Вы находитесь на странице: 1из 362

тгг,

РИЛ1ЕНЕНИЕ
Т Е О Р И И ИГР
В В0ЕНН0/1 ЛЕЛЕ
ПРИМЕНЕНИЕ
ТЕОРИИ ИГР
В ВОЕННОМ ДЕЛЕ

СБОРНИК ПЕРЕВОДОВ С АНГЛИЙСКОГО


Ю. С. Г ОЛ УБ Е ВА - НО В ОЖИ ЛО ВА
ПОД РЕДАКЦИЕЙ
В. О. А Ш К Е Н А З Ы

ИЗДАТЕЛЬСТВО „сов е т с к ое радио *


М О С К В А — 1961
Книга представляет собой сборник переводов
статей по вопросам применения теории игр в во­
енном деле.
П омещ енные в сборнике статьи охваты вают
широкий ди ап азон военных проблем — от тактики
одиночных боев-дуэлей -между танками и боевы ­
ми самолетами д о стратегических вопросов п р ове­
дения крупных операций и войн в целом. Боль­
шинство статей написано на довольно высоком
математическом уровне и требует от читателя
знания общ их основ математической теории игр
и знакомства с некоторыми идеями теории и ссл е­
дования операций.
Сборник рассчитан на военных и гр аж д ан ­
ских специалистов, занимающ ихся выбором опти­
мальных видов вооруж ения, оптимальных груп­
пировок вооруж енны х сил и оптимальных мето­
дов проведения тактических боев и операций.

ПРИМЕНЕНИЕ ТЕОРИИ ИГР В ВОЕННОМ ДЕЛЕ


Сб. переводов с английского
Ю . С. Голубева-Новожилова
Редактор В. И . Грознова

Техн. редактор Б. В . Смуров Обложка худож . В. Т. Сидоренко

Сдано в набор 4. VIII. 1961 г. Подписано к печати 15. XII. 1961 г.


Формат 84ХЮ 8/з2 У ч.- и зд . л . 18,68 Печ. л. 18,45
Зак. 464 Тираж 7 000 экз. Цена в перепл. № 5 — 1 р. 41 к., в перепл. № 7 — 1 р. 46 к.
Типография Госэнергоиздата. Москва, Шлюзовая наб., 10.
ПРЕДИСЛОВИЕ
Проблема (принятия решения волнует человека с «не­
запамятных времен. Сталкиваясь (повседневно с необ­
ходимостью 'выбирать тот или иной альтернативный
способ действий, человек использует имеющийся в его
распоряжении логический аппарат, проводя цепь логи­
ческих рассуждений, обращаясь к ассоциациям и анало­
гиям, вспоминая прецеденты, высказывая ярогнозы,
предположения и догадки, (прибегая к интуиции и, н а­
конец, производя расчеты. При этом человек, естест­
венно, стремится, -чтобы выбранный им способ действий
приводил к наивыгоднейшим для него результатам. Та­
кой способ действий обычно называется оптимальным
выбором или оптимальным решением.
По мере расширения и усложнения задач растет по­
требность в научных способах выбора методов их реше­
ния. Это объясняется тем, что ошибки при решении задач
большого масштаба или неоптимальное их решение
приводит к большим потерям, чем при решении задач
малого масштаба. К тому же, чем сложнее задача, тем
труднее найти не только оптимальное, но и просто пра­
вильное решение.
Особенно важное значение имеет (проблема решения
в области организации, планирования и проведения
военных операций и в области выбора новых систем
вооружения. Ведь принятие в этих областях неопти-
мальных решений может привести к неисчислимым по­
терям людей и материальных ценностей.
Однако только появление быстродействующих вычи­
слительных машин дало толчок к разработке и разви­
тию методов теории решений, позволяющих отказаться
от интуитивных или полуинтуитивных способов приня­
тия решения и находить научное обоснование выбора
того или иного способа действий во многих сложных
ситуациях, в том числе и в военных ситуациях,
3
Круг вопросов, рассматриваемых теорией решений,
включает в себя:
— выбор некоторой функции критерия полезности
(целесообразности), с помощью которой можно было бы
оценивать результаты возможных способов действия;
— перечисление всех возможных способов действия
(альтернатив) в данной ситуации;
— установление математической модели (в частно­
сти, функциональных соотношений), связывающей функ­
цию критерия полезности и возможные способы действия;
— применение вычислительных способов определе­
ния оптимальных альтернатив, дающих наилучшие ре­
зультаты с точки зрения .выбранной функции критерия.
Все эти вопросы тесно взаимосвязаны и влияют друг
на друга. Так, например, 'часто приходится выбирать
функцию критерия, математическую модель и даже пе­
речень доступных альтернатив таким образом, чтобы
рассматриваемая проблема поддавалась анализу и что­
бы существовала возможность практически найти ре­
шение этой проблемы.
Практические потребности теории решений вызвали
•появление и развитие новых разделов математики.
Среди них следует в первую очередь назвать теорию
игр, теорию статистических решений, линейное и нели­
нейное программирование, динамическое программиро­
вание.
При применении теории решений в военном деле
особый интерес представляет теория игр, изучающая
математические методы анализа конфликтных ситуаций,
возникающих между враждующими сторонами. К аж ­
дая из этих сторон преследует противоположные цели
и для достижения их выбирает тот или иной способ
действия. Однако результат действий одной из сторон
зависит не только от этих действий, но и от действий,
выбранных противниками. Иначе говоря, исход кон­
фликтной ситуации есть функция выборов способов
действия всех сторон, принимающих участие в этой кон­
фликтной ситуации. Задача теории игр состоит в уста­
новлении тех способов действия, которые дают наиболь­
шую выгоду (пользу) для каждого из противников.
Наибольших успехов теория игр добилась в изуче­
нии так называемых парных игр с нулевой суммой, т. е«
4~
таких моделей конфликтных ситуаций, -в которых имеют­
ся две враждующие стороны, причем выигрыши, полу­
чаемые одной стороной в процессе развития конфликта
в результате выбора обеими сторонами определенных
способов действия, в точности равны проигрышам про­
тивной стороны. Именно к такому типу игр принадлежат
все модели военных ситуаций, рассмотренные ,в настоя­
щем сборнике статей. Эти статьи написаны, в основном,
американскими специалистами по теории решений и по­
священы применению теории игр к отдельным военным
проблемам.
Помещенные в сборнике статьи охватывают широкий
диапазон военных проблем, от тактики одиночных боев-
дуэлей между танками и боевыми самолетами до страте­
гических вопросов проведения крупных операций и войн
в целом. Условно сборник можно разбить на несколько
разделов.
К первому разделу относятся статьи, рассматриваю­
щие планирование боевых действий различных видов
и масштабов. В статье Дж. Р. Айсбела и У. X. Мэр-
лоу «Игры на уничтожение» рассмотрена общая мате­
матическая модель процессов тактического сражения,
описываемого дифференциальными уравнениями, сход­
ными с уравнениями Ланчестера, известными из ли­
тературы по исследованию операций *: Сначала бой
рассматривается как игра, решения в которой состоят
в распределении сил для участия в активных боевых
действиях и в качестве резерва. После разделения сил
рассмотрена задача распределения огня сил, выделен­
ных для участия в активных действиях, по различным
типам целей, т. е. задача целераспределения.
В небольшой статье Д. У. Блэкетта «Решения игр
«Блотто» в чистых стратегиях» выводятся условия, не­
обходимые для того, чтобы так называемые игры
Блотто имели решения в виде однозначно рекомендуе­
мых распределений сил противников на нескольких не­
зависимых участках боя.
В статьях Д. Р. Фулкерсона и С. М. Джонсона
«Тактическая воздушная игра» и Л. Д. Берковица и
М- Дрешера «Игровой анализ тактической воздушной
* См., например, Ф. 14 . М о р з и Д ж . Е. К и м б е л л. М етоды
исследования операций. «Советское радио», 1956, стр. 146— 172.
5
войны» и «Игровой анализ распределения двух типов
самолетов в тактической воздушной войне» анализиру­
ется одна и та же задача оптимального планирования
использования воздушных сил для выполнения различ­
ных тактических задач (удары во аэродромам 'против­
ника, .противовоздушная оборона, непосредственная
поддержка наземных войск). Статьи различаются друг
от друга исходными данными относительно сил .про­
тивников и состава тактических задач, решаемых этими
силами.
Во второй раздел входят статьи, посвященные опти­
мальному распределению ограниченных ресурсов бое­
вых средств. Джон Э. Уолш в статье «Оптимальные
свойства оборонительной стратегии, состоящей в одина­
ковом воздействии но всем целям» доказывает, что при
ограниченных оборонительных ресурсах наилучший спо­
соб действия состоит в равномерном распределении этих
ресурсов по всем атакующим боевым единицам.
В статье X. К. Уэйсса «Некоторые тактические диф­
ференциальные игры и выбор поддерживающей системы
оружия» даны рекомендации по распределению ограни­
ченного бюджета между главной и поддерживающей
системами вооружения.
Аналогичная проблема рассмотрена в статье
Дж. М. Добби «О распределении бюджета между раз­
личными типами оружия устрашения», где под оружием
устрашения понимается ракетное оружие.
Тематика третьего раздела — оптимальное построение
группировок войск — весьма близко соприкасается с те­
матикой второго раздела. В статьях, входящих в этот
раздел, рассматриваются вопросы оптимального построе­
ния группировки многорубежной системы обороны
(Дж. Э. Уолш «Недостаточность стоимости поражения
цели в качестве критерия эффективности»), оптимально­
го построения кольцевых боевых порядков системы ло­
кальной противовоздушной обороны (М. Л. Лейбовиц и
Дж. Дж. Либерман «Оптимальный состав и боевой по­
рядок разнородной по составу системы локальной про­
тивовоздушной обороны») и оптимальных боевых поряд­
ков войск на поле боя при применении обеими сторона­
ми тактического атомного оружия (Дж. К. Хэйл и
X. X. Уик «Применение теории игр для оценки атомного
оружия»),
6
Статьи, входящие в четвертый раздел , -посвящены
выбору оптимальных тактик три ведении одиночного
боя между танками (Л. Э. Сашриссон «Применение тео­
рии игр к анализу танковой дуэли») или воздушного
боя 'между истребителем и бомбардировщиком
(Т. Э. Кэйвуд и С. Дж. Томас «Применение теории игр
к воздушному бою между истребителем и 'бомбардиров­
щиком»).
Несколько особняком стоят три статьи (X. Э. Скарф
и Л. С. Шэпли «Игры с неполной информацией»,
Л. Э. Дубине «Дискретная игра на уклонение от пресле­
дования» и С. Карлин «Бесконечноходовая игра с запаз­
дыванием»), составляющие пятый раздел и посвященные
оптимальной тактике маневрирования корабля, пресле­
дуемого бомбардировщиком.
Сборник заканчивается статьей К. Дж. Томаса и
У. Л. Димера «Роль моделирования игр в исследовании
операций», в которой указана ограниченность областей
применения моделирования игровых ситуаций и прове­
дено сопоставление аналитических методов с методами
моделирования. Нужно отметить, что интересные сооб­
ражения о границах применимости метода моделиро­
вания при исследовании процессов решения приведены
также в заключительном разделе статьи «Игровой Ана­
лиз тактической воздушной войны».
Реальные конфликтные ситуации, встречающиеся при
решении военных проблем, обычно слишком сложны для
непосредственного игрового анализа. Поэтому аналити­
ческие методы применяются к упрощенным моделям та­
ких ситуаций и само собой разумеется, что наиболее
важные выводы, которые следует делать на основании
теоретико-игровых моделей, использованных авторами
статей, заключаются не в точных количественных резуль­
татах, а в качественной стороне решений и в установле­
нии природы ©тих решений.
Авторы некоторых статей излагают содержание ис<
следованных ими игровых задач в типичном стиле «хо­
лодной войны» и политики «с позиции силы», характер­
ном для идеологии современного империализма. Одна­
ко мы сочли возможным включить эти статьи в настоя­
щий сборник без каких-либо изменений, так как основ­
ной интерес с точки зрения теории решений здесь пред­
7
ставляет математическая постановка конкретной игро­
вой задачи, а не внешняя форма изложения.
Следует указать, что большинство статей написано
на довольно высоком математическом уровне, и для их
понимания необходимо знакомство с теорией стратеги­
ческих игр в объеме общих курсов, таких, например, как
книга Дж. Мак-Кинси «Введение в теорию игр»,
ГИФМЛ, 1960 г. Полезно также знакомство с некоторы­
ми идеями исследования операций, например, с уже упо­
минавшимися дифференциальными уравнениями боя,
предложенными ЛанчестерО'М.
Помещенные в сборнике статьи, несмотря на некото­
рую ограниченность постановки исследуемых задач, мо­
гут помочь читателю усвоить методику принятия научно
обоснованных решений по ряду военных проблем.

В. О. Ашкеназы
Ю.С. Голубев-Новожилов
РАЗДЕЛ ПЕРВЫЙ

ИГРЫ НА УНИЧТОЖЕНИЕ
Дж. Р. Лйсбел (Эбердш .ский полигон) и У. X. Мэрлоу
(Университет Д ж о р д ж а Ваш ингтона) *

ЧАСТЬ I. ПРОЦЕССЫ УНИЧТОЖЕНИЯ

В этой части мы рассматриваем двухмерные стоха­


стические процессы, основанные и а понятии о вероятно­
стях выживания индивидуальных боевых единиц. Мы
объединили результаты работ нескольких авторов
[9, 10, 12] с некоторыми собственными выводами и заме­
чаниями. Центральной проблемой является определение
Р(ху г, р; /), где все аргументы неотрицательные,
а аргументы х, г, р — целочисленные; Р — это вероят­
ность того, что за период времени 1Уначинающийся в мо­
мент ^ = 0 , из общего числа (г, р) единиц уцелеет (вы­
живет) (ху |) единиц. За исключением раздела 1.4 мы
будем повсюду рассматривать только однородный про­
цесс уничтожения, при котором индивидуальные боевые
единицы одного из игроков одинаковы, но не обязатель­
но такие же, как боевые единицы его противника. В раз­
деле 1.1 мы рассмотрим вероятностный случай, когда
функция Р положительна для ^>0, 0 < х < г , 0 < $ < р .
Мы даем частное решение в явном виде для случая (1.1.6)
и показываем, что проблема численных расчетов в об­
щем случае не является совершенно безнадежной. В раз­
деле 1.2 мы рассматриваем усеченный процесс, игнори­
руя его развитие во времени, для того чтобы изучить
направление изменения процесса. В таком виде он под­
дается анализу, а его применение до известной степени
оправдывается теми выводами, которые мы делаем из
* X к. I з Ь е 11 апс! \У. Н. М а г 1 о \у. АИгШоп & атез. Ыауа1
КезеагсЬ Ь о ^ зЦ сз С}иаг1ег1у, 1956, уо1. 3, р. 71— 94.
9
игр, рассматриваемых позднее. В разделе 1.3 рассмот­
рены детерминированные процессы, стандартными при­
мерами которых являются процессы, описываемые урав­
нениями Ланчестера. Неоднородный процесс уничтоже­
ния, рассматриваемый в разделе 1.4, основан на рабо­
те [П]; мы ограничимся изучением только тех вопросов,
которые понадобятся нам в части III.

1.1. Вероятностный процесс уничтожения


Рассмотрим однородный процесс уничтожения, опи­
сываемый введенной выше функцией Р (х , г, р; I), где
, %)сН 1ф (х, | )сИ] есть вероятность потери за время сН
одной из 'боевых единиц первого (второго) игрока, если
общему числу боевых единиц первого игрока х противо­
стоит общее число боевых единиц второго игрока Если
пренебречь вероятностью одновременной потери двух
и более единиц, то уравнение для будущих состояний
системы (перспективное уравнение) будет
_ар(х,ь..) = ! { х + 1 ' * ) / > ( * + ! , +

+ ?(х, 5+ 1) Р ( х , 5 + 1 ; . . . ) - [ / ( * , 5)/>(.х,5; ...) +


+ ? (* , 5)Р (х , 5;...)]; (1)
л: = 0, 1,
5 — 0, 1, . . р,
Р (х, 5; г, р; 0) = 8*^*;
Р (х, г, р; ^) = 0 для всех I, если х^> г или $ > р .
Мы будем иметь дело со случаем, когда
06
Т(х, *) = ах + $, / ( , ) = 0;
ср(х, 5) = а? -}- Ьх, (р(х, 0) = 0.
Предположение (2) означает, грубо говоря, что для каж­
дой из боевых единиц имеется вероятность а уцелеть
и вероятность Ь уничтожить одну единицу противника; а и р
имеют тот же смысл для боевых единиц, входящих в число

* Здесь Ъаь — символ Кронекера: = 1 при а = Ь, при афЬ.


(Прим, ред.)
Ю
Совершенно очевидно, что для случая (2) имеется единст­
венное решение уравнения (1) (ср. [4], стр. 409, 416), но
читатель должен обратить внимание на то, что разрывы
непрерывности в условиях (2) приводят к тому, что диф­
ференциальные уравнения для д : > 0 = ? и ^ > 0 = х не
являются частными случаями уравнений для хЧ^>0.
Читатель может убедиться, что точное интегрирование
уравнения (1) в общем виде несложно при, скажем, г —
— 2 < л ;< г ; р — 2 < $ < р , но быстро становится практи­
чески невыполнимым для меньших значений х и Ч (для
больших значений г и р).
Уравнение для прошлых состояний системы (ретроспе­
ктивное уравнение) (см. [5], стр. 397), соответствующее (1)
и (2), будет
с1Р(...;г, р ;0
й! (аг -|- рр) Р ( ...; г — 1, р; 1)-\-
(аР Ьг) Р (• • •; ^, р — 1; 0 —
— Ь) г (а -{- (3) р] Р (.. .; г, р; ^), (3 )

причем в случае г — 0 или р = 0 мы можем сохранить


эту формулу, если положим Р ( ...; — 1,р;^) = Р ( . . 0 , р; 1)
и Р ( . ..; г, — 1; /) = /* ( ..., г, 0; I). Уравнение (3) можно
легко проверить, если в правой части уравнения для бу­
дущих состояний (1) записать Р' вместо Р (х , Ч; г, р; I).
Тогда Р' будет обычным аналитическим решением „пер­
спективного" уравнения, удовлетворяющим начальным ус­
ловиям уравнения (1).
Ретроспективное уравнение удобно потому, что оно
удовлетворяется любой функцией Р (^, г, р) = с (х, Ч) X
дг, ^
Х Р (*к, Е; г, р; /); например, среднее значение х в момент I,
определяемое выражением с (х ,Ч )= х, удовлетворяет урав­
нению (3) и поэтому его можно вычислить рекурсией по г и р,
не обращаясь к индивидуальным значениям Р. Ретроспектив­
ное уравнение разрешимо в одном частном случае, который,
к сожалению, не имеет большого практического значения.
Тем не менее, само решение и рассуждения, приводящие
к нему, могут дать понятие о трудностях решения для об­
щего случая.
Рассмотрим вначале независящую от времени вероят­
ность Р(х, Ч\ г, р) того, что имеется некоторый момент
11
времени 15* 0, когда число уцелевших боевых единиц равно
точно х, ?. Совершенно очевидно, что Р(г, р; г, р ) = 1
и что Р удовлетворяет двойственным рекурсивным соотно­
шениям
Р (х, г, р) = а(х + 1) + Р6 6; г, Р) +
(а + 6)(х + 1) + (а + р)5
а (I + 0 + ь*
+ (я + Ь) х + (а + ?)(? + 1) Р(х, : + 1; г, р); (4)
аг +
Р(х, г, р) = (а + Ь) г + Р(х, 5; г — 1, р) +
(а + р) р
ар -|- Ьг
Р(х, I; г, р — 1). (5)
(а + Ь)г + ( а + Р)Р

Соотношения (4) и (5) можно вывести из предыдущих


формул, но читатель может рассматривать соотношение (5)
как определение. Учитывая, что Р (х, х, Е) = 1
и Р (х, $; г, р) = 0 при х^> г или $ > р , мы получим пол­
ное определение Р. Оно правильно лишь для х^> 0 и $ > 0 ;
поэтому наши последующие рассуждения применимы только
к этому случаю.
Предполагая, что а-\-Ь = а-\-$, можно получить реше­
ние уравнения (3) при начальных условиях (1):

Р(Х, V, Г, р; 0 = /Ч *. г. р)(^ + е ) х
+ Ь)1 — {а + Ь ) ( г + р) 1
(б)
Формулу (6) легко проверить: мы опускаем эти вычисления.
Мы пришли к формуле (6) с помощью следующих рас-
суждений, заимствованных у К. А. Трусделла [13]. Заме­
ним Р функцией С}=е{а+Ь) (г+р)/, а I—переменной 2— ^ ^ .
Тогда (3) преобразуется в простое уравнение
Е; г, р; г)
йг
— {аг + Рр)0(. ■ . ' - 1 , р; *) +
-}-(6г-}-ар) <2 (. . .; г, р — 1; г), (7)
в правой части которого отсутствует неразделенный, третий,
член. В одномерной задаче Трусделла это можно всегда
сделать в соответствии со строгими правилами. В нашей
задаче именно на этом этапе требуется гипотеза о том, что
а-\-Ь = а 4 - В. [Хотя мы не можем доказать, что
12
в других случаях задача становится труднее, у нас
имеется совершенно иной и более сложный вывод соотноше­
ния (6), для которого потребовалась та же гипотеза.]
Последовательными приближениями (итерациями) по фор­
муле (7) производные от <} (х, г, р; /) могут быть выра­
жены через некоторые функциональные значения С}(х, ?;
г\ р'; 2"), где г ' и р' меньше, чем г и р. Если неизвестная
функция С} является аналитической в 2 , то ее можно
представить в виде ряда Тейлора. Разлагая ее в ряд вблизи
значения 2, соответствующего ^= 0, мы находим из на­
чальных условий, что все члены ряда равны нулю, кроме
(г-\- р — х — $)-го члена. Тогда (? может быть выражена
через 2, а поэтому Р может быть выражена через I.
Итерация, упомянутая в начале предыдущего абзаца,
приводит к сложным коэффициентам. Можно в принципе
последовательно вычислить коэффициенты <р(х, ?, г, р),
которые оказываются равными Р (х, г, р) , как
в уравнении (6). Мы решили, однако, использовать тот
факт, что если х!-\-У = х то (поскольку а-\-Ь=а-\-$)
отношение Р ( х г, Р; г, р; г) к Р(х, ?; г, р; г) не зависит
от времени и равно отношению соответствующих значений
9 или Р. Следовательно, достаточно найти У 9 (х, г, р ) =
х - \- Ь = к
— О (к; г, р). (Соответствующая сумма значений Р равна
единице, так как общее число уцелевших боевых единиц
равно к.) Теперь вероятность того, что число боевых еди­
ниц в момент I было равно к и уменьшилось к моменту
равна
{а-\-Ь)к [е(а+6) 1— 1]г+р+* е ~ {а+Ь) (г+р) *О (к; г, р)Я.
Интеграл этого выражения от нуля до бесконечности ра­
вен единице, поскольку его можно рассматривать как ве­
роятность. Непосредственное вычисление интеграла от этого

жению (6).
Численное решение уравнений процесса уничтожения
(1) и (2) может быть получено рекурсивно на цифровой
вычислительной машине стандартными способами. При
этом задаются постоянными значениями параметров а,
13
Ь, а и |3, после чего табулируются значения Р для желае­
мых значений I. Такие табулированные распределения
вероятностей оказываются необходимыми для решения
игр, рассматриваемых в разделах 11.1 и 11.2.
Один из 'недостатков выражения (2), (применяемого
для описания скорости '.процесса уничтожения (кроме
трудности анализа), связан с тем, что огневая мощь
каждой боевой единицы вносит свою долю в процесс
уничтожения каждой боевой единицы (противника. Зам е­
тим вначале, что для машинного решения можно иметь
/ и ср нелинейными; читателю (предоставляется право
создавать частные варианты выражения (2), соответ­
ствующие рассматриваемым частным физическим ситуа­
циям. Однако следует исходить из совершенно очевид­
ного желания сохранить 'представление о бое как о ком­
бинации 'независимых событий: при этом каждое
событие или боевое соприкосновение может быть описа­
но системой, подобной системе уравнений (1).
Предположим, нто физическая ситуация такова, что
одна и та же боевая единица противника никогда не
может быть обстреляна более чем двумя боевыми еди­
ницами (ср. [12]). Тогда будут возможны следующие ви­
ды боевого соприкосновения:
(г, р) = (2,1), (1,2), (1,1), (1,0) или (0,1),
для которых уравнение (1) легко решается. Для лю­
бого значения (г, р) требуется, чтобы игрок, обладающий
численным превосходством, мог организовать единственное,
наиболее выгодное для него множество соприкосновений.
Тогда вероятности Р для сражения (г, р) вычисляются ре­
курсивно: для любого значения (г, р) имеется такое „бли­
жайшее" значение (г\ р'), г '< г , р '< р , что сражение (г, р)
состоит из сражения (г\ р') плюс одно дополнительное со­
прикосновение. Среднее число уцелевших после сражения
равно, конечно, сумме средних чисел уцелевших после
боевых соприкосновений. Вероятность полной победы
(уничтожения противника) определяется простым умноже­
нием; другие подобные выражения легко рассчитываются.

1.2. Усеченный процесс


В этом разделе мы исключим непрерывную перемен­
ную I и заменим ее дискретной переменной общим
числом уцелевших боевых единиц. Отдельные дискретные
14
шаги в сражении соответствуют последовательным потерям
отдельных боевых единиц. Как и раньше, мы исключаем
возможность одновременного уничтожения двух или более
единиц и начинаем с уравнений (1.1.1) и (1.1.2). На этот
раз мы примем г = х и р = $ и будем считать, что может
быть потеряна самое большее одна единица. При этом по­
лучаем
Р (х, $;.. ,) = ехр{— [(а-)-6 )х + (а4 -р ) $]/},
Р (х-1 , (1)
+ Ьх
Р (х, 6 - 1 ; . . . ) = (а + Ь) X + (а + Р)
Из системы уравнений (1) легко находим
ах —[- ^
ПшР ( х — 1, 5; . . .) = (а + Щх + (а + р) ^
= Р~ (X, 6),
/->00
Н т Р ( х , 6— 1; . . . ) = 1 — Р '{ х , Ь) = Р+(х, 6). (2)
/->00
Знак « + » обозначает благоприятный исход с точки зре­
ния -первого игрока, а знак «—» — неблагоприятный ис­
ход. Для любых значений х, \ г, р, I в процессе (1.1.2)
Р+ является вероятностью того, что если единицы х и §
уцелели до момента то следующей потерянной едини­
цей будет ^-единица.
Мы предполагаем, что в начале этого независящего
от времени процесса силы г противостоят силам р; про­
цесс продолжается до тех пор, пока одна из сторон не
будет уничтожена. Если конечные результаты (х, 0),
(О, |) оценивать функцией и, то значения и могут быть
вычислены рекурсивно по формуле
и(х, Б) = Я “ (л;, Х)и(х— 1, Е)-}-
+ Р ' ( х , Ь)и(х, $ - 1 ) , (3)
т. е. значение функции при (х , |) является выпуклой
комбинацией значений этой функции при возможных ва­
риантах сил, которые могут последовать за (ху |) . Н а­
пример, если У(х, 0) = 1 для х > 0 , К(0, |) = 0 (опреде­
лять К(0,0) нет необходимости), то V есть вероятность
победы первого игрока. Если теперь V(х, 0) =х , 1/(0, |) =
= 0, то вычисленное по формуле (3) значение V есть без-
15
условное число единиц х , уцелевших после последнего
боя.
Усеченный процесс, описанный в настоящем разделе,
может быть, очевидно, использован тогда, когда предпо­
лагается, что после уничтожения какой-нибудь одной
боевой единицы возможен выбор новых стратегий. Ина­
че говоря, он применим не только к сражениям до кон­
ца; эту мысль мы разовьем в разделе П.З.

1.3. Детерминированные процессы


В этом разделе мы рассмотрим развитие боя в среднем:
мы будем интересоваться такими значениями х! = х{1 ) и
? = $(/), чтобы Р ( х г, г, р; /) = 1 -
Классические уравнения Ланчестера (см. [9, глава IV])
для случая, когда потери не восполняются, имеют сле­
дующий вид:
йх
= — ах — $,
Л = — — Ъху 0)
си
л;(0) = г, Е(0) = р.
Решения уравнений (1) приведены в книге [9, стр. 164]. Если
а — а = 0, то интегральные кривые являются гиперболами
с асимптотами х 2Ь= Ъ2$. Поэтому здесь говорят о законе
п2\ эффективность сил каждой стороны измеряется произ­
ведением ее огневой мощи на квадрат ее численного со­
става. Имеется по крайней мере одна прямолинейная инте­
гральная кривая (при положительных значениях х и $),
уравнение которой имеет вид
I — а — а + У (а—а)2+ щ х ^2)

Если б р > а а , то остальные интегральные кривые от­


клоняются от прямой (2) при возрастании /; таким об­
разом, начальное превосходство усиливается по мере
развития сражения. Если аа>6|3, то интегральные кри­
вые отклоняются в сторону прямой (2). Если аа = бр, то
эти кривые превращаются в прямые линии, параллель­
ные линии (2) . В некоторых вырожденных -случаях один
противник всегда выигрывает, но вообще существует
критическое соотношение, определяемое наклоном пря­
мой (2), так что победителя можно определить с по-
16
мощью оценки каждой я-еди-ницы через посредство
^-единиц; победителем будет та сторона, которая имеет
более высокую оценку. Выше мы упомянули закон п2
для случая а = а = 0; легко создать аналогичные описа­
ния сражений для других случаев. Мы вернемся к проб­
леме определения 1собственной .цены боевых единиц в ча­
сти IV.
Интересно сравнить систему уравнений (1) с уравне­
ниями, удовлетворяемыми средним числом уцелевших
единиц в уравнениях (1.1.1) и (1.1.2).
После умножения на х и суммирования, умножения
на | и суммирования, эти уравнения принимают вид
(ср. {11, стр. 24]):

- % - = - а х - $ + ^ \ Р { 0,
е
- ^ - = — аГ— Ъх-\-Ъ ^ л:Р ( л , 0; ...) , (3)
X
х ( 0 ) — п Т (0) = р.
Непосредственные вычисления по этим формулам невоз­
можны, если неизвестны суммируемые члены. Это, веро­
ятно, указывает, ввиду раздела 1.1 нашей статьи, на то,
что х и | могут быть вычислены согласно их определе­
ниям. Мы отметили выше, что х и | удовлетворяют
ретроспективному уравнению (1.1.3); поэтому подобные
рекуррентные вычисления, очевидно, приведут к таким
значениям I, которые делают уравнения (1) плохим (не-
адэкватным) приближением к уравнениям (3)-
Итак, мы рассмотрели следующие детерминирован­
ные процессы: уравнения Ланчестера (1 ),точные уравне­
ния (3), легко разрешимые выражения для среднего
числа уцелевших единиц, приведенные в конце раздела
1.1, и уравнения (1.2.3) для уцелевших единиц в усечен­
ном процессе.
1.4. Неоднородное уничтожение
В работе [11, стр. 22] даны уравнения, обобщающие
(1.1.1) для сражения между стороной, состоящей из т
типов боевых единиц, обладающих мощью г. в единице
иго типа, 1= 1, 2 , . . . , т (Игрок 1), и стороной описывае-
.17
мой аналогично параметрами р1 э рп (Игрок 2). Мы не
будем приводить здесь эти уравнения, так как в процессе
вероятностного неоднородного уничтожения нас интересует
главным образом обобщение усеченного процесса, рассмот­
ренного в разделе 1.2. По аналогии с уравнениями (1.1.2)
мы полагаем, что для ненулевых значений г. и р.

/,-('•». • •м гт, Рп . . Ря) = а1г1+ ^ р Д ,^ ,


У

Например, вероятность потери одной единицы типа /


в сражении, длящемся время сИ, равна если Г{ФО,
и равна нулю, если г* = 0.
Как обычно, мы ввели оба значения в виде греческих
и латинских букв для тарных 'переменных, благодаря
чему достаточно объяснить значение одной переменной
из каждой тары. Так, обозначает скорость экспонен­
циального убывания своих сил типа /, а Ьц есть мера
эффективности огня своих боевых единиц /-то типа про­
тив боевых единиц противника /-го типа. Новым «поня­
тием, которое мы используем в части III, являются вве­
денные нами стратегические переменные рц , представ­
ляющие собой пропорциональную часть общих усилий
боевых единиц типа / (для Игрока /) , которые направ­
лены против единиц типа /. Здесь мы применили слово
«стратегические» в смысле теории игр; на военном языке
переменные рц являются тактическими переменными.
Мы ограничиваемся изучением оптимального выбора
значений р и я в части III, для чего достаточно рассмот­
реть процесс [см. (1.2.1)] только до первой боевой поте­
ри. Если символом с1г обозначить такое возможное собы­
тие, при котором первым потерянным подразделением
будет своя боевая единица типа /, то нам требуется
определить вероятность Вер(а?г) и аналогичную вероят­
ность Вер(б^). При этом мы, как и в (1.2.2), получим

а1Г1+ У Р/?,Т
У
Вер (4) • ( 2)
У акгк "Е^ а] Ру ^ (гкРк}Рку “Ь Р/ ^’кп]к^
к У У. к
18
В заключение в целях законченности наших рассуждё*
ний мы заметим, что соответствующее обобщение детерми­
нированных уравнений (1.3.1) для I = 1 , . . . , т и / = 1 , . . . , п
приводит к уравнениям
д.X;
~М ~— ! 'А Х Х т> Х А ® )— Г1’

(**’ ••••■*«; «..•••• у . м ° ) = р у

Эти уравнения для фиксированных значений р и я ис­


пользуются в работе [11, стр. 12— 17]. Их решение, есте­
ственно, много сложнее, чем решение уравнений Ланче-
стера; однако, как мы уже говорили, нас интересует
только выбор значений р и я в вероятностном -случае,
для чего достаточно соотношения (1.4.2).

ЧАСТЬ II. ЗАДАЧИ ТИПА «ХОТСПОТ»*

Мы начнем с кратного изложения статьи К. Томп­


кинса относительно игр типа «хотспот». Эти игры носят
вероятностный характер, потому что в их основе лежит
такой процесс уничтожения, который описан в разде­
ле 1.1. Решение таких игр представляет определенные
трудности. В разделе 11.2 мы представим родственную
матричную игру, для решения которой известно несколь­
ко эффективных методов. Между этими матричными
играми и играми типа «хотспот» существует эвристиче­
ская связь **. Однако более важно то, что когда одна из
этих игр имеет решение в чистых стретегиях, то другая
имеет также решение в чистых стратегиях, причем оп­
тимальные стратегии и цена игры одинаковы у обоих
типов игр. В заключение в разделе II.3 мы вводим упро­
щенную игру, возникшую под воздействием модели
типа «хотспот». Вместо ввода новых сил в бой через
установленные интервалы времени мы производим на­
значение новых сил у обеих сторон, как только одна из
боевых единиц любой стороны уничтожена. Эта упро­
щенная игра имеет решение в чистых стратегиях, по­

* «Хотспот» — дословно «горячее место» — участок ож есточ ен ­


ных боевых действий. (Прим, перев.)
** То есть связь, установленная догадкой, а не строгими рас­
суждениями. (Прим, перев.)
19
этому <ни один из игроков не захочет изменить свое рас­
пределение в какой-нибудь другой момент времени. Оп­
тимальная стратегия любого игрока в любом случае со­
стоит в вводе в бой всех боевых единиц, ни одной бое­
вой единицы или точно одной боевой единицы. Игры,
рассматриваемые в разделе II.3, используются в частях
III и IV в качестве основы для (перехода к более труд­
ным проблемам.

11.1. Игры типа «хотспот»


В этом разделе мы дадим краткий обзор статьи [12],
в которой К. Томпкинс рассмотрел парную игру с нуле­
вой суммой для решения задачи ввода сил на участок
поля боя, называемый «хотапот» («горячее .место»). Эта
игра не является матричной игрой, однако ее можно
свести к одноходовой игре.
На к-ои ходу (гк, рЛ) боевых единиц из общего числа
(тк, единиц вводятся в район „хотспотм. Результатом
хода явится возможная потеря боевых единиц одним игро­
ком или обоими игроками; предполагается применение функ­
ции однородного процесса уничтожения Р ( х , г, р; Р),
введенной в части I, причем V является постоянной вели­
чиной и не меняется в промежутках между ходами. После
начала партии нельзя вводить никаких новых боевых еди­
ниц. Игра заканчивается к-ым ходом, если гкрк = 0, при­
чем платеж Игроку 1 равен Р, —Ф или 0 в зависимости
от того, гкф Ь , р^=т^0 или г^ = р^ = 0 соответственно.
Кроме того, имеется платеж — (т1— /7гЛ) 0 — Р*)»
т. е. Игрок 1 платит единицу платежа за каждую свою
потерянную боевую единицу и получает с единиц платежа
за каждую уничтоженную единицу Игрока 2. Таким образом,
мы придерживаемся общепринятого правила, считая Игрока 1
максимизирующим игроком.
Томпкинс [12] доказал, что эту игру можно рассмат­
ривать как заканчивающуюся за ограниченное число
ходов, и, таким образом, показал существование един­
ственной цены V(т, р) для многоходовой игры. Для то­
го чтобы получить более эффективный метод расчета,
чем метод, применявшийся при доказательстве существо­
вания цены игры, потребовалось сведение игры к одно­
му ходу. Так как V(т, р) есть единственная цена игры,
20
то можно написать следующее выражение для матема­
тического ожидания платежа Игроку 1 после первого
хода:

Е (г, р; т, р) = А(т, ц; г, р)-}-[Я(г, р ) 1] V(/те, р), (1)

где предполагается, что на поле боя введены силы (г, р)


из числа общих сил (т, р) и что после этого каждый
игрок применяет свои оптимальные стратегии. В этом вы­
ражении А есть математическое ожидание платежа от всех
возможных исходов хода, который приводит к потере по
крайней мере одной боевой единицы. Точнее

Л (0, 0; т , р) = 0,
А (г, 0; т, р) = Р — ^ {г — х) Р (х, 0; г, 0; /'), г^= 0,

А ( 0, Р; т, !1) = _ Ф + а У ( р - | ) Я ( 0 , !=; 0, р; С), Рф 0 ,


&

А (г, р; т, р) = ^ [ 1 / ( т — г + х, р—р-И) — (г~ х ) +

+ 3 (р — & г, р; О . ГФ °> Рт^°> (2)

где суммирование производится в диапазоне 0 < л; < г;


0 < $ < р , исключая точку (г, р).
Для облегчения анализа мы ввели обозначение
В (г, р) = / >(г, р; г, р; — если г р ^ О ,
В (г, р) = — 1 в противном случае. (3)
Следует заметить, что А не зависит от т и р при гр = 0.
В самом деле, для этих случаев А — Е и поэтому игры,
в которых у одного из игроков или у обоих игроков вместе
нет никаких ресурсов, могут быть немедленно исключены.
Примем далее по индукции следующую гипотезу: V (г , р)
известна для г < т и р < р , за исключением V = У(т, р).
Тогда все величины в уравнениях (2) и (3) известны, и не­
трудно определить V как цену игры с платежами (1)или,
что равнозначно, как корень уравнения
(V) = Цена (А + ВУ) = 0. (4)
21
Томпкинс показал справедливость этого определения и
предложил итеративный метод расчета цены V. Сущест­
вование единственного корня уравнения (4) было также
доказано фон Нейманом [14], Лумисом [8] и Дайн-сом [3]
при (предположении, 'что элементы матрицы В отрица­
тельны. С более поздними результатами можно позна-.
копиться в статье Беллмэна [1].
Таким образом, игра типа «хотспот» сводится к одно­
ходовой игре, решение которой несколько отличается
от решения -стандартных матричных игр. Ее цена и опти­
мальные стратегии могут быть найдены, если считать,
что матричная игра в выражении (4) имеет нулевую
цену. Для того чтобы найти V (т, ц), необходимо решить
систему ( т + 1 ) ( 1и + 1 ) уравнений (4).

11.2. Вариант игры типа «Хотспот»


Как мы только что видели, решение первоначальной
игры типа *хотспот“ означает определение числа V и опти­
мальных стратегий, таких, чтобы у игры с платежной
матрицей (а..-\-Ь..У) была нулевая цена. Решение в чистых
стратегиях (/, /) существует тогда и только тогда, когда
V= ь~— , т. е. когда имеется игра С2 с платежной мат­

рицей у Действительно,

если все величины & ..< О, то игра Сг имеет


решение в чистых стратегиях (г, 5) и цену
игры V = .~ ^ ~ тогда и только тогда, когда (г, 5)
является решением игры 6 2. (1)
Д о к а з а т е л ь с т в о . Если игра Ох имеет такое реше­
ние, например У\ то остающиеся платежные элементы
в строке г (в столбце 5) будут неотрицательными (не­
положительными). Так как наклон линии Е — ац -(- Ь^У отри­
цателен, то точки пересечения линий V удовлетворяют
условию= = ш а х т . е. (г, 5) есть ре-
°Г5 / 0Г/ I
шение игры 0 2.
22
Следующий пример показывает, что ни цены игры, ни
даже чистые стратегии, входящие в оптимальные смешан­
ные стратегии, не нуждаются в согласовании

5 1 1 3
А= 1 4—е —В= 5 2—е
1 1 3 1/2

В игре 0 1 цена У= 1, и Игрок 2 выбирает первую и вто­


рую строки. С другой стороны, для малых значений ецена
игры 0 2> 1, и используются строки 1 и 3. У нас имеют­
ся примеры, когда цены игр не согласуются при реше­
ниях в смешанных стратегиях для игр Л и В, данных
в (1.1.2) и (1.1.3). Мы ,не смогли найти классы игр А и
В, позволяющие сравнивать стратегии для 0 1 и 0 2, вхо­
дящие в оптимальные смешанные стратегии.
Мы заканчиваем раздел установлением формальной
связи между играми 0 1 и С2. Возвратимся к разделу II. 1
и будем действовать дальше, как и прежде, используя
уравнения (II. 1.3). Затем предположим, что по крайней
мере одна боевая единица теряется в каждом шагу при
грфО и, кроме того, заменим Р (х , 5; г, р; V) на С} {х,
г, р; О;
я (г, р; г, р; П = °.
Р (х, ?; г, р; П
<3(х, 5; г, р; V) 1—Р(г, р; г, р; (')

С помощью этого процесса исключения вероятности того,


что не будет потеряна ни одна боевая единица, и ренор­
мализации величин вероятностей Р мы снова приходим
„ А (г, р ; т , ц)
к матричной игре с платежами ■ ^ .
Если каждая цена игры У (т , р) не определяется
игрой с седловой точкой, то наша новая процедура мо­
жет привести к различным значениям цен V так, что
величины Л, только что записанные нами, могут не сов­
падать с величинами Л для первоначальной игры типа
«хотспот». Еще не вполне ясно, насколько тесная связь
существует между этими двумя методами. Решение чис­
ленных примеров показывает, что эта связь может быть
сильнее, чем указывает утверждение (П.2.1).
23
Н.З. Упрощенная игра
Игра, рассматриваемая -в этом разделе, основана на
усеченном .процессе уничтожения, рассмотренном в раз­
деле 1.2. Два командира, в распоряжении которых име­
ется соответственно г и р боевых единиц, борются за об­
ладание некоторым объектом. Если они выделят для
этой цели соответственно х и | боевых единиц [резерви­
руя (г—х) и (р—|) боевых единиц] и если л^> 0, то нач­
нется процесс уничтожения, управляемый уравнениями
(1.2.1). Как только достигается условие л^= 0, бой счи­
тается законченным, и та сторона, у которой остались
еще боевые единицы на поле боя, считается выигравшей
объект. Как только одна из боевых единиц на любой
стороне терпит поражение, оба командира имеют право
произвести новые назначения из оставшихся у них сил.
Игра для нас определена, как только установлены ко­
личественные показатели конечных состояний. Для любых
значений г и р мы получаем игру с матрицей порядка
(г-\- 1) X (р-|- 1), если только нам известны пять значений
цены игры: У+ (г, р) — цена первому игроку, если второй
игрок не выделяет никаких сил, так что первый игрок
выигрывает объект; V” (г, р) — цена игры при противопо­
ложной ситуации; V (г, р) — цена игры, если оба игрока
отказались от боя, и, наконец, две цены игры \У (г—1,р)
и \У (г, р—1). Имеется большое число неравенств, которым
должны удовлетворять эти значения цен .игры. В частности,
мы предполагаем, что К " < У < У +.
Платеж в игре (г, р) при применении стратегий (х, I)
определяется уравнениями (1.2.2), т. е.

6; Г, р) = Р + ( ^ р-1) +
+ Р - ( х , | ) Г ( г - 1 , Р). (1)
Формула (1), естественно, применима только при х1=^0.
Должно также выполняться условие Н (х, 0; г, 0) =
— У+(г, 0) и симметричное условие для (0, р). Случай,
когда г = р = 0, можно не рассматривать, так как он не
может возникнуть при любом другом варианте.
Матрица Н порядка (г-\- 1) X ( р + 1) всегда имеет сед­
ловую точку. Главной причиной этого является то, что
Р +(х - [-1, $ ) > Я + (х, $ ) > Я + (л;, Е + 1 ) тогда и только
тогда, когда Ь $^аа и все эти неравенства одновременно
24
обратимы. Тогда, если Ь$^>ах, стратегия г (или р) доми­
нирует над всеми остальными, за исключением, возможно,
стратегии 0. Эго сразу приводит к матрице

V'(г, р) У+(г, Р) (2)


У~(г,р) У(г, р)
где V (г, р) = Я ( г > р). Однако +; следователь­
но, вопрос заключается в том, где лежит
Для случая, когда

если то есть седловая точка


матрицы (2);
если то седловой точкой яв- ^
ляется V*;
если V*< У “ , то седловой точкой являет­
ся V".
Аналогично,
если & р<аа, т о следует в условии (3) заме­
нить V* на У* = Н (1,1); результат от этого
не изменится. (3')
Заключение (3') основано :по существу на специаль­
ном предположении о том, что Н (х, 0) —сопз! для л:>0
и Я ( 0, ^)=сопз1 для |> 0 . Заключение (3) справедливо
и при более слабом ограничении, состоящем в том, что
Я(х, 0) является монотонной функцией по х , а Я (0, |) —
немонотонной функцией. Вырождение этих игр подтвер­
ждает интуитивное предположение о том, что обычно сле­
дует вводить в бой все наличные силы, если не предпо­
лагается одновременно предпринять другие операции,
так как обычно Ь а а . Из заключений (3) и (3') сле­
дует, что если Ь$ = аа, то все ненулевые назначения бое­
вых единиц эквивалентны.
Общий ход боя, протекающего в соответствии с (3),
будет следующим: обе стороны вводят в бой все свои
силы и продолжают сражаться до тех пор, пока одна
из сторон не прекратит борьбу (будучи, возможно, .пол­
ностью уничтоженной). С другой стороны, согласно за­
ключению (3') каждая сторона вводит в бой только од-
25
му боевую единицу. Когда эта боевая единица уничто­
жается, она заменяется другой, и так продолжается до
тех пор, пока одна из сторон не покинет толя 'боя. Тог­
да введение любой новой характеристики, такой, напри­
мер, как стоимость передислокации или выгода времен­
ного обладания толем боя, приведет к возможности еще
более общего использования знакомого принципа, опре­
деляемого заключением (3).

ЧАСТЬ III. ИГРЫ НА ПЛАНИРОВАНИЕ

В этой части мы рассмотрим модель изолированной


тактической .проблемы распределения огня то враже­
ским целям нескольких типов. Процесс уничтожения
описывается функциями, введенными в части I, а модель
игры имеет конструкцию, весьма сходную с последней
моделью, рассмотренной в части II. Такая модель мо­
жет быть решена сравнительно простыми методами бла­
годаря некоторым интересным математическим -причи­
нам, которые будут в дальнейшем рассмотрены более
подробно. Третья часть заканчивается изучением «рас­
ширенных игр на планирование». При этом было найде­
но, что объединение решений по выделению сил с реше­
ниями по распределению огня встречает серьезные труд­
ности, которые нам не удалось преодолеть.

111.1. Игры на планирование огня


Формально игра на планирование огня может быть
описана следующей платежной функцией:

н (Р, п ) = Вер (<*,) Ц7 (4) + 5 ] Вер (8,.) И7 (6.). (1)


I У

Стратегические переменные Р и П представляют собой


распределения огня нескольких типов оружия по несколь­
ким типам целей противника. В уравнении (1) мы не
дали явного указания о силах, принимающих участие
в игре. Имеется т типов боевых единиц, сражающихся
с п типами боевых единиц противника. Имеется г* -своих
боевых единиц /-го типа (/=1, 2 , . . . , т) и р/ боевых еди­
ниц противника /-го типа. Тогда Р есть матрица поряд-
26
ка т Х п , состоящая из действительных -чисел р^-, под­
чиненных условиям
/7.у> 0 для всех / и /;
(2)
любого /.

Под рг] мы понимаем ту часть общей огневой мощи


своих боевых единиц /-го типа, -которая направлена про­
тив единиц противника /-го типа. Аналогично у против­
ника имеется стратегия распределения огня П = ( я ;г-),
подчиненная таким же ограничениям. Н является для
нас ценой игры. Поэтому стратегия Р выбирается так,
чтобы максимизировать # ( Р , П), а стретегия П — так,
чтобы минимизировать ее.
Символ йг относится к тому возможному случаю, ког­
да первой уничтоженной боевой единицей будет наша
единица типа I. Предполагается, что результирующая
ситуация уже была оценена и имеет цену 1V(Лг). Таким
образом, мы неявно предполагаем, что, во-первых, мы
перечислили все возможные варианты развертывания
войск и, в частности, указали, что силы не будут ни
вводиться, ни выводиться с поля боя до тех пор, пока
не произойдет уничтожение одной боевой единицы;
во-вторых, уничтожение боевой единицы сразу же ста­
новится известным обоим командирам или, по крайней
мере, результирующая цена не зависит от стратегий Р
и П, как если бы смена стратегий происходила с запоз­
данием. Отметим, что мы уже сделали соответствующие
предположения в разделе II.3. Первое предположение
было подтверждено результатами, а второе предполо­
жение обосновывается необходимостью упрощения.
Замена латинских букв греческими при сохранении
индексов превращает йг в б;-, что соответствует такому
событию, когда первой уничтбженной боевой единицей
будет единица противника /-го типа. Вероятности
Вер (йг ) зависят от стратегий Р и П согласно формуле
(1.4.2), которую мы перепишем в следующем виде:

27
Уравнением (1), шарой уравнений (2) и шарой уравне­
ний (3) мы закошчили ошисашие игры на планирование
огня. Принятый вами характер уничтожения достаточно
подробно описан коэффициентами (1.4.1) и является то
существу простейшей из всех форм, претендующих па
описание действительного 'боя. Правило ходов в игре
также является простейшим из всех имеющихся в п а­
шем распоряжении. Формально у нас имеется только
один ход. В действительности, однако, мы предполагаем,
что какой-нибудь ход, т. е. смена стратегии распределе­
ния огня, может быть сделан немедленно, как только
возникнет в этом необходимость. Наконец, мы ограни­
чили действия командиров принятием решения только
по распределению огня между целями.
Решение настоящей проблемы оказывается замеча­
тельно простым по причинам, которые теряют свою силу
как только мы снимем какое-нибудь из наших упро­
щающих предположений или даже в том случае, когда
модель будет слегка изменена без увеличения ее слож­
ности. Поэтому мы желаем здесь подчеркнуть, что проб­
лема, перед которой мы поставлены, заключается в опре­
делении оптимальных стратегий Р и П, изменяющихся
во времени и в зависимости от наблюдаемой стратегии
противника. Подобные проблемы весьма сложны, одна­
ко в нашей модели мы найдем оптимальные постоянные
стратегии.

111.2. Вычислительные методы


Перед решением игры на планирование огня мы рас­
смотрим более простую проблему дробно-линейного про­
граммирования:, т. е. задачу максимизации дробно-линей­
ной функции при линейных ограничениях. Задача со­
стоит в том, что задан выпуклый многогранник X в дей­
ствительном «-мерном пространстве и функция

/(*) = их
1у 1
Ц +± ^к (1)
' 1

и требуется найти ш ах/(х). В настоящее время изве-


х^Х
стно много эффективных методов решения этой задачи
для линейной функции /; это не что иное как задача ли­
нейного программирования. Мы опишем метод дробно*
28
линейного программирования, который основан на реше­
нии проблем линейного программирования. Сначала,
однако, мы опишем задачу, используя геометрические
представления.
Простота функции (1) заключается в том, что она
представляет по существу двухмерное преобразование,
имеющее следующий смысл: знаменатель обращается
в нуль на некоторой гиперплоскости Д а числитель — на
некоторой гиперплоскости N. Обычно (случай 1) гипер­
плоскости Б и N не параллельны и пересекаются
в (п—2) чмерном подпространстве Ь данного п -мерного
пространства Е. Функция / не определена на подпрост­
ранстве Е\ она постоянна на любом подпространстве,
параллельном Ь. Таким образом, мы можем спроектиро­
вать Е в пределах Ь на некоторую плоскость, в которой й
и N становятся линиями, пересекающимися в точке Ь.
Функция I постоянна на линиях, проходящих в прост­
ранстве Е\ на любой окружности вокруг Е функция /
проходит монотонно через все действительные значения,
совершая дважды скачки от + о о до — оо при каждом пе­
ресечении гиперплоскости В. Наше описание можно по­
яснить следующим образом: функция / есть одномерное
преобразование, имеющее сингулярности, которые про­
являются как бесконечности (на О) и как существенные
сингулярности (на Ь), но мы можем применить сначала
двухмерное преобразование без сингулярностей. Все з а ­
труднения имеют место на плоскости, но даже там си­
туация очень простая; читатель, знакомый с однородны­
ми координатами проективной линии, может распознать
их здесь.
Возвращаясь к многограннику X, трансформирован­
ному с помощью упомянутой выше проекции в много­
угольник, мы видим, что он не может пересечься с гипер­
плоскостью Д, если должен существовать максимум. По­
этому он должен находиться по одну сторону от /). Здесь
/ монотонно возрастает по мере перемещения х в направ­
лении, которое мы можем назвать направлением часо­
вой стрелки; мы желаем найти самый удаленный, при
обходе по часовой стрелке, луч, проходящий через Ь, ко­
торый касается многогранника X. Для того чтобы такой
луч существовал, необходимо наложить дополнительные
условия на X , которых мы не будем касаться в деталях;
достаточно, если X ограничен.
29
Запишем задачу в следующем виде:
(х + Н
шах V. (2)
х^Х их + /<?

Знаменатель имеет неизменный знак, который мы мо­


жем считать (положительным. Тогда три умножении знак
неравенства сохраняется, и мы имеем
шах {I — Vи) х — Ук — к, (3)
х^Х
т. е. луч {(х) = V, -касающийся многогранника X в наибо­
лее удаленной (по часовой стрелке) точке, является
одновременно самым удаленным в семействе, всех линий,
параллельных ему и касающихся еще многогранника X .
К несчастью, мы ничего не знаем относительно этого па­
раллельного семейства. Мы можем, однако, аппроксими­
ровать его следующим способом.
Для того чтобы найти [шах ^ ^ на ограниченном

многограннике X , надо
1) выбрать х 1 на X и по индукции
о\ вычислить \У = *хП
2) ——1 +—л
' ихп + к ’
3) решить уравнение шах (I — \Упи) х = \Упк — к 4- й.
х^Х
В пункте 3 с1> 0. Если й = 0, тогда №п=У и хп опти­
мален. В противном случае
4) полагаем, что в пункте 3 оптимальным будет х п+1
и повторяем пункт 2 программы.
Величины монотонно возрастают до V, и итераци­
онный процесс заканчивается, т. е. \Уп = У для некоторо­
го значения п .
Формальное доказательство заключается в следую­
щем. Если в пункте 3 й < 0, то 1Уп> У у что невозможно
по определению №п. Величины №п монотонно возрас­
тают, поскольку мы постепенно приближаемся к крайне­
му лучу }(х) = V. Итерационный процесс имеет конец,
потому что решением любой линейной задачи, .подобной
сформулированной в пункте 3, является одна из вершин
многогранника X, а их имеется ограниченное количе­
ство.
30
Мы опустили случай, когда Р и N (параллельны.
В этом случае в пункте 1 ( = аи для некоторой постоян­
ной а. Метод, описанный выше, здесь также применим,
и \р2=у. С геометрической тонки зрения в этом случае
нет сингулярностей, и [ есть проективное преобразование
на проективную линию. Читатель, который заинтересует­
ся этим вопросом, может проверить это самостоятельно.
Мы не приводим также описания аналогичного метода
для некоторых минимаксных проблем более общих, чем
игры на планирование огня, а именно
а+ с
шах Ш1П т~7—, , (4)
( а, Ь) (с, й) ^ Х 2 Л "

где (а, Ь) и (с, й) суть точки на плоскости. Игры на пла­


нирование огня имеют именно такую форму: в них а, 6,
с и с1 являются линейными функциями нескольких дей­
ствительных переменных, которые, к счастью, подчине­
ны очень удобным ограничениям (III.1.2).
Запишем выражения 7^ = ^ / . и Ф = У ! у у.. На основа-
I !
нии (1.4.1), (III. 1.1) и (III. 1.3) мы получаем

2 /,(Р) •'(»,) + 2 » , (и) г щ


Й ( ^ П ) = " --------- т + ъ ш ---------- ' (5)
Определим маргинальные значения* боевых единиц
с помощью истинной цены У = т а х гат Я (Р , П) как
р ТС

— ВР (^.), а. = \V (Ь) — V. Заметим, что мы еще не


знаем, действительно ли т т шах Я (Р, П) = 1/ или нет.
и п р
по из уравнения (5) и из определений мы имеем

шах шп т ( X ^ с р . ( Г 1 ) 5.^ = 0. ( 6)
р
Записывая Я в виде Ур ^р '>+ а (р) + ^ М — МгО мы ви.
Р (Р) + ФСи)
дим, что тах а (Р) = т а х 6 (П) и что V есть истинное ми-
Р П
* М аргинальное значение какой-либо величины — скорость из­
б и е н и я этой величины вблизи ее оптимального значения. (Прим.

31
нимаксное значение. Точнее говоря, согласно (6) страте­
гия Р оптимальна тогда и только тогда, когда она макси­
мизирует линейную функцию /а(Р ) а.. Аналогичные со-
/
ображения справедливы и в отношении П. Принимая во
внимание ограничения (III. 1.2), мы получаем

И «Л°/ + Е Г1т а х V / = 2 « /А + 2 Ру т а х ( 6')


/ I 1 I / 1
и, следовательно, оптимальные распределения огня яв­
ляются чистыми стратегиями. Каждая боевая единица
типа I выбирает себе ту единицу противника типа /, ко­
торая максимизирует Ьг^а^ и сосредотачивает весь свой
огонь на ней.
По-прёжнему вычисления основаны на аппроксима­
ции истинного значения V и состоят в решении линейных
задач, одна из которых «касательна» к истинной задаче
в точке решения. Для некоторого выбранного значения
ИР решают уравнение (6') (это выполняется довольно
быстро, так как решение состоит из некоторых арифме­
тических действий и из выбора максимумов из несколь*
ких строк чисел) и обычно приходят к неравенству вме­
сто равенства (б'). Если равенство выполняется, то №
есть истинное значение цены. Если левая часть больше,
это означает, что № взято слишком малым. В этом слу­
чае стратегии распределения огня, которые удовлетво­
ряют уравнению (б') для этого значения ИР, будучи под­
ставлены в выражение для Я (Р ,П ), приведут к некото­
рому большему пробному значению цены ИР'. Если те­
перь оперировать с ИР', то итерационный процесс должен
неизбежно закончиться; однако мы не располагаем до­
статочным опытом числовых расчетов или пониманием
вычислительного процесса, чтобы утверждать, что этот
метод является наилучшим. В конце концов, теперь, ког­
да мы показали существование чистых оптимальных
стратегий распределения огня, проверка всех пар чистых
стратегий является конечным методом. Тем не менее, ме­
тод, предложенный выше, обладает преимуществом, со­
стоящим в монотонном приближении к решению.
Заметим, что минимаксную теорему для Я (Р , П)
можно вывести из более общей минимаксной теоремы
а ~I с
для билинейных дробных функций {14].. Форма . . .■
32
позволяет нам найти решение с помощью решения по­
следовательности задач линейного 'программирования.
Здесь мы имеем дело с частным случаем ограничений
(III.1.2), который сводит эти линейные задачи к обыч­
ным. Теперь можно отметить следующее: помимо того,
что наша модель во многих отношениях не может дать
точного описания реального боя, мы считаем возможным
такое решение, при котором сорок военных кораблей
обрушивают свой огонь на одну шлюпку для того, что­
бы потопить ее за какую-нибудь долю секунды. Эта не­
суразица может быть несколько скорректирована введе­
нием дополнительных ограничений. Однако за это при­
дется уплатить введением задач линейного программи­
рования, значительно более сложных, чем задача выбора
максимального значения из ряда чисел.

II 1.3. Расширенные игры на планирование


Проблемы планирования огня можно объединить
с задачами распределения сил в играх типа «хотепот»,
рассмотренными в части II. При этом должны быть при­
няты предположения, аналогичные предположениям моде­
ли, приведенной в разделе 11.3. Если же мы попытаемся
применять одну цз двух первых моделей, то мы столкнем­
ся с новыми трудностями. Необходимо решить, когда
могут производиться изменения в распределении огня.
Здесь имеются две альтернативы: во-первых, изменять
распределение огня,-когда теряется одна боевая единица,
и, во-вторых, изменять распределение огня одновремен­
но с изменением распределения сил. Если мы выберем
первую альтернативу, то мы должны исследовать про­
цесс уничтожения более подробно, чем мы это делали
до сих пор (а в первой части отмечалось, что мы не
в состоянии по-настоящему исследовать этот вопрос).
Если же мы вы'бираем вторую альтернативу, то мы стал­
киваемся с игрой 'более сложного типа, чем мы рассмат­
ривали раньше. В любом случае вычислительные труд­
ности превышают возможности современных вычисли­
тельных машин.
Поэтому мы обращаемся к правилу ходов, рассмот­
ренному в разделе II.3; изменения в распределении сил
могут производиться только тогда, когда уничтожается
одна из боевых единиц. Мы не будем описывать модель
33
ё Деталях; командиры определяют распределение сил,
вводят эти силы в бой и решают задачу планирования
огня применительно к выделенным силам. Существова­
ние решения и общие очертания вычислительного метода
довольно очевидны; следует начинать с сил, состоящих
из одной боевой единицы, и произвести расчеты сложной
последовательности минимаксных задач в обратном н а­
правлении. Структура таких составных игр и доказа­
тельство существования решения разработаны в весьма
общем виде в работе [6].
Даж е при использовании модели, которую мы выб­
рали в качестве самой легкой для решения, возникают
серьезные возражения. Во-первых, правило, по которому
стратегические решения могут меняться лишь при поте­
ре одной боевой единицы, выглядит мало обоснованным,
если только нам не посчастливится получить такую мо­
дель, при которой командование ни одной из сторон не
может выиграть, игнорируя это правило. С другой сто­
роны, эти правила могут оказаться недостаточно стро­
гими, если они ведут к бою, в котором участвуют сотни
боевых единиц и стратегии меняются по нескольку раз
в минуту. Нам не удалось выяснить, применимо ли вто­
рое возражение к данным моделям. Но бой четырех бое­
вых единиц показывает, что первое возражение может
быть применено в нашем случае.
Рассмотрим пример и покажем, каковы должны быть
чистые стратегии; входящие в оптимальный план игры.
Интересующийся этим вопросом читатель может произ­
вести вычисления самостоятельно. Матрицы огневой
мощи игры 2X 2 имеют вид:

Все йг и а* равны нулю. Окончательная цена игры рав­


на 1, если противник уничтожен или если он оставляет
поле боя. В противном случае она равна 0. Значения
цены игры №(ти т2\ ць цД, когда имеется т * своих
единиц ь-го типа и \х$ единиц противника /-го типа,
равны
Г (1 , 0; 1, 0) = 0,8333
1Р(1, 0; 0, 1) = 0,5000
№(0, 1; 1, 0) = 0,0625
34
47(0, 1; О, 1) — 0,6667
47(1, 0; 1, 1) =0,3571
47(0, 1; 1, 1) = 0,0392
47(1, 1; 1, 0) = 0,8661
47(1, 1; 0, 1) = 0,8750.
Все имеющиеся боевые единицы вводятся в бой
в этих восьми случаях. В шервых четырех случаях выбор
целей не производится; в следующих двух случаях
целью является первая единица противника; в послед­
них двух случаях предпочтительными целями являются
первая и вторая своя единица, соответственно. Обратите
внимание на то, что в случае (1, 1; 1, 0) маргинальное
значение цены первой своей единицы более чем в 15 раз
превышает (маргинальное значение цены второй своей
единицы.
Переходя к случаю (1, 1; 1, 1), мы видим, что здесь
должны быть решены пять нетривиальных игр на пла­
нирование огня. В любом случае, когда какая-нибудь
единица должна сделать выбор целей, она должна его
производить в соответствии со стратегиями

Игровая матрица, в которой перечислены стратегии рас­


пределения сил и в которой стропи относятся к своим си­
лам, имеет следующий вид:
(1, 1) (0, 1) (1, 0)

С
В этой игре седловой точки нет. Минимакс равен 0,6362,
а максимин — 0,5001. В смешанной стратегии принимают
участие чистые стратегии, входящие в подматрицу 2X2
в верхнем левом углу. Цена игры равна 0,5633.
Это означает, что каковы бы ни были распределения
сил, произведенные командирами, как только каждый из
них узнает о силах противника, он решает, выиграет ли
он, оставляя одну единицу в резерве или используя
одну единицу из резерва. При этих условиях будет су­
ществовать стабильность физической ситуации. Но для
того чтобы определить эти условия, мы должны полнее
описать условия боя. При этом решение проблемы соот­
ветственно усложнится.

ЧАСТЬ IV. ОПРЕДЕЛЕНИЕ КАЧЕСТВА ОРУЖИЯ

В этой части мы, руководствуясь уже рассмотренны­


ми моделями, хотим произвести оценку качества (цен­
ности) оружия. Для случая, когда определенному ти|пу
оружия противостоит определенный тип оружия против­
ника, имеются, как указывалось выше, две простые фор­
мулы, пригодные при Ь $^аа и &р<аа, соответственно.
При бр = аа формулы 'совпадают. Обе формулы дают
наилучшие результаты в тех 'случаях, когда силы обеих
сторон примерно равноценны. Таким образом, мы видим,
что общая проблема оценки оружия достаточно сложна,
даже если рассматривается только по одному типу ору­
жия с каждой стороны. Когда необходимо сравнить не­
сколько типов оружия, следует начать с их попарного
сравнения. Мы нашли оценки в случае смешанной про­
блемы, которая является достаточно полным обобще­
нием «главного» случая, когда &р>аа, по-прежнему при
условии, что силы примерно равны. Однако мы нашли
их в том смысле, что доказали их существование и, за
исключением некоторых краевых случаев, единствен­
ность. Достаточно эффективный вычислительный метод
еще предстоит найти.

IV. 1. Однородный случай


Вспомним формулу (1.3.2):
__ а — а + / ( а — а)2 + Щ
Р— 2[*

Это — уравнение прямой линии, являющейся решением


уравнений Ланчестера. При этом соотношение качеств
(цен) своих и вражеских единиц равно

а — а + } Д а — а)2 + Щ
Щ •
36
Пусть V и \У будут значениями цен в этом соотношении.
Тогда мы можем сказать, что если в ланчестеровском
процессе уничтожения гУ>р то побеждают наши вой­
ску, в '.противном случае побеждает противник, и в слу­
чае равенства бой заканчивается вничью. Достижение
по'беды зависит от сил нелинейно, а именно в 'соответст­
вии с обобщенным законом п2. Поэтому приписывание
боевым единицам линейных однородных значений явля­
ется неполным описанием ситуации. Тем не менее, в це­
лях экономии мы интересуемся в первую очередь выпол­
нением оценок с помощью простых формул. Вышеприве­
денная формула по всей видимости соответствует моде­
ли Ланчестера.
Формула (1.3.2) получилась при решении уравнения
условия „стабильности" — = — . Обратите внимание, что
Р Р
это же соотношение получается из уравнений
ХУ = ЬФ — аУ; ( 1)

= — <№.
В этих уравнениях (1) мы требуем, чтобы значение це­
ны V одной своей боевой единицы было пропорциональ­
но тому ущербу, который эта единица может нанести
противнику. За время сИ она нанесет противнику ущерб
ЬУРШ, но одновременно сама понесет потери аУд.1. Выяс­
няется также, что А,>0 тогда и только тогда, когда
&Р>аа. Действительно, если 6|3<аа, то маргинальное
значение цены боевой единицы, вводимой дополнительно
в 'бой, отрицательно (если мы предполагаем, что эта еди­
ница может находиться в резерве и может быть введена
в бой в случае необходимости). Этот результат легко.по­
лучить из уравнений Ланчестера-, но мы желаем исполь­
зовать соотношения (1) и (1.3.2) в других моделях и
в частности в модели раздела II.3.
Если б р ^ а а , то оптимальные стратегии нам извест­
ны из раздела II.3. Эти стратегии состоят в посылке всех
имеющихся сил на поле боя. При этом следует подчерк­
нуть, что ограничения в отношении передвижения бое­
вых единиц, вносящие трудности в других случаях, не
оказывают в данном случае никакого влияния. Приме­
няя оптимальные стратегии, 'мы получаем полностью
определенный стохастический процесс. Этот процесс был
37
исследован Ричардом Браунам [2] и из результатов его
работы, если считать V и ^ зад ан н ы м и уравнениями (1),
легко получается следующая теорема.
Теорема 1 (Брауна). П ри возрастании т и р ,
если г У > ( 1 — е ) для некоторого знаяения е > О ,
мы асимптотически приближаемся к победе с ве­
роятностью 1\ в противном случае выигрывает про­
тивник с вероятностью 1.
Среди прочих результатов Браун тщательно исследо­
вал асимптотическое поведение вблизи критического от­
ношения, однако недостаточное приближение к действи­
тельности не оправдывает изучения этих результатов.
Больший .интерес представляет вопрос о том, насколько
точно критическое отношение описывает преимущества
в случае малых сил, т. е. если гУ>р№ , то больше ли ве­
роятность победы, чем вероятность поражения? Не всег­
да; тем не менее, в результате вычисления нескольких
сотен примеров мы смогли сделать вывод, что модель
оказалась достаточно точной.
Результаты Брауна применимы в случае, когда
6|3>аа. Однако наши исследования показали, что если
командованию предоставлена некоторая свобода в отно­
шении перемещения сил в резерв и из резерва, то стоха­
стический процесс, описанный Брауном, не имеет места.
В этом случае мы должны иметь последовательность
дуэлей между одиночньгми боевыми единицами обеих
сторон. Дэвид Блекуэл указал, что это есть последова­
тельность независимых событий с идентичными распре­
делениями вероятностей. Эту же теорему можно легко
вывести на основе усиленного закона больших чисел
[5, стр. 208]; однако при этом критическое отношение по­
лучается другим.
Оно по-прежнему определяется условием -Д и

равно ■ Подытоживая вышесказанное, получаем


я+ р
Определение . Если то отношение цены V
одной своей боевой единицы к цене № одной боевой еди-
V а — а + ]/(<* — а)2 + 4 .
ницы противника равно — = — -------- щ------------- , если
V а+ 6
Теорема 2 (Б лекуэла). В последовательности
дуэлей при возрастании г и р, если г У > ( 1 + в)р№
для некоторого значения е > 0 , мы асимптотически
приближаемся к победе с вероятностью 1. В про­
тивном случае выигрывает противник с вероятно­
стью 1.
На основании теорем Брауна и Блекуэла и факта, до­
казанного в разделе II.3, мы можем сделать вывод о том,
что в случае 6(3 = аа все ненулевые назначения эквива­
лентны, и обе формулы в этом случае должны совпадать.
Действительно, легко видеть, что обе формулы сводятся
V Ь
к выражению — = — .
Для малых сил в случае Блекуэла мы не распола­
гаем достаточно большим расчетным материалом. Име­
ется предположение, что эта формула должна опреде­
лять вероятного победителя по крайней мере с такой же
точностью, как формула Брауна в случае Брауна.
В обоих случаях формулы находятся в результате
Г ^
решения уравнения —= -—. Мы не можем распростра-
р Р
нить эти результаты на случай, когда т типов оружия
противостоят п типам оружия, и получить значения цен.
Мы можем получить критические линии, а хотим полу­
чить критическую гиперповерхность. Мы можем и долж­
ны обобщить уравнения (1), которые дают правильные
результаты в случае Брауна. Доказательство такого
обобщения несколько расплывчато, и мы не можем д а­
же установить область, в которой оно справедливо. У нас
нет асимптотических теорем для неоднородных сил, так
же как нет полного описания интегральных кривых для
обобщенных уравнений Ланчестера. Таким образом, ос­
новным доводом в поддержку такого обобщения явля­
ется внешнее правдоподобие уравнений (1).
Отметим три возможных возражения против наших
доводов. Каждый из доводов вместе с нашим ответом
может быть легко трансформирован для случая неодно­
родных сил.
Ценность боевой единицы, принимающей участие
в сражении, может быть мысленно разбита на две ча­
сти. Существует непосредственная ценность единицы,
характеризуемая ее огневой мощью в применении к за-
39
Даче уничтожения противника. Существует также ее
ценность -выживания, 'которая пригодна для нашей моде­
ли независимо от того, введена ли -боевая единица в бой
или находится в резерве. Если аа>Ь $, то между этими
понятиями -существует небольшое отличие. «Непосредст­
венная» ценность отрицательна, и дополнительные бое­
вые единицы должны содержаться в резерве. Уравне­
ния (1), по всей видимости, характеризуют только эту
часть ценности единицы. С другой стороны, если аа>Ь$,
и нам позволено проводить бой как последовательность
дуэлей, то «непосредственная» ценность, очевидно, исче-
а -(- Ь
зает, и выражение - ^ в точности равно ценности
«выживания». Эти соображения подсказывают, что при
дальнейших исследованиях нужно рассмотреть другие
особенности оценки в случае Ь$>аа, т. е. именно в том-
основно'м случае, который мы желаем обобщить. Авторы
не знают, -как решить эту задачу.
Второе критическое замечание состоит в том, что, хо­
тя мы ведем анализ, не устанавливая точных конечных
состояний, т. е. без оценки условий, в которых может з а ­
кончиться бой, имеется довольно общее (хотя и несколь­
ко туманное) свойство, которым должны обладать эти
окончательные условия. Факту выигрыша поля боя долж­
на быть приписана существенная ценность. В против­
ном случае более слабая сторона просто откажется ве­
сти бой. .Это означает, что маргинальные значения цен­
ности боевых единиц максимальны в случае примерно­
го равенства сил, так как добавление одной боевой
единицы в этом случае означает существенное увели­
чение вероятности окончательной победы. Наоборот,
если добавить одну единицу более слабой стороне, то
это просто уменьшит ожидаемое значение сил победи­
теля в конце боя и увеличит вероятность победы
более слабой стороны всего лишь, например,, с 0,001
до 0,002. Необходимо отметить, что, во-первых, замечание
об отказе от боя более слабой стороны может быть доказа­
но в виде теоремы при разумных предпосылках; во-вторых,
замечание о том, что маргинальные значения макси­
мальны при приблизительном равенстве сил, вероятно,
может быть также доказано, но мы приводим его на ос­
нове числовых расчетов. Возвращаясь к нашим рассуж­
дениям, можно сделать вывод о том, что в случае одиг
40
наковых сил ценности единиц 'сильно зависят от окон­
чательных условий, т. е. от фактора, который мы до
сих пор игнорировали. Этот случай является непросто
важным частным случаем, во и тем 'случаем, которому
уделялось много внимания в наших рассуждениях
(прямолинейная интегральная кривая теоремы Брау­
на и Блекуэла).
Нашим ответом на это критическое замечание будет,
во-первых, то, что оно ограничивает применимость на­
ших формул. Нельзя ожидать, чтобы формулы давали
точную оценку маргинальных значений независимо от
того, одинаковы силы противников или нет. От них мож­
но ожидать только оценки средних значений. Во-вто­
рых, в нашем распоряжении имеется хорошо известное
оправдание: в возражении не говорится о том, что наше
отношение слишком велико или слишком мало; поэто­
му, если конечные условия примерно -симметричны, то
мы можем с известным оптимизмом пользоваться пред­
лагаемыми формулами, во всяком случае до тех пор,
пока не будут предложены лучшие формулы.
Читателю предоставляется возможность самому
взвесить как возражение, так и наш ответ. Отметим два
возможных источника асимметрии конечных условий:
высокая стоимость или трудность замены потерянного
оружия и стоимость человеческих жизней могут быть
различными для обеих сторон.
Третье критическое замечание касается деталей и
имеет меньшее значение, но и оно может оказать -нам
пользу. В уравнениях (1) если а = а , то их общее зна­
чение не играет никакой роли, так как хотя к зависит
от а, V и № при этом остаются неизменными, потому что
к + а остается постоянной величиной. Если, однако,
Ь—4, |3=1, а —а = 0, то одна наша единица обладает
четырехкратным преимуществом над единицей против­
ника. Если же а —а = 2, то это преимущество умень­
шится до двухкратного. Совместимо ли это? Ответ за­
ключается в том, что наши линейные формулы не дают
оценки превосходства, которое даже приблизительно
не линейно. Назначение наших формул состоит в оцен­
ке численного отношения сил, необходимого для пре­
одоления неблагоприятного соотношения в огневой мо­
щи. Здесь мы можем аппроксимировать кривую линию
прямой, касательной к ней в критической точке.
41
Возвратимся к нашему примеру для случая, когда от-
ношение------ —— -ц — — - равно двум. При этом две
вражеских единицы примерно эквивалентны одной нашей
единице. Действительно, в первом случае (6 = 4, (3= 1,
а — о, — 0, г = 1, р = 2) шансы на победу равны 8 про­
тив 7 в нашу пользу, а во втором случае— 11 против 10
в пользу противника. Если продолжать увеличивать а и а
при сохранении их равенства, то мы будем иметь случай
аа> 6 (3 и должны применять другую формулу. Если а =
— а = 5, то эта формула говорит нам, что две наши еди­
ницы эквивалентны трем вражеским единицам. Вероятность
победы в этом случае равна 0,4752. Эта цифра получена
в результате беспристрастного выбора из проведенных на­
ми расчетов. Поэтому, видимо, эти формулы будут столь
же точными, как в трех приведенных примерах. Точность
модели в отношении представления боя является совсем
другим вопросом.

1У.2. Уравнения ценности боевых единиц


Мы предлагаем для оценки ценности боевых единиц
пользоваться следующими уравнениями:
(Л + а <) У ,= тах6у1Р/,

(Я + а ^ ^ ш а х р . Е . . (1)

Согласно нашему несколько .вольному описанию, сде­


ланному ранее, наш метод представляет собой аппрок­
симацию кривой линии прямой линией. Но, пожалуй,
точнее было бы определить его как аппроксимацию
кривой линии фунтом масла, так как между стохастиче­
ским процессом и системой уравнений, такой, как си­
стема (1), существует весьма слабая формальная ана­
логия. Мы можем иллюстрировать это на примере од­
ной стохастической проблемы максимизации, весьма
тесно связанной с системой (1).
Прежде всего, обратим внимание на одну худшую
альтернативу. Мы уже указывали ранее на различие
между «непосредственной» ценностью боевой единицы,
определяемой применением ее огневой мощи в период
перед первым поражением, и остаточной ценностью,
42
которую мы назЁали ценностью «выживания». Непо­
средственную ценность можно определить точно по­
средством сравнения с другим возможным процессом,
при котором рассматриваемая боевая единица .не может
использоваться до тех пор, 'пока не произойдет по­
тери боевой единицы. Непосредственная ценность мо­
жет быть отрицательной, и в любом случае она должна
быть много меньше ценности выживания для боль­
шого числа боевых единиц. Тем не менее, как мы
уже говорили, наши уравнения, по всей видимости,
дают что-то похожее на непосредственную ценность.
Поэтому можно предполагать, что модель, напоминаю­
щая модель части III статьи, но для которой система
(1) совершенно точно определяет ценность, будет вклю­
чать некоторую схему для усиления непосредственной
ценности. Во всяком случае модель, приводимая нами
ниже, обладает этим свойством усиления посредством
повторения периода до первой потери боевой единицы
в течение неопределенного времени.
Пусть нам заданы т единиц оружия и п целей. Каж­
дая единица оружия должна выбрать себе цель и стре­
лять по ней до тех пор, пока она не будет разрушена
или пока посредник не остановит игру. Попадание в /-ую
цель приносит №. очков, но не приводит к ее уничтоже­
нию. Посредник допускает, чтобы партия игры продолжа­
лась в течение времени I или более с вероятностью €~к*.
За время сИу если /-ая единица оружия стреляет по /-ой
цели, вероятность ее уничтожения равна а М - ^ - о ^ ) , а ве­
роятность зарегистрировать попадание 6,.Л-|-о(сЙ). Тогда
легко понять, что /-ая единица оружия должна выбирать
себе цель / так, чтобы максимизировать ЬЬ]^№.\ при этом
общий ожидаемый эффект будет равен т а х Ь1 №..
I ^
Следовательно, цена игры равна сумме ценностей У1 бое­
вых единиц, где (к-{-а.)У1= тахЬ..№г
Таким образом, мы выставили все известные нам
аргументы в защиту предлагаемой оценки с указанием
условий, ограничивающих применимость такой оценки.
Мы ожидаем, что она будет применима в некотором диа­
пазоне параметров, охватывающем диапазон бр > аа.
43
Может быть, она остается в силе и тогда, когда все
боевые единицы введены в бой; при Х<0 это почти на­
верняка не является наилучшей стратегией. В примере,
приведенном в разделе III.3, Л= К 1 5 — 1>0. Значения,
полученные с помощью системы (1), составляют 6 к 5,16
в пользу 1своих сил. Если, однако, все силы брошены
в бой, то соотношение сил будет почти равным. Тем не
менее, имеются основания полагать, что обычно наилуч­
шей стратегией является введение в бой всех наличных
сил. К тому же часто не удается сохранить резерв в без­
опасности. Поэтому наша оценка должна с достаточ­
ной для большинства случаев точностью отвечать на
вопросы: имеется ли превосходство своих сил над си­
лами противника и какова относительная ценность р а з ­
личных составных частей или проектируемых составных
частей своих сил.
Остается проблема решения системы уравнений
(1), представляющая значительные трудности. Объеди­
няя уравнения, ;мы получаем
V;: X+ а- т а х ^ - 6 . г п а х ^ й. ( 2)

Теорема 1. Пусть а{, Ь.р а.., р суть неотрица­


тельные действительные числа , такие, что для лю ­
бого значения I некоторые 0 и д ля любого зна­
чения / некоторые р/; >- 0. Тогда существуют неот­
рицательный ненулевой вектор V и некоторая дей­
ствительная постоянная X, такие что удовлетво­
ряется уравнение (2).
Д о к а з а т е л ь с т в о . Рассмотрим единичный симп­
лекс 5, состоящий из всех V, удовлетворяющих условиям
0 для любого значения г и V V1= 1. Пусть 7? бу-
I
дет множеством всех действительных чисел, больших, чем
максимум всех — аь и — а.. Для и определим
Т{УЛ) = У, где I/' = ^ шах ^ Ъ.. шах ^ У к.
Пусть / (V, X) = ^ у ! ; тогда для фиксированных значе-
I
ний V при V > Я получаем /(У, Я 'Х /( У , Я). Мы опускаем
доказательство, которое не сложно, но связано с применением
44
сложной индексации. Неравенство справедливо для любой
координаты. При Я->оо, /(У, Я)—►О. По мере приближе­
ния Я к ее нижнему пределу / (У, Я) возрастает до беско­
нечности. Поэтому существует только одно значение Я=
= Я(У), при котором /(У, Я) = 1, т. е. Т (У, Я)0 $ . Мы
опускаем стандартное доказательство того, что Я(У) есть
непрерывная функция от У. Пусть теперь Ф (У )= Г [У , Я(У)]
есть непрерывное отображение 5 на себя, и поэтому по
теореме Брауера о фиксированной точке существует такое
значение У0, при котором Ф (У °)= У °. Но это означает,
что У0 и Я(У0) являются решениями уравнения (2).
Следствие . Е сли все Ь.. и положительны , то
положительны и все Уг.
Д о к а з а т е л ь с т в о . Пусть некоторое значение Уи
например Ух, положительно. Тогда для любого значения I

X*-{- а^ X -|- Ьа№


л г> 0-
Это следствие справедливо только три особом тред-
положении. Рассмотрим случай а\ = а /= 0 для 1 = 1,2,
/ = 1, 2, '&ц = &22= Р11 = 1, ^22 = 2, Ьц и равны нулю при
ьф]. Можно показать, что наше следствие, точно так
же, как и теорема 2 и некоторые дальнейшие зыводы,
непригодно для этого примера. Действительно, пример
относится к двум несвязанным между собой боям, ко­
торые не могут иметь одно и то же значение Я. Таким
образом, мы сталкиваемся с другим ограничением
применимости нашей оценки. Если оптимальные страте­
гии предписывают разбить бой на ряд отдельных стычек,
то, возможно, правильнее рассматривать все составные
части по отдельности. Ответ на вопрос о том, как можно
скомбинировать результаты, зависит от того, что про­
изойдет после этих отдельных стычек. У нас нет ника­
ких соображений по этому поводу.
На протяжении оставшейся части статьи мы будем
предполагать, что все Ъц и все р^ положительны. Мы
также запишем дополнительные условия, которые мы
удовлетворяем, а именно

I
У . > 0 и 1У;. > 0 для всех *, /, (3 )
Я > — а . и Я > — а. для всех /, /. .
45
Для заданных значений V и Я решение 1У является, оче­
видно, единственным и положительным. Условие ]У]У{= 1
I
позволяет нам говорить об единственности V.
Теорема 2. В решении уравнений (2) и (3) значе­
ние Я единственное .
Доказательство. Предположим, что (V, Я) и
(!/', Я') являются решениями. Мы можем положить, что
, У\
Я ' > Я , Ух У>УгУ>0, а отношение {.= -=- максимально
*I
при = Л Докажем противоречивость условия У’й > 0/У^
для некоторых значений к и для 0 > 1. Выберем к так,
чтобы для некоторого значения / было

у; 1 I/
Л '+а1Л' + а/ Ук"

Я' + Х '+ д , .
Введем определение 0 так как Я'>Я, а чис­
X+ а; X+ а, ’
лители и знаменатели этого выражения положительны, то
0 > 1 . Предположим теперь, что У'к <С. 0/УА; тогда мы
приходим к выводу, что

ь 1/ Ь к А*
X' + а, X' + ау Ук<
< м
X' + <Ху (Я + а/)(Я + а 1)У1= (Я^ + а 1) ^ 1Э
что противоречит определению I. Следовательно, противо­
речивость неравенства У'к > /1^ еще раз доказывает теорему.
Дальше мы отмечаем, что к удовлетворяет по мень­
шей мере одному алгебраическому уравнению относи­
тельно а, а, Ь, |3. Мы покажем, что если V не единствен­
но, то к удовлетворяет по меньшей мере двум таким
уравнениям, включающим несвязанные множества па­
раметров. Отсюда следует, что V не единственно толь­
ко тогда, когда параметры удовлетворяют некоторым
алгебраическим уравнениям в рациональной области.
Но если параметры выбираются случайно, то вероят­
ность того, что они алгебраически связаны, равна нулю.
46
Кроме того, множество значений параметров, для кото­
рых V не единственно, топологически неплотно, так как
требуется проверить только конечное число алгебраи­
ческих уравнений. Таким образом, мы пришли к сле­
дующей теореме.
Теорема 3. Решение системы (2) и (3) единст­
венно, за исключением неплотного множества зна­
чений параметров , имеющего меру нуль .
Мы должны рассортировать индексы, но нам доста­
точно будет проверить свои индексы I, к, . . . ; пусть к
будет консеквентой I для некоторого /; при этом

V— 1 V
* ^ + а1 ^ + а/ к*
Тогда в конечном множестве каждый индекс имеет по
меньшей мере одну консеквенту. Отсюда следует, что
существует некоторый цикл 1\ , ..., /п, такой, что 1р+\ яв­
ляется консеквентой гр для любого значения р и 1\ яв­
ляется консеквентой 1п (возможно, что п= 1). Освобож­
даясь от всех V по циклу длиной я, мы приходим к ал­
гебраическому уравнению степени 2п, удовлетворяемо­
му значениями %. Теперь на основании формул, исполь­
зованных при доказательстве теоремы 2, можно сфор­
мулировать лемму.
Лемма . Е сли (V, I) и (У , V) являются решениями
уравнения (2), то д л я любого положительного дей­
ствительного числа I множество всех индексов /,
таких, что V I V , содержит все консеквенты его
элементов , относящихся к V'.
Можно сказать по другому: множество всех I, такое,
что содержит все консеквенты его элементов,
относящихся к V. Если V и V' непропорциональны, то I
может быть выбран так, чтобы оба эти множества были не­
пустые. Тогда мы имеем два цикла и два независимых
алгебраических уравнения, удовлетворяемые с помощью Я.
Кроме того, имеется только конечное число уравнений,
подлежащих проверке (самая высшая степень равна удвоен­
ному числу индексов). Поэтому теорему 3 можно считать
доказанной.
47
Теорема 4 . Решение уравнения (2) является ниж­
ней полунепрерывной функцией параметров .
Это просто означает, что уравнения непрерывны, т. е.
предел решений есть решение 'предела, что* очевидно.
Отсюда можно легко вывести следствие.
Следствие . Решение уравнений (2) и (3) почти по­
всюду единственно и непрерывно .
Непрерывность нарушается только на граничных
поверхностях, на которых решение обычно! неоднознач­
но. Действительно, мы можем рассматривать эти поверх­
ности как места, где бой разбивается на несвязанные
между собой части (мы уже отмечали ©ту неприятную .
возможность). Мы1 опускаем утомительную формализа­
цию. Приводимое ниже утверждение является однознач­
ным, и заинтересованный читатель может продолжить
рассуждения теоремы 3 для его доказательства.
Утверждение . Цены не являются единственными
тогда и только тогда , когда бой разбивается на две
части т ак , что никакое оружие в любой из частей
не имеет оптимальной цели в другой части боя.
Подчеркнем, что область, в которой настоящие значе­
ния являются несоответствующими, включает не просто
сингулярные поверхности, но некоторые неизвестные со­
седние области.
Доказав существование и единственность (в боль­
шинстве случаев) решения уравнений (2) и (3), мы,
естественно, желаем узнать, а как же вычислить реше­
ние. Аналитические рассуждения теоремьи 1 можно про­
должить приблизительными вычислительными методами,
однако объем работы выходит за всякие (Пределы р а ­
зумного. Наилучшим из имеющихся в нашем распоря­
жении методов является следующий хорошо известный
и часто дающий неудовлетворительные результаты ме­
тод: задаться некоторыми значениями V* и одним зна­
чением X, подставить их в правую часть уравнения (2),
получить в левой части новые значения, задаться новым
значением X и продолжать эту процедуру до тех пор,
пока ошибка не будет мала или пока не остановится
вычислительная машина. У нас имеется пример, когда
при заданном правильном значении X, но при плохом
выборе значений V, этот метод, оказывается, не дает
48
сходящихся результатов. Однако он обычно дает доста­
точно хорошие результаты за малое время для неболь­
ших количеств типов оружия.
Для важного особого случая, когда все а* и а* равны
нулю, имеется конечный, но неосуществимый метод, опи­
санный одним из авторов в работе [7]. Прогресс в деле
изучения этих оценок может быть облегчен в результа­
те разработки более совершенных вычислительвы1Х ме­
тодов.

Л ИТЕРАТУРА

1. Р. В е П ш а п , Оп ап ИегаНуе ргосеЛиге Гог оЪ Ы ш п^ 1Ье Рег-


гоп гоо! о! а розШ уе т а ! п х . Ргос. Агпег. МаШ. 5ос., 1955, уо1.6,
р. 719— 725.
2. Р. Н . В г о V п. А зЬ а Ь а зи с апа1уз1з о! ЬапсЬез^ег^з 'Шеогу о!
сотЪ а!. О рега!ю пз РезеагсЬ ОШсе ТесЬшеа1 М ет о га п Л и т ,
О РО -Т-323, 1955.
3. Ь. Ь. О 1 п е в. Оп а Щеогет о! уоп Меитапп. Ргос. Ш!. Асас1.
5с1. 1Л5А, 1947, уо1. 33, р. 329—331.
4. Р е 11 е г. Оп Ше Шеогу о[ з^осЬаз^с ргосеззез. Р госееЛ т ^ з
о! !Ье Вегке1еу з у т р о з ш т оп таШ етаЦ са1 з^аИзИсз апЛ ргоЬа-
ЪШ1у, Вегке1еу, 1949.
5. В. Ф е л л е р . Введение в теорию вероятностей и ее приложения,
перевод с английского. И зд-во иностранной литературы, 1952.
6. Л. Р . I з Ь е 11. Р т Ц а г у ^ а т е з . Соп1пЪи!юпз !о Ще Шеогу о!
д а т е з , уо1. III.
7. Л. Р . I в Ъ е 11. А з!аЬШ!у ргоЫ ет т Ппеаг а1^еЬга. ОгЛпапсе
С от р и !ег РезеагсЬ Рерог!, 1956, уо1. 3, р. 24— 26.
8. Ь. Н. Ь о о т 1 з. Оп а Шеогет о! уоп Ыеитапп. Ргос. Ыа1. АсаЛ.
5с1. 1Л5А, 1946, уо1. 32, р. 213—215.
9. Ф. М. М о р з и Д ж . Е. К и м б е л л. М етоды исследования опе­
раций, перевод с английского. «Советское радио», 1956.
Ю. Ь. Н. 5 Ь а р 1 е у . 81ос1та'з11с & атез. Ргос. N 3 !. АсаЛ. Зек 1Л8А,
1953, уо1. 39, р. 1095—1100.
П . Р. N. В п о V. 'Соп!пЬи!юпз !о Ьапс11ез1ег аНгШоп Шеогу. Рго-
]’ес! РапЛ Рерог! № Р А -15078, 1948.
12. С. Т о т р к 1 П 5 . РгоЬаЬШзЦс р гоЫ етз апЛ шШ!агу еуа1иа!1оп;
ап е х а т р 1 е. ТЬе Оеог&е АУазЫп^Ьп 1Лтуегз1!у Ь о ^ зИ с з Рарегз,
1ззие 2, 1950.
13. С. А. Т г и е з Л е Щ. Ап е зза у !очуагЛ а ипШеЛ Шевгу о! зрес1а1
1ипс!юпз. Р п п се!оп , 1948.
14. Л. уоп И е и г л а п п . Ег^еЬш ззе е т е з МаШ. К о 1 к ^ ш и т з, 1937,
уо1. 8, р. 73— 83; перевод на англ, в Реу1е>у Есопогшс 5!иЛ1ез,
уо1. 13, 1945— 1946, р. 1—9.
РЕШЕНИЕ ИГР «БЛОТТО» В ЧИСТЫХ СТРАТЕГИЯХ
Д. У. Блэкетт *. Бостонский университет
Игры Блотто [1] состоят в том, что два игрока (А и В)
противостоящие друг другу на п независимых уча­
стках боя (обозначенных цифрами 1, 2, п ), должны
распределить все свои силы (Р и О подразделений
соответственно) по этим участкам, причем каждый игрок
не знает решения противной стороны. Платежом (т. е.
численным значением выигрыша игрока А или потерь
игрока В) на /-ом участке боя является функция
Р% (х> у) , зависящая только от участка боя и от сил, на­
значенных на этот участок игроками А и В. Платежом
всей игры является сумма платежей на отдельных уча­
стках боя.
Чистой стратегией для игрока А является распределе­
ние его сил по участкам боя. Такое распределение можно
представить вектором Х = (х1У х а, . . . , х п), где л;, пред­
ставляет ту часть сил игрока Л, которую он назначил на
/-ый участок боя. Для этого вектора должны удовлетво-
* п
ряться следующие условия: х ^ О для всех / и ^ х ( = Р.
1= 1

Аналогично чистая стратегия игрока В может быть описана


п
вектором У = (уи у г, .. .,у п), причем все у .> 0 и ^ у. = О.
1=1
Если игроки А и В применяют стратегии X и У, то платеж
равен

Н (Х , У) = |]Р .(Х ,., у.).


1=1
* О. В 1 а с к е Н . Риге в!га!е^у зсЛиНопз о! В1о11о д а т е з .
Кауа1 ЦезеагсЬ Б оф зП сз (2иаг1ег1у, 1958, уо1. 5, р. 107— 109,
50
Частные случаи игр Блотто, рассмотренные здесь,
относятся к таким играм, которые могут быть решены
рв Ч
чистых
Ио1131л стратегиях.
плл. Игра имеет решение в оптималь-
ных чистых стратегиях

У. Другими словами, чистые стратегии I и У являются


решением игры, если игрок А, выбирая стратегию_Х,
обеспечивает себе по крайней мере выигрыш Н(Х, У).
Одновременно, если игрок В выбрал^ стратегию У, то
игрок А не_получит более, чем Н (X , У). Таким образом,
стратегии^ X и У являются оптимальными, если К(Х) ~
= Н(Х, У) имеет максимум при X , а Ь (У )= Н (Х , У)
имеет минимум при У.
Так как мы будем применять дифференциальное ис­
числение, предполагается, что функции Рг(х, у) опреде­
лены и имеют непрерывные вторые частные производные
для всех действительных значений х и у (0 < х< Р и
О< у < 6 ). Те стратегии X и У, для которых *«>0 и
у {> 0 при /= 1 , ..., п, будут называться внутренними стра­
тегиями.
В настоящей статье даны необходимые условия, кото­
рые должны удовлетворяться, если внутренние стратегии
X и У игры Блотто являются оптимальными. Поэтому бук­
вами X и У будет обозначаться пара оптимальных внутрен­
них стратегий.
п
Так как Б (У) имеет минимум при У и V у. = 6 для

всех стратегий У, то функция

должна иметь минимум, когда у 1= у 1, . . . , уп_ х=


Для этих значений у х, . . . , уп_ х первые частные производ­
ные функции С? равны нулю. Обозначим буквами Ьк и
частные производные от Ь и С} по /г-ой переменной при
У = У. Так как <Зк = Ьк — ^ = 0 для к = \ , . . . ,п — 1,
то Ьх — Въ— . . . = В п. Обозначим через Рк значение пер­
51
вой частной производной от Рк (х, у) по у при х — х к И
у = ук. Так как

Ь ( У ) = % р Д , у}),
;=1
то 1.к = Р к и Р'{ = . . . = Р'п = — р, где р есть некоторая
постоянная величина. Производная Рк представляет собой
скорость, с которой дополнительные силы игрока В на
к -ом участке боя вызвали бы увеличение выигрыша игро­
ка А. Маргинальная полезность* сил игрока В на к-оч
участке боя при Х = Х и У = У равна — Р'к. Первым не­
обходимым условием, чтобы X и У были оптимальными
стратегиями, является равенство маргинальных полезностей
сил игрока В для всех участков боя, когда Х = Х и
У=У.
Второе необходимое условие, чтобы Ь(У) была мини­
мальной при У, касается вторых частных производных функ­
ции С}. Пусть 01^ и будут вторыми частными производ­
ными С} и Ь по /-ой и /-ой переменным при У = У. Для
соблюдения условия минимума функции при У симметрич­
ная матрица порядка (п — 1) X ( я — 1)

Сц • • @ 1, п— 1

м =

О ц -1 .1 * ' -® п—\, п—\

ь п + ^ пп ^п п • * * ^ пп
^ пп ^22 + ^пП * * * ^ пп
; •

^ пп ^ пп * • • ^ 7 2 — 1 , л — -1 Н г кп п

* См. сноску на стр. 31.


52
должна быть положительной полуопределенной. Если
через Р"к обозначить вторую производную Р к (х , у) по у
при х = х к и у = ук, то 1кк = Р к , и

Р ’х +Р'п ■ • * 1р"п

р': ■ .• .* р1 п"— 1, +' Г


р"п

Из этого матричного уравнения можно вывести следую­


щее условие.
Для любого числа к значений Р ” симметричная функ­
ция, образованная суммированием всех произведений к — 1
из к чисел, является неотрицательной.
Так, например, для к — 2
Р" + Р " > 0
при любом выборе I и /. Отсюда следует, что Р" может
быть отрицательной самое большее для одного из значений
/ = 1 , . . . , л . Если Р " < 0, то | Я " | < | Р " | , / = 1 , . . . , п .
Неравенство Р ”^ 0 означает, что первая производная
Р-(х, у) по у уменьшается при х = х^ у = уг Другими
словами, маргинальная полезность сил игрока В уменьшается,
и выигрыши игрока В подчиняются закону уменьшающе­
гося результата при х = х р у = у г
Эти условия совместно с условиями, необходимыми для
того, чтобы К (X ) имела максимум при X , дают следую­
щую теорему.
Теорема . X и V являются оптимальными внут­
ренними чистыми стратегиями противников в игре
Блотто с платежными функциями , имеющими вне -
прерывные вторые производные.
В ы в о д . Если игроки применяют стратегии X и У,то:
1. Маргинальная полезность сил игрока А (игрока В)
одинакова для всех участков боя.
53
2. Выигрыш игрока А (игрока В) подчиняется зако­
ну уменьшающегося результата на всех участках боя,
за исключением, возможно, одного участка. Абсолют­
ная скорость изменения маргинальной полезности имеет
минимальное значение на этом исключительном участке.

ЛИТЕРАТУРА

1. Э. АУ. В 1 а с к е Н . 5 ош е В1о11о & атез. № уа1 КезеагсЬ Ь о ^ зН сз


Риаг1ег1у, 1954, уо1. 1, р. 55— 60.
ТАКТИЧЕСКАЯ ВОЗДУШНАЯ ИГРА
Д. Р. Фулкерсон и С. М . Джонсон *. РЭ Н Д -К орпорейш н,
Санта-М оника, шт. Калифорния

Непрерывная модель тактического воздушного сра­


жения определенной продолжительности между воздуш­
ными силами двух противников, наносящими удары
по аэродромам или поддерживающими наземные силы,
была предложена Арнольдом Менгелем из РЭНД-Кор­
порейшн в 1952 г.
В настоящей статье мы рассматриваем дискретную
аналогию модели Менгеля как многоходовую игру,
в которой обе стороны в любой период операции распре­
деляют свои силы для одновременного выполнения двух
задач. Каждая сторона испытывает за данный период
времени определенные потери в результате аварий, ка­
тастроф и т. д. и, кроме того, теряет самолетьи пропор­
ционально интенсивности вражеских атак на ее аэро­
дромы. Пополнения для каждой стороны происходят пе­
риодически, и их можно считать функциями времени.
Предполагается, что платеж равен разности между об­
щими числами самолетовылетов для поддержки назем­
ных сил той и другой стороны за время операции.
В разделе 1 статьи дано подробное описание модели.
В разделе 2 мы представляем платежную функцию
в форме, нужной для последующего анализа. Начиная
с раздела 3 мы сосредоточиваем внимание на симметрич­
ных операциях, в которых скорости потерь одинаковы
для обеих сторон. Даны решения этого случая для опе­
раций конечной и бесконечной длительности. Оптималь­
ные стратегии в случае операций конечной длительности
заключаются для обеих сторон в ударах по аэродромам
с максимальной интенсивностью в начале операции и
* Ц. Р и П с е г з о п апс1 5. М. ^ о Ъ. п з о п. А 1асНса1 а й
^аш е. ОрегаПрпз ЦезеагсЬ, 1957, у о 1. 5, р. 704— 712.
55
в переходе к поддержке наземных сил в дальнейшем.
Для операций неограниченной длительности показано,
что обе стороньи должны или все время атаковать аэро­
дромы, или все время наносить удары по наземным
силам, в зависимости от величины потерь. Раздел 5 за­
вершает статью числовым примером для симметрично­
го случая и некоторыми шримерами для несимметрич-'
ного случая; при этом показано, что оптимальные стра­
тегии в последнем случае могут быть более сложными.
1. ФОРМУЛИРОВКА ЗАДАЧИ
Игра может быть описана следующим образом:
пусть р ^ О и <71^3 0 суть первоначальные силы», которы­
ми располагают соответственно Синие и Красные. Пред­
полагается, что перед первым ходом обеим сторонам
известны свои силы и сцлы шротивника, а также следую­
щая дополнительная информация:
Т — положительное целое число, обозначающее число
периодов операции;
^ О, л = 1 , . . . , Г — 1 — пополнения для Синих;
г'п ^ 0, п = 1 , . . . , Т — 1 — пополнения для Красных;
а , 0 < а < 1 — часть сил Синих, не уничтоженная огнем
зенитной артиллерии, в результате аварий и т. д. в тече­
ние некоторого периода времени;
с , 0 < с < 1 — часть сил Красных, не уничтоженная
огнем зенитной артиллерии, в результате аварий и т. д.
в течение некоторого периода времени;
Ь >• 0 — ущерб, который наносит один самолет Красных
при атаке аэродромов Синих;
О— ущерб, который наносит один самолет Синих
при атаке аэродромов Красных;
р, 0< р < 1 — коэффициент, учитывающий будущие пе­
риоды платежа.
В п -ый период, где л = 1 , . . . , 7 \ Синие делают выбор
величины х п> 0 < х п< р п, а Красные одновременно выби­
рают величину упУ 0 < у п< д п; эти выборы представляют
собой количества самолетов, действующих против аэродро­
мов противника, где
Рп~ т а х (0. арп_ х- Ь у п_ х+ г п_ х),
Чп ~ шах (0, сдп_ х— йхп_, + г 'п_ х).
56
Остаток сил рп —х п и с/п — уп автоматически кыСыл&еТсй
для ударов по наземным войскам. Синие хотят максимизи­
ровать, а Красные—свести к минимуму платеж

Р (х, у )= " % рп \{рп - х п) - (дп - уп)). (2)


/2 = 1

Так как обе стороны знают параметры а, Ь, с, й и


Рп, Яп, гя, гп в начале каждого периода, то ни один
из противников, очевидно, никогда не выделит самоле­
тов больше, чем их требуется для уничтожения сил .про­
тивоположной стороны (включая пополнения, поступаю­
щие в течение данного периода). Следовательно, урав­
нения ( 1) могут быть заменены уравнениями
Р п + 1 = а Р п ~ ЬУп + Гп> (1 „

Уп+1 = С<1 п - аХп + Гп>


где х п и уп ограничены неравенствами

0 < х я < т т ( р я,
( 3)

Здесь следует сказать несколько слов относительно фор­


мы информации о пополнениях. Оказывается, что в сим­
метричном случае, когда а = с9 Ь= с1, несущественно, из­
вестны ли пополнения заранее или о них сообщается
только время от времени. Однако вряд ли в общем слу­
чае будут существовать решения в чистых стратегиях,
если план организации пополнений не становится изве­
стным перед первым ходом. Задача нами и сформулиро­
вана в этом виде.
2. ДРУГАЯ ФОРМА ПЛАТЕЖНОЙ ФУНКЦИИ
Преобразуем выражение платежной функции. По­
вторное применение выражений ( 1') приводит к урав­
нениям
/2—1 /2—1
П—1—I„
А, = а " Р г - Ь ^ а п 1 +
2= 1 2= 1
(4)
Яп = ^ Ч г - - + 2 * ' - 1- '>;.
2 = 1

57
ё результате чего уравнение (2) принимает следующий вид;
г /
р ( * . у ) = 2 р" ( Л - ь ] у - ' - V, +
я= 1 \ 2=1
/2 - 1
„/2—1—2*
+ 2 “" Г;— Х„
*=1
п— 1
- I С | «- — ч + 2 - у ,;
2= 1 2=1

или после приведения коэффициентов при л:л и уп

Р (х, у) = Рг 5] р"а"_1 — <71 ^ р”^ -1 4-


/2=1 /2=1
Г—/г—1 Г—1 71—/2—1
+ ^ , г ' 2 (р Ч -т у у * ^ < м ‘+
/2= 1 2=0 /2= 1 2-

[ - • + * ! > > '


/2=1 2 = 0

-2 У/ /2 = 1 Е/=о
(5)

Для упрощения запишем это выражение в виде

Р(х, й = л : + 2 ( д г д „ - » х > - (6)


/2 = 1

где

/ „ = рл - 1 + р ^ Х V ) 11,
2 = 0
(7)

8 п =
- 1 - ^ 2 V ) 1] ,
2 = 0

а /С есть остаток правой части уравнения (5). Так как


множители в квадратных скобках выражений (7) моно­
тонно уменьшаются при возрастании п, то /„ и § п также
уменьшаются монотонно до тех пор, пока они положи-
58 ^
тельны, а после того, как они становятся отрицатель­
ными, их значения принимаются равными нулю.
Мы можем теперь рассмотреть следующий тривиаль­
ный случай:
Теорема 1. Е сли 0, ^ < 0 , то оптимальная
стратегия Синих (Красных) состоит в выборе х п = 0
(уп = 0) для всех значений п, т. е, обе стороны должны
выделять авиацию только д л я поддержки наземных
сил.
Обозначив эти стратегии соответственно через х° и у °,
получим

Р (Xе, у) = К - У Уп8п, р (Х°, у •) = к ,


п—1

Р (х, Л = К + 5 > . А .-
п=\
По предположению / \ < 0 , следовательно / „ < 0 для лю­
бых п. Аналогично § „ < 0 . Таким образом,
Р ( х \ у ) > Р ( х Л, у°)> Р (х , у°).
Заметим, что условия теоремы 1 подтверждаются авто­
матически независимо от Г, если р (а -(-6 )< 1 и р(с-{-й)<1,
так как, например,
ОО

- 1 + Р ^ ( Ра)‘— 1+р6т=^<0
1=0
означает, что р (а -[- Ъ) < 1.

3. СИММЕТРИЧНЫЙ СЛУЧАЙ
В этом разделе мы предполагаем, что а = с , Ь= й и
что на основании теоремы 1 ( = §г) > 0. Поэтому имеется
такое положительное целое число N <^Т, при котором

Докажем теорему 2.
Теорема 2. В симметричном случае оптимальная
стратегия Синих (Красных) состоит ге выборе х п —
?^щах (у^ — тах) д л я п = и ^ = ° (уп — 0 )д л я
59
т. е . обе стороны должны вложить макси­
мальные усилия в удары по аэродромам в первона­
чальные интервалы времени а затем атако­
вать наземные войска.
Прежде всего отметим, что независимо от тактики,
проводимой в течение первых N периодов, удары по на­
земным силам должны быть отнесены» на заключитель­
ный период кампании. Далее рассмотрим случай, когда
N = 1. Обозначим через х °, у0 стратегии, указанные в тео­
реме; тогда
т
Р (Х°, у) = к + (шах л:, — ух) /, — ^ уп!п,
п= 2

Р {х°, у й) = К -\- (шах х г — шах у г) /1(

Р (х, у°) = К + (хг — шах Уг) /, + ^ х п!п.


П=2
Так как
(шах х х — ух) !г > (шах х х — шах у х) Д > (хх — шах ух) Д,
а
т Т

п=2

то мы получаем седловую точку Р ( х °, у ) ^ Р ( х ° у у°)>


^ Р (х , у0) и, следовательно, теорема 2 справедлива для
N — I.
Следует указать, что простые неравенства, которы­
ми мы пользовались до сих пор, не очевидны для 1.
Поэтому мы будем продолжать анализ, применяя метод
индукции по N. но сначала мы докажем две леммы, ко­
торые будут полезны при применении метода индукции.
п
Лемма 1. Если 0 д л я п— 1 , . . . УЫ при стро­
ях
гом соблюдении неравенства д л я некоторого п и еслц
п > N > ■■• > Тя> 0, т о ^ * ,./,> о,
и
60
П
Обозначив частные суммы через К п, где /С0= О,
1=1
получим
N N-1
2 (
/=1
К , I ВД- 1 ,+ ,) + * „ /» > < > ■
1=1

Лемма 2. Пусть вп, Iп, гдо п = 2 ,. суть две


произвольные последовательности нулей и единиц и
предположим , что

\ = - 5«6 X - о - 5„) 2 вв_Ч»


/=1 г=1

Р„ = - К Ь2 ^ " '" Ч - ( ! - д 2 «""‘А-, (я = 2 , . . . . АО,


1= 1 1=1

гдо а, = 1, ^ = 0, 6 > 0 , 0 < а < 1 . -Сели


> /л? > 0, ото ^ (а. — р.) /. > 0.
/=1
Согласно лемме 1, поскольку (ах— {Зх) = 1 > 0, до-
п
статочно доказать, что все суммы
^ (а. — |3.),
1=1
п = 2, неотрицательны. Прежде всего отметим, что

^ ^ > 0 , % а п~ % < о
/=1 /=1
для всех п. Это очевидно для п — 1 и, предполагая, что
это справедливо и для п — 1, получаем, что либо
п— 1 Я—1
Р,>0,
1=1 ;=1 1=1
либо
/г - 1

1 Ч — 2 а" Ч = °
м 1=1
61
в зависимости от того, равно §п единице или нулю.
п
Такие же соотношения можно получить и для У 'а л“”*Рг
1=1
Для заданных последовательностей 1г длиной п — 1
эти неравенства указывают, что минимум выражения ап —
— получается при $п = {п = 0. Чтобы убедиться в этом^
напомним, что

ап ~ ~ $ п = ~ Ь ' ^ а 'г 1 + 1 Ч >

1= 1 1= 1
если — 1, /„ = 1;

1= 1 1=1
если 5/г = 1, 1п — 0;

« » - р* = —§ а"_ ч + 62
1=1 -1=1
если 5п = 0 ,1 Iп = Ц

% - р»= - 2 аЧ~ 'а< + 2


1= 1 1=1
если 5„ = 0, 1п = 0.:
Если П= 1, 1Т
„Ь— 1, то аП— *ВП> 0, тогда как если 5„Г1= 0~'
*п = °> ТО
Сравнение последнего выражения для ап — РЛ с каж­
дым из двух других остающихся приводит к неравенствам
п— \ п— 1 п— 1 п- 1

у у - ч ^ V Ь ^ ап- '~ ‘ а. >


шш шш Б а" " ‘
1= 1 1= 1 1=1 1= 1

которые, конечно, справедливы, так как суммы слева не­


отрицательные, а суммы справа — неположительные.
Теперь предполагаем по индукции, что
п
(я = 1, . . . , Я - 1 ) .
<=1
62
Тогда, используя Только чТо доказанное, получаем
Л1—1
2 ] к — с , ) » е (*,— ( » —
1 1=1

- д2 а 1= 1
(а<~ Р*) > ^ 0 “ а"~1) (“/ - &>■
*=1

Так как 1 — аы 1 монотонно уменьшается при возраста­


нии I, то лемма 1 и принятое по индукции предположе-
П
ние,что ^ ( а . — р . ) > 0 , п ^ N — 1, обеспечивает справед-
1= 1
N

ливость неравенства ^ (а. — (3.) > 0. Это и требовалось


1=1
доказать в лемме 2.
Возвратимся к доказательству теоремы 2. Теорема
предполагается справедливой для -всех игр, в которых
продолжительность первоначального интервала меньше,
чем Ы; это равнозначно предположению, что если пред­
посылки теоремы 2 справедливы, то обе стороны долж­
ны атаковать аэродромы с максимальной интенсивно­
стью в периоды 2 , . . . , М, а наземные силы только после
этого. Что должны делать, например, Синие в первый
период? Платежная функция Р (х , у) может теперь
рассматриваться как функция только от х х и у Исполь­
зуя выражения (3) и (4), получаем уравнения для хп и
У п при

х„п = пип ап 1А — Ь ^ ап 1 +
г=! 1=1
_1_
1 (ап Я г -
1 /—1

у„ = т т ап ’ а ^ а '- '- Ч + Е а * :—1—I Гг,


1=1 1=1
63
Г ^ Р , - Ь ^ а Г - , у 1+ ^ а - ‘г1+ , п) , ( 8)
1= 1 1= 1
и так как х п является кусочно-линейной функцией от х х
то за исключением конечного числа значений х х
п— 1

1Ив
^
дхп

I
— 6 V ап~ (1 < п < Л Г )
дхх 0 1а дхх
1=1
ИЛИ (9)
п— 1
дхп _ дх1
V 1 ап~1 д х 1 (1 < л < А 0 ,
дхх
-
Ъа
1= 1

в зависимости от того, могут ли Синие послать все свои


силы против аэродромов Красных или нет. Аналогично
имеем, что за исключением конечного числа точек

дУп
дхг ('< *< **)
1= 1
ИЛИ ( 10)
п—1
дУп
дхг < !< « < * ).
= - 2 3
1= 1

в зависимости от того, могут ли Красные послать все


свои силы против аэродромов Синих или нет.
дх;
Теперь мы можем применить лемму 2 при а. = ,

= - ^ - и «в = 1 или 0 {(п = \ или 0) в соответствии


с тем, могут или не могут Синие (Красные) атаковать
аэродромы Красных (Синих) всеми своими силами в пе­
риод п. При этом получаем
N
дР (*„ у,) _ VI ( дхп
дхх 1Л \ д х х (П )

Другими словами, платеж возрастает монотонно с воз­


растанием х\, и Синие должньи сделать, таким образом,
64
выбор л:1 = шах; аналогично платеж уменьшается с воз­
растанием уи и Красные должны сделать выбор */1 = т а х .
Э т озавершает доказательство теоремы 2.
Из доказанного видно, что в симметричном случае
оптимальные -стратегии не зависят от предположения,
по которому планы пополнений известны заранее. Все,
что нужно в первоначальной фазе игры, это предвари­
тельно перед каждым периодом объявлять пополнения
этого периода, так чтобы каждая сторона знала, сколько
самолетов потребуется, чтобы уничтожить силы против­
ника. В дальнейшем мы рассмотрим несимметричный
случай, в котором для одного из игроков важно иметь
более полную информацию о пополнениях.
Несомненно также, что теорема 2 справедлива для бо­
лее широкого класса весовых функций шп платежа, чем
случай шп — рл. Единственно, что требуется, это чтобы
Г — п— \

функция /я = — а>я -[-& Л монотонно уменьша­


ло
лась при / я > 0, а при отрицательных значениях /я сохра­
няла бы нулевое значение.

4. СИММЕТРИЧНЫЙ СЛУЧАЙ,
КАМПАНИЯ БЕСКОНЕЧНОЙ ДЛИТЕЛЬНОСТИ
На основе анализа игры конечной длительности можно
интуитивно прийти к выводу, что если Г = оо и если для
обеспечения сходимости мы предположим, что р > 1 и
что пополнения ограничены, то оптимальная стратегия
для каждой стороны в бесконечной игре состоит в том,
чтобы все время атаковать наземные силы, если р 1,
или— воздушные силы противника, если р(а-}-&)>1. Пер­
вая часть этого утверждения'может быть доказана анало­
гично теореме /, так как платеж для бесконечной игры мо­
жет быть записан в виде:

Р(х, ») = К + [ г ? р - 1 <12>
п=1

пН
а если р (а + & )< !, то — 1 < 0.
5—464 65
С другой стороны, если р (а -(-6) > 1 , то для достаточно
большого значения Т получаем

Л > /а > • • • > !т~к > 0; /М + Р . . . , /г < 0 , (13)


где к есть постоянное положительное целое число, не за­
висящее от Т. Обозначим через л;0 стратегию, которая
обеспечивает максимальное значение х п для всех п в бес­
конечной игре, а через (х°, у ) — игру, которая дает в ре­
зультате использования стратегии х 0 против произвольной
стратегии у платеж Р(х°, у). Используя выражение (13)
и предполагая, что р < 1 , можно привести стратегию х°
к игре конечной длительности Т с точностью до е для
достаточно больших значений Т. Поэтому, если Р т(х° , у)
является платежом в Г-ходовой игре и Ут есть цена этой
игры, то Р т{х°, у) Ут — е для достаточно большого Т.
Однако совершенно очевидно, что Р т(х°, у) стремится к
Р(х°, У), а Ут стремится к некоторой величине У; следо­
вательно, Р(х°, у) ^ V. Аналогично Р (х , у °)^ У . Таким
образом, игра бесконечной длительности имеет цену V =
= Р(х°, у °), и х °, у 0 являются оптимальными стратегиями
противников. Это можно сформулировать в виде теоремы 3.
Теорема 3 . В симметричной игре бесконечной д л и ­
тельности с р < У и с ограниченными пополнени­
ями оптимальная стратегия Синих (Красных) сос­
тоит в выборе либо х п = 0 (уп = 0) д л я всех п , либо
х п — тгх (уп = шах) д ля всех п, в зависимости от
тогоу р(а + 6 ) < 1 или р (а -}-& )> 1*

5. НЕКОТОРЫЕ ПРИМЕРЫ И ПРЕДПОЛОЖЕНИЯ


Приведем результаты вычислений при а — с — 0,9; Ь =
— с/= 0,2; Т — 20; р = 1; гп = гп = 100 для всех п.
Так как /„ _ ,= « / „ + « + * — 1, то / 20= — 1; /19 =
= 0,1 — 0,9 = — 0,8; /18= 0,9(— 0 ,8 ) + 0,1 = — 0,62,. .
/ 14= — 0,062882, / 18> 0 и, таким образом, обе стороны
должны наносить удары по аэродромам в течение первых
13 периодов, а по наземным средствам в течение остав­
шихся 7 периодов. Для = 5000, ^ = 5 0 0 0 цена игры
будет равна 0; для /?! = 4000, ^ = 5000 цена игры со­
ставляет приблизительно — 15 650; для /?2— 3 000, =
66
= 5000 цена игры равна приблизительно — 24650. В по­
следнем случае силы Синих полностью уничтожаются во
время четвертого периода, и Синие не имеют самолетов
до пятнадцатого периода, когда Красные прекращают
атаки аэродромов Синих. В конце игры Синие имеют 470
самолетов, а Красные— 1 345. Любая другая неоптималь­
ная стратегия Красных значительно ухудшает результаты.
Так, если предположить, что Красные в каждый период
выделяют половину своих самолетов для действий против
аэродромов Синих, то платеж при р х= 3 000 становится
равным— 16 700. Силы Синих не уничтожаются, и они кон­
чают игру со 100 самолетами, а Красные — с 990 самоле­
тами. Таким образом, эта неправильная стратегия Крас­
ных приблизительно эквивалентна тому, что Синим в на­
чале игры предоставляется лишних 1 000 самолетов. Приве­
денные нами примеры подтверждают то, что платеж обычно
довольно чувствителен к выбору стратегии.
Исходя из формы решения для симметричного слу­
чая, можно предположить, что в несимметричном случае
оптимальные стратегии будут состоять в концентрации
ударов по аэродромам в течение некоторой первоначаль­
ной фазы, а затем — по наземным силам. Точки измене­
ния стратегий обоих игроков при этом будут в общем
случае различными. Рассмотрим теперь пример с Т = 5,
р = 1, который покажет ошибочность этого утверждения.
Пусть
Р п + 1 = Р п ~ У п + Гп' 4 п +1 = -°>9 ^„ + 100,
где /71 = 100, ^ = = 9 0 , г1— г2— 0, г3 = 100, г4= 0.
Подставляя эти значения в уравнение (5), получим
Р (х, у) — 210 — 0,1 {х1-\- х 2-\-х 34 -. я4) —
--------^ 5 ( 3 ^ 1 “ К 2У2 + Уз) + У
5 *

Допустим, что у0 будет стратегией у°п = шах, п = 1,


2, 3; #5 = 0. Тогда
# ° = т т ( 9 0 , 100) = 90; у\ = т т ( # 2> /?2) =
= т т ( ? „ 10) = 10,
так как #2 = — 0 ,9 ^ -)- 100 10, и
#з = т т (<73, р 3 100) = #3 = 0,9дга 100.
67
Следовательно,
Р ( х , у°) = — 180 — 0,1^ + 0,8л;а — 0,1*3 — 0,1*4— Об­
какан' стратегия противодействия будет наилучшей для
Синих? Легко видеть, что это будет стратегия х5= Ха==
=л:з = 0 (действительно, рз = 0 независимо от того, что
предпринимают Синие в первые два периода, поэтому
и х3= 0). Отсюда следует, что

х 2= т а х = ш т //?2, -щд-\— р 9= р 1— у 1 = Ю,

и так как верхний предел х2 не зависит от х и то Синие


должны выбрать Х1 = 0. Другими словами, если Красные
в течение первых трех периодов атакуют аэродромы,
а затем наземные силы*, то для Синих лучше всего бу­
дет поражать наземные силы в течение первого периода,
атаковать аэродромы в течение второго периода и снова
атаковать наземные силы в течение оставшихся трех пе­
риодов. Обозначим эту стратегию Синих через х° и по­
ищем для Красных наилучшую стратегию противодей­
ствия.
В нашем случае
Р(х°, у) = 210 — 0,1*2 — Ъу1— 2уя — у 3+ у ъ,
или, так как *° = 100— Уи
Р { х \ У ) = 2 № — 2 $ У 1 — 2У2 — У з + У ь-
Отсюда уь= 0 в минимизирующем решении, а */3= гпах.
Так как г 3 = 100, то у ъ— дг. Выбор у2 не приводит
к изменению <73, а выбор максимального значения уг не
приводит к уменьшению #3. Поэтому (поскольку речь
идет о у 3) мы должны взять максимальные значения ух
и у 2. Таким образом,
г/а = гшп(<72, /?я) = 1ш п (100, 100 — у1) = Ю0 — ух,
и так как — 2,9у х — 2(100 — уг) = — 0 ,9 ^ — 200, то,
следовательно, ух — шах = 90. Поэтому *°, у 0 есть сед­
ловая точка платежной функции Р (х, у ).
Если в этом примере изменить пополнения так, чтобы
гл = гл = 100, то оптимальная стратегия Синих сме­
щается так, что х х = шах, * 3= шах, * 3 = = 0,
68
а оптимальная стратегия Красных остается прежней.
Чтобы убедиться в этом, заметим, что теперь
г/? = пип (90, 100) = 90,
у2 == пип ( , р%-(- 100) ——с]2= — 0 , 9 ^ -)- 100,
2/ з = т ш ( ^ 3, р г -\- 100) = ^з = — 0,9л:а 4 - 1 0 0 >

так что с точностью до постоянной получаем


Р (л:, у °) = 1,7х 1+ 0,8х 2— 0,1л:з — 0,1лс4— 0,1х5.
Легко заметить, что это выражение имеет максимум при
х х= шах, л;2= тах, х 3= х ^ = х ь= 0. Другими словами,
если Синие играют согласно этой стратегии, тр для Крас­
ных не остается ничего лучЩего, как выбрать стратегию у °.
Таким образом, маловероятно, чтобы в несимметричном
случае существовали решения в чистых стратегиях, если
пополнения заранее неизвестны.
Наш последний пример показывает, что в несиммет­
ричном случае игрок должен всегда тщательно распре­
делять свои силы между двумя задачами. Допустим,
что
Г = 5, р = 1, Рп+{= Р п ~ У п + гп,
^ ^ 0 , 4 ^ - 0 , 5 ^ + г;,
где
р х— 100, <7з = 50, г4= 0, г2= Ю, г3= 100,
г4 = 0, г ' = 9 0 , г'2= 0, Г з= 1 0 0 , г '= 0 .
Тогда с точностью до постоянной
Р (х, у) = — 0 ,188л:! — 0,22лг2 — 0,3л:з — 0,5л:4 —
— ■** — 3 2 /1 — 2 г /2 — г /з + г /5 .

Обозначим через г/° такую же стратегию Красных, как


в предыдущем примере. Тогда
2/°=гаш (50, 100) = 50,
у\ = г а т (< 72, /72 + 10) = т т ( 92, 60) = 60,
У з = т т ((7 з , /7з+Ю 0) = 9з.
69
С точностью до постоянной, получаем
Р (х, у °) == 0,012^ + 0,28д:2— 0,Зх3— 0,5л;4 — л;5.
Следовательно, Синие должны применять стратегию
^ = ^ = ^ 5=0 и л г ° = т т ( / ? 2, 0,8(/2) = ш ш (50,88 —
— 0 ,4^). Подставляем это решение в выражение для
платежа; после этого нам остается найти максимум следую­
щей функции от х х\

Р (х и х 2 , х°3 , х\ , х°5 , у°) = 0,012^-}- 14, если ^ < 9 5 ;

Р {х г, х°2 , х°3 , х \ , ^ , у ° ) = —0,1^4-24,64, если ^ > 9 5 .

Поэтому наилучшая стратегия противодействия стра­


тегии у 0 означает выбор х® ^ Э б ^ ш а х ^ . Так как мож­
но показать, что Р(х°, у) при стратегии у 0 достигает-,
минимума, то мы имеем дело со случаем, когда один из
игроков должен очень тщательно распределять свои силы, ч
Следует сказать, что в обоих примерах р{с-\-й)< ^\,
р (а 4" Ь) > 1. Мы приходим к выводу, что в случае
р(а-\-Ь)^>\, р (с -\-й)^> \ обе стороны имеют оптималь­
ные стратегии такого же характера, как в симметричном
случае. Разница состоит в том, что переход от дейст­
вий по аэродромам к действиям по наземным силам
может происходить в другие моменты времени. Если §п
меняет знак позже, чем скажем, при ^ +1, . . . ,
^ < 0 , то оптимальная стратегия Красных состоит в вы­
боре уп = шах для п — 1 , . . . , N и уп = 0 для п^>Ы,
и Синие изменяют свою стратегию раньше.
ИГРОВОЙ АНАЛИЗ
ТАКТИЧЕСКОЙ ВОЗДУШНОЙ ВОЙНЫ
Л. Д. Берковиц и Мелвин Дрешер *. Р Э Н Д — Корпорейшн,
Санта-М оника, шт. Калифорния

Проблема оптимального использования тактических


воздушных сил для выполнения различных боевых за­
дач, подобно многим другим военным проблемам, мо­
жет рассматриваться как многоходовая игра между дву­
мя противниками. В этой игре каждая из сторон стре­
мится получить наибольший возможный платеж, харак­
теризуемый выполнением некоторых задач в масштабе
данного театра военных действий.
В ходе тактической воздушной кампании командова­
ние каждой из сторон стоит перед выбором многих воз­
можных решений, определяющих исход кампании. Оно
должно вьибрать типы оружия для выполнения каждой
конкретной задачи, объекты налетов, профиль задачи,
тактику ее осуществления и т. д. Самым важным и ос­
новным решением в тактической воздушной войне яв­
ляется распределение самолетов для выполнения раз­
личных задач. Настоящая статья и посвящена пробле­
ме принятия решения при распределении сил.
Мы изложим результаты) игрового анализа упрощен­
ной, но довольно реалистической модели тактической
воздушной войны, рассматриваемой как многоходовая
игра. Само собой разумеется, что наиболее важные за­
ключения, которые следует извлекать из моделей т а ­
кого типа, состоят не в точных количественных резуль­
татах, а в качественной стороне решения и в установле­
нии природьи этого решения. Наши результаты относят­
ся не только к проблемам тактической воздушной войны,
* Ь. Э . В е г к о т о П г апс1 М е 1 у 1 п Э г е з Ь е г . А ^аш еДЬеогу
апа1уз1з о! !асйса1 а!г \уаг. Орега1юпз НезеагсЬ, 1959, уо1. 7,
р. 599—620.
71
но могут пролить некоторый свет на применение игро­
вого моделирования военных ситуаций. Этот вопрос рас­
смотрен в заключительном разделе статьи.
Математические доказательства представленных
здесь результатов даны в работах {1], [2] и [3]. Однако
основная идея, лежащ ая в основе всего исследования,
вместе с ее доказательством изложена в Приложении.
В нем (приводится также точная математическая фор­
мулировка игры в нормальной форме.

ВОЕННО-ВОЗДУШНЫЕ ОПЕРАЦИИ

Тактическая воздушная война характеризуется рядом


боевых действий или задач, выполняемых для осущест­
вления определенной операции. Обьичными являются
следующие боевые действия:
Удары по военно-воздушным базам. Эти операции
направлены против комплекса и системы управления
военно-воздушных баз противника на данном театре
с целью уничтожения самолетов, личного состава, тех­
нических средств и т. д.
Противовоздушная оборона. Она представляет собой
противовоздушные операции, т. е. операции против уда­
ров противника по воздушным базам.
Непосредственная авиационная поддержка. Объекта­
ми нападения при непосредственной .авиационной под­
держке являются скопления войск противника или его
укрепленные позиции; целью непосредственной авиаци­
онной поддержки является помощь наземным войскам
непосредственно на поле боя. Это осуществляется
использованием огневой мощи самолетов против назем­
ных целей.
Удары по коммуникациям. Эти операции проводятся
для ослабления военного потенциала противника посред­
ством ударов по его транспортным средствам.
Разведка. Наиболее важной функцией разведыва­
тельных операций является получение информации
относительно объектов нападения.
Транспортировка по воздуху. В этих операциях са­
молеты используются для перевозки войск и военного
оборудования.
В настоящей статье мы объединим непосредствен­
ную авиационную поддержку, удары по коммуника-
72
циям, разведку ;в интересах наземных сил и транспор­
тировку по воздуху под общим названием «поддержка
наземных операций» или «поддержка наземных войск».
Разведка, направленная против воздушных сил против­
ника, будет рассматриваться как часть задачи нанесе­
ния ударов по базам противника.

ФОРМУЛИРОВКА ИГРЫ

Мы рассматриваем тактическую военно-воздушную


игру как последовательность операций или ходов, каж ­
дый из которых включает одновременно удары по ба­
зам, противовоздушную оборону и поддержку наземных
сил, предпринимаемых обеими сторонами для осущест­
вления некоторой тактической задачи, т. е. для получе­
ния некоторого выигрыша. /Предположим, что в начале
воздушных операций Синае имеют р самолетов, а их
противник, Красные, имеют <7 самолетов. Рассмотрим
какую-нибудь одну операцию в кампании, например, на­
чальную операцию. Предположим, что в этой операции
Синие выделили х самолетов для ударов по базам про­
тивника, и самолетов для противовоздушной обороны
и т —р —х— и самолетов для поддержки наземных сил.
Предположим аналогично, что Красные в своей первой
операции назначили у самолетов для ударов по базам,
до самолетов для ПВО и п —у —у —до самолетов для под­
держки наземных сил. Перед этой начальной операцией
и перед любой последующей операцией каждая сторона
принимает решения, не зная распределения сил против­
ника. Однако предполагается, что каж дая сторона знает
число самолетов, которым обладает ее противник.
Так как Красные назначили до самолетов для ПВО,
то -мы можем ожидать уменьшения числа самолетов Си­
них, которые прорвутся к воздушным базам. Число са­
молетов, перехваченных Красными, будет пропорцио­
нально числу до, например, сдо, до тех пор, пока не бу­
дут перехвачены все самолеты Синих. Коэффициент про­
порциональности с, или оборонительный потенциал
Красных, зависит от характеристик самолетов и от вы­
соты их полета, а также от характеристик их вооруже­
ния. Число самолетов Синих, которые прорвутся через
оборону Красных, равно х — сдо, если ст не пре­
вышает х. Если сдо>х? то нц один самолет Синих не
73
проникнет к объектам 'Нападения. Поэтому число ата­
кующих самолетов Синих, проникающих через оборону
Красных, равно наибольшему из чисел х—сш или 0, т. е,
равно шах (0, х — схш).
Целью ударов Синих по базам противника является
ослабление военно-воздушных сил Красных посредст­
вом бомбардировки определенных объектов. При этом
число уничтоженных самолетов будет зависеть от числа
атакующих самолетов, прорвавшихся сквозь оборону
Красных. Если предположить, что каждый прорвавший­
ся самолет Синих может уничтожить Ь самолетов про­
тивника, то начальная операция Синих против баз Крас­
ных может привести к уничтожению самое большее
Ьт ах (0, х — схю) самолетов Красных. Число самолетов
Красных, действительно уничтоженных в результате
атаки Синих, зависит от числа самолетов Красных,
находившихся на базах во время налетов. Коэффициент
пропорциональности 6, или наступательный потенциал
Синих, зависит как от характеристик объектов нападе­
ния, так и от характеристик (самолетов.
Предполагается, что воздушные -силы Красных умень­
шаются во время операции также в результате азарий
и зенитного огня. Предположим, что эти потери пропор­
циональны общему числу самолетов, используемых
Красными во время операции. Тогда эти потери рав­
ны а<7, где а есть интенсивность потерь Красных.
Наконец, предположим, что воздушные силы Крас­
ных пополняются во время операции 5 самолетами. Это
пополнение .подвержено атакам Синих, но не может
быть использовано Красными в течение операции.
Таким образом, число самолетов Красных, подвер­
гающихся ударам во время операции, равно д +
Поэтому в результате начальных ударов Синих по ба­
зам противника будет уничтожено
т т [<7 — ад-\-з, 6т а х ( 0, л; — схю)\
самолетов Красных.
Предполагается, что самолеты, участвующие в про­
тивовоздушной обороне, потерь не несут, а самолеты
Красных, которые не смогли преодолеть ПВО Синих,
возвращаются на свои базы. Иначе говоря, мы предпо­
лагаем, что .потери сторон в результате воздушных боев
незначительны по сравнению о другими потерями и что
74
самолеты ПВО' не допускают бомбардировки намечен­
ных объектов атакующими самолетами, не обязательно
сбивая их. Так, .например, атакующий самолет может
быть поврежден, но не настолько серьезно, чтобы не
вернуться на свою базу; в результате противодействия
он может развернуться, не дойдя до цели, наконец, он
может, даже достигнув цели, настолько отклониться от
боевого курса, что сброшенные им бомбы вызовут не­
значительный эффект, и т. д.
Если учесть все потери и пополнения, то после пер­
вой операции силы Красных будут равны
дх= У~\~ $ — а д — ппп[<7 — ад-\-8у 6тах(0, л; — ст)] =
= тах[0, — а д — 6шах(0, л; — сш)\. (1)
Точно таким же образом мы можем подсчитать си­
лы Синих после .первоначальной операции. Они будут
равны
р г = шах [0, р -\-г — й р — г шах (0, у — ка)\ (2)
где коэффициенты е >и к имеют те же значения, что
и коэффициенты а, Ь и с для Красных, а г есть попол­
нения самолетов Синих.
• У Синих теперь имеется р\ самолетов, которые они
должны распределить для выполнения тех же трех за­
дач во второй операции. В результате этой второй опе­
рации останется р2 и д2 самолетов для выполнения
третьей операции. Этот процесс повторяется на протя­
жении всей кампании.

ПЛАТЕЖ
Рассмотрим использование Синими своих воздушных
сил >на протяжении кампании. Предположим, что их
целью является поддержка наземных войск на поле боя
и что результаты такой поддержки зависят от числа са­
молетов, выделенных для этого. Предположим, что мож­
но создать для Синих платежную функцию, выражаю­
щую зависимость платежа в конце каждой операции
кампании, определяемого глубиной продвижения назем­
ных сил, от числа самолетов т , выделенных для назем­
ной поддержки. Эта функция сильно зависит от характе­
ристик наземных целей, т. е. от степени концентрации
войск, транспортных средств и боеприпасов и от инже­
75
нерного оборудования позиций. В настоящей работе мы
не делаем попыток представить эту функцию в явном
виде. Мы просто предполагаем, что платеж 3(т ) являет­
ся положительной функцией, возрастающей с возраста­
нием сил, выделяемые для наземной поддержки.
Так как наземные войска Синих должны продвигать­
ся вперед в условиях воздействия самолетов Красных,
поддерживающих .свои наземные силы, то платеж Си­
них больше не равен 5 ( т ) , как указывалось выше, а бу­
дет меньше в соответствии с числом п самолетов, выде­
ленных Красными для поддержки наземных войск.
Если Т(п) есть функция, характеризующая продвиже­
ние наземных сил Красных, то результирующее продви­
жение наземных сил Синих равно
У(пгу п )= 3 (т ) — Т(п).
Это выражение представляет собой платеж Синим
за один такой период или за одну операцию. Платеж за
всю кампанию, состоящую из N операций, равен сумме
платежей для каждой из N операций, т. е.
N

М = ^[3 (т )-Т (п )].

Теперь проблема, перед которой стоит каждая из


сторон, становится очевидной. При планировании оче­
редного хода Синие хотели бы выделить большое число
самолетов для поддержки наземных сил и тем самым
увеличить значение 5 ( т ) , но, с другой стороны, им
одновременно хотелось бы уничтожить воздушные силы
Красных посредством ударов по базам с тем, чтобы ве­
личина Т(п) была мала или вообще равнялась нулю
для последующих ходов. Кроме того, если они не пре­
дусмотрят выделения сил для противовоздушной оборо­
ны, то они могут понести большие потери в случае вы­
деления Красными крупных сил для нанесения ударов
по воздушным базам. Поэтому каждый игрок должен
принимать во внимание возможности, имеющиеся в рас­
поряжении его противника, и учитывать развитие собы­
тий в будущем.
В нашей модели тактической воздушной войны мы
примем еще одно упрощение, состоящее в том, что мы
76
будем считать платежные функции 3(т ) и Т(п) линей­
ными, например, 5{т) =т, а Т(п) =п. Тогда платеж для
всей кампании будет равен
N

М (х, и; у, = — х — и) — (<7 — у — а>)]. (3)

Синие желают сделать этот платеж как можно боль­


шим посредством выбора соответствующих значений х и и
в каждой из N операций, а Красные хотят сделать его
как можно меньшим, выбирая соответствующие значе­
ния у к №.

ОПТИМАЛЬНЫЕ СТРАТЕГИИ ДЛЯ СЛУЧАЯ РАСПРЕДЕЛЕНИЯ


СИЛ ПО ДВУМ ЗАДАЧАМ

Мы начнем наш анализ модели тактической воздуш­


ной войны рассмотрением случая, когда потенциалы
противовоздушной обороны с и к равны нулю. Это озна­
чает, что 1мы принимаем во внимание только две задачи:
удары по 'базам и поддержку наземных сил, на выпол­
нение которых должны выделяться самолеты. Уравне­
ния (1 ) и (2) теперь будут иметь вид:

<71 = тах [0 , <7-}- 8 — ад — Ьх\, (4)


/?1 = тах[0 , р + г — йр — еу], (5)

а уравнение платежа (3) сведется к


N
м (X , у) = Л [{р — Х)—(Ч — у)]. (6)

Этот вариант тактической военно-воздушной игры


был сформулирован Фулкерсоном и Джонсоном [4],
и -ими было найдено решение для симметричных пара­
метров, т. е. для а = с1 и Ь= е. Полное решение для асим­
метричного варианта было позднее найдено Дрешером
[3]. Мы приведем здесь полученные им результаты, по­
дробные доказательства которых читатель /может найти
в работе [3]. Краткое описание метода доказательства
приведено .в Приложении.
77
Характерной особенностью решения тактической воз­
душной игры 1С распределением сил по двум задачам
является то, что независимо от коэффициентов потерь,
начальных условий и относительных сил сторон во вре­
мя каждого данного хода обе стороны имеют оптималь­
ные чистые стратегии. Хотя игрок делает каждый ход
одновременно со своим противником, ему нет нужды
прибегать к механизму случайного выбора или к обма­
ну. Это позволяет определить оптимальную стратегию
каждого игрока, задавая для каждой операции кампа­
нии число самолетов, выделяемых для нанесения уда­
ров по базам и для поддержки наземных сил. Эти опти­
мальные распределения зависят от коэффициентов по­
терь а, 6, б/, е и от числа операций, остающихся до кон­
ца данной кампании.
Для описания оптимальных стратегий введем неко­
торые обозначения. Из уравнения (4) видно, что если
у Синих имеется достаточное число самолетов, то они
могут уничтожить воздушные силы Красных, выделяя
л ; = ------^ ----- самолетов для нанесения ударов по ба­
зам. Выделение большего числа самолетов для ударов
по базам является расточительностью. Таким образом,
можно назвать такое распределение, при котором Синие
выделяют х = тт 1р, 4------— ^самолетов для ударов
по базам.Красных и р — х самолетов — для поддержки
наземных войск, тактикой ударов по базам, так как оно
воплощает тактику максимальных усилий по уничтоже­
нию воздушных сил противника на его базах. Такое рас­
пределение мы обозначим буквой Л. Аналогично распре­
деление, при котором Красные выделяют у=
самолетов для ударов по базам,
а оставшиеся <7— у самолетов •— для поддержки наземных
сил, можно также назвать тактикой ударов по базам
и обозначить также буквой' Л. Распределение, при ко­
тором один из игроков посылает все свои самолеты для
поддержки наземных сил, будет обозначаться буквой О.
Рассмотрим, наконец, такое распределение самолетов Си­
них, при котором они назначают х самолетов, где лс<<х>
для ударов по базам, а остаток своих самолетов, р —лс, —
78
для поддержки наземных войск. Применяя такую тактику,
Синие уже не прилагают максимальных усилий для уда­
ров по базам. Обозначим подобную тактику буквами
(Л, О). Аналогично обозначим буквами (Л, О) такую так­
тику Красных, при которой они назначают для ударов по
базам у самолетов, где у<Су, и — ~у самолетов — для
поддержки наземных войск.
Оптимальные стратегии игроков зависят от коэффи­
циентов потерь. Вначале предположим, что е—^> 0
и Ъ—а > 0. Смьисл этих неравенств состоит в том, что
ожидаемое число потерянных самолетов, приходящееся
на одну сброшенную противником бомбу, больше ожи­
даемого числа самолетов, потерянных в результате ава­
рий, зенитного огня и т. д., приходящегося на один с а ­
молетовылет. Оказывается, что оптимальная стратегия
для каждой стороны требует начинать кампанию с се­
рии распределений типа Л и заканчивать ее серией рас­
пределений типа О. Моменты времени, в которые игроки
должны переходить от тактики А к тактике О, будут
в общем случае неодинаковыми для Синих и Красных.
Они зависят от величин коэффициентов потерь.
Предположим теперь, что е—с!>О и Ь—а < 0, т. е.
Красные несут .меныйе потерь от налетов противника,
чем от аварий. В этом случае характер оптимальной
стратегии Красных не изменится. Они начинают кампа­
нию серией атак типа Л и заканчивают ее серией атак
типа О. Оптимальная же стратегия Синих при этом не­
сколько изменится. Они должны начинать серией атак
типа (Л, 6 ), после чего следует одна операция с рас­
пределением типа Л. Во всех остальных операциях Синие
концентрируют все свои силы для поддержки наземных
войск, т. е. применяют распределение типа О. Момент
перехода Красных к поддержке наземных сил наступает
позже, чем соответствующий момент для Синих.
Если е — и Ь—а > 0, то только что сделанные
выводы справедливы и при перемене ролей Синих и
Красных.
Наконец, если е— и Ь— 0, то у Синих
и у Красных имеется одна и та же оптимальная стра­
тегия, состоящая в том, что обе стороны выделяют са­
молеты только для поддержки наземных сил и совсем
не выделяют самолетов для ударов по базам против­
ника.
7?
Все эти рассуждения сведены в табл. 1. В этой таб:
лице нумерация ходов произведена от конца игры. Ц е­
лые числа / и §, приведенные в таблице, определяют
первую операцию ((считая от конца игры), при которой
происходит переход от поддержки наземных сил к уда­
рам по аэродромам. Их можно найти следующим обра­
зом: число / равно наибольшему целому числу, для ко­
торого справедливо неравенство
^ ___1 - ( 1 - а / п
е й
,В свою очередь число § равно 'наибольшему целому чи--
слу, для которого удовлетворяется неравенство
^ ___1 —(1 —а)ё
# а
Заметьте, что если е— О, то числа / не существует,
а если Ь—а < 0, то не существует числа §. Мы можем
в этих случаях положить их равными +оо. Целое чис­
ло I обозначает номер последней операции (считая
от конца игры ),.при которой один игрок применяет
тактику Л, а другой— тактику О. Мы не оценивали /
как функцию коэффициентов потерь.

ОПТИМАЛЬНЫЕ СТРАТЕГИИ ДЛЯ СЛУЧАЯ РАСПРЕДЕЛЕНИЯ


СИЛ ПО ТРЕМ ЗАДАЧАМ
Возвратимся к более общей модели, в которой име­
ются все три типа задач: удары по базам, противовоз­
душная оборона и поддержка наземных войск. Мы уви­
дим, что увеличение числа задач до трех приводит к су­
щественным изменениям характера оптимальных так­
тик.
Для того чтобы упростить анализ, мы предположим,
что Синие и Красные обладают одинаковыми оборони­
тельными потенциалами, т. е. каждый самолет, выделен­
ный для противовоздушной обороны, может предотвра­
тить прорыв к объектам одного атакующего самолета.
Иными словами, мы .предполагаем, что с = к = 1. Мы
предполагаем также, что один атакующий самолет, ко­
торому удается проникнуть сквозь систему обороны, мо­
жет уничтожить один самолет во время налета на аэро­
дром, т. е. Ь = е= 1, и что потери, вызванные неудачными
80
Таблица 1
О птимальны е р а сп р ед ел ен и я си л м е ж д у д в у м я за д а ч а м и
Оптимальное распределение во
время п-то хода (считая от
конца кампании)

+ V/

Коэффициенты потерь Игрок


+ 3-
Ъо
!
п и
В с
V/
I
с С
уу
Е

е— 0 , Ь— <2^>0
Синие О О А А
К е { Красные О А А А
Синие О А А А
ё<! { Красные О О А А
Синие О А А А
ёЧ { Красные О А А А
е — ^ > 0 , Ь— <2<:0
8=оо |
Синие О О А (А, О)
Красные О А А А
0 , 6— а > 0
Синие О А А А
(=оо |
О А
Красные О ( а , О)
е— ^ < ;0 , Ь—а ~ 0
! = 8 = оо |
Синие О О О О
Красные О О О О

взлетами, авариями и зенитным огнем, незначительны.


Наконец, мы предположим, что пополнения самолетов
не производится, т. е. г=8 = 0. Тогда остаток самолетов
в конце какой-нибудь операции будет для Красных
^ 1 = т а х [ 0> р _— шах (0, у — и)],
а для Синих
^1 = т а х [ 0> ^ — шах(0, х — до)].

Мы должны подчеркнуть тот факт, что сделанные нами


упрощающие предположения не оказывают никакого
влияния на общую форму оптимальных стратегий.
В следующем разделе мы покажем, как изменение ве­
личины противовоздушного оборонительного потенциала
изменяет форму оптимальной стратегии.
81
Оптимальные стратегии для модели с тремя зада­
чами отличаются от решения модели с двумя задачами
в двух отношениях: во-первых, оптимальная тактика
зависит от соотношения сил обеих сторон; во-вторых,
оптимальный способ игры требует от одного из игроков
применения смешанной стратегии. Мы дадим полное
описание оптимального распределения тактических воз­
душных сил в зависимости от числа операций, которые
предстоит провести, и от соотношения сил обеих сторон.
При этом мы-будем всегда предполагать, что в каждом
рассматриваемом ходе Синие являются более сильной
-стороной, чем Красные, т. е. р ^ д . Следует подчеркнуть,
что это не более как условное соглашение, необходимое
для 0|блегчения описания оптимальных стратегий, кото­
рое ни в коем случае не означает, что сторона, более
сильная на данном этапе игры, будет всегда оставаться
ею в течение всех последующих ходов. Однако само со­
бой разумеется, что если игрок, который был более силь­
ным в начале кампании, будет придерживаться опти­
мальной стратегии, он останется более сильной стороной
на протяжении всей кампании.
Начнем наше исследование с качественного описа­
ния оптимальных стратегий. После этого мы дадим
числовую таблицу, в которой будут подведены итоги
относительно оптимальных стратегий для кампаний,
состоящих самое большее из восьми операций. В заклю­
чение будет разобран пример, иллюстрирующий важ ­
ность правильного распределения сил в начальной опе­
рации. Математическая теорема, на которой основан
анализ, приведена в Приложении.
Ниже приведены свойства оптимальных стратегий.
Кампания заканчивается поддержкой наземных сил.
Камлания всегда заканчивается серией операций по
поддержке наземных сил, т. е. во время заключительно­
го периода кампании как Синие, так и Красные концен­
трируют все свои силы для поддержки наземных войск.
Во время этого заключительного периода обе стороны
имеют одинаковые оптимальные стратегии, независимо
от их начальных сил.
Синие (более сильная сторона) разделяют свои силы.
За исключением заключительной фазы кампании опти­
мальные стратегии Синих и Красных все время сильно
отличаются друг от друга. Во время любой из этих на­
82
чальных операций более сильная сторона, т. е. Синиё,
применяет чистую стратегию. Иначе говоря, существует
.некоторое наилучшее распределение воздушных сил
Синих между тремя задачами. Имеется некоторое кри­
тическое значение (приблизительно 2,7) отношения сил
Синих и Красных, которое следующим о'бразом опреде­
ляет распределение самолетов Синих во .время этих
начальных о,перидий; если отношение сил меньше этого
критического значения, то оптимальная стратегия более
сильной стороны во время начальных операций заклю­
чается в распределении самолетов между двумя зада­
чами: ударами по базам и противовоздушной обороной,
и в отказе от поддержки наземных войск. Количествен­
но это распределение зависит от соотношения сил обеих
сторон и от числа операций, которые должны быть про­
ведены до конца кампании. Если соотношение сил Синих
и Красных больше критического значения, то Синие
должны все время распределять свои силы по трем
задачам, независимо от имеющегося числа самолетов.
Количество самолетов, выделяемых на выполнение каж ­
дой задачи, по-,прежнему зависит от числа операций,
которое остается до конца кампании.
Красные (более слабая сторона) смешивают свои
стратегии и концентрируют свои силы. Более слабая
воюющая сторона не может использовать какую-нибудь
единственную стратегию, .а должна применять политику
обмана во время всех операций, за исключением заклю­
чительных. В отличие от своего противника, более сла­
бая сторона не имеет какой-то одной наилучшей стра­
тегии. Поэтому она должна применять смешанные стра­
тегии, добиваясь при этом возможно большего платежа.
Если она не слишком слабая, т. е. если отношение сил
меньше критического значения, то она должна концен­
трировать все свои силы или на ударах по базам или
на противовоздушной обороне. Решение, какую из этих
задач предпочесть, .принимается с помощью какого-ни­
будь механизма случайного выбора. Если Красные очень
слабы, т. е. соотношение сил больше критического зна­
чения, то они назначают все свои самолеты на выполне­
ние одной из трех задач, определяя свои частные спосо­
бы действия опять-таки с помощью механизма случай­
ного выбора. Другими словами, если один игрок значи­
тельно слабее своего противника, то он должен исполь-
83
зоЁать возможность получения платежа в начальных
операциях. Естественно, что для достижения макси­
мального эффекта он должен правильно проводить так­
тику обмана, т. е. его механизм случайного выбора дол­
жен выбирать задачи в соответствии с определенными
относительными частотами *.
Силы смешиваются и разделяются для выполнения
одних и тех оюе задач. Интересно отметить, что в каж ­
дой операции Красные, более слабая сторона, маски­
руют свой выбор из тех же задач, которые выбраны
Синими в их распределении сил. Так, если Красные
очень слабы, то они маскируют свой выбор из всех трех
задач, а Синие в это время должны распределить свои
силы между всеми этими тремя задачами. Если же
Красные не слишком слабы, то они проводят политику
обмана уже относительно двух задач — удары по базам
или противовоздушная оборона, а Синие разделяют свои
силы между выполнением тех же самых двух задач.
В процессе кампании оборона Синих ослабевает. Как
отмечалось выше, перед заключительной фазой кампа­
нии Синие разделяют свои силы на выполнение двух
или трех задач одновременно. Количественно это разде­
ление зависит от соотношения сил противника и от
числа оставшихся операций. Однако по мере (развития
кампании часть сил Синих, выделенная для противо­
воздушной обороны, уменьшается. В то же время часть
сил Синих, выделенная для ударов по базам, возра­
стает. Во время этого периода вероятность того, что
Красные будут атаковать базы Синих, уменьшается,
а вероятность перехода Красных к обороне увеличи­
вается.
Оборона Синих в течение длительной кампании. На
начальной стадии сравнительно длительной кампании
более сильная сторона обороняется от концентрирован­
ных атак более слабой стороны. Во время этого периода
Синие выделяют для противовоздушной обороны при­
близительно столько самолетов, сколько имеется у Крас­
ных. Напоминаем, что нами принято вполне определен­
ное частное значение эффективности выполнения задачи
противовоздушной обороны.
* То есть с определенными вероятностями. (Прим, перев.)
84
СВОДНАЯ ТАБЛИЦА
В табл. 2 'Суммированы оптимальные стратегии для
кампаний, состоящих самое большее из восьми операций.
В таблице даны оптимальные -распределения сил для
каждой операции (здесь номер операции равен числу
оставшихся операций данной кампании) в зависимости
от соотношения сил к моменту проведения этой опера­
ции. Однако цена игры, приведенная в последнем
столбце таблицы, дана для кампании определенной дли­
тельности.

ПРИМЕР, ИЛЛЮСТРИРУЮЩИЙ ЧУВСТВИТЕЛЬНОСТЬ


РЕШЕНИЯ ПО ОТНОШЕНИЮ
К НАЧАЛЬНОМУ РАСПРЕДЕЛЕНИЮ
Важность правильного распределения сил в началь­
ной операции (а следовательно и в любой последующей
операции) может быть наглядно показана с помощью
следующего примера. Предположим, что к началу пер­
вой операции кампании, состоящей из пяти операций,
у Синих было р —85 самолетов, *а у Красных 9 = 68 са­
молетов. Из табл. 2 мы видим, что цена игры в конце
пятой операции для Синих при указанных выше усло­
виях будет равна 108. Предположим, что при проведе­
нии первой операции Синие сконцентрировали все свои
силы, т. е. все 85 самолетов, на ударах по базам про­
тивника, что не является оптимальной тактикой, а затем
остающиеся операции они проводят по оптимальному
плану. Тогда, если Красные на время первой операции
назначат все свои силы, т. е. 68 самолетов, на противо^
воздушную оборону, то у Синих останется всего лишь
17 самолетов, а у Красных— ничего. Оптимальный
план проведения последних четырех операций требует
от Синих выделения всех 17 самолетов на поддержку
наземных сил. В этом случае цена игры, т. е. кампании
из пяти операций, будет равна 68. Таким образом, цена
игры для Синих будет на 40% меньше, чем в случае,
когда во время первой операции Синие назначают для
ударов по базам 76 самолетов, а для противовоздушной
обороны 10 самолетов.
Теперь предположим, что Красные, вместо примене­
ния смешанных стратегий, во время первой операции
направили вое свои самолеты для ударов по базам про-
85
00
05 Таблица 2
Оптимальные стратегии в тактической воздушной кампании, состоящей из нескольких операций
(сильная сторона имеет р самолетов, слабая сторона д самолетов (руд)
Оптимальное началь­
ное распределение сла­
Оптимальное начальное распределение
[ Период кампании

Длитель­ Соотношение бой стороны (вероят­


сильной стороны (число самолетов) ность распределения Математическое
ность кам­ начальных сил
пании (чис­ противников всех самолетов) ожидание цены

1
ло опера­ (отношение сил кампании

ных войск
поддерж ­
ка назем­
удары по
ций, остаю­ сильной стороны (продвижение
щихся в к силам слабой поддержка линии фронта)
кампании) стороны) р/? удары по базам ПВО наземных ПВО

базам
войск

I 1 1,00 до оо 0 0 Р 0 0 1 р —д
II 2 1,00 до оо 0 0 Р 0 0 1 2( р - д )
III 3 1,00 до 2,00 Я 0 р—д 0,50 0,50 0 3 (р—д)
3 2,00 до оо 1,5? 0,5? Р—2? 0,50 0,50 0 3( р - д )
IV 4 1,00 до 2,33 0,5р+0,5? 0,5/>—0,5? 0 0,50 0,50 0 4,5 (р—д)
4 2,33 до оо 1,67? 0,67? р—2,33? 0,33 0,33 0,33 4,00р—3,33?
V 5 1,00 до 1,70 0,41р-|-0,59? 0,59/5—0,59? 0 0,53 0,47 0 6,35р—6,35?
5 1,70 до 2,45 0,55р+0,36? 0,45р—0,36? 0 0,45 0.55 0 5,82 р—5,45?
5 2,45 до оо 1,70? 0,75? р—2,45? 0,25 0,30 0,45 5,00р—3,45?
VI 6 1,00 до 1,44 0,32р+0,68? 0 68р—0,68? 0 0,56 0,44 0 8,39р—8,39?
6 1,44 до 1,78 0,40р+0,56? 0,60р—0,56? 0 0,52 0,48 0 8,00р—7,83?
6 1,78 до 2,51 0,59/4-0,22? 0,41 р—0,22? 0 0,41 0,59 0 7,04р—6,12?
6 2,51 до оо 1,71? 0,80? р—2,51? 0,20 0,29 0,51 6,00/?—3,51?
VII 7 1,00 до 1,29 0,25/5+0 75? 0,75р—0,75? 0 0,58 0,42 0 10,50р—10,50?
7 1,29 до 1,53 0,29/?-+0,70? 0,71р—0,70? 0 0,57 0,43 0 10,26р—10,19*7
7 1,53 до 1,84 0,41р+-0,51? 0,59/5—0,51? 0 0,50 0,50 0 9,54р—9,09?
7 1,84 до 2,55 0,63/?4-0,11? 0,37р—0,11? 0 0,37 0- 63 0 8 ,21р—6,64?
7 2,55 до оо 1,72? 0,84? р —2,55? 0,17 0,28 0,55 7,00р—3,55?
VIII 8 1,00 до 1,25 0,20р+0,80? 0,80/5—0,80? 0 0,60 0,40 0 12,60р—12,60?
8 1,25 до 1,40 0,22р+0.78? 0,78р—0,78? 0 0,59 0,41 0 12,48р—12,45?
8 1,40 до 1,59 0,28р+0,б9? 0,72р—0,69? 0 0,56 0,44 0 12,06р—11,86?
8 1,59 до 1,88 0,42р+0,4б? 0,58р—0 1 6 ? 0 0,49 0,51 0 11,03р—10,22?
8 1,88 до 2,58 0,66/5+0,01? 0,34р—0.01? 0 0,34 0,66 0 9,36 р—7,07?
8 2,58 до оо 1,72? 0,85? р—2,58? 0,14 0,28 0,58 8,00р—3,58?
тив-ника, а -все остальные четыре операции провели
согласно олтимальному плану. В этом случае, если бы
Синие выделили 17 самолетов для ударов по базам,
а 68 — для противовоздушной обороны, то силы Крас­
ных уменьшились 'бы до 51 -самолета, а у Синих сохра­
нились бы все 85 самолетов. В конце кампании платеж
Синих при этом будет равен (9/2) • (85—51) =153, т. е.
почти на 50% выше, чем в случае применения Крас­
ными своей оптимальной стратегии проведения первой
операции.

СЛУЧАЙ ПРОИЗВОЛЬНЫХ ЗНАЧЕНИЙ ПОТЕНЦИАЛА


ПРОТИВОВОЗДУШНОЙ ОБОРОНЫ
Теперь предположим,, что потенциалы противовоз­
душной обороны с и к могут принимать произвольные
значения между нулем и единицей, но сохраним при
этом условие с = к. Представим множество оптимальных
стратегий как функцию общего значения потенциала
противовоздушной обороны к, где 0<& <1. Мы по-преж­
нему предполагаем, что Ь= е = \ и а = с1=0. Тогда оста­
ток самолетов у Синих и Красных в конце первой опе­
рации будет -соответственно
р х= тах [0, р — шах (у — ки)\ (0 < 6 < 1),
с/ х==—гпах[0, ^ — шах(д: — кш)\ (()<<&•< 1).
Оптимальные распределения сил по-прежнему опре­
деляются соотношением сил Синих (более сильной сто­
роны) к силам Красных (более слабой стороны) и чис­
лом остающихся операций. Вообще любая кампания
может быть разделена на три периода, каждый из кото­
рых состоит из аналогичных операций. Эти периоды мы
будем называть (начиная с конца кампании) периодом
поддержки наземных войск, периодом ударов по базам
и вероятностным периодом. Следующие стратегии опти­
мальны для этих трех периодов.
Оптимальные стратегии во время периода поддерж­
ки наземных войск. В этот период входят две последние
операции кампании. Во время этого периода оптималь­
ной стратегией как Синих, так и Красных будет назна­
чение всех сил на поддержку наземных войск.
Оптимальные стратегии во время периода ударов по
базам. Периоду поддержки наземных сил предшествует
37
ряд операций, во время которых Красные, т. е. более
слабая сторона, назначают все свои силы <7 для осу­
ществления ударов по базам Синих. Одновременно
Синие, более сильная сторона, назначают <7 своих само­
летов для ударов по базам, а р—^ самолетов для под­
держки наземных сил. Число операций, 'входящих в этот
период, равно х— 1, где х есть наибольшее целое число,
которое меньше или равно т. е. г = ^1 г]* Заметьте, что
если к больше, чем 7г, то т = 1 и периода ударов по
базам в кампании нет. Следовательно, по мере умень­
шения к до нуля длительность периода ударов но базам
возрастает.
Оптимальные стратегии во время вероятностного
периода. В общем случае периоду ударов по базам
предшествует начальный период, который мы называем
вероятностным. Если Синие немного сильнее, чем
Красные, то они назначают <7 самолетов для ударов по
базам, а р—у самолетов для противовоздушной обо­
роны. Если Синие умеренно сильнее Красных, то они
назначают х* самолетов (где х*><7) для ударов по ба­
зам, а р —х* самолетов для противовоздушной обороны.
Если, однако, Синие значительно сильнее Красных, то
они разделяют свои силы на выполнение всех трех
задач. Во время этих операций Красные, более слабая
сторона, должны следовать одной из трех стратегий,
перечисляемых ниже, в зависимости от своей относи­
тельной слабости:
1. Если Красные немного слабее Синих, то они
должны концентрировать все свои силы на ударах по
базам Синих.
2. Если Красные умеренно слабее Синих, то они
должны концентрировать все свои силы либо на уда­
рах по базам, либо на противовоздушной обороне, при­
чем решение в каждом конкретном случае принимается
с помощью механизма случайного выбора, подчиняю­
щегося заданному распределению вероятностей.
3. Если Красные значительно слабее Синих, то они
должны концентрировать свои силы на выполнении
одной из трех задач, выбираемых, как и в предыдущем
случае, в соответствии с заданным распределением
вероятностей.
38
Продолжительность вероятностного периода равна
(М—х— 1) операциям, где N — длительность камлании.
При Л ^< т+ 1 вероятностного периода вообще не долж­
но существовать. Так происходит, если кампания непро­
должительна или если потенциал противовоздушной
обороны очень низок. Например, для того чтобы в кам­
пании, состоящей из 2'1 операции, не -было начального
периода, требуется, чтобы потенциал противовоздушной
обороны не превышал 0,06. Или же наоборот, при по­
тенциале противовоздушной обороны, равном 0,0)5,
любая кампания, состоящая более чем из 21 операции,
должна включать в себя начальный вероятностный пе­
риод.
За исключением ситуации, когда М < т + 1 и когда,
следовательно, отсутствует вероятностный период, опти­
мальные стратегии требуют от слабого игрока примене­
ния механизма случайного выбора. Следовательно, они
сильно отличаются от оптимальных стратегий для слу­
чая, когда потенциал противовоздушной обороны равен
нулю. Если, однако, А/г> т + 1 , то оптимальные стратегии
по -существу такие же, как в случае, когда с = } —0. Как
уже отмечалось, если к > 1/2у то среднего периода нет.
При этом мы .по существу имеем случай, когда потен­
циалы противовоздушной обороны обеих сторон равны
единице.
Математические доказательства этих выводов даны
в работе [2], а идеи, лежащие в их основе, изложены
в Приложении.

о возможности ИСПОЛЬЗОВАНИЯ
МЕТОДА МОДЕЛИРОВАНИЯ ИГР

В своем превосходном-изложении метода моделиро­


вания игр Томас и Димер [5] определяют его как
«...разумное использование реализаций партий в каче­
стве важнейшего аппарата для формулирования игры,
решения этой игры или для получения некоторого поня­
тия о ее решении». Хотя основная цель нашей статьи
состоит в формулировании военно-воздушной игры и
в получении игрового решения проблемы определения
оптимального распределения тактических воздушных
сил данного театра военных действий между различ­
ными задачами, мы считаем, что наш анализ может
89
быть использован при рассмотрений вопроса о возмож­
ности нахождения решений игр посредством моделиро­
вания. По нашему мнению игра, которую мы рассмо­
трели, дает дополнительные доказательства того, что
метод моделирования не может .служить полезные аппа­
ратом для решения игр или получения сколько-нибудь
существенной информации относительно решения. При
этом >мы считаем, что определение метода моделирова­
ния игр, данное выше, включает наряду с проигрыва­
нием игры людьми проигрывание ее вычислительной
машиной.
Тактическая воздушная игра принадлежит к таким
ситуациям, которые часто исследуются с помошью моде­
лирования. Она имеет дело с весьма реальной пробле­
мой, которая может быть представлена в виде много­
ходовой игры, в которой каждый игрок одновременно
со -своим противником делает выбор из непрерывного
множества альтернатив и в которой исход каждого хода
оказывает влияние >на все последующие ходы. Она* без­
условно значительно проще, чем большинство игровых
моделей, изучаемых с помощью моделирования. Этот
факт, однако, только укрепляет наше убеждение, что
моделирование не может быть полезным при решении
игр или при отыскании существенной информации отно­
сительно природы решения. Мы покажем, что природа
решения тактической воздушной войны, рассмотренной
в данной работе, такова, что весьма сомнительно, чтобы
моделирование дало существенную информацию относи­
тельно |решения данного типа игр. Так как мы не
думаем, что чем сложнее проблема, тем проще ее реше­
ние, то мы считаем, что моделирование будет еще менее
полезным при решении более сложных игр.
Оценивая полезность моделирования в качестве
аппарата для решения игр, мы не требуем, чтобы оно
приводило к аналитическим (решениям, т. е. к оптималь­
ным стратегиям. Главная причина этого состоит в том,
что игра сама по себе является весьма несовершенной
моделью и в качестве таковой сильно идеализируется.
Поэтому значение аналитического решения состоит не
в том, что оно позволяет исследователю подставить
некоторые числа и получить на выходе другие числа,
которые укажут ему правильный способ действия с точ­
ностью до трех (или одного) десятичных знаков. Напро-
90
тив, имея аналитическое (решение, исследователь может
рассмотреть основные особенности решения, может раз­
личить и изучить существенные детали решения и мо­
жет, таким образом, прийти к .правильным действиям.
Поэтому мы считаем уместным и своевременным спро­
сить тех, кто пользуется моделированием, могут ли они
определить по крайней мере основные особенности ре­
шения и наиболее .важные детали.
Обратимся теперь к решению тактической воздуш­
ной игры .с тремя задачами. Его важнейшие особенно­
сти следующие: а) оптимальное распределение в дан­
ной операции зависит от соотношения сил обеих сторон
и от числа операций, оставшихся до конца кампании;
б) оптимальные стратегии для более слабого игрока
смешанные, т. е. включают случайный выбор. Две дру­
гие особенности решения имеют значение по крайней
мере тогда, когда речь идет о моделировании. Во-пер­
вых, решения не являются непрерывными функциями.
Во-вторых, важнейшие детали оптимальных стратегий
не являются интуитивными по своему характеру. Н а­
пример, если потенциал противовоздушной обороны к
таков, что 0< & < 11, то существование трех периодов и
зависимостей длительности вероятностного периода от к
является такой особенностью, при выявлении кото­
рой интуиция бессильна. Внимательное изучение таб­
лицы 1 или тео(ремы 1 в Приложении показывает, что
точные численные или алгебраические характеристики
оптимальных стратегий тоже, по всей вероятности, не
могут быть получены с помощью только одной интуиции.
Спросим теперь обо всем этом у сторонника модели­
рования. Насколько успешно можно получать при моде­
лировании наиболее важные характеристики решения?
Первое затруднение состоит в том, что при моделирова­
нии трудно сделать правдоподобные предположения
относительно решения. Поэтому для исследования игры
требуется проиграть ее несколько раз. При этом возни­
кает вопрос о методике исследования игры. Каким дол­
жен быть достаточно чувствительный метод исследования
и сколько партий игры требуется реализовать для полу­
чения результата?
С первого взгляда следовало бы попробовать т раз­
личных распределений при каждом ходе каждой сто­
роны. Если игра состоит из N ходов, то потребовалось
91
бы проиграть т2к партий. Скромное желание исследо-*
вать три распределения при 'каждом ходе игры, состоя­
щей из пяти операций, потребовало бы проиграть З10,
или приблизительно 59 000 партий. Более того, это
исследование соответствовало бы только одной паре
значений количеств самолетов, имеющихся у сторон
в начале операции. Если требуется произвести испыта­
ния для г различных значений р (начальное число само­
летов Синих) и для 5 различных значений д (начальное
число самолетов Красных), то потребное число партий
возрастает до г${т2м). Совершенно очевидно, что такую
игру можно проиграть только на вычислительной ма­
шине, но даже в этом случае большое число партий
сильно осложнит проблему истолкования результатов.
Тем не менее главное возражение против только что
описанной методики основано не на затруднениях, свя­
занных с большим числом партий, которые необходимо
проиграть, а на следующем более принципиальном
факте. Оптимальные стратегии являются функциями
числа операций (времени) и наличного числа самолетов
у обеих сторон (переменных состояния), т. е. они имеют
форму /(р, ду /г), где п есть число операций, р — число
самолетов у Синих и д — число самолетов у Красных.
С другой стороны, предложенная методика состоит по
существу в испытании функций только числа операций,
т. е. функций вида §(п). Таким образом, описанная
выше методика моделирования не обещает многого.
Для получения рациональной методики исследова­
ния необходимо выяснить зависимости оптимальных
стратегий от величин р и д. Нам неизвестны сколько-
нибудь удовлетворительные' решения этой проблемы.
Самый простой способ, который мы смогли придумать,
это рассматривать области на плоскости (р, д) и произ­
водить распределения сил в зависимости как от ходов,
так и от этих областей. Это, однако, может быстро при­
вести к необходимости рассмотреть астрономическое
число чистых стратегий. Если, например, при каждом
ходе мы имеем I областей на плоскости (р, д) и желаем
рассмотреть т распределений для каждой из областей,
то для ^-ходовой игры будет иметься т ш возможных
чистых стратегий для каждой стороны. При т = 3, ^=9
и N=5. мы получаем З45, или приблизительно 2,9ХШ 21
чистых стратегий для каждой стороны,
92
Можно возразить, что с помощью разумного выбора
число альтернатив может быть уменьшено. Нам кажет­
ся, что это означает решение без доказательства.
В самом деле, если учесть сложный неинтуитивный
характер решения, то как узнать, что такое разумный
выбор, не зная самого решения. Имеются другие при­
чины, заетавляющие нас возражать против описанной
нами методики. Сейчас мы не будем их касаться, так
как они присущи всем методам' моделирования и мы
рассмотрим их .позднее.
По существу, применение моделирования для опре­
деления решения игры, осуществляемое либо человеком,
либо вычислительной машиной, либо обоими вместе,
является попыткой определить функции /(р, <7, п), кото­
рые дар а ли бы оптимальные стратегии е помощью очень
ограниченного числа выборок чистых стратегий. Хотя
большое число партий, требуемое даже для скромного
числа выборок стратегий, кажется нам серьезным пре­
пятствием для применения моделирования, мы чув­
ствуем, что имеются более основательные причины, за­
ставляющие нас быть пессимистичными относительно
применения моделирования в качестве аппарата для
определения решения игры. Эти причины, которые свя­
заны с природой решения, мы сейчас и рассмотрим.
Наш пессимизм основывается, прежде всего, на том
факте, что оптимальные стратегии являются функциями
/(р, 9, п) сил сторон и числа операций, которые не всег*
да непрерывны. Мы уже упоминали некоторые трудно­
сти, возникающие из того, что стратегии являются
функциями как р и <7, так и п. Теперь мы утверждаем,
что основное затруднение состоит в том, что само ре­
шение не является непрерывным. Моделирование в луч­
шем случае может дать информацию относительно не­
которого конечного числа стратегий в дискретном мнси
жестве точек (р, <7), а относительно промежуточных
точек нельзя ничего сказать с какой-нибудь степенью
уверенности из-за разрывов непрерывности. Д аж е если
мы увеличим число рассматриваемых дискретных точек,
все равно будут разрывы непрерывности между точ­
ками, и мы не сможем осуществить сколько-нибудь
обоснованную интерполяцию. Можно показать, что
в этом случае нельзя быть уверенным в правильности
информации даже относительно выборочных точек. Это
93
объясняется двумя причинами. Во-первых, при модели­
ровании рассматривается только конечное число рас­
пределений среди непрерывного множества (конти­
нуума) возможных распределений. Во-вторых, в про­
цессе проведения партии силы сторон (будут отличаться
от тех, которые были взяты при выборке. Поэтому при­
ходится либо считать такую точку одной из .рассматри­
ваемых точек, либо производить между ними интерпо­
ляцию.
Пожалуй, наиболее серьезным возражением против
использования моделирования в качестве аппарата для;
изучения игр является тот факт, что решения многих
игр состоят из смешанных стратегий. Поскольку мы
имеем дело не с одноходовой матричной игрой, мы не
видим, как повторение партий может привести к реше­
нию в смешанных стратегиях. Любая попытка составить
матрицу результатов проигрываний одной стратегии
против другой не может привести к сколько-нибудь зна­
чительным результатам. Такая матрица будет просто
представлять результаты проигрывания некоторого ко­
нечного числа чистых стратегий из бесконечного числа
чистых стратегий одного игрока против аналогичного
множества стратегий другого игрока. Таким образом,
решение такой матричной игры по существу ничего
не дает.
Эта неспособность вскрыть необходимость примене­
ния случайного выбора или обмана является, очевидно,
основным камнем преткновения на пути моделирования
игр. Она не только держит игрока в неведении относи­
тельно его наилучшей стратегии, но может даже не
сказать ему ничего о природе его наилучшей стратегии.
Ошибочность применения такого метода определения
наилучшего способа действий в ситуациях, когда этот
метод часто неспособен давать такие рекомендации,
очевидна. Если кто-либо серьезно заинтересован в при­
менении моделирования игр при принятии решения, то
пренебрежение смешанными .стратегиями может приве­
сти его к неприятным последствиям. В качестве иллю­
страции мы хотим привести последний абзац раздела
«Пример, иллюстрирующий чувствительность решения
по отношению к начальному распределению». Там Крас­
ные вместо смешанных стратегий применили чистую
стратегию ударов по базам противника, и эго повысило
94
цену игры для Синих на 50%. Волее того, $та частная
чистая стратегия легко может рассматриваться коман­
дованием Красных на основании какой-нибудь доктрины
или на основании опыта как «разумная» и «хорошая»
стратегия. Чтобы получить грубое представление о том,
что получится, если вместо применения смешанных
стратегий все время придерживаться какой-нибудь
одной чистой стратегии, достаточно подумать о том, что
станет с игроком в покер, который никогда не блефует.
В заключение подытожим те основные причины, по
которым мы считаем, что моделирование игр -не может
служить полезным орудием для определения решений
игр. Во-первых, сложность решения приводит к необхо­
димости проигрывать весьма большое число партий для
исследования игры. Во-вторых, если даже это исследо­
вание произведено, тот^ факт, что решение является
функцией положения и времени и может не быть непре­
рывным, приводит к весьма несовершенному представле­
нию относительно решения. В-третьих, маловероятно,
что с помощью моделирования игр могут быть полу гены
указания о применении смешанных стратегий. Авторы
уверены, что не может быть никаких сомнений относи­
тельно возможности применения моделирования для
решения более сложных игр, так как нет никаких осно­
ваний считать, что чем сложнее становится задача, тем
проще становится ее решение.

ПРИЛОЖЕНИЕ

В работе [1] дано доказательство следующей теоре­


мы для модели с тремя задачами при с= к= 1. Ниже
приводится его сокращенное изложение. Обозначим че­
рез N длительность кампании, а через ш — номер данно­
го хода, отсчитываемый от конца кампании.
Теорема . Е сли N — 1 и ли 2 , то цена игры равна

Уы(Ры> Я ы ) ^ ( Р н - Ч ы ) -

Синие имеют оптимальную чистую стратегию


х т— ит— 0 д ля т <Ы . Красные имеют оптималь­
ную чистую стратегию Ут= ‘ют= 0 д л я т <Ы .
95
Если. N5*3, то цена игры определяется (Ы—2)-ку-
сочной линейной, функцией

Ук(Рн> Ян) = АнРн — ВнЯн (1= 1> 2........N—2),


где постоянные А1Ы и В1Ы положительны и монотонно
уменьшаются с возрастанием I д л я фиксированного
значения Ы; величина верхнего индекса I опреде­
ляется отношением ры!яы. Оптимальные стратегии
двух игроков будут следующие:
1. П ри ходе т = 1,2 (считая с конца) игроки вы­
бирают
гт — ит= уи тт— Гт0т— О.

2. П ри ходе т = 3 , если р 3^ ц 3, Синие выбирают


такие значения х 3 и и3, что
ц3< х 3< ш п(^ +
и3= х 3— ц3.
Красные выбирают у 3= я 3 или ш3— ц 3, каждую
с вероятностью 1/2.
3. При (т -\-1)-м ходе, где 3 < т < Ы — 1, если
Рт+ о т н о ш е н и е рт+1/дт+1 определяет це­
лое число I, К К т — 1, и Синие делают выбор
(2т - Л‘т) рт+1 - (я - 2В‘т) 9ОТ+,
Х т+ 1 т + В1т

ит +1= Р т + 1 Хт +1
д л я 1 = 1, 2 ,. . т — 2 и выбор

д ля 1= т — 1, где постоянные А‘т и В 1т опреде­


ляются игрой с продолжительностью т и с началь­
ными условиями рт, дт. Красные выбирают ут+1 и ли
96
в1
ге'от+1= ^ + 1 с вероятностями а‘т иЙ
т+ К
соответственно д л я / = 1, 2 , . . . , т — 2,
т + В ‘„
однако если 1= т — 1, то Красные выбирают
I 1
Ут+1 = Я т+ 1 с вероятностью <хп или ют+1 = д,
Чт+1
, 1
с вероятностью фт — ~^т-г. ила ут+1 — шт+1 с вероят­
ностью 1 -------
т Б тт ~ 2 ‘

Постояннее теоремы Л^ и В‘ы определяются по индук­


ции следующим образом:

4 = 3 , Л„пТ
п ; = ( Л Г 2+ 1 )
-\ -1 (я > 3 ),

^з= 3 . ^ , = /4 . (»>«>.

я° = л°=о («>3)>
Л "-2 ( 2 4 + 4 ) _ ЗЛ Г2 4
л! л я “ 2 ’ °п + \ В 1п + Л п - 2
&П+К-
{ь ^ 1, /2 = / —
[—2, I 3,
Верхний индекс I связан с отношением р ы/с/м с помощью
ступенчатой функции <р{ры1ям). Для различных значений N
точки, в которых- функция делает скачки, определяются
последовательностью Х1 Ы{I = 1, ..., N — 2), которую мы
определим ниже. Функция 9 (/^/9^)==** если
<Я ^'1. Последовательности Л# определяются по формулам
Я1
Аз —
— 11>
у п -
п
1= - ( - О О (л = 3, 4-, 5
хп~
п
2= В пп~2— 1 (п — 4, 5, 6
К ~ х- в 1п ( п = 4 , 5, 6,
Vп --- л I ____ л*
(= 2, 3,
1 ,

97
Основная идея анализа тактической военной игры
одинакова для каждого из трех рассмотренных случаев.
Она состоит в доказательстве того, что если игра с дли­
тельностью (А/’— 1) ходов может быть решена, то игра
с длительностью N ходов может быть приведена \к рас­
смотрению начального, т. е. ЛЛго, хода. Таким образом,
задача ,по существу сводится к (решению одноходовой
игры. Детали решения результирующей одноходовой,
игры, однако, изменяются от случая к случаю и имеют
очень сложный характер. Читателю, который пожелал
бы познакомиться с этими деталями, мы рекомендуем
обратиться к работам [1, 2 и 3], в которых приведены
полные доказательства. Здесь же мы покажем, как осу­
ществляется сведение к рассмотрению одного хода для
случаев, в которых имеется противовоздушная оборона,
т, е. при с= к , 0< & < 1. Изменения, которые необходимо
произвести для случая к = 0, элементарны.
Во-первых, необходимо точно определить стратегии
для игры в нормальной форме. В дальнейшем ходы
будут нумероваться, начиная с конца игры, т. е. п -ый
ход означает, что до конца игры остается п ходов. Пред­
полагается также, что каждый игрок знает, как разви­
вается игра от этапа к этапу, и что каждый игрок на
любом этапе знает переменные состояния и весь; преды­
дущий ход игры.
Чистые стратегии игры в нормальной форме опреде­
ляются индуктивно по числу ходов. Любая стратегия Синих
в одноходовой игре является точкой Х1— (х 1, а х), где
х 1> 0, 0, и Аналогично любая стратегия
Красных в одноходовой игре является точкой У1(у1, хв)г),
где ух> О, Ух-^т^х^^х- Пусть есть какая-то
стратегия Синих в М-ходовой игре, безусловно, является
функцией р м и <7^. Тогда в (А/-}- 1)-ходовой игре Синие при
(А?+1)-ом ходе выбирают точку = ( ^ +1, ^ +1) тре-
угольника , определяемого условиями х ы^ х>0, а ^ 0,
Рм+1 • Одновременно Красные выбирают
точку К^+1 = ( ^ +1> треугольника Р ^ +1, определяе­
мого условиями 0, о ^ Х ) , ^ +1 + ^ +1< ^ +1.
Эти выборы приводят к следующим значениям переменных
состояния р и
93
р ы= т а х [0, ры+х — т а х (0, уы+1 — киы+1)], (7)
Яы= т а х [О, 9л,+, — т а х (О, — ктм+1)]. (8)
Стратегия Синих в (Ы 1)-ходовой игре состоит тогда
в выборе точки Хы^ х в треугольнике Д^+1 и определяется
функцией Ф^, которая связывает с каждой точкой
(Хд;+1 , Умл,{) В-Пространстве произведений Д^+10^+1 не­
которую стратегию в Ы-ходовой игре. Таким образом,
<зу+1 может быть записана как о^+1 = (Хдг_^1, Ф^).
Аналогично, стратегия Красных в (N 4- 1)-ходовой
игре определяется как выбор точки Уы+Х и как некоторая
функция связывающая с каждой точкой (Хм+х, У^+1)
некоторую стратегию в N-ходовой игре. Таким образом,
ТЛЧ-1= (^У-Н’
Смешанные стратегии игроков теперь могут быть опре­
делены по индукции таким же образом. В одноходовой
игре смешанная стратегия для Синих представляет собой
распределение вероятностей Ог на Дх, а смешанная страте­
гия для Красных — распределение вероятностей Н г на
Предположим теперь, что смешанные стратегии для игр
с длительностью N были ранее определены. Пусть Ом
есть некоторая смешанная стратегия Синих в Л^-ходовой
игре. Смешанная стратегия в ( Ы 1)-ходовой игре
есть распределение вероятностей §м+х на Д^+1 и является,
функцией Ф^, которая связывает с каждой точкой (Л^+1,
У„+1) смешанную стратегию в М-ходовой игре. Таким обра­
зом, смешанная стратегия в (Ы -ф- 1)-ходовой игре может
быть записана, как 6 М+1= ( § М Ф^). Аналогично, сме­
шанная стратегия Красных Н ы^ х является распределением
на Оы,! и функцией и может быть записана, как
'Г»)-
Предположим, что в игре с длительностью N сущест­
вуют стратегия 0^ для Синих и стратегия Н*ы для Крас­
ных, обладающие следующими свойствами:
1. Если Синие придерживаются стратегии 0 ^ , а Крас
ные— стратегии //^ , то существует математическое ожи­
дание Е (О*, Н],).
99
2. Для всех чистых стратегий Красных существует
Е (°1г> хлл)> и
Е ( о ; , ^ ) > е (о ; , я ; ) .

3. Для всех чистых стратегий Синих <зы существует


Е (°Л’ и
е (Зд,, я ; ) < Е ( о ; , я ; ) .

В этом случае говорят, что игра имеет цену дыУ


равную
(Ры* = Н ы)-
При этом говорят, что С*ц является оптимальной страте­
гией Синих, а //* — оптимальной стратегией Красных. Цена
игры, как это подчеркнуто в обозначении, является функ­
цией начальных условий. В остающейся части Приложения
мы будем повсюду опускать индекс N и писать, например,
Е (0 , Н) вместо Е ^ , Н м) или Е ^ , Н г) вместо

Предположим, что игра с длительностью N имеет цену


V (р , <7), непрерывную по р и <7, и что у Синих и Крас­
ных имеются оптимальные стратегии О* и Н*. Введем обо­
значения
М*1> у г) = (Рг — ■*!—их)—( ч х — Уг — Щ )
И

МЦХ,, У4) = ! ,,(* ,, 1\) + У( а ?),


где /7 и <7 определяются из /?1 и <7Х посредством выбора
(Хд, Кх) и с помощью уравнений (7) и (8). Пусть
с ;= (* ;, о*), н \ = ( н \ % н \

где §* есть распределение вероятностей на Дх, а Л* есть


распределение вероятностей на Д . Мы выведем доста­
точные условия для того, чтобы §* и А* удовлетворяли
условию оптимальности стратегий С* и Н* в (Л7 — 1)-хо-
довой игре,
100
Согласно общепринятым определениям
я ; ) = 5 5 ь 1( ^ , я * )^ ;=
= 1 1 1 , (Хг, У1)йё\с1Н \-\-^У {р, д)й8\й к \ =
= [ ^ ,( ^ ,7 ,) ^ ;^ ;. (9)

Далее, если х, = (У1, ЧГ) при ЧГ (X,, У1) = х, то

Е( 0 ] , ^ ^ ( Х , , 7 , ) ^ ; + } Е (С \ ч)а8\>

>^Ьг(Хг, Гг)й8\ + 1 У { р , д) й&\ ^ М х (Хи 7 , ) ^ ; (10)

для любых значений х1.


Аналогично, если <з1= (Х1, Ф), то
Е(<ч, Я . 'К р И Д * , , У,)йк\ (П)
для любых значений в1. Так как в уравнении (9) мы пока­
зали, что цена Е ( 0 1 , Н *) существует, то для того,
чтобы показать, что С\ и Н \ являются оптимальными
стратегиями, мы должны доказать, что Е ^ , / / * ) <
< Е (О* у Н*) < Е (0*> хх) для всех чистых стратегий Синих
ах и для всех чистых стратегий Красных V Из уравне­
ний (9), (10) и (11) следует, что достаточные условия опти­
мальности стратегий О* и //* принимают следующий вид:

для любых значений Уг и


ридх,, у^сДОмд*,. у х) < 1 В \ а н \

для всех значений Х х.


Только что доказанное нами положение может быть
сформулировано несколько по-другому. Если было найдено
решение игры с длительностью N и эта игра имеет цену
V (р, #), то решение (Ы - |-1)-ходовой игры получается
посредством решения одноходовой игры Гх с платежной
функцией М1(Х1, У1) = Ь1(Х1, У 1)-{-У(р, я), где V(р, д)
101
получается из р х и ^ посредством выбора Х х, Уг и с по­
мощью уравнений (7) и (8). Цена (Ы -|- 1)-ходовой игры
равна цене игры 1\. Если оптимальные стратегии Синих и
Красных в игре 1\ суть §* и А* , а в N -ходовой игре — О*
и //*, то оптимальными стратегиями в (Ы -(- 1)-ходовой игре
будут стратегии (§{ , О*) для Синих и (А*, //*) — для
Красных.

ЛИТЕРАТУРА
1. Ь. И. В е г к о у И г апс! М. И г е з Ь е г . А шиШ шоуе тП пП е
д а т е уч1Ь Ппеаг рауо!Т. РасШ с Л. о! Ма1Ь. (печатается).
2. С И. В е г к о у Н г апЛ М. И г е ъ Ь е г . О ри та1 еш рЬ уш еп!
о! 1асИса1 а\г Гогсез т Ш е а ^ е г а\т 1азкз— И; а д а т е ШеогеИс
апа1уз1з, НАЫИ М ет о га п Л и т КМ-2137, МагсЬ 1958.
3. М. Ь г е з Ь е г . О рЕ та1 1асИсз т а т и Ш зЫ к е а\г с а т р а 1дп,
КАЫИ М ет о га п Л и т КМ-1335, Ос1оЬег 1954.
4. И. К. Р и 1 к е г з о п апс! 5. М. Л о Ь п з о п . А 1асИса1 а1г д а т е ,
ОрегаНопз КезеагсЬ, 1957, уо 1. 5, р. 704— 712.
Д . Р. Ф у л к е р с о н и С. М. Д ж о н с о н . Тактическая в оз­
душ ная игра (см. настоящий сборник).
5. С. Л. Т Ь о т а з апЛ \У. Ь. И е е т е г, Лг. ТЬе го1е о! орегаПо-
па1 дагш пд т орегаН опз гезеагсЬ. О регаРопз КезеагсЬ, 1957,
уо 1. 5, р. 1— 27.
К- Д ж. Т о м а с и У. Л . Д и м е р. Роль моделирования игр
в исследовании операций (см. настоящий сборник).
Иг р о в о й а н а л и з
РАСПРЕДЕЛЕНИЯ ДВУХ ТИПОВ САМОЛЕТОВ
В ТАКТИЧЕСКОЙ ВОЗДУШНОЙ ВОЙНЕ
Л. Д. Берковиц и Мелвин Дрешер *. РЭ Н Д -К орпорейш н,
Санта-М оника, шт. Калифорния

Распределение тактических воздушных сил по раз­


личным боевым заданиям составляет одну из важней­
ших проблем при проведении тактической воздушной
кампании. Принимая во внимание возможные решения
противника, мы желаем определить оптимальный план
использования своих тактических ресурсов. Сформули­
рованная в такой форме, эта задача распределения
является задачей теории стратегических игр.
В статье [1] мы рассмотрели распределение тактиче­
ских воздушных сил по различным боевым задачам,
представив проблему в виде парной игры с нулевой
суммой. Предполагалось, что обе стороны имеют само­
леты только одного типа, которые надлежало распреде­
лить по трем задачам: для ударов по базам противника,
для противовоздушной обороны и для поддержки на­
земных операций.
В игре, рассматриваемой в настоящей статье, пред­
полагается, что каждая сторона имеет два различных
типа самолетов, которым мы дадим условные названия
«бомбардировщик» и «истребитель». Бомбардировщики
могут использоваться только для ударов по базам или
для наземной поддержки, а истребители — только для
противовоздушной обороны или для наземной под­
держки.
Введение в тактическую игру‘двух различных типов
самолетов приводит к совершенно иным и более слож-
* Ь. Э. В е г к о у Н г апс1 М е 1 у 1 п О г е з Ь е г . АНосаНоп
о? 1ауо 1урез о! апсгаЙ т 1асНса1 ап* угаг; а ^ате-Ш еогей с апа1уз13.
О регайопз КезеагсЬ, 1960, уо1. 8, р. 694— 706.
103
НЫм ОптиМальйым тактикам даже для кампаний малой
продолжительности. В работе [1] показано, что если
имеются только задачи ударов ,по базам и наземной
поддержки, то обе стороны имеют оптимальные чистые
стратегии. Если добавляется третья задача, то одна
сторона имеет оптимальную чистую стратегию, а дру­
г а я — смешанную стратегию. В отличие от этого, если
требуется распределить два типа самолетов по трем
задачам, то обе стороны могут иметь оптимальные сме­
шанные стратегии. Чтобы показать на примере слож­
ность этого последнего случая, мы рассмотрим опти­
мальные тактики, т. е. оптимальное распределение
самолетов, для сравнительно короткой кампании.

ФОРМУЛИРОВКА ТАКТИЧЕСКОЙ ВОЕННОЙ ИГРЫ

Мы рассматриваем военно-воздушную игру как


серию операций или ходов, каждый из которых состоит
в одновременных ударах по базам противника, в проти­
вовоздушной обороне и в поддержке наземных войск.
Каждая сторона предпринимает эти действия с целью
выполнения поставленной задачи на данном театре
военных действий или с целью получения определенного
платежа.
Предположим, что в начале кампании одна из сто­
рон, которую мы назовем Синими, имеет воздушные
силы, состоящие из В бомбардировщиков и Р истреби­
телей, а противная сторона, Красные, имеют р бомбар­
дировщиков и Ф истребителей.
Исследуем теперь какую-нибудь операцию кампа­
нии, например первую операцию. Предположим, что
Синие выделяют х своих бомбардировщиков для нане­
сения ударов по базам, а остающиеся В—х бомбарди­
ровщиков— для поддержки назем-ных сил. Некоторая
доля этих х бомбардировщиков, например гх бомбарди­
ровщиков, где 0 г < 1 , направляется против аэродро­
мов базирования бомбардировочной авиации противни­
ка, а остаток,!, е. (1—г)* .самолетов,—'против аэродро­
мов истребительной авиации. Предположим, что во
время этой операции Синие также направляют и из сво­
их Р истребителей для противовоздушной обороны,
а остаток, т. е. Р—и истребителей,— для наземной под­
держки. Следовательно, во время этой начальной опе-
104
рации В + Р —х —и самолетов Синих принимают участие
в наземной поддержке.
Аналогично предположим, что во время первона­
чальной операции^ Красные выделяют | бомбардиров­
щиков для ударов по аэродромам противника, а остаток,
т. е. |3—I самолетов, — для поддержки наземных сил.
Часть этих § бомбардировщиков, допустим р где
0 < р < 1, назначается для атаки аэродромов бомбарди­
ровочной авиации противника, а остаток, т. е. (1—р)$
самолетов, — для атаки аэродромов вражеской истреби­
тельной авиации. Предположим также, что ц из Ф своих
истребителей Красные выделяют для противовоздушной
обороны и Ф—ц — для поддержки наземных операций.
Число самолетов Красных, принимающих участие в на­
земной поддержке во время начальной операции, состав­
ляет, таким образом, р + Ф—| —ц.
При выборе этих распределений игроки знают как
свои силы, так и силы противника. Однако ни одна
из. сторон не знает (распределения сил своего против­
ника вплоть до окончания операции.
Рассмотрим теперь результат описанной выше опе­
рации. Истребители, которых Красные назначили для
противовоздушной обороны, уменьшат число бомбарди­
ровщиков Синих, прорвавшихся к воздушным базам
Красных, но не окажут никакого влияния на операции
по наземной поддержке. Предположим, что число ата­
кующих самолетов, которым не удалось прорваться
к целям, пропорционально числу \х, например, равно ср,
если только число атакующих самолетов Синих не чрез-;
мерно велико, т. е. если с\1 >х. Постоянная с называется
противовоздушным оборонительным потенциалом, так
как она является мерой эффективности самолетов ПВО.
Мы полагаем, что истребители Красных не могут раз­
личить, какие из атакующих бомбардировщиков Синих
предназначены для налета на бомбардировочные базы
Красных, а какие — на базы истребителей.
Будем считать, что истребители распределяются слу­
чайно и равновероятно по всем самолетам противника,
участвующим в налете.
Таким образом, число бомбардировщиков Синих,
прорвавшихся через оборону Красных, равно х—с\х до
тех пор, пока ср < х . Если же ср > х , то ни один самолет
Синих не проникнет к цели. Следовательно, число бом-
105
бардировщиков Синих, проникших сквозь оборону
Красных, равно
шах (0, л; — ср).
Из прорвавшихся бомбардировщиков г т а х (0 , х —ср,)
бомбардировщиков будут атаковать бомбардировочные
базы Красных, а (1—г)шах(0, л:—ср) — 'базы истреби­
телей Красных. Поэтому число бомбардировщиков Си­
них, атакующих бомбардировочные базы Красных,
равно
шах [0, г ( х — ср)],
а число бомбардировщиков Синих, налетающих на базы
истребителей Красных, равно
шах [0, (1 — г) (х — ср)].
Бомбардировщики Синих, проникшие к своим целям,
будут уничтожать .посредством бомбардировки враже­
ские самолеты, находящиеся на аэродромах.
Пусть каждый прорвавшийся бомбардировщик Си­
них может уничтожить Ъ\ вражеских бомбардировщиков
или Ь2 вражеских истребителей и пусть во время опера­
ции все самолеты Красных подвержены опасности уни­
чтожения. Тогда число бомбардировщиков Красных,
уничтоженных Синими во время начальной операции,
равно
т ш {р, ^ т а х ^ , г ( х — ср)]},
а число уничтоженных истребителей Красных равно
т т { Ф , 62тах [0 , ( I — г ) ( х — с^)]}.
Мы предполагаем, что потери воздушных сил Крас­
ных в результате аварий и действий наземных сил про­
тивника малы, и ими можно в дальнейшем пренебречь.
Кроме того, мы предполагаем, что самолеты, выделен­
ные для ПВО и наземной поддержки, не несут никаких
потерь и что бомбардировщики Красных, которым не
удалось проникнуть сквозь оборону Синих, возвращают­
ся на свои базы. Иначе говоря, мы предполагаем, что
потери во время воздушных боев незначительны по
сравнению с другими потерями и что самолеты ПВО
предотвращают проникновение вражеских бомбардиров­
щиков, не обязательно обивая их. Итак, мы видим, что
106
во время начальной операции численность бомбардиро­
вочной авиации Красных уменьшилась до
р1= шах{0, р — 61шах[0, г ( х — ^ )]} самолетов ,
а истребительная авиация Красных уменьшилась до
Ф1= тах{0, Ф — 62шах [0 ,(1 — г)(х — ^)]} самолетов .
Точно таким же образом мы можем подсчитать влияние
этой начальной операции на силы Синих. В конце первой
операции у Синих останется
Л1= тах{0, В — с?1шах[0, р($ — ей)]} бомбардировщиков
и
/71= тах{0, Р — с1%шах [0, (1 — р)(5 — ей)]} истребителей ,
где е, й\ и й2 имеют тот же смысл, что и с, Ъ\ и Ь2 для .
Красных.
Итак, для проведения следующей, второй, операции
у Синих имеется В 1 бомбардировщиков и Р\ истребите­
лей. В результате этой (второй операции останется В2,
Р2, Фг самолетов и т. д. Такой процесс повторяется
в течение всей кампании, состоящей из заранее опреде­
ленного числа операций.

ПЛАТЕЖ

В нашей модели функцией тактических воздушных


сил является поддержка наземных сил, и качество вы­
полнения этой функции зависит от числа самолетов, вы­
деленных для поддержки наземных операций. С другой
стороны, противник также желает помочь своим назем­
ным силам, выделяя для этой цели определенное число
самолетов. При этом некоторая доля усилий сторон по
наземной поддержке может скомпенсироваться. По­
этому мы будем считать, что помощь, оказываемая воз­
душными силами наземным войскам Синих, или, иначе
говоря, платеж Синим, в данной операции может изме­
ряться разностью между числами боевых вылетов для
наземной поддержки Синих и Красных, т. е.

Здесь молчаливо предполагается, что при наземной под­


держке бомбардировщики и истребители одинаково
107
эффективны. Платеж М Синим за всю кампанию, со­
стоящую из N операций, есть сумма платежей для каж ­
дой из операций, т. е.
N
М='%[(В + Р — х — и) — $ + Ф — И— **)].
Теперь совершенно очевидна задача, стоящая перед
каждой из сторон. Синие, например, желали бы зыде-
лить большое число самолетов для наземной поддерж­
ки и тем самым- увеличить платеж в данной операции.
Им, однако, приходится думать одновременно об уни­
чтожении самолетов Красных посредством ударов по
аэродромам для того, чтобы Красные не смогли выде­
лить в последующих операциях сколько-нибудь значи­
тельных сил для поддержки своих наземных войск.
Кроме того, если Синие не подумают о противовоздуш­
ной обороне, а противник нанесет сильные ударьи по
аэродромам, они могут понести большие потери в само­
летах. Таким образом, каждый игрок должен смотреть
в будущее и учитывать возможности противника.
ЗНАЧЕНИЯ ОТДЕЛЬНЫХ ПАРАМЕТРОВ
Из описания илры и определения платежной функ­
ции очевидно, что оптимальные тактики зависят от зна­
чений постоянных Ьь Ь2, су е, с!\ и й2у а также от вели­
чины начальных сил, т. е. от В и Р для Синих и от р
и Ф для Красных. Так как главная цель настоящей
статьи состоит в том, чтобы показать, как зависят опти­
мальные распределения двух типов самолетов от вели­
чины начальных сил, то мы примем для всех шести
постоянных определенные значения. Для удобства вы­
числений положим, что Ъ\ —Ъ2= с = 6 = (1\ = с%2— 1. Иначе
говоря, мы предполагаем, что различные задачи выпол­
няются с одинаковой эффективностью.
Теперь наличное число самолетов Синих в конце ка­
кой-нибудь одной операции равно
5 1= шах{0, В — шах [0, р(?— ^)]},
Р1= тах {О, Р — шах [0, (1 — р)($— и)]},
а наличное число самолетов Красных равно
р1= шах{0, р — шах [0, г ( х — р)]},
Ф1= тах{0, Ф — шах [0, (1 — г)(х — р)]}.
108
И, наконец, мы предположим, что в начале кампаний
число истребителей у обоих противников одинаково, т. е.
Р = Ф. Для облегчения анализа нашей задачи будем
считать, что в начале кампании р = ф = 1; это просто
означает, что в начале кампании мы в качестве единицы
наших измерений вместо одиночного самолета берем
истребительную авиацию в целом.
Хотя мы сформулировали игру для произвольного
числа операций, мы найдем оптимальные тактики для
кампаний, состоящих из трех операций. Полное матема­
тическое доказательство полученных результатов дано
в работе [2]. Тем не менее в Приложении мы приводим
краткое описание методики, использованной для полу­
чения этих результатов, и метода доказательства.
В Приложении дана также точная математическая фор­
мулировка игры в нормальной форме.

ОПТИМАЛЬНЫЕ ТАКТИКИ ПРИ ОДИНАКОВЫХ СИЛАХ

Мы начнем с описания оптимальных тактик для


частного случая, когда Синие и Красные в начале кам­
пании имеют одинаковые военно-воздушные силы, т. е.
В = |3 и Р = Ф = 1. Кроме того, мы ограничимся рассмо­
трением кампании, состоящей из трех операций.
Рассмотрим сначала первый ход игры. Природа
оптимальной тактики зависит от численности бомбарди­
ровочной авиации. Обозначим ее через к , т. е. В = $ = к.
Тогда оптимальные тактики будут следующими.

Оптимальные тактики в первой операции


Если к ^ 2, то каждая сторона назначает все свои
бомбардировщики для ударов по аэродромам, а все
свои истребители — для противовоздушной обороны.
Из числа бомбардировщиков, выделенных для ударов
к
по базам противника, доля должна атаковать
+ 1
аэродромы базирования бомбардировочной авиации, а
_ * _ л -ая доля — аэродромы истребителей.
1+к)
Если 1 < к < 2, то каждая сторона должна приме­
нять случайный. выбор между всеми тремя задачами.
Каждая из сторон посылает все бомбардировщики для
109
атаки баз противника и все истребители для ПВО с ве<
роятностью у (к— 1). Каждая сторона посылает все
свои бомбардировщики для ударов по базам и все свои
истребители для наземной поддержки с вероятностью
у (2—к ). Каждая из сторон посылает все свои бомбар­
дировщики для наземной поддержки и все истребите­
л и — для ПВО с вероятностью 72. Из бомбардировщи­
ков, назначаемых для ударов ,по базам, ^ Г “[-ая часть
направляется против аэродромов бомбардировочной
авиации, а остаток — против аэродромов истребителей.
Если &<1, то каждая сторона должна также при­
менять случайный выбор, но 'между двумя задачами.
На этот раз назначение всех бомбардировщиков для
ударов по базам и всех истребителей для ПВО должно
производиться с вероятностью 7г, назначение всех бом­
бардировщиков и всех истребителей для наземной под­
держки должно производиться также с вероятностью 7г.
Как и раньше, из бомбардировщиков, назначенных для
к
ударов по аэродромам, -ая часть выделяется для
атаки аэродромов бомбардировочной авиации, а осталь­
н ы е— для атаки аэродромов истребителей. Вообще
говоря, эти тактики не являются единственными опти­
мальными тактиками.

Оптимальные тактики для двух последних ходов

Оптимальные тактики для двух последних ходов


игры одинаковы у обоих игроков и состоят в концентра­
ции всех ресурсов для наземной поддержки.
Интересной особенностью оптимальных тактик
является то, что, хотя силы обеих сторон одинаковы,
оба игрока должны применять случайный выбор при до­
вольно широком диапазоне начальных условий. В этом
заключается отличие от случая с одним типом самоле­
тов, когда обе стороны при равных силах имеют чистые
стратегии и не нуждаются в случайном выборе [1].
ПО
ОПТИМАЛЬНЫЕ ТАКТИКИ ПРИ НЕОДИНАКОВЫХ СИЛАХ
БОМБАРДИРОВОЧНОЙ АВИАЦИИ

Теперь мы откажемся от предположения, что в на­


чале кампании каждая сторона имеет одинаковую по
силе 'бомбардировочную авиацию. Предположение
о том, что Р = ф = 1, .сохраняется. Так как эффектив­
ность самолетов обеих сторон одинакова, то для того,
чтобы определить оптимальные тактики, мы ограничим-

Области на плоскости (В, р). Числа в квадратных скобках указывают


характер оптимального способа игры в данной области. Так, [1, 4]
означает, что Синие применяют случайный выбор в отношении однчй
стратегии, т. е. используют чистую стратегию, а Красные применяют
случайный выбор м еж ду 4-мя стратегиями.

ся случаем, когда бомбардировочная авиация Синих


вначале сильнее бомбардировочной авиации Красных
или же они равны по силе, т. е. В противном
случае, т. е. при |3 ^ 5 , оптимальные тактики получают­
ся из случая В ^ р посредством перемены ролей Синих
и Красных. '
Для описания оптимальных тактик необходимо рас­
смотреть несколько случаев, отличающихся друг от
друга величиной разности т между числом бомбарди-
Ш
Ц ен а игры и оп ти м а л ьн ы е вы боры д л я н а ч а л ь н о г о х о д а
Область плоскости Оптимальные выборы Синих Оптимальные выборы Красных
(В, Р) (см. рисунок)
Цена игры
№ описание выбор (* , к) | вероятность выбор (^ , [А) вероятность

0^т^1
1 0<^1 7ит (5, р) V. (Р. В) 7а
0^В ^1 (0, 0) 7а (0, 0) 7а
0^т^1 (В, Р) ги (Р. О 7 2(В 1)
2 0=^1 У2т (В.0) 0 (? . 0) 7.(2 - В )
1^В ^2 (0, 0) 7г О. 1) 7а
1 ^ т ^ 3/ 2 (■в , Р) V . О. 0 7*Р/(2-ш )
( т - 1)(В -2 )
3 0^р^1 (В,0) 1!з(т—1)/(2—т) (Р .0 ) 7а(2— В)/(2—т )
/а 1 2(2—т)
1^В ^2 (0,0) 7а(3— 2т)/(2— т ) (0, 1) 7а
1^т<г3/2
4 7 а ^ 1 (В .'Р ) 7а О. О 7а
4 Ю -Р /.Р -1
2 ^ В ^ /2 (В, 0) 7а (0, 1) 72
О. 1) 74
5 в/а^т (Р. 0) 74
0^р^2 З п Ч “, / * Р + 1/ * (Р + */* 7аР) (0, 1) и
(0. 0) 74
0^т<^3/2
-6 1$^< 2 4/п+ ,/2?—1 (В, 1) 7аР 0. 0 72
2^а^7* (В, 0) (0. 1) 7а
1“ 7аР

(В. 1) 7*ф -1 ) О. О 7а( В— 1)


7 У2т (В,0) 1/Л 2-р ) 0 .0 ) 7а(2 В)
1^В ^2 (0, 1) (0, 1) 7г
У2
3 0 ^ т^ ® /2
2<^р Ат (В. 1) 1 0 . 1)
<9 8/ ^ т 3т - р / 2 1 (Р. 1) 7а
2^ р №+»/* 0 (Р. о> 7а
ровщиков Синих и бомбардировщике),в Красных в на­
чале кампании, т. е.
т = В —р.

Природа оптимальных тактик зависит от соотноше­


ния сил Синих и Красных. Каждая возможная комби­
нация начальных сил бомбардировочной авиации Синих
и Красных задается парой чисел (В , р) и, следователь­
но, может быть представлена точкой на плоскости
(В, р) при В ^ р. На рисунке показана разбивка пло­
скости (В, р) на девять областей. Для каждой из этих
областей мы опишем оптимальные тактики при началь­
ном ходе.

Оптимальные тактики при начальном ходе


Оптимальное распределение самолетов по различным
задачам во время первой операции показано в таблице.
Из числа бомбардировщиков Синих, выделенных для нале-
в
тов на аэродромы, |-ру-ая часть посылается против аэрод­

ромов бомбардировочной авиации, а ^ ^ 1 -ая часть—против


аэродромов истребителей. Из числа бомбардировщиков
Красных, назначенных для действий против воздушных
баз противника, ая часть атакует базы бомбардиров­

щиков, а -ая часть — базы истребителей. Вообще го­


воря, эти тактики не являются единственными. Тактики,
рекомендующие случайный выбор, являются самыми про­
стыми в том смысле, что. никакой случайный выбор при
малом числе чистых стратегий не является оптимальным.

Оптимальные тактики
во время двух последних ходов
Оптимальное решение для обеих сторон во время
двух последних ходов состоит в назначении всех само­
летов. для поддержки наземных войск. Оптимальность
этого решения не зависит от предположения, что
ИЗ
АНАЛИЗ ОПТИМАЛЬНЫХ ТАКТИК
Часть плоскости (5, р), для .которой 0 < # г < 3/ 2»
можно рассматривать, как множество начальных усло­
вий, при которых силы противников приблизительно
равны. Для этой части плоскости можно сказать, что
противники поступают одинаково, если под этим под­
разумевается, что у них имеется одинаковое число слу­
чайных выборов. В областях /, 7 и 8 полосы 0 < # г < 3/ 2
одинаковость стратегий обоих игроков выражена еще
сильнее. Часть границы каждой из этих областей со­
ставляет отрезок линии т = 0, и тот характер оптималь­
ных стратегий, который получается для этих отрезков,
сохраняется для всей области. И действительно, в этих
областях оба игрока имеют в точности такие же одина­
ковые оптимальные стратегии, какие они имеют на ли­
нии т = 0. В области 8 каждый игрок посылает все свои
бомбардировщики для атаки воздушных баз и все свои
истребители — для ПВО. В области 7 каждый игрок
производит случайный 'выбор между следующими тремя
тактиками: все бомбардировщики — против аэродромов,
а все истребители — для ПВО; все бомбардировщики —
против аэродромов, а все истребители — для поддержки
наземных сил; все бомбардировщики — для поддержки
наземных сил, а все истребители— для ПВО. В обла­
сти 1 оба игрока или выделяют все свои силы для уда­
ров по базам и для ПВО (х = В , ^ = р для Синих и
|= |3 , ц = В для Красных) или выделяют все самолеты
для наземной поддержки, выбирая л: = ^ = | = ц = 0, при­
чем обе тактики выбираются с вероятностью 1/2. Так
как в области"/ у каждого игрока силы бомбардировоч­
ной авиации слабее сил истребительной авиации про­
тивника, то нет необходимости использовать все истре­
бители для ПВО. Поэтому для ПВО назначается только
такое число истребителей, которое достаточно для отра­
жения налета наибольшего возможного/ числа бомбар­
дировщиков противника. Следует также отметить, что
область 8 является единственной областью, в которой
оба игрока обладают чистыми оптимальными страте­
гиями.
Часть .плоскости (Я, р), которая лежит выше линии
т = 3/2, может рассматриваться как множество началь­
ных условий, при которых Синие сильнее Красных
Если /гг> 3/2, то у Синих имеются чистые оптимальные
И4
стратегии, а Красные должны использовать случайный
выбор.
В заключение мы обращаем внимание читателя на
любопытное свойство области 3. Это — единственная
область, в которой цена игры не является линейной
функцией В и р.

ПРИЛОЖЕНИЕ

Математическая формулировка игры


Пусть нумерация ходов начинается с конца игры,
т. е. я-ый ход означает, что до конца игры остается
я ходов. Распределения сил игроков во время я^го хода
следующим образом определяют распределения сил во
время ( я — 1)-го хода:
Вп-\ — шах [0, Вп — Р„тах(0, $„ — «„)],
^ _ 1 = тах[0, Рп — (1 — Р„)1пах(0, $„ — «„)],
1 = т а х '[0 , Р„ — гя тах (0 , х п — *«.„)], (1)
Ф„_! = т а х [О, Ф„ — (1 — гп) шах (0, х п — ц„)].
Для Ы-ходовой игры платеж Синим равен

+ е „ - X. - я„) - (Р„+ Ф„ - - М- (2)


п— 1
Предполагается, что оба игрока знают, как проходит игра,
а именно: оба игрока обладают информацией, выраженной
уравнениями (1). Далее предполагается, что на любой ста­
дии игры оба игрока знают распределения сил и всю пред­
шествующую историю игры. Иначе говоря, перед я-ым
ходом оба игрока знают Ыу Вм, Ры, р^, и х .у и.у г., ^
р.., р. для /= Л ^ , N — 1 , . . . , п - \- 2, л + 1. Так как им из­
вестны также и уравнения (1), то, следовательно, перед
я-ым ходом им известны также ВР Рг р., Ф. для 1— Ыу
N — 1, . . . , я + 1, я.
Теперь чистые стратегии игры в нормальной форме мо­
гут быть определены посредством индукции по числу хо­
дов в игре. Любая стратегия Синих в одноходовой игре
является выбором точки Хг = (хи и1У гг) внутри паралле-
115
Лепипеда 0 < ^ 1 < В 1, ( Х а ^ Я ^ 0 < г 1 < 1. Аналогично
любая стратегия Красных Является выбором точки Уг =
= (61, р.1Э р4) внутри параллелепипеда 0 < 5 1 < р 1, (Х ^ ^ Ф ^
0< р 1 < 1. Пусть ам будет некоторой стратегией Синих
в М-ходовой игре. Совершенно очевидно, что аы является
функцией от Яд,, рд,, Фд,. В (Лг+-1)-ходовой игре
во время (М-)-1)-го хода Синие выбирают точку Х ^ х—
= (хы+1, ^ +1, ^ +1) внутри параллелепипеда Яд,+1, опре­
деляемого неравенствами
О^ ^ ^ ^ иы-\-\ ^ ®^ ГЛ^4-1 ^ *’
и одновременно Красные выбирают точку У = (2ЛГ_^_1,
Рдг-н) внУтРи параллелепипеда Д д,+ 1 , определяемого
неравенствами

О^ ^ РлЧ-1 ’ ^ ^ РN-{-1 ^ ^*
Эти выборы позволяют с помощью уравнений (1) опреде­
лить переменные состояния Яд,, Яд,, Рд,, Фд,. Тогда стра­
тегия Синих ОдГ_^1 в ( Ы 1)-ходовой игре определяется
как выбор * в О и как функция Ад,, которая свя­
зывает с каждой точкой (Хд,+1, Уд,+1) пространства Яд,+1Х
X Дд^! стратегию Од, в Л^-ходовой игре. Таким образом,
может быть записана как
аЛ^-1 =
Аналогично стратегия Красных Хд,+1 в ( Ы 1)-ходовой
игре определяется как выбор Уд,+1 и как функция ЧРд, ,
которая связывает с каждой точкой (Ад,+1, Уу+1) страте­
гию Хд, в ЛЯходовой игре. Таким образом, Хд,+1 может
быть записана как
Х#-Н = : (^+1»
Смешанные стратегии игроков могут быть определены
теперь таким же образом. Для одноходовой игры смешан­
ная стратегия Синих есть распределение вероятностей Ох
по параллелепипеду а смешанная стратегия Красных
есть распределение вероятностей Н х по параллелепипеду
Д1* Предположим теперь, что мы смогли определить сме-
Пб
щанные стратегии для М-ходовой игры. Пусть Оы есть
смешанная стратегия Синих в М-ходовой игре. Смешанная
стратегия Сд,+1 в (N-{-1}-ходовой игре является распреде­
лением вероятностей по параллелепипеду и
функцией А^, которая связывает с каждой точкой
некоторую смешанную стратегию 0^ в М-ходовой
игре. Таким образом, смешанная стратегия в (Л^+^-ходо-
вой игре может быть записана как

Смешанная стратегия Красных Н ы^ х определяется ана­


логично распределением по и функцией и
может быть записана как
— (^N+1» **)•

Достаточные условия для оптимальных стратегий


Предположим, что в Л^-ходовой игре существуют сме­
шанные стратегии Синих 0*ы и смешанные стратегии Крас­
ных Н*ы со следующими свойствами:
1. Если Синие выбирают стратегию 0^, а Красные —
стратегию Н*ы> то существует математическое ожидание
Е (о ;, я ; ) .
2. Для любой стратегии Красных т^, существует
Е (0 ^ , «дг). причем Е(С*. (О*, Н'ы).
3. Для ^юбой стратегии Синих существует Е(а
Н^), причем Е(<гы, Я * ) < Е ( 0 ^ , Я *).
В этом случае говорят, что игра имеет цену УМ= УМ(Вцу
Рдг* Ф/Л равную
^лг(^лг> р н> ?л'’ флг) = Е(Олг, И ы)\
при этом говорят, что 0*ц — оптимальная стратегия Синих,
а / / * — оптимальная стратегия Красных. Как видно из
обозначения, цена игры является функцией начальных
условий Ф^.
117
Введем обозначения
^+1 <*„*,.
V^4-Р >'//-1
» -1
« ) = ' в „+1+ р N 4-1 л;N+1
— и/У+1 $N +1 ®ЛГ+1 ~Н ^У+1 + !ХЛ/+1

ЛГ+1 ( ^ Л Г + Р ^Л Г-н) = = ^'Л +1 (^ Л Ц -Р ^ Л + 1) "

"Ь^Л/^ЛР ^ЛР Рлр ®Л^)’


где В„, Р„, рд,, Фы получаются из Вы+1, Р„+1, рд,+1 ^
Фд,+| с помощью уравнений (1) и выборов (Хд,^, УЛ._|_,)/
Мы можем теперь сформулировать лемму, которая дает
нам возможность решить игру по индукции.
Лемма. Пусть Ы-ходовая игра имеет цену Уы(ВМ)
Рн, Рд,, Фд,) и оптимальные стратегии 0*ы и Я* д ля
Синих и Красных соответственно. Пусть §ы+х есть
распределение по Оы+1, а /г*,+1 — распределение по
Дд, р причем

^ ^ У + 1 ( ^ N + 1' ^ N + № ^ N + 1 ^ ^ § ^ Н + 1 ( ^ Н + Г ^ Н + 1) ^ 8 ц + \ ^ Ы + \

д ля всех Уд,+1, (3)

^ ^ Л / + 1 (^ Л М -Р ^ЛГ + 1) ^ Л Г + 1 ^ ^ ] * ^ Л Г + 1 ( ^ +р ^ + , ) ^ ; +1^ ; +,

(4)
для всех X.N+1'
Тогда (Ы-{-\)-ходовая игра имеет цену
^N +1(^ЛГ+Р РН+1> ^ЛГ+Р ^ +1)
= Я +1^ N +1’ ^ЛГ-ц) ^ЛГ-И^ЛГ + Р
а ее оптимальные стратегии суть 0*ц+х = {8ы+х, ^ы)
для Синих и Я ^ +, = ( ^ +1, для Красных , где А*
есть функция, связывающая 0*м с любой точкой
(* р Улг+1), а ^ есть функция, связывающая Я*
с любой точкой (Хд^,, Уд,+1).
118
Доказательство этой леммы такое же, как приведен­
ное в работе [1] для аналогичных условий, и поэтому мы
его здесь не повторяем.

Решение для УУ== 1 и 2


При N — 1 исследование уравнения платежа (2) пока­
зывает, что как у Синих, так и у Красных имеются опти­
мальные чистые стратегии, состоящие в выборе х х= и {= О
для Синих и в выборе ^ = ^ = 0 для Красных. Выбор
значений гг и рх в этом случае может быть, очевидно,
самым произвольным. Цена игры равна

Из леммы следует, что для N = 2 достаточно рассмот­


реть
Мъ{Х2, У2) = В2-\-Р 2— Р2 — Ф2— х 2— и2-\-
+ ^2 + Ра + \В г + Рг — Рх — ФД
С помощью уравнений (1) величины в квадратных скобках
могут быть выражены через величины с индексом 2. После
исследования величин коэффициентов х 2, и2У $2, р.2 видно,
что оптимальным выбором для Синих будет х 2= и2= О
при произвольном значении г2, а оптимальным выбором для
Красных будет = также при произвольном значе­
нии р2. Цена двухходовой игры равна

У2= 2(Яв+ - 7 \ - р в- Ф 2).

Решение для N = 3
Из леммы следует, что при N==3 достаточно рассмот­
реть игру с платежом
^з(^з> У.) — В 3-\-Р 3— р3 — Ф3— х 3— й3+
“Ь ^з Н-з + 2 [В2-)- Р2— р2— Ф2].
Можно показать, что поскольку оптимальными выборами
для г = 1, 2 являются х 1= и. = $. = р,. = 0, то оптималь­
ное значение для г3 равно а для р3 равно
•—;— —. Дальнейшее доказательство заключается в про-
#3+^3
верке того, что стратегии, приведенные в таблице, удов­
летворяют уравнениям (3) и (4). Можно заметить, что так
как мы сначала определили оптимальные значения г3 и р3,
мы можем теперь положить Х3= (л;3, и3) и У3= (?3, р,3)
в уравнениях (3) и (4). Проверка, хотя и отнимает много
труда и времени, все же очень простая. Она приведена
в работе [2].
Более трудной задачей, чем проверка, является отга­
дывание оптимальных стратегий или, иначе говоря, вы­
бор «кандидатов» для проверки. В случае равных сил
бомбардировочной авиации использовалась следующая
процедура. Сначала было сделано пробное предполо­
жение, что оптимальные стратегии состоят из ступенча­
тых функций с конечным числом скачков и что эти
скачки имеют место в экстремальных точках про­
странств стратегий. После этого была составлена конеч­
ная матричная игра с платежом М3(Х3, Уз) и со страте­
гиями, выбранными по экстремальным точкам .про­
странств стратегий В и А. Затем определялось решение
полученной матричной игры, и найденные для нее опти­
мальные стратегии были испробованы на оптимальность
в полной игре посредством подстановки их в уравнения
(3) и (4). Если, однако, 6 < 1 , то на основании эвристи­
ческих соображений можно видеть, что некоторые
экстремальные точки доминируют над другими гранич­
ными точками. Например, из структуры игры совер­
шенно очевидно, что при 1 стратегия (к , 1) приво­
дит к излишнему расходу истребителей Синих и что
стратегия (ку к) будет доминировать над стратегией
(к, 1). Поэтому матричная игра была в этом случае
расширена, чтобы включить подобные стратегии.
В случае неодинаковых начальных сил 'бомбардиро­
вочной авиации для отгадывания оптимальных страте­
гий была использована комбинация «метода, применяв­
шегося в симметричном случае, т. е. метода образования
конечной матричной игры, с методом, который может
быть назван методом «искажения и непрерывности».
В нем ключом к природе оптимальных стратегий являет­
ся знание решений в смежных областях, которые исполь­
зовались для отгадывания оптимальных стратегий или
для модификации^ соответствующих матричных игр. Этот
120
процесс особенно эффективен, если имеется Возможность
определить цену игры в некоторой области, используя
свойство непрерывности и зная значения цены игры
в смежных областях.

ЛИТЕРАТУРА
1. 1_. И. В е г к о у Н г апб М е 1 у 1 п О г е з Ь е г . А ^аше-Ш еогу
ап а 1у з 1з о! 1асйса1 а\г \уаг. ОрегаПопз КезеагсН, 1959, уо1. 7,
р. 599—620.
Л . Д . Б е р к о в и ц и М е л в и н Д р е ш е р . И гровой анализ
тактической воздуш ной войны (см. настоящий сборник)'.
2. Ь. Б. В е г к о у И г апс 1 М е 1 у 1 п О г е з Ь е г . А ш и Ш то у е
аПосаПоп ^ а т е . ТЬе КАЫО Согр., Рарег Р - 1533, Ос1оЬег 1958.
Р А З Д Е Л ВТО РО Й

ОПТИМАЛЬНЫЕ СВОЙСТВА
ОБОРОНИТЕЛЬНОЙ СТРАТЕГИИ, СОСТОЯЩЕЙ
В ОДИНАКОВОМ ВОЗДЕЙСТВИИ ПО ВСЕМ ЦЕЛЯМ
Джон Э. Уолш *. 5 у з 1 е т О е у е Ь р т е п ! СогрогаНоп,
Санта-М оника, шт. Калифорния

Рассмотрим такую ситуацию, когда силы нападения,


состоящие из определенного числа боевых единиц и
являющиеся однородными с точки зрения обороняющей­
ся стороны, проходят через некоторый сектор обороны.
Против участников налета, пока они находятся в этом
секторе, назначается известный .потенциал сил обороны,
имеющих приблизительно однородный характер. Нами
будет исследоваться задача оптимального распределения
этого оборонительного потенциала между атакующими
единицами.
С точки зрения обороны все участники налета такого
типа обычно неразличимы ни по их виду, ни по их бое­
вой нагрузке, ни по цели налета, ни по маршрутам,
ведущим 'к этой цели. Здесь под «боевой -нагрузкой»
подразумевается потенциал разрушения или противо­
действия ((1е§гайаИоп ро1епИа1), который несет каждый
участник налета или который контролируется им
с целью применения против обороны. Эта нагрузка
используется либо в рассматриваемом оборонительном
секторе, либо в некоторой точке маршрута, достигаемой
после прохождения этого сектора.
Невозможность различить участников налета и их слу­
чайное расположение в момент, когда они подвергаются
воздействию со стороны обороны, часто приводят к тому,
* Т о Ь п Е. № а 1 з Ь. О р й т ш п ргорегйез !ог (1е!епзе з1га1:её^
о! ечиа1 аНаск а ^ а т з ! а11 1аг^е1з. ОрегаНопз НезеагсЬ, 1959, уо1. 7,
р. 249— 255.
122
что на каждого участника налета назначается одинако­
вое воздействие. !В статье показано, что подобная
практика, являющаяся обычно результатом интуитивно­
го подхода к вопросу, обладает выгодными свойствами
с точки зр'ения обороны. Действительно, для большого
класса ситуаций, имеющих практическое значение, оди­
наковое воздействие по всем целям представляет опти­
мальную оборонительную стратегию с точки зрения
теории игр. Таким образом, подобная оборонительная
стратегия, помимо сравнительной простоты реализации,
обладает и другими преимуществами, говорящими в, ее
пользу.
Оптимальность такой стратегии сохраняется даже
в тех случаях, когда обороняющаяся сторона обладает
большей информацией и большими возможностями, чем
обычно. При анализе предполагается, что оборона рас­
полагает дополнительными разведывательными данны­
ми, позволяющими разделить всех участников налета на
группы, в пределах которых участники имеют одинако­
вую боевую нагрузку, маршрут и боевое задание. Вну­
три группы все ее члены считаются неразличимыми, и
сделано предположение, что в среднем каждому члену
группы оказывается одинаковое противодействие со сто­
роны обороны. Предполагается также, что оборона спо­
собна атаковать каждого члена группы раздельно, при­
чем на эффективность атаки члены других групп не ока­
зывают никакого влияния. Показано, что и в такой
усовершенствованной системе обороны назначение оди­
наковой степени воздействия на каждую боевую единицу
нападения является для важного класса ситуаций опти­
мальной оборонительной стратегией с точки зрения тео­
рии игр.
Для рассматриваемых ситуаций предполагается, что
«среднее» выживание, приходящееся ,на члена группы *,
может быть выражено как функция отношения вели­
чины оборонительного потенциала, назначенного против
данной группы, к числу членов группы, когда она вхо­
дит в сектор обороны. Предполагается, что логарифм
этой функции существует и имеет строго монотонную
первую производную. Функциональная форма среднего
* Отношение среднего числа боевых единиц противника, про­
рвавшихся через систему обороны, ко всем боевым единицам, уча­
ствующим в налете. (Прим, перев.)
123
выживания на члена пруппы считается одинаковой для
каждой группы. Это предположение представляется
разумным в силу однородного характера сил нападения
и обороны. Здесь слово «среднее» может означать ожи­
даемые величины, но не исключена возможность дру­
гих значений этого слова. Таким образом, среднее
число членов какой-нибудь группы, уцелевших в дан­
ном секторе, будет (равно численному составу этой
группы, умноженному на «среднее» выживание, прихо­
дящееся на одного члена.
Предполагается, что критерий «среднего» выжива­
ния для группы может быть выражен в виде дифферен­
цируемой строго монотонной функции от среднего числа
уцелевших членов этой группы. Эта функция не обяза­
тельно должна быть одной и той же для каждой груп­
пы, и единственным дополнительным условием, нало­
женным на эти функции, является то, что все они долж­
ны возрастать- в одинаковом направлении. Общий кри­
терий для всего налета относительно рассматриваемого
оборонительного сектора принят равным сумме крите­
риев для индивидуальных групп. Если же в качестве
меры эффективности взять произведение частных крите­
риев, то результат получится по существу таким же,,
т. е. одинаковое воздействие и в этом случае является
оптимальной оборонительной стратегией. Удовлетвори­
тельная ненулевая функция критерия для каждой
группы может быть получена практически для всех
возможных случаев, представляющих интерес. С по­
мощью логарифмирования и, возможно, перемены знака,
ненулевая мера эффективности, получаемая перемноже­
нием частных критериев, может быть преобразована
в эквивалентную суммарную меру эффективности, удо­
влетворяющую требуемым условиям.
Рассматриваемый тип меры эффективности пригоден
для широкого круга ситуаций. Использование отноше­
ния оборонительного потенциала к числу членов группы
.в качестве аргумента функции «среднего» выживания
на каждого члена группы оказывается вполне приемле­
мым для случая равномерного распределения воздей­
ствия внутри групп. Действительно, такая переменная
уже использовалась для этой цели во многих моделях
«нападения — обо!роны» (см., например, [1]). Требование
существования логарифма функции «среднего» выжц-
124
вания на одного члена группы сводится просто к тому,
чтобы эта функция была положительной. Требование
того, чтобы логарифм этой функции имел строго моно­
тонную первую производную, является более серьезным,
но не очень ограничивающим. Это условие означает,
что функция должна быть непрерывной и либо строго
монотонной, либо такой, чтобы ее крутизна меняла свой
знак лишь один раз; иными словами, она должна быть
гладкой, т. е. без волнистостей. Действительно, эта
функция будет непрерывкой и строго монотонной для
любого типа разумной наступательно-оборонительной
ситуации. Кроме того, требование «гладкости», очевид­
но, не является сильно ограничивающим, если принять
во внимание точность, с которой может быть опреде­
лена такая функция. В следующем разделе дано под­
тверждение общего характера этих логарифмических
требований, основанное на том, что им удовлетворяет
важный класс функций «среднего» выживания на члена
группы.
Свобода выбора формы функции выживания позво­
ляет учесть действие помех, создаваемых или контроли­
руемых членами группы в целях подавления обороны.
Могут быть также учтены многие эффекты типа
запаздывания (Иттд е[{е&8).
Среднее число членов группы, уцелевших в данном
секторе, по всей видимости, является разумным аргу­
ментом функции критерия для группы. Допустимые
формы функции критерия для группы и способность
этой функции сильно меняться от группы к группе ука­
зывают ка возможность рассмотрения ситуаций значи­
тельно более общего типа. Кроме того, практически для
всех важных случаев одна и та же оптимальная оборо­
нительная стратегия получается как при использовании
меры эффективности, получающейся в результате сло­
жения, так и при использовании меры эффективности,
вычисляемой перемножением частных критериев. Таким
образом, мера эффективности рассматриваемого типа
пригодна для важного класса оборонительно-наступа­
тельных ситуаций.
Одним из наших основных предположений является
применимость используемой меры эффективности как
к обороне, так и к нападению. При правильном выборе
функции среднего выживания на члена группы ц функ-
125
ции критерия это требование почти всегда может быть
удовлетворено, хотя бы приблизительно. При этом пред­
положении взаимодействие обороны с нападающей сто­
роной эквивалентно игре двух игроков с нулевой сум­
мой. Поэтому оптимальные оборонительная и наступа­
тельная стратегии могут быть определены на основе
теории игр.
Для исследования свойств решений этой игры отно­
шение потенциала поражения к численному составу
группы рассматривается как непрерывная переменная.
Многие случаи могут быть приближенно сведены к этой
упрощенной ситуации. К ней можно мысленно прийти,
если назначение долей нападающих единиц и единиц
оборонительного потенциала заменить назначением це­
лых единиц, произведенным на вероятностной основе.
Дальнейшим упрощением является предположение, что
решение игры существует, когда как обороняющаяся,
так и атакующая сторона назначают ненулевое воздей­
ствие по всем рассматриваемым группам. Тогда опти­
мальность стратегии, состоящей в равномерном воздей­
ствии, может быть доказана методами дифференциаль­
ного исчисления. Тщательный, но реалистический выбор
рассматриваемых групп позволяет сделать это упроще­
ние приемлемым почти для всех ситуаций, представ­
ляющих интерес.
Обстановка такова, что каждая сторона выбирает
свою стратегию, не зная, какую стратегию выбрал про­
тивник. В явном виде стратегии, доступные атакующей
стороне, состоят в различных способах назначения
фиксированного числа атакующих единиц в состав
групп рассматриваемых типов; на это назначение на­
кладывается условие, что ни одна из групп не останется
без воздействия. Предполагается, что число единиц, на­
значенных в каждую группу, становится известным обо­
роне как только атакующие силы входят в рассматри­
ваемый сектор. Стратегия обороны состоит в заранее
выбранной «доктрине обстрела», которая устанавливает,
какое число единиц потенциала поражения должно быть
назначено на каждого члена группы. Это число может
меняться от группы к группе, причем единственное
ограничение состоит в том, чтобы не было групп, остав­
шихся без воздействия. Любое выбранное распределе­
ние должно удовлетворять условию, чтобы было задей-
126
ствовано установленное число оборонительных единиц,
т. е. для каждого из рассматриваемых типов нападаю­
щих групп нападающая сторона должна назначать
определенное число членов группы, а оборона прини­
мает фиксированную «доктрину обстрела» на каждого
члена группы.
Следующий раздел статьи «Обозначения и предпо­
ложения» содержит принятые при выводе обозначения,
а также техническое описание принятых предположений.
В последнем разделе «Анализ и результаты» приводится
доказательство того, что равно-мерное воздействие по
атакующим боевым единицам является оптимальной
оборонительной стратегией для рассматриваемых ситуа­
ций.
ОБОЗНАЧЕНИЯ И ПРЕДПОЛОЖЕНИЯ
Рассмотрим произвольный, но фиксированный сек­
тор обороны. При изложении предположений и при ана­
лизе приняты следующие обозначения:
О — число имеющихся у нападающей стороны комби­
наций различных маршрутов, бомбовой нагрузки и объектов
нападения, т. е. число рассматриваемых атакующих групп;
§ — индекс для обозначения атакующих групп (§* =
= 1» • • О);
т — число боевых единиц в ^-ой группе;
о
М = У т — общее число атакующих единиц (фикси-
/аш1 с>
5=1
рованное число);
к — число единиц потенциала поражения, назначаемых
против §-ой группы;
о
к&— общий (фиксированный) потенциал пора-
5=1
жения, выделенный против всех атакующих единиц;
а8— ~щ---- часть потенциала поражения, назначенная на
одного члена ^-ой группы;
5 (а8) — „среднее" выживание на одного члена ц’-ой
группы;
№8 [/гев5 (а§)] — критерий среднего выживания для ^-ой
группы.
127
Независимыми переменными, находящимися в распоряже­
нии обороняющейся стороны, являются а (ограниченные уело-
О
виями и ^ т^аё = К), а в распоряжении атакую-
5 = 1
щей стороны — т§ (ограниченные условиями т§ ^>0 и
о о ё
^ т§ = М). Условие ^ т^а — Ь( накладывает ограни-
5 = 1 5 = 1
чения на а§, а не на тё. Величины т§ и пг а& не обяза­
тельно должны быть целыми числами.
В предыдущем (р;азделе было дано словесное описание
принятых предположений. Некоторые из них непосред­
ственно при анализе не используются, но зато исполь­
зуются для мотивировки других предположений. Кроме
того, ни одно из предположений не было выражено
в приемлемой математической форме. Ниже дано техни­
ческое описание предположений, принятых при выводе
результатов данной статьи.
1. Д ля нападающей и обороняющейся сторон суще­
ствует одна и та же 'мера эффективности для рассмат­
риваемого сектора.
2. Общая для обеих сторон мера эффективности мо­
жет быть представлена в виде

5 = 1

где для 0 < х < о о , 5 (л )> 0 функция ^ у = {Х)


строго монотонна. Кроме того, для 0 < у < о о функции
ё \у] дифференцируемы, строго монотонны и возрастают
в одном и том же направлении.
3. Стратегия о>бороны состоит в выборе допустимого
множества величин а ь ...,ао, а стратегия нападающей
стороны — в выборе допустимого множества величин
т и ..., т с. Каждая сторона выбивает свою стратегию,
не зная выбора противника.
4. Существуют такая оптимальная оборонительная
стратегия, для которой все аё> 0, и такая оптимальная
наступательная стратегия, для которой все тб> 0.
128
При этих предположениях задача состоит в том, 'что­
бы показать, что оптимальной оборонительной страте­
гией является условие = ... = ас.

Пример функции 8(х)


Важным классом функций «среднего» выживания на
одного члена группы являются функции вида

5 (л ) = 1 - ( 4 - ) ( 1 “ е - /и) ( 0 < Л < оо).

Для функции $(л;), имеющей такую форму,

является строго монотонной функцией от х при А ф \.


Поэтому результаты статьи справедливы для этого типа
функций 5(л:), кроме случая А = 1. Легко, однако, пока­
зать из соображений непрерывности, что условие а\ —
= ... =ао является оптимальной стратегией для обороны
и в случае, когда А = 1. Таким образом, результаты
статьи справедливы для рассмотренного класса функ­
ций 5(л:).

АНАЛИЗ И РЕЗУЛЬТАТЫ
В этом разделе содержится подробное доказательство
того, что доктрина одинакового воздействия является оп­
тимальной игровой стратегией для усовершенствованной
обороны. Раздел завершается доказательством того, что
все а обязательно имеют одинаковую величину для лю­
бой ненулевой комбинации величин а1У . . . , а0>т г, . . . ,
которая является седловой точкой функции критерия эффек-
о
тивности ^ ХРг [т^5 (а^)]. Для рассматриваемых ситуаций

седловая5 точка критерия эффективности является реше­


нием соответствующей игры.
Так как функция ЧР8 [/«^5 (а^)] дифференцируема как
по ав, так и по те, и существует такое решение в виде
седловой точки, которое не является граничным значением,
то для вычисления производных могут быть применены
9—464 129
методы дифференциального исчисления. Пусть Я и р -
множители Лагранжа (постоянные относительно а§ и т )
Тогда любая седловая точка а 0, т 0, дл^
которой все значения не равны нулю (т. е. эта точка не
является граничной), должна удовлетворять условиям
о о
■щгй Щ к 5 « 1 — » [ 2 “ А - к ]}=

к=1 Л=1
= Г ; [ т в5 ( а в)] 5 ( а в) - Р= 0
при ^ = 1 , . . . , О.
Так как т5 , 3 (а5 ) и И?’о [ тб 5 о(а )] не равны нулю, то
5'(**) X
_ Р

Так как У(*) является строго монотонной функцией


5(*)
от л;, то только единственное значение х может удо-
влетворить уравнению
Ь'(х)
5( х )
— сопзП

Это означает, что а\= ... =ао для любой седловой


точки при ненулевых значениях. Однако по предположе­
нию имеется такое решение в форме седловой точки, для
которого все аё и тё не равны нулю. Это доказывает, что
равномерное распределение воздействия является опти­
мальной оборонительной стратегией для рассматривае­
мых наступательно-оборонительных ситуаций.

ЛИТЕРАТУРА
1. Т о Н п Е. \ У а 1 з Ь. 1 п а с ^ и а с у о[ соз! рег „кПГ аз т е а з и г е о!
еНесП уепезз. ОрегаНопз НезеагсЬ, 1957, уо1. 5, р. 750—764.*
Д ж о н Э. У о л ш . Н едостаточность с т о и м о с т и пораж ения цели
в качестве критерия эффективности (см. настоящий сборник).
НЕКОТОРЫЕ ТАКТИЧЕСКИЕ
ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ И ВЫБОР
ПОДДЕРЖИВАЮЩЕЙ СИСТЕМЫ ОРУЖИЯ
Херберт К . Уэйсс *. А егопеи1готс 8уз1;ет5, 1пс.,
Л ос А нж елос, шт. Калифорния

Одной из важнейших проблем, встречающихся при


анализе систем вооружения, является учет взаимных
связей, существующих между различными видами воору­
жения при их 'совместные действиях на 'протяжении
одного боя. Мы предлагаем подразделить вооружение
на «главное» и «поддерживающее». Такая классифика­
ция позволяет заглянуть в сущность некоторых из этих
связей.
Различие между «главным» и «поддерживающим»
оружием было подмечено Клаузевицем [1], который ука­
зывал, что «...армия, состоящая только из артиллерии,
является абсурдом с военной точки зрения... Армия, со­
стоящая только из пехоты, не только возможна, но и
много сильнее». Однако «... сочетание различного оружия
в войне приводит к более совершенному использованию
сил».
В качестве более современного примера можно при­
вести статьи Галлуа [2, 9], который считает, что функция
легких истребителей-штурмо!виков сил НАТО состоит
в действиях во время таких ситуаций, когда продвиже­
нию наземных сил противника в период стратегического
взаимного применения ядерного оружия препятствует
укрепленная полоса. «Линия фронта может сдерживать­
ся наземными силами, которые поддерживаются самоле­
тами, предназначенными для выполнения ограниченной
задачи предотвращать концентрацию войск противника
вблизи оборонительных позиций... удерживаемых назем­
ными частями...»
* Н е г Ь е г 1 К. Ш е 1 з з. 5ош е (1Шегеп11а1 д а т е з о! 1асИса1
1п1егез1 апс! Ше уа1ие о! а зиррогИпд чуеароп зу$1еш. О регаНопз
КезеагсЬ, 1959, уо1. 7, р. 180— 196.
131
В настоящей статье эти мысли использова-ны в каче­
стве переходной ступени к простой математической мо­
дели, в которой характерные черты обоих примеров
воплощеньи в степени, до^таточной, чтобы представлять
практический интерес. В этой модели реальные тактиче­
ские проблемы настолько сильно упрощены, что ее не
следует -всерьез применять к реальным системам воору­
жения. Тем не менее, при построении модели мы должны
делать выбор между достаточно сложной моделью, кото­
рая бы точно представляла действительную тактическую
ситуацию, и достаточно простой моделью, с помощью
которой можно 'было бы рассмотреть основные взаимо­
связи. Мы выбрали второй способ на том основании, что
общие результаты!, полученные посредством такой моде­
ли, всегда могут быть использованы в качестве руковод­
ства для исследования более сложных моделей с по­
мощью вычислительных машин. В то же время простая
модель может помочь понять важнейшие связи, которые
трудно проследить в более сложной модели.
УПРОЩЕННАЯ ТАКТИЧЕСКАЯ СИТУАЦИЯ
Предположим, что обе стороны находятся в сопри­
косновении, т. е. в пределах досягаемости систем ору­
жия, имеющихся у обеих сторон. Силы каждой стороны
состоят из двух типов систем вооружения, главной си­
стемы и второстепенной. Каждая второстепенная систе
ма может атаковать или главную, или второстепенную
систему вооружения противника. Каждая главная систе­
ма может атаковать только главную систему противника.
Если имеется потребность придать этой идеализации
физический облик, то можно представить себе главную
систему в виде пехоты, а второстепенную систему в виде
артиллерии, как у Клаузевица. На рис. 1 изображена
эта ситуация. Представим действия сторон в виде сле­
дующих функций времени:
7Й*= —*«•*. — ф64,л:4) — (1 — ф) к АЗх„

а- ^ = — к1Лх 1— <ркзлх 3, ^-4= — (1 — < р )^ Л , М


где х и х 2— число единиц главной системы вооружения
(численность пехоты) у Красных и Синих
в момент (,
132
Х3, х 4 — число единиц второстепенной системы воору­
жения (артиллерии или авиации) у Красных
и Синих в момент I ,
— скорость, с какой одна единица оружия
/-того типа может поражать единицы воору­
жения /-го типа,
ф, <р— часть уцелевших единиц 4-го и 3-го типов,
действующих против систем вооружения
1-го и 2-го типов.
Бой считается закончившимся тогда и только тогда,
когда либо Х\, либо х2 станет равным нулю. Красные
стремятся 'максимизировать, а Синие минимизировать
величину
Ц = х 1— х 2, когда х г или х 2= 0. (2)
Задача заключается в вьиборе (г|э, ср), как функции
времени. Задача этого типа у разных авторов носит
различные названия: «дифференциальная игра» у Айзек­
са [10], «игра по планированию огня» у Айсбелла и
Мэрлоу [5, 6], «тактическая воздушная игра» у Фулкер­

сона и Джонсона [4] и т. д. Автор настоящей статьи


также занимался некоторыми характеристиками реше­
ния при ограничивающих условиях [3].
Дальнейшее упрощение приводит задачу к такому
виду, который позволяет ясно видеть большинство инте­
ресных характеристик, входящих в уравнения (1), и
одновременно избежать затемняющих смысл сложных
133
алгебраических выражений. Это достигается предполо-*
жением, что ^21=^12 = 0.
Это равноценно следующей ситуации: Красным и Си­
ним удалось заставить сконцентрировать друг против
друга единицы главной системы вооружения (рис. 1).
Каждая из этих систем поддерживается второстепенной
системой вооружения настолько быстро и эффективно,
что это может решить исход боя до того, как оружие
главных систем сможет нанести существенное пора­
жение.
Каждая сторона теперь ,р ешает в каждый момент
времени, что должна атаковать ее второстепенная систе­
ма — главную или второстепенную систему противника.
Сторона проигрывает бой, если она теряет всю свою
«авиацию» * или всю свою пехоту. Это следует из того,
что если какая-нибудь сторона потеряет свою авиацию,
в то время как ее пехота остается прикованной к своим
позициям пехотой противника, то авиации противника
ничего не стоит уничтожить эту пехоту. Если же она
раньше потеряет всех своих людей, то не сможет удер­
живать пехоту противника 'в виде сконцентрированных
целей, пехота противника рассредоточится и захватит
уцелевшую артиллерию или авиационные базы. Совер­
шенно очевидно, что когда мы употребляем в тексте ради
краткости слово «авиация», мы подразумеваем только
очень ограниченные действия воздушных сил.
Произведем следующую замену переменных:

, Vк
У\ ------- ^ 1 ^ 4 3 У Уз ---^34> ^1---^ ^^43^34*
(3)
и
У2 Л-2^34 Ь У\ === -^4 ^ ^ 4 3 *

В результате мы получаем следующие простые урав­


нения:

Ух = — Ф#4> Уг = — 9Уз> У3 = — (1 — Ф) 04>


У4 (1 — <р)*/з> (4)
* Д ля простоты мы используем слово «авиация», предпочитая
его «артиллерии» или «поддерж иваю щ ей системе вооруж ения».
134
ё Которых точка сверху букв означает Производную по
времени ^\. Игра заканчивается, как только одна из пе­
ременных уг станет равной нулю. Сторона, у которой это
(произошло, считается потерпевшей поражение. Мы бу­
дем называть тот момент, когда какая-нибудь и'з пере­
менных уг первой достигнет нуля, «концом игры». Цена
игры для Красных равна у\8у если они выигрывают,
и — У28 у если выигрывают Синие. Здесь индекс относится
к значениям в конце игры, причем цена игры V анало­
гична цене (2) для уравнений (4). Цена игры для Синих
равна этим значениям цены игры, взятым с обратным
знаком.
Чтобьи получить оптимальные значения г|э и <р, посту­
пим следующим образом:
а) рассмотрим в качестве единственных возможных
значений ф и яр только 1 или 0; предположим, что эти
значения постоянны в течение игры, и определим мини­
максные решения;
б) покажем, что решения, которые допускают изме­
нение величин г|) и ф в течение игры, являются неопти­
мальными. При этом у нас будут (возможные комбина­
ции тактик, которые вместе с результатами приведены
в табл. 1. В этой таблице применены следующие обо­
значения:
1е — время, оставшееся до конца игры (время до прев­
ращения у. в 0),
у — у. в момент 1о
у п— начальное значение уг
Обозначим также через V (ф, ?) дену игры для Красных,
получающуюся в результате выбора (ф, <р) обоими игро­
ками.
Случай 1: у п/у41< 1,0
Разделим плоскость у и/у 3х, у21/у 41 на три области: А,
В и С, как показано на рис. 2. Оптимальные стратегии
будут определяться для каждой из этих областей.
Область А. В этой области 2уг1у41^ у 2зг УиУз^УмУа
и У п< У и- Поэтому

Уг1 2 У*1’ (5)


135
т
В ы б ор
о [
С и н и х
° 1
В ы б ор
о | о К р а сн ы х
“ 1

^5 ^

^ < ?
I? «г
СО со м *? со ео
р
ь
о
Л V
1 1= р ?
А ^ о
а
<$: со а
Р Р 2 <5»
!? * о О оЮ ^ * °
#» **

■*
Со
ю | — м | —
1
1
00* оо
" Ч ’ ч
«С «Г <$; ^ |<«: ^
Й * «Г » «с № ««: ♦ с.
2= [ ? ? р м * * З и #> •- см 1 со Л

1 + 1 + 1 1
^ ^ <55 ^ «о ю
«о ео ** <Р“
<5
м

Р
**

<«г
V*

<5? У 1 О 0 ^ СО
С$^ со

ео 4*Ю 2 <«:
*


со
СО

<$: с$; о
н м го го 1 °
1?
Ю|
с г* <$: р
*Г О> N3
ео

ОЭЮ

<«: ^ ^ <5; «г
ео со со со С*э
О “ о 1 со
*» *■ *
Ю
м

■ц

Й *
<*:

°
о 1 р ? Р ? &
ГО
Таблица

Со

Л - Я
-
О
*
чз "О О О 43 О $
к &> Й. к к » 5 я § &
а: о
О д х 2 я о й п>
§ Я х я я я ст >э
В Е
я
Е я
ср а> Е о Е 8
ГР ГР
1

® 1I »
Обращаясь к табл. 1, находим, что

У(1,1) = 0 „ - 0 м!г , У(0, 1) = У». У(0, 0) = - у п,


У 31

У(1, 0) = IУ11 2у31 ’ ^УиУы^Уы’ (6 )

I — У п , если 2у11у п <!%1-

Рис. 2. Области определения оптимальных стратегий.

Подставляя функции цены (6) в игровую матрицу


ф= 0 ф= 1 т т ф*
<р= 0 — У21 Уи— УцРУп или — Уп — Уи
?== 1 Уп Уи УыУ\г!Уз1 Уп УнУа/Уц
гаахф Ун У и— УиУи/У»
мы сразу видим, что

т а х т т У (ф , < р )= т т шахУ(ф, <р) =


* Ф Ф <Р
===^(1» 1)==Ун УчУп!Уп' (7)
В этой игре имеется седловая точка, и оптимальной стра­
тегией в области Д является чистая стратегия (1, 1).
137
Область В. В этой области г/21г/41> г /иу31, г/п < у г /31
У п< У а- Поэтому
%УиУп < У» (8)
и из табл. 1
У (М ) = - У . | + М Л . V"(1,0) = — у,» У (0 ,0 )= —у Л1
„ п п I Уш если 2у«Уа1< у1 д.
\ — Уи + УыРУи’ если 2г/21г/41> / 31 1
и так как согласно (8) УиУи1У^<у\х1^У^ то
шах т ш V (ф, 9) = т т шах V (<|>, <р) =
Т Ф Ф 9

= 1/(1, 1) = — У гг - { - У и У н / У и - (10)
Область С. В этой области

Я У ч У ^У п ' Уп>-ЪУ*» У ч< У ч- (П)


Обращаясь к табл. 1, находим, что

Уц—УиУи1Ун> если У1#»1>УиУ41,


У ( 1, 1) =
~ У и ~ \~ У и У а г/У а * еС Л И У цУ ц^У цУ ^ц

V (0, 1) = ~ г / 21+ Уз,/2у41, V (0, 0) = ~ < /21, (12)

у \^ У ш если 2уиу п ^ у 2ли


У( 1, 0 ) = { ^ 1
1 — У*I. если 2г/п г/31< г/41.
Можно сделать вывод, что независимо от значений цен
У (1, 1) и У ( 1, 0), данных в табл. 1 и определяемых зна­
ком неравенств, благодаря условиям ( 1 1 ) справедливо
соотношение
ш ахш тУ(ф, <р) = т т т а х У(ф,<р) =
<р Ф Ф ?
= У(0,1) = - у 21 + ^ / 2 у 41. (13)
Поэтому мы делаем заключение, что для случая
Уъ\!Ун< 1,0 и для всех значений г/21 и уп оптимальными
стратегиями будут чистые стратегии, причем мы показа-
133
Лй, чТ6 бйй йвЛяЮтся функциями начаЛЬМых условий.
Для того чтобы суммировать полученные результаты,
был начерчен рисунок 3,а. Он такой же, ка,к рис. 2, толь­
ко на нем нанесены оптимальные стратегии (ф, ф)
в областях А, В и С. Кроме того, в каждой области
отмечена выигравшая сторона. И, наконец, на нем нане­
сены! линии, соединяющие постоянные значения отноше­
ния у\8[у\\у когда выигрывают Красные, и постоянные
значения отношения у^81у\\, когда выигрывают Синие.
Значения этих отношений, связанные с каждой такой
линией, можно отсчитать в точке пересечения линий
с какой-нибудь осью координат. Так, линия с надписью
«Ничья», соответствующая случаю, когда у\8 и у 2 8 одно­
временно становятся равными нулю в конце игры, про­
ходит через начало координат.
Случай 2: у3\/У4\>190
Этот случай исследуется так же, как и случай 1. На
рис. 3,6 графически показаны три области, которые мо­
гут быть использованы для подтверждения существова­
ния оптимальных чистых стратегий. Стратегии, победи­
тели и линии постоянных значений уи!уъ\ и У2 $1 у\\ нане­
сены точно так же, как на рис. 3,а.
Случай 3: уг\1уи = 1,0
Разделим плоскость уп1узи Уъ\1у\\ на три области.
Область А\. В этой области

Уи1Уи>Ъ' У и1У ч> Ъ ‘ (14)


Нам необходимо теперь уклониться относительно
цены У(0,0). Так как в этом случае бой происходит
только между поддерживающими системами и может
продолжаться бесконечно долго, то в этом смысле бой
оканчивается ничьей, поскольку здесь нет ни победителя,
ни побежденного н нашем первоначальном понимании.
Согласно этой интерпретации У (О ,0)=0. С другой сто­
роны, главные системы остаются при этом неизменными.
Поэтому в соответствии с нашим предположением о том,
что поддерживающие системы сами по себе не имеют
никакой ценности, можно считать, что в этом случае
цена игры в любой момент 'времени равна У(0,0) =
= Хц—х2\. Оказывается, что оба предположения относи-
139
тельно, значения У (0,0) дают одни и те же оптимальные
стратегии. Таким образом, учитывая (14) и только что
приведенные рассуждения, мы 'получаем
V (0 ,0 ) = у п — у 21 или 0, У ( 1 , 1 ) = у г1 — у21,
У(0,1) = — Уи + ^ У ч , У(иО) = у 11— ^ у А1 (15)
и приходим к выводу, что
т а х г а т V (ф, <р) = т т т а х V (ф, <р) = V (0,0). (16)
? Ф Ф 9
Область В х. В этой области
Уи /Уа1<С "2" > Уи/у31 <"С~2 » (17)
У(0,0) = уп — уи или 0, V ( 1 ,1) = уп — уЛ1,
V (1.0) = — уЯ1, V (0,1) = 1/ц, (1 8 )
откуда оптимальная стратегия должна быть (1,1).
140
Области С1УО,. В этих областях у Л1 /уи ^ у и!уп< ^

и У21Л/41 < "4“ » У11 /У31 > “у - > соответственно. Применяя


непосредственно методы, использованные выше, находим,
что оптимальными стратегиями для обоих случаев являются
стратегии (1 , 1 ).
На рис. 3,в графически показаны оптимальные стра­
тегии для всех начальных условий, для случая уз\=У 4 \,
а также нанесены Линии постоянных значений Уи/Узи
У 2*!у а \ и для стратегии ( 0 , 0 ) — значение Уи1 уз\—У2 в1 УА\-
Наконец, на рис. 3,2 -показаны такие сочетания у\\!уз \,
У2\1 у а \ и У з \/У 4 \, Для которых игра оканчивается вничью.
На этом заканчивается определение оптимальных
стратегий при ограничивающем условии, что ф и ф могут
принимать только значения, равные 0 или 1. Теперь мы
приступим к доказательству того, что чистым стратегиям
(ф, ф), которые были /получены 'выше, следует отдать
•предпочтение по сравнению с теми, в которых ф и ф
могут меняться в ходе игры или могут принимать значе­
ния в пределах между 0 и 1.

ПРИМЕНЕНИЕ ТЕОРИИ ДИФФЕРЕНЦИАЛЬНЫХ ИГР


Следует отметить, что теория дифференциальных игр
находится в начальной стадии развития и поэтому, по-
видимому, не существует еще общих теорем, с помощью
которых можно было бы строго доказать, что либо су­
ществуют решения желаемого вида, либо решения, полу­
ченные методами, использованными нами, являются
обязательно желаемыми решениями. Однако к такой
форме может быть приведено столь большое количество
интересных поенных проблем, что мь» надеемся нашей
статьей стимулировать дальнейшие математические
исследования.
Согласно Айзексу [10] метод состоит в рассмотрении
выборов, доступных обеим сторонам, в непосредственной
близости к поверхности, соответствующей -состоянию
окончания игры (г/г = 0). Здесь оптимальные стратегии
очевидны, а решение можно получить, возвращаясь от
точки, соответствующей состоянию окончания игры.
Таким образом, можно построить пучок траекторий,
каждая из которых соответствует постоянному значе-
141
нию V и оканчивается на выбранной поверхности,
опветствующей состоянию окончания игры. Взяв сечение
пучка в момент I и просматривая в*се возможные выборы»
на предшествующем отрезке времени сИу мы ищем такое
решение, чтобы
шах пип V = Ш 1П шах У = 0. (19)
<р Ф ф <р
Вообще
V = У1У1 + УгУг + УзУз + У4у4 , (20)
где 1/.у= — ; значения ^у у. в отличие от значений V.у не ос-
Ьу. ’
нованы на оптимальной траектории.
Из уравнений (4) следует, что
V= ( - У ,+ У3) + <?Уз ( - У2+ У4) - УзУ4 - У4у3. (21)
Рассмотрим траектории, оканчивающиеся победой Си­
них при <р= 1,0, ф = 1,0, т. е. игру, оканчивающуюся
положением, когда уи = 0:
У= у 21 “ф" У31У11 ]Ул\ • (22)
Для этого случая

1^1 У31/У4П ^2 ^ 3= = Уп/У 4 1 > ^4 У31У 11/1/41 *

V == Ф (Уз1 У п ) “ Ь Т^/31 0 У н У31/У41) Ун У11У31/У41»

< р= 1,0, пока УпУз1/у 24, < 1 , У11/Уз1< (У и /У п )2’ (23)


4 » = 1 ,0 , пока Уз1> У11, Уц /Уз1 < 1 , 0
и шахш1П У = ш т т а х У = 0, что и требовалось. Так как
<р ф ф ср

оба эти предела включают ранее установленные границы,


то решение справедливо в этих границах.

У11 /У31 ^ ~2 (у4:1/Уз 1) » У41/У31 ^ ^ ®>

Ун/ У31 < у . У41/У31 = 1>0. (24)

Аналогичным образом можно показать, что ранее полу­


ченные стратегии с победой Красных также оптимальны.
142
Исследуем теперь те случаи, которые оканчиваются
при
Уз? — 0, т. е. при <1>= 0, <р= 1,0:
У = - У п + ^ У н , ^ = 0, У2 = — 1,0, (25)
Vз==Уы1Уы’ ^4 = Уз\1^Уа\ у
V = УУп + «РУзТ — у\\!2у\\) — Ун + «/31/ 2/ 41, (26)
откуда <1>= 0 для всех значений У]2з 1 ,
Ч>=1,0, если (у31/уи У < 2,0. (27)
Но так как нам требуется решение только для
уъ\!Уа\ < 1>0, то наш 'предыдущий выбор (0,1) утверж­
дается.
Для частного случая уз\ = УА1 в области Уп/уз1>-у>

У2 \!уа\ > \ вышеописанный метод неприменим. В этой


области оптимальная стратегия, определенная при пред­
положении, что могут выбираться только либо 0, либо 1,
была (0,0). Для того чтобы определить последствия
какой-нибудь другой стратегии, разрешим одной из сто­
рон, скажем, Красным, использовать стратегию (0,ф=^=0)
в течение небольшого интервала времени Ы. Тогда
в ионце этого интервала с точностью до членов с Ы
в первой степени
Уи1у32= 1 + 9 ^ > 1 ,
У12/ Уза — 0 (Уи/1/31) Уи/Уп' (28)
1/*»/1/42= [1 — (1 — ?) Щ(Уп/Уп) — ? 5* < Уи1Ун>
и сравнивая рис. 3,в с рис. 3,а, мы видим, что за исклю­
чением начальных точек, лежащих рядом с „ничейной"
границей 2у 22у^2= у \2, результатом этого отклонения Крас­
ных будет более уверенная победа Синих. Вблизи „ни­
чейной" границы Синие выигрывают, если 2г/22г/45> у\2л
С точностью до членов с в первой степени

2УпУ*ш — «4 = 1/41[(2Уи1Уи)— 1 ]> 0, (29)


где <р было взято равным 1,0, так как такое значение ма­
ксимизирует это выражение. Поэтому мы делаем вывод,
143
что для всех точек в области уХ1/уг #21/1/41 ^ у от­
клонения от стратегии (0,0) приводят отклоняющуюся
сторону к потерям.

ПОСЛЕДСТВИЯ ИСПОЛЬЗОВАНИЯ ОДНОЙ СТОРОНОЙ


НЕОПТИМАЛЬНОЙ СТРАТЕГИИ

Обратите внимание на то, что в дифференциальной


игре каждая сторона должна непрерывно следить за
параметрами уи так как ее оптимальная стратегия зави­
сит от этих величин. Так, хотя стратегии (ф,ф) фиксиро­
ваны, поскольку обе стороны играют оптимальным обра­
зом, однако если одна из сторон отклонится от
оптимального поведения и выберет какую-нибудь не­
оптимальную стратегию, то это может завести Уг в ходе
игры в такую область, где противник может быть вы­
нужден также сменить стратегию, чтобы продолжать
игру оптимальным образом. Иначе говоря, ф0р1;=
= Ф(#ь Уг, Уз, Уа) \ фоР4= ф(Уь Уг, Уз, Уа).
Полученные до сих результаты могут быть сформули­
рованы следующим образом.
Заданы хц, *г\, *зь &34, кзг, &а\ и уравнения (3)
и (4); оптимальные тактики и результаты игры опреде­
лены. Результаты показаны на рис. 3. Д алее желатель­
но исследовать «баланс сил» с учетом расхода денежных
средств.

РАСПРЕДЕЛЕНИЕ ФИКСИРОВАННОГО БЮДЖЕТА


Одной из дополнительных альтернатив, имеющихся
у реальных противников в игре описанного в этой статье
типа, может быть начальное распределение фиксирован­
ного бюджета между системами вооружения. Этот выбор
производится перед началом игры. Предполагая, что
игра проводится оптимальным образом, мы ищем ответ
на вопрос, как должна каждая сторона первоначально
распределить выделенный ей бюджет между системами
оружия.
Пусть одна единица системы оружия типа г стоит с*
долларов. Тогда расходы каждой из сторон можно з а ­
писать в следующем виде:
$1 ---^1*^1 $2 ---^2^2 ^4^4 * (30)
144
Требуется определить
$1= С1Х1/$1, / 2==
/.= 1-Л . /4 = 1 - / . -
Дадим определение более общей формы игры: бюджет Си­
них равен $2; он фиксирован и известен обеим сторонам.
Красные стремятся уравновесить свои силы с силами Синих
(способом, который должен быть определен), выбирая
бюджет Далее Красные и Синие одновременно выби­
рают и / 2, определяя таким образом распределение
расходов и $2 между типами систем вооружения. Зна­
чения и / а не обязательно должны быть известны Си­
ним и Красным, соответственно. Затем происходит бой
в соответствии с оптимальными стратегиями (9, <р), опре­
деленными раньше.
Так как результат V можно предсказать при оптималь­
ном выборе (ф, <р) и при заданных (д:п , х 21, х 31, х 41), то
как Синие, так и Красные перед началом игры могут
определить для всех возможных значений (/1Э / 2) такое
значение $х, которое привело бы игру к ничейному резуль­
тату, т, е. к ( / = 0.
Затем Красные выбирают такое значение / 1Э чтобы
минимизировать $х, а Синие выбирают такое значение / 2,
чтобы максимизировать Мы хотим показать, что суще­
ствует решение
= Ш1Пшах (/х, / 2) = т а х ш 1П$1(/1, / 2). (32)
/1 и и Гг
Если оно существует, то Красные выбирают $*.
Выражение, определяющее связь между (у п , у 21, у31,
у41), принимает одну из четырех форм в зависимости от
неравенств г/ц/г/315 ; Уы/Уи^--^-* Мы рассмотрим все
эти случаи в отдельности.
Д ля того чтобы упростить обозначения, мы опустим
второй индекс в символах х 1Х, уп, имея в виду, что речь
идет о начальных значениях.
Вначале рассмотрим область

У*1У*<^2 >
т. е.
^ ^41 Х%!Х4 ^за/^^34* (3 3 )
145
Здесь ф = 1 ,0 , <р= 1,0, и если бой оканчивается вничью,
то
^32^1^3 к^Х^Х^. (^4)
Тогда
($11^)2= [к41с1с3}2(^ — Ш ^ Л М 1 — /Л
и
т т шах (/,, / 2) = шах т т $х(/,, / 2) =

= *1 {-Т ’ -т)=*Л(СгСгки )1(С^ки )]^. (35)

Следовательно, в этой области каждая сторона распреде­


ляет свои расходы между системами вооружения поровну.
Уравнение (35), конечно, подчиняется ограничениям (33),
и поэтому оно справедливо только в том случае, если
^41^1^-2^43^3, ^32^2 ^ 2^ з4^4.
Затем рассмотрим область

Ух/Уз < 4 - ’ у«/у* > 4~ • (Зб)


Здесь ф = 1,0; <р= 0, и если бой заканчивается вничью,
то
2 к ^ х 1х 3= к^х\ , (*1/*,), = [Л41с1с3(1— /2)2]/[2&34|у (1— /,)],
(37)
шга 1йах $ 2(/4, / 2) = шах т т (/„ / 2) = », ( у , /* ) =

= *, [2^41с1с 3/^ 34]1/2/[ с4+ (632с2/2634)], (38)


где /* = &32с2/(&32с2+ 2к34с4), т. е. минимакс лежит на
границе у г/у4= 1 /2 .
Аналогичное выражение может быть получено для
случая у,/г/3 >-?>-, у3/у^<~^-. Было найдено, что мини­
макс лежит на границе г/1/у 3 = -Г -.

Если, наконец, у ^ у г> \ , у3/ у » то для ничьей

Ьзгх г = > ОК/^з)2= (кц/к33) [с3(1 /а)/^4 0 1г))\


(39)
146
ш1п шах $, (/„ / 2) = шах ш1п $, (/„ /,) =$» (/*, }*2 ) =
Л /2 /2 / 1
= $ 2(^41^1 “(- 2Й43Сз)/(^ з2С2 2^34^4), (40)
ГД6 | ^41^1/(^41^1 “1~ 2^4з^з) И ^ 1_~ ^32^2/(^32^2 2^34^4),
т. е. решение находится в точке у г!уъ= , у 2/у ^ -= -^ .
Результаты для всех четырех случаев суммированы
на рис. 4. Распределение бюджета для Синих, опреде­
ляемое отношением /2Я4, зависит только от величины
Й32С2/2&34С4, а для Красных, определяемое отношением
/ 1//3, зависит только от к^\С\[2 к^ъс^
Заметим, <что к32 с2— это скорость, с какой одна еди­
ница системы х 3 уничтожает вложения Синих В систе­
му х2. Поэтому к32 с2 /кз4 С4 есть отношение скоростей,
с которыми система х 3 может уничтожать вложения вси-

Рис. 4. Результаты оптимизации по стоимости.

стему х 2 по сравнению с вложениями в систему Х4 . По


мере возрастания этого отношения, начиная от очень
малой величины, Синие выделяют все возрастающую
долю своего -бюджета — но не больше половины — на
главную систему Х\ .
Если, однако, поддерживающая система очень уязви­
ма (и дорога), то большая часть бюджета, практически
147
почти весь бюджет, расходуется на нее. Это -происходит
потому, что в нашей простой модели только поддержи­
вающее вооружение может наносить урон противнику.
Величина р,, показанная на рис. 4, ра-вна
н. = ($1/$2)2{ к ^ с ^ к ^ с ^ . (41)
Она позволяет подсчитать минимальное отношение бюд­
жетов Красных и Синих, необходимое для обеспечения
равновесия сил. Мьв теперь в состоянии ответить на
следующий вопрос: каким должно быть отношение бюд­
жетов ($1/$2)> чтобы обеспечить ничью, и какая доля
бюджета должна быть выделена на каждый тип воору­
жения, если заданы коэффициенты эффективности &з2>
&41, &34, &43 и стоимости боевых единиц Си с2, с3, с4.

ВЛИЯНИЕ РАССТОЯНИЯ

Теперь мы определим оптимальное расстояние, на ко­


тором следует размещать оружие. Для того чтобы полу­
чить некоторое представление о том, какую функцию
следует применять для изображения зависимости эффек­
тивности поражения от расстояния, рассмотрим характе­
ристики некоторых типичных образцов артиллерийского
и авиационного вооружения. Мы приводим их в Прило­
жении.
Во всех случаях уменьшение расстояния увеличивает
эффективность поражения. Поэтому в случае ситуации,
представленной уравнением (31), когда поддерживаю­
щая система сама не подвергается атаке, оптимальное
расстояние стремится сократиться до нуля.
В дальнейшем мы ограничимся рассмотрением сим­
метричного случая, когда бюджеты и боевые возможно­
сти вооружения обеих сторон одинаковы. Будем искать
такое симметричное решение, при любом малом откло­
нении от которого отклоняющаяся сторона несет потери.
Заметим, что в лучшем случае это требование приводит
к единственной седловой точке в точке симметрии. Во­
прос о том, не могут ли большие отклонения привести
к лучшим стратегиям, должен быть решен рассмотре­
нием -значений переменных во всем диапазоне их изме­
нения.
Рассматривая случай, когда поддерживающая систе-
ма подвергается атаке [уравнение (41)], обозначим
148
1 * = ($ А )4 (42)
и вычислим б 1о 8|х/6 /'3, где г3 есть расстояние от перед­
него края обороны системы х3.
В соответствии с нашим намерением исследовать
только область вблизи точки симметрии, где &32= &41.
^34=^43, С 1 = с 2
и т . д ., мы имеем
6^34/5 г3= : ё ^ 3/8 г 3, (43)
та,к как небольшое изменение расстояния г3 изменяет
эффективность действий системы х% против системы Х4
ровно настолько же, насколько оно изменяет эффектив­
ность действий системы х 4 .против системы х3. Следова­
тельно, 6&.и/6 гз= 0 . Поэтому
щд 102 Н ^2^32/ 34 — О & Ь . , (44)
г бг3
1 2 (^2^32/^4^34)
и поскольку 81о§&/?г3< 0 , то 8 1о§ [х/бг3 > 0.
Однако Красные желают минимизировать эту вели­
чину и поэтому стремятся уменьшить Гз до нуля. Поэто­
му мы приходим к выводу, что для этой модели, в силу
того, что #32 монотонно уменьшается с увеличением г3,
оптимальным значением г3 является нуль. Аналогичные
заключения можно сделать и относительно г4.
Это заключение, однако, не всегда справедливо в не­
симметричном случае.
ВЛИЯНИЕ КОЛИЧЕСТВА И СТОИМОСТИ ВООРУЖЕНИЯ
Рассмотрим теперь проблему определения оптималь­
ного значения 3. Найдем производную от 1о&р, по с4:

В поисках какого-нибудь локального оптимума положим


все параметры одинаковыми в точке решения. Это дает

Ь 1о%[х_ 1 а&43 25 2 сг(^41/^43) с4^| I


= 0. (46)
/г43
2 съ(^41/^43) 4" С4
149
Используй величину У &34, мы придем, наконец, к выра-
жению
1
^ ^4 2 ^ 41/^43) С4 “Ь 2 (^41/^4з)
(47)
йК 634 К/^34
Теперь при оценке численности вооружения отношение
&41/&43 остается почти неизменным, так |Как увеличение
бомбовой нагрузки обычно приводит к возрастанию
эффективности действий против обеих систем х х и л:3.
Поэтому

^К^4з/^4 — У^4 3 | ^ 4 + “У ^2(^41/^4з) |‘ (48)

ОПРЕДЕЛЕНИЕ ЧАСТНЫХ ТИПОВ ВООРУЖЕНИЯ


Принимая во внимание резкое падение эффективно­
сти артиллерийского оружия при возрастании веса для
одной и той же дальности (см. рис. 5) и полагая, что

Рис. 5. Характеристики артиллерии.

стоимость оружия приблизительно пропорциональна его


весу, мы приходим к выводу, что артиллерийское ору­
жие, лучше всего удовлетворяющее требованиям простой
150
ситуации, описанной в настоящей статье, должно быть
ближнего действия, малого калибра и с высокой скоро­
стрельностью.
Для авиационного вооружения, наоборот, бомбовая
нагрузка возрастает с увеличением общего веса. Поэто­
му эффективность должна возрастать почти пропорцио­
нально стоимости (рис. 6). Если
к„ = ас'+*, (49)
где Д очень мало, и
к^/км = ^=соа51, (50)
то выбор С4 в области, определенной уравнением (65) не
имеет почти никаких преимуществ, за исключением
того, что максимум в этой области немного выше. Это

приводит решение к границе области, в которой спра­


ведливо уравнение (4). Подставляя (49) в (48) и пола­
гая б (&43) 1/2/бс4= 0, мы получаем
(51)
с4— 2 Са( с ) ^ + 2Л)-
151
Таким образом, мы отдаем -предпочтение тяжелым само­
летам, но легким артиллерийским орудиям.
Чтобы получить представление о том, какой тип
самолета могут рекомендовать наши простые формулы,
вспомним, что в Корее военно-воздушные силы США на­
несли наземным войскам потери в 150 раз большие, чем
авиации противника. Тогда, согласно уравнению (51),
с±[с2 = 75. Если считать расходы на одного пехотинца
равными 10 000 долларов, то -самолет «оптимальных раз­
меров» должен был бьв стоить 750 000 долларов, что не
так уж сильно отличается от стоимости истребителя-
бомбардировщика того типа, который применялся
в Корее.
Эти далеко идущие обобщения следует, конечно, при­
вести к терминологии основной модели. Предполагалось,
что местоположение всех целей, как главных, так и
второстепенных, всегда известно, так что эффективность
поражения цели ограничена только мощью оружия.
Тогда выбор легкого артиллерийского оружия объяс­
няется тем, -что для типов артиллерии, приведенных
в Приложении, эффективность падает настолько быстро,
а вес возрастает настолько сильно при возрастании
максимального расстояния, что выгоднее иметь большое
количество легкого, скорострельного оружия, используе­
мого с малых расстояний. В действительном бою цели
обнаруживаются не настолько быстро, чтобы можно
было использовать максимальную скорострельность ору­
жия. В этом случае более выгодно использовать дально­
бойную артиллерию, которая, к тому же, позволяет при
меньшем ее количестве перекрывать более широкие
участки фронта. Эти соображения не включены в нашу
модель.
Что касается авиации, то на практике увеличение
вдвое бомбовой нагрузки обычно не приводит к удвое­
нию эффективности, приходящейся на один вылет, опять-
таки из-за трудности отыскания цели.
Кроме того, стоимость всей системы! вооружения не
совсем пропорциональна весу оружия. Эта зависимость
несколько слабее. При оценке стоимости реальной систе­
мы вооружения следует также учитывать эксплуата­
ционные и ремонтные расходы, снабжение и т. д.
Наконец, эффективность «пехотинцев» не включена
в нашу модель. Если эффективность действий поддержц-
152
вающего вооружения против пехоты (приближается
к нулю, то восстановление членов уравнения (1), содер­
жащих к \2 и &21, (приведет к некоторой границе, -ниже
которой никакого поддерживающего вооружения не сле­
дует заказывать.
ПРИЛОЖЕНИЕ

ХАРАКТЕРИСТИКИ ОРУЖИЯ
Чтобы получить основу для определения функцио­
нальной зависимости эффективности вооружения от рас­
стояния и стоимости, изучим некоторые физические х а­
рактеристики артиллерии и авиации при атаке назем­
ных сил.
В приведенной ниже таблице даны характеристики
гаубиц, имеющихся в армии США [7].
Относи­
Вес снаряда

(в ф ут /с е к )

тельная
(в фунтах)

Начальная

Вес Дальность Скоро­ площадь


скорость

Тип с лафетом (в ярдах) стрель­ поражения


(в фунтах) ность на снаряд*

75 -мм М1А1 1 940 18 1 250 9 760 6/мин 1


105-лш М2А1 4 980 33 1 550 12 500 4/мин 1,22
155-лш М1 12 800 95 1850 16 000 2/мин 1,75
8" М1 31 700 200 1 950 ' 18 510 0,5/м и н 2 ,2 4
240-лш 64 525 360 2 300 25 250 1/мин 2 ,7 2

* Относительная площ адь пораж ения на снаряд взята пропор­


циональной V? » как указано в работе [8].

На рис. 5 показана зависимость максимальной даль­


ности от общего веса, а также площадь, поражаемая
в (минуту, в зависимости от дальности, для каждого типа
оружия при максимальной дальности. На меньших рас­
стояниях площадь, поражаемая в минуту, возрастает
вследствие увеличения точности. Кривые зависимости
эффективности от расстояния также приведены на рис. 5.
Для авиационного вооружения мы можем написать, что
“'горюч + “'бомб + “'основы- В ПеРВ0М приближении ГО-
рючее, потребное для полета на расстояние миль, равно
®горюч __ , Я /#* ^ И
- 1_е ~ я?
153
где ^горюч“в е с горючего,
— взлетный вес самолета,
Ях — постоянная для самолетов с одним и тем же
отношением подъемной силы к силе сопро­
тивления, крейсерской скоростью и удельным
потреблением горючего.
Среднее значение отношения ДОосновн/ДОю равно 0,6
(хотя оно занижено для очень малых самолетов). На
рис. 6 мы прежде всего показали зависимость расстоя­
ния ОТ отношения ^полезнЛ^О, З а т е м зависимость ШПолезн
от Я для различных значений Х0ю. Не вся полезная на­
грузка приходится на долю бомбовой нагрузки и горю­
чего. Сюда, например, не входит вес летчика, радио- и
радиолокационного оборудования, бомбоприцела и т. д.
Поэтому мьи нанесли линию минимального веса
в 500 фунтов. Затем мы вычертили зависимость гюю от
расстояния. И, наконец, мы показали зависимость бомбо­
вой нагрузки от расстояния для двух типов самолетов.
Существует предельная бомбовая нагрузка, определяе­
мая ограничениями по объему. Ясно, что чем больше
самолет, тем болъше его возможности в отношении бом­
бовой нагрузки.
При малых и средних расстояниях, однако, бомбовая
нагрузка примерно пропорциональна общему весу само­
лета. Поражение, которое может быть достигнуто по­
средством бомбовой нагрузки данного веса, зависит от
типа оружия на самолете. Если у каждой стороны будет
иметься совершенная информация относительно «распо­
ложения целей, то скорость их поражения одним само­
летом можно считать приблизительно пропорциональной
бомбовой нагрузке, т. е. общему весу, а следовательно
стоимости. Таким образом, авиационное вооружение
существенно отличается от артиллерийского, у которого
скорость поражения уменьшается по мере роста общего
веса.
ЛИТЕРАТУРА
1. К а г 1 у о п С 1 а и з е у м 1 2 . Оп АУаг. Мос1егп ЫЬгагу, Ыечу
Уогк, 1 9 4 3 , р . 2 3 7 .
2. Р 1 е г г е М. О а 1 1 о 1 з. У дЫ ег, з1ошег, скеарег, И АТО ’з П&Ы
з!п к е П^Ыег р г о д г а т т е . 1гйегау1а, 1957, у о 1. X II, р. 893.
3. Н е г Ь е г ! К. АУ е 1 з з. ЕапсЬез1ег4уре тас1е1з о! чуаНаге. Ргос.
Р1гз1 1п1егпа11опа1 СопГ. Орега1юпа1 К ез., Ох1огс1, 5ер1етЬ ег
1957.
154
4. И. К. Р и 1 к е г з о п а п с! 5. М. * 1 о Ь п з о п . А {асИса! а\т & ате.
Орпз. Кез., 1957, у о 1. 5, р. 704— 712.
Д . Р. Ф у л к е р с о н и С. М. Д ж о н с о н . Тактическая воз­
душ ная игра (см. настоящий сборник).
5. X К. I з Ь е 11 а п с! АУ. Н. М а г 1 о чу. МеШоЬз о! та1Ь етаЕ са1
1ас11сз. Ь о^зМ сз Рарегз, № 14, ТЬе О еог^е АУазЫ п^оп Иш уег-
зй у Ь о ^ зИ сз КезеагсЬ Рго|ес1, 5ер1етЪ ег 1956.
6. 3. К. I з Ь е 11 а п с! АУ. Н. М а г 1 о чу. АН гШоп О а т е з . Ыауа1
Кез. Ьо&. С^иаИ., 1956, уо1. 3, р. 71— 94.
Д ж . Р. А й с б е л и У. X. М э р л о у . Игры на уничтож ение
(см. настоящий сборник).
7. ТЬе А г т у А 1тап ас. И. 5. О о у егп ет еп ! Р т Ш гщ ОШсе, 1950.
8. Соп^геззю па1 КесогЬ, 10 Ли1у 1956, р. 12380.
9. Р 1 е г г е М. О а 11 о 1 з. Ы^Ь! з!п к е П^Мегз !ог Ше (1е1епзе о!
Еигоре. 1п1егау1а, 1958, у о 1. X III, р. 38.
10. К и ! и з 3. I з а а с з. ЬЫ егепЕа1 ^ а т е з . ТЬе КАЫО СогрогаНоп,
КМ-1391, КМ-1399, КМ -1411, КМ -1486, 1954, 1955, уо1з. I— IV.
О РАСПРЕДЕЛЕНИИ БЮДЖЕТА
МЕЖДУ РАЗЛИЧНЫМИ ТИПАМИ
ОРУЖИЯ УСТРАШЕНИЯ
Джэймс М . Добби*. Группа оценки операций, М ассачусетс­
ский технологический институт, Александрия, шт. Вирдж иния.

Проблемы распределения ограниченных усилий часто


встречаются в исследовании операций. Одной из самых
первых проблем такого типа явилась задача распреде­
ления ограниченных поисковых возможностей для ма­
ксимизации вероятности обнаружения цели, когда изве­
стна только функция распределения местоположения
цели. Подобная проблема рассматривалась в [1]. Ее
решение может быть найдено непосредственным приме­
нением дифференциального и вариационного исчис­
лений.
Проблема усложняется, если противник может ока­
зать противодействие, зная или не зная распределение
усилий в данный момент. Такие парные игры могут быть
двухсторонними, когда каждый игрок делает ходы, не
зная ходов своего противника, или односторонними,
когда один игрок знает все ходы своего противника.
Наша проблема представляет пример игры последнего
типа [минорантная игра, по обозначению фон Неймана
(см., например, [2], стр. 100)], когда цена этой игры не
равна цене другой (мажорантной) односторонней игры.
Обычно в таких случаях проблема сильно усложняется.
НАШИ ЦЕЛИ И КРИТЕРИЙ ЭФФЕКТИВНОСТИ
Мы желаем распределить определенные усилия
(в условиях холодной войны это будут, вероятнее всего,
доллары) между различными системами устрашения для
того, чтобы предотвратить новую всеобщую войну.
* 1 а т е з М. Б о Ь Ь 1 е. Оп Ше аИосаПоп оГ е!Гог* а т о п ^ 6е-
1еггеп1 вуз1ешз. О регаИопз КезеагсЬ, 1959, уо1. 7, р. 335— 346.
156
Вообще говоря, наша цель состоит в том, чтобы удер­
жать противника от развязывания всеобщей войньи.
Трудно установить, какие факторы важны для дости­
жения этой цели и в какой степени они способствуют
предотвращению войны. Чтобы избежать дальнейших
споров по этому широко обсуждавшемуся вопросу, мы
предположим, что самым существенным фактором
является наша способность нанести ответный удар в слу­
чае, если .противник развяжет войну. Поэтому -наша цель
состоит в максимизации нашей способности к ответному
удару.
Поскольку дело касается наших сил устрашения,
цель противника будет заключаться в минимизации на­
шей способности к ответному удару посредством выделе­
ния части своего начального удара (или всего удара)
для действий по системам устрашения. Эту часть на­
чального удара обычно называют упреждающим ударом
(ЫипИп§ еЦоН). Мы будем предполагать, что противник
может распределить этот упреждающий удар по нашим
системам устрашения, имея ограниченные средства и
обладая полной информацией относительно нашего рас­
пределения усилий между этими системами.
Для любого заданного распределения наших усилий
между различными системами устрашения противник
будет стараться так распределить свой упреждающий
удар, чтобы минимизировать способность к ответному
удару, сохраняющуюся после упреждающего удара. Сле­
довательно, самое лучшее, что мы можем сделать, это
распределить наши усилия по устрашению так, чтобы
максимизировать этот минимум. Таким образом, наша
задача состоит в определении минимаксного решения,
в то время как задача противника сводится к простой
минимизации.
До сих пор ничего не ‘ было сказано относительно
влияния времени на нашу проблему. Совершенно оче­
видно, что все соревнующиеся альтернативы будут ме­
няться с течением времени. Кроме того, величины пара­
метров, характеризующих возможности систем, будут
также меняться со временем. Следовательно, необходимо
выделить один или несколько моментов времени, пред­
ставляющих интерес, и ограничить рассмотрение теми
альтернативами с соответствующими значениями пара­
метров, которые в это время доступны для анализа.
157
Следует понять, что мы не пытаемся достичь абсолютно­
го максимума нашей способности к ответному удару для
этого момента времени, так как в другой момент време­
ни такое решение может, вероятно, дать недопустимо
низкое значение этой способности. Как функция времени
наша политика распределения должна стремиться к ма­
ксимизации минимальной способности 'к ответному уда­
ру. Другой фактор, который следует принять по внима­
ние, это время, потребное для восстановления
способности к ответному удару при появлении какой-
нибудь новой системы. Предварительное определение
такого времени затруднено ошибками в определении вре­
мени создания новых систем и их стоимости.
Чтобы избежать некоторых из только что рассмотрен­
ных нами трудностей или, хотя бы, создать иллюзию
этого, мы ограничим наш анализ двумя новыми система­
ми, действующими в достаточно отдаленном будущем,
когда существующие в настоящее время системы можно
будет считать неэффективными. Этими двумя системами
являются система ракет с неподвижными стартовыми
позициями, такая, как система «Титан», и система ракет
меньшей дальности, но с подвижными стартовыми пози­
циями, такая, как система «Поларис», базирующаяся на
подводных лодках. Тем не менее, наша модель пригодна
для сравнения любых других неподвижных и подвижных
систем.
Существенное различие между двумя системами со­
стоит п том, что подвижность и скрытность способ­
ствуют лучшей защите боеготовой развернутой части
подвижной системы против упреждающего удара, так
как противник должен сначала обнаружить эти боевике
единицы. С другой стороны, месторасположение боль­
шей части наших боевых единиц, расположенных на не­
подвижных базах, вероятно, будет известно нашему про­
тивнику.
Мы предполагаем, что к противнику будет поступать
информация о расположении наших постоянных баз по
разведывательным каналам. Затраты на получение этой
информации не повлияют на эффективность упреждаю­
щего удара, так как масштабы разведывательной дея­
тельности, вероятно, мало бы изменились, если бьи такой
системы вообще не существовало. Мы предполагаем
также, что непосредственно перед упреждающим ударом
158
не производится никакой разведки для выявления допол­
нительных подразделений этой системы.
С другой стороны, мы предполагаем, что в любое
время часть подвижной системы развернута таким обра­
зом, что прежде, чем она может быть успешно атакова­
на, должны быть приложены значительные усилия для
обнаружения, сопровождения и локализации этих под­
разделений. Эти усилия полностью направлены на
снижение эффективности упреждающего удара против­
ника. Предполагается, что месторасположение неразвер­
нутых единиц известно противнику, хотя предположение
о том, что часть этих сил не удалось обнаружить, ни­
сколько не усложняет математические выкладки.
В целях удобства мы будем н дальнейшем считать
систему с неподвижной базой наземной системой, а си­
стему с подвижной базой — морской системой. Для обо­
значения параметров наземной системы мы будем поль­
зоваться индексом /, а морской системы!— индексом 5 .
Введем следующие обозначения:
Ь — число позиций (или баз) типа / (или 5),
п — число ракет на каждой базе,
к — огневая мощь ракеты*,
с — стоимость базы,
/ — часть наземных баз, обнаруженных против­
ником заблаговременно,
й — часть подразделений морского базирования,
развернутая на море,
г — число экипажей самолетов, выделенных для
поиска и атаки подразделений, развернутых
на морских базах,
и — число ракет противника, действующих против
подразделений наземного базирования или
против неразвернутых морских подразделений,

* Вы раж ается с помощью какой-нибудь удобной единицы р а з­


рушения, такой, как площ адь городской застройки, разруш енная до
данного уровня разруш ения или х уж е. Это позволяет учитывать
различные боевые головки, точность, надеж ность и т. д. Очевидно,
что И. долж на уменьшаться с увеличением Ьп для того, чтобы ском­
пенсировать уменьшение досягаемости подходящ их целей и дубли ­
рование разруш ения. С другой стороны, влияние возрастания р а з­
рушения на промышленное производство и на моральное состояние
населения возрастает, вероятно, значительно быстрее, чем физиче­
ское разруш ение.
159
ехр (— к , ) — вероятность того, что наземная база уцелеет
после запуска по ней одной ракеты (в случае
индекса 5 имеются в виду неразвернутые под­
разделения морского базирования),
ехр (— кг) — вероятность того, что развернутое подразде­
ление морского базирования не будет обна-
ружено одним экипажем самолета, выделен­
ного для этой цели,
§ — вероятность того, что развернутое подразде­
ление морского базирования уцелеет после
того, как оно будет обнаружено,
В0 — общий бюджет, выделенный на наземные
базы и подразделения морского базирования,
Ц0— общие усилия противника, выраженные в экви-,
валентных ракетах.
Тогда ожидаемое число наших боеспособных подраз­
делений, уцелевших после упреждающей атаки, равно
приблизительно*

Ы= Ь1п1Н1[ ( 1 - П + 1<Гк1“1ПЬ‘]+
+ ^ Л К 1 - 4 ) е~кз'1з1('~а)Ьз + </е~г*г+ с1§(\-е~гк% (1)
Наши суммарные затраты и суммарные усилия про­
тивника можно записать в следующей форме:
В 0= Ь1с1+ Ьвса, (2)

^0 = И/ + Ы4+ аГ> (3)


где а — отношение стоимости одного экипажа самолета,
выделенного для обнаружения и атаки подразделений
морского базирования, к стоимости одной ракеты, исполь­
зуемой против наземной базы.
Нормализуем выражения (2) и (3), полагая
V/ __ ^8С3 Ио8
У2 ~й >
к

к
II

* = -зг* ■** Щ
* Если по одной базе выпущено две и более ракет, то вероят­
ность сохранения базы равна произведению частных вероятностей
сохранения. При этом мы подразумеваем, что ошибки некоррелиро-
ваны (а на самом деле некоторые из них скоррелированы) и что
ущерб не накапливается, что не совсем так. Однако для наших
целей такое допущение возможно.
160
Тогда уравнения (1), (2) и (3) примут следующий вид:
N = а'у1+ Ь'у2+ ау1е~а*1,у,-{- Ьу2е~9'ч1у*+ су2е~^х‘, (4)
У\ “Ь У2— 1* (5)

х 1-\- х 2- \- х 3= 1 ( 6)
где коэффициенты а', Ь', а, Ь, с, а, р, у могут быть легко
выраженье черев первоначальные параметры. Величины
Хи х2, х3 суть те части упреждающего удара противника,
которые направлены против подразделений наземного
базирования, неразвернутых подразделений морского ба­
зирования и развернутых подразделений морского бази­
рования. Величины у\ и у 2 суть части нашего бюджета,
выделенные на системы наземного базирования и систе­
мы морского базирования.
Мы будем предполагать, что противник делает свой
выбор (х) = (*1, х2, х3) после нашего выбора (у) =
= (у\,у2), имея полную информацию относительно наше­
го выбора*. Будем также предполагать, что цель против­
ника— минимизировать N. У нас же имеются две разум­
ные цели. Первой целью является максимизация N при
ограничениях, налагаемых фиксированным бюджетом и
вышеупомянутым предположением о том, что противни­
ку известен наш выбор. Вторая цель — минимизировать
общую стоимость затрат, необходимых для получения
заданных минимальных сил, уцелевших после упреж­
дающей атаки. Были рассмотрены обе формулировки и
между решениями (у) для заданной группы параметров
не оказалось существенной разницы. Мы рассмотрим
только решение, связанное с первой целью.

РЕШЕНИЕ ПРОБЛЕМЫ
При любом выборе (у) противник сделает свой вы­
бор (х ) так, чтобы минимизировать N. Самое лучшее,
что мы можем сделать, это произвести наш выбор (у )
так, чтобы максимизировать этот минимум. Следова­
тельно, наша задача состоит в решении игры с макси-
минным результатом, в то время как перед противником
* Выборы ограничены дискретными числами. Если решение по­
лучено в результате непрерывных вариаций, следует брать дискрет­
ные значения вблизи полученных решений.
161
стоит просто задача минимизации. При принятых нами
предположениях минимаксная игра не может быть при­
менена. Интересно, однако, отметить, что минимаксная
игра легко решается. К несчастью, функция N не имеет
седловой точки, и минимаксное решение не может быть
использовано для определения максиминного решения.
При заданном выборе (у) мьи сначала сделаем такой
выбор (х), чтобы минимизировать N. Как показано
в Приложении, выборы (х) лежат в области, ограничен­
ной треугольником, изображенным на рис. 1. Минималь-

(0,1,°)
/2
Рис. 1. Треугольная область решений.

ное значение N может иметь место на одной из вершин,


на одной из сторон или же внутри треугольника. Точки,
в которых имеет место минимум, зависят от величины
параметров, и от конкретного выбора (у). Минимальное
значение N есть функция выбора (\у), но эта функция
зависит от точки треугольника, в которой имеет место
минимум. Имеется семь функций, соответствующих трем
вершинам, трем сторонам и внутренней части треуголь­
ника.
Пусть одна из переменных уи например #2, изменяет­
ся от 0 до 1 при заданных значениях параметров, как
показано на рис. 2. Для любого значения У2 может быть
использована одна и только одна из семи функций.
Используемая функция будет изменяться при измене­
нии у2- Таким образом, интервал 0 < у 2< 1 можно раз­
бить на такие подынтервалы, чтобы на каждом из них
было минимальное значение N. определяемое одной из
162
семи функций. В результате мы будем поставлены перед
проблемой определения максимума составной функции
на всем интервале.

Рис. 2. График функции т т Ы для опреде-


X
ления максимального решения.

В Приложении -показывается, что аналитически ре­


шить эту проблему очень трудно. Как обычно принято
в таких случаях, мы должны обратиться к быстродей­
ствующей вычислительной машине.

ОСОБЫЙ СЛУЧАЙ

Иллюстрацией нашего метода может служить особый


случай, который легко поддается изучению и который
имеет место, если (предположить, что неразвернутые под­
разделения морского базирования будут эффективно по­
ражены при атаках противника, не направленных спе­
циально против этих подразделений. Если мы исключим
из выражения для N член, содержащий х 2, заменим *з
на 1—х \, а #2 на 1—у\, то N можно представить в виде
функции двух переменных х\ и у\. Тогда мы должны
рассматривать поверхность, определяемую этим уравне­
нием, в пространстве (хх, у1У Ы) в пределах квадрата
О< < 1, 0 < # х< 1 , т. е. мы имеем
N = Ь'-\-{а' — Ь') у х + а у ^Т * '1»' + с (1 - ух)
Если # 1= 0, то минимальное значение N. очевидно, полу­
чается при Х\ =0. По мере увеличения у\ минимальное
163
значение N будет по-прежнему три Х1=0 для некоторых
значений параметров, при условии, что у\ не принимает
слишком больших значений. Для #1 = 1 минимум, оче­
видно, имеет место при х \= \. Для значений у\, немного
меньших единицы, минимум по-прежнему будет при
лг1 = 1. Д ля средних значений у\ минимальное значение N
будет иметь место при некоторый значениях Х\ между О
и 1. Эти значения х\ и само минимальное значение N
будут зависеть от у\.
Совершенно очевидно, что N есть выпуклая функция
от х\. Поэтому минимальное значение N будет иметь ме­
сто при *1=0, если производная от N по х х будет в этой
точке положительной. Точно также минимум будет иметь
место при Х]=1, если производная будет в той же точ­
ке отрицательной. Если не соблюдается ни одно из этих
условий, то минимум имеет место при значении х\ меж­
ду 0 и 1.
Удобно ввести следующие обозначения:
А = аа, С = Г(, А' — Ае~а, С’= Се~т.
Тогда условия и минимальные значения N можно све­
сти в следующую таблицу:
Таблица

Минимум
Случай при (*„ *з) Условия Минимальное значение N

1 (0, 1) А С С'у2 и = а'у 2 + Ь'Уг + ауг + су 2 ^

С’У 2< А , = а'у2 + Ь 'у г + ( - 7 -+


2 (*1, 4) Ае~а^< С у2
1
X [Ау'1а (С 'у1)1/1[]

3 О , 0) Су2 < Ае~а/У' }г = а'у, + Ь'у2 + ау1е~а1",А- суг

Следовательно,

• 4 — #1 | \ + ] / ( а _ Ь Т # » ) > х °з — Х °1 •

■ Очевидно, что случая 1 не будет, если А больше С’.


Если А<^С', то максимальным значением функции /, на
ее интервале является наибольшее из двух значений на
164
концах, т. е. при 2/1 = 0 и г/, = 1 — ^ . Аналогично, мак­
симум функции / 3 на своем интервале будет равен наиболь­
шему из двух концевых значений, так как / 3 есть вы­
пуклая функция от у\. Верхнее концевое значение равно
2/1 = 1. Нижнее концевое значение получается в резуль­
тате решения уравнения
а
С ( 1 - У1) = А е ~ 7\ (7)
Таковы участки функций ^ и /3.
Функция /2 применяется для значений у\ между
1 — ^7 (или 0, если это выражение отрицательно) и ре­
шением уравнения (7). Аналитическое решение здесь за­
труднительно. Практически максимум определялся 'при­
ближенно 'путем вычисления на интервалах внутри
•применяемого диапазона и выбором'максимального ре­
зультата. Наконец, максиминное значение N определя­
лось выбором максимального значения функций Ь
и |з в пределах диапазонов их применения.

РЕЗУЛЬТАТЫ
Были произведены вычисления решений (у\, у 2) бо­
лее чем для 2000 различных комбинаций параметров.
Для некоторых комбинаций параметров было получено
решение (1,0), т. е. рекомендовалось весь бюджет израс­
ходовать на наземные базы. Для некоторых же комби­
наций получалось решение (0,1), т. е. рекомендовалось
весь бюджет выделить на ракеты, устанавливаемые на
подводных лодках. И, наконец, в некоторых случаях
решение было смешанным *.
Выбор параметров производился посредством предва­
рительной оценки значения каждого параметра для
интересующего нас времени. Она основана в свою оче­
редь на оценке наших возможностей в данный момент,

* Не следует путать смешанное решение со «смешанной страте­


гией». Стратегией называется пара чисел ( у и У г ) , удовлетворяющих
условиям у\, У2^0, У\Л-у2 ~ 1• Поэтому решение (0,3; 0,7) является
точно такой же чистой стратегией, как решение (0,1), но оно являет­
ся смешанным решением в том смысле, что оно касается обеих
систем.
165
на разведывательных данных о возможностях противни­
ка и на оценке их возможных изменений в будущем
После этого выбирались значения 'по обе стороны от этих
оценочных значений, чтобы учесть возможные отклоне­
ния и колебания.
Влияние некоторых из этих параметров показано на
графиках рис. 3 и 4. Значения параметров, не указанных

Рис. 3. Влияние эффективности поиска.


Сплошными линиями показана часть сил у 2, бази­
рующаяся на подводных лодках; пунктирными ли­
ниями показаны остающиеся силы.

на графиках, взяты такие, которые являются оптималь­


ными для рассматриваемого периода времени. На рис. 3
оплошными линиями обозначены кривые зависимости ча­
сти у 2 , т. е. сил, базирующихся на подводных лодках,
в решении максиминной задачи. Пунктирными линиями
обозначены! кривые зависимости общего остаточного по­
тенциала устрашения после упреждающего удара про­
тивника. Верхние кривые соответствуют случаю, когда
166
й = 21г (чась развернутых боевых единиц, базирующихся
на подводных лодках), а нижние кривые — случаю,
когда й= 7г. Из этих кривых видно, что эффективность
поиска вражеской авиацией боевых единиц, развернутых
на подводных лодках, оказывает большое влияние на
решение и 'значительно меньшее влияние на результат.

Эффективность поиска на один самолет противника,^


Рис. 4. Влияние различных параметров.

На рис. 4 показано влияние отношения стоимости ра­


кет к вероятности непоражения наземных баз. Там, где
около одной кривой нанесены две или более групп значе­
ний параметров, это означает, что кривые проходят
очень близко друг к другу, и чтобьи их не перепутать,
они все объединены в одну кривую,
ПРИЛОЖЕНИЕ
РЕШЕНИЕ МАКСИМИННОИ ЗАДАЧИ
Обозначим через х и х2, х$ части упреждающего уда­
ра противника, направленные против наших наземных
баз, морских неразвернутых боевых единиц и морских
167
развернутых боевых единиц, соответственно. Обозначим
через у\ и у2 части нашего бюджета, выделенные на ра­
кеты «земля — земля» и на ракеты «подводная лодка —
земля», соответственно. Тогда математическое ожидание
ракет, уцелевших после упреждающего удара при усло­
виях, перечисленных в статье, будет приблизительно
равно *
N = а'у , + Ь'у2 + аУх <Гах',у'+ Ь у 2 е ~ ^ 1у‘ + с у ^ х\ (8)

Будем сокращенно записывать это выражение как N (х , у ).


Если мы предположим, что противник делает свой вы­
бор (х) = (хг, х 2, х 3) после нашего выбора (у) = (уг, у2)
и знает этот наш выбор, то мы можем вместо N рассмат­
ривать N (х°, у ), где (л;0) = (л^ , х °2 , лф есть множе­
ство значений х , которое минимизирует N для нашего вы­
бора (у ). Если наша цель состоит в максимизации значе­
ния //, то самое лучшее, чего мы можем достичь, это
значения V = т а х пип N (х, у).
у X
Задача заключается в том, чтобы определить такой
наилучший выбор (у ), при ограничениях
х .> 0 , 2 Ц = 1 ( /= 1 ,2 ,3 ) , (9)
У,> О, Щ = \ ( / = 1 , 2). (10)
Сначала рассмотрим N как функцию от х\, Хъ, х%
и запишем его в следующем виде:
N = 6 - \- Н е~1гх' + / е - '**+ К е~кх>. (11)
Значения букв могут быть получены из сравнения вы­
ражений (И ) и (8). Мы желаем найти минимальное
значение// при ограничениях (9).
Здесь мы можем заменить хз разностью (1—Х\—х2)
в выражении для /V, а условия (9) заменить условиями
х » х 2>0; ^ + ^ < 1 . (12)
* Производная от третьего члена не может быть использована,
если 1/1=0, так как она начинается со значения ^ вероятности, что
наша наземная позиция уцелеет от одной ракеты противника. В этом
случае третий член должен быть приравнен нулю. Точно так же
четвертый член должен быть приравнен нулю, если #2=0. Хотя эти
члены стремятся к соответствующим пределам, некоторые производ­
ные в этих предельных случаях не будут иметь физического смысла.
168
Тогда Ы=Р(х 1, х2) будет уравнением поверхности
в трехмерном пространстве, и мы должны определить
его минимальное значение в пределах треугольника,
заданного уравнениями (12). Однако проще отказаться
от такого пространственного представления и рассмат­
ривать N как функцию трех переменных (Х\, х2у х3)
в пределах треугольника с вершинами (1, 0, 0), (0, 1, 0)
и (0, 0, 1).
Имеется юемь различных форм функции минимума
в зависимости от того, в какой точке имеет место ми­
нимум — на одной из трех вершин, на одной из трех
сторон или внутри треугольника. Ограничениями для
этих семи случаев будут неравенства, связывающие Я,
к и т. д., которые становятся неравенствами на (уи Уг)-
Таким образом, интервал от {уь #2) = (1,0) до (0,1) мо­
жет быть разбит на участки так, что к каждому из них
будет применима одна из семи функций. Максимум
функций пип N для всего интервала можно найти, если
определить максимумы для каждого участка, а затем
выбрать наибольший из них.
Так как N есть сумма простых отрицательных экспо­
ненциальных функций, причем каждая из них является
функцией одной переменной, то, очевидно, что N — вы­
пуклая функция. Поэтому локальный минимум будет
минимумом для всей интересующей нас области. Для
того чтобы точка была локальным минимумом, необхо­
димо, чтобы направленные производные во всех возмож­
ных направлениях были либо положительны, либо рав­
ны нулю.
Направленная производная в точке (х \, х2у *з)
в направлении, заданном направляющими косинусами
(Я, р,, о) будет равна

^ = —ХНН (ГНх‘ — е~1Х’ — ^Кк е~кх‘ .

В точке (1, 0, 0) направленная производная в направлении


(О, и2, и8), где иа + я 3= 1, будет равна
йЫ____ Нк оГн — ц2/ / — игКк
^8 1^1 + и2 + и\
Мы накладываем условие, чтобы она была неотрица­
тельной для всех значений (и2, и3) у так что и2+ и3= \ у

и2> 0, и3>0. Это справедливо тогда и только тогда, ког^
да
НН€~~н> шах (У/, К к),
или, выражая через ^ и //2,

Ае~х1!/'>тах(В, Су2), (13)

где А = аа, В = Ь§, С = с у .


Если Ле~“< 5 , то никакое значение (уи у2) не мо­
жет удовлетворить условию (13). В этом случае мы
должны заменить условие (13) особым значением г/2= 0,
для которого минимальное значение N имеет место всег­
да при (1, 0, 0). Трудность заключается в том, что, как
указывалось в примечании к выражению (8), в этом
случае третий член выражения (11) должен быть опу­
щен, и это отразится на правой части условия (13).
Если это сделано, то условие (13) удовлетворяется при*
у 2 = 0. Следовательно, выборы (уи У2 ), которые дают ми­
нимум при выборе (хь х2у Хз) = (\у 0, 0), состоят изу2= 0,
у 1=1 и значений, удовлетворяющих условию (13).
Для у2= 0 минимальное значение N равно а' + ае~а
Для других значений, удовлетворяющих условию (13),
функция будет иметь вид

} = Ы (1, 0, $) — а'у1^ ( Ь гАг Ь-\г с)у2Аг ау1е а1у\


Заменим у 2 на 1 — у х\ следовательно, }1= Р(у1). Тогда
__ аа2еГа/У1
Лу\ у\
Следовательно, Р (уг) — выпуклая функция. Поскольку
мы ищем максимум функции Р, то достаточно проверить кон­
цевые точки. Этими точками являются точка ^ = 1 и ре­
шение уравнения, полученного из неравенства (13). Если
правая сторона выражения (13) равна В , что обычно имеет
место, и А е Г а> В (условие для решения, удовлетворяю­
щего граничным условиям), то решение будет
_0 «
— 1п {А/ ву
т
Таблица 2
Сводная таблица минимальных условий и функций

Случай Минимум Условия Минимум N

у 2 = 0 плюс решения уравнения Га' + ле“"а , если у 2 = 0


1 (1 , 0 , 0) Ае~~а/У1 ^ ш ах (В, С у {) / , = \ (а! + а е - а/-"’) у , + (*' + Ь + с) у 2,
[если у 2 ф ®

2 (0 , 1 , 0) ш ах (Л , Су2) Ь = Ф' + а ) у г + (Ь ' + с + Ь еГ&у*) у 2

3 (0 , 0, 1) 0 / г е~ т ^ ш ах (А >В) }3 = ( а ' + а ) у 1 + (Ь' + Ь + с е ~ ’1 ) у г

В<Г®у* < С у г < В & / 4 = (а' + а) у х + Ь'у2 + X


4* (0 , 4) ( В \й /р ( С у 2 \1/Т 1
и ) ( - х ) 5*
у а ^ Н с у ^ - л у,19+1п

=< Сг/2 < Л ет $5 = а!у3 + Ф' + Ь)уг + х


5* о. 4 ') ( А \У‘1*(Су2 у /7 1
1 V« у V * У >е Х М у‘/“ (Сг/2)1/Т е - - ] л /а + 1 /т
* Координаты минимумов:

СмгМ*'И '+"ж) /(*■+>)■'»* (Ё+“т"-)/(Ё +Ф


Продолжение т абл. 2

Случай Минимум Условия Минимум N

и = я'Л + (Ь '+ С) у г + (-V + X


6* ( С у 2 \ У г 1 * ( С у г \У11$
*г. °) [ а ) ( * ; < е 1
X [А У1/аВ у ^ е - ^

(4 Г (^ Г < -
и = а 'У 1 + Ь'У 2 + ( т ‘+ У" + -у ) х
7* (*?. 1
X [ А ^ В ’^ С у ^ ' Ч - ' ) у ‘ 1а + у ^ + >/т

* Координаты минимумов:
Тогда можно вычислить величину Р{у\) и сравнить ее
с ,Р (1 )= = а '-|-# е~а- Само собой разумеется, что если
Р(0) = Ь' + Ь + с < Р (1 ),
то .Р(1) является максимумом для всего интервала
0< у 1 < 1, и нет никакой необходимости вычислять г/10
или величину Р (у 1 °).
На этом заканчивается анализ вершины (1,0,0).
Анализ двух других вершин аналогичен. Для стороны,
на которой Х\ —0, мы найдем минимум N согласно выра­
жению ( 1 1 ), если положим Х1=0 в точке
1п ( Л1Кке- к) . >_ 1п (АГЙ/У/ е~')
Х2— }+ к ’ Х3 ~ /+ 6 (14)

Таблица 3
Необходимые условия

Случай Условия*

1 В<А'
2 А<Ь' и С < В'
3 А < С и В С С
4 А< В и А< С
5 в < а и в е с
6 Простых условий не сущ ествует,
обычно получаемый случай
7 Простых условий не сущ ествует

* А' — Ле а; В' = Ве~$; С ' = Се“ Т .

Величины х 2 и х ъ в сумме дают 1, так что условия (9)


будут удовлетворены, если две величины под знаками ло­
гарифмов в выражениях (14) не меньше единицы. Если
перейти к переменным у, то это условие примет вид

В е- ^* < Су, < Вет. (15)

Теперь вычислим направленную производную в точке


(0, х 2 , х г) в общем направлении внутрь. Условие не­
отрицательности этих производных сводится к условию
173
(Ё/А)у*1* (Су2/А)^1^>е. Соответствующая функций Мини­
мума будет
1
{а *Л~а)У1 ~\гЬу2 + (^/2/^ + 1/у)[5^2/р (Су2),/Те 1]Уш1* /т .
(16)
Теперь надо решить задачу определения пары (у{, у2),
которая максимизировала бы /4 при соблюдении трех
неравенств.
Условия того, что минимум будет иметь место на
двух других сторонах, а также соответствующая функ­
ция минимума могут быть получены таким же образом.
Условие того, что минимум будет в какой-нибудь внут­
ренней точке, состоит в том, чтобы направленная про­
изводная в этой точке была неотрицательной во всех
направлениях.
Эти условия и функции минимума для всех семи
случаев сведены в табл. 2. Для первых трех случаев мо­
жет быть определено максимальное значение функции
минимума в соответствующем диапазоне решений (уи
У2 )• Метод аналогичен методу, рассмотренному выше
для случая 1. Для последних четырех случаев, однако,
аналитическое решение не может быть найдено. При
этом следует рекомендовать использование вычислитель­
ной техники.
Для любого у 2 в интервале 0 < г /2< 1 применима одна
из семи групп условий. При изменении у2 от 0 до 1 нам
желательно выбрать подходящий случай, вычислить зна­
чения соответствующих функций минимума, я затем вы­
брать максимум этих значений на всем интервале. На
практике у 2 может принимать форму дискретною мно­
жества равномерно распределенных точек.
При у 2 —0 минимальное значение равно а '+ а е “~а.
Для малых значений у2 применимы случаи /, 5 или 6.
В середине интервала обычно применим случай 7. Для
значений у2, близких к /, применимы случаи 2, 3, 4. Для
некоторых комбинаций параметров могут быть исполь­
зованы только некоторые из этих случаев.
Для того чтобы решить, какие случаи следует иссле­
довать для данной комбинации параметров, полезно
использовать простую сводку необходимых условий.
Если условия не удовлетворяются, это значит, что не
существует таких значений у 2, для которых применим
174
данный случай. Эти условия приведены в табл. 3 и мо­
гут быть легко получены из табл. 2. Необходимые усло­
вия для первых трех случаев очевидны. Чтобы получить
условия для случая 4 , следует неравенство Су2 < 5 е т
подставить в последнее неравенство случая 4 в табл. 2.
Тогда левая часть будет меньше или равна е (.В/А )(^ }+ (1/7)-
Но при В<1А она должна быть меньше, чем е. Следова-
тельно, чтобы получить случай 4 , необходимо, чтобы В^> А-
Другие неравенства в случаях 4 и 5 получаются таким же
способом.

ЛИТЕРАТУРА

1. В. О. К о о р т а п . ТЬе Шеогу о! зеагсЬ, III. ТЬе о р М т и т


сПз1пЬииоп оГ зеагсЫп^ еЛог!. ОрегаИопз РезеагсЬ, 1957, уо1. 5,
р. 613— 626.
2 Л . у о п К е и ш а п п а п с ! О. М о г ^ е п з 1 е г п . ТЬеогу оГ Оа-
ш ез апс! Есопогшс ВеЬаую г. Р ппсе1оп Уш уегзЦ у Р гезз, 1953.
Р А З Д Е Л ТРЕТИЙ

НЕДОСТАТОЧНОСТЬ СТОИМОСТИ ПОРАЖЕНИЯ


ЦЕЛИ В КАЧЕСТВЕ КРИТЕРИЯ ЭФФЕКТИВНОСТИ
Джон Э. Уолш*. Л окхи д Эркрафт Корпорейш н, Бэрбанк,
шт. Калифорния

Стоимость уничтожения противника является обще­


принятым критерием относительной ценности различных
соревнующихся элементов системы обороны. Если эле­
менты системы обороны применяются так, что они не
влияют друг (на друга, то этот критерий оказывается
достаточным для многих ситуаций. Если, однако, имеет­
ся взаимодействие между элементами системы обороны,
то сравнение, основанное на этом критерии, получаю­
щемся не из рассмотрения всей системы обороны в це­
лом, может привести к неправильным выводам. В на­
стоящей статье приведен анализ, показывающий, что по­
добные положения часто встречаются. Для проведения
такого анализа была разработана несколько упрощен­
ная математическая модель, описывающая действия
и результаты атаки противника на систему обороны. М а­
тематическая модель позволяет производить частично
аналитическое изучение умеренно сложных ситуаций
и может оказаться полезной во многих областях работ
по исследованию операций в военном деле.
В настоящей статье не рассматривается вопрос
о критериях эффективности вообще. В ней изучается
только один критерий 'эффективности, часто применяе­
мый при выборе оптимальных систем вооружения для
обороны. Этот критерий эффективности основан на ис­
пользовании минимальной стоимости поражения цели,
определяемой без учета взаимодействия элементов всей
системы обороны в целом.
* , 1 о Ь п Е. Ш а 1 з Ь. 1 п а с ^ и а с у о! соз! рег „кПГ аз ш еазиге
оГ еЙесПуепезз. О регаПопз ЦезеагсЬ, 1 9 5 7 , у о 1. 5, р. 750— 764.
176
Сложность проблемы оценки какой-нибудь закон­
ченной военной системы обороны почти всегда огромна.
Трудности возрастают, если учесть возможность приме­
нения противником различных типов атак, с одной сторо­
ны, и возможность изменять оборонительную группиров­
ку, с другой стороны. В результате этого существует
тенденция, выбирая элементы и их относительную чис­
ленность при создании системы обороны, игнорировать
рассмотрение системы в целом. Использование указан­
ного критерия для сравнения относительной ценности
возможных элементов обороны без учета свойств всей
системы в целом представляет собой определенный ком­
промисс. Применение такого критерия часто оправдывают,
утверждая, что при этом получается небольшая потеря
точности по сравнению с методом рассмотрения системы
в целом. В статье показано, что для многих типов ситуа­
ций эта потеря в действительности может быть большой.
Слово «поражение» используется нами в общем смысле
как уничтожение или как отражение вражеской атаки и
может применяться к кораблям, самолетам, танкам
и т. д.
Рассмотрим упрощенную математическую модель,
которая использована для представления действий и ре­
зультатов вражеских атак против системы обороны.
В ней группа объектов обороняется от атак против­
ника. Чтобы достичь этих объектов, противник должен
пройти последовательно через несколько оборонитель­
ных секторов. Размер ущерба, наносимого объектам, за­
висит от величины потенциала разрушения, который со­
хранится у противника после прохождения всех сек­
торов, т. е. предполагается, что противник следует по
одному маршруту, проходящему через несколько отдель­
ных зон (или секторов) обороны и заканчивающемуся
у группы объектов.
Результат действий противника определяется величи­
ной потенциала разрушения, который сохранится у него
после прохождения всех секторов обороны. Противник
старается выбрать такую стратегию, которая максими­
зировала бы эту величину, в то время как оборона стре­
мится выбрать такую стратегию, которая минимизи­
ровала бы ее: Таким образом, рассматриваемая ситуация
представляет собой игру с двумя игроками и с нулевой
суммой, причем оборона должна выбрать свою страте­
177
гию первой. Зная оборонительную стратегию, противник
выбирает свою стратегию. В настоящей статье слово
«стратегия» используется в том смысле, в котором оно
применяется в теории игр, ,а не в военном деле, Пред­
лагаемый анализ пригоден для различных соотношений
сил атакующего противника и обороны. Тем не менее
метод, применяемый для оценки результатов, более при­
годен для случаев, когда силы обеих сторон примерно
одинаковы или когда оборона сильнее атакующего про­
тивника.
Противник обладает некоторым фиксированным чис­
лом единиц нападения (например, бомбардировщиков)
нескольких различных типов. Некоторые типы атак вы­
полняются единицами, не обладающими потенциалом
разрушения и используемыми для понижения эффектив­
ности (подавления) обороны в одном или в нескольких
секторах (например, бомбардировщик — постановщик
помех). Стратегии, доступные противнику, состоят в раз­
личных распределениях общего количества единиц на­
падения по типам итак. При этом тип единицы нападе­
ния, применяемой для подавления обороны, определяет­
ся не только степенью подавления, но также и тем сек­
тором обороны, где эти меры подавления применяются.
Секторы обороны построены так, что только один тип
элементов обороны может быть применен в каждом сек­
торе. Так как сектор является основной единицей систе­
мы обороны, то тип средства, применяемого в данном
секторе, может быть выбран на основе критерия мини­
мальной стоимости поражения единицы средств нападе­
ния. Однако количества средств, выбранные для дан­
ных секторов, не обязательно определяются на основе
этого критерия. Если бы это было так, то все секторы,
кроме одного, с наименьшим значением этого критерия
для его средств, были бы лишены средств вообще.
Целью данной статьи является сравнение результатов
в случае, когда для определения количества оборони­
тельных средств применяется вышеназванный критерий,
и в случае, когда для этого выбора применяется более
оптимальный метод.
Значение критерия стоимости поражения известно
для каждого оборонительного средства, и общий
бюджет для всех секторов обороны задан. Стратегии,
доступные обороне, состоят в изменении распределения
175
бюджета между секторами. Предполагается, что избран­
ная обороной стратегия известна противнику и может
быть использована им для выбора своей стратегии.
С другой стороны, предполагается, что оборона знает
общее число единиц нападения, которое может быть
использовано противником, и все возможные типы его
атак. Однако оборона не знает, какое количество единиц
нападения в действительности будет использовано про­
тивником в каждом из этих различных типов атак.
Каждая единица нападения вызывает определенное
снижение эффективности обороны того сектора, в кото­
рый она входит. Этот эффект равен нулю или больше ну­
ля и позволяет учесть влияние тактик, применяемых про­
тивником и обороной данного сектора. Величина эффек­
та подавления обороны зависит от рассматриваемого
сектора и от типа атаки противника. ,В первом
секторе обороны входящая в него единица оказывает
одинаковый эффект на оборону для всех, кроме одного,
типов атаки. Во втором секторе входящая в него едини­
ца оказывает на оборону одинаковый эффект подавле­
ния для всех типов атаки, кроме двух, и один из них,
возможно, является как раз тем типом, который выде­
лялся в первом секторе. В третьем секторе входящая
в него единица оказывает одинаковый эффект подавле­
ния для всех типов атаки, кроме трех, и два из них явля­
ются как раз теми, которые выделялись во втором сек­
торе, и т. д. Эти ограничения в отношении типов враже­
ских атак не являются чересчур сковывающими, но при­
нятие их сильно упрощает определение оптимальной
стратегии противника.
Способность поражения цели для каждого типа
оборонительных средств оценена независимо от
свойств системы обороны в целом. Потенциал пораже­
ния для единицы обороны -данного типа определяется
средним значением потенциала разрушения, которым
обладают пропускаемые единицы противника, при неза­
висимом действии этой оборонительной единицы против
единицы нападения, т. е. частостью выживания единицы
нападения в таких условиях. Предполагается, что каж ­
дая единица нападения, независимо от типа атаки, несет
при этом один и тот же урон. Это могут быть, напри­
мер, бомбардировщики одного типа, но с различными
видами груза. Если единицы, применяемые для каждого
179
атаки, выбраны соответствующим образом, то это
ти п а
предположение часто является удовлетворительным при­
ближением. Стоимость, приходящаяся на единицу по­
тенциала обороны, и есть то, что имеется в виду, когда
мы говорим об отношении стоимости к эффективности
поражения цели.
Чтобы перейти от оборонительного потенциала к дей­
ствительным цифрам эффективности поражения в рам­
ках системы обороны, введена функция отношения обо­
ронительного потенциала данного сектора к степени
снижения эффективности этого сектора в результате
действий противника. Эта функция определяется той ча­
стью единиц нападения, входящих в данный сектор, ко­
торая прорывается через него к следующему сектору.
В эту же функцию заложены некоторые другие зависи­
мости, определяемые тактиками противника и обороны
в данном секторе. Предполагается, что каждая единица
нападения, независимо от типа, несет одинаковый урон
в данном секторе обороны. Таким образом, через дан­
ный сектор прорывается одна и та же часть от общего
числа единиц нападения каждого типа.
Небоевые потери среди единиц нападения учиты­
ваются посекторно. Для каждого сектора обороны за­
дается коэффициент, учитывающий небоевые потери
противника в данном секторе. Этот коэффициент опре­
деляет ту часть единиц нападения, которая осталась
после боевых потерь и после небоевых потерь в данном
секторе. Каждая единица нападения несет один и тот
же урон от небоевых потерь независимо от ее типа.
Для обороны боевые и небоевые потери учтены при
определении оборонительного потенциала.
Предлагаемая математическая модель в сочетании
с методом, применяемым для превращения оборонитель­
ного потенциала в действительное поражение, может
быть применена во многих типах оборонительных ситуа­
ций, имевших место в прошлом, и может оказаться по­
лезной также в настоящем и будущем. Отличительной
чертой этой модели является то, что приблизительно
оптимальная стратегия противника может быть опреде­
лена аналитически. Зная эту стратегию противника,
можно определить приблизительно оптимальную оборо­
нительную стратегию, минимизируя функпию распреде­
ления бюджета обороны между различными секторами.
180
Таким образом, в рассматриваемой игровой проблеме
без чрезмерно большой вычислительной работы могут
быть найдены приблизительное значение цены игры
и приблизительно оптимальные стратегии обеих сторон.
Анализ результатов применения этой математической
модели показывает, что имеется много ситуаций, когда
оптимальная оборонительная стратегия не требует кон­
центрации всего бюджета в секторе с минимальным зна­
чением отношения стоимости к эффективности пораже­
ния. Величина проигрыша, получающегося при исполь­
зовании стратегии, основанной на минимизации этого-кри­
терия, в сравнении с применением оптимальной оборони­
тельной стратегии, зависит от исследуемой ситуации.
Численный пример, приведенный в конце статьи, пока­
зывает, что этот проигрыш может быть значительным.

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ

Рассмотрим математическую модель, которая ис­


пользуется для оценки результатов атаки противника
против системы обороны. У этой модели имеется ценное
свойство, состоящее в том, что приблизительно опти­
мальная стратегия противника может быть определена
аналитическим путем без чрезмерно больших вычисле­
ний. Получив эту приблизительно оптимальную страте­
гию противника, не представляет большого труда с по­
мощью метода последовательных приближений или дру­
гого метода определить и приблизительно оптимальную
стратегию обороняющейся стороны. Полученная таким
способом приблизительно оптимальная стратегия обо­
роны обеспечивает защиту против любой стратегии, до­
ступной противнику. Исход атаки оценивается на основе
понятий теории игр, т. е. считается, что величина потен­
циала разрушения, сохранившаяся после прохождения
противником всех секторов обороны, равна тому потен­
циалу, который получается, если противник и обороняю­
щаяся сторона используют свои приблизительно опти­
мальные стратегии.
По своей природе любая реальная ситуация атаки
и обороны включает большое количество факторов По­
этому математическая модель содержит значительное
количество обозначений и сложных выражений. В статье
использованы следующие обозначения:
181
/ — номер сектора (/ = 1, . . . , з > 2); противник
проходит сначала первый сектор, затем вто­
рой, . . . и, наконец, сектор 5;
п. — число оборонительных единиц, размещенных
в /-ом секторе;
С1 — С1 (п*) — стоимость одной оборонительной еди­
ницы /-го сектора;
кь — поражающая способность одной оборонитель­
ной единицы /-го сектора;
К1— общий оборонительный потенциал /-го сек­
тора, К{= клг:,
В — общий бюджет обороны, выделенный для
всех секторов, В = п1с1- \- . . . -\-пзс8;
/ — индекс типа атаки противника ( / = 1 , . . . ,
N .— число вражеских единиц, входящих в район
обороны и участвующих в /-ом типе атаки;
N — общее число вражеских единиц, входящих
в район обороны, N = N г - ( - . . . —
[- N ^
— число вражеских единиц, участвующих в /-ом
типе атаки и проникших через все секторы
1, *; Л/;0)= Л Г ;
— эффект снижения эффективности обороны
г-го сектора, вызываемый вражеской едини­
цей, участвующей в /-ом типе атаки для
/<*•; = 0; Д<0) = 0;
И. — общий эффект снижения эффективности обо­
роны в /-ом секторе, вызываемый единицей
нападения для всех типов атаки, для кото­
рых / > / ; Д> = 0;
/. — часть вражеских единиц из числа вошедших
в /-ый сектор, которая уцелела после бое­
вых потерь в этом секторе;
а . = а 1(п1, . . . , п.) — часть вражеских единиц, ко­
торая, уцелев после боевых потерь в /-ом
секторе, уцелела также после небоевых по­
терь в этом секторе;
Р .— часть вражеских единиц из числа вошедших
в /-ый сектор, которая уцелела от боевых и
небоевых потерь в этом секторе, / ^ = 1 ;
Р} — потенциал разрушения объектов одной враже­
ской единицы, выполняющей /-ый тип атаки;
182
Р — величина потенциала разрушения объектов,
сохранившаяся после прохождения всех сек­
торов обороны, Р — Р . . . -}- Р ^ \ 5)\
A. — А1(п1, . . . , п) — некоторая величина в выра­
жении для
B. — В ^ п ^ . . . , п.) — некоторая величина в выра­
жении для
Здесь Р является величиной, которую противник ста­
рается максимизировать, а оборона — минимизировать.
Теперь свойства математической модели могут быть
описаны с помощью нескольких соотношений:
л К ° = / ч • • • р 1я 1 (« •= 1 , /=1».•*);

о Г ’ л ^ у / д - 1,
«=/ +1 И—1
где Л. и В1 выбраны так, чтобы }. была неуменьшаю-
щейся функцией от Величина /. ограничена значени­
ями 0 и 1; поэтому значения меньше нуля считаются
равными 0, а значения больше единицы считаются равны­
ми единице.
Р. — О для / < 5 , / > 5 + 1 ;
Я ^ ш а х [Ц .В Р , . . . . & Г 1)].
Выражение для /. может быть переписано в виде

П= 1 - л, {В, + (п
я=0
^.) [ Щ + 2 (Дм -
и=О
Д> К +

+ ( 0 « - О . ) +.]/+}-■.
В этом случае величина N. выражена явно.
Выясним смысл этих пяти соотношений. Выражение
для основано на предположении, что в пределах
одного сектора все типы вражеских единиц подвержены
уничтожению в одной и той же степени. Выражение для
/. может быть представлено в виде
где
^ __ снижение эффективности обороны сектора /
1 потенциал средств обороны сектора I
Если правильно выбрать значения Лг- и Вг-, то с помо­
щью функций этого типа можно аппроксимировать мно­
гие ситуации, представляющие интерес. По всей видимо­
сти и должна быть неуменьшающейся функцией от хи
и А{ совместно с В г- должны быть выбраны так, чтобы
удовлетворить этому условию. При вычислении выраже­
ния для Х\ предполагается, что все типы атак, за исклю­
чением / = 1 , ..., /, вызывают одно и то же подавление обо­
роны в секторе \1. Это ограничение тесно связано с по­
следними тремя из пяти соотношений. Все эти ограниче­
ния являются следствиями метода, применяемого для
определения типов атаки противника, и не очень сильно
уменьшают универсальность математической модели.
Типы атак противника определяются не только типом
оружия и методом его доставки, но также и тем, где это
оружие применяется в первый раз. Так, применение
одного и того же оружия по одному и тому же методу
представляет различные типы атак, если оно имеет ме­
сто в разных секторах обороны. Типы атак с /< $ исполь­
зуются исключительно для подавления обороны и не со­
держат потенциала разрушения объектов. Это приводит
к условию, что Р ^==0 для / < $ . Главное назначение
/-го типа атаки состоит в подавлении сектора / (при
/ < $ ) . Если противник не в состоянии вызвать более
сильное подавление обороны в секторе /, чем то, которое
было достигнуто единицами, просто проходившими через
этот сектор, то
= (И = 0, 1);

в противном случае противник обладал бы большей спо­


собностью подавления обороны в секторе чем пред­
полагалось. Если 1)^ = 0., то нуль есть оптимальное
значение для N.. В соответствии с предположением во
всех случаях для подавления обороны каждого сектора
назначается один тип атаки (тип I для сектора /). Так
как по крайней мере один тип атаки должен содержать
потенциал разрушения объекта, если хотят, чтобы атака
имела хоть какую-нибудь ценность, то должно выпол-
184
няться неравенство Последнее соотношение, ка­
сающееся 0 {.], возникло из требования, чтобы тип атаки,
вызывающий наибольшее подавление сектора I, использо­
вался в секторе и
Используя вышеприведенные соотношения и определе­
ния, можно выразить результирующий потенциал Р как
функцию ДО,, . . . , ДО, и п1, я 4_,. Здесь п3 можно
исключить с помощью уравнения
п вс з 11
П С ... ,

так как п8с8 есть монотонно возрастающая функция от


п8 для любой неабеурдной ситуации. Первым шагом ана­
лиза ситуации *атака — оборона* является определение
оптимальной стратегии противника, которую мы будем
А А

обозначать через ДО,, . . . , ДО,. Оптимальная стратегия про­


тивника максимизирует Р и является функцией от я,,
. . . , я 8_,, т. е. каждое ДО, есть функция от я,, , . я 5_,.
При использовании оптимальной стратегии противника Р
также становится функцией от я „ . . . , п3_ у Оптимальной
стратегией обороны является множество значений я,, . . . ,
п в_ ,, которое минимизирует выражение для Р.
А А

Непосредственное определение Ы.— Ы. (пг, . . . , п


с помощью зависимости Р = Р(Ы1У . . . , пг, . . . , лн )
может потребовать огромной вычислительной работы. При­
близительное определение оптимальной стратегии против­
ника, однако, может быть легко выполнено с помощью
некоторых критериев. Эти критерии получаются на основе
приблизительной оценки, которая дает достаточно точные
результаты. Метод состоит в том, что сначала рассмат­
ривается сектор 1 и вычисляется критерий оценки важно­
сти вражеских единиц, уцелевших в этом секторе. Этот
критерий является функцией от а не от ДО2, . . . ,
Величина является тем значением Л^, которое макси­
мизирует эту функцию важности вражеских единиц, уце­
левших в секторе 1. Приблизительное выражение для
представляет собой не слишком сложную аналитическую
А

функцию от я ,, . . . , п8_ у Получив ДО, = ДО,, вычисляют


185
критерий важности вражеских единиц, уцелевших в сек­
торе 2 . Этот критерий является функцией от М2, а не от
Л/3, N 1 - Затем в качестве Ы2 берется то значение
которое максимизирует критерий важности для сектора 2.
В общем случае, если известны Л/Г1=ЛГ1, =
А

= ДО._р то можно получить критерий оценки боевых еди­


ниц, уцелевших в секторе I. Этот критерий является
А

функцией от но не от №1+1, Величиной яв­


ляется то значение Ы., которое максимизирует критерий
А А

важности для сектора /. Выражения для Л^, . .., Ы8 по-


А

лучаются таким же способом. При все N. равны ну­


лю, за исключением тех, для которых Р. имеет макси­
мальное значение. Любое допустимое распределение
(Ы — Ы1— . . . — Л^) единиц, не используемых для подав­
ления оборонительных секторов, среди возможных ЛЛ, не
равных нулю (для / 5 > представляет оптимальное ре­
) ,

шение. Таким образом, применение подобных критериев


А А

дает сравнительно легкий метод определения Ы1У . . . ,


Рассмотрим определение критерия важности вражеских
А

единиц, уцелевших в секторе / (1 < / < $ ) . Здесь Ы1= Ы1,


..., они являются известными функциями от
п 1У • • П8_ х. Из математической модели получаем

/,=1 - 4 {в, + (П Г.) [ щ + 2 Д) 4, +

так что /*’. = «./. есть функция от ноне от Ы.+1, . . Ыг


А А

После определения , Л^_, и величины


Лт;+1, . . . , М( являются по-прежнему произвольными. Они
должны быть неотрицательными целыми числами и подчи­
няться условию

186
Таким образом, поскольку вражеские единицы типа /
(при / > / ) , уцелевшие в секторе /, неразличимы по важ­
ности, их важность при выходе из сектора I можно счи­
тать одинаковой. Поэтому общая важность единиц типов
на данной стадии может быть представлена выраже­
нием

( П ^ ) ( * - й - я , ) .

Если бы была известна относительная важность вра­


жеской единицы типа и (и < ь), уцелевшей в секторе г, по
сравнению с важностью вражеских единиц типа / > / , то
А

представляло бы собой такое значение ЛЛ, которое


максимизировало бы величину

(П г„) (и ~ ", - • • - - - ", + < 4 +


0=1

и—О

Эта величина является функцией от ЛЛ, но не от


..., Значение можно приблизительно оце­
нить, рассматривая вражеские единицы типа и как экви­
валенты единиц типа I -}- 1 прА I < 5. Подавление сектора
вызываемое вражеской единицей типа и , равно
в то время как для единицы типа *-|-1 оно равно
Таким образом, выбор

= ' (« = 1.........
оказывается разумным, если результирующее значение не
слишком велико (например, < у 2). Если / = $, то —
= 0, так как вражеская единица типа и < $ теперь уже
не имеет никакой цены; Ц^0) = 0 по определению. Огра­
ничение величины ^ : 7)< у 2 не является существенным.
Крайне редки ситуации, когда важность неиспользуемой
вражеской единицы не превышает по крайней мере
187
в 2 раза важность единицы, которая уже осуществила
свое основное действие.
Теперь рассмотрим определение приблизительно опти-
мальной формы Ы,(т. е. / = *‘<5). Если В\ = то
N. = 0. Если же р У ф Р . , то возможны два случая:
N. равно либо нулю, либо целой части выражения

где
I—1
а. = ^ - У ( 1 - У « ) Ы а (Ло= 0),
а=0

т, = в, + (П [N0, + 2 (°Г
о—О «—О

*, = (П Р * ) № - 0 № г
Р—О
Здесь N. принимается равным нулю тогда и только
тогда, когда величина выражения (1) отрицательна
или величина (а. — где N. равно целой части вы­
ражения (1), не превосходит величины этого выражения
при N. = 0.
Знанид . . . , л8_ , ) , . . . , Л^ = А^
достаточно, чтобы определить Р = Р ( п 1, . . . . п8_ х) неза-
А А

висимо от значений Л^+1, . . . , Ыг То есть

Р = (гаах Р ) ( П
1 \= . '
А А

где Nх= N х, . . . , N 8= N8 в выражениях для Р8.


Остается определить допустимое множество значений
п1 лв__ь минимизирующее Я. Эта задача мини­
мизации может быть решена методом последовательных
168
приближений, итерационными методами и т. д. (см., на­
пример, [1]). Использование минимизирующего множества
значений п г, . . . , п8шшЛ дает наилучшую защиту против
всех допустимых стратегий’ противника и поэтому являетсй
оптимальной оборонительной стратегией. Предположим,
что оборона использует эту стратегию. Тогда максималь­
ное значение Я, достигаемое противником, будет равно
приблизительно тому значению, которое получится при ис-
А

пользовании выражений, выведенных для N ^ в этой статье.


А

Это происходит благодаря тому, что значения N. определя­


ются требованием, чтобы Р был максимальным для данного
множества п г, . . . , п8_ Г
На этом заканчивается описание математической мо­
дели и метода, применяемого для определения прибли­
зительно оптимальных стратегий противника и обороны.
Если 5 не достаточно мало, описанная процедура может
потребовать большой вычислительной работы. Однако
применение приближенного аналитического метода опре­
деления оптимальной стратегии противника уменьшает
объем вычислений по крайней мере на один порядок по
сравнению с непосредственными расчетами.

ЧИСЛОВОЙ ПРИМЕР

Ниже детально рассматривается числовой пример


с тем, чтобы продемонстрировать метод, описанный
в предыдущем разделе. Этот пример показывает, какие
большие потери получаются при использовании крите­
рия минимального отношения стоимости к эффективно­
сти вместо оптимальной оборонительной стратегии.
Число секторов обороны было принято равным 5 = 2,
а число типов атак противника 1= 4. Хотя выбор таких
малых чисел снижает величину относительных потерь при
определении оборонительной стратегии, однако это дает
возможность продемонстрировать существенные свой­
ства метода без чрезмерно больших вычислений.
Центральное выражение, использованное при опреде­
лении основано на пуассоновской аппроксимации бино­
миального распределения вероятностей. Биномиальное
распределение отражает идеализированную ситуацию,
в которой все единицы противника ц обороны статисти­
ка
чески независимы. Кроме того, вероятность того, что
данная единица обороны атакует данную единицу 'про­
тивника, одинакова для всех комбинаций единиц оборо­
ны и противника и не зависит от того, была ли единица
противника уже атакована и уничтожена.
Используя распределение Пуассона, получаем

ц — —и» — 4 /
^ 2 ^ -|) + 2 ч ч
1~ и=1+1 и= 1
Хорошее приближение к этому выражению в интере­
сующей нас области получается, если положить
А . = 1,17, 5. = 0,86.
В это-м случае
/ г = 1 -1 ,1 7 [ 0 ,8 6 + (О4. ^
и=1+\

+ 2 о Т ^ - 'У ц - .
и=1 -1

Для примера были приняты следующие значения величин:


^ = 1,00 единица стоимости,
^2 = 0,25 единицы стоимости,
к 1 = 0,4,
6а = 0,2,
В — 3 000 единиц стоимости,
N = 500 единиц противника,
Г>4= 1>я= Г»(1а>= Г^,>= 1 ,
&,п = 3, О(22)= 1 0 ,
(Х\ — а 2—■1>
/->1= Р 2= 0, Р 3= 0,8, Р 4= 1 единица потенциала раз­
рушения.
Вычислим стоимость поражения цели для обоих обо­
ронительных секторов. Для сектора 1 она равна 2,5,
а для сектора 2 — всего лишь 1,25. Иначе говоря, стои­
мость поражения цели для сектора 1 вдвое больше, чем
для сектора 2. Поэтому в соответствии с критерием ми­
нимального значения стоимости, деленной на эффектив­
ность поражения цели, оптимальной стратегией обороны
должна была бы быть стратегия п\ = 3, п2= 12 000. Одна­
ко, как будет показано ниже, эта стратегия далека от
190
оптимальной, и потери от ее применения вместо приме­
нения истинной оптимальной стратегии велики.
Первым шагом в решении является определение выра-
А А А

жения для N 1 = («1). Величина равна или нулю, или


целой части выражения (1) при 1 = 1. Соответствующие
величины, входящие в (1), равны
^ = 1,17, в, = М = 500,
р! = 1 - 0 (21)/ 0 ‘2) = ° ,9,
Т. = В х+ = 0 ,8 6 + 1 ^ ,

61= (0 (,1)- Л 1) / ^ = | ; .

Таким образом, Ыг равно или нулю, или целой части вы­


ражения
— 249,5 — 0,172 пг + У 1 8 8 ,5 ^ + 0,04025 я 2 . (2)
Если выражение (2) отрицательно или если выражение
(а1 — больше при Л^ = 0, чем при Л^, равном це-
А

лой части выражения (2), то берется нулевое значение А+


А А

Далее определим Л/а= + (я,) для вычисленного значе-


А А

ния Ы1— М1(п1). Здесь п 2 выражено через п1 посредством


з ооо — п х
соотношения п2 2= — 0,25—1 и
Л 2= 1 ,1 7 , ^ = N — N ^ 50 0 — й»
Ра= 1 - И 7 < 2> = 1 ,
Р 1 = \ — I , \7 [0,86 + ( 1 2 5 0 -{-БМ^/п^-1 ( 0 < Р г< 1),

Ъ = В 2+ Рг [ # 0 2+ ( ^ 1)- О а)^ 1]//(2= 0 , 8 6 + з ^ г ;


(2) •11,25
83= ^ ( Д 2 В Д = 3000 — пг *

Таким образом, М2 равно или нулю, или целой части


выражения
— 55 — 0,0764 (3 000 — п1)/Р1+

+ У (57,6— 0,104 & +3000—я + ^ + 0 , 00795(3000- п ^ /р ]


(3)
191
Нулевое значение придается ЛГ2, если (3) отрицательно
или если значение (а2— |32Л^2) / 2 больше, когда Я2= О,
чем когда — целая часть выражения (3).
А А

Если известны Ых и Ы2, то легко вычислить приблизи­


тельно оптимальную стратегию противника. Величина
А А А

равна нулю, так как Р ,« < Р 4. Тогда = Ы — IV* =


А А

= 500 — Ых — Остается определить оптимальную стра-


А А

тегию обороны, которую мы обозначим через л„ п2.


Так как т а х Р /.=сопз1, то пх есть такое значение л„
которое минимизирует выражение

( Р 1Р 2) ( 5 О 0 - Ы .- Ы ,) , (4)
где Р х — то же выражение, которое было использовано при
определении N в то время как
Е2= 1 — 1,17 [0,86 + (625 + 1 1 ,25Й2)/(3 000 — л,)] - 1,
( 0 < Р а< 1 ).
Проверка показывает, что выражение (4) имеет един­
ственный относительный минимум в области допустимых
А

значений пх. Вычисление пх состоит в подсчете значений


выражения (4) для нескольких значений пх вблизи миними-
А

зирующего значения. Затем пх определяется графически


на основе рассмотренных значений пх и соответствующих
значений выражения (4).
Для начала рассмотрим случай, когда «1 = 0. Это как
раз та стратегия обороны, которая получается, если в ка­
честве критерия эффективности берется отношение стои­
мости к поражающей способности. При этом выражение (2)
отрицательно, так что (0) = 0; Р х равна единице при
А

п1= 0. В результате Ы2(0) равно либо нулю, либо целой


чаоти выражения
_ 55 _ 0,0764 (3 000) +
+ /5 7 ,6 (3 000) + 0,00795 (3 ООО)2ж 209.
Для М2= 0 величина, (аа — $2М2) ? 2 равна нулю, а для
ДОа= 209 она равна 107. Следовательно, приблизительно
192
оптимальной стратегией противника в случае л, = 0 будет
А = 0; N а = 209, А = 0 и А = 291. Таким образом, по
скольку ш а х Р ^ -1 и а2— Р1= 1, величина Р = Я (0 )= 1 0 7 .
Иначе говоря, для случая л1= 0 через все секторы обо­
роны проникнут цели со 107 единицами потенциала разру­
шения.
Далее рассмотрим случай, когда л 4= 1 5 0 0 . Тогда
А (1500) равно либо нулю, либо целой части выражения
— 249,5 — 0,172(1500) +
+ уЧ 188,5) (1500) + 0,04025 (1500)2~ 103.
Для А = 0 К —Р А ) / 1= 1 5 5 , а для А = Ю З (а4—р А ) /х =
= 173. Таким образом, А (1500) = 103, /?1= 0,425. Анало-
А

гично, А (1500) равно либо нулю, либо целой части выра­


жения
кс 0,0764(1500) ,
0,425 "Г
, - | / ;(46,9)(1 500) , 0 ,0 0 7 9 5 (1 500)2 100
"•“ Г 0 ,4 2 5 + . (0 ,4 2 5 )2 — 1вб-

Для А = 0 (аа—Р А )/а = 3 3 , а для Л^а= 1 8 8 (а2— р А ) / 2=


= 188. Поэтому приблизительно оптимальная стратегия
противника для случая = 1 500 будет А = 103, А =
= 188, А = 0, А = 209. Тогда, поскольку т а х Р . = \,
а* = 1, А = 0,425, величина Р = Я(1500) = 50. Иначе
говоря, если л1= 1500, то через все секторы обороны
будет пропущено только 50 единиц потенциала разрушения.
Производя аналогичным образом вычисления для слу­
чаев, когда л 1= 1100, 1900, 2300, получим

А (1100) = 67, А (1100) = 210, А (1100) = 0,


А (1900) = 132,4 А (1 9 0 0 )= й 165, А (1900) = 0,
А (2300) = 160, А (2300) = 132, А (2300) = 0,
А (1100) = 223, Р(1100) = 58;
А (1900) = 203, Р (1900)=47;
А (2300) = 208, Р (2300) = 48,5.
193
График, построенный по результатам расчетов для
^1 = 0, 1100, 1500, 1900, 2300, дает следующую прибли­
зительно оптимальную стратегию обороны
л, = 2000, дг2— 4000.
Из этого же графика видно, что приблизительно оптималь-
А А

ной стратегией противника будет N,(2000) — 138, N2(2000)=


= 157, ^з(2000) = 0, # 4(2000) = 205, а Р = Р ( 2000) =
= 46,5. Иначе говоря, если как обороняющаяся сто­
рона, так и противник применяют приблизительно оптималь­
ные стратегии, то только 46,5 единиц потенциала разру­
шения проникнут через все секторы обороны.
В заключение сравним результат, получающийся,
когда используется приблизительно оптимальная страте­
гия обороны, с тем результатом, который получается,
если стратегия обороны определяется на базе минимума
отношения стоимости к поражающей способности. Здесь
противник всегда использует свою приблизительно опти­
мальную стратегию для данной стратегии обороны. Если
применяется приблизительно оптимальная стратегия
обороны, то только 46,5 единиц потенциала разрушения
проникают через все секторы обороны против 107 еди­
ниц, проникающих во втором случае. Таким образом,
применение оптимальной стратегии обороны вместо кри­
терия эффективности, основанного на отношении «стои-
мость/поражающая способность», существенно улучшает
эффективность обороны.
П РИЛ ОЖЕН ИЕ
В приложении содержится доказательство того, что
А

N .(/% !,..., п5_,) равно либо нулю, либо целой части выра­
жения (1). Нулевое значение берется в том случае, когда
выражение (1) отрицательно или когда выражение (а.—
— меньше при N. = 0, чем когда Ы1 равно целой
части выражения (1). Одновременно N. = 0, если =
= Ор т. е. ?к = 0.
По предположению есть неуменыпающаяся функция
от N1 для допустимых значений Nг Кроме того, О)')
> т а х [П!1*,. . . , Г)*1-1*], так что 8 .> 0 . Эти два условия
194
требуют, чтобы Т^ + ^Л^. была неуменьшающейся функцией
от которая не меняет знак при допустимых значе­
ниях Ыг Если 8. = О, то не будет никакого выигрыша в
степени подавления обороны, если противник использует
тип атаки 1\ поэтому N. = 0. Эти интуитивные соображе­
ния согласуются с непосредственным использованием этого
критерия. При 8,. = 0 критерий представляет собой моно­
тонно убывающую .функцию от ЛЛ, так что максимизирую­
щим значением будет Ых= 0.
Остается случай, когда 8 .> 0 . Тогда есть
возрастающая функция от Л^., не меняющая знака для всех
допустимых значений N.. Если Л. = 0 или ^ < 0 , то /.обя­
зательно должна равняться единице для всех допусти­
мых N.. Для А. = 0 это следствие очевидно. Если у .< 0 ,
то А{ должно быть обязательно неотрицательным, так как
8. > 0 , и нуль есть возможное значение для N.. Отсюда
вытекает, что Р. должна равняться по крайней мере еди­
нице для всех допустимых значений N.. Анализ, аналогич­
ный проделанному для 8. = 0, показывает, что N. = 0, если
8 .> 0 , но Л . < 0 или у .< 0 .
В заключение рассмотрим случай, когда 8 .> 0 , Л.=^=0,
0. Тогда есть монотонно возрастающая неот­
рицательная функция от N.. Отсюда следует, что А.^>0
и следовательно /. << 1 для всех допустимых При
определении величины Ы., которая обеспечивает максималь­
ное значение критерия, /. может быть положена равной
своему несокращенному выражению. Это допустимо, так
как для /. > 0 величина равна этому несокращенному
выражению, в то время как ситуации, в которых /.= 0 ,
исключаются по другим соображениям. Исключив, таким
образом, ненулевые множители, независимые от мы
приходим к проблеме определения величины^, при которой
достигается относительный максимум функции

(5)
А А

для заданных ..., .


195
Определим относительный максимум выражения (5),
рассматривая его как функцию от Ыг Дифференцируя (5)
по ЛГ., получим условие получения максимизирующего зна­
чения N.
»ль^ уд> Л ____ ^ _ \ = 0

где Т/ + 81Н1ф 0 для допустимых значений Ыг Сокращая


на коэффициенты, не равные нулю, и группируя члены,
получаем следующее выражение:

(г1+ « Л ) , = л ( т , + ^ - ) -

Отсюда следует, что если существует допустимое значе­


ние Ы., которое придает выражению (5) значение относи­
тельного максимума, то оно равно наибольшему целому
числу, содержащемуся в выражении (1). Если эта величина
отрицательна, то относительного максимума выражения (5)
для 0 не существует. Тогда максимизирующим зна­
чением будет N. = 0. Если величина выражения (1) больше
нуля, то выбор между ^ = 0 и Ы1У равным целой части
выражения (1), производится на основании прямого сравне­
ния значений выражения (а. — р.ДО.)Д. для обоих случаев.
Имеется верхний предел а./|3. для допустимых значений
Этот предел, однако, не есть возможное значение N^ так
как критерий равен нулю при ДО. = а./р/в

Расширение математической модели


Математическая модель, представленная в этой
статье для рассмотрения действий и результатов атаки
противника против обороны, может использоваться в си­
туациях более общих, чем было предусмотрено при ее
выводе. На нее наложено условие, чтобы атака прохо­
дила через заданное множество секторов в определен­
ном порядке (сначала сектор /, затем сектор 2,...,
наконец, сектор $). Не во всех реальных ситуациях это
условие удовлетворяется. Однако многие очень сложные
ситуации могут быть разбиты на части так, чтобы каж-
196
дая из них удовлетворяла условию, наложенному на
нашу модель. Тогда соответствующее применение нашей
модели к каждой из этих частей (совместно с методом
определения приблизительно оптимальных стратегий
противника может сильно упростить определение при­
близительно оптимальной стратегии противника! для
всей ситуации в целом. Если известна приблизительно
оптимальная стратегия противника, то* приблизительно
оптимальная стратегия обороны может быть часто най­
дена с помощью стандартных методов определения мак­
симального значения функции.
Согласно нашей модели^все атакующие единицы должны
проходить через все секторы обороны. Для единиц, пред­
назначенных для разрушения объектов, это верно. Одна­
ко часть остающихся единиц типа I < 5 может прекращать
атаку в конце сектора *, сектора и т. д. Это можно
учесть, умножая величину „т на коэффициент (и). Он
равен той части начального числа единиц типа I, которая
должна продолжать атаку в секторе « > / . Величина д{(и)
является обязательно невозрастающей функцией от и.

Л ИТЕРАТУРА

1. М. Р Н е й т а п а пс ! Ь. .1. 5 а V а § е. Р1апш п2 е х р е п т е п 1 з
з е е к т д т а х п л а . Т е ск г^ и е з о! з1аИзиса1 апа1уз1$. М сОга\у-НШ ,
Уогк, 1947, р. 363— 372.
ОПТИМАЛЬНЫЙ СОСТАВ И БОЕВОЙ ПОРЯДОК
РАЗНОРОДНОЙ ПО СОСТАВУ СИСТЕМЫ
ЛОКАЛЬНОЙ ПРОТИВОВОЗДУШНОЙ ОБОРОНЫ
Мартин Л. Лейбовиц и Джералд Дж. Либерман *.
Стэнфордский исследовательский институт, Менло Парк,
шт. Калифорния

Почти все системы локальной противовоздушной обо­


роны состоят из нескольких типов оборонительного ору­
жия. Подобное дублирование является необходимым.
Система ПВО должна быть готова к отражению целого
спектра приемов налета, доступных противнику. Вслед­
ствие большой разницы в тактико-технических требова­
ниях либо оовсем невозможно, либо экономически невы­
годно создать один единственный тип оборонительного
оружия, который был бы эффективен против всех воз­
можных видов налета. На некотором этапе планирова­
ния системы обороны подобная разнородность характе­
ристик оружия приводит к необходимости решить во­
прос о наилучшем сочетании различных типов оружия.
Иначе говоря, требуется определить, сколько оружия
какого типа должно быть предусмотрено в системе обо­
роны.
В настоящей статье описан метод решения этой за ­
дачи в случае идеализированной оборонительной ситуа­
ции, справедливой для некоторых симметричных оборо­
нительных систем, использующих зенитные управля­
емые снаряды. Тем не менее, нам кажется, что описан­
ный метод применим к более широкому диапазону про­
блем военного планирования .

* М а г И п Ь. Ь е г Ъ о ^ Н г апс! С е г а 1 (1 Л. Ы е Ъ е г т а п .
Ор1дта1 сотр озШ оп апс! с!ер1оутеп1; о! а Не1его§гепео115 1оса1 а п -
ЛеГепзе зу з1 ет . ОрегаНопз ЦезеагсЬ, 1960, уо1. 8, р. 324— 337.
198
МОДЕЛЬ НАЛЕТА
Оперативный «бюджет» нападающей стороны в каж ­
дой отдельной операции характеризуется уровнем уси­
лий, вложенных в налет, Мо. Определенные усилия, вло­
женные в налет, могут быть реализованы посредством
одного из т типов налета, причем в рамках одной опе­
рации может быть применен только один тип налета.
Отдельные типы налета характеризуются индексом /,
где /= 1 ,2 , ..., т, и различаются друг от друга по «стои­
мости» одной атакующей единицы, по разрушительному
потенциалу, которым обладает одна атакующая едини­
ца, и по ее уязвимости со стороны каждого подразделе­
ния системы обороны.
Стоимость одной атакующей единицы, С., используется
для определения числа атакующих единиц в /-ом типе
налета. Если обозначить через М. это число единиц, то
М I. = ^ С
гу- . Другими словами, для заданного уровня усилий,
вложенных в налет, при атаке легких бомбардировщиков
должно, по-видимому, участвовать больше самолетов, чем
при атаке тяжелых бомбардировщиков.
Разрушительный потенциал одной атакующей единицы,
е., характеризует тот факт, что тяжелый бомбардировщик
может нести бблыную бомбовую нагрузку, чем легкий.
Поэтому общий разрушительный потенциал /-го типа на­
лета без учета потерь, наносимых системой обороны, равен

Уязвимость определенного типа атаки выражается


математическим ожиданием числа атакующих единиц,
Кц, уничтоженных подразделениями обороны, оснащен­
ными оружием 1 -го типа. Имеется п различных типов
оборонительного оружия, характеризующихся индексом /,
где 1=1, 2,..., п. Совершенно очевидно, что при расчете
уязвимости учтены многие физические параметры нале­
та: скорость и высота полета, эффективная отражающая
поверхность бомбардировщиков и т. д.
МОДЕЛЬ ОБОРОНЫ
Общий бюджет, выделенный для создания и эксплуа­
тации локальной системы обороны, равен С0. Если че­
рез Nх обозначить число подразделений, оснащенных
199
/-ым оборонительным оружием, а через С* — первона­
чальную стоимость /-го оружия и стоимость его эксплуа­
тации, приходящуюся на одно подразделение, оснащен­
ное этим оружием, то возможна реализация любой ком­
бинации оружия (\Ыи Л^2, ... Дп), удовлетворяющей нера-
п
венству^СгА^г < С 0. Все оружие /-го типа равномерно
1= 1
распределено вдоль окружности с радиусом ^ и с цен­
тром, совпадающим с обороняемым объектом. Оборо­
няющаяся сторона может выбирать величину радиу-

Рис. 1. Группировка средств противовоз­


душной обороны.

са Яг по своему желанию. Так как боевой порядок каж ­


дого типа оружия представляет собой отдельную окруж­
ность, то система обороны в целом состоит из несколь­
ких концентрических кольцевых оборонительных поясов,
окружающих обороняемый район (рис. 1). Такой боевой
порядок основан на предположении о равной вероятно­
сти налета со всех сторон.
Эффективность действий одного оборонительного под­
разделения с оружием /-го типа, расположенного на
окружности радиуса Яг, против /-го типа налета карак-
теризуется математическим ожиданием числа целей,
200
Кц(Яг), пораженных этим подразделением до того, как
атакующие единицы достигли рубежа бомбометания.
Этот параметр является функцией характеристик цели
(скорости, высоты, эффективной отражающей поверхно­
сти и т. д.) и характеристик оборонительного подразде­
ления (работное время, дальность действия, пропускная
способность, условная вероятность поражения цели раке­
той при состоявшемся наведении и т. д.). Действитель­
ное число сбитых целей зависит также от положения
оборонительного подразделения на окружности боевого

Рис. 2. Математическое ожидание числа целей,


сбитых отдельным подразделением средств обо­
роны 1-то типа.

порядка относительно направления налета. Однако с по­


мощью усреднения математического ожидания числа
сбитых целей по всем возможным направлениям атаки
величину Кц можно сделать независимой от расположе­
ния оборонительной единицы на кольце обороньп (рис. 2).
(Вычисление математического ожидания числа сбитых
целей Кгз(Яг) является непростой задачей, и то, что
в статье этот 'вопрос рассмотрен вкратце, не следует ис­
толковывать как попытку преуменьшить сложность про­
блемы. Так как, однако, содержание статьи сфокусиро­
вано на модели сбалансированной обороны, то функция
математического ожидания числа сбитых целей считает­
ся заданной.)
20}
К РИ ТЕРИ Й ЭФФЕКТИВНОСТИ

Атакующая сторона старается максимизировать


ущерб, наносимый объекту при заданном уровне усилий,
вложенных в налет. Этот ущерб является монотонно воз­
растающей функцией числа бомб, пропущенных систе­
мой обороны. Аналогично, обороняющаяся сторона стре­
мится минимизировать бомбовый потенциал, пропущен­
ный через рубежи обороны, с учетом ограничений, на­
кладываемых бюджетом обороны. Поэтому ,в качестве
критерия эффективности как налета, так и обороны, при­
нято число бомб, пронесенных через систему обороны.

ФОРМУЛИРОВКА ПРОБЛЕМЫ
Атакующая сторона должна выбрать один из т ти­
пов атаки. Обороняющаяся сторона может, во-первых,
выбрать любую возможную комбинацию оборонительно­
го оружия, а во-вторых, она обладает полным контролем
относительно радиусов боевых порядков выбранной ком­
бинации оружия. В некоторых случаях обороняющаяся
сторона может осуществить только начальный контроль
за боевыми порядками. Это имеет место, например, ко­
гда оборона состоит из стационарных сооружений. С дру­
гой стороны, если оборонительное оружие подвижно, то
обороняющаяся сторона может осуществлять более или
менее непрерывный контроль за построением боевых по­
рядков. В статье рассмотрены оба случая.
Предполагается, что обе стороны действуют разумно
и обладают полной информацией относительно значений
параметров задачи. Далее предполагается, что нападаю­
щая сторона знает выбранную противником комбинацию
типов вооружения, а в случае стационарных сооружений,
знает и боевые порядки.
С точки зрения обороняющейся стороны задача за­
ключается в определении такой комбинации оружия и
боевых порядков, которые минимизируют математиче­
ское ожидание числа пропущенных бомб.

МОДЕЛЬ СБАЛАНСИРОВАННОЙ ОБОРОНЫ


Если противник выбрал /-ый тип атаки, то система
обороны действует против N! атакующих единиц, каждая
из которых несет е. бомб. Если обороняющаяся сторона
202
выбрала к-ую возможную комбинацию средств, где й —
= 1, 2 , . . . , 5 , оборона должна состоять из Ы\к) подразде­
лений первого типа, Ы2к) подразделений второго типа и
в общем случае из Ы{к) подразделений /-го типа. Имеется
бесконечное число вариантов размещения на местности этих
средств обороны. Для удобства изложения, однако, пред­
полагается, что число таких вариантов конечно. Так у-ый
вариант размещения означает, что все средства первого
типа размещены на окружности радиуса Я\у\ все средства
второго типа — на окружности радиуса 7?^ и в общем слу­
чае все средства /-го типа — на окружности радиуса
где у = 1, 2, . . . , г . Если обороняющаяся сторона выбрала
к-ую комбинацию и у-ът вариант размещения, то матема­
тическое ожидание числа пораженных целей, достигаемое
всей системой обороны, будет равно

(<В этом выражении предполагается, что математиче­


ское ожидание числа сбитых целей С}куз не зависит от
размеров налета М^ Это предположение накладывает
на нашу модель сильные ограничения, так как оно спра­
ведливо только в некоторых частных случаях, например,
когда число атакующих целей во много раз превосходит
оборонительный потенциал системы обороны. Тем не ме­
нее, общность метода при этом не уменьшается, так как
всегда можно линейные выражения заменить соответст­
вующими функциями С1куз. Хотя введение более слож­
ных выражений может сильно усложнить вычисление
значений Якуз, можно показать, что при этом форма
оптимальных решений не меняется.)
Математическое ожидание числа целей, прорвавших­
ся через все 'рубежи обороны, равно числу целей, выле­
тевших с баз, минус математическое ожидание числа
сбитых целей, 0.куз, т. е.

' 1=1
203
И, наконец, математическое ожидание числа бомб,
пронесенных сквозь системы обороны, равно
Вкуз —&э ( ^ 3 Фкуз) •
Рассмотрим сначала случай, когда средства обороны
размещены стационарно. В тот момент, когда атакую­
щая сто-рона должна принять решение относительно ти­
па атаки, она, по предположению, обладает полной ин­
формацией о составе и расположении средств обороны.
Поэтому такую ситуацию можно рассматривать как
•игру с полной информацией. Следовательно, как у напа*
дающей, так и у обороняющейся стороны имеются опти­
мальные чистые стратегии, а игра имеет цену. Решение
этой игры легко находится следующим образом. Перед
нападающей стороной имеется система оборонив с фикси­
рованными к-ои комбинацией средств и у -ым их распо­
ложением. Если атакующая сторона выбрала /-ый тип
атаки, то математическое ожидание платежа будет В^Уз
бомб. Естественно, что она выберет тот тип атаки, /*,
который максимизирует число бомб, пронесенных через
оборону, т. е.

Обороняющаяся сторона, наоборот, выберет такие к *-ую


комбинацию и фиксированное расположение средств у *,
чтобы минимизировать Вку].„ т. е.
В = В ,.Л . = т т в м .

Таким образом, нападающая сторона выберет /*-ый


тип атаки и будет уверена в том, что по крайней мере В
бомб проникнет через оборону, в то время как обороняю­
щаяся сторона выберет к *-ую комбинацию и у*-ое рас­
положение средств и будет уверена, что к объекту будет
пронесено не более чем В бомб (рис. 8).
В более общем случае, когда расположение оборони­
тельных средств не фиксировано, атакующая сторона
знает комбинацию средств обороны, но ничего не знает
относительно радиусов колец боевых порядков. Игра
перестает быть игрой с полной информацией, и опти­
мальное решение потребует применения смешанных
стратегий. Необходимость смешанных стратегий можно
пояснить, если предположить, что допустимы только
решения игры в чистых стратегиях. Тогда, если оборо­
няющаяся сторона играет осторожно, то она разместит
204
к-ую комбинацию (предполагая, что индекс &фиксирован
в самом начале) так, чтобы минимизировать наилучший
платеж, который может получить нападающая сторона.
Другими словами, осторожная обороняющаяся сторона

Радиус кольцевой группировки Я;


Рис. 3. Оптимальная группировка для стацио­
нарного размещения.

полагает, что нападающая сторона правильно отгады­


вает вариант размещения и в соответствии с этим при­
меняет /*-ый тип атаки, при котором т а х Вку^= Вку^ .
Обороняющаяся сторона тогда выберет такое значение
у = у*, которое минимизирует Вк ^ т. е.

Принимая такое решение, обороняющаяся сторона


исходит из предположения, что нападающей стороне
удастся выбрать именно такой тип атаки, который наи­
лучшим образом использует имеющиеся слабые места
обороны. При этом она проявляет максимальную осто­
рожность. Вообще же обороняющаяся сторона может до­
стичь лучших результатов, если она применит какую-ни­
будь более «рискованную» стратегию размещения
средств обороньи. Обратимся к рис. 4. Наиболее осто­
рожная стратегия определяется пересечением двух кри­
вые, нанесенных для двух типов атаки. Предположим,
однако, что обороняющаяся сторона вынуждена иополь-
205
ЗОЁать смешанную стратегию, состоящую из пбперёМёй-
ного использования стратегий /?' и Я". Если бы порядок
использования этих стратегий был случайным, то напа­
дающая сторона была бы не в состоянии определить,
какое размещение средств выбрала оборона в данный
момент времени. В некоторых случаях нападающий мо­
жет .правильно угадать стратегию обороны, получая при
этом более высокий платеж, однако, даже в этом «удач­
ном» случае этот платеж не на много выше гарантиро­
ванного платежа, получаемого при применении чистой

Рис. 4. Чистые и смешанная стратегии для по­


движной обороны.

стратегии. С другой 'стороны, если нападающему не уда­


ется правильно разгадать стратегию обороны, и он вы­
бирает, например, тип атаки /= 1 против размещения
средств то его платеж значительно меньше, чем пла­
теж при использовании чистой стратегии. Можно строго
доказать, что оборона всегда может улучшить свой ре­
зультат, используя смешанную, т. е. рискованную, стра­
тегию. Это же справедливо, конечно, и в отношении на­
падающей стороны. Доказательство этого утверждения
является основной теоремой теории некооперативных
игр * с нулевой суммой.
* Н екооперативные игры — игры, в которых не допускается
абсолю тно никакой связи м еж ду игроками д о начала игры. (Прим.
перев.)ч
206
Возникает вопрос: оправдывается ли риск, заключен­
ный в смешанной стратегии, если в игре на карту по­
ставлено само существование противников? Будет ли
капитану тонущего флагманского корабля легче от мыс­
ли, что выбранная нм смешанная стратегия в результате
многократного повторения оказывается наилучшей?
Этот вопрос имеет некоторые интересные следствия, ко­
торые будут рассмотрены! позднее. А сейчас мы предпо­
ложим, что оба игрока желают применить смешанные
стратегии.
Можно легко сформулировать выражение математи­
ческого ожидания цены смешанной стратегии. Пусть ос­
есть вероятность того, что нападающий применит /-ый
тип атаки и пусть есть вероятность того, что оборона
выбрала у-ыи тип размещения средств. Тогда, предпо­
лагая индекс к фиксированным, получаем, что матема­
тическое ожидание числа пропущенных обороной бомб равно
г т т г
X Ц и т1ВкуГ где X 0птимальные значе-
У= 1 /=1 /= 1 у=1
ния т. — и ^ = / определяются из условия

^ = т т ш а Ху | =
у=*\ / = 1

;™ах т 'п Х I /М ,-
9 Г У=^ /—1 у=\ 1= 1

Таким образом, нападающий, применяя свою оптималь­


ную смешанную стратегию, может гарантировать, что по
крайней мере Вк бомб будет пропущено обороной. Одно­
временно оборона может быть уверена н том, что не бо­
лее Вк бомб проникнет через оборонительные рубежи.
Поскольку нападающий знает смешанную стратегию, вы­
бранную обороной, то Вк является единственным крите­
рием ценности &-ой комбинации средств и, следователь­
но, оборона выберет ту к-ую комбинацию средств, при
которой минимизируется величина Вк. Результирующая
уцелевшая бомбовая нагрузка, В . является ценой всей
игрьи для обеих сторон.
207
РЕШ ЕНИЕ ДЛ Я МОДЕЛИ СБАЛАНСИРОВАННОЙ ОБОРОНЫ

Если число альтернативных стратегий может быть


в результате наблюдения уменьшено до достаточно ма­
лого числа доминирующих стратегий, то уравнения моде­
ли сбалансированной обороньи разрешимы. Такое усло­
вие соблюдается в одном случае, имеющем практическое
значение.
Первым шагом является исключение возможно боль­
шего числа подчиненных стратегий. Для фиксированного
индекса к любой /*-ый тип атаки, удовлетворяющий не­
равенству

5 ] л Л % ,( Я ,) м,
Сг

для ]ф]* и для всех Ки может уверенно рассматривать­


ся как подчиненная стратегия и может быть исключен
из множества доступных стратегий нападения при оцен­
ке к-ой комбинации средств. Подобные стратегии могут
быть легко отобраны. Аналогично любое размещение у*,
такое, что удовлетворяется неравенство

2 (я п < 2 ( ^ >)
Ь=1 1—\
для у ф у* и для любого индекса /, может быть исклю­
чено при оценке к -ой комбинации средств.
И наконец, любая комбинация к * может быть исклю­
чена из рассмотрения, если для к ф к *, при любых значе­
ниях / и при любых значениях у справедливо неравен­
ство

2 С Ч у (Я?0)< 2 ат<%
1=1
Если при каждой к-ой возможной комбинации средств т'к
есть число неподчиненных стратегий нападения, гк — число
.неподчиненных стратегий размещения и 5' — множество
неподчиненных возможных комбинаций средств, то для
стационарной обороны требуется только подсчитать значе­
ния У ткгк и выполнить указанные выше операции.

203
Задача для подвижной обороны может быть сведена
к выражению
В= ттш ттах V /„ V ш(е.Х
к [ в, "

X : т ш 5 й,
/=1
где

= пип шах ^ шуе, сТ “ ^ ] М Х 7 (К?)


/—I
9 ’^ к '
Для фиксированного значения & игра может быть пред­
ставлена матрицей

М, >(</)\
\ВкУМ = М % (Я У = 11^/ (А1у- д |
с/
*=1

У этой матрицы имеется гЛг строк и тк столбцов. Цену


игры Вк можно найти, рассматривая матрицу ||/?а д || как
двойственную задачу линейного программирования и исполь­
зуя стандартную вычислительную программу. Всего будет 5'
таких матриц и 5' решений В к, характеризующих ценность
каждого варианта предполагаемой системы обороны.
Наилучшей системой будет, естественно, та, для которой Вк
имеет наименьшее значение.

ПРИМЕР
Рассмотрим две подвижные системы зенитных управ­
ляемых снарядов. Первая система, которую мы назовем
оружием А , особенно эффективна против высоколетя­
щих целей, в то время как 'вторая система, оружие В ,
наиболее эффективна шротив низколетящих целей. З а ­
дача заключается в определении соотношения количеств
оружия А и оружия 5 , которое обеспечивало бы наибо­
лее эффективную сбалансированную оборону.
Следующая тактическая ситуация считается типич­
ной: точечному объекту угрожает налет истребителей-
209
бомбардировщиков. Атакующие самолеты могут .пытать­
ся проникнуть как на малых высотах (/= 1 ), так и на
больших высотах (/ = 2). Из этих двух возможных типов
атак маловысотный вариант является более «дорогим»
из-за сложности решения вопросов управления и нави­
гации. По этой ‘причине нападающая сторона может вы­
делить только 14 самолетов для атаки на малой высоте
(Мъ=М\=\4\ Сх = 1), -в то время как для проведения
более «дешевого» варианта атаки на 'большой высоте
она может выделить 20 самолетов (М2= 20; С2= 0,7).
С другой стороны, эффективность атаки выше при атаке
на малых высотах, потому что маловысотный истреби­
тель-бомбардировщик обладает вдвое большим разру­
шительным потенциалом, чем высотный (121 = 1, 22= 0,5).
Эффективность обоих типов оборонительного оружия
против истребителей-бомбардировщиков показана в
табл. 1. Стоимость оружия А равна 50 единицам, ору­
жие В стоит 25 единиц, а общий бюджет системы обо-
роны! составляет 100 единиц стоимости.
Первым делом следует перечислить все возможные
комбинации средств
к Количество Количество
оружия А оружия В
1 2 о
2 1 2
3 0 4
Далее необходимо составить платежную матрицу для
каждой возможной комбинации средств. Этот процесс
значительно упрощается, если использовать то обстоя­
тельство, что некоторые значения радиусов боевых по­
рядков являются строго подчиненными стратегиями
(-см. табл. 1). Остаются две наподчиненные стратегии
размещения:
у = 1, оружие А на кольце /? = 0,
оружие В на кольце 7 ? = 10;
у = 2, оружие А на кольце = 10,
оружие В на кольце В = 20.
Тактическая игра, связанная с любой из этих комбинаций,
характеризуется платежной матрицей

II
в ку1II= II*у [ М . - Ы ^ К А ]. <>) - ЛГ<ХУ(<)] ||.
210
Таблица I
Значение потенциала поражения Кц (7^.) для двух типов
оборонительного оружия
Оружие А Оружие В
Радиус коль­
цевого боевого атака атака атака
атака на на большой на малой на большой
порядка, малой высоте высоте высоте высоте
(1=1) (1=2) (/=1) (7=2)

0 0 б 0 0
10 1 2 3 1
20 0 ,5 1 0 ,5 0

Элементы матриц легко подсчитать


}= \ /= 2

к= 1 У= 1 14 4
У= 2 12 8

У =1 /= 2
к= 2 У= 1 8 6
{/ = 2 7 8

/== 1 /= 2
6= 3 у = 1 1 2 8
г/= 2 | 2 8

Третьим шагом является решение тактической игры.


В нашем примере эти решения легко находятся. Если
оптимальные смешанные стратегии оборонь» и нападаю­
щей стороны выразить в виде (//, /г) и (я>ь ^ г), соот­
ветственно, то
к Оптимальная Оптимальная Цена
стратегия стратегия игры
обороны нападения
1 (0,1) (1,0) 12
2 (1/3, 2/3) (2/3, 1/3) 7,33
3 Любая (0,1) 8
из двух
Четвертым и последним шагом является определение
той комбинации оборонительного оружия, при которой

ущерб объекту минимальный. Так как этот ущерб харак­
теризуется ценой соответствующей тактической игры,
очевидно, что оптимальной является комбинация к = 2.
Таким образом, оборона должна состоять из одного
подразделения, оснащенного оружием Л, и двух подраз­
делений, оснащенных оружием В.

СПРАВЕДЛИВОСТЬ СМЕШАННОЙ СТРАТЕГИИ.


ОГРАНИЧЕНИЯ, ПРИСУЩИЕ КРИТЕРИЮ ЭФФЕКТИВНОСТИ

Использование математического ожидания числа про­


пущенных -бомб в качестве критерия эффективности
является серьезным компромиссом. Первое возражение
заключается в том, что потерям нападающей стороны
не {придается никакого веса, за исключением того, что
они влияют на выполнение задачи налета. Это неверно,
потому что самолет, который уцелеет и вернется на свою
базу, о'бладает определенной ценностью, так как он мо­
жет быть использован повторно. Вторая трудность ка­
сается требований, которые теория игр предъявляет
к природе платежной функции. Чтобы смешанные стра­
тегии имели смысл, платежная функция должна описьи-
вать профиль предпочтений игроков *, т. е. должна быть
линейной функцией полезности **. Например, предполо­
жим, что имеются два платежа Л и В, такие, что оборо-
на решает использовать смешанную стратегию, в кото­
рой оба платежа получаются с одинаковой вероят­
ностью 0,5. Для того чтобы эта смешанная стратегия
правильно описывала профиль предпочтений игрока,
необходимо, чтобы значение цены смешанной стратегии
0,5У(Л) +0,5У1(В) было равно среднему значению инди­
видуальных платежей У(0,5Л + 0 ,5 5 ). Иначе говоря,
0,5У (А) + 0,5У (В) = V {ОМ + 0,5В).

* Профиль предпочтений игрока — м нож ество доступны х игро­


ку альтернатив (стратегий), упорядоченное по признаку предпочте­
ния их этим игроком. Н апример, если игрок предпочитает страте­
гию г стратегии х , а стратегию х стратегии у , то его профиль пр ед­
почтения будет К{г, х, у). (Прим, перев.)
** Функция полезности (иШНу 1ипс1юп)— функция, численно
характеризую щ ая предпочтение одной альтернативы (стратегии) по
сравнению с другими альтернативами. Она играет роль критерия,
позволяю щ его устанавливать степень полезности (ценности) различ­
ных альтернатив для лица, принимающего решение. (Прим, перев.)
212
Чтобы пояснить это, рассмотрим следующий стример.
Пусть платежами являются количества бомб, которые
проникают сквозь оборону; пусть А =110 бомб, В = 0 бомб,
С = 5 бомб. Теперь предположим, что объект имеет та­
кую структуру, что бомбардировка менее чем десятью
бомбами приносит незначительный ущерб, но зато бом­
бардировка десятью и большим числом бомб вызывает
полное разрушение объекта. Очевидно, что если оборона
должна выбирать между уверенным платежом в пять
бомб У=У(С) и смешанной стратегией, в которой пла­
тежи в десять бомб и в ноль бомб могут появляться
с одинаковой вероятностью 0,5, то У=0,5У(\А) +0,51/('В),
и обороняющаяся сторона должна предпочесть уверен­
ный платеж в пять бомб. В этом случае
0,5У(10) + 0 ,5 ^ (0 )< 1 /(0 ,5 Х Ю + 0 ,5 Х 0 ) = У(5),
0,5У (А) + 0,51/ (В) С V (0,5А + 0,5 В) = V (С),
и смешанная -платежная функция неточно описывает
профиль предпочтений игрока.
Поэтому задача в том виде, в котором она сформули­
рована, дает лишь качественное описание ситуаций,
в которых:
1) разрушение объекта имеет столь большое значе­
ние для нападающей стороны, что число самолетов, воз­
вращающихся после выполнения задания, имеет сравни­
тельно незначительную важность и
2) ущерб, наносимый объекту, может быть приблизи­
тельно представлен в виде линейной функции от числа
бомб, пронесенных к объекту.
Во многих случаях оба эти условия нарушаются.
Поэтому, если это возможно, желательно сформулиро­
вать более точный критерий эффективности. В некото-
рьих случаях, например, достаточно хорошей платежной
функцией будет математическое ожидание ущерба, по­
несенного обороной, минус математическое ожидание
ущерба, понесенного нападающей стороной. В любом
случае," однако, основной метод решения остается не­
изменным.
Вернемся к вопросу о допустимости применения сме­
шанных стратегий к существующим реальным играм,
когда неблагоприятный исход одного из ходов исключает
возможность повторения партии игры. Если платежная
213
функция точно описывает профиль предпочтений игрока
и если справедливость этого описания инвариантна
к линейным преобразованиям, тогда даже в случае
реальных игр игроки должны предпочесть оптимальную
смешанную стратегию оптимальной чистой стратегии.
Другими словами, истинная платежная функция должна
учитывать важность сохранности объекта. На это мож­
но, вообще говоря, возразить, что такую идеальную пла­
тежную функцию невозможно получить на практике и,
в частности, что функция математического ожидания
числа .пронесенных бомб наверняка не выполняет этого
условия. Следует помнить, однако, что рассматриваемая
проблема касается планирования решения, исход кото­
рого окажет влияние на все множество возможных так­
тических игр. Поэтому в известном смысле тактическая
игра будет повторяться несколько раз, независимо от
того, приведет «ли не -приведет какая-нибудь из партий
к полному уничтожению. Вследствие этого в случае
подвижной обороны вполне оправдано применение сме­
шанных стратегий.

ПРИМЕНЕНИЕ МЕТОДА В ДРУГИХ ОБЛАСТЯХ

Игровая математическая модель, разработанная для


неоднородной локальной обороны, является по суще­
ству моделью оценки комбинации оружия одноцелевого
действия. Ценность любой такой комбинации может
быть выражена через решения соответствующей такти­
ческой игры. Один и тот же общий метод может быть
приложен к целому ряду проблем планирования, смысл
которых заключается в .выборе одной .программы из мно­
жества возможных программ, причем каждая отдельная
программа приводит к своей тактической игре. Суще­
ствует большое количество военных про-блем этого типа:
1. Возможности нападающей и обороняющейся сто
рон изменяются с течением времени. Однако те вариан­
ты! обороны, которьие характеризуются возрастанием ее
мощи, могут в большей или меньшей степени сравни­
ваться с первоначальным построением обороны. Какова
должна быть экономическая 'программа развертывания
обороны, чтобы она удовлетворяла требованиям необхо­
димой эффективности в течение каждого заданного пе­
риода времени?
214
2. Имеется несколько точечных объектов, обладаю­
щих различной важностью. Каков должен быть опти­
мальный оборонительный локальный комплекс?
3. Оборонительные средства 'распределены равномер­
но по заданной площади таким образом, что тип группи­
ровки каждого вида оборонительного оружия можно
характеризовать расстоянием между подразделениями
этих средств. Какова должна быггь их оптимальная ком­
бинация?
4. Нападающая сторона желает увеличить число на­
падающих средств для какой-то одной операции. Какова
должна быть оптимальная комбинация средств нападе­
ния, если задань» характеристики каждого типа оружия
и известна группировка оборонительных средств? Како­
ва должна быть эта оптимальная комбинация, если
действительная группировка обороны неизвестна? (Эта
задача приводит к игре, платежная функция которой
является решением соответствующей тактической игры.)
5. Имеется несколько типов самолетов, отличных от
самолетов, производящих атаку, которые должны про­
никнуть в обороняемый район для того, чтобы выпол­
нить свое задание (например, транспортные самолетьи,
самолеты-разведчики и т. д.). Какова будет их опти­
мальная тактика, имеющая целью проникновение через
систему обороны?
ЗАКЛЮЧЕНИЕ
Проблема оптимального построения неоднородной ло­
кальной системы противовоздушной обороны может
быть сведена к игровой модели. Оборона принимает ре­
шение по выбору некоторого комплекса оборонительного
оружия. Это решение становится известным нападающей
стороне. После этого обе стороны разыгрывают такти­
ческую игру, в которой они стремятся наиболее эффек­
тивно использовать имеющиеся в их распоряжении ком­
плексы оружия. Поскольку тактические игры исполь­
зуются только для оценки различных стратегий плани­
рования, они представлены) в виде некоторой обобщен­
ной ситуации. Абстрактный характер тактической игры
сильно упрощает решение всей проблемы в целом.
Наиболее актуальные тактические ситуации слишком
сложны для игрового анализа. Это привело к распро­
страненному мнению о безнадежности практического
применения теории игр к военным проблемам. Рассмот­
рим типичную проблему планирования комплекса воору­
жения: выбрать такую комбинацию оружия, которая
была бы эффективной во всех (возможных тактических
ситуациях. Если общее число возможных тактических
ситуаций велико, тогда решения по планированию
должны по необходимости базироваться на некотором
абстрактном прототипе типичной тактической ситуации.
Этот прототип обычно сравнительно прост и поэтому
позволяет провести игровой анализ. Таким образом, воз­
можно, что теория игр сделает свой наибольший вклад
в военное дело в области планирования вооружения.
ЛИТЕРАТУРА
1. К. А. В а П е у . АррПсаПопз о ! орегаНопз-гезеагсЬ 1есЬ г^иез 1о
айЪогпе чуеароп з у з 1 е т р1аппт&. ОрегаНопз КезеагсЬ, 1953,
уо1. 1, р. 187— 199.
2. Ь. О. В е г к о V Н 2 а п (1 М. Б г е з Ь е г . О рИ та1 етр1оутеп1:
о! 1ас1[са1 а й Шгсез т Шеа1ег а\т 1азкз; а ^ате-Ш еогеН с апа1у-
313. КезеагсЬ М етогапс1иш К М -1877, ТЬе КАИИ СогрогаНоп,
5ап !а М ош са, 1957.
3. Т. Е. С а у ч у о о б а п<с1 С. X Т Ь о т а з . АррПсаИопз оГ & ате
Шеогу т й^М ег уегзиз Ьош!Ьег сошЬа!. ОрегаЙопз КезеагсЬ,
1955, уо1. 3, р. 402—411.
Т. Э. К э й в у д и С. Д ж . Т о м а с . П рименение теории игр
к воздуш ном у бою м еж ду истребителем и бомбардировщ иком
(см. настоящий сборник).
4. О. В. О а п 12 1 д. А 1^опШ т 1ог сош рийп^ орИтпит сЪзйШийоп
оГ 1оса1 >с!е1еп5е. КезеагсЬ М е т о г а п б и т КМ-914, ТЬе КАИ Э
СогрогаНоп, 5ап1а М ош са, 1952.
5. М. Э г е з Ь е г а п <1 О. О г о з з . Йоса1 ЬеГепзе оГ 1аг^е1з о!
е^иа1 уа1ие. КезеагсЬ М е т о г а п б и т КМ -320, ТЬе К АИ Э Согрога-
Поп, 1950.
6. Э . К. Р и 1 к е г з о п а п б 8. М. Т о Ь п з о п . А 1асИса1 а й & ате.
ОрегаНопз КезеагсЬ, 1957, уо1. 5, р. 704— 712.
Д . Р. Ф у л к е р с о н и С. М. Д ж о н с о н . Тактическая в о з­
душ ная игра (см. настоящий сборник);
7. О. О. Н а у то о о б, 3 г. М Пйагу Й еазю п апб & ат е Шеогу. Оре-
гаНопв КезеагсЬ, 1954, уо1. 2, р. 365— 385.
8. Р. Д . Л ь ю с и X. Р а й ф а. Игры и решения. П еревод с ан­
глийского. И здательство иностранной литературы, 1961.
9. А. К а г с Ь е г е а пс! Р. Н о е Ь е г . С о т Ь а ! р гоЫ етз, чуеароп
з у з 1 е т з апс! Ше Шеогу о Г аИосайоп. О регаНопз КезеагсЬ, 1953,
уо1. 1, р. 286— 302.
10. Д ж . М а к - К и н с и . В ведение в теорию игр. П ер евод с англий­
ского. ГИ Ф М Л , М ., 1960.
11. X Е. \ У а 1 з Ь . 1 п а с ^ и а с у оГ соз! рег „кШ“ аз а т е а з и г е оГ
еГГесиуепезз. О регайоп з КезеагсЬ, 1957, уо1. 5, р. 750— 764.
Д ж . Э. У о л ш . Н едостаточность с т о и м о с т и пораж ения цели в
качестве критерия эффективности (см. настоящий сборник).
216
ПРИМЕНЕНИЕ ТЕОРИИ ИГР
ДЛЯ ОЦЕНКИ АТОМНОГО ОРУЖИЯ
Дж. К Хэйл и X. X. Уик *. С эндиа Корпорейш н, Албукерк,
шт. Нью М ексико

ВВЕДЕНИЕ

Опубликованная за последнее время литература


о выборе и оценке атомного оружия делает уместными
в начале статьи некоторые замечания относительно
использования игрового подхода и теории Ланчестера.
Широко распространен метод оценки вооружения, со­
стоящий в выборе моделей оружия и цели и в подсчете
ущерба. Результаты такого детального расчета после
критической обработки могут оказать помощь при оцен­
ке оружия. Однако имеются основания предполагать, что
в будущих войнах обе стороны будут обладать атомным
оружием и обе стороны будут вынуждены создавать
средства защиты) от его действия. Одним из основных
способов защиты, рассматриваемым в настоящей статье,
является способ расположения противостоящих друг
другу войск на поле боя.
То, что расположение войск играет важную роль,
можно видеть на простом примере. Если войска против­
ника сосредоточены в пределах длинной узкой полосы
близко к нашим войскам, то применение с нашей сторо­
ны атомного оружия большой мощности было бы не­
эффективным. Гораздо эффективнее было бы применить
несколько бомб малой мощности. С другой стороны, при
рассредоточенном расположении войск более эффектив­
ным будет применение оружия большой мощности
(военный аспект рассредоточения войск будет рассмот­
рен позднее).
Эти соображения приводят к необходимости выбора
* X К. Н а 1 е апс1 Н. Н. \ ^ 1 с к е . Ап аррПсаПоп о! д а т е
Шеогу 1о зре<па1 тоеароп еуа1иаНоп. Ыауа1 Н езеагск Ь о^ зН сз <3иаг-
1ег1у, 1957, уо1. 4, р. 347— 356.
217
Мощности атомного оружия и боевых порядков войск.
В настоящей статье рассмотрена простая ситуация, 'в ко­
торую входят эти элементы, для того чтобы получить
хотя бы общие рекомендации 'по этим вопросам. Эта
модель может быть уточнена во многих отношениях, но
даже первое приближение дает понятие о некоторых
тенденциях и указывает на необходимость дальнейших
исследований вопроса.
Наиболее важно, однако, что обе стороны нуждаются
в ответах на эти вопросы (и на многие другие вопросы),
чтобьи избежать поражения. Как нетрудно показать, при­
менение одного типа атомного оружия и одного типа
боевых порядков войск может привести к тяжелым поте­
рям. Легко понять также, что при заданной системе
оружия можно всегда применить такую тактику, которая
сделает неэффективным применение этой системы ору­
жия, если только стороны не вынуждены придерживать­
ся одного определенного типа боевых порядков по
другим соображениям, например, по условиям местно­
сти. Таким образом, следует применять по крайней мере
две различные системы оружия и два различных типа
боевых порядков. Для того чтобы точно установить, какой
стратегии следует придерживаться, самым подходящим
аппаратом, по-видимому, является непрерывная игра,
в которой стратегии каждого игрока состоят из всех воз­
можных комбинаций типов оружия и типов боевых по­
рядков при ограничениях, накладываемых бюджетом,
численностью войск, условиями местности, военными це­
лями и т. д. Такая игра выходит далеко за пределы! воз­
можностей современной вычислительной техники. Поэто­
му в статье мы рассматриваем сильно упрощенный
вариант этой игры.
Следует наложить некоторые ограничения на типы
боевых порядков, которые могут быть использованы.
Например, очень хорошим способом защиты от атомного
оружия было бы рассредоточить войска так, чтобы каж ­
дый солдат находился на расстоянии 100 миль от бли­
жайшего солдата. Очевидно, что с военной точки зрения
такой метод совершенно неэффективен. Для того чтобы
иметь возможность оценивать эффективность боевых
порядков, использована теория Ланчестера. Основная
часть статьи посвящена вопросу о применении этой тео­
рии для оценки боевых порядков.
218
МЕТОД
Предположим, что каждый солдат обладает опреде­
ленной огневой мощью, не зависящей от численности
группы. Как для обороняющейся, так и для атакующей
стороны существует некоторая «основная» группа, чис­
ленность которой наиболее оптимальна с тактической
точки зрения. Поэтому численность групп, входящих
в определенные боевые порядки, измеряется числом та­
ких основных групп и является функцией общей числен­
ности войск и численности основной группы!. Следова­
тельно, можно задаваться потерями, наносимыми каждой
такой основной группе в результате применения атомно­
го оружия. Предположим, что у нападающей сто­
роны имелось п основных групп и что после применения
обороняющейся стороной атомного оружия в каждой
нападающей группе Л* осталось бойцов, каждый из
которых обладает огневой мощью /С*. Предположим
далее, что обороняющаяся сторона состоит из т основ­
ных групп и что после применения нападающей стороной
атомного оружия в каждой обороняющейся группе В%
осталось Шг бойцов, каждый из которых обладает огне­
вой мощью Ь. После этого оставшиеся группы Л* и 0%
вступают в бой друг с другом (характер боя зависит от
расположения войск) *по одной группе с каждой стороны
за один раз. Ожидаемое число уничтоженных бойцов,
как функция продолжительности боя, подчиняется зако­
ну уничтожения Ланчестера, т. е. если группа Л* сра­
жается с группой Ог и если ожидаемое число остающих­
ся бойцов в любой момент времени I равно у (для на­
падающей стороньи) и л: (для обороняющейся сторо­
ны), то

Ж = ~ КУ С)
при начальных условиях
у(0) = тг х (0) = пи
Принимая !во внимание время, в течение которого груп­
пы ведут бои, перегруппировываются и т. д., и многократ­
но повторяя применение этого закона, можно определить
победителя, или, точнее, можно определить ожидаемое
*■ М ож но предполож ить, что огневая мощь каж дого бойца и з­
меняется с изменением численности групп, но мы в нашей статье
полагали, что огневая мощь неизменна.
219
число бойцов, уцелевших на каждой стороне, как
функцию времени. Если назвать «временем уничтоже­
ния» то время, в течение которого одна сторона теряет
полностью своих людей, то в. качестве платежа можно
принять число бойцов, уцелевших у нападающей сторо­
ны, или число бойцов, уцелевших у обороняющейся сто­
роны, по окончании времени уничтожения.
Если ожидаемое число уцелевших бойцов является
неприемлемой платежной функцией, то можно использо­
вать более общие уравнения Ланчестера для вероятно­
сти того, что в момент ^ у нападающей и обороняющейся
сторон остается некоторое определенное число бойцов.
С такими более общими уравнениями можно познако­
миться в статье Дж. Р. Айсбела и У. X. Мэрлоу «Игры
на уничтожение» (см. перевод н настоящем сборнике).
В нашей статье в целях иллюстрации идеи будут исполь­
зованы! только уравнения (1).
Расчеты, связанные с применением общего метода,
описанного выше, очень сложны. Поэтому мы будем
предполагать, что число бойцов, уцелевших непосред­
ственно после боя двух групп, определяется решением
уравнений Ланчестера (1) для времени уничтожения.
Кроме того, предполагается, что ошибки сброса бомб
равны нулю, а отношение К/Ь огневой мощи нападающей
стороны к огневой мощи обороняющейся стороны равно
единице.
Оставшаяся часть статьи посвящена рассмотрению
трех примеров, иллюстрирующих применение этого мето­
да. Хотя деление на основные группы является искус­
ственным, тем не менее полученные результаты содер­
жат полезную информацию.
П РИ М ЕРЫ
1. Атомное оружие имеется только у обороняющейся
стороны
Рассмотрим ситуацию непосредственной поддержки
войск, при которой атомное оружие имеется только
у обороняющейся стороны. Предположим, что оборони­
тельные силы состоят из М человек, каждый из которых
обладает огневой мощью К; псе бойцы размещены
в пределах прямоугольника 600 X 3600 ярдов*. В данной
1 я р д = 0,914 м. (Прим, перев.)
220
задаче конфигурация боевьих порядков обороняющейся
стороны не играет никакой роли. Предположение о пря­
моугольной форме боевых порядков сделано потому, что
эта же форма используется в других примерах. Напа-
3600 Я р д о В
------- :--------- Обороняющиеся
бООярдод __________ силы
--------------------- Л и н и я ф рон т а

бООярдод Я1 _ _ _ _ _ _ _ _ _ _ _ _ _ Н аст уп аю щ и е

бООярдод #2 ' силы


3600ярдод
Рис. 1. Боевая ситуация, в которой у насту­
пающей стороны имеется две группы Л , и Л 2-

дающая сторона с общим численным составом в N бой­


цов, каждый из которых обладает огневой мощью Ь>
распределяет своих бойцов по основным группам, раз­
мещенным в пределах прямоугольников размером
600X3600 ярдов. Таких групп может быть несколько.
Нападающая сторона всегда располагает свои основные
группы так, как показано на рис. 1. Предполагается, что
огневая мощь, приходящаяся на одного бойца нападаю­
щей стороньи, не зависит от распределения общего числа
бойцов N. Кроме того, Ь/К=1.
Перед обороняющейся стороной стоит задача выбора
типа оружия, а перед нападающей стороной — задача
выбора числа основных групп на которое следует раз­
бить свои силы. Для упрощения расчетов предположим,
что в распоряжении обороняющейся стороны имеется
четыре типа атомного оружия, характеристики которых
Таблица 1
Типы оружия, имеющиеся у обороняющейся
стороны

Типы о р у ж и я ............................ 1 2 3 4
Число бомб ............................ 1 2 3 4
Радиус поражения (в ярдах) 1100 950 850 550

приведены в табл. 1, а нападающая сторона может раз­


делить свои силы только на одну, две, три или четыре
группы. Для каждого типа оружия имеется фиксирован-
221
ное множество точек прицеливания, выбранных на неко­
торой линии, параллельной линии фронта (рис. 1) и рас­
положенной так, чтобьи не поразить свои войска. П ред­
полагая, что ошибки бомбометания равны нулю, можно
легко подсчитать эффективность применения данного
типа оружия против любых боевых порядков нападаю­
щей стороны. Иначе говоря, если известно, что боевой
порядок состоит из к основных групп, можно подсчитать
число бойцов нападающей стороны оставшихся
в группе Аи *=1, 2, ..., к , после того, как обороняющаяся
сторона применила атомное оружие типа /, / = 11, 2,..., 4.
Значения этих величин приведены в табл. 2.
Таблица 2
Число бойцов, уцелевших в каждой группе А{ нападающей
стороны после применения обороняющейся стороной атомного
оружия, если нападающая сторона состоит из к основных
групп и имеет общую численность N бойцов
Типы атомного оружия
Число
групп, Группы
к 1 2 3 4

1 А 0 ,6 7 N 0,ЗА/ 0 ,3 4 8 // 0 ,0 6 1 //
2 Ах 0,ЗЗМ 0 ,1 5 3 // 0 , 1 74Л/ 0,031М
Аг 0,19М 0 0 0 ,1 9 7 //
3 Аг 0, 22 N 0 ,0 9 1 // 0 ,1 1 6Л/ 0,021л /1
А2 0 ,1 2 6 N 0 0 0 , 129Л/
А3 0,126л /1 0 ,0 3 1 // 0 ,0 8 7 // о,ззлг
4 Аг 0 ,1 6 7 N 0,076М 0 ,0 8 7 // 0 ,0 1 5 м
А2 0,095М 0 0 0 ,0 9 8 //
Аз 0 ,0 9 5 N 0,035л/1 0 ,0 8 7 // 0 ,2 5 //
А4 0 ,1 6 7 // 0,227Л/ 0 ,2 5 // 0 ,2 5 //
В нашем случае теория Ланчестера применяется сле­
дующим образом. Предположим, что нападающая сто­
рона выбрала боевой порядок с двумя основными груп­
пами, а обороняющаяся сторона выбрала первый тип
оружия. После взрыва у нападающей стороны остается
0,33N бойцов в группе А\ и 0,19М бойцов в группе Л2.
Далее предполагается, что первую атаку производит
группа А и а затем атакует группа Л2, причем каждая
новая атака производится против бойцов обороняющей­
ся стороны, уцелевших после предыдущей атаки. Подоб­
ная тактика согласно теории Ланчестера всегда приво­
дит к полному уничтожению одной группы. Количество
222
бойцов, оставшихся по окончании всех атак, приведено
в табл. 3. Отрицательные числа в таблице соответствуют
уничтожению нападающей стороны. Функция §-(х) =
= (5§п х) | / | л; |* и / / = (Л4/Я)2. Числа, приведенные в таб­
лице, нормализованы относительно N , но это не оказывает
никакого влияния на решение игры.

Таблица 3

Общая платежная матрица игры, в которой атомным


оружием обладает только обороняющаяся сторона
Типы атомного оружия
Число
групп,
к 1 2 3 4

1 8 (0 ,4 4 5 — Я ) 8 (0 ,0 9 0 — Я ) 8 ( 0 ,1 2 1 - Я ) 8 (0 ,0 0 4 — Я )
2 § ( 0 ,1 4 5 - Я ) 8 (0 ,0 2 3 — Я ) 8 (0 ,0 3 0 — Я ) 8 (0 ,0 4 0 — Я )
3 8 (0 ,0 7 0 — Я ) 8 (0 ,0 0 9 — Я ) 8 (0 ,0 2 1 - Я ) 8 ( 0 ,1 2 7 - Я )
4 8 (0 ,0 7 4 — Я ) 8 (0 ,0 5 8 — Я ) 8 (0 ,0 7 8 — Я ) 8 ( 0 ,1 3 5 - Я )

Заметим, что если х 2> х х, то #(лга) (■*!)■ Если же


то § (^2) — & (■*!) = У х 2— у х г > 0. Если
х 2> 0 > х 1, то § (х 2) — § (хг) = У'х1— 1/ | I > 0. И, на­
конец, если 0 > х 2> л : 1, то |л:1| > | л : 2| и § (х2) —§ (л:,) =
= - / Г х 21+ V | х г | > 0. На основании этого легко видеть,
что для любого значения Н все элементы второго столбца
меньше соответствующих элементов первого и третьего
столбцов. Поэтому обороняющаяся сторона никогда не будет
применять оружие первого и третьего типа, и игра сво­
дится к игре с платежной матрицей, приведенной в виде
табл. 4.
Проводя аналогичные рассуждения, можно видеть,
что элементы четвертой строки новой матрицы больше
соответствующих элементов второй и третьей строки для
любого значения Я. Поэтому нападающая сторона ни­
когда не 'будет разделять свои силы на две и три основ­
ных группы. Платежная матрица окончательной игры
дана в табл. 5.
* здп х обозначает алгебраический знак х .
223
Таблица 4 Таблица 5
Платежная матрица игры, Платежная матрица
эквивалентной начальной
игре окончательной игры

Типы атомного оружия в Типы атомного оружия


о.
О

2 4 1 2 4
у
8 (0 ,0 9 0 — Я ) е (0 ,0 0 4 — Я ) 1 ё (0 ,0 9 0 — Я ) ё (0 ,0 0 4 — Я )
8 ( 0 ,0 2 3 - Я ) ё (0 ,0 4 0 — Я ) 4 8 (0 ,0 5 8 — Я ) ё ( 0 ,1 3 5 -Я )
е (0 ,0 0 9 — я ) е (0 ,1 2 7 - Я )
8 (0 ,0 5 8 — Я ) ё (0 ,1 3 5 — Я )

Для любого значения Н оптимальная стратегия на­


падающей стороны состоит в том, что она с некоторой
вероятностью разделяет свои сильи на четыре группы и
с некоторой вероятностью вообще не делит свои силы.
Оптимальная же стратегия обороняющейся стороны со­
стоит в применении оружия второго и четвертого типов
с некоторыми 'вероятностями. На рис. 2 показаны эти
оптимальные стратегии, а также цена игры в зависимо^
сти от (М/ А^)2.
Некоторые точки на этих графиках представляют
особый интерес. Например, точка, в которой цена игры
становится равной нулю, может быть использована для
определения эффективности атомного оружия, выражен­
ной с помощью числа пораженных 'бойцов. Иначе гово­
ря, если обороняющаяся сторона обладает атомным
оружием, а нападающая сторона. нет, тогда обороняю­
щейся стороне достаточно иметь численность бойцов,
равную 0,28 численности 'бойцов нападающей стороны,
чтобы уравновесить силы наступающей стороны.
Можно сказать еще по-другому: если у обеих сторон
вначале имелись одинаковые силы, например по
1000 бойцов, то у обороняющейся стороны останется
950 бойцов, а у нападающей стороны не уцелеет никто.
2. Атомное оружие имеется у обеих сторон
В этом примере условия боя остаются теми же, что
в примере 1, за исключением того, что силы обороняю­
щейся стороны теперь также могут разбиваться на
группы. Кроме того, предполагается, что обороняющаяся
224
Рис. 2. Кривые зависимости решения игры,
в которой атомным оружием обладает толь­
ко обороняющаяся сторона, от отношения
(М1 АО2:
/ — вероятность использования обороняющейся сто­
роной второго типа оружия; 2—вероятность того,
что наступающая сторона разделит свои войска на
четыре группы; 3 — вероятность того, что наступаю­
щая сторона не будет делить свои войска на груп­
пы; 4 — вероятность использования обороняющейся
стороной четвертого типа оружия; 5 —цена игры,
в которой только обороняющаяся сторона обладает
атомным оружием.

225
Сторона лучше защищена от атомного оружия. Поэтому
радиусы поражения оружия наступающей стороньи взяты
меньше, чем для обороняющейся стороньи. В табл. 6
Таблица 6
Типы атомного оружия, имеющиеся у нападающей
и обороняющейся сторон

Типы оружия Типы оружия оборо­


[нападающей стороны няющейся стороны

1 2 1 2
Количество атомного ору­
жия .......................................... 2 4 2 4
Радиус зоны поражения
(в ярдах) . . * ................... 720 400 950 550

приведены характеристики оружия, имеющегося у обеих


сторон. Обе стороны могут либо разбить свои сильи на
четыре основные группы, либо не разбивать их.
Если использовать метод, описанный в примере 1 и
обозначить через (I, /) стратегию, состоящую из выбора
/-го типа оружия и боевого порядка, состоящего из
I групп, то можно вычислить .платежную матрицу, при­
веденную в виде табл. 7.
Применяя те же рассуждения, что и в примере 1,
можно видеть, что для любого значения Н обороняю­
щаяся сторона всегда будет предпочитать стратегию
(1,1) стратегии (|4,1) и стратегию (1,2) стратегии (4,2).
Поэтому такая игра 4X 4 равноценна игре 4X 2 со
стратегиями обороняющейся стороны (1,1) и (Ей). Кро­
ме того, в этой новой игре наступающая сторона будет
Таблица 7
Общая платежная матрица игры, в которой обе стороны
обладают атомным оружием
к , ■ Стратегии обороняющейся стороны
«22
щей С'
Стратег
напада
роны

(1.1) (1,2) (4,1) (4,2)

0.1) ё (0.090—0,620//, ё (0,004—0,620//) ё (0,090-0,101//) ё (0,004—0,101 Н)


(1.2) ё (0,090—0,204//) § (0,004—0,204//) ё (0,090—0,163//) ё (0,004—0,163Н)
(4.1) ё (0,056—0,620//) ё (0,135—0,620//) ё (0,056—0,101//) ё (0,135—0,101//)
(4.2) ё (0,056—0,204//) ё (0,135—0.204Я) ё (0,056—0,163Н) ё (0,135—0,163Н)

226
всегда предпочитать стратегию (1,2) стратегии (1,1)
и стратегию (4,2) стратегии (4,1). Платежная матрица
окончательной игры приведена в виде табл. 8.

Таблица 8

Общая платежная матрица игры, эквивалентной игре,


в которой обе стороны обладают атомным оружием
Стратегии обороняющейся стороны
Стратегии
нападаю-
щей сто­
роны (М ) (1.2)

(1 ,2 ) 8 (0 ,0 9 0 — 0 ,2 0 4 Н) 8 (0 ,0 0 4 —0 ,2 0 4 Н)
(4 ,2 ) 8 (0 ,0 5 6 — 0 .2 0 4 Я ) § (0 ,1 3 5 — 0 ,2 0 4 Н)

Из табл. 8 видно, что для любого значения Н опти­


мальная стратегия' нападающей стороньи должна со­
стоять в применении второго типа атомного оружия и
в построении войск в виде четырех групп или одной
группы! с определенными вероятностями. Обороняю­
щаяся же сторона не должна делить свои войска на
группы и должна применять атомное оружие первого и
второго типов е определенными вероятностями. На
рис. 3 приведены графики зависимости этих оптимальных
стратегий и цены игры от величины (М/Л/)2. Обратите
внимание, что в решение игры 4X4, матрица которой
дана в виде табл. 7, не входят стратегии (11,1) и (4,1)
для нападающей стороны и стратегии (4,1) и (4,2) для
обороняющейся стороны.
Точка на рис. 3, в которой цена игры становится
равной нулю, может служить мерой мощности взрыва
атомной бомбы, выраженной через численный состав
войск. Иначе говоря, если обе стороны обладают атом­
ным оружием и обороняющаяся сторона подвергается ата­
ке без предупреждения, то ей достаточно иметь 0,60 чис­
ленности войск противника, чтобы уравновесить силы
•наступающей стороны.
Можно сказать и по-другому: если у обеих сторон
вначале имелись одинаковые силы, например по
Г 000 бойцов, то у обороняющейся стороны после боя
останется 360 человек, в то время как у наступающей
стороны не уцелеет никто.
227
Рис. 3. Кривые зависимости решения Рис. 4. Возможные програм­
игры, в которой обе стороны обладают мы прицеливания для оборо­
атомным оружием, от няющейся стороны.
отношения (Л4/-/У)2: Прямоугольниками представлены
основные группы наступающей
/ — вероятность применения обороняющейся стороны. Кругами показан эф­
стороной стратегии (1,1); 2 — вероятность при­ фект оружия, применяемого обо­
менения наступающей стороной стратегии роняющейся стороной. Цифрами
(1,2); 3 — вероятность применения наступаю­ обозначены различные ситуации.
щей стороной стратегии (1,2); 4 —вероят­ Силы обороняющейся стороны, не
ность применения обороняющейся стороной показанные на рисунке, располо­
стратегии (1,2); 5 — цена игры, в которой обе жены ниже сил наступающей
стороны обладают атомным оружием. сторрны.

228
3. Оптимальный выбор точек прицеливания
в случае, когда атомное оружие имеется только
у обороняющейся стороны

В этом примере рассматриваются те же условия боя,


что и в первом примере, за исключением того, что у обо­
роняющейся стороны имеется лишь одна система воору­
жения, состоящая из четырех одинаковых атомных бомб
с радиусом поражения '350 ярдов каждая. Обороняю­
щаяся сторона может выбирать одну из пяти возможных
программ прицеливания, показанных на рис. 4. Приме­
няя метод, описанный в примере 1, получим платежную
матрицу игры в виде табл. 9.
Совершенно очевидно, что нападающая сторона
всегда будет предпочитать сосредоточение своих войск
в одну группу, а не разделение их на две группы. Поэто­
му игра сводится к игре 3X5, которая получается исклю­
чением из табл. 9 второй строки.
Таблица 9
Общая платежная матрица игры, в которой обороняющаяся
сторона обладает атомным оружием и имеет возможность
выбирать различные программы прицеливания
Программы прицеливания
групп,
Число

1 2 3 4 5

1 2 (0,445—Я) 8 (0,225-Я ) 8 (0,090-Я ) 8 (0,075—Я) 8 (0,265—Я)


2 8 (0,145—Я) 8 (0,078—Я) 8 (0,036—Я) #(0,060—Я) 2 (0.158-Я *
3 д (0,070- Я ) 8 (0,065-Я ) 8 (0,080—Я) 8 (0,096—Я) 2(0,100—Я)
4 д (0,074—Я) 8 (0,098-Я ) 8 (0,108-Я ) § (0,093—Я) 2 (0.079-Я )

Эта игра имеет решение только для одного значе­


ния Я, а именно для Я =0,08 Цена игры равна 0,076;
нападающая сторона применяет свои стратегии 1, 3 и 4
с вероятностями 0,24, 0,45 и 0,31, а обороняющаяся сто­
рона применяет свои стратегии 1, 3 и 4 с вероятностями
0,21, 0,03 и 0,76.
Интересно отметить изменения цены игры для р аз­
личных совращенных игр при Я =0,08. Если, например,
нападающая сторона может применять только свои
стратегии 7 и 4, то пена игры возрастет до 0,077. Если
же она может применять три стратегии — первую, вто­
рую и четвертую, — то цена игры будет 0,076.
229
Заметим также, что чз оптимальную программу при­
целивания входят не только те методы прицеливания, ко­
торые оптимальны 'против каждого отдельного способа
расположения войск в отдельности.
ЗАКЛЮЧЕНИЕ

В настоящей статье представлен метод комбиниро­


ванного использования классической теории сражения
Ланчестера с теорией игр для выбора оптимальных
стратегий в сражениях с применением атомного оружия.
При использовании этого метода на примере, когда
атомным оружием обладает только обороняющаяся сто­
рона, было показано, что нападающая сторона должна
либо максимально рассредоточить свои силы', либо не
рассредоточивать их совсем. Обороняющаяся сторона
должна использовать смешанную стратегию, состоящую
в применении двух бомб средней мощности или четырех
бомб малой мощности.
Если атомным оружием обладают обе стороньп, то
нападающая сторона должна всегда применять четыре
атомных бомбы малой мощности и смешанную страте­
гию в отношении рассредоточения своих войск. С дру­
гой стороны, обороняющиеся войска не должны рассре­
доточиваться и должны применять смешанную страте­
гию в отношении типа атомного оружия.
В случае, когда у обороняющейся стороны имеется
лишь один тип оружия и когда она стремится оптими­
зировать свою программу прицеливания, показано, что,
оптимальная программа прицеливания включает в себя
не только те программы прицеливания, которые опти­
мальны при действиях против каждого из возможных
способов рассредоточения нападающей стороны.
Модель, рассмотренная в настоящей статье, далека
от действительности. Тем не менее, авторьи считают, что
даже такое элементарное рассмотрение может выявить
интересные тенденции. Модель можно приблизить к дей­
ствительности по двум направлениям— включить в нее
время боевого соприкосновения различных групп (этот
вопрос 'был затронут в начале раздела о методе) и по­
лучить более реалистическую модель основной группы
(этот вопрос также рассматривался в том же разделе).
РАЗДЕЛ ЧЕТВЕРТЫЙ

ПРИМЕНЕНИЕ ТЕОРИИ ИГР


К АНАЛИЗУ ТАНКОВОЙ ДУЭЛИ
Л. Э. Сашриссон *. Ш ведский исследовательский институт
национальной обороны

Предварительная оценка характеристик проектируе­


мого оружия может быть получена, вероятно, наилучшим
образом, если заставить его принять участие в предпо­
лагаемом сражении; особенно часто приходится рассмат­
ривать дуэль между определенным типом оружия и ка­
ким-то противником. В статье описывается модель дуэли
между двумя танками и решается связанная с этой мо­
делью игровая задача. Показано, что имеются возмож­
ности еще большего обобщения модели и что используе­
мые методы пригодньи для анализа других, более общих
боевых ситуаций.

ОБЩИЕ ДОПУЩЕНИЯ
Предположим, что два танка, Л и В, движутся на­
встречу друг другу по прямой линии. Командир каждого
танка может выбирать скорость своего танка от макси­
мального до минимального значения. В интересах после­
дующего математического анализа минимальное значе­
ние скорости должно быть больше нуля. В этом случае
танки не могут отступать, так как это означало бы, что
они движутся с отрицательной скоростью.
Каждый танк может находиться только в одном из
двух возможных состояний: он может быть либо исправ­
ным, либо небоеспособным. Цель каждого участника
дуэли состоит в том, чтобы перевести танк своего про­
тивника из первого состояния во второе. Предполагается,
* Ь. Е. 2 а с Ь г 1 5 3 о п . А {апк с1ие1 \уШ1 ^ате-Ш еогеИ с 1тр Н -
саПопз. № уа1 НезеагсЬ Ь о ^ зИ с з С2иаг1ег1у, 1957, уо1. 4, р. 131— 138.
231
что эффективность огня не зависит от скорости передви­
жения танков. Что касается времени стрельбы, то приня­
то несколько нереальное допущение о том, что вероят­
ность открытия огня в течение небольшого интервала
времени 61 не зависит от момента времени /, пока танк
остается боеспособным. Предполагается также, что у тан­
ков имеются неограниченные запасы боеприпасов.
Вероятность повреждения танка А за время 61 обо­
значим как р(х)61, где х — расстояние между танками.
Обозначим соответствующую вероятность для танка В
через д(\х)б1. Ясно, что р(х) [или д(х)] зависит частично
от собственной бронезащищенности танка А [танка В]
и частично от 'эффективности огня и скорострельности
оружия противника. В рассматриваемой здесь модели
дуэли заложено предположение о том, что величины,
характеризующие бронезащищенность и эффективность
оружия, могут быть так скомбинированы!, чтобы дать
значение такой вероятности.
Танк А имеет скорость и , которая может меняться
от минимального значения и' до максимального значе­
ния и". Для танка В соответствующие величины обозна­
чены через V, V' и V". Когда расстояние между танками
уменьшится до нуля, они не смогут разойтись, и дуэль
продолжается на месте встречи до тех пор, пока не бу­
дет поражен тот или другой танк.
С математической точки зрения наиболее важными
параметрами дуэли являются вероятности 5(х) и Т(х)
того, что танк А или танк В у соответственно, будет по­
ражен в конце дуэли при условии, что оба танка были
невредимыми, когда между ними было расстояние х.
При этом предполагается, что оба танка движутся со
скоростями и(х) и V(x), соответственно.
Так как согласно правилам игры в конце ее должен
быть поражен какой-нибудь один из двух танков, а ве­
роятность одновременного поражения обоих танков рав­
на нулю, то для х ^ О мы получаем
5 (* )+ Э Д = 1 .
Если дуэль начинается на расстоянии х=лго,то
танк А будет стремиться максимизировать Т(х 0). Танк В,
наоборот, стремится максимизировать 5(|Хо) или, соглас­
но только что написанному уравнению, минимизиро­
вать Т(х0). Таким образом, интересы! обоих танков пря-
232
мо противоположны. Это приводит к ситуации, харак­
терной для парной игры с нулевой суммой.
Поэтому с точки зрения танка А функция Т(х 0)
является подходящей функцией распределения в смысле
теории игр. Выбор стратегии в смысле теории игр озна­
чает здесь -выбор скорости танка при условиях, сложив­
шихся в рассматриваемый момент времени, т. е. при
данном расстоянии х и при данной скорости вражеского
танка. Таким образом, выбор стратегии для танка А
сводится к определению функции / двух переменных,
связывающей и с х и V.
и=[(х, V) .
Для танка В, соответственно, выбор стратегии означает
выбор функции
я=ё( х, «)•
Если решить эти два уравнения относительно и и у,
то станет очевидным, что при выборе скорости танка
принимается во внимание только расстояние х. Этот
результат получается из интуитивных соображений, одна­
ко решение нашей проблемы! таково, что ни один из уча­
стников дуэли ничего не выиграет, если будет прини­
мать во внимание скорость вражеского танка. Опреде­
ленная таким образом игра состоит из платежной функ­
ции Т(хо) и стратегий и(х) и п(х) непрерывного, а не
дискретного типа.
Эта игра является игрой с полной информацией (если
не обращать внимания на то, что ни один из противни­
ков не знает, в каком состоянии находится другой про­
тивник в данный момент времени). Поэтому имеется
полное основание предполагать, что игра обладает
седловой точкой. Тем не менее, нельзя заранее утверж­
дать, что это свойство сохраняется и в нашем случае,
так как теорема о том, что игра с полной информацией
имеет седловую точку, была доказана только для дис­
кретных конечных игр. Мы все же докажем, что в на­
шей игре также имеется седловая точка, которая и опре­
деляет оптимальные стратегии.
Утверждение, что пара стратегий {и*(х ), а*(х)} явля­
ется седловой точкой, означает, что при {и*(х ), V*(x)}
функция Т максимальна по й и минимальна по V. Иначе
говоря, это означает, что если танк В придерживается
233,
своей стратегии V*(x), то танк А будет всегда в худшем,
или во всяком случае не в лучшем, положении, если он
откажется от соответствующей своей стратегии [так как
Т (и , V *)< ^ Т (и *, у* ) ] .

ЦЕНТРАЛЬНОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ


Сначала следует получить дифференциальное уравнение
для Т (х). Вероятность того, что танк В будет выведен из
строя на дистанции х - \ - А х , если к этой дистанции оба
танка пришли неповрежденными, равна Т(х- \- Ах). Сле­
дует отметить, что танк В может быть поврежден или
в интервале между х - \ - А х и лс, или позже. Время, за
которое дистанция между танками уменьшается на А х ,
может быть получено из следующего уравнения относи­
тельно А1\
Ах — {и V) А1 + о (Д/), (1)
где, как обычно, о(А1) означает величину, малую по
сравнению с А1, т. е., используя язык математики, можно
сказать, что если к = о{А1), то
П ш -г г = 0.
дг-> о и
Вероятность того, что танк В будет уничтожен в тече­
ние интервала А^, равна дА1-\-о(А1), и аналогично веро­
ятность уничтожения танка А в течение интервала А^
равна р(А1)-\-о(А1). Следовательно, вероятность того, что
в течение этого интервала ни один из танков не будет
поврежден, равна 1 — (р -|- А1 -|- о (АI), так как вероят­
ность того, что они будут повреждены одновременно, равна
о{А1). (Сравните этот вывод с результатами, приведенными
в книге \У. Ре11ег „Ап ЬПгобшПюп 1о РгоЬаЫШу ТЬеогу
апб Из АррПсаНопз*, уо1. 1, р. 386 — 391*.) Поэтому веро­
ятность уничтожения танка В в более позднее время
равна
[ 1 - ( / > + </) Д* + о (Д*)] Г (*),
и, таким образом, мы получаем уравнение
Г (* + Д *) = ?д г + о (ДО 1- (/> + <7) Д '+ о (ДО! Г (•*>•

* См. русский пер. У. Ф е л л е р. В ведение в теорию вероятно-


стей и ее применения, гл. X V II, изд-во иностранной литературы,
1952.
234
Переходя к пределу, получаем
Н т т^ Т П » = % = « - ( р + ч)Т- (2)
«-►о
С учетом уравнения (1) получим
с[Г р + д ( _ л __
6х и + и \р + я (3)

Это и есть искомое дифференциальное уравнение.


Аналогично можно получить второе уравнение
4$ _ ^ Р + д / р
61 и+ V \р + д (3')
Именно из-за этих уравнений нам понадобилось пред­
положить, что и и у не могут одновременно уменьшиться
до нуля, так как в этом случае мы не смогли бы произ­
водить деление на и + у. Поэтому мы и приняли, что
и ^ и'>0 и V х / > 0 .
Складывая уравнения (3) и (3'), получим

(5+ Г)= ^ [1- (5+ Г)]. (3")


Из этого уравнения следует, что если 5>(л:) +Т(х) = 1
для некоторого значения х, то это уравнение удовлетво­
ряется тождественно, так как 5 + Г = 1 является реше­
нием дифференциального уравнения. Тогда, очевидно,
что 5(0) +71(0) = 1. Это означает, что танки не могут
пройти мимо друг друга без того, чтобы один из них
не был уничтожен.
Возвратимся к уравнению (3). Это — дифференциаль­
ное уравнение первого порядка, которое при предполо­
жении, что функции непрерывны, имеет одно и только
одно решение, так как и(х) и V(x) являются функциями
только от х, если значение Т задано для какого-нибудь
одного значения х. Теперь мы можем легко получить
величину Т (0):

т (°)=?(0) • р ( 0) +

Уравнение (4). можно получить также и следующим


образом: когда х становится равным нулю, тогда Г, как
функция от I, является решением уравнения (2). Но так
как Т должна быть здесь независимой от I, то решение
уравнения (2) является постоянной величиной Т( 0).
235
ГИПОТЕЗА О ТН О С И ТЕЛ ЬН О ОПТИМ АЛЬНО ГО РЕШ ЕН И Я

Теперь мы попытаемся обосновать гипотезу относи­


тельно оптимальных стратегий. В дальнейшем мы приве­
дем более строгое доказательство справедливости этой
гипотезы.
Большое значение для нас имеет функция
__ Я(х)
а д р(х) + я(х) • (5 )

В соответствии с уравнением (3) нам могут встретиться


следующие случаи.'
Если Т — /?, то = 0.

Если Т ~ Ж , то ^ -< < 0 .

Если Т<^Я, то ^ - > 0 .


Так как для танка А выгоднее, чтобы Т (л:0) была как
с1Т
можно больше, то в его интересах, чтобы была
как можно больше для любого значения х. Для танка В
справедливо противоположное положение. Согласно приве­
денному выше делению на различные случаи, при Т^>В
с1Т
мы имеем — = 0, и при этих условиях танк А желает
йТ
сделать йх как можно меньше, т. е. сделать как можно

меньше выражение . Чтобы добиться этого, он дол­


жен сделать и как можно больше, т. е. он должен
добиться того, чтобы и = и". Точно так же танк В должен
йТ
сделать как можно больше йх что означает, что он
уменьшает V до возможного предела, т. е. добивается,
чтобы V= V^. При Т перед нами возникает диамет-
йТ
рально противоположная ситуация: в этом случае ^
л
положительна, так что танк А должен сделать

как можно больше, а танк В — как можно меньше. Они


достигают этого, выбирая и, — и! и у =
236
Таким образом, оптимальное управление танком Л
заключается в том, что на некоторых участках он дви­
жется с максимальной скоростью, а на некоторых — с ми­
нимальной. Танк В должен двигаться с минимальной
скоростью, когда танк А движется с максимальной, и
наоборот. Теперь возникает вопрос: при каком значе­
нии х должна 'произойти перемена скоростей? Это
должно произойти, очевидно, при пересечении кривых Т
и Я, так как скорости определены для ТФД, Однако
кривая Т зависит от программы изменения скорости,
которой должны придерживаться противники вплоть до
расстояния л: = 0, а командир танка Л, конечно, не знает

/?,Г

и * макс, I и =мин .
у^мин. | V * макс.
----------------- 1----------------ц—-------х
интервал Д интервал В интервал Д

намерений противника. Единственным разумным отве­


том на вопрос о том, какая же кривая Т должна опре­
делять момент изменения скоростей, является выбор
кривой Т в предположении, что оба танка до конца сле­
дуют оптимальной модели, описанной выше. Таким обра­
зом, мы пришли к следующей гипотезе, иллюстрация
которой дана на рисунке. Каждый из противников
имеет одну-единственную определенную оптимальную
стратегию, а именно, решение уравнения (3) построено
так, что~Г(0)=7?(Ю) и так, что и принимает свое макси­
мальное значение, а V — свое минимальное значение для
Т > Д , в то время как для Т<Д и принимает свое мини­
мальное значение, а V — максимальное. При этом ось х
оказывается разделенной на интервалы Л, в которых
Т > Д , и интервалы 5, в которых Т<Д. Оптимальная
стратегия танка Л состоит в движении с максимальной
скоростью в интервалах Л и с минимальной скоростью —
237
в интервалах В. Оптимальные стратегии танка В проти­
воположны стратегиям танка А. Цена игры» Т(х 0) равна
ординате кривой Т в точке х = х о .
НОВАЯ ФОРМУЛИРОВКА ГИПОТЕЗЫ И ЕЕ ДОКАЗАТЕЛЬСТВО
Сформулируем теперь нашу гипотезу в более общем
виде. Дифференциальное уравнение (3), (рассматривав­
шееся нами, является частным примером класса диффе­
ренциальных уравнений вида

5 7 = /( • * . т>и. у)> (6)


где правая часть является функцией величин, заключен­
ных в скобки. Рассмотрим для некоторого заданного
дифференциального уравнения этого вида следующую
игру между игроками А и В: игрок А может выбирать и
как функцию от х, а игрок В может выбирать V. При
этих выборах и и V и ори соответствующих «предположе­
ниях относительно правой части уравнения (6) это урав­
нение имеет единственное решение, которое принимает
заданное значение Т(0)=То при х = 0. В частности,
функция Т\{х) точно определена для любого значения х.
Игрок А должен максимизировать Т(х 0), а цель игро­
ка В состоит в минимизации этой же функции.
Как легко видеть, только что приведенная формули­
ровка означает, что игроки принимают участие в игре,
«локализованной» в каждой точке (х у Г), причем
игрок А стремится максимизировать функцию / в правой
части уравнения (6), а игрок В стремится минимизиро­
вать ее. Если правая часть, рассматриваемая как
функция параметров и и V, имеет седловую точку, то эти
локальные игры имеют следующее решение:
шахш1п/(д:, Т; и , у) = ш1пш а х[(х, Т ; и , V) = Р(^с, Т).
и V V и
(7)
В уравнении (3) действительно имеется седловая точка,
а именно и — и" и у — х/ для Т^>Я и и = и' и у =
для Т<^Я- Решение первоначальной игры, которая состоит
из локальных игр и которую мы поэтому назовем общей
игрой, получается посредством решения дифференциального
уравнения
% Г = ?(Х ’ П (8)
238
с заранее заданным значением Г*(0) — Т0. Но величина
Т*(х 0), определяемая из уравнения (8), есть цена игры,
а оптимальные значения и(х) и V(x), которые мы обозна­
чим как и*(х) и у*(х), определяются из условия удовлет­
ворения уравнению (7) в каждой точке [х, Г*(х)] инте­
гральной кривой в интервале от х = 0 до х — х 0.
Главную трудность .при строгом математическом ана­
лизе общей задачи представляет доказательство того,
что функции и*(х) и определенные приведенным
выше способом, являются достаточно «хорошими».
В действительности, если производная К(х) имеет толь­
ко конечное число нулевых значений на конечном отрез­
ке оси х , то функции будут кусочно-непрерывными и
даже кусочно-постоянными, и в этом случае затрудне­
ний нет.
Краеугольным камнем доказательства является при­
водимая ниже без доказательства лемма.
Лемма. Если У(х) есть непрерывная дифференцируе­
мая функция, удовлетворяющая условию
14*)], (9)
то функция у(х), являющаяся решением дифференци­
ального уравнения
ЙГ = 8(х, у), (10)
при г/(0) = У(0) никогда не будет меньше , чем У (х)
д л я х > 0 . Здесь предположено, что функция §(х, у)
является достаточно хорошей.
Отождествим У с Г*, у с Т, а § ( х , у) с /[х , Г, и*(х ),
о*(х)], где о(х) есть стратегия, которая отклоняется от
стратегии, соответствующей седловой точке, т. е. о*(х);
тогда
/(х , Т\ и*, о*)<}(х, Т\ и \ о).
Так как производная от Г* по х равна первому члену
этого неравенства при замене Г на Г*, то можно приме­
нить неравенство (9), и поэтому
7 ( х 0) > Г * ( х 0).
Это означает, что если игрок А придерживается стра­
тегии и*'(х), а игрок В использует вместо стратегии
о*(х) другую стратегию о(х), то результирующее зна-
239
чение Т будет больше или во всяком случае не меньше.
Иначе говоря, игрок В ухудшает для себя результат
игры, отказываясь от стратегии у*. Т так же
о ч н о

игрок А ухудшит результат игры для себя, если отка­


жется от стратегии и *. Это, однако, равноценно
утверждению, что стратегии и*(х) и ь*(х) являются
координатами седловой точкц для всей игры с результи­
рующей ценой игры Т*(х о). Таким образом, наша гипо­
теза верна, и игру следует проводить так, как описано
выше.
ЗАМЕЧАНИЯ
Приведем несколько дополнительных замечаний отно­
сительно рассмотренного решения:
1. Оказывается, что оптимальная стратегия в этой
игре состоит в том, чтобьи выбирать оптимальное пове­
дение в каждый момент времени, т. е. чтобы интересы,
преследуемые игроками на ближних и дальних дистан­
циях, совпадали. Следствием этого является то, что дан­
ное решение применимо не только для частного случая,
когда танки начинают сближение с некоторого фиксиро­
ванного значения дистанции Хо, но и для более общего
случая с произвольным значением х 0.
2. Мы можем допустить, чтобьи минимальные скоро­
сти и' и V' равнялись нулю. Структура Т остается неиз­
менной. Стратегия не является единственной, так как
в точке пересечения кривых Т и Я танк, который начал
двигаться с максимальной скоростью, может с таким же
успехом оставаться неподвижным в течение любого вре­
мени. Это следует из уравнения (|2). Здесь р и ^ не
изменяют своего значения, когда танки находятся в дви­
жении. То же самое справедливо и для Т = —/?.
Ясно, что огонь с дальней дистанции обычно менее то­
чен, чем с ближних дистанций, а решение оставаться на
месте потребует большего расхода боеприпасов на даль­
них расстояниях, чем на ближних. Если учитывать снаб­
жение боеприпасами, которым мы до сих пор пренебре­
гали, то задача сильно усложнится.
3. Кривая 7? зависит только от соотношения р и <7,
а не от их суммы. Кривая Г, наоборот, зависит и от сум­
мы. Уравнение (3) показывает, что для больших значе­
ний Т и Я, соответствующих ближним дистанциям, на-
240
клон кривой становится большим, и кривая Г значительно
расходится с кривой Я. Это совпадает с интуитивным
соображением о том, что участник игры вряд ли может
заранее предполагать, как он будет вести себя на близ­
ких расстояниях, а вероятность того, что бой будет за­
кончен на большом расстоянии, довольно велика.

ОБОБЩЕННАЯ МАРКОВСКАЯ ИГРА

Уравнение (6) является обобщением дифференциаль­


ного уравнения, которое мы вывели в начале нашего
анализа модели боя. Теперь можно вернуться к модели
боя и обобщить ее. Можно также рассмотреть случаи,
когда вероятности р и <7 зависят от скоростей и
и V при условии, что для любого значения 0 < л; < л;о и
любого значения 0 < Г < 1 правая часть уравнения (3)
имеет седловую точку в плоскости и, V. Например, если
у танка В нет гироскопической стабилизации или она
недостаточна, то вероятность поражения танка А ста­
новится функцией скорости танка 5 . В этом случае, если
танк А имеет совершенную гироскопическую стабилиза­
цию, задача имеет седловую точку и разрешима.
Другое обобщение, открывающее широкие перспекти­
вы для увеличения числа ситуаций, состоит в том, что
танк может находиться иногда в промежуточных поло­
жениях, когда цена игры сильно уменьшается, но не
падает до нуля. Отсюда легко перейти к рассмотрению
более общих боевых ситуаций.
Предположим, что боевая ситуация между двумя
противными сторонами может существовать только при
конечном числе условий, которым мы дадим номера
1, 2,..., АЛ Эти условия могут- заключаться в выборе
определенного боекомплекта или географического поло­
жения. Сторона А стремится довести бой до такого ко­
нечного состояния, при котором противная сторона В
будет уничтожена. Сторона В имеет противоположную
цель.
Если бой характеризуется условием то вероятность
того, что он за время М перейдет в состояние /, равна
/*г\7-Д^ + о(Л^). Вероятность перехода гц зависит от некото­
рых параметров к\, Лг,... (параметров А), которыми
управляет сторона А, и от других параметров (ы, кото­
241
рыми управляет сторона В. Таким образом, задача со­
стоит в следующем: существует ли у стороны А выбор
•параметров Я, а у стороны В — выбор параметров ц,
которые давали бы наилучшие -результаты, соответ­
ствующие их задачам в этом бою?
Можно, оказывается, составить систему дифферен­
циальных уравнений, в которых зависимыми переменны­
ми были бы вероятности ГД/) победы стороны Л, если
бой в момент времени I находится в /-ом состоянии
(/= 1 , 2, ..., 14). Здесь гц входят .в виде коэффициентов.
Эта система уравнений является обобщением уравне­
ния (3).
В конце концов, если мьи 'будем анализировать бой
•по вышеописанной схеме, мы придем к рассмотрению
такой модели, которую можно было бы назвать «мар-
ковским боем». Цепь Маркова может рассматриваться
как последовательность ситуаций, характеризуемые
матрицей вероятностей перехода. В марковской игре эти
вероятности перехода зависят от множеств параметров,
контролируемых игроками. Для того чтобы у игры была
нулевая сумма, вероятность того, что игра закончится
положением, не предусмотренным правилами игры,
должна равняться нулю.
ПРИМЕНЕНИЕ ТЕОРИИ ИГР
К ВОЗДУШНОМУ БОЮ
МЕЖДУ ИСТРЕБИТЕЛЕМ И БОМБАРДИРОВЩИКОМ
Т. Э. Кэйвуд и С. Дж. Томас *. Институт исследования
воздуш ного оруж ия, Чикагский университет, Чикаго, шт. Иллинойс

В своей книге «Теория игр и экономное поведение»


Джон фон Нейман и Оскар Моргенштерн указали на
возможность 'применения теории игр к военным пробле­
мам’. Вслед за окончанием второй мировой войны раз­
личные организации, занимающиеся оценкой систем во­
оружения, действительно начали применять основные
идеи 'парных игр с нулевой суммой к исследованию воз­
душного боя между истребителем и бомбардировщиком
и раз-вивать методы решения бесконечных игр как -полез­
ных моделей сражений этого вида.
Основой настоящей статьи является работа, прове­
денная ее авторами в Институте исследования воздуш­
ного оружия при Чикагском университете. Другие рабо­
ты, связанные с представленным здесь материалом,
указаны в библиографии.
Теория игр является хорошим аппаратом оценки
перспективных или проектируемых систем -вооружения.
Такие оценки обычно основаны на расчетные характери­
стиках этих систем- при типичных боевых условиях. Вы­
числение этих характеристик неизбежно требует указа­
ния определенных тактик, которьие сравнительно легко
поддаются изменениям со стороны любого из противни­
ков. Имеет смысл предположить, что оба эти -противника
являются «разумными» сеточки зрения теории игр.
Хотя в статье рассматривается один частный тип
систем вооружения, а именно система вооружения оди­
ночного самолета, тем не менее основные идеи можно
* Т. Е. С а у ч у о о с ! апН С. «Г, Т Ь о т а з . А ррП сабопз оГ 1Ье
&атпе Шеогу ш уегзиз Ь отЬег сотЪ а!. ОрегаПопз КезеагсЬ,
1955, уо1. 3, ,р. 402— 411.
243
непосредственно применить к другим системам. Однако
в целях ясности изложения мы не будем касаться этих
обобщений.
Система наступательного оружия самолета-перехват­
чика и система оборонительного оружия бомбардиров­
щика созданьи для осуществления воздушного боя между
перехватчиком и бомбардировщиком. Мы будем рас­
сматривать воздушный бой одиночного перехватчика
против одиночного бомбардировщика, оправдывая себя
тем, что такой бой является составной частью более
сложной воздушной операции. Для наших целей необхо­
димо фиксировать большинство факторов такого боя,
Например, мы будем считать постоянными тип, скорость,
высоту и курс полета рассматриваемого самолета, свой­
ства и характеристики его вооружения, включая бое­
комплект, точность системы управления огнем и полную
эффективность залпа. Позднее мы будем варьировать
количество бортового оружия для того, чтобы опреде­
лить оптимальное значение этого количества, но сейчас
мы просим читателя считать его неизменным. Даже
когда значения всех этих переменных фиксированы (как
это могло бы быть для уже построенного самолета), оба
противника имеют в своем распоряжении выбор опреде­
ленных тактик, которые могут кардинально изменять
исход 'боя. Эти выборы! касаются дистанции открытия
огня и порядка изменения темпа стрельбы во время боя.
Выбор такой тактики на основе теории игр позволяет
обоим противникам вести огонь наиболее оптимальным
образом.
Для успешного применения теории игр к подобной
проблеме потребовалось предположить, что игра имеет
нулевую сумму. Будущие исследования, вероятно, позво­
лят снять это ограничение. В настоящее же время при­
ходится предположить, что платежная функция одинако­
ва для обоих противников и что их цели противополож­
ны. В нашем случае в качестве такой платежной функ­
ции выбрана вероятность поражения бомбардировщика.
Перехватчик желает максимизировать, а бомбардиров­
щ ик— минимизировать этот платеж. Точно так же могут
быть рассмотрены другие типы платежных функций, та­
кие как вероятность поражения перехватчика или
математическое ожидание времени' выживания бомбар­
дировщика. Здесь уместно указать еще на одно условие.
244
Предполагается, что каждый противник не в состоянии
продолжать бой после того, как он поражен. Поэтому
оружие бомбардировщика имеет своим назначением
уничтожение перехватчика до того, как перехватчик сам
собьет бомбардировщик.
Рассмотрим один пример, показывающий, почему со­
вместное рассмотрение программ ведения огня перехват­
чика и бомбардировщика может иметь большое значе­
ние. Предположим, что две системы вооружения, подле­
жащие сравнению, одинаковы во всех отношениях, за
исключением вида зависимости, связывающе