Вы находитесь на странице: 1из 213

В.

Босс

ПЕкqии по
МАТЕМАТИКЕ
ОпmuмuзаЦUII

Издание второе, стереотипное

MOC~
- - URSS I~I
ББК 22.18я73

Босс В.

Лекции по математике. Т. 7: ОП11lМИ18UИJ1: Учебное пособие. Изд. 2-е. стерео­


типное. - М.: КомКнига, 2007. - 216 с.

Книга охватывает классические разделы теории экстремальных зздач: услов­


ная и безусловная оптимизаuия, выпуклые задачи, вариаuионное исчисление,
принuип максимума, динамическое программирование. Рассматриваются также
нетрадиuионные дЛя оптимизаuии области: бифуркаuии, катастрофы, теория игр.
Отдельного упоминания заслуживают методы асимптотического агрегирования
ДЛЯ задач большой размерности.
Изложение отличается краткостью и прозрачностью.
Для студентов, преподавателей, инженеров и научных работников.

И1llaтеЛЬСТ80 .КомКн"га •. 117312. г. Москва. пр-т 6О-лет". Октябр •• 9.


Формат 60)( 90/16. Бумага офсетна•. Печ. л. 1),5.

Отпечатано а 000 оЛЕНАНД•. 117312. г. Москаа. пр-т 6О-лет". Октября. д. (IA. стр. 11.

13-значныli ISBN. вводнмыli с 2007 Г.: © КомКнига, 2006, 2007


ISBN 978-5-484-00873-5
Соотв. IO-значныli ISBN. прнменяемыli до 2007 Г.:
ISBN 5-484-00873-5

НАУЧНАЯ И УЧЕБНАЯЛИТЕРАТУРА

~
E~: URSSO\JRSS.ru 435107 ID 41731

j~l~Ш~ l~I~~l~J
кsтвnor И3Д8НИЙ 8 Иtm!pИlml:

http://URSS.ru
Тen.Jфaкc: 7 (495) 135-42-16
URSS ТenJфакс: 7 (495) 135-42-46
Оглавление

Предисловие к .Лекциям. . . . . . . . . . . . . . . . . . . . . . . . . .. 7
Предисловие к седьмому тОму. . . . . . . . . . . . . . . . . . . . . . .. 9
Глава 1. КрИ11lческие точки и rpадиентиые поля. . . . . . . . . .. 10
1.1. Безусловный экстремум 10
1.2. Достаточные условия . . . . . . . . . . . . . . . . . . . . .. 13
1.3. Градиентные поля . . . . . . . . . . . . . . . . . . . . . . .. 15
1.4. Минуя бифуркации. . . . . . . . . . . . . . . . . . . . . .. 18
1.5. Глобальный оптимум . . . . . . . . . . . . . . . . . . . . .. 19
1.6. Деформации градиентных систем 22
1.7. Топология градиентного поля . . . . . . . . . . . . . . .. 25
1.8. Комментарии и дополнения . . . . . . . . . . . . . . . .. 29
lЛава 2. Условная минимизация . . . . . . . . . . . . . . . . . . . . .. 30
2.1. Условный экстремум . . . . . . . . . . . . . . . . . .
30 . . ..
2.2. Общий случай. . . . . . . . . . . . . . . . . . . . . . .
34 . . ..
2.3. Нелинейное программирование . . . . . . . . . . .
36 . . ..
2.4. Вопросы существования. . . . . . . . . . . . . . . .
38 . . ..
2.5. Достаточные условия . . . . . . . . . . . . . . . . . .
39 . . ..
2.6. Интерпретация множителей Лагранжа 41
2.7.•ДвоЙственные.задачи 43
2.8. Принцип Ле Шателье-Самуэльсона . . . . . . . . . .. 44
2.9. Штрафные функции . . . . . . . . . . . . . . . . . . . . .. 45
2.10. Механика и обобщенные координаты 47

2.11. Примеры . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 49
lЛава 3. Выпуклый анализ . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.1. Векторы и матрицы . . . . . .. . .. . . . . . . . . . . . .. 52
3.2. Выпуклые множества и конусы . . . . . . . . . . . . . .. 53
3.3. Выпуклые функции. . . . . . . . . . . . . . . . . . . . . .. 58
3.4. Субградиент и субдифференциал . . . . . . . . . . . . .. 61
4 Оглавление

3.5. Сопряженные функции . . . . . . . . . . . . . . . . . . .. 64


3.6. Теорема Хелли 67
lЛава 4. Выпуклое проrpаммирование . . . . . . . . . . . . . . . . ., 69
4.1. Теорема Куна- Таккера 69
4.2. Двойственность. . .. . .. .. . . . . . .
71 . . . . . . . . . ..
4.3. Теорема о минимаксе . . . . . . . . . . .
72 . . . . . . . . . ..
4.4. Разрешимость неравенств . . . . . . . .
75 . . . . . . . . . ..
4.5. Линейное программирование . . . . .
77 . . . . . . . . . ..
4.6. Геометрическая интерпретация .
80 . . . . . . . . . ..
4.7. Двойственность линейных задач 81
4.8. Экономическая интерпретация . . . . . . . . . . . . . .. 85
4.9. Транспортная задача 86
4.10. Максимальный поток в сети . . . . . . . . . . . . . . . .. 88
4.11. Симплекс-метод и алгоритм Хачияна . . . . . . . . . .. 89
4.12. Квадратичное программирование 91
lЛава s. Теория иrp . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 92
5.1. Смешанные стратегии . .. . . . . . . . . . . . . . . . . .. 92
5.2. Равновесие по Нэшу . . . . . . . . . . . . . . . . . . . . . . 95
5.3. Метаиrpoвой синтез. . . . . . . . . . . . . . . . . . . . . .. 97
5.4. Оптимум Парето . . . . . . . . . . . . . . . . . . . . . . . . . 99
lЛава 6. Бифуркации и катастрофы 101
6.1. Скачкообразные изменения 1О 1
6.2. Хвосты и струи 104
6.3. Лемма Морса 105
6.4. Эквивалентность особенностей 107
6.5. Грубость и трансверсальность 109
6.6. Структурно устойчивые семейства 111
6.7. Спекуляции и приложения 113
6.8. Дополнение 116
lЛава 7. Вариационное исчисление 118
7.1. Классические задачи 118
7.2. Уравнение Эйлера 120
7.3. Преимущества наивной теории 126
Оглавление 5

7.4. Условия второго порядка . . . . . . . . . . . . . . . . 128


7.5. Достаточные условия 131
7.6. Свободные концы и трансверсальность 134
7.7. Изопериметрические задачи 135
7.8. Условный экстремум 138
7.9. Гамильтонов формализм 139
7.10. Взаимная сводимость задач 142
7.11. Проблема существования 143

DJaBa 8. Задачи оптимального управленИJl . • . • • • . . • • . . . • • 146


8.1. Принятые стандарты 146
8.2. Принцип максимума 147
8.3. Линейные системы 150
8.4. Системы с дискретным временем 150
8.5. Динамическое программирование 153
8.6. Многошаговые процессы 155
8.7. Критические пути и сетевые графики 156

DJaBa 9. НеГЛaдкlJl ОППlМИ:JaЦИJl .•..••..•...•.•...... 158


9.1. Гуманитарные аспекты 158
9.2. Субдифференциал Кларка 160
9.3. Барьер дифференцируемости 161

DJaBa 10. Численные методы .....•..•..•.......•.••• 164


10.1. Градиентные алгоритмы 164
10.2. Себестоимость комфорта 166
10.3. Метод Ньютона-Канторовича 167
10.4. Метод сопряженных градиентов 168
10.5. Почему трудно сделать хороший автомобиль 170

DJaBa 11. Задачи большой раэмернOC11I . . . . . . . . . . . . . . . • . . 172


11.1. Оптимизация и агрегирование 172
11.2. Согласование задач 175
11.3. Термодинамические потенциалы 180
11.4. Реакция на внешние воздействия 183
11.5. Оптимизация инеопределенность 185
6 Оглавление

lЛава 12. Сводка определений и ре1уЛЬтатов 187


12.1. Критические точки и грanиентные поля 187
12.2. Условная минимизация 188
12.3. Выпуклый анализ 190
12.4. Выпуклое программирование 193
12.5. Теория игр 196
12.6. Бифуркации и катастрофы 197
12.7. Вариационное исчисление 199
12.8. Зanачи оптимального управления 202
12.9. Неглanкая оптимизация 203
12.10. Грanиентные методы 204
12.1 J. Задачи большой размерности 205
Сокращении и 0б01начеиии. . . . . . . . . . . . . . . . . . . . . . . . . . 207
Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
Предметный ука:J8тель 211
Предисловие к «ЛеКЦИRМ»

Если человек не понимает про­


блемы, он пишет много формул.

НилЬе Бор

Для нормального изучения любого математического предмета не­


обходимы, по крайней мере, 4 ингредиента:
1) жиtlой учитель;
2) обыкновенный nодр06ный )"Ie6HUK;
3) РRдotюй задачник;
4) )"Ie6HUK, осtю60ждeнный om рутины. но дающий общую I(QpmUHy, мomиtlы, CtlRJU •
• что зачем-.

До четвертого пункта у системы образования руки не дохо­


дили. Конечно, подобная задача иногда ставилась ирешалась,
но в большинстве случаев - при параллельном исполнении функ­
ций обыкновенного учебника. Акценты из-за перегрузки менялись,
и намерения со второй-третьей главы начинали дрейфовать, не до­
стигая результата. В виртуальном пространстве так бывает. Аналог
объединения гантели с теннисной ракеткой перестает решать обе
задачи, хотя это не сразу бросается в глаза.

«Лекции. ставят 4-й пункт своей главной целью. Сопутствую­


щая идея - экономия слов и средств. Правда, на фоне деклараций
о краткости и ясности изложения предполагаемое издание около

20 томов может по казаться тяжеловесным, но это связано с обшир­


ностью математики, а не с перегрузкой деталями.

Необходимо сказать, на кого рассчитано. Orвет «на всех. вы­


глядит наивно, но он в какой-то мере отражает суть дела. Обо­
зримый вид, обнаженные конструкции доказателы:тв, - такого
сорта книги удобно иметь под рукой. Не секрет, что специалисты
самой высокой категории тратят массу сил и времени на освоение
математических секторов, лежащих за рамками собственной спе­
циализации. Здесь же ко многим проблемам предлагается короткая
8 Предисловие к «Лекциям»

дорога, позволяющая быстро освоить новые области и освежить


старые. Для начинающих «короткие дороги. тем более полезны,
поскольку облегчают движение любыми другими путями.
В вопросе «на кого рассчитано., - есть и ДРУГОЙ аспект.
На сильных или слабых? На среДНИЙ вуз или физтех? Опять-таки
выходит «на всех •. Звучит странно, но речь не идет о регламентации
кругозора. Простым языком, коротко и прозрачно описывается
предмет. Из этого каЖдЫЙ извлечет свое и двинется дальше.

Наконец, последнее. В условиях инФормационного наводнения


инструменты вчерашнего дня перестают работать. Не потому, что
изучаемые дисциплины чересчур разрослись, а потому, что новых

секторов жизни стало слишком много. И в этих условиях мало


кто готов уделять много времени чему-то одному. Поэтому учить
всему - надо как-то иначе. «.Лекции. дают при мер. ПЛОХОЙ ли,
ХОРОШИЙ - покажет время. Но в любом случае, это продукт нового
поколения. Те же «колеса., тот же «руль., та же математическая
суть, - но по-другому.
Предисловие к седьмому тому

Жизнь nод nредлozoм onтuмиЗQ­


ции компенсирует HenOНUМOHиe сути.

Поле непрерывных экстремальных задач на данный момент хорошо


перепахано .•Самородки. с поверхности более-менее подобраны,
но притягательный потенциал области все же сохраняется, по­
скольку оптимизация часто оказывается единственным способом
придать задаче осмысленный вид.
Что касается литературы, ситуация ухудшается обычным об­
разом. Чем более высоких стандартов достигает теория, тем не­
понятнее становятся книги. А для написания простых учебников
недостает энтузиазма и вдохновения, присущих этапу рождения

идеологии и снятия пенок. Данный курс имеет целью восполнить


дефицит по части простого и ясного изложения предмета.
Гi1эsэ 1

Критические точки и градиентные поля

Философски выражаясь, экстремальные эадачи нужны не ДIIЯ того, чтобы их


решать. Они сушествуют, дабы служить nО'Juцuеu и направлять мысль. Однако
рассказывать приходится - как будто все наоборот. Иногда и жить так приходится.

1.1. Безусловный экстремум

Оптимизация - та область, где мотивы ясны, а оправдания излиш­


ни. В багаже каждого есть при меры из фольклора и личного опыта.
Поэтому изложение можно начинать с более-менее формализован­
ной постановки задачи.
Пока речь будет идти о конечномерной теории и о точках Х·,
обеспечивающих максимальное (или минимальное) значение не­
прерывной функции

'Р(Х) , Х = {XI, ... , Х П } Е IRn •


При этом задачу описывают как 'Р(Х) I -t mах (min) 1.
Функцию 'Р(ж) часто называют Функцuоналом по аналогии с бесконечно­
мерным случаем. Употребление термина .функцuонал. в конечномерном варианте
подчеркивает, что речь идет о СКWlярноА функuии I{J : R- -+ R.

Если Х· обеспечивает максимум 'р(Х) по сравнению с близ­


лежащими точками Х, говорят о локалЬНО'м ,Максиму,Ме; если -
по сравнению с любыми Х '# Х·, говорят о глобально'м ,Максиму,Ме.
В главе функция 'р(Х) предполагается гладкой 1). Для образного
виденья ситуации - это наиболее удобный вариант. Ключом к ана­
лизу служит понятие градиента.

1) В пределах данного тома под гладкостью подразумевается непрерывная диф­


ференuируемость. каковая далеко не И1llИWНЯ в данном коитексте. Фуикuия
'I'(ж) = 2ж 2 + ж 2 siп (l/ж 2 ) имеет в нуле строги А минимум и равную иулю проиэвод­
ную, но (!) tI СКOJIО ylOднo ..,алой OКfl«"'НOCnlU НУЛR "puН/JJIlое"" КОК IIоложu",елОНl1lе,
"'ОК u OtrIРU/l,о",елОНl1lе ЗНОlfеНUR.
1.1. Безусловный экстремум 11

Рассмотрим случаА '" : к ~ R как наиболее наглядныА. ПPOU38однаR a~


2

функции u = "'(2:,,) по наnраtlAению единичного вектора , = {'''' ,~} равна


производноА функции ЩВ) = ",(ж + В,"' 7/ + B,~) в нуле 2),
, d д", д",
а, = d/J"'(Ж + В,,,, 7/ + B,~) = дж'" + д7/ ,~. (1.1)

ВеК1Ор

= { дж'
д", д"'}
grad '" ду

называют градиентом функции "'. Для градиента используют тalOКe обозначение


V'" (читается .набла фи.). Из (1.1) следует, что проиэводную по направлению,
можно записать как скалярное произведение

a~ = , . grad "'. ( 1.2)


Максимум (1.2), в силу ,. grad '" = coso ·11 grad ",11, достигается, когда о = О,
т. е. единичныА вeкrop , совпадает по направлению с градиен1ОМ, и равен,
соответственно, IIV",II. Таким образом, градиент V'" - 310 вектор скорости
JIIаксиJIIQЛЬНOlO роста функции "'. Следовательно, в К3ЖдоА точке nOflepxнocmu
nocmoRHHOlO УJXИlНR,
",(Ж, 7/) = сопst,
градиент V'" перпендикуляренэтой поверхности (направлен по нормали). Таким
образом, касательная плоскость - проходиwая через 1Очку {Жо,7Io} - к линиям
ПОС1Оянноro уровня функции u = ",(Ж, 7/), описывается уравнением (на рис. 1.1
это пунктирная прямая)

д", д",
-(ж - ЖО) + -(7/-7/0) = О.
дж д7/

Если интерес представляет


касательная плоскость к поверх­
2:
ности графика функции

u = ",(ж, 7/),
10 это сводится К предыдущему

случаю рассмотрением функции

"=u - ",(ж, 7/) трех переменных. Рис. 1.1


Ее градиент

V"= {I , _д", _ д", } .


дж' д7/

2) дnя удобства чтения вместо ссылок на предыдущие тома некоторые фрагменты


из [5.6) uecb ВОСПРОИЗВОДЯТСЯС ПОдХодящими контексту видоизменениями.
12 Глава 1. Критические точки и градиентные поля

Поэтому касательная плоскость к поверхности u = V'(Ж. у) в точке {uo, жо, уо}


определяется уравнением

lJV' lJV'
u- uo = дж (ж - жо) + IJY (у - 110)·

Orrалкиваясь от двумерного случая, легко записать общее уравнение каса­


тельной плоскости в RA К поверхности постоянного уровня в точке жо:

VV'(Ж) • (ж - жо) = о, I
где VV' = {::. ..... :~}.
Уравнение касательной в к n + ' к поверхности графика u = V'(Ж) в точке
{uo, жо}, uo = СР(Жо):
I u - uo = VV'(Ж) . (ж - жо)· I
Теорема о Cpe.IUIeМ. Применяя теорему Лагранжа к функuии скалярного apryмeHТ8

~(1') = V'[Ж + 1'(у- ж»).


получаем

, ~ IJV'(z)
~(I) - ~(O) = ~ (8) = LJ ~(Yi - жi) = VV'(z)' (у- Ж),
i Ж.

где z = ж + 8(у - ж) при не котором 8Е (О, 1). Таким образом.

I V'(y) - V'(Ж) = VV'(z)· (у- ж).


Отсюда следует формула конечною npuращенuя:

V'(Ж + ~ж) - V'(Ж) = VV'(Ж) . ~ж + о(ll~жЮ.

1.1.1. Теорема. Если 'Р(х) 8 точке х· дифференцируема и прини­


мает локалЬНО экстремальное (максuмальное Wlи минuмальное) значе-
ние), то Vtp(x·) = О.
... 8 двумерном случае линии постоянного уровня функции u = V'(ЖI' Ж2)
в районе локального максимума ВЫГЛЯдЯт примерно как на рис. 1.2. Замкнутые

)1 О локмьном максимуме u = Ip(ж) а точке ж· roворят, Korдa Ip(ж) < Ip(ж·) дЛЯ
ж 1= ж· и3 некотороА окрестности точки ж· . При замене неравенства на Ip(ж) ~ Ip(ж·)
roворят о несmfJOlON или нeu:ЮЛU{JOгОНIЮN максимуме.
1.2. Достаточные условия 13

КОН1УРы стягиваются К центру, в котором градиент

.вынуждеНt быть напраRllен сразу во все сторо­


ны, что возможно лишь при еro обнулении. Еше
Qll,Ин аргумент: при ненулet10М градиенте «егдо мож­
но сдвинутьсн tiдoль градиента, Yt/ели'lиtlaR 3Ha'leHue Рис. 1.2
функции 4). ~

Точки, в которых градиент обращается в нуль, называюткрити­


ческими, или cтaциoHapHbLМи. Их многообразие, разумеется, не ис­
черпывается экстремумами, - и в поле зрения, как побочный
эффект, появляются разные nерегибы, седловые точки и прочие
«неприятности •. Но любые второстепенные явления при перемене
позииии становятся главными. Такая же метаморфоза происходит
с ассортиментом критических точек на «другой территории. (би­
фуркаиии, катастрофы, - глава 6).

(!) Теорема 1. 1. 1 дает лишь необходимые условuя оптимума.


но фактически их, как nравuло, достаточно для решения задачи. При­
чина заключается в том, что условие V'"о(ж·) = О для экстремальной
точки - обязательно. Поэтому искомое критическое значение ж·
неизбежно попадает в число решений системы уравнений V'"о(ж) = О.
Последняя в «ситуациях общею nоложени1l» имеет либо одно, либо
несколько решений. В любом случае «круг nодозреваемЫХ» достаточно
узок, чтобы оставшуюся часть задачи - при наличии оптимизма
и везения - считать чисто технической.

1.2. Достаточные условия

Как и в одномерном случае, где оптимум оиенивается по знаку вто­


'рой производной, В общей ситуаиии тоже можно судить о характере
критической точки по квадратичной части в разложении Тэйлора,

4) На этой идее основаны J1)IUIиентные методы поиска экстреМВllьных точек.


Движение по J1)IUIиеlП)' или под острым yrnoM к J1)IUIиенту увеличивает значение
целевой функции.
14 Глава 1. Критические точки и градиентные поля

Если второй дифференциал, называемый гессианом, положи­


тельно определен, т. е.

2
"'"
L- д D.дrp . t1Жit1Жj >О при t1ж::/= о,
.. ж, ж,
','
то в критической точке ж* - минимум S), ибо в малой окрестности
ж* будет rp(ж* + t1ж) > rp(ж*), потому что Vrp(ж*) = О.
2
D rp ] вырождена, ситуация принци-
Если матрица Гессе 6) [ дж;дЖj

пиально усложняется. В скалярном случае о характере критической


точки можно судить по первому ненулевому члену ряда ТэЙлора.
Для функций n переменных дело обстоит совершенно иным обра­
зом. Вопрос решается в теории катастроф (глава 6).

Предвидеть трудности (но не их масштаб) довольно легко. Понятно, что


в отсутствие знакоопределенности дифференциалов порядка выше второго - по­
верхности их вырождения MOryr наlUlaдblВ3ТЬСЯдрут на друта весьма разнообразно,
в результате чего аномалии становятся нормой.

Островок порядка характеризуется невырожденнымu критиче­


скими точками, в которых невырожденнысоответствующиематри­

цы Гессе. Классическаялемма Морса 7) гарантирует существование


в некоторой окрестности V критической точки - локальной си-
8)
стемы координат жl, ... , ж п , такои что
u

Функция вида (1.3) называется морсовским l-седлом. В случае


l =О имеем максимум, при l =n - минимум.

51 В случае отрицательной определенности - максимум.


6) Матрица Гессе - это матрица Якa6u отображеИИА Vlp(ж).
7) См. предметный УК3:13тель, где укз:13НЫ страиицы, на катОрЫJl даны определе­
НИА и карактеристики выделеННЫJl курсивом термииов.

81 Обратим внимание, что :шесь речь идет о приведении к диагональному виду


путем выбора ПОдХодящей локальной системы координат не КlllllЦ)атичиой формы.
а ПРОИ3ВО11ьной гладкоli функции.
1.3. Градиентные поля 15

Лемма Морса дает по существу


полную классификацию невы рож­
денных критических точек. Для вы­
рожденных критических точек та­

кой классификации нет. Простой


при мер вырожденной критической
точки - обезьянье седло (рис. 1.3),
которое описывается функцией Рис. 1.3
'Р(х, у) =х 3
- 3ху2.

1.3. Градиентные ПОnЯ

Успех детективногорасследованиячасто зависитот широты взгляда,


при котором в поле зрения попадают .не относящиеся к делу. об­
стоятельства. Такая же СИ1)'ация возникает при поиске критических
точек. Интересуясьрешениями V'1p(x) = О, полезно, как оказывает­
ся, интересоваться гpaдueHmHы.м полем V'1p(x) целиком, а также его
ролью в совсем других (вроде бы) задачах. Например, топологиче­
ские свойства поля V'1p(x) позволяют судить о существовании кри-
тических точек и об их числе. Движение вдоль градиентного поля 9)
:i = -V'Ip(х) (1.4)
может рассматриваться как численный алгоритм определения ми­
нимумов 'Р(х) либо как основа для иных процедур вычислительного
толка. Существенно, что асимптотически устойчивые равновесия
(1.4) являются точками локальных минимумов потенциала 'Р(х), -
и это позволяет использовать идеологию теории устойчивости.

На рис.l.4а изображен график некой функции z 'Р(х, у) двух =


переменных - линии постоянного уровня !р(Х, у) даны в проекции
на плоскость {х, у}.
Соответствующий фазовый портрет динамической системы
(1.4) в плоскости (х, у) - на Фоне контуров постоянного уровня -
показан на рис. 1.46.

91 Стандарт (1.4) двuжrНUR nfЮlllutltродurнmо вместо ж = Vlp(ж) - дань традиuии,


уходя шей КорНЯМИ в привычку смотреть на ФУНКЦИЮ Ляпунова как на потенuиan,
у&,tlоющuu на траекroриях, а не воэрастаюшиЙ.
16 Глава 1. Критические точки и градиентные поля

б)

Рис. 1.4

в связи со сказанным выше ясно, что в контексте изучения критических


точек довольно важную роль играют вопросы устойчивости движения. Напомним
определения (6, т.2).

1.3.1. Положение равновесиll системы

:i = f(ж) ( 1.5)
называетСIl устойчивым по ЛllnУНову, если по любой его окрестности V можно
указать такую окрестность W, что любое движение, начинающееСIlВ W, не выходит
за пределы v.
1.3.2. ПоложениераВН08есиll ж' системы (1.5) называетСIl асимnтотически устой­
чивым, если оно устойчиво по ЛllnУН08У и любое решение ж(t), начинающееСIl в до­
статочно МШloU окрестности ж', стремитСIl к ж' при t --+ 00. При зтом множество
точек ж(О), из которых траектории ж(t) aoдllmcll к ж', на:JbIваетСIl областью
nритllжениll ж' .

Присутствие в определении 1.3.2 требования устойчивости по Ляпунову


не избыточно. Траектории ж(t) MOryr сходится К ж' при неустойчивомдвижении
(6, т. 2). Но если речь идет о градиентном движении, то сходимость ж(t) --+ ж' всех
траекторий, начинаюшихся в достаточно малой окрестности ж', влечет за собой
устойчивость.

Изучение
(1.5) наряду с (1.4) представляет интерес в том случае,
когда оба движения происходят под острым углом друг к другу 10),
В результате чего оба - асимптотически устойчивы или неустойчи­
вы одновременно.

В обычной теории устойчивости мысль работает в направлении


от (1.5) к (1.4): для неградиентного движения (1.5) ищется потен-

10) Т. е. скалярное произведение f(ж) . V'Р(ж) > О при ж f= ж'.


1.3. Градиентные поля 17

циал tp(x), называемый функцией Ляпунова и позволяющий судить


об асимптотической устойчивости.
Обратное направление (1.4) ~ (1.5) представляется малопер­
спективным, но это не совсем так. Во-первых, с точки зрения
проблем существования критических точек, изучение поля f(x)
может оказаться удобнее V'tp(x). Во-вторых, f(x) может быть гра­
диентом другого потенциала, легче анализируемого.

Выделим несколько опорных результатов.

1.3.3. Теорема. Критическая точка х· является положениеммини­


мума функции tp(x) в томм 11) случае, когда равновесие х· системы
(1.4) асuмnтотически устойчиво.

1.3.4. Лемма. Пусть tp(O) =о и tp(x) >О для х i= о, Ilxll ~ 1.


Тогда при
о < с < inf{tp(x) : IIxll = '}
нуль окружен замкнутыми поверхностями уровня tp(x) = С.
~ Нуль окружают замкнутые поверхности Ip(ж) = с, которые являются
границами связных компонент лебеговых множеств Ip(ж) ~ с, содержащих ж = О.
Вообще говоря, .связные компоненты. могут быть не единственны, но тогда
помимо нуля у Ip(ж) будут и другие критические точки. ~

1.3.5. Теорема. Если потенциал tp(x) имеет в IR R единственную


критическую точку х·, в которой достигается локальный минимум
tp(x) , то область n притяжения х· при движении (1.4) неограни-
ченна 12).
~ Пусть щар В. = {ж : Ilжll < r} целиком лежит в П, а BR - шар сколь
угодно большого радиуса R. Допустим n с BR • Возьмем любую граничную точку
жо Е BR области П. Поскольку жо rl П, решение ж(t) системы (1.4) с началом
ж(О) = жо не может попасть в В., и не может все время оставаться в В R, поскольку
значение Ip(ж(t» в кольце

B. R = {ж : r ~ Ilжll ~ R}

11) В англиАскоА математическоА литературе употребляется irr вместо граммати­


чески правильного ir (если) дЛЯ обозначения громоздкого оборота .если и только
если •. Трюк удобен. В русском - ему могло бы соответствовать -в томм случае- =
.в ТОМ И ТQl\bKO том случае., -тогдаа. = -тогда и только тогда. и т. п.

12) т. е. никакоА шар ее полностью не накрывает.


18 Глава 1. Критические точки и градиентные поля

обязано убывать со скоростью не менее

Но если ж(t) выходит из Вн • ТО. В силу непрерывной зависимости решения


от начального положения, найдется траектория (1.4), начинаюшаяся в n вблизи
жо ~ n
и целиком лежашая в П, которая также выходит из iiR • что противоречит
преДП01l0жению n с Вн . •

1.4. МИНУЯ бифуркации

Бифуркации рассматриваются в главе 6, но о них несколько слов


необходимо сказать заранее, чтобы меры предосторожности не ка­
зались чрезмерными.

НеВЫроЖденный минимум функции

при малом возмущении 2€x незначительно смещается,

но критическая точка остается единственной и сохраняет свой тип.


Совершенно иная ситуация возникает при рассмотрении вырож­
денных точек. Например, х в результате возмущения х
4 4
+ €x2
при
сколь угодно малом по модулю € <О дает в окрестности х =О
вместо одного - два минимума и один максимум 13).
Из-за аномалий подобного сорта с ВЫроЖденными критиче­
скими точками обращаются осторожно, ибо они MOryr менять свой
тип под действием возмущений. Но малые деформации никогда
не разрушают минимума. Точнее говоря, справедливо следующее
утверЖдение.

1.4.1. Теорема. Если гладкая функция !p(x,~) имеет при ~o изоли­


рованный минимум по х в точке x·(~), то при достаточно малом
возмущении A~ минимум сохраняется, смещаясь в близлежащую точ­
ку x·(~o + A~).

13) Такого рода .непрнятноетн. называют бuфуркацu1UfU.


1.5. Глобальный оптимум 19

(!) При «Топологическомнастрое мысли~ теорема 1.4.1 выглядит


неожиданно. Дело в том, что малое возмущение градиента V'rp(ж)
не может ликвидировать критическую точку 14), но сколь угодно
малое изменение потенuиала <р(ж) - типа е sin (ж/е) - может сколь
угодно сильно менять градиент. При этом естественно ожидать
.чего угодно •. Однако не всегда. Минимумы и максимумы образуют
особую статью, демонстрируя устойчивость по отношению к малым
возмущениям функuионала.

... Пусть, например. Ip(ж) имеет в нуле строгий локальный минимум и

11(&) = miп{Ip(Ж) : Ilжll = е}.


Разумеется, 11(&) > О при достаточно малых & > О. Если возмущение функционала
61р(Ж) по модулю меньше IIЩ/2 при любом ж из шара Ilжll ~ &, то Ip(ж) + 61р(Ж)
имеет в шаре IIжll ~ & ХОТЯ бы один минимум. •

Таким образом, МШlое возмущение ФункциОНШlа не может уни­


чтожить изолированный MиHUМyM. Возможна бифуркаuия, порож­
дающая из минимума ансамбль критических точек. Но в этом
ансамбле обязательно найдется минимум. О седловых точках этого
не скажешь 15). Например, сколь угодно малое возмущение Функ­
uионала <р(ж) = жl . Ж2 - способно ликвидировать критическую
точку вообще. (?)

1.5. Глобальный оптимум

в ClWlJlpIIOM случае, если некоторая функция Ip(ж) имеет в ж' локальный ми­
нимум 16) И не имеет других критических точек, то минимум в ж' является
глобальным. Еше точнее: чтобы локальный минимум не был глобальным - дол­
жен быть еше локальный максимум.

Вся эта простота рушится в многомерном случае. Из-за свой­


ственных человеку недостатков пространственного воображения
здесь многое кажется «неожиданным .., И до «простых~ вещей, ока­
зывается, трудно додуматься.

14) Имеющую ненулеtЮй иHдeK€, см. 16, т. 1).


IS) Не считая. коиечио, иевырождеИИЫII случаев.
16) МЫ говорим то о минимуме. то о максимуме. поскольку это суть одно и ТО же,
ибо переходит одно в дpyroc при замене '1'(:1:) на -'1'(:1:).
20 Глава 1. Критические точки и градиентные поля

с D
о

~
А В
о

Рис. 1.5

Функция <р(х) = x~ - COS Х2 имеет бесконечно много миниму­


мов в точках {О,2k1Г} и ни одного максимума. ПраВда, у <р(х) есть
седловые критические точки {О, (2k + 1)1Г}.
Принципиально более важен другой вопрос. Пусть <р(х) имеет
в точке Х· локальный минимум и не имеет других экстремальных
точек, т. е. V<p(z) 1= О при Z 1= х·. Нельзя ли тогда провести парал­
лель с одномерным случаем? Нельзя. Уже на плоскости минимум
в Х· не обязан быть глобальным. Соответствующие примеры легко
строятся на базе следующей конструкции.

Представим, что на полосе (рис. 1.5), ограниченной параллель­


ными прямыми АВ и CD, задана функция у = <P(ZI, Х2), график
которой (ось у перпендикулярна плоскости чертежа) представляет
собой горный хребет, уходящий .тем выше - чем левее». Уро­
вень <р(х) на прямых АВ и CD - нулевой, а срезы !р(Х) = с > 0-
тем левее, чем больше с > О. Наконец, градиент УО<р(Х) везде отли­
чен от нуля.

Таким образом, полоса делит плоскость на две части (верхнюю


и нижнюю), и <р(х) убывает по мере приближения к АВ и CD. Точ­
нее говоря, градиент <р(х) в близких к АВ и CD точках направлен
внутрь полосы, что позволяет продолжать <р(х) на всю плоскость
.нисходящим образом». При этом ниже АВ можно устроить ло­
кальный минимум (продавив воронку), а выше CD образовать
склон !р(Х), уходящий, скажем, в минус бесконечность. Получит­
ся график функции, имеющей единственную критическую точку,
которая является локальным, но не глобальным минимумом 17).

17) Вот два .ФОРмульных. при мера таких фуИКЦИЙ и] (2):

'е'
z
1 3
= (зж - 2ж )е r +. jr I +t 2 dt.
1.5. Глобальный оптимум 21

в другом варианте, продавив по обе СТОРОНь! от ПОЛОСbl по одной


воронке, получаем два локалЬНblХ минимума без дополнитеЛЬНblХ
критических точек.

Следовательно, горныА пере вал при наличии двух вершин - необязателен.


Его можно yrащить в бесконечность. Однако на замкиyroА поверхности .перевал.
девать некуда. Поэтому, скажем, на сфере невозможно задаТЬ функцию, у котороА
было бы два локальных максимума (или минимума) и не было друтих критических
точек .

• Организуя», по аналогии с предьшущим, систему горных хреб­


тов, которая делит равнинную часть на N компонент связности,
и продамивая в каждой .компоненте» воронку, получаем функцию,
все N критических точек которой ямяются точками локального
минимума.

Подобных .неприятностеЙ» можно избежать в дополнитеЛЬНblХ


предположениях.

1.5.1. Теорема. Пусть х· - единственная критическая точка ФУНК­


ции <р(х). удовлетворяющей условию неограниченного роста

Нт <р(х) = 00. (1.6)


l/zII-+оо

Тогда в х· достигаетсяглоБШlЬНЫЙMиHUМYM функции <р(х).

.. При любом достаточно большом R множество

LR = {ж : .,,(ж) ~ R}
является компактом, в силу (1.6). Функция .,,(ж) обязана достигать минимального
значения на L R в некотороА критическоА точке, т. е. в ж· . ~

1.5.2. Лемма. Пусть О - единственная критическая точка функции


<р(х). и IIV<p(x)1I ~ ео >О при Ilxll ~ ro > О. Тогда nотенциШl <р(х)
удовлетворяет условию (1.6). (1)
Условие (1.6) само по себе достаточно для существования
у функционала <р(х) глобального минимума - без какого бbl
там ни бblЛО упоминания о существовании критической точки
и даже без предположения гладкости. Для обоснования надо в до­
казательстве теоремЬ! 1.5.1 изменить акценты. Из (1.6) BblTeкaeT
22 Глава 1. Критические точки и градиентные поля

компактность множества

L R = {х : Ip(X) ~ R},
на котором непрерывный функционал обязан иметь минимум
по классической теореме Вейерштрасса.

Теорема Веиерштрасса - .непрерывная функция на коr.tпакте достигает


минимума. - остается справедnивой при ослаблении требования непрерывности
до полунепрерывности снизу.

Функционал rp(ж) nолунеnреры8еН снизу (сверху) в точке ж, если из Жt -+ Ж


вытекает

1.6. Деформации градиентных систем

Пусть Ф обозначает класс гладких функциОНШlO818) Ip(X) с един­


ственной в шаре Ilxll ~ 1 нулевой критической точкой.
функционалы lpo(X) и IpI(X) назовем гомотоnны.ми в Ф, если
существует гладкая деформация (еще говорят: гомотоnuя, гомотоnи­
ческий мост)
Ip(X, ,\) Е Ф, ,\ Е [О, 11,
такая что

1.6.1. Теорема &обblnева. Если lpo(X) и Ipl (х) гомотоnны 8 Ф


и нуль - точка локального MиHUМyMa lpo(X) , то нуль - точка
локального минимума IpI(X),

Иными словами, невырожденная деФормация, v жlp(Х,'\) 1= О


для х 1= О, минимум переводит в минимум. При бесхитростном под­
ходе к задаче утверждение выглядит естественным, но до публика­
ции результата 19) мало кто готов был поверить в его справедливость.

щ в теории экстремальных эацаЧ функции I{J : к- ~ R прииято называть Т3lО11е


функuиоиалами.

19) Бo6bIJrеfl Н. А. об одном приеме исследования устойчивости rpaдиентных си­


стем 11 Аит. 1980. !'Е 8. С.33-35. Подробная библиография и ДОПQ/lНИтельная
информаuия есть в [121.
1.6. Деформации градиентных систем 23

Причины .неожиданности" здесь связаНbI с двумя обстоятельства­


ми. С .биФуркаUИОННblМИ опасениями,. и снекоторой инерuией
мышления стандартного топологического толка. Дело в том, что
если следить за деформаuией только на граниuе области, то един­
cтвeHHblM инвариантом неВblрожденной деФОрмаuии является вра­
щение векторного ПОЛЯ [6, т. 11, а экстремумы - это из другой оперbl.
В четномерном пространстве, например, минимум деформируется
в максимум (см. раздел 1.7). Однако предположение о единственно­
сти критической точки в проuессе деформаuии позволяет избежать
таких неприятностей.

... Множество Л тех,л Е [О, 1), при которых нуль является точкой минимума
!р(ж, ,Л), открыто в [0,1) (теорема 1.4.1). Поэтому, если установить замкнутость
Л, - это повлечет за собой Л = [О, 1).
Пусть !р(ж, "о) имеет в нуле минимум и ПО обозначает область притяжения
нуля при движении :i: = -V!р(ж, "о), а В• - открытый шар10) максимального
радиуса, который содержится в ПО.
Мы покажем, что r допускает оценку снизу, r ~ f > О, не зависяwую от "о.
Тем самым теорема будет доказана, ПОСКOJ1ьку на шаре В. любой локальный ми­
нимум будет глобальным, и тогда из 'лt -+ 'л. (все 'лt Е Л) будет следовать 'л. Е Л.
П0J10ЖИМ

а = min{ IIV!Р(ж, 'л)11 : ~ ~ Ilжll ~ 1, ,л Е [О, 1) },


f3 = mах{lIV!Р(ж, 'л)11 : Ilжll ~ 1, ,л Е [О, I)}

и рассмотрим траекторию жо(l) уравнения

:i: = -V!р(ж, "о), (1.7)

начинаюwуюся в точке 11) жо(О) = жо Е по, Ilжоll = 1.


ПОСКOJ1ьку Ilжо(l)ll -+ О при t -+ 00, то при некотором to в первый раз будет
достигнуто равенство IIжо(tо)11 = 1/2. Очевидно,

1"~2~1
Рассмотрим теперь функцию lJ(t) = !р[жо(t), "о), которая в силу (1.7) убывает
со скоростью

10) С цен11ЮМ в нуле.


11) ИЗ доказательства теоремы 1.3.5 ясно, что ПО не укладывается внутрн сдинич­
ноro шара, поэтому жо с указанными свойствами наА.ается.
24 Глава 1. Критические точки и градиентные поля

Поэтому

СР(Жо. Ао] = ср(жо(t о ), Ао) - !'.о


1J'(s) ds ~ a 2t o ~ ;;.

с другой стороны, СР(Жо, Ао) ~ тр. В результате получается требуемая оиенка

не зависяшая от Ао.
Остается пояснить, откуда берется неравенство СР(Жо, Ао) ~ тр. Пусть ж6
обозначает rpаничную точку шара В., которая не ПрИНaдllежит ПО. Траектория
(1.7), начинаюшаяся в этой точке. вынуждена уйти из единичного шара B1
(см. доказательство теоремы 1.3.5). Но тогда. в силу непрерывной зависимости
решения от начального положения, найдутся сколь утодно близкие к ж 6 точки ж6
В ПО, исходя из которых траектории (1.7) сначала попадают на rpаниuу B 1 • а потом
уже сходятся к нулю.

Поэтому на rpаниuе В. есть точки жо е По. которые .возникли. при


движении (1.7) из точек ж', расположенных на rpаниuе В•. Для этих точек.
а именно их и надо рассматривать,

Теорема 1.6.1 совсем просто обобwается на случай более гибких


требований.
Пусть Ф(Щ - класс гладких Функuионалов '1' : JRR --+ JR с един­
ственной на замыкании области n
критической точкой ж·('I'), при­
чем в случае Ж·('I') Е n критическая точка должна быть невырож­
денной.
Функuионалы '1'0 (ж) и '1'1 (ж) назовем nодвижно гомотоnны­
ми в Ф(Щ, если сушествует гладкая деформация 'I'(ж, А) Е Ф(Щ,
А Е [О, 1), такая что 'I'(ж, О) = 'l'о(ж), 'I'(ж, 1) = 'l'1(Ж)' Таким обра­
зом, ситуаuия обобwается в следующих направлениях:

(i) Шар заменяется произвольной областью.

(ii) При деформаuии критическая точка может двигаться, но, как


и прежде, обязана быть единственной.

(iii) Критическая точка при деформаuии может выходить на граниuу


области, но при этом обязана становиться невырожденной.
1.7. Топология градиентного поля 25

1.6.2. Теорема. Если 'Ро(Х) и 'PI(X) подвижно гoMomonHы в Ф(n)


и нуль - точка локального MиHUМyMa 'Ро(Х) , то нуль - точка
локального MиHUМyMa 'PI(X),

Продемонстрируемвозможности теоремы 1.6.2 на классическом примере.

... Для доказательства известного неравенства

al + ... +аа
-=-----=
n
~ V'al'" а n
перепишем его в виде

где а; = ж:. Зафиксируем ж~ >О и рассмотрим деформацию

ср(ж, .\) = ж~ + ... + ж~ - .\П(ЖI ••• ж а )1/n ~ о,

на неотрицательномортанте R~-I.
Легко проверить, что система уравнений

дср(ж, .\) = 2 [Ж i _.\ (жl ... Ж а )lI ] = о,


а
i = 1, ... ' n _ 1,
дж; жi

имеет на K~I при любом .\ Е 10,1) единственное решение ж; = .\а/1 жn , которое


лишь при .\ = О лежит на границе R~-I. При ЭТОМ ср(ж,О) имеет невырожден­
ный минимум. Поэтому ср(ж, 1) таюке имеет минимум (в точке, в которой все
жi =Ж n )' ~

1.7. Топология градиентного поля

данный ра:шел для содержания в целом принципиального значения не имеет,


но проливает дополнительныйсвет в некоторых напраВllениях.

Градиентное поле Vср(ж) ЯВllяется частным случаем - неnрерывного

1: к а
-+ к n

Иногда имеет смысл подняться на эту С1}'Пеньку и посмотреть, как выглядит


предмет изучения в иной среде.

Вращение вeктopнoro DOJI.I. Пусть n-


некоторая область в к , П - ее граница,
n

а f(П) - образ границы при непрерывном отображении I(ж). Поле f(ж) пред­
полагается невыpoжi)eннЫAI на П, т. е. I(ж) 1= о при ж Е П.
26 Глава 1. Критические точки и градиентные поля

Выпустим из нуля произвольныR луч 1и посчитаем, сколько раз 1 протыкает


/(0.) изнутри наружу - допустим, 1$ раз, и сколько - снаружи внутрь -
допустим, 1е раз. величина

(1.8)

называется вращениeJrl векторного nОЛR F на п. Значение (1.8), как оказывается,


не зависит от луча 1. Определение, конечно, неC1JЮГО, но оно прозрачно и поз­
воляет дать простые доказательства всех основных результатов. Подробности -
в 16, т.
1, глава 9). Здесь лишь бегло остановимся на фактах, с точки зрения
которых интересно посмотреть на градиентные поля Щ.

Центральную роль в теории врашения играет понятие деформации, или


гомomоnии.

1.7.1. Опредеnение. От06ражениR /0 и /1 называютсн гомomоnными на 0., если


существует такан неnрерывнан деформациR (гомomonин) Н(ж, Т), оnределеННQR длн
ж Е О. и Т Е 10, 1), что
Н(ж, о) == /о(ж), Н(ж, 1) == /1 (ж),
причем Н(ж, Т) 1= о при любых ж Е О. и Т Е 10, 1), что называют невыро:жденностью
деформации.

Операции гомотопического перехода от /0 к /1 С помошью Н(ж, Т) визуально


соответствует непрерывное деформирование поверхности /0(0.) в поверхность
/1(0.). Требование невырожденности, Н(ж, Т) 1= о, означает, что деформируемая
поверхность не имеет права пересекать точку О.

1.7.2. Теорема. Гомотоnные векторные nОЛR имеют одинаК08ые вращениR.

Для установnения roмотопности полеR часто используется JВlНeiнa. юмо­


топи.:

Н(ж, Т) = (1 - т)/о(ж) + Т /1 (ж),


связываюшая отображения /0 и /1. Невырожденность линеRноR roмотопии рав­
нозначна неnративоnоложной направленности векторов /о(ж) и /I(ж) при любом
Ж Е п.

1.7.3. Теорема. Пусть векторное поле /(ж) onределено и невыро:ждено на границах


областей п, п., ... ,п т , причем области п; (; = 1, ... ,т) nonарноне nересекаютСR

щ Теорию врашении веКТорНЫХ ПOllеil (степени отображении) с ПРНJIожениими


к нenинеilному ВН8IIИ3У манируетси И:lllОЖИТЬ в ОДНОМ и3 последуюшихтомов. Дли
первого знакомства, однако, -нестрогиil вариант. из первого тома, вообше говори,
преДПОЧП1ТeJ1ьнееиз-за наглядности.
1.7. Топология градиентного поля 27

и либо fi = U nj , либо поле невыражденно на П\ U nj . Тогда


m

1(/, П) = L: 1(/, Пj ). (1.9)


j=1

Нуль жо Е n поля /(ж) называют изолированным, если в достаточно малой


окрестности жо нет друтих нулей. Вращение поля / на сферах достаточно малого
радиуса с центром в жо называют индексом жо и обозначают iпd(/, жо).

1.7.4. Теорема об 8IIгебраическом чисnе нуnеЙ. Пусть векторное поле /(ж)


n
невырождено на П и Шlеет в лишь изолированные нули. Тогда

1(/, П) = L: iпd(/, Zj), (1.10)

где суммирование идет по всем HyJlJlAf Ж; Е n поля /.

Рассматриваемая теория ориентирована в основном на изучение уравнений


/(ж) = О с акцентом на вопросах сушествования решений и выяснения их свойств.
В частном случае градиентных полей - это как раз проблематика критических
точек.

1.7.5. Теорема. Если 1(/, П) ::1= О, то уравнение f(z) =О разреШШlо в n, т. е.


существует точка ж' Е n, в кomорай f(z') = О.
с точки зрения -разрешимости. - это центральный результат, из которого
ясно, что все упирается в умение вычислять вращение2J). Используемые рецепты
ИСХОдЯт из простых соображений. Вычисляются врашения нескольких стандартных
полей, после чего задействуется техника гомотопических переходов. Основная
масса приложений охватывается деформациями к линейному полю /(ж) = Аж,
вращение которого при условии О Е n и невырожденности матрицы А равно:
1(А, П) = det А.
В частности, тождественное отображение 1ж == z имеет вращение 1, а

Разумеется, речь идет о ситуации О Е n, поскольку 1(/, П) = О в случае /(ж) ::1= О


на П.

Посмотрим теперь, как это работает. Допустим,

(VIp(x), х) >О
при любом х, лежащем на граниuе некоторого шара BR. Тогда
векторы VIp(x) и х не MOryr быть противоположно направлены.

2J) Хотя бы с точностью до его неравенства нулю.


28 Глава 1. Критические точки и градиентные поля

Поэтому линейная гомотопия невырожденна, в результате чего:

и по теореме 1.7.5 потенциал 'Р(х) имеет в шаре BR критическую


точку. Причем критическая точка либо одна, либо несколько -
но тогда они разных типов.

к сожалению ~типизация~ критических точек на основе вра­


щения очень груба. Все невырожденные экстремумы разбиваются
всего на два класса 24), соответствующие двум возможностям: детер­
минант матрицы Гессе больше нуля, и - меньше. Соответственно,
индексы

При этом в четномерном пространстве максимумы и минимумы


оказываются в одном классе, т. е. принaдnежат одному топологи­

ческому типу (с точки зрения вращения). Правда, любой недо­


статок при должном развороте обращается в достоинство, обеспе­
чивая основу для тех или иных выводов. Так и здесь. В случае
(Vlp(x) , х) >О на границе BR, и четного n, - критическая точка
либо одна, либо это не MOryr быть только минимумы и максиму­
мы. При нечетной размерности пространства ситуация меняется,
минимумы и максимумы имеют разные индексы, и с точки зрения

(1.10) это порождает новые возможности.

Перечислим некоторые факты, возникаюшие в рамках описанного типа


рассуждений. Их можно рассматривать также как упражнении при использовании
в качестве руководства к действию главы 9 первого тома.
Везде предполагаетси О е {} и речь идет об условиих, выполниемых на 'l'a-
нице: Vж е п.

• Пусть
IIVср(ж) - жll < IIVср(ж)11 + Ilжll·
Тогда ср(ж) в {} имеет критическую точку.

• Если в нечетномерном пространстве (Vср(ж), ж) <О и критическаи точка


в {} единственна, то это максимум. Если критических точек две, то по крайней
мере одна - вырожденнаи.

• Если (Vср(ж), ж) > 2ж 2 , то Функции ж 2 -ср(ж) имеет в {} критическую точку.


24) Вырожденные ЭКС1ремумы разбиваются на бесконечное число классов.
1.8. Комментарии и дополнения 29

1.8. Комментарии и дополнения

• Доказательство теоремы 1.1.1 обычно сводят к одномерному случаю. Если ж·


положение минимума rp(ж), то скалярная функция

(Т) = rp(ж' + та),


где а произвольный фиксированный вектор, принимает минимальное значение
при т = о. Поэтому
('(О) = (Vrp(ж"), а) = О,
откуда, в силу произвольности а, следует Vrp(ж") = о.

Исходя из такого рассуждения легко сделать ошибочный вывод о возмож­


ности изучения не только необходимых, но и достаточных условий минимума -
на основе рассмотрения производных по напрамению. вот станлартный контр­
пример на эту тему.

Рассечем график функции двух переменных z = rp(ж, у) вертикальной плос­


костью, проходящей через нуль. Допустим, в любом сечении получается кривая,
имеюwaя минимум в нулевой точке. Обязана ли в этом случае функция rp(ж, у)
тоже иметь минимум в нуле?
Интуиция, воспитанная на простых примерах, дает положительный ответ,
но это неправильно. Пусть

z = rp(ж, у) = (у - ж 2 )(у - 2ж 2 ).
На любой прямой у = аж (а::/; О) функция
ф(ж) = rp(ж, аж) = а 2 ж 2 - Заж) + 2ж 4

принимает в нуле минимальное значение, поскольку ф"(О) = 2а 2 > о. На прямых


ж = О, У = О - тоже минимум. Тем не менее в сколь угодно малой окрестности
нуля rp(ж, у) принимает не только положительные, но и отрицательные значения

(мя у = /3ж 2
, 1 < /3 < 2).
• Склон rp(ж) выше CD на рис. 1.5 можно не опускать ниже уровня rp(ж"), -
и тогда автономная система

ж = -Vrp(ж)
будет иметь положительно определенную функцию Ляпунова rp(ж) - rp(ж"), веЗде
(кроме ж ::/; ж") строго убывающую, но траектории ж(t), начинающиеся выше CD,
будут уходить в минус бесконечность.

Уход траекторий ж(t) в бесконечностьвозможен, когда единственныйлокаль­


ный минимум функции Ляпунова V(ж) ямяется глобальным, но не все области
V(ж) ~ с ограничены (см. [6, т.2).
Глава 2

Условная минимиэация

2.1. Условный зкстремум

Оптимизаuия, как и течение жизни, проходит обычно при соблю­


дении некоторых условий.
Рассмотрим сначала ситуаuию /(х) -+ min, в которой ограни­
чение задается одним уравнением

(2.1)

Если точка х находится на поверхности 9(Х) =


О, то в на­
правлении плюс-минус градиента V9(X) двигаться нельзя - иначе
точка х сразу сойдет с поверхности 9(Х) = О, и условие нарушится
(рис. 2.1 а). Можно смещаться в касательной плоскости (на бес­
конечно малую ~x), т. е. перпендикулярно V9(X). Если градиент
V /(х) не коллинеарен V9(X), т. е. не совпадает по направлению
с ±V9(X), то У V /(х) есть составляющая в касательной плоскости
к 9(Х) = О, вдоль которой можно сдвинуться и увеличить тем COМbIМ
значение /(х).

grad f(x)= А grad g(x)

Рис. 2.1
2.1. Условный экстремум 31

Эrой последней возможности «сдвинyrься И увеличить значение


J(x) .. нет: либо в вырожденном случае 1), либо когда градиенты
коминеарны,

Vf(x) = '\Vg(x) при некотором ,\ # О. (2.2)

Тогда в точке х происходит касание поверхностей g(x) = О и


J(x) = f3 (рис. 2.1 б). При этом достигается (возможно) условный
минимум. Условие (2.2), таким образом, является необходимЬLМ, -
но только в невырожденной ситуации.

Особые случаи - стандартная головная боль. Соломинка обхо­


дится дороже стога сена, и средств на другие надобности перестает
хватать. Поэтому обычно не жалеют сил на достижение единообра­
зия, позволяющего обходиться без «реверансов ...
В данном случае, например, избежать упоминания вырожден­
ной ситуации можно так. Если х· - точка условного максимума,
то найдyrся такие числа .\о, '\1, не равные нулю одновременно, что

Но это имеет свои минусы. Во-первых, смешивая воедино разнород­


ные явления, формулировка теряет лицо. Во-вторых, рассуждения
все равно требуют разграничения возможностей.
Задачи, в которых можно положить '\0 = 1, характеризуют
как регулярные. РегуЛЯРНЬLМи называют и соответствующие точки
минимума.

Итак, правило поиска условного минимума заключается в ре­

шении системы (2.2) 2) совместно с уравнением (2.1). На практике


это оформляется немного иначе. Задача

J(x) -+ min, g(x) = О, (2.3)

1) ВblрождеННblй случай оквзтывает «малоинтересные- СИ1Увции: либо Vg(ж) О, =


либо в точке ж иа поверкиости g(ж) = О достигается беэусловныА минимум f(ж),
и направление rpao.иеита Vg(ж) не иrpaeт роли.
1) это n скалярнык уравнениА, поскольку градиент - вектор.
32 Глава 2. Условная мнннмнэацня

заменяется поиском экстремальной точки ж лагранжиана З)

L(ж, ,\) = j(ж) - '\g(ж)

при надлежащем выборе '\. Знак перед ,\ принципиального значе­


ния не имеет (пока).
В итоге все сводится к решению системы n+I уравнений:

дj(ж) _,\ дg(ж) _ О


g(ж) =о и
дж; дж; - ,
i = 1, ... ,n,
относительно n + I неизвестных жl, ... , жп ,'\. Коэффициент ,\
называют множителем Лагранжа.

ПриведенныеусАOfJия всеголишь необходимы, но зто инструмент, кomо­


рыи обычно работает и дает результаты. Решение соответствующей
системы уравнении, как nравuло, одно, а сущестВOfJание MиHUМyMa
ясно из -физических соображении,.. Последние часто спасают и в тех
случаях, коМа решении - несколько.

"римepw

• Критическими точками задачи

(Аж, ж) -+ min, Ilжll = 1,


с симметричной матриuей А, являются собственные векторы жj. Пары (жj, лj) -
суть критические точки лагранжиана L(ж, л) = (Аж, ж) - л(ж, ж). Разумеется, лj
собственные значения матриuы А.
Если л; ~ ... ~ л~, то л; равно глобально минимальномузначению (Аж, ж)
на сфере (ж, ж) = 1.

• Забеraя несколько вперед 4), решим задачу


n n

Е rj'/ж; -+ mах, Е жj = х, (2.4)


i=1 i=1

которую можно интерпретировать как оптимальное распределение ресурса Х по n


ячейкам с эффективностью rj'/ж; от использования ресурса в количестве Жj.

]) См. обоснование -лагранжевой- идеологии с помощью шmрофнlIIX функций


(раздел 2.9).
4) .Забегание вперед_ свяэаио с присyrствием ограиичеиий %; ~ О.
2.1. Условный экстремум ээ

Действуя по регламенту, получаем:

L(ж, ~) = t
;=1
rj.fXi - ~ (Ё Жj - х) ,
;=1
n
OL rj
-=---~=O Еж; = Х, i = 1, ... ,п.
дж; 2-1Ж; , i=1

Решение последНей системы уравнений дает оптимальное распределениересурса:

• rl
Ж; =X~ 2'
L..J rj
j

а также значение множителя Лагранжа

Л' ~ ~~ " r,
2 'L..JX'
j

с которым пока не ясно, что делать (см. раЗдел 2.6).


Итоroвая формула получается в результате бесхитростноro решения выше­
стояшей системы уравнений - и нуждается по этой причине в обосновании
тоro, что найден действительно максимум. В первую очередь требует проверки
возможность более эффективноro решения на границе неотриuaтельноro ортанта.
Такая возможность исключена, так как производная в нуле любой функции rj.fXi
бесконечна и, следовательно, у каждой ячейки в нуле бесконечна скорость роста
эффективности. Поэтому какое-то количество ресурса всем надо давать - иначе
заведомо можно получить выигрыш, передав малую часть ресурса той ячейке,
которая ничеro не получила.

Таким образом, решение должно лежать внутри рассматриваемой области


и обязано улавливаться методом м ножнтелей Лагранжа. Поскольку .метод .. других
стационарных решений не обнаружил - на этом можно ставить точку.

Рассмотрим теперь ситуацию двух ограничений

gl(X) =о и g2(X) = О.
Как уже отмечалось в начале раздела, чтобы оставаться на поверх­
ности g(x) = О, можно двигаться только перпендикулярно градиен­
ту Vg(x). в данном случае надо оставаться на обеих поверхностях
одновременно, чего можно достичь, смещаясь перпендикулярно

как Vg1(x), так и Vg2(X)' Другими словами, двигаться можно лишь


перпендикулярно плоскости, проходящей через оба градиента. Ес­
ли градиент целевой функции V Лх) лежит вне этой плоскости, то
34 Глава 2. Условная минимиэация

у него есть состаWJяющая в разрешенном направлении, и значе­

ние f(x) можно улучшать. В противном случае,

V f(x) = ~I V91 (х) + ~2 V92(X) при некоторых ~1, ~2 # О,

разрешенных направлений нет, и соответствующая точка х - кан­


дидат на решение.

Разумеется, как и выше, нужны оговорки насчет ВЫроЖденных


случаев, к каковым теперь добаWJяется возможность касания в точ­
ке х поверхностей 91 (х) = О и 92(Х) = о, при которой градиенты
V91(X) и V92(X) оказываются линейно зависимы.

2.2. Общий случай

Аналогично предыдущемуобщая задача

f(x) ~ miп, ... , 9т(Х) = О, (2.5)


заменяется оптимизацией лагранжиана

m
L(x, ~) = I(x) - L ~j9j(X) (2.6)
j=1

по х при НадЛежащем выборе ~I, ••• , ~т.


В результате поиск УСЛО8Ного экстре.му.ма (2.5) сводится к реше­
нию системы уравнений

01 _ ~ ~. °9j 91(Х) = о, ... , 9т(Х) = О, k = 1, ... , т,


OXk - ~ } OXk'
}=I

но это, конечно, лишь стержень методики.

Картину портят 8ырожденныеслучаи, на рассмотрение которых


уходит много энергии, но с очень низким к. п. д. Низкая эффек­
тивность такой работы определяется двумя обстоятельствами. Во­
первых, многие исключения тривиальны и скучны. Во-вторых, 8Ы-

рожденные случаи на фоне ситуаций общего положения5) - всего


лишь «точка В континууме •.

51 CumYQuuR,wU 06щего nоложеНUIl принято называть обстоятельства, в которых


исключены редкие совпадения. Прямые не параллельны, точки не совпадают н т. п.
Конкретное понимание термина определяется контекстом.
2.2. Общий случай 35

Последнее обстоятельство создает впечатление, что уйти от рас­


СМО11>ения исключительных вариантов совсем просто. Достаточно
«слегка пошевелить.. условия. Подобный 11>ЮК действительно эко­
номит усилия, но иногда анализ вырожденных случаев неизбежен.
Например, при изучении зависимости поведения системы от пара­
ме11>а. На том стоит вся теория бифуркаций. Меняющийся параме11>
натыкается на аномалию, которую «не обойдешь», - и это опреде­
ляет характер возникающей метаморфозы. Кроме того, вырожден­
ные случаи бывают не11>ИВИальны 6), что возбуждает «писателей..
и раСС11>аивает читателей.

2.2.1. Теорема. Если точка х* есть решение задачи (2.5), то 7)


найдутся такие числа ~o, ~~, ... ,~~, не все равные нулю, что
m
~oV J(x*) =L ~;Vgi(X*), (2.7)
i=1

Условие (2.7) вместе с gl(X*) = о, ... , gm(X*) = о образуют


систему n +т уравнений относительно n + т + 1 неизвестных

Однородность по ~ (произвольное ненулевое ~k можно положить


равным единице) позволяет систему считать замкнyrой (число не­
известных и уравнений совпадает).

Таким образом, замена лагранжиана (2.6) функцией

m
Lo(x,~) = ~oJ(x) - L ~jgj(X)
j=1

позволяет в формулировке теоремы 2.2.1 обойтись без оговорок.


На практике обычно полагают ~o = 1, и если в процессе решения
что-то настораживает, начинают разбираться в чем дело.
Любые предположения,позволяющие исключить в (2.7) слу­
чай ~ = О,
- например, линейная независимость градиентов
Vgl(X*),'" , Vgm(x*) , - называют условиями регулярности.

6) Достаточно вспомннть )Кардановы формы матрнц [6. т.3). .


7) Гладкость рассматрнваемых функцнй в данном ра:щеле везде ПОдр8зумевается.
36 Глава 2. Условная минимиэация

2.3. Неnинейное проrраммирование

Задача нелинейного nрограммирования,

/(х) --+ min,


gj(x) = О, i = 1, , т, (2.8)
hj(x)~O, j=I, ,r,

отличается от (2.5) наличием дополнительных ОJ1)аничений в виде


неравенств. Кстати, ОJ1)аничения в (2.8) удобно записывать в век­
торном виде: g(x) = О, h(x) <:; О. Элементы х, удовлетворяющие
ОJ1)аничениям задачи, называются допустимыми решениRltlи.
Присyrcтвие в Оfl'8ничениях неравенств, особенно типа х ~ О, -
вещь характерная. Более того, с помощью дополнительных пере­
менных задача (2.8) приводится к виду

Лх) --+ min, g(x) = О, h(x) + z = О, z ~ О, (2.9)


где из неравенств фигурирует только неотриuательность координат.

Если решение х* задачи (2.8), равносильно (2.9), удовлетворяет


неравенству hj(X*) < О, то ограничение hj(X*) <:; О роли не ИJ1)ает,
и его можно не принимать в расчет. Такого сорта ограничения
называют пассивными, - активных,
в отличие от характеризуемых

выходом решения на J1)аниuу: hj(X*) = О.

2.3.1. Теорема Каруwа-Джона. Если точка х* есть решение зада­


чи (2.8), то найдутся такие числа ..\0' ..\~, ... , ..\~ и p~, ... , р;, не все
равные нулю, что 8)
т r
..\oV ЛХ*) +L ..\iVgj(x*) + L pjVhj(x*) = О, (2.10)
j=1 j=1

8) За кадром имеется в виду лаграюкиан

'" r
Lо(ж. Л, р) = .\о/(ж) + L Лj9j(Ж) + L Рjhj(Ж).
j=1 j=1

Обратите внимание на ]наки.


2.3. Нелинейное программирование 37

причем ~ ~ О, все 11; ~ о и


(2.11 )
Равенства (2.11) называются условиями дополняющей нежест­
кости и проистекают из отмеченного выше соображения о несу­
шественности пассивных ограничений. Если hj(Ж·) ~ О, то соот­
ветствуюший множитель Лагранжа 11; = О, в силу (2.11), - что
равносильно исключению неравенства hj(Ж) ~ О из списка ограни­
чений. Гарантия положительности коэффициентов 11; у активных
ограничений очевидна в связи со знаком неравенств hj(Ж) ~ О.

Уравнения (2.10), (2.1 1) вместе с т ограничениями 9;(Ж) =О


и учетом однородности по множителям Лагранжа - приводят в со-
ответствие число уравнений инеизвестных 9). Поскольку теорема
2.3.1 дает лишь необходимые условия, которым обязано удовле­
творять решение задачи (2.8), ни о чем больше можно не упо­
минать. В большинстве случаев эти условия позволяют получить
желаемое.

Но возможны также осложнения, связанные с обстоятельства­


ми, которые принято характеризовать как вырожденные. Например:

• Функция I(ж) имеет безусловный минимум на границе.

• Градиенты функций, определяющих ограничения, оказываются линейно за­


висимы.

• Нет допустимых решений, т. е. отсутствуют точки ж, УДОWJетворяющие огра­


ничениям.

в последнем случае система уравнений (2.1 О), (2.11) плюс


9(Ж) =О - может иметь решение, но оно не удовлетворяет огра­
ничениям, и задача (2.8) оказывается неразрешимой. Теорема 2.3.1
формально справедЛива, поскольку исходное предположение про­
сто не выполняется.

В первых двух случаях теорема также остается справедЛИВОЙ,


но эффективность ее падает, потому что соответствуюшая система
уравнений несет на себе следы не вполне нормальной ситуации.

9) Вместо упоминания об однородиости - можно добавить уравнение

1.\01 + ... + IЛ:"I + I"il + .... 1,,;1 = 1.


38 Глава 2. УсловнаR мнннмнзаЦНR

Решений оказывается слишком много, и без понимания того, что


происходит за кадром, выбрать нужное - не так просто, особенно,
если речь идет о «слепом» машинном поиске.

Многие руководства, пытаясь помочь неопытным пользовате­


лям, раскладывают возникающие варианты по полочкам о форме
многочисленных теорем. ЭФФект получается, вообще говоря, отри­
цательный. С одной стороны, возникает иллюзия наличия рецептов
на все случаи жизни. С другой - этими рецептами при недопо­
нимании предмета обязательно пользуются невпопад. Сказывается
и «слепое чтение» теорем, при котором из поля зрения ускольза­

ют многие предположения из-за непонимания их роли, не говоря

об общей потере ориентации, когда все мешается воедино. Поэтому


при столкновении с нетипичными ситуациями необходимо пони­
мание ('подводных течений». Готовые инструкции часто дают сбой.

(!) Обратш.t внимание, что множители Лагранжа .;\;, как и 1':,


можно считать неотрицательными. Для этого надо лишь к лагранжи­
ану nрибавлять .;\j9j(X) с «правильным» знаком. Дело в том, что каж­
дое ограничение 9j(X) = О равносильно двум ограничениям 9j(X) ~ о,
9j(X) ~ О, одно из которых в экстремальной точке активно, другое­
пассивно. Изменением знака перед 9j активные ограничения всегда
можно привести к виду «меньше или равно нулю», и тогда из актив­
ных - остаются только ограничения вида hi(X) ~ О.

2.4. Вопросы существования

Проблема разрешимости конечномерных задач оптимизации не­


редко объявляется элементарной. Orчасти это эмоции на Фоне не­
сравнимо более сложных вариационных задач в функциональных
пространствах. Orчасти - факт, если экстремум ищется на ком­
пактном множестве.

В общем случае решение существовать не обязано. Понятно,


например, что задача

Лх) = Х\ ----+ mах, XI - arctg Х2 =О


не имеет решения.
2.5. Достаточные условия 39

2.4.1. Теорема. Пусть в задаче 10) на условный MиHlIМyM существу­


ют дonycтuмыe решения, и ФункционШI /(х) неограниченно растет
на бесконечности,

/(х) --700 при Ilxll --7 00.


Тогда условный MиHUМyM существует, в том числе - глобальный.

Результат простой (см. теорему 1.5.1), но часто полезный, - гарантнрует,


например, существование глобального минимума в задаче

(Аж, ж) + (Ь, ж) -+ min, Вж = с,


если матрица А положительно определена.

в общем случае можно пользоваться топологическими резуль­


татами о разрешимости параметрических уравнений

L(x,.\) = О.
Идея заключается в рассмотрении топологических свойств поля
VL(x,.\) при различных значениях .\. Если, например, вращения
векторныхполей 16, т. 1] VL(x, .\1) и VL(x, .\2) на граниuе некоторой
областиn не совпадают, то на любой параметрической кривой .\(t) ,
соединяющей точки .\1 и '\2, существует решение V L[ х·, .\(t·)] = о
на П.

2.5. Достаточные УСЛОВИЯ

При безусловной минимизаuии К необходимомуусловию миниму­


ма, V /(х) = О, можно добавить неотриuательную определенность
матриuы v 2/(x). Условие (v 2 /(x)y, у) > о при у f. о, в совокуп­
ности с V лх) = О, обеспечивает достаточность. Нечто подобное
имеет место и в задаче условной минимизаuии.

Например, в задаче (2.5) возникает приблизительно та же си1)'­


аuия после замены лх) лагранжианом L(x, .\). Остановимся пока
на необходимом условии.

10) Неважно какой, (2.5) или (2.8).


40 Глава 2. Условная мнннмнзацня

2.5.1. Теорема. Если все функции в регулярной задаче (2.5) дважды


непрерывно дифференцируемы, х· - точка 'миHUМyMa, а >,. ~ о -
соответствующий (векторный) ,Множитель Лагранжа, то квадра­
тичная Фор,Ма (V;L(Z·, >,.)у, у) неотрицательна для у, лежащих
в подпространстве 11) Vg(z·)y = О.
... Пусть проиэвольная гладкая параметрическая кривая ж(т) леJКИТ в мно­
жестве g(ж) =О и при т =О проходит через ж', т. е. ж' = ж(О). Дифференuируя
первую проиэводную

d";;O») = L 0/1:(0)1 ж;(О) = (V"ж(О»). ж'(о»


i I

еще раз, получаем

d2/~:~O)l = (v2"ж(0»)ж'(о), ж'(о» + (V"ж(О)l, ж"(о». (2.12)

Аналогично

d2{Л':!~(0»} = (v2{Л'g[ж(0»}Ж'(0), ж'(о» + (V{Л'g[ж(О»}. ж"(о». (2.13)

Складывая теперь (2.12) и (2.13) и учитывая, что ж', л' - критическая точка
лагранжиана, получаем (v 2 L(ж', Л')ж'(о). ж'(о» ~ О. •

Разумеется, если (V;L(z·, >,.)у, у) ~ о при любо,М у, то условия


теоремы 2.5.1 выполнены тем более.
Перейдем к достаточным условиям.

2.5.2. Теорема. Пусть все функции в регулярнойзадаче (2.5) дважды


непрерывно дифференцируемы, х· - критическая точка, >,. ~ о -
соответствующий (векторный) множитель Лагранжа, и

(2.14)

для любого у f: О, удовлетворяющего условию Vg(z·)y = О. Тогда


х· - точка изолированного 'миHUМyMa в задаче (2.5).

допустим противное. Тогда найдется последовательность ж -+ ж' , удо­


k
...
влетворяющая ограничениям g(жk ) =
О, на которой

11) Имеется в виду (Vgj(z').I/) = о, j = 1' ... ' т.


2.6. Интерпретация множителей Лагранжа 41

деля каждое равенство

0= g;(zt) - g;(z') = (Vgi(z'), zt - ж') + o(llzt - z'll)


t
на IIz - z'll и переходя к пределу, получаем Vg(z')y = О, где
(zt - ж')
Ilz t - z'll ..... у.
Далее,

О ~ I(zt) - Лж') = L(zt, ).') - L(z', ).') =

= (V;L(z', ).')(zt - ж'), (zt - ж'» + o(llzt - z'11 2),

что после деления на IIzt - z'I1 2 И перехода к пределу (k ..... 00) приводит
к неравенству

(V;L(z', ).')у, у) ~ О,
противоречашему (2.14). ~

Зanача нелинейного программирования (2.8) охватывается тео­


ремами 2.5.1 и 2.5.2 после включения в список ограничений вида
9j(X) = О активных неравенств hj(x) ~ О.
Ясность приведенным результатам придает рассмотрение слу­
чая выпуклых функций (глава 4), в котором теорема Куна- Таккера
гарантирует, что критическая точка лагражиана является седловой
(минимум по Х, максимум по ~, - см. теорему 4.1.3).

Эквивалентом требования положительной определенности матрицы V 2L


на элементах у, удовлетворяюших условию Gy = О, G = Vg, - является
положительная определенность матрицы

при достаточно больших..,. (?)

2.6. Интерпретация множителей Лагранжа

Прозрачность идеологии множителей Лагранжа создает опасность


пройти мимо важных обстоятельств. (!)

Имеется естественный повод зanуматься. В результате решения


экстремальных зanач определяются ненужные (вроде бы) коэф­
фициенты ~~, ~~, ... ,~:п и Jl~, ... , Jl;. Но они, понятно, говорят
42 Глава 2. Условная минимиэация

о чем-то, что может представлять дополнительный интерес, а то


и первоочередной 12).

Частично секрет уже раскрыт УСЛО8Ш1МU дополняющей нежест­


кости: если J.&; = О, то соответствующее ограничение hj(X) ~ О
пассивно.

е uелью дальнейшего ~расследования" возьмем задачу с одним


ограничением

/(Х) ~ min, 9(Х) = ь, (2.15)


отличающуюся от (2.3) наличием числового параметра ь.

Пусть {ж' (Ь), Л'(Ь)} обозначает экстремальную точку соответствуюшего (2.15)


лагранжиана

L(ж, Л) = J(ж) - Л(9(Ж) - bl.


дифференuируя
L(b) = Llж·(Ь). Л'(Ь)J.
получаем

dL ~ д f dж; dЛ' ( (ж '()


-=LJ----9 Ь) I
-Ь -Л '( Ь) [~
LJ д9- dж;
--1] . (2.16)
~ . д~~ ~ . д~~
I •

в (2.16) оба выражения в квадратных скобках равны нулю по причине


9(Ж'(Ь» == Ь. Поэтому

где

df =Е д! dж;.
~ ; дж; db

С другой стороны, группируя в (2.16) слагаемые иначе:

dL = Е [д ! _ Л'(Ь) д9 ] dж; + Л'(Ь),


db ; дж; дж; db

получаем dL/db = Л·(Ь). в итоге:

df
db
= Л'(Ь) . (2.17)

12) Как ни странно звучит, по1]le6итель обычно не знает, чего хочет. Точно так же,
любая задача - лишь ступеиь к пониманию того, какую задачу на самом деле надо
решать.
2.7. .ДвоЙственные» задачи 43

Таким образом, '\·(Ь) показывает скорость роста оптимального


значения иелевой функиии f по пара метру Ь. Иными словами,
представляет собой цену ограничения. Еще говорят о чувствительно­
сти оптимума по отношению к ограничению.

в :Jaд3че распределения ресурса (2.4), например,

).'=- ,~2
Е..1.
2 . Х
J

дает :J3висимость суммарного эффекта от испольэования ресурса Щ Х системой


в целом. Эro значение ).' при исполь:ювании в качестве реальной цены на ресурс
имеет то преимущества, что индивидуальная прибыль

r;../Ж; - ).'Ж;

каждого элемента достигает максимума при тех значениях ресурса ж;, которые
оптимальны по суммарному критерию, т. е. дЛя всего .коллектива •.

в случае т ограничений gj(X) - bj = о чyrь более громоздкие


выкладки при водят к обобщению (2.17):

(2.18)

Аккуратная формулировка здесь нуждается в определенных ого­


ворках насчет существования зависимостей х·(Ь), '\·(Ь), но детали
иелесообразно оставить за пределами рассмотрения, ничего особен­
но не теряя. Если все складывается, как в приведенной выше задаче
распределения ресурса, - оговоркам иена ноль. Если же возникают
осложнения, то в задачу проще вникать конкретно, ибо многослов­
ные универсальные реиепты MOryr сослужить даже плохую службу
из-за перегрузки деталями, не относящимися к делу.

2,7, .двойственные-задачи

Вернемся к задаче (2.15) с одним ограничением. На рис. 2.2 изобра­


жены линии постоянного уровня функиий f(x) и g(x). Поскольку,
как уже отмечалось, градиенты в экстремальной точке должны быть

13) При условии его оптимального распределения виутри системы.


44 Глава 2. Условная минимизация

----------
:::,::.--
,,,.... " ...... ...-:.::~ ...................... ,
коллинеарны, решение зада­

чи х· будет точкой касания


~ ~ I,~,_ ,»,1 ,'g(ж)
линий постоянного уровня

"-~ ЛХ) =с и g(x) = Ь.


При таком угле зрения понят­
Рис. 2.2
но, что нет разницы, идет ли

речь о задаче «ЛХ) ~ min, g(x) = ь .. или о двойственной задаче


teg(x) ~ mах, ЛХ) = с ...
Смена минимума на максимум при переходе к двойственной
задаче на данном этапе рассмотрения проблемы в определенной
степени условна. Проще говорить об экстремуме в той и другой за­
даче. Есть две функции, J и g, и получается, что нет разницы, какую
из них оптимизироватьпри поддержании значения второй - на за­
данном уровне. Уточнение сорта оптимизации (минимум или мак­
симум) возникает при некотором углублении в задачу, когда в поле
зрения попадает «правильное,) построение лагранжиана (за счет
«правильного» выбора знака, см. замечание к теореме 2.3.1).

в случае более общей задачи

ЛХ) ~ min, gl(x) = о, ...... , gт(x) =о


возникает аналогичная ситуация. С точки зрения поиска стацио­
нарных точек нет особой разницы, какая функция в наборе

и(х), gl(X), ... , gт(x)}

оптимизируется, а какие - описывают ограничения.

2.8. ПРИНЦИП Ле Шатеnье-Самуэnьсона

Рассмотрим задачу на условный экстремум весьма общего вида:

rp(x, ,\) ~ min, х Е Х>., (2.19)


где векторный параметр ,\ принимает значения из некоторого
множества Л.
2.9. Штрафные функции 45

Допустим, при любом .\ Е Л множество Х>. не пусто и зanача


(2.19) имеет решения, совокупность которых обозначим через 0(.\).
ДЛя любых ХI Е Щ'\I), Х2 Е Щ.\2), очевидно,

'р(Х" .\1) ::;; 'Р(Х2, '\,), 'Р(Х2, .\2) ::;; rp(XI • .\2).
откуда

(2.20)

в частном случае Л = JRR. Х>. = JRR.


'р(Х • .\) = ф(Х) + (.\. Х).
неравенство (2.20) при водит к

(.\1 - '\2, ХI - Х2) ::;; о. (2.21 )


что принято называть nринциnом Ле Шаmелье-Самуэльсона для
экстремальной зanачи.

в зanаче распределения ресурсов это означает рост закупок


при уменьшении отдельной цены. Вывод кажется малоценным.
Но то же самое можно сказать о физическом законе Ле Шаmелье 14) •
Уменьшение объема повышает давление - очевидно. Однако три­
виальность - всего лишь впечатление. базирующееся на жизнен­
ном опыте.

Векторный вариант (2.21) интуицией уже не охватывается.


и приводит к некоторым полезным следствиям. Имеется в виду
следующее. В достаточно свободных предположениях неравенство
(2.21) будет строгим (разумеется. при .\1 1= .\2). и тогда зависимость
х(.\) • • цены - закупки •• оказывается Р-оmображением с массой
полезных следствий (неВЫРОЖденность матрицы Якоби. глобальная
обратимость отображения - см. [6. т.3]).

2.9. Штрафные функции

Вернемся к зanаче (2.5) и перепишем ее в виде

I(x)-+min. 9(Х) =0. 9={91.···,9т}. (2.22)

14) Внешнее ВОlllеАствне, выводяшее снстему из равновеСИlI, вызывает в неА


проuессы. стреМllwиеСII ослабить результаты этоro ВОlllеАСТВИII.
46 Глава 2. Условная минимизация

Легко видеть, если к /(ж) добавить штраф ру2(ж) за нарушение


ограничений 15), - безусловная минимизация функционала

(2.23)

при достаточно больших р будет давать сколь угодно точное реше­


ние Жр задачи (2.22).

Сказанное нуждается в уточнении. Пусть ж· - изолированная


точка локального минимума в задаче (2.22), а и - ее достаточно
малая компактная окрестность. Тогда глобальный минимум Жр
функционала (2.23) на и будет сходиться к ж· при р ~ 00.

в случае непрерывной дифФеренцируемости градиент /р(Ж)


в точке Жр равен нулю,

V' ЛЖр) + 2р L gj (Zp)V'gj (Жр) = О, (2.24)


j

а поскольку Жр ~ ж· при р ~ 00, то

что дает новую схему обоснования .метода .множителей Лагранжа.

Можно также разделнть (2.24) предварительно на

I + р2 Е g](zl')'
j

получая в пределе необходимое условие оптимума (2.22) в форме

~V '(ж') + Е ~jVgj(X') = О,
j

не требующей оговорок насчет реlУЛRрносmu задачи.

Метод штрафных функций прост идеологически и достаточ­


но эффективен с вычислительной точки зрения. Понятно, что он

I~) Под i(ж) подразумеваетси (g(Ж),9(Ж».


2.10. Механика и обобщенные координаты 47

легко модифицируется под различные задачи условной оптимиза­


ции далеко за пределами постановки (2.22). При этом идея может
использоваться не только как алгоритмическая основа, но и как

удобная схема для получения теоретических выводов. Например,


для обоснования необходимых и достаточных условий оптимума.

2.10. Механика и обобщенные координаты

На условную минимизацию,

Лх) ~ min, 9' (Х) = О, ... , 9т(Х) = О, (2.25)


можно смотреть как на чисто механическую задачу, что дает новые

полезные интерпретации.

Допустим, система состоит из N точечных масс m v , имеющих


координаты r v = {x v, Yv, zv} и движущихся под действием акти8­
ных nотенциШlЬНЫХ сил F v по закону Ньютона

где W v =r
v обозначает ускорение. При этом естественно говорить
о движении изображающей точки в пространстве 3N n изме­ =
рений.
Выстраивая все переменные в один ряд Х = {Х 1, ••• , Х n } ,
можно говорить о движении тjЖj = Fj или более общем
mjXj + fJjXj = Fj(x),

д/(х)
где Fj(x) = -д--'
Xj
а fJj - коэффициенты трения.

Если бы речь шла о безусловной минимизации потенциала


/(Х), задача сводилась бы к поиску равновесия сил

д/
Fj=-д.
Xj

При наличии связей, чтобы система оставалась на пересечении


поверхностей 9' (Х) = О, ... , 9т(Х) = О, необходимо действие до­
полнительных сил реакции С8язей. Обычно рассматривают только
идеШlьные С8язи, ПОрОЖдающие силы реакции Rj' ортогональные
48 Глава 2. Условная минимиэация

поверхностям 9j(X) = О, - другими словами, коллинеарные гради­


енту 16) V9j(X), т. е. Rj = ).jV9j(X).

Результирующаясила реакции равна

R= L ).jV 9j(X),
j

где ).j - неизвестные параметры (множители Лагранжа). Равнове­


сие динамического процесса 17)

(2.26)

в точности определяется уравнениями, совпадающими с обычными


необходимыми условиями минимума дЛЯ задачи (2.25).

Обобщенные коордннl110I н сил .... Хорошо известно, что уравнения


(2.26) используются довольно редко. Механика идет другим путем,
который заслуживает внимания и с точки зрения оптимизации.
При наличии т уравнений связи 91(Х) = о, ... , 9т(Х) = О
любые r = n - т из n переменных Х = {Х(, .•• , Х П } могут быть
выбраны независимо друг от друга, остальные т координат будут
определяться решением системы уравнений 9(Х) = О. На роль
независимых переменных можно взять также какие-нибудь более
удобные параметры q., ... , qr, С помощью которых однозначно
выражаются координаты, т. е.

Xj=Xj(q" ... ,qr) i=l, ... ,n.

Переменные q" ... , qr называют обобщенными координатами, они


хороши тем, что серазвязывают& задачу. Уравнения связи упразд­
няются, переменные становятся независимыми, все перемещения

16) СВЯЗЬ являетСЯ идеanьно!!, если работа ее СИЛ реакции Rj на возможныхпереме­


щениях 6х равна нулю, т. е. (R. 6х) =
О, но это и ecrb перпеидикулярнocrь Rj любому
виртуanьному перемещению 6х, лежащему в касательно!! !Ulоскости к 9j(X) =
О.
17) Уравнения (2.26) в анanитическоА механике называются yptНlHeHи1lJlи ЛОiРОНЖО
nеptJ(Ж) рада.
2.11. Прнмеры 49

6q - возможными. Виртуальные перемещения 6х = {6XI,"" 6х n }


определяютсятеперь из соотношений

n дх.
.
6х·I = ""_'6q·
L- д.
J' ..• -- I , ... , n .
j=1 qJ

В результате связанному ограничениями движению исходной си­


стемы теперь отвечает свободное движение точки в координатном
пространстве {ql"'" qn}. Каждая переменная qj характеризует i-ю
степень свободы.

Работа активных сил на допустимых перемещениях может быть


записана как

где

BXj

J 7
Q. = " " F i -
Bqj

называют обобщенной СШlOй, соответствующей координате qi.

По пути манипуляиий с обобщенными переменными механика


уходит довольно далеко [6, т. 21, и этим можно в той или иной сте­
пени интересоваться, в зависимости от решаемых задач. Но о чем
полезно помнить вообще, - так это о том, что оптимизаиионные
задачи имеют механическую интерпретаиию, и физический фунда­
мент способен питать идеями голые схемы.
Что касается описанной выше трансформаиии задач, то это
не что иное как тривиальная (вроде бы) замена переменных. Од­
нако искусство, с которым механика умеет выделять обобщенные
координаты и силы, дает пример того, насколько изящно и эффек­
тивно подобного сорта задачи могут решаться.

2.11. Примеры

Изложенное выше представляет собой общую идеологию оптими­


заиии. Как всякая общая идеология, - она производит сильное
50 Глава 2. Условная минимизация

впечатление поначалу, но потом тускнеет от ча­

~I1 стого употребления. При этом вычеркивается


~

~
~
из памяти многое, что остается за бортом.
~

• Точка С на прямой L (рис. 2.3), обеспечиваюшая


минимальную мину ломаной АСВ, - определяется пере­
сечением отре3к3 АВ' с L, где точка В' симметрична В
L относительно L.

Рис. 2.3
Это известная задача Герона, сохраняющая
свежесть несмотря на возраст (порядка 2000 лет).
Решение в рамках лагранжевой методики, конечно, не может кон­
курировать с изящным геометрическим трюком.

Пример лишний раз напоминает, что за пределами стандартной


технологии остается много специфических приемов, способных
решать отдельные задачи более эффективно.

• Вот другая ]3Д3ча,

.jж~ + ,Л + + .Jж~ + Y~ -+ miп,


(ж) + ... + Жt)2 + (у) + + Yt)2 = R~. k = 1, ... , n - 1,
n n
все Жj, Yj ~ О, суммы Е Жj, Е У; фиксированы.
j j
Здесь можно дифференцировать лагранжиан, но проше ззметить, что прямая
короче ломаной (рис. 2.4) - и ]3Д3ча решена.

Y11oIriI:=. --I._-L ....---JL..---=-Х

Рис. 2.4
2.11. Прнмеры 51

• Зада.,а Шварца. В ОСТРОУГОЛЬНЫЙ тре­


угольник надо вписать треугольник минимально­

ю nepuмeтpa с вершинами, лежашими на сто­

ронах исходного.

Сделаем проволочную модель треугольни­


ка АВС (рис. 2.5). На АВ, ВС, АС оденем
свободно скользящие кольца D, Е, G, и соеди­
ним их резинками. Натяжение резинок пусть
равно I и не зависит от веЛИЧИНЫ растяжения.
Потенциальная энергия в этом случае равна

А "----"'---------"
С
и = I(DE + EG + GD). (2.27)
Рис. 2.5
Модель, предоставленная сама себе, решает
задачу автоматически. В равновесии достигается
минимум (2.27), т. е. минимум пери метра ADEG, а из условий равновесия
очевидно, что равнодействующаясил растяжения в каждой точке D, Е, G должна
быть ортогональна соответствующей стороне ААВС. это уже другая задача, и ее
решение известно: такой треугольник ADEG получается соединениемоснований
высот ААВС.

По литературе рассенно дotюльно много nодо6ных зада." где ICII/O'I к решению


дают физи.,еские или геометpu.,еские соображениR, - .,то nОМOlает nративиться
инерции единообразиR. Но рецептура Лагранжа также достатO'lНО сильна, - в том
.,исле, в ООласти геометрии и физики .

• Простой пример (зада.,а EBlClluдa). В треугольник вписать параллелограмм


наибonьшей площади (рис. 2.6).

Плошадь паpannелограмма, вписанного в тре­


угольник со сторонами а, Ь, с (рис. 2.6), равна Ж1/ sin о.
В итоге (после анализа подобных треугольников) во­
прос сводится к задаче на условный максимум,

Ж1/ -+ тах, ьж + су = Ьс,

которая легко решается с помошью лагранжева форма­


лизма. (?) ПOllучается ж = с/2, 1/ = Ь/2, - верШИНЫ Ь
паpannелограмма обязаНЫ делить СТОроНЫ исходного
треугольника пополам.
Рис. 2.6
Глава 3
Выпуклый анализ

Выпуклые задачи важны не ПОТОМУ. что распространены, а ПОТОМУ. что хорошо


решаются. И хотя это похоже на -поиск под фонарем - ибо там хорошо видио-,
математика, как и Вселенная, именно так развивается. При этом энания, добытые
в -выпуклой области-. освеwaют многое эа пределами.

3.1. Векторы и матрицы

Векторная и матричная техника (6, т.3) подраэумевается далее иэвестноЙ. во иэ­


бежание недоразумений кое-что напомним.

• СкалRрНое npouзведение определяется как (Ж,1/) = Ж,1/1 + ... + Ж n 1/n. Экви­


валентные обоэначения: ж .1/, жу.

• Базисом наэывают линейно неэависимое множеl.:ТВО {е" ... , en } при


n
условии, что любой вектор ж Е R представнм В виде линейной комбинации
n
ж = х,е, + ... + жnеn . Величины жl •••• , Ж N - есть координаты точки ж Е R .
Число n векторов, составляюших баэис, - определяет размерность пространства.

• Векторы Ж,1/ ортOlOНальны. если (ж. 1/) = о. Плоскость (линейное noдnpa­


странство) определяется как множество элементов ж, ортоroнальных некоторому
вектору О, т.е. (о, ж) = о.
• ЛинейнаR ФункциR 1/ (о. ж) =ОIЖ, = + ... +
ОnЖn принимает постоянные
эначения (о, ж) =
fJ на lUnерnлоекостRХ, параллельных плоскости (о. ж) о. =
• Таблицу коэффициентов А = [о;;),

01' •••
А= .
[
оп, .

наэывают матрицей. которая определяет линейный оператор у = Аж, соп0СТ8ВЛЯ­


юший вектору ж вектор у по правилу

1/; = LО;;Жj. i = I, ...• n,


j

что эanaет тем самым умножение матрицы на вектор.


3.2. Выпуклые множества и конусы 53

• Череэ /1;: обоэначается i-я строка матриuы А, череэ o:j - j-й етолбеu, т. е .

•, ~ I~,.··. ·,.1. ., ~ [::] .


• По определению:

7А = [70;j), А + В = [а;) + b;j).


Умножение А и В дает матриuу С = АВ с элементами
С;; = Е /l;kbkj.
k

Иными словами, С;) равно скалЯРНОМУ проиэведению i-II вектор-строки на j-II


вектор-столбеu,т. е. С;; = (О;:. b:j)'

• Матриuа А" (равн~ильно А Т ) С элементами а;; = Oj; наэывается транс­


nониfЮ8DННОЙ.

• Обратной к А наэывают матриuу А-


1
, такую что

где единичная матрица 1 определяет тождественныll оператор Iж == ж.

• Векторное неравенство ж « 11 (равн~ильно 11 > ж) оэначает совокупность


покоординатных неравенств жj ~ !I;, i = 1' ... ,n.

3.2. Выпуклые множества и конусы

Инструментарий выпуклого анализа [20] едва ли не шире ассорти­


мента грузинской кухни, но обойтись в том и другом случае можно
небольшим минимумом.
Множество Х называется вьmуклым' если вместе с любыми
двумя точками х,1I Е Х оно содержит отрезок, их соединяющий 1),

'\х + (1 - '\)11 Е Х, ,\ Е [О, 1].

1) В Х, таким обра:юм, AOJlJlUtbl быть определены линеАные операции. Пока


имеется В ВИДУ ситуация Х с К" .
54 Глава Э. ВЫПУI<ЛЫЙ анализ

N
Линейную комбинацию L >';С; точек {fl , ... , fN}, при условии
;=1
N
>.; ~ о, L >.; = 1,
;=1
называют выпуклой.

Объединение всех выпуклых комбинаций конечных наборов


точек из Х с RR называется выпуклой оболочкой множества Х
и обозначается со Х.

3.2.1. Теорема Каратеодори2). Выпуклая оболочка всегда совпа­


дает с объединением всевозможных выпуклых комбинации конечных
подмножеств Х С RR, содержащux не более n + 1 точек.
Выпуклая оболочка Х равносильно определяется как мини­
мальное (по включению) выпуклое множество, содержащее Х.

Аффинные МНОИU!C11l8. Множество А С к


п
на:JЫвается аффUННbIAf, если вместе
с любыми двумя ра:JЛичными точками оно содержит проходЯWУЮ чере:J них пря­
мую. В случае О С А множество А ЯВl1яется линеАным пространством. Всякое
аффинное множество - есть пересечение гunерплоекоеmей, описываемых урав­
нениями вида аж = р. Совокупность реwениА системы линеАных уравнениА
Аж = Ь - есть аффинное множество.
Oroбражение 5 Н:J В
.. В кп, УДОВl1етворяюwее условию

5(аж + ру) = а5ж + Р5у, а + р = 1,


на:JЫвается аффUННbIAf. Аффинное отображение - это всегда преобраювание вида
5(ж) = Аж + Ь, где А - линеАное отображение.

Orделимость. Выпуклые множества Х, У С RR называются отде­


лuмыми (строга отделuмыми), если существует разделяющая гиnер­
плоскость Н С RR (ах = {3), относительно которой множества
располагаются в разных замкнутых (открытых) полупространствах
Н+, Н-:

х Е Х ~ ах ~ {3 « {3), х Е У ~ ах ~ {3 (> {3).

2) Теорема Каратеодори тесно связана с mrofWJIЮii Хеми, одна И] дрyroil легко


выводится, см. (10).
3.2. Выпуклые множества н конусы 55

3.2.2. Теорема отделимости. Неnересекающиесязамкнутыевыпук­


лые множества Х, У всегда отделимы, и - строго отделимы, если
хотя бы одно их этих множеств ограничено 3) •

Опорной гиперплоскостью к Х называют гиперплоскость Н,


которая имеет хотя бы одну общую точку с Х, и либо Х С Н+,
либо Х С Н-.

• у выпуклого множества всегда существует опорная гиперплос­


кость, проходящая через любую наперед заданную граничную точку.
Такое свойство, кстати, равносильно определению выпуклости.

• Любое замкнутое выпуклое множество совпадает с пересече­


нием всех содержащих его замкнутых nолуnространств. Эrо еще одно
характеристическое свойство.

Конусы. Замкнутое выпуклое множество К С IR R , содержащее вме­


сте с любой точкой ж Е К луч Аж, проходящий через эту точку, на­
зывается конусом. Конус, не содержащий противоположных точек,

ж Е К, ж # о :::} -ж ft К,
называют острым, или заостренным.

Множество К·, состоящее из точек у, для которых скалярное


произведение уж ~ О при любом ж Е К, называется двойственным
конусом по отношению к К. На рис. 3.1 изображен пример на плос­
кости.

При изучении линейных неравенств важную роль играют сле-


u 4)
дующие легко проверяемые своиства :
• (К·)· = К.
• К +К· = ]RR.
• К 1 С К2 :::} K~ ~ К2 .
• (KI nК2)· = K~ +К2 .
• (К 1 + К2 )· = K~ nК2 .

]) ПРИ варьироваИИИ предположеИИiI теоремы отделИМОСТИ быстро _ра1МИОЖВ­


КЛСЯ>.

4) Под суммоil Х +У подра1умевается миожество точек z = ж + У. где ж Е Х,


УЕУ.
56 Глава З. Выпуклый анализ

Мноrorpанники. Выпуклую оболочку конечного множества точек


называют многогранником.

Пересечение F многогранника Р с любой своей опорной


гиперплоскостью называют гранью многогранника; k-гранью, если
dim F = k; О-грани - вершины, I-грани - ребра.

Каждая грань мноюгранника, в свою очередь, является многогранником. (?)


Всякий многогранник совпадает с выпуклой оболочкой своих вершин. (?)

Пересечение конечного числа замкнутых полупространств на­


зывают полиэдром. Ограниченный полиэдр - многогранник.

Конусная техника. Докажем, Ш1я иллюстрации, следуюшее утвер­


ждение. для любой матрицы А либо существует ненулевой вектор
х ~О - такой, что Ах ~ О, либо уА > О при некотором у ~ О.

... Множество решений системы Ах <О -


есть конус К = {х: Ах < О}, двойственный к ко­
торому:

К'={х:х=уА, у>О}.

Совокупность пonожительных решений Ах ~ О


ямяется пересечением К с неотриuaтельным ор­
тантом R~. Если ненулевых пonожительных ре­
шений нет, то К R~ n =
О, что мечет за собой
(К n R~)' = R". Остается заметить,
Рис. 3.1
(К n R~)' = К'+ (R~)' = R",
где, очевидно, (R~)' предстамяет собой отрицательный ортант R~. Если теперь
взять u <О (и Е R~), то условие К'+ R~ = R" мечет за собой (в силу О Е R")

уА = -и > О, У '" О. •

Теория линейных неравенств интересна и обширна, но линей­


ность иногда маскирует более фундаментальные причины. Вот один
из обших нелинейных резулы"Зтов (20), влекуший за собой целую
серию теорем о линейных альтернативах.

3.2.3. Теорема. Пусть <PI, •.• , <рп - BblnYlUlble функции на BblnYIUlOM


множестве Х. Возможна одна и только одна из двух альтернатив:
(i) существует такой вектор х Е Х, что

... , Ipп(х) < О;


3.2. Выпуклые множества н конусы 57

(ii) существует ненулевой вектор у = {YI, ... ,уп} ~ О, такой, что


YI<P'(X) + ... + Уп<Рп(Х) ~ О при любом Х Е Х.
.... НевозмоJКНОСТЬ второй альтернативы при выполнении первой - оче­
видна. Остается по казать: если (1) не имеет места, то выполняется (11).
Пусть Z обозначает множество таких Z = {ZI' ... , Zn}, что все n неравенств
~j(ж) < Zj ра:Jрешимы по ж е х.
Поскольку (1) не выполняется (по предположению), Z не пересекается
снеположительным ортантом,

K~ = {ж : ж ~ О},

и потому Z и K~ MOryт быть отделены гиперплоскостью, что, собственно,


и означает (в итоге неслОJКНОГО рассуждения) справемивость (П). •

Линейные следствия можно получать, выбирая

<Pj(X) =L ajkXk + bj
k

и различные выпуклые множества в качестве Х. Например, в случае


Х = R~ можно утверждать: либо Ах < О положительно разрешимо,
либо уАх ~ О при некотором ненулевом у ~ о и любом Х ~ О.
Последнее означает существование такого ненулевого у ~ О, что
уА ~O.
На этом пути в качестве Х MOryr фигурировать различные
конусы,

к = {Х: Вх ~O} либо К = {Х: Х = Ву, Dy ~O},


или - многогранники, М = {Х : Вх ~ Ь}, - что дает обозримо
тpaК'tyeMыe результаты в отдельных случаях.

8 бесконечномерных пространствах многие из перечисленных результатов со­


храняют силу, но кое-что принципиально меняется. Не останавливаясь на рассмот­
рении обшей ситуации (см. (13», отметим, что определенный интерес может пред­
ставлять новое мя выпуклого анализа понятие идеальной 8blnYlCllocmu (6, Т. S, гл. 6).

Множество Х в банаховом пространстве Е называется идеально 8blnYlCllblN,


если

О.ЖI + 02Ж2 + ... е х


мя любой последовательности {ж n } С Х И любой числовой последовательности
{Оп}, при условии ОП ~ О и 01 + 02 + ... = 1.
58 Глава Э. Выпуклый анализ

в Rn идеальиая выпуклость совпадает с обычной, однако линейное подпро­


странство непрерывных функuий в Lp выпукло - но ие идеально. Не обязано
быть идеально выпуклым ядро линейного функuионала I : Е -+ R и другие
выпуклые множества Х С Е.

Многие классические результаты Функuионального анализа на ба3е иде­


альной выпуклости доказываются очень просто [6, т. 5). Эго свидетельствует
об определенной удаче - понятие улавливает спеuифику перехода к бесконечной
размерности и отражает именно тот срез идеи выпуклости, которым имеет смысл

ограничиться в функuиональных пространствах 51. Что же касается R n , то сужение


обычной выпуклости до идеальной 1Цесь вообше незаметно. Эro касается многих
математических понятий, для которых Rn - слишком flJубый пробный камень.
В связи с подобными СИ1уаuиями часто имеет смысл задуматься о uелесообразных
изменениях определений. О таких изменениях, на которые конечномерный анализ
.не реагирует., а бесконечномерный - .откликается с благодарностью•.

3.3. Выпуклые функции

Скалярная функция Ip векторного apl)'MeHTa считается выпуклой,


если

Ip[.\x + (1 - .\)уl ~ .\Ip(x) + (1 - .\)Ip(Y) (3.1)

при любом .\ Е [О, 11. Неравенство (3.1) называют неровенством


Иенсена. Другими словами, выпуклая функция Ip(x) имеет вы­
пуклый надграфик - множество пар (z, х), таких что z ~ Ip(x).
Надграфик обозначают как epi Ip.
Функция Ip называется вогнутой, если «минус Ip" выпукла.

к сказанному лучше ничего не добавлять, если не планируется исполь­


зование двойственности. Если же рассчитывать на манипуляuии сonряжеННЫAlи
функциями (см. далее), то к выпуклым лучше сразу относить функuии, имеюшие
право принимать бесконечные значения, при естественных правилах сложения
и умножения с участием бесконечностей.
При этом любую выпуклую функuию, принимаюшую конечные значення
на обычной области определения dom 'Р, можно доопределить на всем простран­
стве а , полагая '(J(Ж)
n
== 00 внеdom 'Р. Так доопределенные выпуклые функuии,
заданные на непустой области dom 'Р, называют cOOcтвeHHЫAlи. Иногда собствен­
ными называют функuни, принимаюшие только конечные значения. Пример

~) На аналогнчные выгоды можно рассчнтывать В :Jaд8чах бесконечномерноА


оптимиэацин.
3.3. Выпуклые функции 59

выпуклоА несобственноА функuин:

Iжl < 1,
~(ж) {;'ОО' ::
= Iжl = 1,
00, ДJ1Я Iжl> 1.
детали и yroчнения имеются в [201.

Правая nРОU380дная

I () [. Ip(x + t::..x) - Ip(x)


Ip + Х = 1т
~жiО
А
I.JI.X

выпуклой функции скалярного аргумента всегда существует и моно­


тонно возрастает.

• Сywествование предела следует из монorонности убывания

~(ж + dж) - ~(ж)


при убывании dЖ, что легко выводнтся из неравенства Иенсена. ~

3.3.1. Теорема. Для выпуклостидважды непрерывно дифференциру­


емой функции Ip : RR -+ R достаточна неотрицательная определен­
ность ее гессиана.

• Результат широко нзвестен. доказательство имеет техннческнА характер


и легко строится на основе следуюшего результата. ~

3.3.2. Теорема. для выпуклости непрерывно дифференцируемойфунк­


ции Ip: RR -+ R необходима и достаточна ее монотонность 6):

'v х, у: (VIp(X) - VIp(Y), х - y)~ О. (3.2)


• ДосmаmOlfносmь. Если ~(ж) выпукла, то н

(t) = ~[ж - t(ж - у)1

выпукла на [О, 11, откуда ('( 1) - ('(О) ~ О, что и есть (3.2), поскольку
('(t) = -(V~[ж - t(ж -у)l, ж -у).

6) Монотонность Вида (3.2) И ItЮlЮmонн«mь по "онусу [6. т.51 - разные ПОНАТИА.


МА обозначеНИА которых ИСПOJlЬ3~А ОДИН И ТОО же терМИН.
60 Глава З. Выпуклый анализ

Необходuмосmь. По формуле конечных прираwений:

(1 - ~)!р(ж) + ~!p(y) - !pI(l - ~)ж + ~!p(y» =


= (1 - ~){!р(ж) - !рl(l- ~)ж + ~!p(y»}+~{!p(y) - '1'1(1 - ~)ж + ~yl} =
= ~(I - ~>(V!p(u) - V!p(v), ж - у),

где и - v= а(ж - у) при не котором а > О. в итоге

Принципиальную роль играет обязательная непрерывность вы­


пуклой функции.

3.3.3. Теорема. Любая выпуклая на IR П функция - непрерывна.


... Без ограничения обwности положим, что речь идет о непрерывности
функции !р в точке ж = О, причем !р(0) = О, чего всегда можно добиться
изменением точки отсчета.

Пусть Ilжll = тах IЖil.


I
в вершинах Жj куба С. = {ж : Ilжll ~ r} функция !р

принимает значения !р(Жj), максимальное среди которых обозначим р.


Любая точка ж Е С. представима в виде

где все ~j неотрицательны. Поэтому на С.

!р(ж) = !Р(Е ~jЖj) ~ Е ~j!р(Жj) ~ (Е ~j)p ~ р.


1 1 1

Е
Пусть теперь О <Е ~ р. Для Ilжll ~ -r имеем, в силу выпуклости !р,
р

!р(ж) ~ ;!Р(;ж) + (1 - ;)!Р(О) ~ Е,


потому что ~ж Е С•.
Е
Е
Остается показать, что !р(ж) ~ -Е для Ж из той же окрестности Ilжll ~ -r.
р

это опять-таки следует из выпуклости !р,

1
0= !р(0) =!р [ --ж + -Е/р- ( --ж
р )] ~ --!р(ж)
1 Е/Р (Р)
+ --!р --ж ,
I+E/p I+Е/р Е I+E/p I+Е/р Е

поскольку - ~ж
1"
Е С•. Orcюда !р(ж) ~ -Е.
3.4. Субградиент и субдифференциал 61

Таким образом, lер(ж) - ep(O)1 ~ €, если Ilжll ~ -r, что и доказывает непре­
IJ
рывность ер(ж). ~

Из теоремы 3.3.3 вытекает выпуклость и замкнутость 7) лебего­


вых множеств L p = {х : <р(х) ~ р}, в том числе

L· = Arg min <р(Х) , х Е JRn.

3.3.4. Лемма. Производная <р ~(x) выпуклой функции <р в любой


точке х по любому направлению s всегда существует. При этом
nроизводные <р ~(x) равномерно ограничены по s.
, ер(ж + та) - ер(ж)
~ ер .(ж) = lim ~ ер(ж + а) - ер(ж) ~
' .... +0 Т

~ mах[ер(ж + а) - ер(ж»). ~
11.11=1

3.4. Субградиент и субдифференциал

При изучении неглалких функций аппарату дифференцирования


находится замена.

Вектор х· называется субградиентом выпуклой функции <р


в точке х, если

I <р(х + h) ~ <р(х) + (х·, h) I (3.3)

для любого h.
Множество субградиентов <р в х называется суб-

дифференциалом 8) функции <р В точке х и обознача­


ется д<р( х ).

• Если ер(ж) дифференцируема в точке ж, субдифферен­


циал совпадает с градиентом,

• Субдифференциал модуля, ер(ж) = Iжl, равен sign ж при Рис. 3.2


ж i= О и сегменту [-1, 1) при ж = О. (?)

7) Но не ограниченность, - как показывает при мер 'Р(ж) = e Z •


81 Терминология Здесь слегка -nлавает-. СубдиффереНЦИaJJ иногда называют так­
же субградиентом.
62 Глава 3. Выпуклый анализ

• Касательная гиперплоекоеть (см. рис. 3.2)

{- {о = (v, z - жо),

где {о = СР(Жо), v Е дср(жо), - является опорной гиперплоекоетью к надграфику


выпуклой функuии ср(ж) В точке {{о, жо}. (1)

3.4.1. Теорема. Необходuмым и достаточнымусловием глоБШlьного


MиHUМyMa выпуклой функции в точке х· является:

.. Речь идет о задаче ср(ж) -+ min, z Е RR. HeoOxoдuмocтb. Если ж· точка


минимума ср, то ср(ж' +
.1.ж) ~ ср(ж·) +
(О, .1.ж), что влечет за собой О Е дср(ж'),
в силу определения (3.3). достаточность. Если О субградиент rp в точке ж·, то,
в силу (3.3), ср(ж· + .1.ж) ~ ср(ж·) для любого .1.ж. ~

Таким образом, выпуклость значительно упрощает ситуацию.


Кроме минимумов, «других экстремумов не бывает ... Всякий ЛОКШlЬ­
ный MиHUМyM автоматически является глоБШlьным. Строгий MиHUМyM
обязательно единствен. Условие О Е arp(x·) не только необходимо,
но и достаточно.

Останавливаться подробно на изучении субдифференциалов


нет смысла. Эrо инструмент, аналогичный дифференцированию,
требующий либо освоения, либо поверхностного взгляда. Середи­
на нелогична, потому что не доводит дело до конца, но отбивает
желание. Плюс к тому, проблема освоения - не в подробностях
(их можно компактно изложить), а в фокусе внимания и практике.
Надо отложить в сторону другие дела и какую-то часть жизни по­
святить субградиентам 9), если на то есть основания. В противном
статистически подавляющем случае необходимо сознательно огра­
ничиться поверхностным ВЗГЛЯдом.

Подо6ная рекомендация, конечно, идет 8fЮЗрез с тfЮдициеil. Математику,


дескать, нельзя изучать поверхностно. А почему, собст8енно? Разумеется, где речь
идет о noдгomOВKeтрех 8ыдающuxсясnециШ/истовпо "JКстремШ/ьнымзадачам, - там
инoU fЮзговор, Су&fЮдиенты им но роду написаны. Но никто не оОязон с одинаК08ЫМ
усердием изучать 8се предметы. При этом «иметь представление,. иногдо требуется,
и тогдо nриходится заглядЫ8ать 8 соседние области, не сжигая за coбoiI мостов.

9) Уединившись с одним из стандартных курсов, например, 1111.


3.4. Субградиент и субдифференциал 63

Сказанное пришлось к слову, и больше относится к ситуаuии


вообще. Применительно к субградиентам оно не так уж актуально,
поскольку основу субдифференuирования составляют несколько
достаточно ПРОСТЫХ результатов [11], но проблема, как это часто
бывает, заключается в понимании не умом, а нутром. Пyrь к такому
пониманию обычный - решение задач и самостоятельное доказа­
тельство ОПОрНЫХ фактов. Вот стандартный «теорминимум.:

(1) Множество дV'(жо} в любой точке жо неnусто, выпукло,


замкнуто и ограничено.

(ii) Производная выпуклой функции v' в точке жо по любому на­


правлению s всегда существует и определяется равенством

дV'(жо}
д
s
= zEO\O(xo)
mах (z, а).

(iii) Теорема Моро-Рокафеллара. Если функции V'I, V'2 выпуклы,


то

(Iv) Теорема Дубовицкоro-МИЛlOТНна. Если функции V'1, V'2 вы­


пуклы и V'I(ЖО) = V'2(ЖО) , то

д max{V' I, V'2}(ЖО) = со{дV'I(ЖО) U дV'2(ЖО)},


(у) Если ",(ж) = V'(Аж), где А прямоугольная матрица, то
д"'(ж) =А Т
дV'(Аж).
Под дV'(Аж) здесь подразумевается субдифференциал v' по отношению
к аргументу в точке Аж.

(п) в отсутствие дифференцируемости работает аналог теоремы


3.3.2. Выпуклая функция всегда монотонна:

'v ж, у: (дV'(Ж) - aV'(y), ж - у) ~ О.


(пl) Если функции V'I(Ж), V'2(Ж) выпуклы на открытом выпуклом
множестве и

aV'1 (ж) == дV'2(Ж),


то разность V'I(Ж) - V'2(Ж) есть константа.
64 Глава З. Выпуклый анализ

Сильная сторона субградиента, как инструмента, проявляет­


ся в унификации. В сведении рассуждений к цепочкам формул,
не требуюших оговорок. Такое свойство методики очень важно при
использовании. Поэтому отработка деталей дает мастеру удобную
технологию, но сильно раздражает пользователей, имеюших дело
с готовыми результатами. Аналогичный комментарий можно дать
к выпуклому анализу в целом. Там есть масса нюансов, которые
мы обходим стороной, ограничиваясь рассмотрением собственных
функций 10) Ip : RR -t R.

Многие читатели испытывают раздражение по поводу функuий, принима­


юших бесконечные значения. Им нет дела до потребностей сделать Функцuu­
uндuкаmоpbl

{
О, z Е П;
х(щ=
00, z ~ П

выпукnых множеств П - тоже выпукnыми.

3.5. Сопряженные функции

Графики выпуклых функций можно рассматриватьдвояко: как то­


чечные множества и как огибаюшие опорных гиперnлоскостей11).
Подобная двойственность служит основой для извлечения выгод
из перепасовывания результатов, которые трансформируются в но­
вые факты при смене точки зрения.

Основой манипулирования служит, в частности, представление


выnуклои
.
Ф
'Ункции как маКСШfума
12)
- .
линеиных :

Ip(x) = тах{ Ip(Z)


z
+ (8, Х - z)}, 8 Е дlp(Z). (3.4)

Последнее равносильно

v х : (8, Z) -1p(Z) ~ (8, х) - Ip(x), 8Е дlp(Z). (3.5)


10) Напомним, функцию называют ro6cmtltHHoU, если ее надграфик не пуст и не со­
дер_ит вертикальных прямых, Т.е. ве:ше 'I'(х) > -00, но исключено 'I'(х) == +00.
11) А на замкнутые выпуклые мно_ества (надграфики) MOJКНO смотреть как на пе­
ресечение содерJl(аwих их замкнутых пonупространств, не считвя альтернативного

точечного описания.

Щ Точнее говоря, аффинных.


3.5. СОПрRженные функции 65

Произвол выбора субградиента 8 из a/f'(Z) не влияет на резуль­


тат, как будет видно из доказательства (3.4). Если /f'(X) дифферен­
цируема в обычном смысле, то (3.4) переходит в

/f'(x) = тах{ /f'(Z) + (/f"(Z) , х - Z)}, (3.6)


z
что Беллман называл кваЗШluнеарuзацuеЙ.

... Обоснование (3.4) совсем просто. В силу (3.3)

'Р(ж) ~ 'P(z) + (8, Ж - z)


дnя любого, Е д'Р(Z), откуда

'Р(ж) ~ sup{ 'P(Z) + (8, Ж - z)}, (3.7)



но при Z = ж в (3.7) достигается равенство, что влечет за собой (3.4). •

Выпуклой функции /f'(x) часто удобно сопоставлять - сопря­


женную

/f't(y) = sup{(x, у) -/f'(x)}, (3.8)


Z

базирующуlOCЯ на свойстве субградиента (3.5). Переход (3.8) на­


зывают nреобразованuем Юнга-Фенхеля, а также nреобразованuем
Лежандра, что не совсем точно.

Если функция 'Р : К" -+ R (не обязательно выпуклая) имеет неВЫроJКденный


гессиан, nреоБРО:J08Qнuе ЛеЖQндро определяется как

'Р'(У) = (ж, 11) - 'Р(ж), где V'Р(ж) = 11·


Если при этом 'Р(ж) гладкая, строго выпуклая и растет на бесконечности быстрее
линейной функции, то

'Р'(У) = mаХ{(Ж,II)
z
- 'Р(ж)}. (3.9)

Поэтому преобраэование (3.8) является обобwением (3.9), связанным с заме­


ной максимума на супремум и отказом от ряда требований. С другой стороны,
преобразование Лежандра, в отличие от (3.8), определяется не обязательно дnя
выпуклых функцнй.

Сопряженная функцuя всегда вьmук.ла, но тут есть червоточинка.


Легко убедиться, что сопряженная для /f'(x) = e есть функция,
Z

принимающая бесконечные значения: /f't(y) = у \п (у/е) при у ~ О,


66 Глава З. Выпуклый анализ

и 'Р.(У) = 00 при у < О. Поэтому, если Оll>аничиваться только


функциями, принимающими конечные значения, то игровое поле
оказывается слишком тесным.

Основу Д1IЯ извлечения инструментальных ВЫГОД из двойствен­


ности дают следующие результаты.

3.5.1. Теорема Моро-Фенхеll•. Если функu,ия 'Р(Х) выпукла и за­


мкнута IЗ), то 'Р··(Х) = 'Р(Х).

3.5.2. Теорема. для выпуклой замкнутой Функu,ии 'Р(Х) и любых


фиксированныхХ, у Е IR
П
- следующие условия эквивалентны:
(i) у Е д'Р(Х),
(ii) Х Е д'Р· (у),
(iii) (Х, у) = 'Р(Х) + 'Р.(у).
... Из 11 Е д",(ж) и определения субдифференциала следует

'v u : (ж. 11) - ",(ж) ~ (и, у) - ",(и),

откуда

",'(11) = sup{ (и, 11) - ",(и)} = (ж, у) - ",(ж),


u

т. е. (i) ::} (iii). эта же цепочка легко проходится в обратном направлении, что
в итоге обеспечивает эквивалентность (i) и (iii).
Аналогичное рассуждение, начатое с ж Е д",'(у), приводит к равенству

","(ж) = (ж, у) - ",'(у),

что с учетом "," = ", приводит к эквивалентности (ii) и (iii). ~

3.5.3. Нера8енСТ80 Юнга 14) •


'Р(Х) + 'Р.(у) ~ (Х, у).

Для однородных выпуклых функций, 'Р(ТХ) = Т'Р(Х), т ~ О,


удовлетворяющих требованию 'Р(Х # О) > О, - широко использу­
ется полярная Функu,ия

'Pd(y) = mах (Х, у) .


.р(х)= I

13) 3амкнутоА Н8ЗblВ31ОТ функuню, имеющую 38MKHyrыA график.


14) Сразу Вblтекающее из (З.8).
3.6. Теорема Хелли 67

в указанных предположениях <р(ж) является нормой, а полярная


функция двойственной нормой,

IIYll d = тах (ж, У).


Ilzll=1
Двойственная норма к двойственной
- опять исходная, т. е.
Ilжll dd
= Ilжll. Евкnидова норма двойственна сама себе. Двойствен­
ная к октаэдрической норме,

- кубическая,

Ilжll m = т~x IЖil,


I

и наоборот 15) •

3.6. Теорема Хелли

Как некто удачно заметил, чтобы развШlить небольшое государство,


достаточноподаритьему крейсер. У выпуклогоанализадля читателя
есть довольно много подарков такого сорта. И хотя «мы должны
думать не о том, что может при годиться, а о том, без чего нель­
зя обойтись. 16), - аудитория впитывает то, что при влекательно.
К изящным фактам подобного рода относится теорема Хелли.

3.6.1. Теорема. Пусть § - конечное семейство из не менее чем n+I


выпуклых множеств 17) в RR. Тогда, если каждые n +I множеств
из § имеют неnустое пересечение, то пересечение всех множеств из §
не пусто.

... Для кО yrверждение очевидно. далее по индукции. допустим, результат


справедnив в R n , покажем, что он остается в силе в R n + l . Пусть любые n + 2
множеств из S пересекаются, но (в предположении противного) пересечение ns
ISI детали и ПРИJIожеиия см. в [6, т.3).
161 джером /(лапка Джером,
17) Семейство S может бьпь и бесконечным в предположении, что каЖдое мно­
жество И] S ком паlcrНО,
68 Глава З. Выпуклый анализ

пусто. Тогда найдетсА подсемейство S, пусть это будет само S, и множество S,


такие что

nS=0, но lI'=n{S\S}!0.
в этом случае сушествует такаА ра:шеЛАюwаА гиперплоскоеть Н, что 11' лежит
в одном ИЗ orкрытых полупространств.

Любые n +I множеств из S\S вместе с S образуют n +2 множеств, оБА­


занных иметь непустое пересечение. Поэтому любые n + I множеств из S\S
в п-мерном сечении гиперплоскостью Н пересекаЮТСА. Но тогда (по индуктив­
ному предположению) все множества семейства S\S пересекаЮТСА в сечении Н.
Противоречие. ~

Спектр приложенийтеоремы Хеллu довольно широк 110J. В кон­


тексте оптимизации она может использоваться в задачах о разре­

шимости неравенств. Если любая система из n + 1 неравенств 18)


Ij(XI .... 'Xn)~O' j=I, ... ,N, (3.1 О)
разрешима, то и вся система (3.10) разрешима.

18) Разумеется, /; выпуклые функции.


Глава 4

Выпуклое nрограммирование

4.1. Теорема Куна-Таккера

Нелинейная задача

f(x) -+ min,
hj(x)~O, j=I, ... ,r, (4.1)
xEQ
с выпуклыми функциями f(x), hj(x) и некоторой выпуклой обла­
стью 1) Q - называется задачей выпуклого nрограммирования. В (4.1)
предполагается выполненным на Q условие Слейтера: существует
такое х, что

hj(X) <О, j=I, ... ,r.


Иными словами, область, выделяемая неравенствами hj(X) ~ О,
имеет внутренность.

Чисто внешне роль условия Слейтера сводится к требованию наличия внут­


ренних допустимых точек, но опосредованно исключаются ограничеНИА в виде

равенств. Такие ограничения формально отсутствуют в (4.1). Однако hj(z) = О


всегда можно заменить двумя противоположными неравенствами. Условия Слеit­
тера не позволяют этого сделать. Но остается возможность включить такие условия
в описание Q.

4.1.1. Теорема Куна-Таккера. Точка х· Е Q является точкой гло­


бального MиHUМyMa в задаче (4. 1) в тOJNМ случае, когда найдутся
неотрицательные множители Лагранжа, у. = {у;, ... , у;}, при ко­
торых выполнены условия дополняющей нежесткости, yjhj(X·) = О,
и лагранжиан

L(x, у) = f(x) + (у, h(x)}


1) Обратим виимание, что ограничеНИА hj(X) ~ О можно переносить в описанне
oбnвстн Q. и наоборот. Подобная .степень свободы. ИСПOnЬ3УСТСА. например. при
персходе к iJIIoiIcmlleHH_ :юдо"Q,V.
70 Глава 4. Выпуклое программирование

принимает минимальное по х значение, т. е.

L(x, у.) ~ L(x·, у.), Vх Е Q, (4.2)


либо в субградиентной форме: О Е DzL(x·, у.).
... Достаточность. В случае (4.2), причем условuе Слеuтера необязательно,
f(ж) ~ f(ж) + (у', h(ж») = L(ж, у') ~ L(ж', у') = f(ж') + (у', h(ж'») = f(ж').
n
Необходuмость. Ограничимся для простоты ситуацией Q = R и гладких
функций f(ж) и h(ж) =
{h , (ж), о ,h.(ж)}. Если ж' точка глобального минимума
••

в задаче (4.1), то по теореме 2.3.1 существуют у;' ... ,


у;, для которых выполняются
условия дополняющей нежесткости, и 2)

V f(ж') = Е у;Vhj(ж'). (4.3)


j=1

Последнее равенство гарантирует (теорема 3.4.1), что в точке {ж', у'} дости­
гается глобальный минимум лагранжиана L(ж, у') по ж, что и дает необходи­
мое (4.2). ~

в недифференцируемом случае соотнощение (4.3) надо заменить необходи­


мым условием минимума:


дf(ж') = Е у;дhj(ж·).
j=1

4.1.2. Определение. Пара (х·, у.) Е IRn х IR' называется седловой


точкой функции ф(х, у), если

ф(х·, у) ~ ф(х·, у.) ~ ф(х, у.)

при любых допустимых х, у. Другими словами, х· - точка минимума


ф(х, у.) по х, а у. - точка максимума ф(х·, у) по у.

Существование седловой точки гарантирует равенство мини­


макса максимину:

min mах ф(х, у)


z у
= mах min
z
у
ф(х, у) = ф(х·, у.),

что, вообще говоря, требует обоснования (см. раздел 4.3).

Теорема Куна- Таккера может быть переформулирована в «сед­


ловом варианте».

2) Равенство '\0 = I - см. (2.10) - обеспечивается услсищем СлеЙmеро.


4.2. Двойственность 71

4.1.3. Теорема. Точка х· Е Q является точкой глобального мини­


мума 8 задаче (4.1) в mOJtIJN случае, когда найдутся неотрицательные
множители Лагранжа, у. = {yj, ... , у;}, при которьа (х·, у.)
седЛ08ОЯ точка лагранжиана,

Конечно, теорема 4.1.3 формально нуждается в доказательстве, которое за­


нимает несколько строчек и легко восстанавливается при осмысленном чтении.

Если же чтение слишком поверхностно, то и доказательство не требуется. Однако


в литературе длина объяснения нередко обратно пропорuиональна сложности
подоплеки. Получается как у Паркинсона ... На маркетинговые исследования
предлагается выделить десять миллионов долларов. Кто за? Принимается в две
минугы. Потому что охватить ..десять миллионов. умом - не получается ... На за­
купку туалетной бумаги - триста рублей. Какие есть мнения? Обсуждение длится
два часа.

4.2. Двойственность

Симметрия лагранжиана относительно прямых и двойственных пе­


ременных (х и у) свидетельствует о существовании за кадром
диалектической пары задач, которые легко обнаруживаются. Нера­
венства (4.4) оказываются равносильны существованию не только
условного минимума в задаче (4.1), но и условного максимума не­
которой двойственной задачи (см. далее).

Введем функционал

8(х) = sup{L(x, у) : у ~ О},

полагая 8(х) = 00 при тех значениях х, при которых значения


L(x, у) неограничены.
С помощью 8(х) задача (4.1) может быть записана в виде

8(х) -+ miп, х Е Q. (4.5)


Если же ввести функционал

R(y) = inf{L(x, у) : х Е Q},

то с его помощью выписывается двойственнаязадача к (4.5):


R(y) -+ mах, у ~ О. (4.6)
72 Глава 4. Выпуклое программирование

Двойственная природа задач (4.5) и (4.6) состоит в том, что


одна и та же сеШlOвая точка (х·, у.) «одного И того же лагранжиана.
служит решен ием и той и другой задачи 3). Поэтому возможность
перехода от одной задачи к другой служит обычно источником вы­
год, как вычислительных,так и общетеоретических. Все это хорошо
видно на примере линейного nрограммирования (или квадратичного).
В более общих ситуаuиях эффект зависит от того, «расшифровы­
вается.) ли функuия R(y) в каком-либо приемлемом виде. Скажем,
двойственная к задаче линейного программирования - снова ли­
нейная задача, и тогда манипулирование идет на одном языке, давая
полезный результат. Но кое-что можно констатировать и на самом
общем уровне.

4.2.1. Теорема. для любых доnустимых значений х и у справедливо


неравенство4)
лх) ~ R(y),

переходящее в равенство IЛХ·) = R(y·) I в тoJНJN случае, когда


(х·, у.) - седловая точка лагранжиана, а значит, х· - решение
прямой задачи, у. - двойственной.
... Доказывать, вообще говори, нечего, поскольку утверждение предста81lиет
собой переформулировку теоремы Куна- Таккера. ~

4.3. Теорема о минимаксе

Вопросы, возникающие вокруг MиHuмaKca, часто ставят в тупик из­


за недостатка «пространственноговоображения•. Сначала не ясно
«что тут доказывать. 5), потом не ясно «как.. Основа здесь, тем
не менее, достаточно проста.

4.3.1. Теорема. MиHuмaKc всегда больше максимина,

min mах ф(х, у) ~ mах min ф(х, у). (4.7)


ж 11 11 ж

J) Разумеется. при условии существования семовой точки. Заметнм также. что


двоiu:m8еннаll к tJвoйсmвенной - снова uсходнаll задача.
41 Поэтому любое значение В(1I) дает оценку снизу условного минимума в прямой
задаче (4.1).
S) Эrо. кстати. наиболее сложная мя пони мания часть математики.
4.3. Теорема о минимаксе 73

Равенство в (4.7) достигается в тOJНМ случае, когда ф(ж, у) имеет


седловую точку (ж·, у.), при этом

min mах ф(ж, у) = mах min ф(ж, у) = ф(ж·, у.). (4.8)


ж у у ж

• Минимизаuия обеих частей очевидного неравенства

mах f/J(ж, у) ~ f/J(ж, у)



при водит к

min mах f/J(ж, у) ~ min f/J(ж, у),


z • z

откуда следует (4.7).


Пусть теперь существует седnовая точка (ж·, у.). Из определения 4.1.2 имеем
f/J(ж, у.) ~ f/J(ж·, у.), откуда

mах min f/J(ж, у) ~ min f/J(ж, у.) ~ f/J(ж·, у.).


• z z

Аналогично из f/J(Ж·, у) :S:; f/J(ж·, у.) следует

min mах f/J(ж, 11) :S:; f/J(ж·, 11·)·


z •

в результате
min mах ,,(ж, у) :S:; f/J(ж·, у.) :S:; mах min f/J(ж, у),
z • • z

что в сопоставлении с (4.7) дает (4.8). Эro устанавливает досmаmочносmь.


Пусть теперь, наоборот, справедnиво (4.8). Выбирая точки ж·, у. из условий

min f/J(ж, 11·)


z
= mах

min f/J(ж, 11),
z

mах f/J(ж·,

11) = min
z
mах f/J(ж, 11),

убеждаемся, В силу (4.8) и определения 4.1.2, что (ж·, 11·) - седnовая точка. Это
доказывает необходuмосmь. ~

Минимизация И максимиззция в (4.7) и (4.8) может вестись


по любым областям, ж Е Х, У Е У. Надо лишь иметь гарантию,
что минимумы и максимумы сушествуют. Для этого достаточна
компактность Х, У, - но не только.

Теорема 4.3.1 устанавливает эквивалентность двух условий,


но ничего не говорит о том, когда же седловая точка сушеству­

ет. Стандартный путь доказательства (4.8) состоит в следуюшем.


Вводятся два отображения

и(у) = Arg min ф(ж,


ж
у) и V(ж) = Arg mах ф(ж, у).
у
74 Глава 4. Выпуклое программирование

Из сушествования неподвижной точки у многозначного отоб­


ражения и(х) х V(y) следует (4.8). Действительно,

означает

откуда ф(х, у.) ~ ф(х·, у.) ~ Ф(х·, у), т. е. (х·, у.) - седловая точка,
и по теореме 4.3.1 справедливо (4.8).
Таким образом, проблема сводится к сушествованию непо­
движной точки у многозначного отображения Т =U х V.

Приведем несколько принципов неподвижно!! точки. - относительно про­


стые доказательства есть в 1171. Ниже считается, что рассматриваемые многознач­
ные отображения имеют выпуклые образы и предполагаются замкнутыми 61.

4.3.2. Теорем. К.кут.нм. Пусть многозначное ат06ражение Т nереводит в себя


замкнутый шар В, т. е. Т(В) С В. Тогда Т имеет неnодвижнуюточку ж' Е В,

ж' Е Т(ж').

4.3.3. Теорем•. Пусть О Е n


и (ж. у) ~ о для любой пары вектора8 ж Е П.
у Е Т(ж). Тогда включение О Е Т(ж) разрешимо в п.

4.3.4. Теорем•. Пусть О Е n и (ж, у) ~ (ж, ж) для любой пары векторог ж Е П,


о , _

у Е Т(ж). Тогда от06ражение Т имеет неnодвижную точку ж Е П.

Из подобного сорта фактов следуют различные утверждения


о сушествовании седловой точки. Ограничимся одним примером.

4.3.5. Теорема. Пусть функция ф(х, у) определена на произведении


Х х У комnактов Х и У, выпукла по х Е Х и вогнута по у Е У.
Тогда ф(х, у) имеет седловую точку.

.. в перечисленных предположениях отображение Т = их v удовлетворяет


условиям теоремы Какyraни (с некоторыми оговорками). •

6) Многоэначное отображение Т: Х -+ 2 У наэывается ЗDм"нуmым (nолунеnрерыtJ­


ным Ctlepxy). если график этого отображения эамкнут в Х х У.
4.4. Разрешимость неравенств 75

4.4. Разрешимость иера.еист.

Разрешимость неравенств, описывающих области допустимых ре­


шений, - весьма принuипиальный вопрос ДЛЯ задач на условный
экстремум. При этом системы линейных неравенств - эталон, ко­
торый раскрывает природу более сложных задач и, в то же время,
охватывает существенную часть приложений.

Линейные неравенства вида Ах ;ii> О или Ах >О с прямоуголь­


ной матриuей А удобно анализировать визуально геометрически.
Примерно так.

Разрешимость неравенства Аж > О означает сушествование такого вектора ж,


скалярное произведение которого на любую вектор-строку Oi: положительно,

(Oi:o ж) =L ОijЖj > О.


j

Геометрически ясно, что подходяший элемент ж сушествует, если все векторы 0i:
расположены строго по одну сторону некоторой (п - I)-мерной плоскости.
Для этого, в свою очередь, требуется, чтобы множество К(А) векторов

при всевозможных наборах положительных коэффициентов

у = {YI' ... , Ут} ~ о

бbIJIО заостренным конусом, не содержашим противоположно направленных век­


торов. Если же

и u= -tl, то

u + tI = L(Yj + Zj)Oj: = О,
j

что указывает на справедливость следуюшего результата.

4.4.1. Теорема. Либо неравенство Ах > О разрешимо, либо уА =О


имеет ненулевое положительное решение.

Результаты типа теоремы 4.4.1 принято называть теоремами об альтернативах.

Если требуется строго положительное решение х >О неравен­


ства Ах > О, то ЭТО сводится к предыдущей задаче о разрешимости
76 Глава 4. Выпуклое программирование

Bz >О с матрицей

В-- [А]
1 .

Задача о разрешимости неравенства Ах > Ь тоже сводится


к предыдущей - с матрицей

a ll .•. al n
а21 .•• а2п -bl]
-Ь2
'" . ... ·х > О.
[ aml •.. а тп -Ь т
О •• , О 1

... Если последнее неравенство имеет решение {жl •...• Жn+I}. то решением
ЯВ1lяется и

жl- •.... --.1


жn} . ~
{-
жn+1 жn+1

4.4.2. Теорема. Либо неравенство Ах ~ О разрешимо (х i= О), либо


уА =О имеет строго положительное решение у > О.
... Для доказательства достаточно заметить, что Аж ;1> О разрешимо. если
конус К(А) помешается в не котором полупространстве. В противном случае К(А)
совпадает со всем пространством аn. И тогда дЛя любого

где все Yj > О. сушествует противоположный вектор

причем У +z > О и (У + z)A = о. ~

По существу теоремы 4.4.1, 4.4.2 в совокупности со стан­


дартными приемами перехода к новым матрицам (неравенствам)
охватывают многие результаты в области линейных неравенств
альтернативного характера .либо-либо~. Разнообразие вариантов
в этой области, тем не менее, достаточно велико и формулировки
результатов выглядят весьма непохожими друг на друга [15]. Вот
небольшая серия фактов.
4.5. Линейное программирование 77

• Система линейных уравнений инеравенств,

Аж=О, ж~О, yA~O

всегда имеет такое решение {ж, у}, что уА + ж> О.


• Либо Аж =Ь имеет решение ж ~ О, либо уА ~ О влечет за собой уЬ ~ О
(ЛeAUfQ MUHKotICKOlO-ФаРКQШQ) 7) •

• Либо Аж =Ь имеет решение ж ~ О, либо разрешима система неравенств


уА ~ О, уЬ <О (nерефоРМУЛUр08ка nредыдущего утвержденuя).

• Либо Аж <Ь имеет решение ж ~ О, либо система неравенств уА ~ О, уЬ <О


имеет решение " ~ О.

• Либо Аж ~Ь разрешимо, либо система "А = О, "Ь = I имеет решение у ~O.

• Система неравенств

Аж < О, ж ~ О, уА ~ О, У ~О

всегда имеет такое решение, что

ж + уА > О, " - Аж > О.

4.5. Линейное программирование

Задача линейного программирования8)

(с, х) --+ mах, Ах ~ Ь, х ~ О, (4.9)


характеризуется линейностью целевой функции (с, х) и ограничений

L aijXj ~ bj.
j

Матрица А имеет размер т х n (т ограничений, n переменных).


Разумеется, это частный случай задачи выпуклого программирова­
ния (4.1).

7) Допonнительн)'IO ииформацию о лииеАных иеравеиствзх можио наАти в сбор­


нике /15).
8' Условие неarpиuaтeльности перемениых неоБАзательно. Стандартная разно­
видность 38IUIчи:

(с, z) -+ тах, Az ~ Ь.

Вариакты с минимизациеА (с, z) ничеro HOВOro в постаНОВКУ не привносАТ, ибо


СвoдAТtя к М8КСИМИ38ЦИИ после замеиы (с, z) на (-с, z).
78 Глава 4. Выпуклое программирование

Каноническая модификация

(с, и) -+ mах, Ви = Ь, u ~О (4.10)


получается из (4.9) добавлением фиктивных параметров Zi ~ О,
таких что

L aijXj + Zi = bi·
j

Впеременных

и= [:]
исходная задача (4.9) принимает вид (4.10).

Использование фиктивных переменных позволяет менять фор­


му задачи до неузнаваемости. Например, вместо (с, Х) можно мак­
симизировать единственный скалярный параметр Хn+1 -+ mах,
добавляя к ограничениям условие

(с, Х) - Хn+1 = О.
Аналогично нелинейная минимаксная задача

тах{ (c l , х), ... , (c k , Х)} -+ miп, Ах ~ Ь, Х ~О


сводится к линейной:

Хn+1 -+ miп; все (d, Х) ~ Xn+l, Ах ~ Ь, Х ~ О.


В качестве -заземления-удобно держать в голове несколько содержательных
примеров, из которых предпочтительны - классические.

Лииeiна8 модет. Пpoи3llO~. На вход производства подается набор ресурсов


ж = {ЖI"'" Ж n }, на выходе образуется набор различных вИдОВ продукции
у =
{YI, ...• Ут}. Внутреннее состояние производства характеризуется векто­
ром Z =
{z., ... , Zt}, компоненты которого принято называть интенсивностями
технологических процессов, но терминология условна. В частности, Zi может обо­
значать количество рабочих, занятых в том или ином технологическом процессе;
время работы не которого агрегата; количество основного вида изroтaвливаемой
продукции и т. д.

Как правило, имеются нормативы, определяюшие взаимосвязи ж = Az,


У = Bz, а также ограничения по ресурсам ж" Ь и ассортименту продукции
у > d. Возможные программы работы предприятия, в свою очередь, подвержены
4.5. Линейное программирование 79

ограничениям. Лfpeгаты не MOIyr работать больше чем 24 часа в сyrки, рабочих


нельзя задействовать в большем количестве, чем есть в наличии, и т. п. Все
это записывается в виде некоторой совокупности неравенств Cz о( е. Сведение
ограничений воедино дает Gz о( h, z > О.
Если цель производства заключается в максимизации объема реализации,
(С,II) -+ mах, rде с; - цена i-ro вида продукции, то после подстановки

(С,II) = (с, Bz) = (В'с, z) = (у, z) -+ mах


возникает задача линейноro проrpаммирования, приведенная к внyrpeнним пе­
ременным z. При этом 9 = в'с интерпретируется как вектор "внешних. цен (9;
показывает, сколько в ценовом измерении продукции дает i-й технологический
процесс, работаюwий с единичной интенсивностью).

з..u .. о JQIe'I'e. Речь, конечно, идет не о приложении,а об эталонной условности.


Имеется n продуктов G., ... , Gn , каждый из которых содержит m питательных
вешеств (белки, витамины и прочее). Пусть Жj обозначает количество i-ro про­
дукта, с; - цену Gj , а;; - количество i-ro питательноro вешества в пишевом
рационе. Задача МИНИМИ38ции стоимости пишевоro рациона при оrpаничениях
на содержание питательных вешеств выглядит следуюшим образом

(с, ж) -+ min, Аж >Ь, ж >0,

где нормативы Ь определяютсядиетологами9).

'QtaНCnOPnWI _.... Имеется m производителей и n пorpeбителей HeKoToporo


товара, расположенных в узлах транспортной сети. Пусть Ж;j обозначает количе­
ство продукта, перевозимоro из i-ro узла в - j-й, а; - объем производства в i-M
узле, Ь; суммарная пorpeбность - в j-M. Естественные оrpаничения на объемы
перево:юк 10):

LЖ;j=S:;;О;, LЖjj~Ьj. (4.11 )


j

за критерий обычно принимается

L..J с; J-ж··
"'" -+ min ' (4.12)
"
;J

где С;; - стоимость пере возки единицы товара из i-ro узла - в j-Й.
Минимизация (4.12) при ограничениях (4.11) - задача линейноro про­
rpаммирования, но только в нестандартной записи с помоwью двухиндексной
нумерации переменных.

9) Либо тpIUIициями, ЛИбо (что чаще вcero) ..беpyrcя С потOIIКЗо.


10) Вывезти иелЬЗЯ БOIIее тoro, что ПРОИЗВОДИТСЯ; завеЗТИ требуетСЯ не менее
потребиости.
80 Глава 4. Выпуклое программирование

4.6. Геометрическая интерпретация

Каждое из ограничений

L aijXj :::;; Ь;
j

задачи (4.9) определяет в JRR сдвинугое полупространство, пе­


ресечение которых дает выпуклый многогранник 11), ограничен­
ный или неограниченный, возможно, пустой. Линейная uелевая
Функuия (с, Х) растет при движении точ­
ки Х вдоль с. Поверхностями постоян­
ного уровня, на которых Функuия (с, Х)
принимает одно и то же значение, явля­

ются гиперповерхности (с, Х) = "'1, орто­


гональные вектору с (рис. 4.1).

Легко понять, что решение задачи


линейного программирования, если су-

Рис. 4.1 ществует, лежит в некоторой вершине


допустимого многогранника. Так при­
нято говорить, но это не совсем точно. Неограниченный много­
гранник может вообще не иметь вершин (клин). Поэтому угвер­
ждение о необходимости расположения решения в одной из вер­
шин допустимого многогранника Р справедливо в предположе­
нии, что Р не содержит прямых (например, в случае ограничен­
ности Р).
Решение не обязательно единственно. Когда одна из .дальних»
граней допустимого многогранника ортогональна вектору с, - все
точки этой грани (в том числе вершины) будуг решениями. Решения
может не быть, когда либо допустимый многогранник пуст, либо
неограничен в направлении с.

Ограниченный многогранник может быть описан двойственным образом, как


выпуклая оболочка своих вершин, а неограниченный - как выпуклая оболочка
конечного числа точек, лучей и прямых.

11) На1ываемый дonycmlUlbUII NHOIOгfН1HHU"ON, ИЛИ J>lHOIOгfН1HHU"ON дonycmlUll1lX ре-


4.7. Двойственность линейных задач 81

Обратим внимание на определенную нечувствительность решения


к данным задачи. Достаточно очевидно, что при малых изменениях
вектора с оптимальное решение будет достигаться в той же самой
вершине. Пределы нечувствительности решения к изменению критерия
могут быть достаточно велики. Например, в ситуации, изображенной
на рис. 4.1, решение одно и то же при любом положительном векторе с.
ВblДелим сказанное в отдельное утверждение.

4.6.1. Теорема. Пусть решение задачи (4.9) единственно. Тогда при


достаточно малых изменениях вектора с оптимальное решение не ме­
няется (достигается в той же самой вершине).

Идеологически задача линейного программирования вроде бы

очень простая 12). Для решения достаточно перебрать вершины


допустимого многогранника и выбрать наилучшую. Однако число
вершин в рЯдовых ситуациях настраивает на пессимистический лад.

Например, при n = 20, т = 40 число вершин'" 1011.

4.7. Двойственностьлинейных задач

Вернемся к исходной зanаче

(с, х) ~ mах, Ах ~ Ь, х ~ О.

Двойственной к ней оказывается задача (см. раздел 4.2)

(Ь, у) ~ min, А Т у ~ с, у ~ О,
где А Т обозначает транспонированную матрицу. Вместо А Т у ~ С
часто пишут уА ~ с.
Напомним, что двойственная к двойственной - снова исходная
зanача. Двойственные задачи тесно связаны между собой, и эта связь
плодотворна.

YOpaJUIeНIUI

• двойственной дIIи канонической

(с, ж) -+ тах, Аж = Ь, ж ~O

12) Если говорить с иекоторой натяжкой, за разработку методов решения этой


задачи КонmoptИJU'lУ и KYnМOHCY была присуж.деиа Нобелевская премия по экоиомике
за 1975 г.
82 Глава 4. Выпуклое программирование

ЯВl1яется задача

(Ь. у) --t min. АТУ> с.

• Для смешанной задачи

(С. ж) --t max.

ЕОijЖj:::; bi • i = I •...• k.
j

ЕОijЖj = bi • i = k+ 1•... • т.
j

Жj~О. ;=I •...• q.


двойственной является

(Ь. у) --t min.

Е 0ijYi ~ Cj. ; = 1•••.• q.


j

EOijYi=Cj. i=q+I •...• n.


j

У; ~ О. i = 1•...• k.

• Если допустимые множества взаимодвойственных задач не пусты. обе


задачи имеют решение. Если же roлько у одной из задач допустимое множество
не пусто. то ее решение бесконечно.

4.7.1. Теорема. Пусть х - доnустимый вектор задачи (4.9), а у -


допустимый вектор двойственной задачи. Тогда

I (с, х) ~ (Ь, у). I


... Таким образом. максимизируемая целевая функция в прямой (исхОдНОЙ)
задаче всегда не больше. чем минимизируемая целевая функция двойственной
задачи. если roлько эти функции вычисляются в точках. удовлетворяющих огра­
ничениям соответствующих задач. Обоснование совсем просто. Умножая Аж ~ Ь
скanярно на у. анеравенство АТУ> С - сквnярно на ж. ПOl1учаем

(Аж. У) :::; (Ь.у). (А Т у. ж) ~ (С. ж).

OrKYдa. В силу (Аж. у) = (АТУ. ж).

(С. ж) :::; (Аж. у) :::; (Ь.у). ~


4.7. Двойственность линейных задач 83

Из yrверждения 4.7.1 легко ВЫВОДИТСЯ следующий критерий


оптимальности.

4.7.2. Пусть х· и у. - доnустимые векторы прямой и двойственной


зада", при"ем (с, х·) = (Ь, у.) Тогда векторы х·, у. являются реше­
ниями соответствующих зада",

Утверждение 4.7.1 дает также ключ к пониманию основной


теоремы двойственности.

4.7.3. Теорема. Если прямая и двойственная зада"а имеют допу­


стимые векторы, то обе они имеют решения.

• При наличии ДОПУl:ГимЬ/Х векторов задача (4.9) неразрешима, если на до­


ПУI:l'ИМОМ многограннике функцию (с, ж) выбором ж можно сделать сколь yrодно
большой. Но по условию функция на ДОПУl:Гимом многограннике ограничена:
(с, ж) ~ (Ь, У).
Такие же рассуждения - с учетом того, что ищется минимум, а не макси­
мум - годятся для двойственной задачи. ~

Активиые И пассивиые orpаиичения. Вернемся к рассмотрению пары


двойственных задач:

(с, х) --+ mах, Ах ~ Ь, х ~O,

(Ь,у) --+ min, АТу ~c, у ~O.

Пусть ж' , у' - их оптимальные решения. Через с(Ь) обозначим максимально


возможное значение (с, ж). В сипу 4.7.2,
с(Ь) = (с, ж') = (Ь, у').

Приращение ~c(Ь) = с(Ь + ~Ь) - с(Ь) при малом изменении вектора Ь,


очевидно, равно

~c(Ь) = (Ь + ~Ь, у' + ~y) - (Ь, у') = (~Ь, у') + (Ь, ~y) + (~Ь, ~y),
где у' + ~y обозначает решение ДВОЙl:Гвенной задачи с новой uелевой функцией
(Ь + ~Ь,Y) при I:I'aPblX ограничениях АТу ~ с.
Как уже отмечалось, при малых изменениях вектора Ь решение ДВОЙl:Гвенной
задачи не меняется (теорема 4.6.1), Т.е. ~y=O, что влечет за собой ~c(Ь)=(~Ь,y').
В чаl:l'ИОМ cnучае ~Ь =
{О, ... ,~bi, О, ... ,О} имеем ~c(Ь) =
у; ~bi, т. е.

• ~c(Ь)
У; = ~Ь; . (4.13)
64 Глава 4. Выпуклое программирование

Таким образом, i-A компонента решеНИА двойственной задачи показывает


во сколько раз прирашение целевой функции больше, чем прирашение Llb j •
Другим словами, ,,: это цена i-ro ограничеНИА.
При этом АСНО, что если ограничение

Еа;jЖ; ~ Ь;
j

не активно, т. е.

ЕаjjЖ; < b j,
j

то малые изменеНИА величины Ь ; никакого ВIIИАНИА на решение ж· не оказывают.


Поэтому соответствуюшее Llc(b) = О, а значит и ,,: = О, в силу (4.13). На этом
пути в итоге получаетсА следуюший результат.

4.7.4. Теорема. Для того чтобы допустимые векторы прямой и


двойственнойзадач бblllи решениями этих задач, необходимо и доста­
точно выполнение следующихусловий дополняющей нежесткости:

У; = О, если L aijX; < bi;

I
j

X~J -- О, если L aijY; > Cj,


i
равносильно

Y ~ ('""
I L...i а· ·X~ - Ь') - О
IJ J I - ,
j

Х; ( ~ aijY; - Cj) = О.
I

ПОНЯТНО, ЧТО В решении исходной задачи часть неравенств об­


ращается в равенства - эти ограничения называют насыщающими

или активными, в противоположность ненасыщающим или пассив­

ным. Решение задачи (4.9) было бы предельно простым, если бы


было известно, какие ограничения активные. В этом случае было бы
достаточно неравенства, соответствующие активным ограничени­

ям, заменить на равенства - и решить получившуюся систему

линейных уравнений. Но решение двойственной задачи как раз


однозначно указывает, какие ограничения активные. Поэтому, если
известно двойственное решение, исходную задачу можно считать
«решенной».
4.8. Экономическая интерпретация 85

4.8. Экономическаяинтерпретация

Рассмотрим линейную модель производства (раздел 4.5),

(р, х) -+ mах, Ах ~ h, х ~ О, (4.14)

считая каждую компоненту Xj интенсивностью j -го технологичес­

кого процесса, приведенной к производству j -го продукта 13) •


В этом случае Pj - цена j -го продукта на внешнем рынке. Элемен­
ты aij матрицы А равны количеству i-гo продукта, производимого
(в случае aij > О) или потребляемого (9ij < О) при производстве еди­
ницы j -го продукта. Соответственно, компонента hi - есть ограни­
чение на суммарное производство (или потребление) i-ro продукта.
Двойственной задачей к (4.14) является

(h, У) -+ min, А Т у ~ р, у ~ О, (4.15)

и она иногда помогает смысловой ориентации.

Математики часто уклоняются от экскурсов в прикладные области, посколь­


ку .там нет ничего нового, кроме эмоциА ... С этим нет смысла спорить. Но дело
ведь не только в "математическоА новизне". В любоА области помимо профес­
сиональноА основы первостепенную роль И'l'ает хорошее настроение и резонанс
с отдаленными сферами бытия. Экономика, конечно, настроение не улучшает,
но -ассоциативно. все-таки резонирует.

Итак, пусть х·, у. - оптимальные решения задач (4.14) и (4.15).


Ограничения двойственной задачи при У = у. имеют вид:

L9ijY; ~ Pj· (4.16)


i

Положительные слагаемые в сумме


(4.16) показывают затраты
на покупку продуктов 14), необходимых для производства едини­
цы j -го продукта; отрицательные слагаемые - доход от продажи

.побочных. продуктов 15), полученных при производстве едини-

131 Иными словами, К8JIIдOMy nродуICmу отвечает -свое. nроuзводсmtlо, которое


пронзводнт Н потреблиет н друтне продукты, но свой продукт считаетси как бы
главным.

14) На внутреннем рынке по ценам 11' = {lIi •... , 1I:}.


IS) Опить-твки на внутреннем рынке.
86 Глава 4. Выпуклое программирование

ЦЫ j -го продукта. Таким образом, (4.16) есть Оfl}аничение по каж­


дому продукту вида:

«внутренние затраты* - .внутренниii доход.. :;;:: .внешняя прибыль ••

Там, где такое неравенство строгое, производство убыточно, -


и соответствующее х; = о. Поэтому, если внyrpeнние цены уста-
новлены равными •
Yj, управляющемуоргану легко сразу исключить

убыточные производства,

х; = О, если L a;jY; > Pj·

Представляет интерес и другое условие дополняющей нежест­


кости,

у; = О, если L a;jxj < h;,


j

показывающее, что оптимальная (равновесная) внутренняя цена


продукта, производство которого не выходит на Оfl}аничение, долж­

на быть нулевой 16).

Здесь, конечно, не имеет смысла углубляться в линейные эко­


номические модели. Более широкий спектр впечатлений можно
получить по специальной литературе. Но сама идея двойственности
в экономике заслуживает внимания. Если материальное произ­
водство описывается некоторой моделью, то двойственная задача
показывает, как финансовая сторона дела должна быть согласована
с сутью происходящего, чтобы содействовать правильному виденью
и стимулированию.

4.9. Транспортная задача

Задача об оптимальных перевозках

L C;jX;j ~ min, L Х;; ~ а;,


;,; j

16) Если ресурс в И1бытке (воздух или вода в некоторык регионак), его целесооб­
разная цена нулевая. Положительная цена лишь путает карты.
4.9. Транспортная задача 87

как уже отмечалось (раздел 4.5), является задачей линейного про­


граммирования. Переменные {Xjj} MOryr быть выстроены в цепоч­
ку, заново перенумерованы, - и задача приобретет стандартный
вид. Такой трюк, однако, разрушит структуру, которая дает надежду
на легкое решение. Поэтому более разумны подходы, учитывающие
особенности исходной постановки задачи.

Обратим внимание, что с самого начала проще рассматривать


задачу

L CijXij -+ min, L Xij = aj, (4.17)


i.j j

Заменить неравенства равенствами можно, вводя фиктивного по­


требителя. Числа потребителей и поставщиков допустимо считать
равными, объединяя всех в один список и полагая bj = О для
чистых производителей и aj = О ДЛЯ чистых потребителей.
Выигрыш в изучении и решении транспортной задачи (4.17)
по сравнению с общей задачей (4.9) довольно велик. Подробности
имеются в любом учебнике по линейному программированию.
Ограничимся несколькими замечаниями.
Если в общей ситуации (4.9) проблема существования допу­
стимого решения достаточно серьезна, то в данном случае - она

почти тривиальна. Допустимое решение существует в томм случае,


когда

(4.18)

Необходимость (4.18) очевидна. Достаточность вытекает из су­


ществования дonycmu.мoгo решенuя 17)

ajbj
Xjj = --,
n
котоРОе, как легко проверяется, удовлетворяет ограничениям (4.17)
при условии (4.18).

17) См. ра:шел 11.5.


88 Глава 4. Выпуклое nрограммирование

Задача
(а, и) + (Ь, 11) -+ тах, и; + lIj ~ C;j

двойственна к (4.17). (?)

4.10. Максимальный поток в сети

Задача о максимальном потоке в сети с точки зрения общего


образования заслуживает выделения места в закромах памяти. Тра­
диционная постановка такова.

На графе выделены две вершины: Р - источник, с - сток. Гру­


зопоток из Р в С, разветвляясь в вершинах, (Стечen по ребрам (i, Л,
из i -й вершины в j -ю. Каждое ребро характеризуется пропускной
способностью (Тij ~ О. Реальный поток по ребру Xij ~ О обязан удо-
влетворять условию I Xij ~ 1, причем в каждой вершине, за ис­
(1ij
ключением Р и с, предполагается выполненным ..:закон Кирхгофа ..:

L Xij =L XA:i, i # р, с, (4.19)


j А:

т. е. суммарный поток, входящий в вершину i, равен - выходяще­


му. В силу (4.19) поток

LXpj,
j

выходящий из р, совпадает с потоком

входящим в С.

Задача о максимальном потоке, таким образом, имеет вид:

LXpj -+ mах,
j

LXij = LXA:i (k #р, с),


j А:
4.11. Симплекс-метод и алгоритм Хачияна 89

и достаточно проста, чтобы рассматриваться в качестве тренировоч­


ного упражнения. Orметим традиционные вехи на пути ее решения.

Сечением 5 в сети называется любое множество вершин, при


условии с Е 5, но Р ~ 5. Разрезом Cs, или пропускной способностью
сечения 5, назовем суммарную пропускную способность ребер,
входящих в 5.

4.10.1. Величина любого дonycтu.мoгo потока не nревышает ми­


нu.мального разреза Cs. Максимальный поток равен минимальному
разрезу.

4.10.2. Алгориmм поиска максимального потока:


(i) Берется любой допустимый поток (скажем, нулевой).
(ii) Проверяется, существует ли путь из р в с, состоящий из не­
насыщенныхребер 18). Если «нет» - алгоритм останавливается,
поток максимален. Если «да» - включается следующий пункт.
(iii) В пути из ненасыщенных ребер все потоки данного пути уве­
личиваются на величину min{ O'ij - Xij}, где минимум берется
по ребрам избранного пути, после чего алгоритм переходит
к nункту (ii).
Задача о максимальном потоке при дополнительном ограни­
чении целочисленности переменных решается точно так же. Это
до некоторой степени удивительно, поскольку общая задача ли­
нейного программирования в целочисленном варианте является

N Р-nолной 19) и сопряжена (на сегодняшний день) с необходимо­


стью экспоненциального перебора.

4.11. Симплекс-методи алгоритм ХаЧИRна

Поскольку решение задачи линейного программирования (ЛП)


достигается в вершине допустимого многогранника, перебор

18) Ребро (i, j) неНQСЫщенно. если Жij < (Щ. ПростоА рецепт целенаправленного
поиска пyrи ИJ ненасышенных ребер проше переоткрыть самостоятельно, нежели
раJбираться в его описании. При иноА roчке Jрения можно обратиться К любому
учебнику.
19) Труднореwаемые J8д8чи и вooбwе дискретные J8д8чи ОПТИМИJaЦИИ планируется
рассмотреть в отдельиом томе.
90 Глава 4. Выпуклое проrpаммирование

в случае существования решения - гарантирует успех за конечное

число шагов. Однако в рядовых задачах число вершин оказывается


астрономическим.

При описании допустимого многогранника в к


n
неравенствами

Аж ~ Ь, ж >0,
где А матрица m х n, - имеется m +n скалярных ограничениА. Вершина
определяется пересечением n гиперnлоскостеА, т. е. из m +n уравнений надо
выбрать n линеАно неэависимых. Поэтому

СП _ (т+n)!
т+n - т!n!

в типичных ситуациях приблизительно правильно (в процентном отношении)


оценивает число вершин.

Классический симплекс-метод реализует идею целенаправлен­


ного поиска решения. Алгоритм .прыгаеn по вершинам, монотон­
но увеличивая целевую функцию (с, х). На каждом шаге переход
осуществляется в соседнюю вершину, в которой значение (с, х)
лучше предыдущего.

Механизм вычислений разбирается в любом учебнике по линейному про­


граммированию, но это уже мало кого интересует, разве что как упражнение

по линейной алгебре. Различные модификации алгоритма давно -реализованы


в железе-, и при наличии компьютерных программ решение соответствуюших

ЗадаЧ с помошью карандаша и бумаги теряет смысл.

За кадром долгое время оставался «ФилосОФСкий вопрос». Бы­


ли построены при меры задач, в которых симплекс-метод вынужден
перебирать почти все вершины. Но переборный, по сути, алгоритм,
как выяснилось, обычно работает довольно быстро, что произво­
дило загадочное впечатление.

Странность была фундаментального характера. Многочислен­


ные попытки найти способ решения задачи ЛП, который бы за­
ведомо избавлял от экспоненциального роста объема вычислений,
- и начинало казаться, что причина в принци­
не давали результата

пиальном отсутствии полиномиального алгоритма 20) • А поскольку все

:10) Алгоритм решении uслочисленно!! 18дачи называют nОЛUНOAIuальн_. если вре­


ми вычислени!! полиномиально зависит от ДЛИНЫ описании исходных данных.
4.12. Квадратичное программирование 91

это «кипело"> В окрестности знаменитой проблемы «Р # N Р? [91,


было сломано немало копий, но безрезультатно.

Вздох облегчения принесла работа Хачияна 21), В которой поли­


номиальный алгоритм был построен - не столько дЛя вычислений,
сколько дЛя удовлетворения философского дискомфорта.
В первую очередь была видоизменена сама задача Л П наложе­
нием условия ограниченности числа знаков в записи всех коэффи­

циентов, фигурирующих в постановке 22). Это позволило с помощью


.метода ЭЛllиnсоидов дать эффективные оценки локализации реше­
ния, и в итоге обеспечить полиномиальный объем вычислений.

4.12. Квадратичное программирование

Задачей квадратичногопрограммированияобычно называют зanачу

(Dx, х) + (с, х) ~ min, Ах.с:::; Ь, (4.20)


где D - положительно определенная n х n матрица, А - матрица
т х n. Непосредственно из теоремы Куна - Таккера вытекает сле­
дующий результат.

4.12.1. Теорема. Точка х· является точкой гл06Ш1ЬНого минимума


в задаче (4.20) в томм случае, когда при некотором у. ~O выполняется
условие:

Dx· + с + АТу. = О, (Ах· - Ь, у.) = О.


Для задачи (4.20) легко переФормулируются и другие общие
результаты.

щ XO'fUIIH Л. r. П01lииомиальный алгоритм в линейном программировании //


дОIUl. Ан СССР. 1979. Т. 244. С. 1093-1096.
221 Что COOТllleTCтвyeT фиксаuии дIIины описания, принятой в дискретных задачвх.
При этом сама Э8дIIча не стала -дискретной-, поек01IЬКУ вершины допустимого
многогранника по-прежнему не обязаны нвходиться В Y:lllВX uелочисленной решетхн.
Глава 5

Теория игр

Самое трудное в любой дисциплине заключается в осознании роли


простых понятий. Не теоремы, а исходные категории мышления -
вот что необходимо для ориентации. Скажем, возможность назна­
чения цены с помощью максимизации
спрос

прибыли, равной площади заштрихо­


ванного прямоугольника на графике
«цена - спрос» (рис. 5.1), - в не­
которых кругах звучит откровением.

uенз
И причина заключается в неосвоенно­
сти самой идеи оптимизации, а не ка­
Рис. 5.1
ких-то теорем.

Помимо экстремума есть несколько других понятий «опти­


мизационного характера», которые относительно малоизвестны,

но не менее важны. Беда заключается в том, что, попав под крышу


с обманчивым названием «теория игр», они стали В общественном
мнении ассоциироваться с покером. Секрет же заключается в том,
что теория игр вообще не изучает игры в приземленном понима­
нии этого слова, а занимается «повсеместно распространенными»

системами, в которых индивидуальные интересы не совпадают

с коллективными.

Так или иначе, в главе рассматриваются теоретико-игровые


понятия, которые заслуживают включения в арсенал общеобразо­
вательных идей.

5.1. Смешанные стратегии

Математика приносит большую пользу всем, и никому - в част­


ности. Так иногда думается, и не без оснований. Но вот примеры
иного свойства.
5.1. Смешанные стратегии 93

Чем ВЫГОДНЫ убыточные акции. Допустим, на рынке ценных бумаг


имеется два типа акuий, 81 и 82, прибыльность которых зависит
от каких-то трудно прогнозируемых событий (принятие закона
о таможенных пошлинах, война и т. п.). Акuия 81 даст либо 8 %,
либо 2 % прибыли; 82, соответственно, - либо .минус 4 %, либо
плюс 14 %. Компактно ситуаuию удобно записать в виде матриuы

[8-4] .
2 14
Покупатель выбирает столбеu, т. е. какие акuии покупать; строка
определяется неизвестными заранее обстоятельствами.
Покупать акuии 82 рискованно (могут оказаться убыточными),
а гарантированная прибыльность 81 - всего 2 %. Тем не менее,
из ситуаuии легко .выжимается. 5 % прибыли. (!) Действительно,
если акuии 81, 82 купить В количестве х. , Х2 штук, то прибыль будет
1 I
либо d, = --(8х) - 4Х1) %, либо d1 = --(2х) + 14Х1) %.
XI + Х1 Х, + Х2

Если ориентироваться на raрантированную прибьUlЬ min{d., d2 },


то ее максимум гарантируется равенством d( = d2 , откуда следует
Х I : Х2 = 3 : 1. В этом случае

независимо от обстоятельств. Покуnка nотенциШlЬНО убыточных ак­


ций noдHuмaeт гарантированную nрибblЛЬ с двух до пяти процентов.

-Русскаи PYJJe11(8•• Предположим, некто вынужден сыграть в .рус­


скую рулетку., выстрелив себе в висок из пистолета 81 или 82. Ве­
роятности осечки (благоприятного исхода) определяются матриuей

8 о]. 10-2.
[ 2 12

Выбору пистолета соответствует выбор столбuа, строка характери­


зует технические обстоятельства (качество патронов, соответствие
марке оружия). Какой пистолет выбрать?
Понятно, задача аналогична предыдущей, но здесь есть новые
мотивы (вероятностные), и новые ощущения в связи с повыше­
нием .ueHbl вопроса •. Принuипиальный момент - одноразовость.
94 Глава 5. Теория игр

Собственно, та же проблема возникала бы, если бы в предыдущей


задаче денег хватало на покупку только одной акuии.

Решение зодачи лежит 30 fJШtIКQJrIи бесхитростнOlO ожиданин, что


кокой-то пистолет нада выбрать после аНШlиза матрицы. Максимум
веронтности осечки в данном случае обеспечивает случайный выбор
пистолета 51 с веронтностыо 2/3, и 52 - с веронтностыо 1/3.

Иными словами, предварительно надо «бросить монету •. Тех­


ника расчета не отличается от предыдущей задачи. Вероятности
выбора PI, Р2 определяются решением системы уравнений

Рассмотренные при меры заслуживают внимания, как ника­


кие другие, потому что среднестатистическоемировоззрениеобхо­
дит такие явления стороной. Все просто, широко распространено,
но почему-то попадает в область слепого пятна. Задачи явно оп­
тимизаuионного характера 1), однако их природа неожиданна, не­
привычна, плюс к тому, имеет тенденuию противиться обнажению.
Именно поэтому простые и яркие примеры здесь эффективнее аб­
страктной теории, в которой общность нивелирует колорит.

Типична. «иrpoва. скryаци•• в экономике. Фирма или физическоели­


цо - имеет n различных стратегий (nокуnки разных акций, выбора
партнеров, направлений деятельности) в условиях неоnределенности
состояния экономической среды, характеризуемого т вариантами 2).
Каждой комбинации возможностей отвечает свой выигрыш aij, где
второй индекс указывает номер стратегии фирмы, первый - состо­
яния среды.
В результате фирма в матрице выигрышей

А= [~~~ ::: ~I.~]


anl •.. а nт

выбирает столбеu, фортуна - строку.

1) Речь идет все-таки о выборе наилучших вариантов.


2) Варианты MOГyr определяться: победоА на выборах тоА или иноА партии,
климатическими катаклизмами, ценами на нефть, международными событиями.
5.2. Равновесие по Нэшу 95

Теория игр описывает ситуацию следующим образом. Имеется


два игрока. Первый - выбирает строки матрицы А с вероятно­
стями {PI,.'" Рп}, второй - выбирает столбцы с вероятностями
{ql •... ,qm}. Матожидание выигрыша первого тогда равно

W(p, q) = L aijPiqj,
i,j

и он его, так или иначе, пытается максимизировать.

Если игра антагонистическая(выигрыш одного есть проигрыш


другого), появляется естественнаялогика решения. Первый так вы­
бирает {PI •... ,Рп}, чтобы добиться максимума W при наихудшем
для себя {ql,"" qm}. второй - наоборот. В результате решением
игры оказываются наборы вероятностей

Р· = {p~, ... ,p~}, Q


.= {.
Ql"'" Qm ,
.
}
обеспечивающиеравенство

mах min
" q
L.. aijPiqj = miпq mах
"
L.. aijPiQj. (5.1)
',] I,J

Решением (5.1) является седловая точка W(p, Q), которая всегда


существует, что является теоремой.

5.2. Равновесие по Нэшу

Пусть некая экономическаясистема состоит из n взаимосвязанных


элементов Ai. Каждый элемент Ai распоряжается выбором пере­
мен ной Жi Е Xi, и его .интерес.. состоит в максимизации своей
функции выигрыша

Переменную Жi, - которая может быть скаляром, вектором, функ­


цией, множеством, - называют стратегией игрока Ai, что плохо
укладывается в семантику слова .стратегия .. , но термин общепри­
нят.

Описанная СИ1Уаuия типична дIIЯ экономики. Каждая ячейка системы имеет


собственную степень свободы Жj (закупки сырья, ассортимент выпуска, внут­
ренний график работ). но выбор Жj не определяет свой выигрыш Dj - многое
зависит от действий дрyпtХ элементов системы.
96 Глава 5. Теория игр

Возникает вопрос: какой выбор стратегий Х = {XI, ... ,Х п } бу­


дет равновесным? В принципе ответов может быть много, но прак­
тика чаще всего показываетследующее. Если предприятие Ai знает,
что изменением Xi может увеличить свой выигрыш, то не удержи­
вается от соблазна. При этом равновесной может быть лишь такая
точка Х, в которой ни один из элементов не может добиться увели­
чения своего выигрыша изменением собственной переменной Xi.
В теории игр такое равновесие Х· называетсярешением игры по Нэшу.
Очевидно,

т. е. каждая функция Di(X) в точке Х· достигает оптимума по соб­


ственной переменной Xi.
В частном случае, когда все Xi являются скалярными величи­
нами, а функции Di(X) - гладкие, равновесие по Нэшу обязано
удовлетворять системе уравнений

BDi(X·)
д
Xi
= О, i = 1' ... ' N. (5.2)

дилемма ПКJllO'letlноl'O. Некоторые при меры в математике - конторово множество,


nодК080 Смешо, функция Аккермоно Э ), - выкристаллИЮвaJlись В самостоятельные
понятия и вошли в своеобразный теоретический минимум. Таким примером
ЯВ11яется и дШlеммо заключенною - Иl1)а двух участников с матрицей ВЫИl1)ышей
(в данном случае - ПРОИl1)ышей):

(1;1) (9;0)]
[ (О; 9) (8; 8) .

Первый иl1)oк (заключенный) выбирает строку, второй - столбец. На пере­


сечении - годы тюрьмы. Первая цифра, выделенная жирным, обозначает, сколько
сидеть первому заключенному, вторая - второму 4). Решая, что делать, первый
заключенный стоит перед дилеммой: получить 1 год или 9 лет тюрьмы, выбрав
первую строку, либо О или 8, выбрав вторую. Выбирая вторую строку, он в лю­
бом случае вы и I1)blвaeT. Но Иl1)а симметрична. Партнеру точно так же выгоднее

Э) Элементы списка, конечно, могут быть разного калибра.


4)Все это обычно приукрашивается сказкоii. Заключенные совершили ТAJКKoe
преcтynnение. Но у прокурора нет доказательств, и он тогда _организует иrpу •.
Созиавшиiiся и представившиii доказательства - выходит на свободу, упорсгвую­
шиii - получает 9 лет тюрьмы. оба не сознаются - получают по году (к примеру,
за незаконное ношение оружия). оба сознаются - получают по 8 лет.
5.3. Метаигровой синтез 97

выбрать второй столбец. В результате оба сознаюгся в совершении преступления


(см. сноску), и получают по 8 лет. Эro и есть нэшевское решение.

Равновесие по Нэшу можно охарактеризовать как индивиду­


ально разумное решение. В рассмотренном при мере коллективно
разумным решением представляется (1; 1). Но парадокс не снимает­
ся даже возможностью предварительной договоренности. В конеч­
ном итоге каждый принимает решение самостоятельно, при этом
оказывается выгодно нарушить коллективный договор.
Парадоксальность нэшевских решений - скорее правило, не­
жели исключение, и многие экономические системы находятся

именно в таком равновесии. До некоторой степени удивительным


представляется тот факт, что для эффективности экономики в це­
лом это часто не имеет никакого значения (см. следующий раздел).

5.3. МетаИГРО80Й синтез

Вернемся к задаче

n
~ rj.;:i; -+ mах, (5.3)
j=1

рассмотренной в разделе 2.1, где она интерпретировалась как


чисто оптимизационная задача распределения ресурса Х n по
ячейкам (элементам Aj), имеющим производственные функции
!pj(Xj) = rj.;:i;, которые измеряют продукцию на выходе Aj при
использовании ресурса в количестве Xj.

Попытка провести параллели с реальной экономической жиз­


нью показывает, что не все так просто. Во-первых, производствен­
ные функции !pj(Xj) отражают скорее не жесткую связь между
входом и выходом производителей, а их предельные возможности.
Поэтому элементы необходимо заинтересовать в результатах рабо­
ты, например, оплачивая труд пропорционально прибыли

Dj = !pj(Xj) - '\Xj,
где ,\ - цена ресурса. Во-вторых, производственные функции
управляющему органу (УО) , как правило, не известны или из­
вестны весьма приблизительно. В ситуации !pj(Xj) = rj.;:i; можно
98 Глава 5. Теория игр

считать, что на сверхнем уровне .. не известны коэффициенты r;.


Но тогда УО не имеет возможности решать оптимизационную
задачу (5.3). Прямолинейная попытка запросить значения ri не га­
рантирует успеха, потому что производители будут отвечать, думая
о собственных интересах. В результате может оказаться, что им
невыгодно сообщать достоверную информацию.

Возможна следующая организация работы системы. УО посы­


лает запрос элементу А; о значении коэффициента ri, элемент
отвечает: «Si". Не имея другой информации, УО на основе полу­
ченных данных S = {SI, ... , ВП} делит ресурс х;(э) и назначает
цену ~(э). После подстановки закона распределения Xi(S) и назна­
чения цены ~(э) в функцию прибыли Di, получаем

т. е. функция выигрыша каждого элемента оказывается завися­


щей лишь от вектора В. Возникает типичная игровая ситуация,
в которой В; является стратегией Ai. В результате игрового вза­
имодействия в системе устанавливается некоторое равновесие э·,
но нет никакой гарантии, что Э· r. =
Понятно, что положение и характер равновесия определяются
функциями Xi(S), ~(э). Поэтому задачей УО оказывается «опти­
мизация правил игры ..: такой выбор функций Xi(S), ~(э), чтобы
в равновесии получающейся игры было Э· = r или хотя бы Э· ~ r,
а равновесное распределение ресурса {Xi(S·)} было оптимально
по критерию (5.3). Иными словами, задача УО есть синтез такой
игры между производителями, в которой каждый, преследуя сугубо
индивидуальные цели, обеспечивал бы тем самым оптимум функ­
ционирования системы в целом.

Может показаться, что задача утопична. Не имея информации о системе, мы


хотим так организовать ее рабol)', чтобы каждый думал только о себе, но этого
было бы достаточно для оптимального функционирования в целом. Тем не менее
подобная задача в довольно свободных предположениях имеет решение~l.

~) Задачи такого сорта широко изучаются в .теории активны!! систем. (Бур­


/(Ot/ В. Н.). Поведенческая сторона дела кратко рассматривается в [6, т.2. гл.lll,
более подробно в монографии: Оnоuцег В. Н. Равновесие и устоАчивость в моделя!!
коллективного поведения. М.: Наука, 1977.
5.4. Оптимум Парето 99

Заметим, что тактика поведения производителей с точки зрения


интересов системы не играет принципиальной роли в следующем
смысле. Если тактика «нэшевская», УО синтезирует такую игру,
что ресурс распределяется оптимально в равновесии по Нэшу. Ес­
ли тактика иная - УО, синтезируя игру, ориентируется на другое
понятие равновесия, по-прежнему добиваясь оптимума распреде­
ления ресурса.

Осмысливаи затронyryю тематику. можно было бы возразить, что проблема


отсyrcтвии информации О производствеННЫХ ФУНКЦИИХ не столь принципиальна,
и метаигровой подход драматизирует ситуацию, из которой есть простой выход.
Ведь можно не запрашивать информацию, а извлекать ее из наблюдений деитель­
ности предnриитий В прошлые периоды. Подобный подход широко примениетси
на првктике, реализуи в раЗНЫХ вариантах принцип планировании от достигну­

ТОГО уровни. Но это не всегда дает эффект, порождаи второй круг неприитностей
и инициируя сознательное скрытие резеРВОВ производства.

Рассмотренный фрагмент из области метаигрового синтеза на­


глядно показывает, что чисто оптимизационные экономические

задачи при более внимательном изучении теряют свою первона­


чальную форму и приобретают новое качество. Экономическая
действительность неизбежно сталкивается с наличием в системе
различных интересов и проблемой их разумного согласования.
Нельзя сказать, что игровое взаимодействие подсистем главное
звено в экономике, но это достаточно важный фактор, без учета
которого трудно рассчитывать на успех исследования.

5.4. Оптимум Парето

На практике широко распространены задачи, в которых одновре­


менно имеется несколько целевых функций. Например, при поиске
выгодного режима работы предприятия приходится думать об улуч­
шении не одного, а многих показателей: прибыль, рентабельность,
себестоимость, надежность и т. п. Выбирая конструкцию самолета
для серийного производства, также приходится думать о многих
показателях: грузоподъемность, потолок, максимальная дальность

перелета, экономичность эксплуатации.

На формальном уровне это выглядит так: имеется т целевых


функций
100 Глава 5. Теория игр

и на множестве Х надо выбрать альтернативу Z Е Х, обеспечива­


ющую, по ВОЗМОЖНОСТИ, как можно б6льшие значения всех Di(Z).
Понятно, что одновременная максимизация нескольких функций
в общем случае противоречива. Первая осмысленная задача, кото­
рая здесь возникает, заключается в выделении множества неулучша­

емы.х альтернатuв.

Альтернатива Z Е Х называется неулучшаемой, если не суще­


ствует другой альтернативы у Е Х, для которой

причем хотя бы одно из этих неравенств строгое.


Неулучшаемые альтернативы называют оnтимальнымu по Паре­
то. В определенных условиях оптимальные по Парето альтернативы
исчерпываются решениями параметрической задачи оптимизации

Варьирование параметров JJi позволяет перебрать все паретовские


решения исходной задачи.

Паретовские решения естественно возникают в игровых зада­


чах. Если Di(Z) - выигрыш, а Zi - стратегия i-ro игрока, то
ясно, что результат разумного коллективного договора целесооб­
разно искать среди альтернатив, оптимальных по Парето. По этой
причине множество паретовских решений называют иногда перего­
ворным множеством.
Глава 6
Бифуркации и катастрофы

Говорят, как назовешь, так и поедешь. Теория катастроф - лишнее ТОМУ подтвер­
ждение. Сначала имя вознесло, потом сбросило. Ажиотаж сменился разочаровани­
ем. Баланс до сих пор не найден. Однако не дожидаясь, пока -все уляжется_, здесь
стоит обратить внимание на ряд аспектов. В первую очередь заслуживает упоми­
нания классификация критических точек, особенно для семейств функuионалов,
а Т3lОКе понятие грубости, которое для параметрических семейств неожиданно
становится нетривиальным.

Содержание главы ориентировано на тех, КОМУ суждено искать трудности


в другой области. За деталями можно обратиться к [1,7,19).

6.1. Скачкообразныеизменения

Поведение изучаемых систем обычно зависит от тех или иных


параметров, при изменении которых MOryr возникать неожиданные

явления. Стандартный пример: устойчивость верхнего положения


маятника при вибрации точки подвеса с частотой, превосходящей
барьерное значение. Эго из области сюрпризов. Но есть также масса
вполне ожидаемых резких перестроек системы на фоне плавного
изменения параметров,о чем свидетельствуютустоявшиесяпонятия

критической нагрузки, критической температуры и т. п.

На заднем плане в таких ситуациях, как правило, фигурирует


динамический процесс

х = V/Р(Ж, Е), (6.1)


но источником скачкообразных изменений являются метаморфозы,
происходящие с критическими точками nотенциШlа /Р, т. е. с реше­

ниями уравнения

V/р(ж, Е) = О, (6.2)
при изменении параметра Е.
102 Глава 6. Бифуркации и катастрофы

Качественный скачок в поведении динамической системы

х = f(X,E)
при изменении параметра называют бифуркацией, а соответству­
ющее критическое значение Е - бифуркационны.м. Это не совсем
согласуется с исходным смыслом слова бифуркация 1), посколь­
ку изменения могуг определяться не только ветвлением решений
уравнения f(x, Е) = О, но и чисто динамическими перестройками
фазового портрета без появления новых положений равновесия.
Например, в бифуркации АндРОНО8а-Хоnфа [6, т.21 фокус теряет
устойчивость, и при этом рождается асимптотически устойчивый
цикл. Тем не менее, в градиентных системах (6.1) бифуркации
в основном определяются критическими точками потенциала и их

характеристиками, что позволяет сконцентрироваться на изучении

статики. Однако при этом нельзя забывать, что различные решения


(6.2) могут качественно отличаться друг от друга - минимумы,
максимумы и т. п.

в случае

критическим значением ЯВllяется f = О. При f ~ О система имеет еДИНСllleННое


нулевое равновесие, которое асимптотически устойчиво. При сколь угодно малом
f >О это равновесие становится неустойчивым, а в его окрестности ПОЯВllяется
два других, асимптотически устойчивых равновесия ж = ±Vi,
в терминах потенциалов реЧЬ идет о возмушении

I 4
Ip(ж) = -ж
4

f 2
добавкой -2Ж' Исходный нулевой минимум Ip(ж) при f >О превраwaется

в локальный максимум и два локальных минимума.

Пример другого рода дает Ip(x) =х 2


• Малое возмущение здесь
может лишь незначительно сместить критическую точку, но она

остается единственной и сохраняет свой тип минимума 2).

1) от лат. bifurcus - раЗдвоенный.


2) См. дaIIee о структурной устойчивости.
6.1. Скачкообразные изменения 103

в случае большего числа параметров возникают ситуации иного


типа. Скажем, минимум по х функции

1 4 1 2
!Рл(Х) = 4 х + 2 А 2 х + A1x (6.3)
определяется условием

d!рл 3
dx = х + А 2 х + А( = о.
Эrо уравнение так называемой ката­
строфы сборки. При различных пара метрах
А •• А2 кубическое уравнение будет иметь
или один действительный корень, или
три. Получается поверхность, изображен­
ная на рис. 6.1. Можно ли эту поверхность
считать графиком некоторой многознач­
ной функции x(A 1, А2)? Вообще говоря,
можно, но на самом деле здесь подразу­

мевается нечто большее, если за кадром


стоит динамика

Рис.6.1. Катастрофа
. d!рл(Х)
x=-~~"':'" сборки
dx
В этом случае заштрихованная часть поверхности отвечает неустой­
чивым положениям равновесия x(A 1, А2), остальные х(А., А2) -
устойчивы 3).
Если при этом система в начальный момент находится в точ­
ке А и параметр А2 плавно увеличивается. то состояние системы
меняется вдоль АСВ - в точке С происходит скачок. При возвра­
щении А2 в исходное положение состояние системы будет меняться
по другому пyrи - ВЕР (нечто вроде петли гистерезиса). В то же
время при специальной регулировке параметров A1, А2 возможен
плавный переход из А в В вдоль ADB. Наконец, заштрихованная
часть поверхности, соответствует нереализуемым (неустойчивым,
метастабильным)состояниям системы.
Кубическое уравнение задает канонический вид катастрофы
сборки, имеющей в точке S характерную особенность. К такому

3) Там потенциал 'Рл(z) прииимает локanЬНО максимальные значеНИII.


104 Глава 6. Бифуркации и катастрофы

виду с помощью нелинейных замен координат сводятся различ­


ные другие уравнения. По первому впечатлению различных типов
особенностей может быть довольно много. Однако оказывается,
что в типичных, структурно устойчи8ЫХ, случаях при наличии двух
параметров могут встречаться лишь два типа особенностей: ката­
строфа сборки и катастрофа складки. При трех и более параметрах
различных особенностей несколько больше, но и там дается их
полная классификаuия.

6.2. Хвосты и струи

Далее используется обычный стеНОfl)афическийтрюк

О дОl+... +О'j(ж)
D j(ж) = д Ж°1 ... д ж.О. '
1

с помоwью которого ряд Тэйлора для функции n переменных записывается


в привычном на веwественной прямой виде:

j( ~~ + ...) = Е'" [)о j(ж) ...0, 0= 01 + ... +0.,


о!
О! = 1.
0=0

Начальный отрезок ряда Тэйлора,

." ()
3lpZ
~ D°Ip(O)
=L- ,Z,
а
0= О
а.

называется k-cmpyeu Функuии Ip в нуле 4). Разность Ip(Z) - j"Ip(Z)


называют Х8остом.

Напомним, что запись

Ip ()
ж =~
LJ
D°lp(O)
---ж
о
0=0 о!

не всегда корректна, поскольку ряд Тэйлора не обязан сходиться к Ip(ж).

Стандартный пример дает функuия Ip(ж) = е- I / Ж !, продолженная в нуле


по непрерывности. Все D°lp(O) = О, и ряд

о(ж) = О + О . ж + О . ж 2 + ...
4) Обычно "-струя определяется бескоординатно, что выглядит нначе.
6.3. Лемма Морса 105

сходится к тождественному нулю, но не к 1р(ж). Тем не менее любой отрезок этого


ряда хорошо приближает 1р(ж) в окрестности нуля, но не улавливает, что 1р(ж)
в нуле имеет минимум.

Считается, что функция 1{) : IR --+ IR имеет в нуле nорядок k,


если первой ненулевой производной является Dkl{)(O).

6.3. Лемма Морса

в окрестности невырожденной критической точки любой Функционал


заменой nepeмeHHых приводится к сумме «± квадратов». Более точная
формулировка и обоснование приводятся ниже, но предварительно
удобно выделить вспомогательный результат.

6.3.1. Лемма. Для любой гладкой функции f : IRn --+ IR, при условии
/(0) = О, - всегда можно указать такие 9i : IRn --+ IR, что

х , 9.·(0) = aafx(O•. ).
f (х ) = Xt91 (Х ) + ... + Х п 9п ()
... Результат устанавливается в одну строчку:

! I:(tж) = ! Е д~~~) жj
I I

f(x) = dt dt. ~
о о I

6.3.2. Лемма Морса. Пусть гладкая функция 1{) : IRn --+ IR имеет
в нуле невырожденную критическую точку и I{)(O) = О. Тогда в до­
статочно малой окрестности нуля существует локальная система

д
коор инат ZI, ••• , Zn, в которои
M~

I{)[x(z)] = Z~ + ... + Z~ - Z~+I .•• - Z~, (6.4)

причем X(Z) является диффеомоРФизмом 6 ), а k - максимальной


размерностью nодnространства, на котором матрица Гессе v 21{)
положительно определена 7).

5) ФунКЦИII (6.4) нззываетсlllrlО{КО«I(UIrI k -седлOltl.


6) ДUффmмopфuwOltl нвзывают такое взаи",но одиознвчное отображение': Х -+ У,
что, и ,-. иепрерывиодифференцируе",ы.
7) Разность n - k нвзывают UHдel(ro", неВЫроЖденноА критическоА точки, С"'. [16).
106 Глава 6. Бифуркации и катастрофы

• По лемме 6.3.1
'Р(Ж) = L Zi'JIi(Z),

причем все

"'i(O) = 8'1'(0) = О,
дж;

что позволяет применить лемму 6.3.1 к функциям "';(ж), получая в итоге

'Р(Ж) =L ZiZjl";j(Z).
i.i

Без ограничения оБШНОСТИ можно считать 1) lAJij = IAJji, причем матрица IAJjj(O)
HeBыpoJКдeHHa, поскольку HeBыpoJКдeHHa нулевая критическая точка и

1 81'1'(0)
lAJ;j(O) = -2 - 8
8Zj .
Ж;

Если теперь в локальных координатах UI •... , un

'Р[ж(и») = ±и~ ± ... ± и~_1 +L UiUjlAJij(U).


i.j~k

то в координатах "1, •.• , "n. гдс все "; = Uj. кроме

получается

'Р[Ж("») = ±,,~ ± ... ±,,~ + L tli"j~Ц"),


;.j~k+1

что обосновывает индукционный шаг и позволяет дойти до k = n, начиная


с k =0.
НепрерывнаядИфференцируемостьлокальныхзамен требует вниманиялишь

в части использования VllAJkk(U)I, где спасает ссылка на теорему об обратной


функции. ~

Лемма Морса, в некотором роде, является нелинеЙНblМ обобще­


нием хорошо извеСТНblХ в линейной алгебре результатов о канони­
ческом представлении квадратичной формы [6, т.3\. Конечно, если
говорить с натяжкой. Потому что здесь появляются принuипиаль­
но новые аспеКТbI, позволяющие взглянуть на различные функuии
с точки зрения эквивалентности их особенностей.

1) В противном CIIучае от r.Jij можно переilти к i;)ij = 1/2(r.Jij + r.Jj;).


6.4. Эквивалентность особенностей 107

6.3.3. Определение. Гладкие функции 'Р, Ф ; IRn -t IR локально эк­


вивалентны 8 нуле, если существует такой локальный диффеоморфизм
z(x), что
'Р(Х) = ф(z(х)J + ~
в некоторой окрестности нуля при подходящей константе ~.

Если VIp(O) = VФ(О) = О, то в предположениях определения


6.3.3 говорят об эквивалентности критических точек. Лемма 6.3.2
показывает, что неВЫрОЖденные критические точки, которым от-

вечают гессианы одинакового ранга 9), - эквивалентны друг друry.

6.4. Эквивалентность особенностей

Данное выше определение эквивалентности критических точек -


и НС11>умент, толкающий на весьма зыбкую почву. За пределами
действия леммы Морса возникают существенные трудности.
Есть, правда, еще одно исключение - одномерный случай.
Если
'Р(О) = 'Р'(О) = .. , = Ip(k-I)(O) = о,
и лишь Ip(k)(o) > о, то 'Р(Х) локально эквивалентна в нуле функ­
ции k
X • Остальные производные роли не играют 10).
Таким образом, первая же ненулевая С11>уя в одномерном случае
определяет характер критической точки. НадеЖдЫ на нечто подоб­
ное в размерностях n>1- не оправдываются.

Вопрос, стоящий на кону, выглядит примерно так. В каком


случае и по каким признакам можно гарантировать эквивалентность

в нуле функции 'Р(х) и ее k-струи jklp(X)? Иначе говоря, какие


свойства полинома jklp(X) обеспечивают эквивалентность jklp(X)

9) Напомним. что РОНlOJI Кtlодроmuчнoii формы иазывается не ранг задающей мат­


рицы, а число отрицательиых слагаемых в каноническом представлении, каковое

является топологическим инвариантом - сохраняется при иеВЫроЖденных преоб­


раЗОВ8НИЯХ.

10) О неэквивалеитности внешне похоJlCИХ функций ;r} и ;rS МОJICИо судить на осно­
ве ТОГО, что нх мвлые возмушения приводят к появлению разиого чнсла новых

крнтических точек в окрестностн нуля.


108 Глава 6. Бифуркации и катастрофы

и jklp(X) при любой функции q(x), разложение которой


+ q(X)
начинается со степени т > k? При положительном ответе на этот
вопрос функцию Ip(x) называют k-оnределенной в нуле.
По первому впечатлению условия k-оnределенносmu не долж­
ны быть очень сложными, по крайней мере, идейно. На такую
волну настраивает ситуация сневырожденным гессианом. Одна­
ко сложность проблемы оказывается несоизмерима с ожиданиями.
Пробные попытки довольно быстро заводят в тупик.

Функuия X,X~ не является Ic-оnределенной ни при каком конечном Ic. А


функция

rдe ра:JJIожение в ряд Тэйлора g(x" Ж2) начинается с членов порядка не менее 12-го,
оказывается II-оnределенной, и поэтому эквивалентна вблизи нуля многочлену
X,X~ + X: I. О неэквивалентности XIX~ и XIX~ + ж:' можно судить по ра:JJIИЧНЮ их
графиков в части пересечения нулевого уровня: X,X~ = О удовлетворяют обе оси
координат, а X,X~ + х: = О - только Ж, = О.
1

Более загадочна функuия (19)

'P(XI' Х2) = xi + X~,


которая не является 5-0nределенной, но 6-0nределена(!), т. е. Xi +X~ и xi +X~ +ф(ж)
raрантированно эквивалентны в нуле лишь в том случае, когда ра:JJIожение ф(х)
начинается со степени m ~ 7.

Функuии

'(Х, у) = зх
2
+ 2ж J
- 6ху 2,

g(x, у) = зх + 2х
2 )
- 6жу 2 + h(x, у),
где ра:JJIожение h(x, у) начинается с членов порядка не менее четвертого, в обшем
случае MOryт быть не эквивалентны. Однако если ра:JJIожение h(x, у) начинается
лишь с членов пятого порядка, то 1и9 - эквивалентны. (!)

Оба многочлена
,,(х, у) =ж 2
-2ху + у2,

/2(х, у) = х 1
_ у1

обрашаются в нуль при х = у, второй - также при х = -у.


МеЖдУ ними имеется принuипиальная разниuа. Функuия 11 определяет сед­
ло, и седnовой характер критической точки не может быть нарушен добавлением
6.5. Грубость и трансверсальность 109

членов третьего порядка и выше. Ничего подобного нельзя сказать о первом мно­
гочлене /1' Прибавление к нему членов более высокого порядка может менять
характер критической точки, так или иначе.

6.4.1. Теорема. Если функция 1{) : IR. n ~ IR. является k-оnределенной,


то любой однородный многочлен степени k + 1 npeдcтaвtiм в виде

jk+l [PI(X)jk-1 (:~)] + ... + jk+1 [рп(х)/-I (:~)],


где РI (Х), ... ,Рп(Х) - полиномы, порядка не менее первого.

Теорема 6.4.1 приведена лишь для того, чтобы можно было


составить представление, о какого сорта условиях здесь идет речь.

Вариации предположений и выводов см. в [7, 191.


Книга 171 по теории катастроф, как нельзя кстати, начинается с китайской
притчи. Некий Чжу, дескать, все от.аал, чтобы научиться убивать драконов. долго
учился, достиг совершенства, но ни один дракон так ему и не встретился .• и тогда
[тут авторы ссылаются на Ренэ Тома) он начал учить других искусству убивать
драконов ...

6.5. Грубость и трансверсальность

Понятно, что нет смысла изучать те свойства системы, которые ис­


чезают при малейшем возмущении параметров. Вопрос, конечно,
не так прост, как поначалу кажется. Тем не менее идея грубости
системы, устойчивости к малым возмущениям, называемой также
структурной устойчивостью, - после необходимых уточнений до­
водится, как правило, до четких постановок задач.

В данном случае речь идет о критических точках функционала,


каковые под воздействием возмущений могут исчезать, расщеп­
ляться, а также менять свой тип. Это список «нежелательных»
явлений. Структурно устойчивые ситуации исчерпывают невырож­
денные критические точки 11), что не вполне ясно, как обосновать.
Не совсем ясно даже, что надо обосновывать.

11) Характеризуемые неВЫРОJКденностью ..,атрицы [«се


110 Глава 6. Бифуркации и катастрофы

Ситуаuия максимума или минимума прозрачна (раздел 1.2).


но как быть в общем случае? Туман частично рассеивает лемма
Морса, поскольку гессиан остается невырожденным под воздей­
ствием достаточно малого возмущения, но тогда в подходящей
системе координат - это k-седло.

Заметим, невырожденность матрицы Гессе - есть невырожден­


ность матрицы Якоби отображения

что пускает мысль по направлению к трансвеРСШlьности, и эта точка

зрения не только проливает новый свет, но и оказывается более


перспективной при рассмотрении семейств функций.

ТрансвеРСШlьность - довольно общее понятие, отвечающее


ситуации общего положения при пересечении многообразий. Д"а
подпространства Х и У в JRn трансверсШlЬНЫ, если любой вектор
z Е JRn представим в виде 12)

Z = Х + у, Х Е Х, У Е У.

Гиперплоскости (сдвинутые подпространства) L, М С JRn транс­


версШlЬНЫ, если их сумма порождает JRn.
Наконец, гладкие многообразия в JRn пересекаются трансвер­
СШlьно в точке Хо, если их касательные гиперплоскости в ХО транс­

версальны. О трансвеРСШlьности многообразии «целиком .. говорят


В том случае, когда в любой точке пересечения они пересекаются
трансверсально 13).

Таким образом, трансверсальность пересечения многообразий,


графиков - есть некий эквивалент типичности, отсутствия ис­
ключительности, который оказывается лакмусовой бумажкой при
выяснении структурной устойчивости. Невырожденность нулевой

12) Прямая и плоскость ]R2 mроНСlfе/КаАЬНЫ в ]R3. если прямая не лежит в плоскости.
Но в а4 они уже не трансверсальны.
13) Разбросанные по литературе определения трансверсальности имеют опреде­
ленный люфт. которы!! обычно используется ДЛЯ извлечения тех или иных удобств.
6.6. Структурно устойчивые семейства 111

критической точки !р(Ж) равносильна трансверсальности пересече­


ния в нуле графика градиента V!р(Ж) с графиком нулевой функ­
ции. Аналогичным образом можно характеризовать (как структурно
устойчивые) k-оnределенные функции. При этом надо лишь огово­
рить, что в качестве возмущений допускаются функции, разложения
которых начинаются с (k+ I)-й степени. Это, кстати, обычная прак­
тика. Для определения структурной устойчивости надо оговаривать
две веши: что должно сохраняться и при каких возмущениях. Лю­
бую систему можно сделать «структурно устойчивой.. , подходящим
образом меняя определение.

Разумеется, произвол выбора определения требует разумного


подхода. Проблема, в той или иной степени, не математическая,
но необходимость согласования различных аспектов теории часто
сводит свободу выбора к единственному варианту.
Обычное требование грубости критической точки проистекает
из естественных потребностей смежных областей. Характер крити­
ческой точки не должен меняться при достаточно малых возмуще­

ниях 14) - вот на что опираются многочисленные результаты. И все


рассыплется как только определение структурной устойчивости ра­
дикально изменится.

6.6. Структурно устойчивые семейства

При рассмотрении семейств функций точка зрения естественным


образом меняется.

6.6.1. Определение. Семейства функций !р(Ж, э), ф(ж, э), т.е.


r
1,0, Ф : JRn Х IR ~ R,

эквивалентны в нуле, если

!р(ж, э) = Ф[z(ж, э), t(s)] + {(э),


где {(э) - гладкое отображение, t(s) - диффеоморфизм, z(ж, э)
семейство диффеоморфизмов.

141 Беэ учета каких бы то ни было етепенеil ра11Jожения.


112 Глава 6. Бифуркации и катастрофы

Понятно, что это следующий виток по отношению к опреде­


лению 6.3.3. Если теперь /р(Х, а) эквивалентно в указанном смысле
любому /р(Х, а) + А/р(Х, а), где А/р(Х, а) - достаточно мал6, то
/р(Х, а) считается структурно устойчивым семейством.

в гла:J8 бросается принципиальное отличие этого определения от cтpyКl}'P­


ной устойчивости критической точки. Но вопрос в том, откуда двигаться. Если
начинать с семейств функций, то в случае не:J8ВИСИМОСТИ 'Р, '" от 8 определе­
ние 6.6.1 переходит в определение 6.3.3. Аналогичная трансформация происходит
со структурной УСТОЙЧИВОСТЬЮ.

Конечно, при намерении посвятить себя .. искусству убивать драконов. дан­


ные выше определения желательно рассмотреть с разных точек зрения. Но если
все же концеитрироваться на более приземленных задачах, можно ограНИЧИТЬСЯ
малым. Главное, разобраться, в чем ра1J1ичие на качественном уровне. Почему
функция ж структур но неустойчива, а семейство (6.3), т.е.
4

структурно устойчиво?
Потому что критическая точка ж4 расщепляется под воздействием сколь угод­
но малого возмущения ~ж2. Что касается fjJА(Ж), то :шесь квадратичные и линейные
члены ..пегалиэованы", а от кубических можно и:Jбaвиться заменой переменных.
Поэтому возмущения степени ~ 4 меняют лишь параметры функционала. Нако­
нец, возмущения степени >4 не играют роли, потому что имеет место аналог
4-0nределенностu d4R семейства, но это и СОСТ8В11яет основную трудность при
строгом доказательстве, хотя может быть 0с0знано с помощью визуальных уси­
лий - на базе предстаВ1lений о трансверсальных пересечениях.

Главное достижение теории катастроф заключается, конечно,


не в том, что изучены некоторые катастрофы. Главное в другом.
Установлено, что при двух параметрах есть всего два структурно
устойчивых семейства, катастрофа сборки и катастрофа складки
(/Р.л(Х) = х + ~x).
3
При большем числе параметров количество
структурно устойчивых эталонных семейств увеличивается. Первые
семь элементарных катастроф были открыты Томом. Арнольдам
классификаuия существенно расширена 15).

щ Арнольд В. И. Критические точки гладких функциА и их нормальные формы 11


УМН. 1975. N1,30. ВЫП.5. С. 3-65.
6.7. СпекушlЦИИ и приложения 113

6.7. Спекуляции и прило.ения

Уравнение газа Ван-дер-Ваальса16),

(Р+ ;2)(У - {1) = "(Г'


где р, ~ т - давление, объем, темпераrypа, а, {1, 'у - константы,
заменой переменных (не суть важно какой) приводится к уравнению
х3 + -Л 2 Х + -Л 1 = О, которое описывает катастрофу сборки.
Под этим предлогом обычно теория фазовых переходов в рам­
ках описания Ван-дер-Ваальса записывается в качестве приложения
теории катастроф. Дескать, взаимосвязь термодинамических пере­
менных р, У, т характеризуется .той самой~ особенностью. Но это
слабый аргумент, и даже 4IНИкакоЙ~. Параметрическое уравнение

х
3
+ -Л2Х + -Л 1 = О
легко анализируется элементарными методами, и было изучено
змолго до появления теории катастроф. Тем не менее, дух теории
катастроф витает нм уравнением

х 3 + -Л2Х + -Л 1 = О,
и было бы полезно разобраться, есть ли от этого какой-то эффект
для термодинамики.

Влияние любой теории на nриложенuя можно разделить на две


категории: аппаратную поддержку и философскую опору. Аппаратная
составляющая, заслоняющая обычно все остальное, в теории ката­
строф не так заметна. Технические подробности большей частью
нужны для внутренних потребностей. Кое-что направлено вовне, на­
пример методика nроверки k-оnределенности критической точки,
но в целом аппаратная часть теории в значительной степени замкну­
та в себе. Поэтому прикладная востребованность близка к нулю, если
говорить об упрощенном взгляде на предмет.
Философская составляющая, наоборот, существенна и нетриви­
альна. Наличие классификации структурно устойчивых катастроф

161 ХороwиА при мер, кстати, Korдa сомнительные предположения ведут к пра­
виnьным выводам.
114 Глава 6. Бифуркации и катастрофы

служит фильтром, позволяющим оценивать исходное качество моде­


лирования. Если бы, например, уравнение состояния вещества приво­
дило к зависимости между параметрами, не обладающей свойства­
ми грубости, было бы ясно, что модель, возможно, неадекватна.
Тот факт, что уравнение Bah-дер-ВаШlьса nорождает структурно
устойчивую зависимость, - служит аргументом в пользу удачной по­
становки задачи. На многие физические nриложения, описанные в [19J,
полезно взглянуть как раз с nодобной точки зрения.

Теория катастроф имеет тalOКe массу .несерЬеЗНЫХ" прило­


жений в биологии, экономике, социологии. Большинство из них
строится примерно по такой схеме.
Будем, например, шахматиста характеризовать тремя парамет­
рами: х - достижения, ,х\ - увлеченность, ,х2 - техника игры.
Первое, что приходит в голову, попытаться охарактеризовать зави­
симость x(,xl' ,х2), Поскольку х не обязан быть функцией .всего
остального., можно попытаться подобрать подходящую поверх­
ность в пространстве пара метров {х,,х 1, ,х2}, Теория катастроф
делает эту задачу предельно простой. Надо рассмотреть лишь две
возможности: сборку и складку - и подобрать подходящее распо­
ложение поверхности в пространстве.

Поверхность на рис. 6.1 как раз улавливает некоторые содержа­


тельные свойства задачи. При низкой увлеченности рост техники
дает непрерывный рост достижений. При большой увлеченности
рост техники приводит к довольно медленному росту достижений,
но затем достижения увеличиваются скачком. Наконец, рис. 6.1
объясняет тот удивительный факт, что есть шахматисты (в окрест­
ности точек В и С), которые равны по технике и увлеченности,
но существенно отличаются достижениями.

далее можно ставить разные задачи. Например, по какой тра­


ектории целесообразно тренировать шахматиста, учитывая его ин­
дивидуальные особенности, начальное положение и потенциальные
возможности. Допустим, если шахматист находится в районе точ­
ки А, а природные данные не позволяют ему в разумное время
достичь техники уровня точек В и С, то для прогресса необходимо
умерить увлеченность и двигаться в обход, вдоль ADB.
Аналогичным обраюм рассматриваются ра3JIичные типы систем: -спрос -
цена - реклама ... -результаты труда - дисциплина - квалификация .. и т. п.
6.7. Спекуляции и nриложения 115

Мноro подобноro рода анализов рассеяно по литературе. Причем, несмотря на всю


их _наивнос""., они часто звучат откровением для специалистов-прикладников.

Возможно, что и в приведенном выше при мере кое-кто из шахматных тренеров


найдет удобное модельное подтверждение своих практнческих наблюдений.

Спрашивается, как расценивать подобного сорта «приложе­


ния.? Удобнее всего - просто игнорировать их, считая чисто
спекулятивными. Опыт развития точных наук показывает, что мо­
дели должны позволять проводить вычисления и, главное, должны

строиться на основе измеряемых параметров. Первый пункт (на­


личие цифровых результатов) постепенно стал необязательным -
важность качественных результатов давно осознана во многих об­
ластях. Но вот по второму пункту (принципиальная измеряемость
параметров) модели типа .достижения - увлеченность - техника.
выглядят малоубедительными.

Тем не менее в этих моделях есть рациональное зерно, и было бы


жалко его потерять, игнорируя все оптом. Главный рациональный
момент состоит здесь в том, что они дают удобный язык дЛя
описания явлений, чуждых методам традиционной математики.
А язык во многом определяет результаты. Ведь исследование часто
идет не столько от потребностей содержательной задачи, сколько
от имеющегося инструмента (языка).

Возьмем простой пример. При изучении рынка, не задумываясь, пишут: у -


спрос, ж - цена, функция у = f(ж) описывает их зависимость. Однако реаль­
ный спрос испытывает скачки, причем сушество дела заключается не в разрыв­
ности функиии f(ж). Психологическая инериия (привыкание) приводит к тому,
что местоположение скачков зависит от на­
у
правления изменения цены. Правдоподоб­
но выглядит зависимость, изображенная
на рис. 6.2, и эта зависимость не описывает­
ся никакой функциональной связью, даже
многозначной. Получается петля гистере­
зиса, наличие нереализуемоro в обычных
условиях участка АВ - дань предшеству­
юшему рассмотрению. ;.-----, в I
I

Итогом сказанного может слу­


жить простой вывод. Содержатель­
ные мотивы, с одной стороны, и Рис. 6.2
116 Глава 6. Бифуркации и катастрофы

теория катастроф - с другой, дают повод для пополнения языка


функциональных связей. Математические результаты теории при
этом сами по себе MOryт оставаться за кадром. Главное, они дают
идеологическую базу, на которой новый аппарат приобретает ра­
циональные черты. Что здесь имеется в виду? Хотя бы понимание
того, что такое типичные ситуации и их классификация. Это, в свою
очередь, позволяет изучать не произвольные связи, а ограниченное

число их типов.

6.8. Дополнение

• Бифуркационная тематика, конечно, шире тех постановок :J8Д8ч, которые


рассматриваются в теории катастроф. Основная доля исследований по бифурка­
циям замыкается в рамках :J8Д8ч статики, сводяшихся к анализу особых точек
х + у х(у) уравнения F(z, у) = О. Здесь много интерес-
ных проблем, и о динамике часто забывают. MeJКДY

L f(y)
Рис. 6.3
тем центр тяжести теории лежит, безусловно, в ди-
намической области.
Статического ракурса иногда не хватает даже
в тех :J8Д8чах, где изначальнонет никакой динамики.
Рассмотрим для примера блок-схему, изображенную
на рис. 6.3. В цепи обратной связи :шесь использован функциональный преобра­
зователь f(y) =.;у при у> о и /(у) = -Н при у < О.
у
Результируюшая связь между входом z и
выходом у системы определяется равенством

х+/(у) =у,

что при водит к зависимости, изображенной на


рис. 6.4.
____ ...::::O.~:::-----
х Возникает сюрприз. Выход у не определя-
ется входом х, хотя все звенья системы детер­

минированы и взаимно однозначны. Беспечное


заявление, что связь входа с выходом многознач­

на, не решает проблемы, так как безответным


повисает вопрос: чему конкретно равно у? В ре­
альной системе ведь значение у должио быть
определено. Поэтому на практике приходится
Рис. 6.4 уточнять :J8Д8чу: описыватьдинамику, учитывать

.. паразитные .. емкости, индуктивности и пр .

• Не хватать может даже динамического ракурса. Представим, что в системе,


изображенной на рис. 6.3, время дискретно, и / - динамический блок, даюший
6.8. Дополнение 117

на выходе сигнал y(k) - y(k - 1) при входном сигнале y[k). Тогда из балансового
соотношения

z[k) + y[k) - y(k - 1) = y[k)


вытекает y[k) = z[k + 1). (!) Ни много ни мало - блок-схема предсказывает
будywее. Понятно, чтобы удержаться в рамках ДОЗВOllенного, надо переходить
на более тонкое описание динамики, опять учитывая ВIIияние паразитных пара­
метров, и самое главное - ]/IПУСК проuесса.

• в граниuах изучаемой модели не всегда ясно, как будет вести себя


реальная система. При изменении пара метров Вдрут начинает мигать "сигнальная
лампочка •. это может быть что утодно:

• решенUJI за КOIН!'IHoe Bpeм1I yxoд1lт в 6есконеlfност.,


• ..,одел. НОlfиноет nредсКQЗывот. будущее,
• решениR ветtIRтсн,

• уровнение nерестоет решотl1CR.

При этом реальная система ВЫГЛАдИт загадкой, и приходится искать дру­


гие модели. Выходить за рамки исходной постановки, переосмысливать задачу.
К слову, из МОдели, предсказываюwей будywее, более-менее ясно, что временные
задерJКXИ сигналов в uепи обратиой связи могут при водить К большим недора­
зумениям. Если такие задерJКXИ фигурируют в качестве пара метров, то в :J8Даче
о бифуркаuиях надо ОJКИД8ТЬ серьезных приключениЙ.
Сами по себе неоJКИД8ННОСТИ при бифуркаuиях почти всегда СВЯ]/lНЫ С ]/1-
бывчивостью. Забываются явные инеявные допywения при выводе уравнений
модели. Дифференuиальноеописание, как правило, предполагает, что .. проuесс
уже пошел., в то время как этап -включения. бывает равносилен перехОдУ в дру­
ГОЙ мир. К стаuионарному режиму иногда нет дороги.
Глава 7

Вариационное исчисление

7.1. Кnассическиезадачи

Некоторыематематическиедисuиплины испытываютпостоянныемучения в свя]и


с поиском простых и красивых экспонатовдЛЯ агитаuии. В данном случае эадачи

давно нашлись сами.

Отправным источником вариационногоисчисления принято счи­


тать задачу о брахистохроне:о кривой быстрейшегоспуска, по кото­
рой тяжеЛblЙ шарик в отсутствие трения бblстрее всего скатывается
из точки А в точку В. Постановка принадлежитГШlШlею, а в 1696 г.
Иоганн Бернулли выдвинул ее на конкурс в основанном им первом
в мире математическом «Acta Auditoгum •. Поступило три
журнале

решения: от ЛоnитШlЯ, Якоба Бернулли 1) и анонимное, по поводу


которого И. Бернулли заметил: «Льва узнают по когтям., - имея
в виду Ньютона.

Задача о брахис:тохроне. Пусть точка А расположена в начале координат, А = (О, О),


ось у направлена вни] и В = (0,13). Наилучшее решение (брахuсmохрона) ишется
среди кривых у(ж).
Скорость дВижения v = ../2iY определяется и] эакона сохранения энергии
2
mv
mgy = -2-'

ДифференuиалдЛины дуги

dl = J1 + [у'(ж))2 dz.
в итоге dt = dl/v, и минимиэаuия времени движения (с точностьюдо константы
1/.;2g) сводится к эадаче:
JI + [у'(ж))2 d ---' .
0
r.:т::\ z -. mщ; у(О) = О, у(о) = р.
/ уу(ж)
о

1) в .Лекциях- имена обычно опускаются, но дIIЯ семьи Бернуллu приходится


делать исключение, слишком много ее члеиов оставили след в математике.
7.1. Классические задачи 119

з.да •• о распponpaнеин. JI)"I8 CIIeТ8 в неоднородной среде базируется на той же


идеологической основе. Согласно nрUНЦUnУ Ферма, свет «выбирает ПУТЬ., мини­
миэируя время, т. е.

0 v'1 + (y'(:I:»2 """ -. .1_ ->. •


mlП; 1/(0) = О, 1/(0) = р,
/ v ( :1:,1/)
о

где "(:1:,1/) - скорость света в точке (:1:,1/).

Начало вариационного исчисления можно связывать таюке


с изопериметрическими задачами. Многие решения были известны
за несколько веков до нашей эры: окружность, ограничивающая
максимум площади при заданной длине; сфера, заключающая мак­

симальный объем при фиксированной площади 2).

з.да •• Диаои.. - базируется на античной легеиде. Финикийская царица Дидона,


бежав в Африку ПО семейным обстоятельствам, купила у царя берберов Ярба
-клочок земли, который можно огородить бычьей шкурой •. Ярбу потом мало
не показалось. Покупательница разрезала шкуру на ремни, связала их и окружила
приличную территорию, заложив Карфаген и положив начало решению июпери­
метрических задач.

Соответствуюwая максимиэвция плошади при фиксации концов кривой


дЛины L на прямой 1/ == О выглядит так:

~ ~

/ 1/(:1:) dx ~ mах, / JI + (y'(:I:»)2 dx = 1.


а а

Легко выписать также вариант постановки дЛя эвмкнутой кривой.


Если кривую 1/(:1:) параметриэовать: :1: = :I:(t),
У = 1/(t), - эадача приобретает вид:

т т

~ /(:l:Y- жу) dt ~ mах, / v':i: 2 + у 2 dt = 1.


о о

О
T. .e.uJI ннn.. Форма тяжелой нити дЛины 1, эв­
крепленной в точках (О, у(О)} , (а,1/(а)} (рис. 7.1)
Рис. 7.1

2) Между прочим, это хороши!! при мер TOro, ЧТО 38дача может быть решена
38дОЛГО ДО появления ueKMTHoro инструмента.да и не подозревали древние, что их
способы рассуждения будут К8:saться иестрогими через пару тысяч лет.
120 Глава 7. Вариационное исчисление

определяется минимумом потенциальной энерrии и (центр тяжести обязан зани­


мать наиболее низкое положение), что приводит к вариационной задаче:

• •
и -JуJ I + (r/(Z))2 dz -+ min,
о
JJ +
о
1 (r/(Z))2 dz = 1.

в теории управления широко распространены задачи на услов­


ный экстремум вида

! р(Х(,
т

S = ... , Х,.; и(, ... , и,; t) dt -+ min,


(7.1)
о

где искомым является управление u(t) = {u,(t), ... , u,(t)} , как


функuия времени, а ограничения имеют характер дифференuи­
альных уравнений.
В большинстве практически интересных ситуаuий на управле­
ние наклааываются ограничения, при водящие к недифференuиру­
емости u(t), что выводит анализ за рамки классического ракурса
(см. главу 8).

7.2. Уравнение Эйлера

Рассмотрим вариаuионнуюзадачу с закреnленны.миконцами, в кото­


рой ищется экстремаль функuионала

!
w = " L(q,q,t)dt (7.2)

на множестве глааких функuий
q(t), принимающих на KOHuax
заданного промежутка времени 3) [t o, t,] фиксированные значения
q(to) и q(t,).
Зааача (7.2) идеологически почти не отличается от конечномер­
ного аналога, но технические подробности ее сильно преображают.
В первую очередь наао договориться, о каком функциональном

}) РазУlolеетСЯ, вреlolснн4я ннтерпретация параlolСТра , нсоБЯ38Тсльна.


7.2. Уравнение Эйлера 121

пространстве идет речь, но решить этот вопрос раз и навсегда

не удается. Пространство В приходится подбирать, чтобы зада­


ча решалась при разумных усилиях. Как правило, предполагается
Е = C 2 [to, t,J. Далее все развивается по обычному сценарию, в ко­
тором необходимое условие оптимума определяется равенством
нулю градиента VW. Но градиент является вектором сonряженного
пространства, что приводит к появлению «нового действующего
лица.. В·. Правда, в случае рефлексивных пространств (например,
гШlьбертовых) , Е с точностью до изоморфизма, совпадает с Е·,
и это сближает картину с пейзажем в IR • Все это в достаточной ме­
П

ре описано в [6, т. 5J. Остановимся лишь на стержневых моментах.

IPuиeнr фУНХЦИОН8Jl8. Производная Фреше tp'(ж) функционала tp : Е -+ IR - это


такой вектор из Е' , что

tp(ж + .::lж) - tp(ж) = (tp'(z), .::lж) + о(ll.::lжll), (7.3)


который называют градиентом Фреше функционала tp(ж) в точке Ж и обозначают
как Vtp(ж). Но в обшем случае (при несовпадении Е с Е') угловые скобки
обозиачают не скалярное произведение, а линейный Фун"ционал.
Линейная часть равенства (7.3), записанная в виде

6tp = tp(ж + 6ж) - tp(ж) = (tp'(ж),6ж),


напоминает соотношение дифференuиалов, но 6tp и 6ж называют вариаЦUR.4lи.

Функuионал tp : Е -+ IR называется дифференцируемым по Гато в lОчке ж,


если сушествует такой линейный ограниченный функuионал I е Е' , именуемый
градиентом Гато, что дIIя любого h е Е

tp(ж + th) - tp(ж) = t(f, h) + o(t).


Понятно, чlО проблема в данном случае .перекликается. 41 с дифференцирова­
нием по любому направлению. Градиент ГаlО и градиент Фреше обозначаются
одинаково: Vtp(ж) - ра3llичие ВО3llагается на контекст. А если сушествуют оба
градиента, то они совпадают, - и в этом случае roворят просто о градиенте.

Для совпадения достаточно равномерной непрерывности градиента Гато, каковая


далее предполагается.

7.2.1. Лемм.. Необходимымусловием достижениR Фун"ционалом tp(ж) в точ"е жо


лOlCального ма"симума Ш/и минимума R8/lRemCR обращение в нуль градиента Vtp(Жо),
-равносильно- - вариации 6tp(Жо).

4) .ПереклнкасТСА., но не совпадает, - потому что в пронэводноli по направлению


Фиryрнрует односmоранний предел, КОТОРЫIi 1( тому же может оказаТЬСА нелииеilиым
по h.
122 Глава 7. Вариационное исчисление

.... Из 'Р(2:) = 'Р(2:о) + (Vtp(2:), 2:-2:0)+0(112:-2:011) ясно, чro при Vtp(2:o) 1= о


в сколь )'ГQIIНo малой окрестности 2:0 иашлись бы lОчки, в кaropых фуикuиоиал
принимал бы значения разных знаков. •

Вернемся теперь к задаче (7.2). Пользуясь леммой 7.2.1 и ва­


рьируя вектор-функцию

с помощью вариации 6q(t) , обращающейся в нуль на концах [to, t.l,


получаем, используя интегрирование по частям,

6W = f(" DLDq 6q + DL)


Dq 6q dt =

DL 1"
= -.6q
Dq 'о
+ f" L. (DL
----о
d DL) 6qi dt =
Dqi dt Dqi
to I

tl

=
f L (-
to I
.
DL
Dqi
- -dtd -.
DL)
Dqi
6qi dt = о,

откуда, в силу произвольности вариации 6q(t), вытекает, что функ­


ция L обязана удовлетворять уравнениям Эйлера,

DL DL
-Dqj - -dtd -Dqj = о, i = 1, ... , n, (7.4)

которые удобно записывать в виде одного векторного уравнения

DL d DL
----=0 (7.5)
Dq dt Dq ,

где подразумевается
7.2. Уравнение Эйлера 123

Если q., ... , qn - 0б06шенные координаты некой механи­


ческой системы, L - лаграюкиан, то интеграл (7.2) называют
действием по Гамшыnону. Из приведенной выкладки следует, что
механическая система движется по экстремалям действия, что назы­
вают nринциnом Гамшыnона, а уравнения Эйлера (7.4) оказываются
механическuми уравнениями Лагранжа [6, т.2].

Если система автономна, L не зависит от t, то уравнение


Эйлера имеет первый интеграл

L - \ q, ~~) = const. (7.6)

... действительно,

в силу (7.5). •

Пpимepw

• в задаче о брахuсmохроне
0 Jt +r.:т=\
[1I(z)P .1_
...... -+ mщ

,,(0) = О, "(0) = /З,
/ v,,(z)
о

в силу автономности, сушествует первый интеграл (7.6), что в данном случае


приводит к дифференциальному уравнению~1

переходяшему после )'Прошений в уравнение ,,1 I + (,,')2) = C 1 , решением которого


оказывается семейство циlCJlоид:

где z, " - координаты точки окружности радиуса С2 , катяшейся по прямой, (J -


угол поворота.

~I Через С нюке обозначаются константы.


124 Глава 7. Вариационное исчисление

Таким образом, брахистохрона ЯВllяется циклоидой. Небезынтересно отмс­


тить, что циклоИда обладает свойством изохронности: время спуска материальной
точки по циклоиде под действием силы тяжести - зависит только от разности
высот (и не зависит от начального положения) .

• Плошадь поверхности врашения кривой, про­


ходяшей через точки А, В (рис. 7.2), равна

f 1/(ж)V 1 + 11I(ж)J2
%2

S = 211' dz.
%1

Минимизация этой поверхности, опять-таки в силу


автономиости функционала, при водит к уравнению
Рис. 7.2 (7.6), сводяшемуся в данном случае к

1/ =с
JI + (11)2 '

что легко решается с помошью замены 11 = С ch t, и в итоге дает семейство


кривых

ж-С,
1/=Cch-- '
C
Соответствуюшиеповерхности называют котенouдами - такую форму принимаст
мыльная пленка, соединяюшая две окружности 61 , как показано на рис. 7.2. По­
скольку энергия поверхностного натяжения пропорциональна плошади, форма
мыльной пленки может подсказывать решение и в более сложных случаях, когда
задача .трудно пробиваема. аналитически .

• Варьирование Функuионала

приводит к уравнению Эйлера i +ж = О, которому удовлетворяет семейство


фУНКI1ИЙ

ж(t) = А sin (t + 8).


Если Q= 11', а краевые условия ж(О) = ж(1I') = О, то экстремалей бесконечно
много: ж(t)= А sin t. В случае Q = 11'/2 и краевых условий ж(О) = О, Ж(1I'/2) = I
экстремаль одна, ж(t) = sin t.

61 Решен ие задач и не впол не оче ВИJ1ИО дlUКe качС(;твеи но (а0 ynом И иаи и я MЫJI ьноА
пленки). Интуитивно кажется, что минимум пет враwение 01РСЗка прямоА.
7.2. Уравнение Эйлера 125

• в задаче

! [(х, х) + (ж. Аж)]


т

dt -+ min. ж(О) = жо.


о

с положительно определенной матрицей А, решение дают уравнения Эйлера


i - Ах =О с краевыми условиями: ж(О) = Хо. х(Т) = О. Последнее является
условuем mронсверсальносmu (раздел 7.6).

Дифференцирование по t при водит уравнение (7.5) к виду 7)


a 2L a 2L a 2L aL
a(j2 q + aqa/J + ataq - aq = О,
что при усиленном условии Лежандра

a2L
aq2 >О
дает возможность разрешить уравнение Эйлера относительно вто­
рой производной:

q = F(q, q, t).
Это свидетельствует о совпадении экстремалей с решениями инте­
грального уравнения

t.
q(t) = J
to
G(t, s)F(q, q, В) ds,

где G(t, В) - функция Грина [6, т. 2] дифференциального оператора


ij при соответствующих краевых условиях.

Оптимизаuия функuионала (7.2), конечно, не исчерпывает задачи вариаuи­


онного исчисления. Функ.uионал может зависеть от производных более высокого
порядка. Например,

!
/,

W = L(q. 4, q. t) dt.
/.

7) Под частными производными подразумеваются матриuы, по принuипу:


126 Глава 7. Вариационное исчисление

в этом случае уравнение Эйлера:

BL d BL ,р BL
Bq - dt д, + dt2 Bq = о. (1)

7.3. Преимущества наивной теории

Обратим внимание, что вычислениевариации 6W ни с каким диф­


Ференцированиемв функциональномпространстве,вообше говоря,
не связано, и сводится к вычислению обыкновенной производной

скалярной Функции {(Т) = W(q + T6q) в нуле 8),


{'(О) = 6W(q).
При этом вывод уравнения Эйлера

BL d BL
Bq - dt Bq = О,
пока для проетоты n = 1, опирается на очевидный факт: .. Если

!" a(t)6q(t) dt =О

для любой гладкой функции 6q(t) с закреnленны.ми в нуле концами, то
a(t) == О.,
- торжественно называемый основной леммой вариацион-
ного исчисления 9) .

То же самое угверждение, где предположение берется на стадии


(едо взятия интеl1Jала по частям., называют леммой Дюбуа-Реймона:
(е Если

!
tl

[a(t)s(t) + b(t)s(t)] dt = О

8) Где 6q ПРОИЗ8ОЛьиая, но .каждый раз- фиксироваиная функция времени
с закременными в нуле конuами. Если бы речь wnа о производной по направлению.
а не о вариаuии, то надо было бы говорить о npatlocmopйНHeii производной ('(О).
9) В .Лекциях- мы стараемся говорить .очевидно-, когда нечто действительно
просто, н пояснения только засорили бы пейзаж. В даииом случае доказательство
могло бы сводиться к замечанию: если о(Т) :F О, то выбор фуикции 6q(t). отличной
от иуля ЛИШЬ в малой окрестности r. -
приводил бы к противоречию. Поиятно. что
любое короткое замечание можно растянуть иа пару страииu.
7.3. Преимущества наивной теории 127

для любой zладкой функции s(t) с закрепленными в нуле концами, то


a'(t) == b(t) ...

Подход в целом выглядит несколько доморощенным. Поиск


минимума функционала (7.2) подменяется анализом скалярных
функций ~(T) = W(q + r6q). в случае функции двух переменных
z = !р(х, у) этому соответствует изучение вертикальных сечений
графика z = !р(х, у), из чего, конечно, гарантий существования
минимума !р(х, у), равно как и W(q), - извлечь нельзя (см. контр­
пример в разделе 1.8). Тем не менее, если иметь в виду необходимые
условuя .миниму.ма, - .наивная .. методика становится, по крайней
мере, законной. Более того, во многих случаях она легко и просто
при водит К искомому решению, потому что решение уравнений
Эйлера оказывается единственным, а наличие минимума вытекает
из .физических" соображений.

Выгоды получаются двоякие. Во-первых, обходятся стороной


технические проблемы, преодоление которых все равно приводи­
ло бы к тому же самому решению. Во-вторых, соблюдение .высоких
стандартов .. функционального анализа способно вообще заводить
ситуацию в тупик. На первом же этапе пополнения функцио­
нального пространства выясняется, что это вопрос не столько

математический, сколько .физическиЙ", поскольку .меру близо­


сти .. необходимо согласовать с природой задачи, от чего зависит,

в каком пространстве ЛПР 10) в результате оказывается. «Уклонение


в среднем. заводит в удобные гилЬ6ертовы пространства, но обыч­
но выясняется: .пришли не туда .., - потому что высокие пиковые

значения вариации не вяжутся со смыслом задачи. «Максимум


уклонения - вяжется., но это ведет в какое-нибудь пространство
гладких функций, которое из-за нерефлексивности превращает во­
просы дифФеренцируемости в кошмар.
Поэтому «дедовские» методы выглядят привлекательнее, имея
реальные преимущества. Слабое звено - проблема существования
решения, на чем делается упор при попытках перетащить вариаци­

онное исчисление на поле функционального анализа.

10) Лицо. прииимаюшее решение.


128 Глава 7. Вариационное исчисление

О недостатках упрощенных точек зрения любой профессионал


будет говорить с удовольствием, и будет выдвигать на передний
план любые мало-мальски нетривиальные особенности, которые,
хоть и встречаются раз в сто лет, повышают вес курируемой дис­
ЦИfU1ины. Причины вполне уважительные. Устройство Вселенной
предполагает, что каждый занимается своими делами и не лезет -
в Космические, не говоря о том, что никому не хочется потерять
работу 11). Плюс К тому, аномалии встречаются редко, но околь­
ными пyrями укрепляют фундамент. Выбраковка .неприятностеЙ.
оставляет в поле зрения 99 % задач и 3 % понимания, что поначалу
не сказывается, но постепенно заводит «мировую науку. в тупик.

Это аргументы в пользу профессионалов.


Есть и другая сторона медали. Аудиторию в системе общего
образования интересует не столько «мировая наука., сколько воз­
можность понять, о чем идет речь. Особенно на первой ступени, где
естественно избегать отвлекающего многообразия, важного «кос­
мически., но малополезного персонально.

В проекции на данный контекст весь этот разговор к тому,


что позиция, которая устраивала Ньютона, Эйлера и Лагранжа, -
не так плоха до сих пор.

Конечно, вариационное исчисление в последней трети ХХ в.


сделало крупные успехи, будучи поставлено на рельсы функцио­
нального анализа. В результате появилась идеологическая четкость,
и расплывчатые ранее вопросы существования решения - стали

достаточно прозрачными, по крайней мере принципиально. При­


чем именно проблематика существования определила водораздел
между «наивной теорией. и «современной •.

7.4. УСnОВИR второго порядка

На формальномуровне анализ критическихточек в бесконечномер­


ных пространствах аналогичен ситуации в аn. Если функционал
I{J дважды непрерывно дифференцируем по Фреше в окрестности

11) Внедрение анестезии в медиuину вызывало резкие протесты хирурroв. Они


опасались, что тогда .любой дурак> сможет оперировать.
7.4. УСЛОВНR второго nOPRдKa 129

критической точки ж· Е Е, то

откуда ясно, что (v2't'(Ж·)~Ж, дж) ~ о - необходимое условие


минимума в точке ж· , а

(7.7)

- достаточное.

Неравенство (7.7) называют условием сильной положительности. В к" оно


равносильно обычному (v !р(ж')Аж, Аж)2
>О при Аж i= о.

к сожалению, от (7.7) мало толку. Требование СШlЬНОЙ положи­


тельности гессиана обычно не выполняется. В результате соблазн
изучения экстремалей на основе скалярных Функuий

~(T) = W(q + r6q),


получает новый импульс, что ведет к различным условиям второго
порядка (Лежандра, Якоби, Вейерштрасса), опирающимся в той или
иной степени на требование ~" (О) ~ О. Но расчет на простоту -
не оправдывается.

Природа трудностей раскрываетси на дальних подступах к вариационному


исчислению. Вернемси к рассмотрению примера СК3Jlирной функции двух пере­
менных

в раЗделе 1.8 было уже проверено, что в любом вертикальном сечении Функция

= !р(тж, Т1I)
((Т)

имеет минимум в нуле - соответственно, ('(О) = О и ("(О) ~ О, - тем не менее


нулевая критическая точка !р - не есть точка минимума.

Суть явления определиет следуюшая причина. Каждому вертикальному сече­


нию отвечает максимальн3А ширина впадины графика с глобальным минимумом
в нуле. эта еширина е В любом сечении 11 = аж строго больше нуля, но стремится
к нулю при а .... О, а при а = О становится бесконечной. Таким образом, никакие
требовании гладкости !р(ж, 11) не могут предотвратить разрывный характер зави­
симости ширины впадины от а.
130 Глава 7. Вариационное исчисление

в функциональных пространствах ситуация не лучше. Поэтому


получить достаточные условия оптимума с помошью второй вари­
ации не так просто. Из

и даже ("(0) > О, выводятся условия второго порядка, но они


остаются необходимыми: условие Лежандра

D2L
Dii ~ О,
условие Вейерштрасса

E(q, q, р, t) ~ О, (7.8)
где

.
E(q, q, р, t) = L (q, 'q, t) - L(q, р, t) -
DL(q, q, t) .
Dq (q - р),

а также условия Вейершmрасса-Эрдмана, требуюшие дополнительно


непрерывности производных

DL DL
Dq и L - Dq q
в точках излома экстремалей.

Обособленное положение занимает условие Н"оби, связанное


с вопросом о глобальном (силЬНОМ) минимуме W(q). Здесь есть оп­
ределенная специфика. На сФере, например, локально кратчайшее
расстояние меЖдУ двумя точками дают две дуги большого круга,
но только одна из них - обеспечивает глобальный оптимум. Анализ
таких ситуаций производится обычно на основе изучения второй
вариации:

" 2
2 2 2
62 W(q) = j{DDqL.
2 Х (t) + [DDqL2 - dt D L] Х 2(t) } dt,
d DqDq (7.9)

где
2
6 W(q) = ("(0), (Т) = W(q + ТХ), Х = 6q.
7.5. Достаточные условия 131

Уравнение Эйлера для Функuионала (7.9),

назы вается уравнением Якоби, которое при усшенно'м условии Лежан­


дра разрешимо относительно Х, и соответствующая задача Коши
при ж(tо) =
О, x(to) =
I имеет единственное решение ж(t). Нули
ж(t), отличные от t o, называются соnряженнымu точками (точке to).
Orcутствие сопряженных точек на отрезке [to, t 1] необходимо, что­
бы отсеять неподходящие решения, типа «неудачных» дуг больших
окружностей (см. выше).

7 .5. Достаточные условия

Некоторые дополнительные усилия и предположения дожимают


перечисленные выше условия до уровня достаточных. Но простой
замены неравенств на строгие не хватает. Более того, возникает
необходимость в привлечении дополнительныхсредств.
Фокус внимания при этом смещается от поиска конкретной
экстремали задачи

J
11

W = L(q, q, t) dt --t min, q(to) = qo, q(t() = q(,


к рассмотрениювсего поля экстре.мШlеи


.12) . и дея напрашивается са-

ма собой, поскольку уравнения Эйлера, определяющие экстремали,


зависят лишь от L(q, q, t) и не меняются при изменении краевых
условий.

Поле экстремалей в области n на плоскости (t, q) называется:


• собственным. если через каждую точку n проходит единствен­
ное решение уравнения Эйлера;

• центршlьным. если все экстремали выходят из одной точки


(to, qo) и однократно накрывают n\(to, qo).

(2) Что обычно называют меmодом геодеЗU'lеекuх nOKpblmuu. Экстре мал и ОТОЖдеств­
ЛЯЮТСЯ С решениями уравнений Эйлера.
132 Глава 7. Вариационное исчисление

Для оценки разности W(q) - W(q·), где q·(t) - экстремаль


(кривая с· в Q), а q(t) - некоторая другая кривая с, интеграл
t.
! to
L(q, q, t) dt

рассматривается как криволинейный и подыскивается такое его


представление - такие P(q, t) и Q(q, t), - что

t.
W(q·) = !
to
L(q·, q., t) dt = !
С
P(q, t) dt + Q(q, t) dq

не зависит от пути интегрирования.

Задачу решает так называемый инвариантный интеграл Гuль6еpmа:

f
с
P(q, t)dt + Q(q, t) dq =

= f{ L[q,p(q, t), t I + [q - p(q, t) l


с
дL(q,Р(q,t),tl}
дq dt, (7.10)

rде p(q, t) обозначает геодези.,ескиЙ HalCllOH - производную той экстремали q' (t)
в точке t, которая проходит через точку (q, t).

Обоснование независимости интеrpала (7.10) от пути интеrpирования С


может иметь два направления: либо индуктивный поиск функции S(q, t), такой
что

Pdt + Qdq = dS,

либо, раз уж «секрет. раскрыт, проверка для 13)


дL = дL
Р = L(q,p, t) - Р др' Q др'

равенства перекрестных производных, т. е.

д [ дL] д дL
дq L(q, р, t) - Р др = дt др' (7.11 )

Последнее леrко проверяется, что raрантирует, собственно, существование


подходящей функuии S(q,t), PJiBHO как и независимость интеrpaла (7.10) от пути

13) Что вытекает из (7.10).


7.5. Достаточные условия 1ЗЗ

интегрирования. Однако вывод (7.11) существенно опирается на предположение,


что поле экстремanе!! однок/Ютно накрывает /ЮСCJllатриваемую область 14). Такое
требование возникает как следствие необходимого в рассуждении равенства

OL д OLI
Oq - Ot др q=qЩ = О,
вытекающего из уравнения Эllлера, если через любую точку (q, t) проходит
единственная экстремanь.

Если интеграл (7.10) берется вдоль экстремали, то

q- p(q, t) == О,
откуда ясно, что (7.10) совпадает с W(q·). Это позволяет оценить
разность W(q) - W(q·) как интеграл

!{ . L(q, q, t) - L(q, р, t) -
aL(q,
aq
q, t).
(q - р)
}
dt, (7.12)
с

взятый вдоль произвольной кривой С. При этом нет необходимости


думать об экстремали (!) - все учитывается само собой. Поэтому
«для минимума» достаточно, чтобы подынтегральное выражение
в (7.12) было неотрицательно, что представляет собой условие Вей­
ерштрасса (7.8).
Таким образом, необходимое условие Вейерштрасса превраща­
ется в досmаmочное при дополнительной оговорке, что экстремаль
принадлежит собственному или центральному полю экстремалей.

(!) Из разложения
. OL(q,p,t) . 1 0 2L(q,ii,t). 2
L(q, q, t) = L(q, р, t) + Oq (q - р) + 2! O2
q
(q - р) ,

где ii лежит на отрезке, соединяющем р и q, - ясно, что условие Ве!!ерштрасса


выполняется, если

0 2L
Oq2 ~ О

В рассматриваемо!! области. Усиленное условие Лежандра

(7.13)

14) Т. С. AВIIACTCA co&:m/leHHIIIN ИЛИ ценmралЬНIIIN.


134 Глава 7. Вариационное исчисление

дает больше, обеспечивая заодно центральность поля экстремалеА, правда, ло­


кально(5).
В результате, условие (7.13) без дополнитеЛЬНЫХ оговорок 16) raрантирует, что
экстремаль обеспечивает локальный минимум W(q).

7.6. Свободные концы и трансверсаnьность

При поиске экстремали функционала

w= !'. L(q, q, t) dt (7.14)



фиксированные ранее граничные условия, одно или оба, MOryт быть
освобождены. При этом множество допустимых траекторий q(t)
расширяется. Поэтому экстремаль - тем более обязана быть экс­
тремалью задачи с закрепленными концами траектории. СООТ­
ветственно, уравнение Эйлера будет выполняться, как и прежде.
Дополнительные требования MOryт быть получены варьированием
граничных условий.

Пусть, например, свободен один конец (t., q.), q. = q(t,). При перемешении
!1>аничной точки из (t" q.) в положение (t l + 6t., q. + 6q.) прирашение функци­
онала (7.14) на эксmремйJIRX оказывается равным

1,+11. 1.
6W J L(q + 6q, 4 + 64,
= t) dt - J L(q, 4, t) dt.
~ ~

с учетом того, что экстремали удовлетворяют уравнениям Эйлера, после


неслоJКНЫХ преобраэований имеем:

6W=(L-4:~)1
q 1=1,
6t'+:~1
q 1=1,
6ql+o(6t,)+o(6q.). (7.15)

Приравнивая нулю линейную часть (7.15), получаем

15) В случае (7.13) уравнение Эйлера локально разрешимо относительно пороil


производноil q. и решение соответствующеil задачи Коши существует и единствеино.
'6) Не считая предположени!\о достаточноil гладкости.
7.7. Изопериметрические задачи 135

ЧТО В случае независимых вариаций 6t. и 6q, приводит к условU1Ulf тронсверсаль­


ноети:

(L_/L)I
дfj 1=/1
=0. -дLI
дfj 1=/1
=0

Если граничная точка (t l , ql) обязана лежать на некоторой


кривой

то

и в силу (7.15) условие mрансверсальносmи приобретает вид:

(L+(i-q)a~)1
aq 1=1,
=0.

7.7. Изопериметрическиезадачи

Изопериметрическимизадачами называют задачи на условный экс­


тремум 17)

1,

! !
1.

S(q, q, t) dt -t mах, P(q, q, t) dt = 1, (7.16)


10 10

где изопериметрических условий может быть несколько, и тогда

Технология решения - та же самая, что и в конечномерном


случае. Переход от (7.16) к поиску стационарной точки лazранжиана

+.\{ I
1. 1.

L(q,.\) = !
~
S(q, q, t) dt
~
P(q, q, t) dt -I}

17) Т. е. не оБЯ38тельно ЗlUl.8чи о геометричеСКИJl фиryрак максимальиоА nЛОI1UU1И


при заданном пери Метре.
1Зб Глава 7. Вариационное исчисление

сводит задачу к решению уравнения Эйлера с функцией

L(q, q, -\) = S(q, q, t) + -\P(q, q, t).


Обоснование Формально не отличается от конечномерного, ес­
ли оперировать градиентами функционалов и подходящими функ­
циональными пространствами. Но все это хорошо на абстрактном
уровне. В конкретных ситуациях проблема упирается в идеологи­
чески простые, но технически весьма сложные вопросы, о чем уже

шла речь выше. Существует ли градиент, действует ли он в соответ­


ствующем пространстве, непрерывен ли?

Перечисленное может показаться тренировочным упражнени­


ем, но чаще это, скорее, тема для диссертационного исследования.

Дело в том, что вариационное исчисление традиционно ориенти­


ровано на гладкие и кусочно гладкие функции, тогда как градиенты
хорошо работают в гилЬ6ертовых пространствах. В «гладком случае»
аппарат тоже работает, но там из-за нереФлексивности пространсто
возникают значительные неудобства [6, т.5]: скалярного произве­
дения нет, функции непрерывны в одном смысле, градиенты функ­
ционалов - в другом, и т. п. Кроме того, возникают небольшие
смысловые нестыковки, на обсуждение которых уходит много сил.
Поэтому до сих пор, несмотря на то что дисциплина давно по­
мешена в рамки функционального анализа, вариационные задачи
часто рассматриваются по старинке, с помощью вариаций вместо
градиентов. Одно с другим, как правило, совпадает, - тем не менее
для гарантии кое-что еще требуется, но не всегда дается. В резуль­
тате журавлю обычно предоставляют возможность летать в небе.

Пример..

• Вернемся к заваче о форме тяжелой нити 18) •


а а

/ yVI + (у'(ж)jl dж -+ min, / VI + (у'(ж»)l dж = 1.


о о

плюс закрепление 8 точках у(О) = Уо. у(о) = Уа.


щ См. раздел 7.1.
7.7. Изоnеримвтричвекив задачи 137

Минимизаuия лаграНJкиана

/(у + л)JI + (у'(ж)Р dж


о

приоодит К уравнению Эйлера, имеющему, в силу автономности функционала,


первый интеграл (7.6), С80дRщийся в данном случае к

(у + Л) _ С
V1 + (у')2 - ,
что в итоге порождает семейство кривых

ж-с.
у+л = с ch -с-'
Пара метры определяются ограничениями.
Интересно, что ТRJКелая нить принимает форму кривой, дающей при враще-

нии поверхность минимальной площади 19).

у
• Рассмотрим задачу об отыскании кри­
вой у(ж) заданной ДЛИНЫ, площадь ПОД которой ...
...
(рис. 7.3) минимальна или максимальна, Т.е. ...
...
...
о
... ...
... ,
/ у(ж) dж -+ mах (miп), ' .
о
--------
о О а х

/ JI + (у'(ж))Z dж = 1, Рис. 7.3


о

при той или иной фиксаuии краевых условий, {О, у(О)} , {а, у(о)}.
Минимизаuия лаграНJКиана

/ (у + лJI + (у'(ж)Р) dж
о

приводит К уравнению Эйлера, имеющему, опять-таки в силу автономности функ­


uионала, первый интеграл (7.6), из которого после элементарных преобразований
получается семейство окружностей

(ж - C I )2 + (у _ с2 )2 = л 2

Параметры определяются ограничениями. Рещением в итоге оказывается .дута


окружности, имеющая заданную дЛину и проходящая через заданные точки. Одна
дута дает максимум площади, друтая - минимум.

'9) См . • коmено,ю. по предметиому ук838тслlO.


138 Глава 7. Вариационное исчисление

7.8. Условный экстремум

Задача оптимальногоуправления (7.1) в векторном виде

f Р(х, и,
т

S = t) dt -+ тах, z = /(х, и, t), х(О) = О,


о

выглядит иначе, чем - изопериметрическая, но это такая же по духу

проблема поиска условного экстремума.

Во-первых, обычная подстановка переводит ее в катеroрию безусловной


оптимизации. действительно, если задача Коши

:i: = f(ж, и, '), ж(О) = О.

при любом управлении u(t) имеет единственное решение ж(t) = cp(u(t», - все
сводится к минимизации функционала

f
о
F(cp(u). и. ') tlt.

Но это лишь .. абстрактно говоря-, потому чro дЛя подстановкн надо "имет~
ж(t) = cp(u(t»). факта сушествоваНИА недостаroчно.

Во-вторых, работает .метод .множителей Лагранжа, хотя и в дру­


гой аранжировке. Функционал не обязан записываться в форме
определенного интеграла. Это может быть, например,

<p(x(t), t)lt=8 либо [х -/(х, и, t)J!t=8'

При каждом значении t = 8 ограничение z -/(х, и, t) = О умножа­


ется на свой множитель Лагранжа ..\(8), что затем суммируется -
в данном случае интегрируется - и прибавляется к минимизируе­
мому Функционалу. В результате получается лагранжиан

L(x, и,..\) = I {F(x, и, t) + ..\(t)[/(x, и, t) - х]} dt. (7.17)


7.9. Гамильтонов формализм 139

Максимизация (7.17) по х и u при водит К уравнениям Эйлера,

aF д/
ди +.л ди = О,
которые необходимо решать совместно с ограничениями

х = /(х, и, t), х(О) = О,


что можно интерпретировать как V>.L = О.

7.9. Гамильтонов формализм

Задача оптимальногоуправления20)

!
1,

S= F(x, и, t) dt ~ тах, х = /(х, и, t), (7.18)


10

как уже отмечалось, сводится к оптимизации лагранжиана 21


)

!
I1

L(x, и, у) = {F(x, и, t) + y(t)[f(x, и, t) - х]} dt. (7.19)


10

(!) Везде, где перемншкзютсявекторы или вектор-функиии,подразумевается


скалярное произведение,

O(t)b = (a(t), Ь) = Е Oj(t)b;.


;=1

В (7.18), (7.19) ж, 1/, 10 - векторы размерности п. Упра8l1ение u - вектор,


вообще говоря, другой размерности". Упрощенная запись скалярного произведе­
ния (без угловых скобок) используется для удобства тех, кто предпочитает вариант
n=,,=I.

20) С теми или иными rpaничными условиями.


21) Для МНОJКИтелеli Лаrpaнжа >'(1) здесь используется более привычное дЛя соnря­
женнbIX nepиleHHЫX обозначение

y(l) = (yl(I), ...• yn(I)}.


140 Глава 7. Вариационное исчисление

ИнтеJ1)ирование выражения уж по частям преобразует (7.19)


к виду

L = !'. {Н(х, и, у, t) + ху} dt + x(to)y(to) - x(tl)y(t l ), (7.20)



где

Н(х, и, у, t) = F(x, и, t) + yJ(x, и, t)


обозначает гамшьmонuан.
Приравнивая нулю первую вариацию (7.20), получаем 22)

откуда

I~ = О, У -~·I =

Таким образом, присовокупляя ж = дН/ду, имеем уравнения


движения в гамильтоновой форме,

дН дН
Ж= -,
ду
у = --,
дх
(7.21 )

I I
и условие дН/ди = О оптимума гамильтониана по управлению,
что служит прообразом nрuнцunа .максиму.ма (глава 8).
Если к уравнениям Эйлера добавить условие Вейерштрасса,
то соответствующим эквивалентом можно считать гамильтоновы

уравнения (7.21), rдe 23 )


Н(х, и, у, t) = тах Н(х, v, у, t).
11
(7.22)

22) Варьироваиие rpaничнык условиА остааляем 38 калром. ПОСКОЛЬКУ на уравнения


оптимanьноro движения внутри ['о. '. J. О чем пока идет речь. ОНО не алияет.
23) Разумеется. после максимизации Н(ж. и.1/. ') не зависит от и. Вместо (7.22)
можно было бы писать Н(Ж.1/. ') = maK Н(Ж.II. у. '). но тогда конструкция УТAJКCllя-

лась бы НОВОЙ ФункциеА Н. ТО и другое МОКО по-своему.
7.9. Гамильтонов формализм 141

Второе уравнение (7.21) в покоординатной записи имеет вид

. aF j n a/
Yi - - LYj-
= -aXi . aXi
}=I

и в случае, когда F не зависит явно от Х, совпадает с уравнение",


в вариациях [6, т.21 ДЛЯ уравнения .попятного движения.

х = - Лх, и, t).
Обратим внимание,

dH ОН ОН ОН ОН ОН (ОН) ОН
di = Ои u + Ож t + 01/ ri + m = Ои u + Ож + ri I(ж, и, t) + m'
что впечет за собой на экстремали:

Поэтому в автономном случае, когда F и I не зависят явно от времени, гамнль­


тониан постоянен вдаль экстре мали.

Задача (7.18) в случае

Лх, и, t) = и,
Т.е.

х = и,
переходит в обычную задачу

s= f'. F(x, х, t) dt -t min. (7.23)



Исключая из гамильтоновых уравнений движения (7.21) сопря­
женные nеременные y(t) =
{УI (t), ... ,yn(t)}. приходим К уравнениям
Эйлера (?) ДЛЯ задачи (7.23), что свидетельствует о наличии идейной
связи между подходами 24).

24) Представления о скрытык пружинак MOryт обоraтить паpaJIJIСЛИ с аналитической


мехаиикой 16, т. 21.
142 Глава 7. Вариационное исчисление

7.10. Взаимная СВОДИМОСТЬ задач

Основной задачей классического вариационного исчисления счи­


тается задача Больца:

t.
J = J
to
F(x, х, t) dt + G [to, t" x(to), x(t,)] --t min, (7.24)

при возможных дифференциальных ограничениях <р(Х, х, t) = О,


а также терминальных условиях вида

Задачу (7.24) в случае G = О называют задачей Лагранжа, а при


условии F =О - задачей Майера.

На вид задача Больца является более общей, но она легко сво­


дится к двум другим. К задаче Майера, - если ввести дополнитель­
ную переменную х n + 1, наложить дифференциальноеограничение
х n +' = F(x, х, t) и перейти к минимизации чисто терминального
функционала

Сведение к задаче Лагранжа также обеспечивает дополнительная


переменная х n + I ,

х n +l = О,
после чего все сводится к минимизации интегрального функцио­
нала

t,

J
10
[F(x, х, t) + хn +l] dt.

Выбор формы задачи диктуется соображениями удобства. При


этом любую из перечисленных задач можно рассматривать как
задачу управления, полагая х = U.
7.11. Проблема существования 143

7.11. Проблема существования

в отличие от lR
R
, где экстремальные задачи обладают той или
иной степенью наглядности, бесконечномерным задачам присуща
некоторая -загадочность •. Решения нет, почему - не ясно.

Пример ЛlJlIoбepтa. Для задачи

I (И )2I
I

i (t) -+ min, 2:(0) = О, 2:(1) = 1,


о

уравнением Эйлера служнт

что при водит К решению q(t) = И, которое действительно обеспечивает мини­


мум. но не является непрерывно дифференuируемым на [О, 1).

Пример ВейepmтpIССI. В задаче

I
I
2
t Ii(t) -+ min, 2:(0) = О, 2:(1) = 1,
о

уравнение Эйлера

имеет обшее решение


Q
q(t) = t + Р,
ни одно И3 которых не проходит через нужные точки.

Неприятности могут возникать по нескольким причинам. Одна


из них - специфика бесконечномерного пространства. Непрерыв­
ный функционал на ограниченном замкнутом множестве не обязан
достигать своего минимума. Приятное исключение - гильбертовы
пространства.

7.11.1. Теорема. Непрерывный выпуклый функционал, определенный


на гuльбертово'м пространстве,достигает своего ,МиHuмy,Мa на любо'м
выnукло'м замкнуто'м ограниченно'м,Множестве25).

25) детали и описание ,внутрсннеА кухни- СМ. в 16. т.5).


144 Глава 7. Вариационное исчисление

Такое преимущество жалко терять. Поэтому при исследовании


вариационных задач определенную часть пyrи выгодно проходить

по «гилЬ6ертовой. территории. Но выгоды, как известно, даром


не даются. Приходится жертвовать привычными удобствами - диф­
Ференцированием, переходя к обобщенным производным, и т. п.
Причем надежды получить в итоге решение «желаемой степени
гладкости. не всегда оправдываются.

Другая возможная причина неприятностей - неуправляемость


системы, в результате чего перевести объект из одного состояния
в другое вообще невозможно. Иными словами, отсyrствуют допу­
n
стимые решения. Но если в IR выяснение сводится к проверке
разрешимости системы неравенств, то здесь обнаруживается новое
явление.

Рассмотрим объект управления

ж = Аж+Вu,
где ж характеризует состояние, и - управление, А и В - матрицы,
размера, соответственно, n х n и n х т.

Естественный вопрос, который здесь возникает, можно ли пе­


ревести систему - управлением u(t) - из любого начального
положения ж(О) = жо в любое желаемое, например, ж(Т) = О? При
положительном ответе это называют управляемостью системы.

Для управляемости, как оказывается [6, т. 2], необходимо и до­


статочно условие

rankU = n,

где U - прямоугольная матрица 26)

Пример

Пусть

26) Матриuа и СТроИТСА слева направо - добаВIIАЮТСА столбuы ,At В. Число


СТРОК и равно п.
7.11. Проблема существования 145

Таким образом, упраВ1lение напрямую деАствует только на %). На %2 В1Iияние


опосредованное. Возможно ли по обеим переменным двигаться в желаемых
напраВ1lениях - неясно, и геометрическая интуиция в таких задачах пасует. Тем
не менее система упраВ1lяема, поскольку для нее матрица

и = [~ ~]
невы РОЖдена.
Глава 8

Задачи оптимального управления

По теории оптимального управления сушествует обширная литература 1). С те­


чением времени aKueHTbl и потребности, конечно, сместились. Если полвека
назад ситуаuию характеризовали ЭНТУ:Jиа:JМ и недостаток информаuии, то теперь
«пенки сняты'" И настало время мемуаров. Для :J3WИТЫ диссертаuий приходится
искать что-нибудь менее исследованное. Поэтому массовый спрос конuентриру­
ется, главным образом, в районе простого вопроса .. в чем там дело,", - об этом,
собственно, в главе речь.

8.1. ПрИНRтые стандарты

Толщина учебников в значительной мере зависит от многообразия


постановок задач. В то же время исчерпать варианты все равно
невозможно. Поэтому главное - передать дух теории. В данном
случае для этой цели годится всего одна задача: поиск управления
u(t) на отрезке [О, TJ, которое обеспечивает максимум одной коор­
динаты, например XI (Т), при движении

х = Лх, и, t), х(О) = О, u Е U. (8.1 )


Остальные Xj(T) MOryr быть закрепленылибо свободны (полностью

или частично) 2).

Недостаточная общность постановки здесь обманчива. Наличие


интегрального критерия, скажем,

J
т

F(x, и, t) dt ~ mах,
о

1) См., например. 14.8. 13. 14.21).

21 Принципиальное отличие :JaJl3чи (8.1) от (7.18) З8КJ1ючаетси в дополнительном


ограничении и Е и, характерном дли теории управлении.
8.2. Принцип максимума 147

..ликвидируется. стандартным трюком введения дополнительной


переменной Zn+I, удовлетворяющей дифференциальному урав­
нению

Xn+1 = F(z, х, t),


и тогда интегральный критерий сводится к

Хп+1 ~ тах.

Так же легко максимизация G[z(T)J заменяется максимизацией


хп+ I (Т), если положить

Zn+l(t) = G[z(t)], Х п +l = (VG(z), J(z, и, t)).


Минимизация zn+I(T) В случае присоединения к (8.1) уравне­
ния xn+1 = 1 равносильна задаче о быстродеЙствии З
).

Как правило, оптимальное управление ищется как функция


времени, и его при изменении краевых условий приходится искать
каждый раз заново. Поэтому предпочтительно решение и·(х), зада­
ющее управление как функцию состояния. Такая задача, называемая
задачей синтеза, существенно более сложна и удовлетворительно
решается в редких случаях.

8.2. Принцип максимума

Добавление к задаче (7.18) ограничения u Е и - например, вида


h(u) = О - добавляет к лагранжиану (7.19) еще одно слагаемое,
в результате чего:

t,
L(z, и, у, Z) = ! {F(z, и, t) + y(t)[J(z, и, t) - х] + z(t)h(U)} dt,
to
где z(t) = {zl(t), ... ,zr(t)} - множители Лагранжа.

действуя далее по схеме, описанной в ра:шеле 7.9, получаем -почти то же


самое ... Интегрирование выражения уж по частям снова преобразует L(ж, и, у. z)

)) Задаче о переходе системы в задаииое состояние 38 минимальное время.


148 Глава 8. Задачи оптимального управления

к виду

! {Н(ж, и,
11

L= 1/, t) + жfl + z(t)h(u)} dl + ж(tо)у(t о ) - ж(t,)1/(t.).


10
где по-прежнему гамильтониан

Н(ж. и.у. t) = F(ж, и. t) + у/(ж. и. t)


не зависит от z(t).
Приравнивая нулю первую вариаuию L(ж. и.у. z) и не трогая граничных
условий, получаем

'1

6L=!{ (~~ + Z(t)::)6U + (~~ +fI)6Ж}dl=О.


10
откуда, как и прежде,

. дН
У=-дж'

Таким образом, уравнения движения не меняются 4):


. дН . дН
ж=-
ду' У = - дж'

но теперь, в отличие от предыдушего.

дН ah
ди + z(t) ди = О. h(u) = О.

что совпадает с условием максимума (или минимума) функции Н(ж, и.у. t) по и


при условии h(u) = О.

Разумеется, в разветвлениях нужна доработка деталей. Тем


не менее центральная идея остается общей. Оптимальное управле­
ние определяется системой уравнений

. дН
Х=--, Н(х, и, у, t) = тах Н(х, v, у, t), (8.2)
ду t7

которую необходимо решать совместно с теми или иными гранич­


ными условиями, вытекающими из постановки задачи.

Заметим, что Н(х, и, у, t) в (8.2) фактически от u не зависит


(после проведения максимизаuии по v).

4) Краевые условия для этих уравнений ..01YТ быть получены варьирование..


тер"инальных ограничениА. ВoJ.. OJКltbl "ноrОЧИСJlенные варианты, однако сейчас
в фокусе вни .. ания - дифференциальные уравнения.
8.2. ПрИНЦИП максимума 149

в варианте типа (8.1),


n
L 1jЖj(Т) --+ тах, ж = f(ж, и, t), ж(О) = О, u Е и, (8.3)
,=I

оптимальное u(t) определяется системой (8.2) - в данном случае:

. ~ 8fj(Ж, и, t)
Yi =- LJ У)
. 1
8 '
жi
J=

где u(t) извлекается из соотношения

n n
LУjfj(Ж, и, t) = тах LУjfj(Ж, V, t)
. IIEU .
J=I J=I

И выполняются граничные условия:

ж(О) = О, Yj(T) = 1j'


(!) При этом интересно обратить внимание на следующую
интерпретацию. Если задача (8.3) уже решена, т. е. все функции
ж(t), y(t), u(t) - определены, то в силу

Н(ж, и, у' t) = (y(t), ж(t))


получается, что оптимальное управление u(t) в каждый момент
времени максuмшrьно разгоняет изображающую точку ж(t) в направ­
лении y(t). Подобный взгляд на роль сопряженных переменных
в наглядной форме вскрывает закулисные механизмы 5).
Как правило, оптимизаuия выводит оптимальные упраВlJения на граниuу
области и. Пусть. например, уравнения регулируемого объекта имеют вид:

Ж; = /;(ж) +и;, i = 1.... ,п,


а упраВlJяющиесигналы Uj(t) ограничены по модулю. lu;1 ~ и;.
В этом случае максимум гамильтониана

Н(ж. и,1/) = L {1/j/j(Ж) + 1/jUj}


j

достигается. очевидно. при условии 1и; = и; sigп 1/; 1·

S) КО1Орые несколько смазываются в присyrствии интегральных Функционanов.


150 Глава 8. Задачи оптимального управления

8.3. Линейные системы

Принцип максимумадает, вообше говоря, лишь необходимыеусло­


вия оптимума, как и уравнения Эйлера в вариационном исчис­
лении, но для линейных систем он преврашается в необходu.мое
и достаточноеусловие, с некоторыми оговорками [4].

Линейный объект управления

х = A(t)x + Ви, u Е и, (8.4)


где А и В - n х n матрицы, а

прямоугольный параллелепипед, - является удобным эталоном для


проверки и генерирования идей. В качестве стандартного критерия
обычно подразумевается быстродействие.

Оnтu.мШlьное управление u·(t) в такой задаче кусочно-nостоянно,


и значеНUЯllfи u·(t) являются исключительно вершины многогранни-
ка U. При этом число nереключений 6 ) конечно. Если же все собствен­
ные значения матрицы А действительны, то u·(t) имеет не более
n - I переключений (теорема Фельдбаума).

8.4. Систем... с дискретным временем

Непрерывного времени, вообше говоря, не бывает, но это удобная


идеализация. Задачи управления с дискретным временемk подобны
тем, что рассматривались выше. Например, поиск управления {u k }
на «отрезке» [О, Т], которое обеспечивает максимум одной коорди­
наты, скажем xf, при динамике

Возможно также подключение«интегралЬНЫХJl» критериев и ог­


раничений.

6) С ОlUlОГО значения на другое.


8.4. Системы с дискретным временем 151

Рассмотрим более подробно лииеАную :Jaд8чу н] (2).


т
k k k k
Е (c • Ж ) + (b •u ) -+ тах.
k=1
(8.5)

где раэмерности переменных жk.u k и матриц Ak.Bk.Dk согласованы дOllжным


обраэом.

с одноА стороны. В (8.5) явно просматривается динамическая задача. С дру­


гоА - это :Jaд8ча линеАного программирования с неетандартноА нумерациеА
переменных.

После при ведения к каноническому ВИДУ можно выписать соответствующую


двоАственную :Jaд8чу. которая после некотороА техническоА эквилибристики при­
обрепет вид

(,/ • АоЖ )
О
+ Е (,,t. ") -+ min.
k=1

,/ = ? yk = уН I A k + ck• Ic =1 т _ 1.
"kDk =,/Bk+bk• v k ~O Ic= I T.

где ,/. "k - двоАственные переменные.


Условия дополняющеА нежесткости (теорема 4.7.4) В данном случае при ВОдЯт
(дЛя оптимального решения) к соотношениям

которые В совокупности с

paBHocНnbHЫ тому. что при каждом фикснрованном Ic = 1•...• т оптимальныА


вектор u является решением :Jaд8чи
k

Н(и) = (,/B k +bk.u) -+ тах.


Dku<d".
что предетавnяетсобоА частныА случаА дискретного принципа максимума.

Рассмотренная задача бегло описана не для того, чтобы взва­


лить на читателя «разбор полетов... Здесь интересно обратить вни-
152 Глава 8. Задачи оптимального управления

мание на совпадение динамической задачи управления с задачей


линейного программирования. Но если вдуматься, в этом нет ни­
чего удивительного, потому что все оптимизационные задачи стоят

на одном фундаменте, на лаграюкевой идеологии игамильтоновом


формализме. Поэтому ясно, что аналогичные параллели имеются
и в общем нелинейном случае.
Другое дело, что вариационное исчисление выводит исследо­
вание в бесконечномерные пространства, где работоспособность
тех же методов требует отдельного обоснования. Ситуация же дис­
кретного времени ничего принципиально нового как бы не дает.
Можно пользоваться обычными результатами типа теоремы Куна­
Таккера, но это бывает не совсем удобно из-за специфики задач.
Использование старых схем разрушает структуру описания, и дина­
мические модели -теряют лицо». Тем не менее классический подход
остается вполне адекватным ситуации, хотя и требует некоторой
доработки в конкретных случаях.

Рассмотрим задачу управления

о
ж = о,

трактуя ее как обычную задачу на условный экстремум в конечно­


мерном пространстве.

Вводя лагранжиан

L = жТ+ 1 + 2: {(уk+I,/(жk,uk,k) - (уk+l,жk+I)}


О

и выписывая необходимые условия оптимума вида

BL BL
дж =0, ду = о, (8.6)

приходим К исходному описанию динамики, плюс - к сопряжен­

ной системе для импульсов:

д/ '
Yk -_ yk+ I дж k ~ Т Т+ I = {о ,... "О I} .
k ~,y
8.5. Динамическое программирование 153

Последнее условие в (8.6) приводит к ограничению на вариацию


гамильтониана Н" = (yk+l, /(х", и", k):

6u Н" = дН" "


ди" 6и ~ О,

но это не означает, что гамильтониан Н" обязан достигать максиму­


ма, хотя и показывает, что оптимальное значение и" ЯWlяется ста­
ционарной точкой Н". Известны примеры, когда на оптимальном
упраWlении гамильтониан Н" вместо максимума имеет минимум
либо седЛОВУЮ точку. Поэтому дЛя систем с дискретным временем
принцип максимума в привычной форме не справедЛИВ, но обрета­
ет прежнюю силу, с некоторыми оговорками, дЛя линейных систем.

8.5. Динамическоепрограммирование

Вся теория экстремальных задач в не котором роде стоит на простом


соображении - на обращении в нуль производной оптимизируе­
мого функционала.
Есть еще одно элементарное соображение,
на котором Беллман построил динамическое nро­
граммирование [3]. Центральная идея тривиальна: ,. ,
.часть экстремали - сама ЯWlяется экстрема­ ,,
лью ... Действительно, если бы участок CD экс­ ,. ,
тремали АВ (рис. 8.1) - сам по себе не был экс­
тремалью, то его надо было бы заменить другой
кривой - экстремалью меЖдУ С и D, которая
на рисунке изображена пунктиром. Рис. 8.1

Вот еше один .l)'МанитарныЙ. вариант формулировки той же идеи. Опти­


мальное управление хора"теризуется тем, что "ОIW8O бы ни бbl/lО промежуточное
состояние, достигнутое8 результате nервоначально nринятьа решений, последующее
управление долЖНО быть onтuмально omносительно этою состояния 1).

По первому впечатлению из такого nринциnа оnmUМШlьносmи


трудно выжать что-либо содержательное, но в итоге банальность
оказывается ненамного хуже, чем равенство нулю производной.

7) Здесь. разумеется, остается широкое пме для уточнений.


154 Глава 8. Задачи оптимального управления

Посмотрим, как это работает на задаче оптимального управления

S(X, и, t) =/ F(x, и, t) dt + <р(Х(Т), Т) ~ тах,


о

:i; = J(x, и, t), х(О) = О, u(t) Е U.


Пусть
т

S·(X, t) = / F(x, и, t) dt + <р(Х(Т), Т)


t

при условии оптимального управления u(t), т. е. S·(x, t) значение


функционала на экстремали из точки (x(t), t) в точку (х(Т), Т).
В силу отмеченного выше «принципа оптимальности»,

S·(x, t) = mах {S·(x + дх, t + дt) + S(x, и, t)},


u

что после подстановки

деления на дt и перехода к пределу по дt ~ о - приводит


К уравнению Бellл.мана

aS· + r::(~) {/\ aS·


дt
) }
дх ' J(x, и, t) + S(x, и, t) = О.

с учетом того, что «гамильтониан, максимизированный по уп­


равлению», есть

Н(х, у, t) = mах Н(х, v, у, t) = mах {F(x, v, t) + yf(x, v, t)},


,,(е) ,,(е)

уравнение Беллмана может быть записано в виде

что принято называть уравнением Гамшrьmона-Я"оби.


8.6. Многошаговые процессы 155

8.6. Многошаговыепроцессы

Динамическое программирование эффективно дЛЯ некоторых задач


управления с дискретным временем вида

G(х п + l ) -4 mах, x k + 1 = f(x k , и\ k),


хО = О, uk Е и, k = О, 1, ... , n.
Введем обозначение

Gk(X k) = ut,o.o,u.
mах G(х П
+ 1 ), k = О, ... ,n.

Очевидно, Gk(x k) = maxGk+l(xk+I), Т.е.


Ut

(8.7)

что представляет собой дискретный вариант уравнения Беллмана.

Использование (8.7) в качестве основы дЛЯ вычислений, хотя


и дает выигрыш по сравнению с полным перебором, в общем случае
не позволяет избежать экспоненциального роста объема вычисле­
ний, которые необходимо проводить в обратно", времени. Сначала
из максимизации mах G[f(х , u ,
П П
n)! определяется оптимальное
иn

значение и~ как функция состояния х , и эту функцию u~(хП)


П

необходимо помнить.
Далее определяется оптимальное значение и~-I , максимизиру­
ющее

mах G{f(х П , u~(хП), nl}


и._1
=
= mах G{f(f[х П - 1 , u П - 1 , n - I!, u~(J[хП-I, uП - 1 , n - 11), n!},
U._I

и так далее. Объем вычислений растет как снежный ком.


Но в некоторых ситуациях методика успешно работает, как,
например, в классической задаче поиска критического пути на се­
тевом графике.
156 Глава 8. Задачи оптимального управления

8.7. Критические пути и сетевые графики

Сетевыми графиками называют орграфы 8) без циклов. Вершины


именуют событиями, ребра - операциями, или работами. Так удобно
описывать различные проекты: строительство дома, запуск ракеты

на Луну, детективное расследование, научный поиск и т. п.


Структуру сетевого графика определяют ограничения на оче­

редность выполнения работ (стены, потом крыша) 9). Хорошо по­


ставить задачу, разумеется, нелегко. Необходимо вникнуть в ситуа­
цию, составить список операций, проследить логику выполнения,
перепроверить - сто раз. Зато потом - ход работ как на ладони.
Хитросплетение обстоятельств заменяется рентгеновским снимком,
обнажаюшим скелет. И одна лишь картинка исключает асфальти­
рование до прокладки кабеля.
Следующий виток - оптимизация. Операциям приписываются
длительности - на рис. 8.2 это числа на дугах, - и ставятся задачи
составления расписания работ.

Рассмотрим при мер, изображенный на рис. 8.2. Числа на дугах


задают длительности операций. Пронумерованные события никако­
го содержательного значения не имеют. Каждое такое событие лишь
отражает тот факт, что входящие в него дуги (операции) выполнены.
Событие 6, например, означает выполнение операций 036 и 046.

Рис. 8.2
8) Ориентированные графы.
9) Если бы граф содержал uикл, операuии uикла составnили бы парочиый круг -
и никогда ие могли бы начаться.
8.7. Критические пути и сетевые графики 157

Припишем теперь начальному событию 1 время О и опреде­


лим времена наступления других событий, предполагая, что все
операuии начинаются как только для их выполнения появляется

возможность.

Операuия 012 длится 5 дней, поэтому событие 2 наступит через


5 дней - 5 рядом и обводим пунктиром. Аналогично, время
пишем
наступления события 3 равно 7. Пишем 7 и обводим пунктиром.
Чтобы наступило событие 4, надо выполнить операuии 014 и 034.
Операuия 034 длится 3 дня, но она может начаться только по ис­
течению 7 дней (время события 3). Значит, 034 будет завершена
через 10 дней (3 + 7 = 10). Время операuии 014 равно 8 < 10,
поэтому время события 4 есть тах{8, 10} = 10.

Дальнейшее определение времен наступления событий при


движении по графику слева направо - происходит аналогично.
В KOHue находится время 25 последнего события 8. Эго уже полез­
ный результат. Глядя на график, так сразу ведь не скажешь, что все
работы можно завершить за 25 дней.

Следующий этап - просмотр сетевого графика справа налево


и определение критического пути по реuепту динамического nрограм­
мированuя. Делается это так. Как получилось время 25? - Время
события 5 было сложено с длительностью операuии 058 ~ опера­
uия 058 выделяется как критическая. Начинается 058 в событии 5,
время 20 наступления которого получилось как 16 + 4 ~ операuия
065 критическая, ее начало в 6. И так далее.
В итоге получается выделенный жирным критический путь.
Эго последовательность критических операuий, которые необходи­
мо начинать вовремя. Любая задержка с критической операuией
увеличивает время окончания всего комплекса работ. Для осталь­
ных операuий есть резервы времени, которые можно посчитать.

Обдумывание примера в данном случае - простейший путь для


понимания сути дела. Формулировка и обоснование общего реuеп­
та могут служить здесь не очень трудным упражнением. Уточнение
деталей (типа того, что критических путей может получиться не­
сколько) либо расширение диапазона (задачи распределения ресур­
сов по операuиям) - едва ли в данном контексте имеют смысл. При
необходимости проще всего обратиться к спеuиальной литературе.
Глава 9
НегладКВR ОПТИМИЭВЦИR

_НематеиатичесКQII. часть .матема­


тики важнее -.математической».

9.1. ryманитарные аспекты

Недифференцируемаяоптимизация иногда кажется следствием ле­


ности ума. Дескать, стоит закруглить углы, как все становится
гладко. Но это не совсем так.
Конечно, если речь идет о прямой У = аж + Р, аппроксимиру­
юwей данные измерения

по критерию

L: IYk - аЖk - PI ~ min,


k

то это либо злой умысел, либо недостаток опыта, потому что


среднеквадратичный критерий

L:(Yk - аЖk - р)2 ~ min


k

выглядит предпочтительнее. И едва ли надо объяснять, что в боль­


шинстве случаев человек сам выдумывает критерий, а потом уже
терпит муки, оптимизируя.

Однако негладкость часто возникает в глубине задачи, и тогда


уже от нее нелегко избавиться. Например, если матрица А(ж) гладко
зависит от параметра Ж, то спектральный радиус р(ж) = р[А(ж)]
таким свойством не обладает, и минимизация

р(ж) ~ min, ж Е Х,
9.1. Гуманитарные аспекты 159

в классическую теорию не помещается. Нечто подобное возникает


во многих других ситуациях. Функция

",(ж) = min 1/1(Ж, у)


у

непрерывна 1), но никакая гладкость 1/1(ж, у) в общем случае не обес­


печивает гладкость ",(ж), и при необходимости дифференцировать
",(ж) - есть над чем задуматься.
Подобные аргументы могут по казаться все же неубедительны­
ми, если не видеть, что стоит за кадром. По первому впечатлению,
ничто не мешает «закруглит~ р(ж) или ",(ж). Но как сглаживать
финишное явление, связанное с источником неконтролируемо? От­
куда гарантии, что «закругление. не вызовет бифуркацию? Наконец,
многие конструкции доказательств перестают работать. И это самое
главное. Если функции поддаются сглаживанию, рассуждения -
противятся и теряют доказательную силу.

Проблема возникает даже в том случае, когда Функuиональные зависимости


в задаче гладкие. но это неизвестно. Невозможно или очень трудно выяснить. Илн
нет желання, а рнск есть. Не говоря о ситуаuиях, когда все функинн «с нзъяном",
а НХ бы надо днфФеренuировать и приводнть В сопрнкосновенне. Вот тогда,
собственно, н возникает потребность в подходя шей замене граднента. СубдНфФе­
ренuналом илн чем-ннбудь еше, после чего начннает стронться теорня. Субднф­
Ференuнал суммы равен сумме субднфФеренuналов н т. д. Зачем все это нужно?

Вопрос естественный, но ответ на него обычно дается тороп­


ливый и не вполне адекватный. Дескать, свойства субградиента
выясняются для того, чтобы его легче было вычислять. Ответ
до некоторой степени правильный, но «100 % вычислений. прихо­
дятся на тренировочные упражнения и экзамены. Реальная научная
работа очень редко сталкивается с необходимостью конкретных
вычислений, чаще - с рассуждениями, где мелькают субградиенты
и их свойства. Вот это «мелькание., дающее возможность делать
общие выводы, - и есть главная цель построения любой теории.
Комплект свойств - производной, выпуклости, полуупорядо­
ченности, - доведенный и отшлифованный до уровня теории, дает
возможность подключить изучаемый сектор к «общей шине. -
к функциональному анализу, теории множеств - и пользоваться

1) Если непрерывна fjI(Ж, у).


160 Глава 9. Негладкая onтимизация

соответствующими инструментами. Понимание ЭТОЙ стороны дела


не УКЛЗllывается в теоремы и формулы, оставаясь «нематематиче­
ским. ингредиентом любоЙ спеuиализированной дисuиплины, без
которого cyl)'6o математическая часть - превращается в груду пло­
хо мотивированных результатов.

9.2. СубдифференциаnКларка

в отсутствие выпуклости не сразу ясно, чем заменитьсубдифферен­


uиал. ПреllЛагалось много вариантов, но в такого рода ситуаuиях
проблема решается обычно единственнымспособом. Показательно
в этом отношении измерение объемов, где напрашивалось мно­
го естественных реuептов, но по-настоящему пригодной оказалась
лишь .мера Лебега [6, т.5].

Что касается неглЗllКОЙ оптимизаuии, то в десятку здесь по­


ПЗllает субдифференцuал Кларка. Определение опирается на новое
понятие производной по направлению 'Р ~(x) llЛя лиnшицевой функ­
uии 2) 'Р(Х),

,( ) '
'Р s х = 11т sup 'P(z + 88)8 - 'P(z)
. (9.1 )
Z-4Ж. e~o

Сушествование верхнего предела (9.1) вытекает из липшицевости ip(ж) ,


которой в обшем случае недостаточно мя сушествования обычной производной
по направлению.

Функuия 'Р ~(x) выпукла и положительно однородна по 8,


независимо от выпуклости 'Р(Х). В определенной степени это ока­
зывается приятным сюрпризом, и служит основой llЛЯ удачного
развития последующего сюжета, привлекая технику выпуклого ана­

лиза llЛЯ изучения невыпуклых 3Зllач.

2) ФУНIWИЯ 'I'(ж) иазывается лunшuu.etЮIi, если суwecтвует такая константа L, что

I'I'(Ж) - 'I'(у)1 ~ Lllж - YII

ДJlЯ любых ж, У в рассматриваемой области.


9.3. БаР&8Р диффврвнцирувмости 161

Субдuфференцuал Кларка)) функuии <р(х) в точке х определя­


ется как множество 4)

д<р(х) = {h Еап :"V 8 Еап : <p~(x) ~ (8, h)}. (9.2)


в случае выпуклой функuии (9.2) совпадает с обычным суб­
дифференuиалом.

На визуальном уровне
(9.2) означает, что д<р(Х) представляет
собой выпуклую оболочку всех точек вида lim V<p(x k ), где после­
k-+oo
k
довательность {х } «избегает .. точек недиФФеренuируемости <р(х)
и точек произвольного, но заранее фиксированного множества ме­
ры нуль.

9.3. Барьер дифференцируемости

Для конкретизаuииразговорао недифференuируемойоптимизаuии


рассмотрим задачу максимального быстродействияДЛЯ динамиче­
ской системы
:i; = !(х,u), и Е U. (9.3)
Обозначим через Т(х) минимальное время, за которое объект (9.3)
переходит из точки х в точку хо при оптимальном управлении.

Если движение И3 точки ж происходит вдоль траектории (9.3) в течение


времени .1.t, а потом по оптимальной траектории в точку жо, то очевидно,

Т(ж) ~ .1.t + Т(ж + :i:.1.t), (9.4)


где равенство достигается лишь в том случае. когда движение на первом участке

.1.t также оптимально по быстродействию.


деля (9.4) на .1.t и переходя к пределу при .1.t -+ О. получаем

дТ дТ
L i
-д :i:i;;;: -1,
Жi
Т.е. L i
~/i(ж,1J);;;: -1,
Ж.

тах{-
оЕи
дТ Ji(ж.1J)} = 1
Li дж, (9.5)

Э) НазываемыА КлоркOIrI [141 обобщенным градиентом.


4) Здесь сохраненообозначениеобычного субдифференuиanа.
162 Глава 9. НегладкаR оnтимизаЦИR

на оптимальном управnении, что воплоwaет nринциn дuнамu'lескOi!O npoгfXJJlJrlupo­


вония, а равенство (9.5) представnяет собой частный вариант yptJ8HeHUR Беллмана.

Чтобbl легализовать проведенное рассуждение и объявить со­


отношение (9.5) необходuмы.м условием оптимума, - не хватает двух
вещей: аПРИОРНblХ гарантий существования оnтuмального управления
и гладкости Т(х).
БblЛО бы еще полбеды, если бы функция Т(х) в итоге оказалась
гладкой. Но даже в простейших линейных задачах Т(х) оказывается
недиФФеренuируемоЙ. В результате метод динамического програм­
мирования (IIтрещит по швам».

Если предположить. что функция Т(ж) дважды непрерывно дифференциру­


ема, справедЛИВЫ следуюшие выкладки.

В силу (9.5) частные производные функции

дТ
8(ж, и) =L -д./;(ж, и)
i 2:.

равны нулю, т. е.

д8 = L ~ /;(ж. и) + L дТ д/;(ж, и) = О,
дЖt . дж;дЖt . дж; дЖt
I I

что может быть переписано в виде

~ ( дТ) + L дТ д/;(ж, и) = О, (9.6)


dt дЖt ; дж; дЖt

поскольку

d (дТ) nZT
dt дЖt = L дж;дЖt /;(ж, и).
I

Вводя далее переменные


дТ
1It = - -
дЖt
и функцию

Н(ж, 11. и) =L 11;/; (ж, и).


;

легко видеть, учитывая (9.6), что дЛя оптимального управnения обязаны выпол­
няться обычные условия (8.2) принuипа максимума.

Ведет ли рассмотренный путь к принuипу максимума? Камень


преткновения - опять-таки дифференuируемость. Правда, в отли­
чие от динамического программирования, здесь ситуаuия на вид
9.3. Барьер дифференцирувмоети 163

лучше. В окончательной ФОрмулировке принuипа максимума (OIпро­


блематичная,. Функuия Т(х) исчезает, и гладкость остается важной
лишь для обоснования. Как теперь при доказательстве обойтись без
предположений о дифференuируемости?
Обходной путь рассуждений и был, собственно, uеной откры­
тия. Не вполне строгие схемы приводят к принuипу максимума
очень легко, и это демонстрировалось не только в данном разделе,

но и в двух предьшущих главах. Однако обойтись без предположе­


ний гладкости было в свое время далеко не просто. Теперь многое
упростилось, особенно В связи с появлением раЗЛИЧНblХ обобщений
дифФеренuирования, в том числе - субдифФеренuиала Кларка.
Глава 10

Численные методы

Heo6xoiJUJlfOCMb nОНUJlfонШl, "то том 3D "одрам, вcelдo


висит на стене - "а" ружье СтониСЛО8С"ого.

Теория мирится с тем, "что получается-, практика вычислений допускает лишь


то, .. что требуется... Поэтому 8ычислительные Ш/гориmJIIЫ - это совсем другая
наука, где скучные детапи представляют наибольший интерес О. В то же время
здесь важна идеологическая ба38, без которой нет понимания существа дела.
И этот ракурс нуждается в ..лихих методах-, не обремененных необходимостью
.. сдать объект под КЛЮЧ-о Глава в этом направлении затрагивает лишь один аспект,
помеwaя в фокус внимания градиентные схемы.

10.1. Градиентные алгоритмы

При безусловной оптимизаuииФункuионала<р(х) естественнодви­


гаться по градиенту, чтобы найти максимум,либо против градиента,
если ищется минимум, т. е.

:i; = V<p(x) или :i; = -V<p(x).


Для определенности будем говорить о минимуме, имея в виду

Судить о сходимости здесь относительно легко, поскольку <р(х)


на траектории меняется монотонно.

Не менее естественно в задачах опrимизаuии рассматривать


движение материальной точки единичной массы

о Ошибки округления, СЛО_НОСТЬ вычислений. правила остановки, согласование


работы отдеЛЬНЫJl блоков по точности - все это ВЫJlОДИТ из-за кулис И требует
внимания.
10.1. Градиентные алгоритмы 165

под действием сил


B/{J
Qj = --д'
Xj

Минимуму потенuиальной энергии /(J(X) отвечает опять-таки ра­


венство обобщенных сил нулю, -V/{J(X) = О, т. е. критическая
точка /(J(X). Правда, система -не хочет стоять на месте., но для
погашения колебаний достаточно ввести трение, что порождает ре­
шающую проuедуру

(10.1 )
которую при нято назы вать меmодом тяжелого шарика [181.

с точки зрения (10.1), обычный градиентный npouecc :i: = -Vrp(z) есть


движение с трением HeвecoMoro шарика.

Выбором коэффиuиентатрения f3 в (10.1) можно добиться про­


скакивания небольших локальных минимумов за счет инерuии, -
но ДЛЯ этого надо обладать способностью «видеть, что лежит в при­
купе •. Талантливые программисты умудряются, тем не менее, кое­
что выжать из идеи, пробуя и ошибаясь.

Поскольку реальность дискретна, вместо t = -V/{J(X) дЛЯ


вычислений используется

Движение по-прежнему осуществляется в направлении минус гра­


диента, но ситуаuия иная. Теперь каждый раз необходимо при­
нимать решение о величине шага, которую в (10.2) регулируют
коэффиuиенты 'Yk, и на их выборе конuентрируется -вся наука •.

в меmоде наискореuшего спуска шаг выбирается решением за­


дачи

( 10.3)

т. е. движение против градиента идет до тех пор, пока это умень­

шает значение потенuиала /{J. Как только уменьшение потенuиала


прекращается, вычисляется новый градиент и выполняется следу­
ющий шаг.
166 Глава 10. Численные методы

Дискретным аналогом процедуры (10.1) ЯВJIяется двухшаговый


алгоритм

(10.4)

10.2. Себестоимостькомфорта

Проблема выбора коэффициентов 1" вычислительного процесса


(10.2) довольно неприятна. Одномерная минимизация (10.3) в ме­
тоде наuскореuшего спуска слишком обременительна и не так уж це­
лесообразна. Поэтому широко распространено упраВJIение величи­
ной шага на основе различных эвристических соображений. Но при
этом, как правило, дамокловым мечом нависает возможность пе­

ререгулирования, что ставит под удар сходимость алгоритма.

Чтобы .освободить руки., часто полагаются на требования

00

L 1" = 00, (10.5)

"
которые в естественных предположениях обеспечивают сходимость
и позволяют частично .расслабиться •.

Требование

проистекает обычно из предположения, что функцией Л/lnУН080 для процедуры


(10.2) ЯВllяется
V(ж) = (ж - ж')1,

где ж' - положение минимума Ip(ж). Иными словами, предполагается;

(Vlp(ж), ж - ж') ~ О. (10.6)

Запись жнl = жt - "t Vlp(Жt) в виде


жнl - ж' = (жt - ж') -"t Vlp(Жt),

после возведения в квадрат, с учетом (10.6), при водит к неравенству

(ЖНI - ж')1 ~ (жt - ж')1 +м 1


.,:, (10.7)

где М - максимум модуля Vlp(ж) в рассматриваемой области.


10.3. Метод Ньютона-Канторовича 167

Суммирование (10.7) по k от О до N дает

N
(ЖN+I - ж')2 ~ (жо - ж·)2 +м 2
Е 1;,
t=o
откуда, в силу

следует ограниченность последовательности жt, т. е. IIЖtl1 ~ R. Но, с учетом


(10.5) 21 и (10.6), жt не может оставаться в кольuе:

0< r ~ IIЖtl1 ~ R,
- что в итоre при водит к жt ~ ж' .

Условие монотонности (10.6) с точки зрения достаточности


(10.5) - может быть ослаблено, но это не тот случай, где стоит
прилагать усилия. Требования (10.5) удобны с теоретической точки
зрения, ибо позволяют некоторым образом «завершить разговор.),
когда ясно, что проблема решена только наполовину. В то же время
выбор 1" = I/k на практике часто представляется расточитель­
ным и необдуманным. Эффективные вычисления - это всегда
проникновение в конкретику задачи, учет спеuифики. И там, где
заканчивается теоретическое исследование, вычислительные про­

блемы, как правило, только начинаются.

10.3. Метод Ньютона-Канторовича

Поиск критической точки функuионала 1р(ж) является частным


случаем поиска нулевого решения уравнения Ф(ж) = О, где Ф -
отображение из а" В аП. Поэтому едва ли не весь арсенал вычис­
лительной математики можно рассматривать в срезе оптимизаuии.
В частности, популярный метод Ньютона-Канторовича итераuи­
онного решения уравнения Ф(ж) =О имеет определенные плюсы
и в оптимизаuии.

2) Расходимость ряда

нужна, чтобы послеllОвательность Zt не могла СХОДИТЬСЯ к не критической точке.


168 Глава 10. Численные методы

Сам метод состоит в следующем. Линеаризаuия отображения


Ф(х) в точке х" приводит к замене Ф(х) = О уравнением
(10.8)

Решение (10.8),

(10.9)

объявляется следующим приближением.


Итераuионная проuедура (10.9) носит название .метода Ньюто­
на-Канторовича. В случае Ф(х) = Vrp(x) (10.9) превращается в

и это довольно эффективный вычислительный проuесс, теоретиче­


ски более uелесообразный, чем простое движение по градиенту

хотя последнее интуитивно кажется более естественным. Но вычис­


ление .матрицы Гессе V 2 rp(x,,) на каЖдОМ шаге с последующим ее
обращением - может оказаться слишком дорогим удовольствием.

10.4. Метод сопряженных rрадиентов

Стандартной задачей оптимизаuии является минимизаuияположи­


тельно определенной квадратичной формы

1
rp(x) = 2"(Qx, х) - (с, х), (10.10)

достигаемая, как нетрудно видеть, на решении линейной системы


уравнений Qx = с.
Напомним стандартную проuедуру оpmо.?ОНаАизации {рама-Шмидта, в кOfQ­
роli осушеСТR/lяется замена не которого множества линеliно независимых векторов
{е.' ...• е n } ортонормнрованноliсистемоli {f., .... /n}. которая порождает ту же
самую линеliную оболочку.
На первом шаге полагается
10.4. Метод сопряженных градиентов 169

Далее строится вектор

орmOi!OНальныu / •• и ОПЯТЬ происходит HOpAlupoвKa:


hz
/} = (h z• h z)l/l .
На k-M шаге строится вектор

h k = её - (её' /Н)Л-I - ... - (еl, /.)/.,

орmогональныu КО всем {/., .•. , Л-I }. после чего НОpAluруеmся,

hk
/ё = (h k • hk)I/l'
На п-м шаге проuесс заканчивается.

Для описанной проuедуры совершенно не важно, как конкретно определя­


ется скалярное произведение. Вместо обычного

(10.11)
можно взять

(ж, у) =L i
q;jж 1l.
;.}

где Q = !q,j I - положительно определенная матриuа, а координаты помечены


верхними индексами. Иными словами, под скалярным произведением можно
понимать (Qж. у), считая, что угловые скобки работают как в (10.11). При этом
векторы ж, у, удовлетворяюшие равенству (Qж, у) = О, обычно называют COnpR-
женным,, либо Q-соnpRженным,, чтобы подчеркнуть. о какой матриuе идет речь.

Наличие полного комплекта (n ш1)'к) Q-сопряженных векто­


ров {/I, ... , /n} позволяет решить задачу минимизации квадратич­
ной формы (10.10) за n шагов. Алгоритм следующий. Из любого
начального положения хо ищется минимум ~(x) в направлении /1,
т. е. решается задача

в результате чего определяется следующее приближение XJ. Затем


из ХI ищется минимум ~(x) в направлении /2 и так n раз.
Сходимость алгоритма за n шагов вытекает из диагонального
вида квадратичной формы в базисе {/I, ... , /n},

(Qx, х) = L lIifi.
170 Глава 10. Численные методы

... ДеАствительно, подставляя ра]J10JКение

:1:= EOi/i

в (Q:I:,:I:), имеем

(Q:I:,:I:) = (QEOi/i. EOi/i) = E(QOi/i' Oj/;) = Eo~(Q/i,/i),


i i i.i i

поскольку (Q/i, Ij) = о при i i= j. ~

Для построения Q-базиса

и,,···, /n}
можно отправляться от любой системы линейно независимых век­
торов {el, ... , е n }. Поскольку .ортогоналuзaцuя .. Грома-Шмидта
не требует наличия сразу всех ej, - в качестве ej берут последо­
вательно градиенты "i7!p(Xj) в точках Xj, получаемых на j-M шаге
в результате минимизации

Если речь идет о минимизации квадратичной формы, такой


процесс, называемый методом сопряженных градиентов, сходится
за конечное число шагов, но его можно применять и для функций
!р(Х) более общего вида. Конечно, в общем случае рассчитывать
на конечную сходимостьалгоритма нельзя, но в малой окрестности
минимума !р(Х) обычно хорошо приближаетсягессианом, и это дает
основание ожидать тех же результатов с точностью до .о-малых •.

10.5. Почему ТРУДНО сделать ХОРОШИЙ автомобиль

Переход от разговоров к делу, в данном случае - к Вblчислениям, -


всегда труден. ПРИЧИНbI вроде бbl очевидны. Богатство реалий, сте­
рильность моделей. Тем не менее иллюзии возникают довольно
часто, и это особенно наглядно проявляется за пределами матема­
тики.

Немцы и японцы делают хорошие автомобили, что расстраивает соседеА, как


производителеА, и рождает намерения самим вырватъся вперед. Но переплюнуть
10.5. Почему ТРУДНО сделать хороший автомобиль 171

с бухты-барахты не получается, потому что ЭllOлюuия требует времени. Надо шаг


за шагом УС1ранять недоделки, отбирать мутаuии, изобретать, совершенствовать.
И все это ДОЛJКНО поддерJКИваться квалификаuиеА кадров, заинтересованностью.
фанатизмом, преемственностью поколениА. Короче говоря, надо _стричь - по­

ливать, С1рИЧЬ - поливать, но не менее 3ООлет- З1 .

Аналогичная СИ1Уаuия возникает в области вычислительных ал­


горитмов. Если теоретики часто обрывают исследование в удобном
для себя месте, практики обречены «дожимать ТО, что не дожимает­
ся. и, так или иначе, добиваться успеха. Это очень тяжелая работа,
причем - не одноразовая. Работа, требующая вычислительных
экспериментов, инкубаuионного вынашивания идей и, нередко,
участия нескольких поколениЙ. Последнее отнюдь не перегибает
палку. Известны красноречивые примеры [6, т.3, раздел 10.4], ко­
гда численные методы долгое время красиво выглядели на бумаге,
но при столкновении с компьютерными вычислениями были пол­
ностью вытеснены из алгоритмического арсенала.

ЗI И !СеетсЯ В ВИДУ классическиi! анекдот о -секрете. траВЯНЫ" покрытиi! В Англии.


Глава 11

Задачи большой раэмерности

Если задаlfа ПЛОХО решается,


ОНО ПЛОХО поставлена.

о задачах оптимизации большой размерности речь шла в [6, т.41. где упор
делался на вероятностном срезе проблематики. В данной главе соответствуюшие
результаты излагаются с несколько иной расстановкой акцентов.

11 .1. ОптимиэаЦИА и аrреrирование

При увеличении размерности исходная постановка задачи часто


теряет смысл. Количество переходит в качество. Механические
проблемы превращаются в статистические. Но пришествия тер­
модинамики ждать необязательно, - новые свойства появляются
в размерностях порядка нескольких сотен, а то и десятков.

Речь идет о достаточно очевидных вещах. Ошибки счета при


манипулировании многочисленными параметрами способны в разы
менять значения uелевых функuий и ограничений, не говоря о вы­
числении градиентов. Но даже это не самое страшное. Смысловые
неmочносmu моделирования при больших размерностях накаплива­
ются, и сами постановки оптимизаuионных задач перестают отра­

жать суть дела. Возникает парадокс: чем больше учтено факторов,


тем хуже становится модель. Большое число переменных свиде­
тельствует о том, что в задаче не поймано и не выделено главное.

Как, например, оптимизировать эффективность сложной сети транспортных


перевозок? Для точного ответа нужен (вроде бы) подробный анализ: распределение
транспорта по маршрутам. расписание, пропускная способность узлов и т. п.
Но это путь, ведуwий в тупик. Чем больше пара метров учтено, - тем меньше
возможность их контролировать. Тем выше роль случайных обстоятельств, сбоев,
неувязок. Вместо модели возникает абсурд.
11.1. Оптимизация и агрвгирование 173

Выход из описанного положения возможен только революци­


онным изменением подхода. Orказ от детальной информации вы­
глядит неизбежным, но это далеко не «сдача позиций ... Приближен­
ные ответы в естественных условиях оказываются довольно точны

и практически не зависят от «подробностей •. Ничего удивитель­


ного в такой метаморфозе, конечно, нет. Пример статистической
физики - тому подтверждение. Удивительно, может быть, лишь то,
что для приемлемого агрегированного описания системы «Термо­

динамические размерности порядка числа Авогадро. не требуются.

Асимптотическое аrperироваиие. Адекватная точка зрения могла бы


опираться на нелинейный закон больших чисел, гарантируюший ста­
билизацию нелинейных функций

при больших n.
Соответствуюшая идеология описана в [6, т.4], но там она
завуалирована 1) вероятностной трактовкой. Остановимся на неко­
торых упрошенных результатах, освобожденных от вероятностной
специфики.

Последовательность функций /п(х) назовем асu.мnтотически


постоянной, есл и

uип(х)} --+ О при n --+ 00,

где uип(х)} - среднеквадратическое уклонение /п(х) от своего


среднего значения 2),

Пусть, для простоты, х = {XI" .. , х п } Е СП, где

СП = [О, 1] х ... х [О, 1].


11 А для КОГО-ТО, наоборот. тем самым обна_ена.
Z) Напомним. что 8 силу HtpotltHCtrНlO Чe6blшеtlо [6. т.41 и) u{f.(ж)} -+ О следует
стремление К нулю меры мно_ества. на котором f.(ж) отличается от среднего
)начеиия более чем на € > О (сколь угодно малое).
174 Глава 11. Задачи большой размерности

11.1.1. Теорема. Пусть последовательностьфункций /n(ж) удовле­


творяет неравенствам

!
С"
[V /n(ж))2 dж( .. , dж n ~ 1n

и 1n -+ О при n -+ 00. Тогда ииn} -+ О, т. е. nоследовательность


функций /n(ж) асu.мnтотически постоянна на Кубе СП.

Результат можно усилить с помошью неравенства 3)

(11.1)

из которого тем более следует

(Т 2 (f) ~ ![V/(ж))2dЖI ... dЖn.


С"

Теорема 11.1.1, например, гарантирует стабилизацию функций

_
1" (ж )-tp
(аIЖ~ + ... +а"ж~)
n

при ограниченности производной 'р' (.) и коэффициентовaj о

Преимущества неравенства (11.1) выявляются на такой функции, как

I,,(ж) = тах Iж;I, ж е с".


I

Здесь IIV 1,,(ж)11 = 1 почти везде, но (11.1) гарантирует (после аккуратных вычис­
лений)
1
17{/,,}"'" .;по

Феномен стабилизации нелинейных функций при больших раз­


мерностях довольно сушественно R1Iияет на понимание и трактовку

задач оптимизации. Упрошенно говоря, теоремы о стабилизации


дают гарантию, что почти все выбранные наугад решения пример­
но одинаковы по качеству, а окрестность оптимума, в которой /n(ж)

)1 Существенно более обwне оиенкн на основе ПОНЯТИЯ соnрllЖtнноii мomносmu


рассматриваются в [6, т.4).
11.2. Согласование задач 175

ощyrимо превышает среднее значение, весьма мала, - и туда очень

трудно попасть. Более того, «наличие оптимума в руках» практи­


чески ничего не дает, потому что малейшие ошибки вычисления
и реализации выбивают значения целевой функции в область сред­
них значений.

Таким образом, различные функции In(ж) , 9n(Х) стабилизи­


руются около своих средних значений, и при больших n отличие
сводится к коэффициенту пропорциональности In(x) '" "У9n(Х) , что
позволяет считать In(x) '" "У,Х, где агрегат

I
Х= - LЖk.
n
k

к такому примитиву задача, конечно, сводится редко. Ситуа­


цию чаше определяют несколько агрегатов. В транспортной сети,
например, это могут быть средние пропускные способности маги­
стралей и узлов, суммарные транспортные ресурсы по категориям
и т. п. На формальном уровне это при водит к замене функций

приближенными функциональными зависимостями от агрегатов

InO ~ !р(Х, 1'; Z).


Построение асимптотической зависимости !р не вполне тривиально даже
в простых с виду ситуациях. Вот два при мера:

hn(ж. У) = L ЖtУt.
t
причем известны только агрегаты

Х =L Жt и у = LYt.
t t

по которым необходимо вычислять /n и h n • (?)

11.2. Соrnасование задач

Рассмотрим систему, состоящую из т ячеек, между которыми


может происходить обмен (перераспределение) ресурсов. Пусть
176 Глава 11. Задачи большой размерности

х: ~ о обозначает количество i-ro вида ресурса в k-й ячейке,


Хё > О (i = 1' ... , n) - обwее количество i -го ресурса в системе.
Предполагаются выполненными 4Iзаконы сохранения.:

~ х: = Хё, i = 1' ... , n,

"
с той или иной интерпретацией. Ресурсы MOryr перераспределяться
без потребления, как объемы в термодинамике. В другом варианте
потребление ресурсов может компенсироватьсяцентрализованным
воспроизводством, как в экономике (бюджет, внешние закупки,
регулярная добыча).
Наконец, каждая ячейка характеризуетсяфункцией полезности,
или эффектом обладания

В " = в"(х"), х " = {"


XI,'" ,Х п "} •
Все функции s" предполагаются гладкими, монотонно возраста­
юшими и строго вогнутыми - это естественно для большинства
приложений. Удобно также предполагать

дв" дв"
- - -+
дx~I
00 при Хё"-+ О, --+0
дx~I
при
"-+
Хё 00,

что избавляет от необходимостиразличных оговорок (насчет суше­


ствования и единственностирешения).

Состояние системы х· назовем равновесным, если суммарный


эффект системы

• 4)
максимален, т. е. Х определяется решением задачи

~ в"(х") -+ тах, (11.2)

"
Понятно, что с формальной точки зрения речь идет об оп­
тимальном распределении многомерного ресурса, не более того.

4) В указанных выше предположениях решение C)'1l1eCTByeT и единственно.


11.2. Согласование задач 177

Но для укрупненного описания системы - это лишь стартовая


площадка.

Заметим. что одна из стандартных термодинамических задач совпадает в точ­


t
ности с (11.2). ПУСТЬ e • V t и "t(e t • I7 t ) - соответственно: энергия. объем и энтро­
пия k-ro тела. Равновесныезначения e и v определяются из условия максимума
t t

энтропии при заданных значениях обшей энергии Е и обшеro объема У:

Термодинамический эталон подсказывает общесистемное на­


правление мысли.

Укрупненное описание. Из (11.2) следует, что условиями равновесия


являются:

дв"
дx " = '\j,
( 11.3)
j

где «множители Лаll'анжа. ,\j определяются из учета векторного


соотношения

LX" =х.
"
Величину

естественно называть также значимостью i-ro ресурса для k-й


подсистемы. Согласно (11.3) в положении равновесия значимости
ooHoимeHHых ресурсов во всех подсистемах выравниваются.

Систему в целом характеризует структурная фУНКЦия

S(X 1, ••• ,ХП ) = тах ~


LJ s k (Х " ), ( 11.4)
zl •...•zm k

для которой, как легко убедиться, выполняются соотношения

( 11.5)
178 Глава 11. Задачи большой размерности

Из (11.5) видно, что величины ~i дЛЯ системы в целом продол­


жают играть роль значимостей ресурсов.

Пример
1
8 (ж') = r.bl, 1
i(ж ) = r2 .fЖ2. Суммарный эффект при оптимальном
распределении

оказывается равным:

S(X) = ";r~ + r~ ./Х.

Тривиальная в математическом отношении акция (11.4) игра­


ет принципиальную роль, Я8ЛЯЯ собой переход к укрупненному
описанию системы. Для изучения равновесных свойств составной
системы оказывается достаточным знание структурной функции S.
Детальная информация о ячейках без ущерба может быть забыта.

Например, если изучается распределение ресурсов между двумя составными


системами, то равновесное распределение ресурсов между ними определяется

укрупненными описаниями. действительно, пусть

SI(X) = тах{ L 8 It (ж t ): L ж t = Х},


t t

S2(y) = тах{ L it(yt): Lyt = У}'


t t

где Х + У = Z. Тогда
mаХ{LI 8 It (ж t ) + 82t (yt»): L ж t = Х, Lyt = У} = тах {SI(X) + S2(y)}.
t t t X+Y=Z

Таким образом, в равновесии нет никакой разницы между составными


и простыми системами. Знания обшей СТРУКl)'рной функuии~) достаточно дЛя
ответа на любой вопрос, касаюшийся равновесия.

• Если из равновесной системы изымается некorорая подсистема вместе с 00-


держашимися в ней ресурсами, то оставшаяся подсистема будет равновесной. (?)

• Равновесные системы с одинаковыми значимостями ресурсов при объеди­


нении образуют равновесную систему. (?)

~) в данном случае S(Z) = тах {S' (Х) + s2(y)}.


X+Y=Z
11.2. Сотасованив задач 179

Описанная выше модель проигрывает термодинамике по части


интриги, поскольку в термодинамике энтропия S(X) «возникает»
лишь В процессе исследования. Конечно, было бы неразумно со­
здавать искусственные трудности и разыгрывать спектакль, если

целевые функции ячеек изначально заданы. Однако в экономике


есть немало систем, в которых наличие структурных функций име­
ет скрытый характер, и они могут быть выявлены лишь на этапе
изучения. Вот простейшая постановка задачи такого типа.

Пусть система обладает набором ресурсов

и осуществляетс окружением локальные обмены

dx = {dXI,"" dx n },

причем dXj > О, если система «получает», И dXi < О, если «отда­
ет». Естественно, что любая система, наделенная хотя бы малой
толикой активности или пассивной целесообразности, допуска­
ет лишь выгодные для себя обмены. Результирующую выгодность
можно определять по-разному. Правдоподобным выглядит следую­
щий способ. Каждый i-й ресурс имеет свой коэффициент ,лj > О
выгодности, и обмен считается допустимым, если

Другими словами, обмен dx допустим, если сумма взвешенных


приобретений не меньше суммы взвешенныхпотерь. Коэффициен­
ты ,лj в общем случае могут зависеть от Х, поэтому окончательная
форма ЛОКШlЬНО выгодного обмена такова:

( 11.6)

Можно ли такой системе при писать структурную функцию?


Да, - если коэффициенты 'лi(Х) справляются со своей ролью. На­
пример, не позволяют с помощью серии локальных обменов (11.6)
перевести систему в состояние с меньшим содержанием всех видов
180 Глава 11. Задачи боЛЬШОЙ размерности

ресурсов, т. е. отобрать ресурсы, ничего не давая взамен 6). В этом


случае можно гарантировать существование у дифференuиальной
формы

интегрирующего множителя 7) JL(Ж), т. е.

(11.7)

Функuию 8(ж), определяемую (11.7), естественно принять


за структурную функuию системы, поскольку главная роль струк­
турной функuии - служить критерием выгодности обмена, с чем
8(ж) легко справляется: вместо (11.6) теперь достаточно написать
d8 ~ О. Величины JL(Ж)~i(Ж) получают при этом интерпретаuию
значимостей ресурсов, так как

11.3. Термодинамическиепотенциалы

Предыдущий раздел в контексте метода множителей Лагранжа ни­


чего особенногоиз себя не представляет.Но параллели с термодина­
микой дают общесистемным формулам дополнительный импульс,
направляя исследование в новое русло.

Рассмотрим сопряженную к 8(ж) функuию

П(~I,". '~n) = XI~'~~Xn 8(Х) - ~ ~iXi}'


{ ( 11.8)
I

Максимум в (11.8) достигается при некоторых Х. (А), ... , Xn(A), т. е.

П(А 1 •••• , An ) = SIХЩ] - Е А;Х;Щ.


i

6) это соответствует термодинамическому nринциnу Qдuоботи'lеrкоu недостижи­


мости.

7) В термодинамике Д1IЯ 6Q = du + Р dV интегрирующим множителем окюы­


вается I/Тo rдe Т абсолютная температура. В результате получается дифференuнал
энтропии dS = 6Q/T.
11.3. Термодинамические noтенциалы 181

Поэтому

дП (дS ) дХ;
дА; = L дХ; - А; дА; - Х;(А),
I

и в силу (11.5)
дП
дА; = -Х;. dП = - L X;dA;. ( 11.9)

Переход от Функuии S(X) И переменныхХ 1, ••• , ХП К функuии


П('\) И переменным ,\ 1, ••• ,'\п называют обычно nреобразованием
Лежандра8). В результате такого преобразования в термодинами­
ке возникают термодинамические потенuиалы (свободная энергия
Гельмгольца, термодинамический nотенциШl Гиб6са) , в аналитиче­
ской механике - гамильтонов ФОРМШlизм.

Соотношения (11.9) позволяют вычислять равновесные количе­


ства ресурсов простым дифференuированием термодинамического
потенuиала П('\). Для этого, правда, необходимо знать равновес­
ные значимости ресурсов, которые бывают ясны из априорных
соображений. Например, значимости ресурсов могут определяться
-окружающей средой .. , каковой для -малой .. системы может слу­
жить - -большая ... В экономике, скажем, где значимости ,\j суть
иены, - подключение малых фирм к большому рынку не меняет
установившихся иен.

в некоторых ситуаuиях подключение одной системы к другой не меняет


значимостей лишь некоторых ресурсов. В этих случаях uелесообразно проводить
преобразование Лежандра по части переменных. переходя к термодинамическим
потенuиалам вида

дЛя которых вместо (11.9) имеет место

дП.
дА; = -Xi , i = 1•... • r;
дП.
дх.=Аj • ;=r+I ..... n.
J

8) О нюансах отличия преобраэованиА Лежондро и Юнго-ФенхелR СМ. ра:шел 3.5.


182 Глава 11. Задачи большой размерности

Баэисный ресурс. Orношение ~j / ~i назовем i -М обменным отноше­


нием j -го ресурса. Вместо значимостей часто удобно рассматривать
набор обменных отношений не которого базисного ресурса - пусть
это будет первый вид ресурса 9), - что отвечает переходу к новым
единицам измерения значимостей, в которых

~i дS / дS
Pi = ~ = дХi дХ '
1 i = 2, ... ,n.
При этом вместо ~1 удобно использовать величину

которая в термодинамикесоответствуеттемпературе.

Условия равновесия в новых переменных приобретают вид

а вместо П r удобнее потенциал П r , дЛя которого

дП r дП r
-=8'
дт '
дpi =-X j , i = 2, ... , r;
дПr
дХ. = Pj. j = r + 1, ... , n.
J

Обратим внимание, что переменные, характеризующие равно­


весие, распадаются на два класса. К первому относятся экстенсивные
nеременные, значения которых в равновесии равны сумме значений
ДЛЯ составляющих подсистем (в экономике - ресурсы, деньги;
в термодинамике - объемы, энергии, энтропия). Ко второму клас­
су относятся интенсивные nеременные, принимающие в равновесии

равные значения для всех подсистем (в экономике - цены; в тер­


модинамике - давления, температуры).

Манипуляции последних двух разделов можно расценивать по-раз­


ному. В «nресном варианте» - это тривиальные nреобразованШI, кото­
рые хороши для упражнений. Однако на таких «уnражненuяx» стоит

9) В экономике базисным ресурсом обычно ЯВ11ЯlOтся деньги, в термодинамике -


энергия.
11.4. Реакция на внешние воздействия 183

вся термодинамика, где без ориентации в прямых и двойственных nе­


ременных невозможно ориентироваться. Какой-нибудь изобарический
процесс можно изучать в средней школе, но как быть с - адиабати­
ческuм? Если для описания состояния выбрана энтропия, то каковы
должны быть другие nара.метры, чтобы составлять «комплект»? Все
это превращается в загадку без «тривиальных преобразований» 10).
Поэтому рассмотрение соответствующих схем на абстрактном
уровне, безусловно, представляет интерес. Систематическое исследо-
вание в этом направлении было предпринято Розоноэром 11). Вместе
с тем надо nOHuмaть, что конгломерат формул служит здесь не ядром
какой-то теории, а, скорее, образцом для подражания при рассмот­
рении аналогичных задач.

11.4. Реакция на внешние воздействия

Тот факт, что в равновесии системы суммарный эффект принимает


не просто стационарное,а максимальноезначение, - обеспечивает
наличие дополнительных свойств.
Рассмотрим составную систему со структурной функцией S(x),
находящуюся в равновесии со средой (с больщой системой), зна­
чимости ресурсов в которой равны ~I,"" ~n. Пусть В равновесии
достигается строгий локальный максимум суммарного эффекта, то­
гда матрица Якоби 82 S/(8x j 8xj) отрицательноопределена, т. е.
2
2 '" 8 S
d S = "~ 8 .8 . dXj dx j < О
.. х. х}
при dxfO. (11.10)
'.}
Если в окружении происходят какие-либо изменения, то ме­
няются равновесные количества ресурсов х" " . ,х n И равновесные

значимости ~I, ••• , ~n, связанные между собой соотношениями

8S
--
8xj
= ~j,
10) АнanогичиыА коммеитариА можио llать к анanитическоА механике и вариаuи­
ониому исчислению. Гllе похожее жонглирование составляет Яllро llИСUИПЛИНЫ.

Розонозр Л. Н. Обмен и раСПpellсление ресурсов (обобшенныА теРМОllинамиче­


11)
скиА ПОJPОll). 1-111 / / А и Т. 1973. М 5. С. 115-132; N.! 6. С. 65-79; М 8. С. 82-103.
184 Глава 11. Задачи боЛЬШОЙ размерности

из которых следует

что в совокупности с (11.10) дает

dS
2
=L d;\i dЖi < О. (11.11)

Легко проверяется d 2 п = _d2S > О, т. е. потенuиал П в рав­


новесии достигает минимума. Неравенства типа (11.11) позволяют
судить о характере сдвига равновесия при изменении окружаюшей

среды 12). Наибольшей наглядностью обладают выводы в том слу­


чае, когда в окружении меняется лишь одна равновесная величина.

Например, из (11.11) следует

(11.12)

что принято интерпретировать как компенсаuионные свойства си­


стем, которые широко декларируются термодинамическим nрuнцu­

nо.м Ле Шаmелье (см. раздел 2.8).

Неравенство (11.12) означает следующее. Если в равновесии происходит из­


менение содержания в системе лишь i-ro ресурса, то изменение ero значимости
определяется правой частью (I1.12). Если же системе при изменении количе­
ства i -го ресурса предоставляется возможность обмена с окружением друтими
ресурсами, то изменение i -й значимости определяется левой частью (11.12) и ока­
зывается меньше. чем в первом случае. Эго означает частичную компенсаuию
эффекта от изменения i-ro ресурса в результате обмена с окружением друтими
ресурсами.

ПринuипуЛе ШателЬе часто при писываюттаинственныесвой­


ства, ибо он позволяет угадать качественнуюреакuию системы при
отсyrствии ее мо.nельного описания. Каждый раз, о.nнако, после­
дуюший внимательный анализ показывает, что сушество дела за­
ключается в простых неравенствах, вытекаюших из экстремальной
приро.nы задачи.

12) Из (11.11) следует, что система .значимlXТИ - минус pecypcы~ ИВJlЯСТСИ P-I:U-
сmемой [6, т.31.
11.5. ОnтнмнзаЦНR инеопределенность 185

11.5. Оnтимиэаци. и неопредеnенноеть

На практике часто встречаются .неn.оопреn.еленные» зa.nачи, возни­


кающие из-за того, что какие-то механизмы остаются невскрытыми.

Вот показательный пример.

в городе UJlfеется n районов, L i - "иело жителей i-гo района, W; - "иело


рабomающих в j-M районе, Жj; - "иело живущих i-M районе и рабomающих в j-M.
Очевидно,

Еж;; =L i , ЕЖi; = W;. (11.13)


;
Вели"ины L j , W; иЗfJeстны, нео6ходUJlfО оценить nассажираnomоки Ж;;. но 2n урав­
нений не хватает дJIJI onределениR n 2 неи3flестных.

в таких ситуациях легче всего сказать «нет - И не нa.nо» ,


но после некоторого n.оn.умывания постановка зa.nачи приобретает
совсем n.ругоЙ виn.. Естественные вероятностные преn.положения
о расселении и распреn.елении мест работы выявляют оптимиза­
ционную прироn.у зa.nачи, в результате чего становится ясно, что

набор X;j нa.nо опреn.елять, максимизируя функционал, напомина­


ющий энтропию,

н =- L: X;j In X;j -+ тах


;,j

при ограничениях(11.1 З), Соответствующее моn.ельное обоснование


рассматривается в [6, т.4].
Задача

- Е Жij In Ж;j -+ тах, ЕЖ;j = L i ,


i.j ;
легко решается методом множителей Лагранжа. В результате получается

откуда ясно, что все Жjj представимы в виде произведения Ж;; = U;IJ;. Подстановка
в ограничения дает систему уравнений

Е UjlJj = L i , Е U;IJ; = W j ,
;
решая которую, окончательно имеем
186 Глава 11. Задачи большой размерности

что можно интерпретировать

~
../N и
~
../N' Прои:Jведение
как наличие у реГИОНОВ «потенuиалов

которых дает пассажиропоток Жij'


. притяжения.,

Приицип максимальиой неопределениости. Использование понятия


энтропии помогает определить неизвестные плотности распреде­

ления переменных, обосновать агрегирование и ввести макропара­


метры, дающие укрупненное описание системы,

Принцип максимума энтропии звучит так. В заданных внешних


условиях параметры системы имеют такие плотности распределения,
при которых достигается 'максиму,М энтропии.

Вот как это работает. НаАдем плотность распределения р(ж) вектора ж Е R" ,
если помимо естественного условия нормировки

f р(ж)dж =
R"
1

задано единственное макроограничение: фиксировано среднее значение ж 2 , т. е.

Максими:JИРУЯ ЭНТРОПИЮ

-f р(ж) 1п р(ж) dж ~ mах,


R"
при указанных ограничениях, переходим к лагранжиану

L(р(ж), >., р) = -
R"
f [р(ж) In р(ж) + >.р(ж) + рж 2 р(ж)] dж

И, варьируя плотность р(ж), получаем необходимое условие максимума:

f
R"
[In р(ж) + I + >. + рz2]6р(ж) dж = О.

В силу ПРОи:Jвольности вариаuии 6р(ж), имеем

In р(ж) + 1 + >. + рж = О,
2

откуда

р(ж) = ke-"z 2 = ke-" ( ZI+"'+


2 Z 2)
" •

Пара метры k и р определяются подстановкоА в ограничения.


Глава 12

Сводка определений и результатов

12.1. Критическиеточки и градиентные поля

,( Теорема 1.1.1. Если ФункцUJI 'Р(Ж) в mO'lKe ж' дифференцируема и npUHUNaem


ЛOIWJIЬНО жстремШlЬНое (..,аксUNШlЬНое или ..,инUNШlЬНое) значение, то VIjI(Z') О. =
,( Теорема 1.1.1 дает лишь необходимые условия оптимума, но фактически
их, как правило, достаточно ДЛЯ решения задачи. Причина ззключается в том,
что условие VIjI(Z') =
о дЛя экстремальной точки - обязательно. Поэтому
искомое критическое значение х' неизбежно попадает в число решений системы
уравнений VIjI(Z) = О. Последняя в .ситуаuиях общего положения. имеет ЛИбо
одно, ЛИбо несколько решений. В любом случае -круг подозреваемых. достаточно
узок, чтобы оставшуюся часть задачи считать чисто технической.

,( Если второй дифференuиал,называемыйгессианом, положительноопре­


делен, Т.е.

то в критическойточке х' - строгий минимум.

,( Теорема 1.3.3. Критическая mO'lKa х' R8ЛJIется положение.., ..,UHUNy..,a


функции 'Р(Х) в mомм случае, когда ровновесие х' системы :i: -VIjI(Z) аси..,nто­ =
mически устoUчиво.

,( Теорема 1.3.5. Если nomенциШl 'Р(Х) UNeem в а" единственную критиче­


скую точку х' , в кomорой достиzоеmся ЛОКШlЬНЫU "'UHUNy'" 'Р( х), то область n
nриmRженUJI х' при движении :i: =
-VIjI(Z) неогрониченна.

,( Теорема 1.... 1. Если lJIадкая ФУНКЦUJI 'Р(Х,'\) UNeem при .\о изолированныu
"'UHUNy'" по Z в mO'lKe х'(.\о), то при достаmочно ..,ШlОМ во:wущении ~,\ "'UHUNy'"
сохроннетсн, смещаясь в близлежащую точку х'(.\о + ~'\).
,( Теорема 1.5.1. Пусть х' - единственная критическая mO'lKa функции 'р(Х) ,
удовлетворllющеu условию неогрониченнOlO роста

lim 'Р(Х) = 00,


11z11"'''''
Тогда в х' достиzаетСЯlJlобальныu "'UHUNy'" функции 'Р(Х).
188 Глава 12. Сводка определений и результатов

'" Пусть Ф обозначает класс zлод/(ux Фун/(ционалов ер(ж) с единственноli


в шаре Ilжll ~ 1 нулевой критической точкой. Функционалы rpо(ж) и rpl(Ж)
называются гoмOтOnHЫNи в Ф. если сушествует гладкая деформоцШl

ер(ж. Л) Е Ф. Л Е (О. 1),


такая что

ер(ж. О) = еро(ж). rp(ж. 1) = rp,(ж).

Теорема Боб...... Если rpо(ж) и rp,(ж) гомomonны (/ Ф и нуль - тO'l/(ОЛОКалЬНOi!O


минимума еро(ж). то нуль - точ/(о локальною MиHUМyMO ер, (ж).

12.2. Условна. минимиэаци.

'" Задача на условный экстремум

I(ж) -+ min, 9,(Ж) = О, 9",(Ж) = О. (12.1)


заменяется оптимизацией логронжионо

'"
L(ж. Л) = f(ж) - Е Лj 9j(Ж)
j=1

по ж при НадЛежащем выборе Л 1 , •••• Л",.


В результате поиск условною э/(стремумо СВОДИТСЯ к решению системы
уравнений

... , 9",(Ж) = О, k= I •...• m .

'" Задача нелинейною npoi!fЮJlUrlиfJ080ния.

I(ж) -+ min.
9;(Ж) = О. i = 1.... • т. (12.2)

hj(ж) ~ О. j = 1•.•• • r.
отличается от предыдушей наличием ДОПQJIНИтельных ограничений в виде нера­
венств. Ограничения записываются TalOКe в векторном виде: 9(Ж) = О. h(ж) < О.
Элементы ж. удовлетворяющие ограничениям задачи. называются дonycтUМЫNи
решениRAlи.

Теорема Каруша-Д-она. Если mO'l/(O ж· есть решение зодо"и (12.2). то най­


дутся то/(ие "исло Л~. Л~, ... , л:.. и p~, •.. , р;, не все fЮ8ные нулю, "то

'" r
Л~VI(ж·) +L Л;V9;(Ж·) + Е рjVhj(ж·) = О.
;=1 j=1
12.2. Условная минимизация 189

причем ло ~ О, все р] ~ О и

p;hj(z') = О. j = 1•... ,r. (12.3)

Равенства (12.3) называются УСЛОВШUlи доnОЛНRющей нежесткости .

./ Теорема 1.4.1. Пусть в зодоче на условныu J118HIIJIfYJII существуют доnусти­


мые решенUJI, и функционал ср(х) н~раниченно растет на бесконечности,

ср(х) -+ 00 при Ilzll -+ 00.

Тогдо условный минимум существует. в том числе - l//о6альныЙ .

./ Теорема 1.5.1. Пусть все Функции в регулярноu зодоче (12.1) дважды


непрерывно дифференцируемы, х' - критическая точка, ).' >0 - соответствующий
(векторный) множитель Лагранжа и

<V~L(z', ).')у, у) >О


для любozo у ::j:. О. удовлетВОРRющеzo условию Vg(z')y = О. Тогдо х' - точка
изолир08анNOZO минимума в задаче (12. 1).

./ Пусть (х'(Ь). ),'(Ь)} обозначает экстремальнуюточку лагранжиана

L(z, ).) = j(z) - ).[g(z) - ы


задачи

j(z) -+ min, g(z) = Ь.


Тогда

~ = )"(Ь).
Таким образом. ),'(Ь) показывает скорость роста оптимального значения
целевой функции j по пара метру Ь. Иными словами. представляет собой цену
ограничениR .

./ Переход от задачи

j(z)-+min, g(z) =0. g={g••...• gm}. (12.4)


к безусловнoii минимизации функционала

j,.(z) = j(z) + pi(z)


при достаточно больших р дает сколь угодно точное решение задачи (12.4).
Метод штрафных функций прост идеологически и достаточно эффективен
с вычислительной точки зрения. Понятно, что он легко модифицируется под
различные задачи условной оптимизации далеко за пределами постановки (12.4).
При этом идея может использоваться не тoI1ько как алгоритмическая основа,
но и как удобная схема для получения теоретических выводов. Например. для
обоснования необходимых и достаточных условий оптимума.
190 Глава 12. Сводка определений и результатов

12.3. Выпукnый анализ

./' Выпуклые задачи важны не пoroму, что распространены, а пoroму, что


хорошо решаются. И хотя это похоже на -поиск под фонарем - ибо там хорошо
видно-, математика, как и Вселенная, именно так развивается. При этом знания,
добытые в -выпуклой области-, освешают многое за предеЛами .

./' Множество Х называется выny""ЫJI, если вместе с любыми двумя точ­


ками Ж,1/ Е Х оно содержит отрезок, их соединяюший,

.лж + (1 - .л)1/ Е Х, .л Е (О, 1).

./' Линейную комбинацию

точек {r., ... ,rN }, при условии .лj ~ О,

N
Е.лj=I,
j=1

называют выnу""ой.
Объединение всех выпуклых комбинацийконечных наборов точек из Х с К"
называется выnу""ой оболочкой множества Х и обозначается со Х.

./' Теорема Каратеодори. BtJIny""QII оболочка всегда совпадает с обыдинением


всевозможных выnу""ых комбинаций конечных nод.множеств Х С КА, содержащих
не более n + 1 точек .
./' Выпуклые множества Х, У С К" называклся отделUAlЫJIи, если суше­
ствует разделяЮЩQII гиперплоскость Н С кА (аж = Р), относительно кoroрой
множества располагаются в разных замкнутых полynространствах н+, н-:

ж Е Х :} аж ~ Р, ж Е У :} аж ~ р.

Теорема arдullМOC11l. Неnересекающиеся3Шlкнутые вЫnJIICЛые множества Х,


у всегда omделUAlЫ, и - строго omделUAlЫ, если XOfNI бы одНО их этих Nножеств
ограничено.

Опорной гиперплоскостью к Х называют rиперплоскость Н, кoroрая имеет


ХОТА бы одну обшую точку с Х, и либо Х С н+, либо Х С н- .

./' Замкнутое выпуклое множество К С К", содерж:ашее вместе с любой


точкой ж Е К луч .лж, проходАШИЙ через эту точку, называется конусом. Конус,
не содерж:аший противоположных точек,

жЕК, ж#О :} -ж f/. К,

называют ocтpЫJI, или заостреннЫJI.


12.3. Выпуклый анализ 191

Множество к', соетояшее из точек у, ДЛЯ которых скалярное произведение


уж ~ О при любом ж е к, называется дtюuственныJIf конусом по отношению к К.

,f Выпуклую оболочку конечного множества точек называют мноюгранни­


ком. Пересечение F многогранника Р с любой своей опорной гиперплоскоетью
называют гранью многогранника; #с-гранью, если dim F = #с; О-грани - вершины,
I-грани - ребра.

,f Теорема 3.2.3. Пусть ~., •.. '~П - ВЫnУlCAые функции на ВЫnУlCAом мно­
жестве Х. Во3JIIOJlCна одна и только одна из двух альтернатив:
(i) существует такой вектор ж е х, "то

~I(ж) < О, ,~,,(ж) < О;


(ii) существует ненулевой вектор у = {У.' ,у,,} > О, такой "то
y.~. (ж) + ... + уп~,,(ж) ~ О при любом ж е х.

,f Скалярная функuия ~ векторного аргумента считается выnуlCAoU, если

~[Лж + (1 - Л)уl ~ Л~(ж) + (1 - Л)~(у)


при любом Л е [0,11. Выпуклая Функuия ~(ж) имеет выпуклый надграфик
множество пар (z, ж), таких что z ~ ~(ж). Надграфик обозначают как epi~.

,f Теорема 3.3.1. для ВЫnУlCAости дважды непрерывно дифференцируемой функ­


ции ~ : JR" -+ JR достаточна нeompuцателЬНQJl onределенность ее гессиона.

,f Теорема 3.3.2. для ВЫnУlCAости непрерывно дифференцируемой функции


~ : R" -+ R неoБJrодUJllа и достаточна ее монотонность:

VЖ,1/: (V~(ж) - V~(1/), ж - 1/) ~ о.

,f Теорема 3.3.3. Любая ВЫnУlCAая на к" функция - непрерывна.

,f Леl\lll8 3.3.4. ПроuзводнQJl ~ ~(ж) ВЫnУlCAой функции ~ в любай точке ж


по лю6aJllу направлению s всегда существует. При этом npouзводные ~ ~(ж) равно­
мерно ограничены по В.

,f Вектор ж' называется субградиентом выпуклой Функuии ~ В точке ж,


если

~(ж + h) ~ ~(ж) + (ж', h)


для любого h.

,f Множествосу6градиентO#J ~ в ж называется субдифференциаломфункuии


~ В точке ж и обозначается 8~(ж).
192 Глава 12. Сводка определений и результатов

./ Теорема 3.4.1. Нео6ходШIbUI и достаточнbUIусловием l//о6альнOlOмиНШIума


выnуlCЛОU функции в точке :1:. R(JJlJlemCII:
о Е дер(:I:·) .

./ (1) Множество дер(:l:О) в любой точке :1:0 неnусmo, выnуlCЛО, замкнуто


и OlpaHUlfeHO.

(11) ПраизsоднOR выnуlCЛОЙ функции ер в точке :1:0 ПО любому наnра8llению 8


всегда существует и оnределнетCII равенством

дер(:l:о) = maх (z,8).


дв zEII,,(zol

(111) Теорема Моро-Рокафe.uара. Если функции ер" ер2 выnуlCЛЫ, то

д(ерl + ep2)(:I:) = дер, (:1:) + дер2(:I:).


(Iv) Теорема ДубоlllOlКoro-МlIJIIO'ПIНа. Если функции epl' ер2 выnуlCЛЫ и

epl(:l:O) = ep2(:l:0),
то

(у) Если "'(:1:) = ep(A:I:), где А nРRAlоугольнOR матрица, то

д"'(:I:) = А Т дер(Аж).
Под дер(А:I:) здесь nодразумеваетСR субдифференциал ер ПО omношению к аргументу
в mO'lKe Аж.

(vI) 8 omсутствие дифференцируемости рабomает анQЛOl теоремы 3.3.2. 8ы­


nуlCЛOR функциR всегда монотонна:

V:I:, у: (дер(ж) - дер(у), ж - у) ;;<: О •

./ Графики выпуклых функций можно рассматриватьдвояко: как точечные


множества и как огибаюwиеопорных гиперnлоскостеЙ.Подобная двойственность
служит основой дIIя извлечения выгод из перепасовываниярезультатов, кorорые
трансформируютсяв новые факты при смене точки зрения.

./ Представление выпуклой функции как максимума линейных функций:

ер(ж) = mах{ ep(z)


z
+ (8,:1: - z)}, в Е дер(z),

равиосильно

"':I: : (В, z) -Ip(z) ;;<: (8,:1:) - ер(ж), 8Е дер(z).


12.4. Выпуклое nрограммнрованнв 193

Произвол выбора субrpaдиента 8 из д'Р(Z) не ВЛИАет на результат. Если 'Р(Ж)


дифференцируема в обычном смысле. то

'Р(Ж) = тах{
, 'P(Z) + ('P'(Z). ж - Z)}.

'" Выпуклоli Функции 'Р(Ж) ПрИНАТО сопостаВЛАТЬсопряженнуюфункцию

'Р'(у) = sup{ (ж. у) - 'Р(Ж)}.


z

баЗИРУЮWУIOCА на своliстве субградиента (3.5). Переход к 'Р' называют nре06розо­


ванием ЮНlа-Фенхеля.

'" Теорема Моро-Фенхe.u. Если функция 'Р(Ж) выпукла и замкнута. то


'Р" (ж) = 'Р(Ж).
'" Теорема 3.5.2. для выnуклой замкнутой функции 'Р(Ж) и любых фиксиро-
ванных ж. у Е IR" - следующие условия эквивалентны:
(i) у Е д'Р(Ж).
(Ii) ж Е д'Р' (у).
(iii) (ж, у) = 'Р(Ж) + 'Р'(У).
'" Теорема ХeJIJUI. Пусть S - конечное семейство из не менее чем n + I 8Ы­
nуклых множеств в R". Тогда. если каждые n + I множеств из S uмеют неnустое
пересечение. то пересечение всех множеств из S не пусто.

12.4. Выпуклое программирование

'" НелинеliнаА задача

f(ж) -+ min,
hj(Ж)~О. j=I ....• r,

жЕQ,

с выпуклыми ФУНКЦИАМИ I(ж). hj(ж) и некотороli выпуклоli областью Q - назы­


ваеТСА зодачей выnуклого nрогpa.!rl/llировония. Обычно предполагаеТСА выполненным
на Q условие Слейтеро: сушествует такое Z, что

hj(z) < О. j = 1, ... • r.

'" Теорема к,уна-Таккера. Точка ж· Е Q является точкой ;иобального ми­


HUМyMa в задаче выnуклого nрогpa.!rl/llир080ния в MOJlUll случае. когда найдутс" не­
omрицотельные множители Лагранжа, 11' = {у; •...• у;}, при кomорых выполнены
условия доnОЛНJIющей нежесткости. у;hj(ж') = О. и лаlранжион
L(ж. у) = I(ж) + (у, h(ж»
194 Глава 12. Сводка определений и результатов

принимает минимальное по ж значение, т. е.

L(ж, у') ~ L(Ж',1/'), 'v ж е Q,


либо в субградиентной форме: О е д",L(ж', у') .

./ Пара (ж', 1/') е К- )( К ' называется седлoвoil mOlfKoй функиии ,,(ж, 1/),
если

ф(ж',у) ~ ,,(ж', у') ~ ,,(ж, у')

при любых допустимых ж, у. Другими словами, ж' - точка минимума ,,(ж, у')
ПО ж, а у' - точка максимума ,,(ж', у) ПО 1/.

./ CeJuollOi варнаIП теоремы ~- тапера. TOIfKa ж' е Q Я8llJlетсн тOlfКoй


глооалЬНOlо минимума в задаче выnуклOlO nрогро.ммUfXNlания в mOJNllf случае, когда
найдутся неomрицательные множители Лагранжа, у' = {у;' ... ' у;}, при кomopыx
(Ж',1/') - седловая точка лагран:жиана,
L(ж', 1/) ~ L(ж', у') ~ L(ж, у'), 'v ж е Q, у ~о .
./ С помоwью функционапа S(ж) = suр{L(ж, у) : у ~ о} задача выпуклоro
программирования MOJКeT быть записана в виде

S(ж) -+ min, ж е Q,
а функционап R(y) iпf{L(ж,у) : ж е Q} позволяет записать двойственную
задачу:
R(y) -+ тах, у ~о .
./ Теорема 4.2.1. Для любых дonycтимыx значений ж и у справедливо нера­
венство

f(ж) ~ R(y),
nереходящее в равенство I(ж') =
R(y') в mOJNllf случае, когда (ж',у') - седловая
mOlfKa лагранжиана, а значит, ж' - решение nрямой задачи, у' - двОЙственноЙ .

./ Теорема 4.3.1 о мииимаксе. Минимакс всегда больше максимина,

min тах ,,(ж, у) ~ тах min ,,(ж, у). (12.5)


'" u u '"
Равенство в (12.5) достигаетсн в mOJNllf случае, когда ,,(ж, у) имеет седловую mOlfKY
(ж', 1/'), при этом

min тах ,,(ж, у) = тах min ,,(ж, у) = ,,(ж', у').


'" u u '"

./ Теорема 4.3.5. Пусть функция ф(ж, у) onределена на npouзведении Х )( у


комnактов Х и У, выпукла по ж е Х и вогнута по у е У. Тогда ,,(ж, у) имеет
седловую точку.
12.4. Выпуклое nрограммнрованнв 195

./ Теорема 4.4.1. Либо неfЮвенство Аж >О fXlзрешимо. либо уА = О имеет


ненулевое положительное решение .

./ Теорема 4.4.2. Либо неfЮвенство Аж> О fXlзрешимо (ж i= О). либо уА =О


имеет строго положительное решение у > о.
./ 3anaча линеliного программнрования

(с, ж) -+ mах, Аж « 6, ж > О, (12.6)


характеризуется линеliностью целевой функции (с. ж) и ограничений Аж « 6.
./ ИСПOllЬ30ваниефиктивных переменных ПОЗВQllяет менять форму задачи
до неузнаваемости. Например, вместо (с, ж) можно максимизироватьединствен­
ный скалярный параметр жn+1 -+ mах, добавляя к ограничениям условие

(с. ж) - жn+1 = о .

./ Каждое из ограничений

LВ;jЖj ~ 6;
j

задачи (12.6) определяет в а" сдвинутое полупространство, пересечение которых


дает выпуклый дonycmUAlbIu МНо.?ОгfЮнник, ограниченный или неограниченный,
возможно пустой. ЛинеАная целевая функция (с. ж) растет при движении точки ж
вдOllь с. Поверхностями постоянного уровня, иа которых функция (с, ж) прини­
мает одно и то же значение, являются гиперповерхности (с, ж) = 'у, ортогональные
вектору с .

./ Теорема 4.6.1. Пусть решение зодо.,и (12.6) единственно. Тогдо при доста­
mO'lHO малых U3JlfeHeHURX вектоfЮ с оптUAlальное решение не меняется (достигается
в той же самой вершине) .

./ Двойственной к (12.6) оказывается задача

(6. у) -+ min. АТу >с. у >0.

./ 4.7.1. Пусть ж - доnустимый вектор задачи (4.9), а у - доnустимый


вектор двойственной зодочи. Тогдо

(с, ж) ~ (6, у) .

./ 4.7.2. Пусть ж· и у. - дonycmUAlbIe векторы nРRAlой и двойственной задач,


причем (с, ж·) = (6, у.). Тогдо векторы ж·, у. являются решениRAlи соответствую­
щих зада., .

./ Теорема 4.7.3. Если nfJRAIaR и двойственная зодача имеют доnустимые


векторы. то обе они UAlеют решения.
196 Глава 12. Сводка определений и результатов

./ Теорема 4.7.4. ДIUI M08J "тобы дonycтuмыe векторы npllAloй и двойственной


зада" Быllи решеНU1INи этих зада", Heo6xoдuмo и достамOIfНО выполнение следующих
условий доnОЛНRющей нежесткости:

1/: = О. если Е Вijжj < Ь;;


j

{ ж; = О. если Е B;j1/: > Cj.

./ Теорема 4.12.1. Точка ж' является точкой глобального минимума в задаче


квадратичного программирования,

(Dж, ж) + (с, ж) -+ min. Аж <!( Ь,

в тамм случае, когда при не котором 1/' ;1> о выполняется условие:

Dж' +с +А Т
1/' = О, (Аж' - Ь.1/') = О.

12.5. Теория игр

./ Самое трудное в любой дисциплине заключается в осознании роли


простых понятиЙ. Не теоремы, а исходные категории мышления - вот что
необходимо для ориентации .

./ Помимо экстремума есть несколькодругих понятий «оптимизационного


характера.., которые относительно малоизвестны, но не менее важны. Беда заклю­
чается в том, что, попав под крышу с обманчивым названием «теория игр .., они
стали в oбwественном мнении ассоциироваться с покером. Секрет же заключается
в том, что теория игр вообше не изучает игры в приземленном понимании этого
слова. а занимается «повсеместно распространенными .. системами. в которых

индивидуальные интересы не совпадают с коллективными .

./ Имеется два игрока. Первый - выбирает строки матрицы А с вероят­


ностями {р., ... ,Pn}, второй - выбирает столбцы с вероятностями {ql' ... , q... }.
МаТОJКИд8ние выигрыша первого тогда равно

W(p, q) = Е BijPiqj,
;.)

и он его. так или иначе, пытается максимизировать.

Если игра антаlOнисти"ескQЯ(выигрыш одного есть проигрыш другого), пер­


вый так выбирает {Р" ... ,Pn}, чтобы добиться максимума W при наихудшем для
себя {q., ... , q... }, второй - наоборот. В результате решением игры оказываются
набор/>! вероятностей (смешанные стратегии)

р' = {p;, ... ,p~}, q' = {q; •... ,q:,.}.


12.6. Бифуркации и катастрофы 197

обеспечиваюшие равенство

mах min Е 0ijPiQj = min тах Е OijPiQj.


р q .. q .. р
'.] '.]

./ Пусть каждый игрок А ; распоряжается выбором переменной Ж; Е Xj ,


и его еинтерес .. СОСТОИТ В максимизации своей функции выигрыша

D;(z) = Di(ЖI, ..• , ж,,).

Точка ж' называется решениeJrl игры ПО НЭШУ, если

Dj(ЖI' ... , Жi_I, ж:, zi+I, ... ,ж,,) = mах Di(ж), i = 1' ... ' N,
%iEXi

т. е. каждая Функция Di(ж) В точке ж' достигает оптимума по собствеиной


перемениой ж; .

./ Альтернатива ж Е Х при наличии m целевых Функций

называется неул)'Чшаемой, если не сушествует другой альтернативы У Е Х, дnя


которой

D;(y) ~ Dj(ж), i = 1' ... ' т,


причем хОТА бы одно из этих неравенств строгое. Неулучшаемые альтернативы
называют onтимальными ПО Парето.

12.6. Бифуркации и катастрофы

./ Начальный отре:юк ряда Тэйлора,

.t ( ) ~ D"1p(0) •
1 11' ж = L., --,-ж ,
0=0 а.

называется k-cmpyeu функции 11' в нуле. Разность Ip(ж) - jtlp(Ж) называют хвостом.
Функция 11' : JR -+ IR имеет в нуле nорядок k, если первой ненулевой
производной является Dtlp(O) .

./ Лемма Морса. Пусть гладкая функция 11' : К" -+ IR имеет в нуле Не8ЫРОЖ­
денную критическую MOlfKY и 11'(0) = О. Тогда в дocmaMOlfHO малой окрестности НУ/IR
существует локальная система координат Z., ... , Z", в кomоро"

Ip[ж(z») = Z~ + ... + Z: - Z:+I ... - Z~,


причем z(z) Я8ЛRется дuффеомopфuзмом.
198 Глава 12. Сводка определений и результатов

n
./ Определение6.3.3. Гладкие функции 'Р, Ф : R -+ R локально эквuвалентны
в нуле, если существует такой локальный дuффеоморфизм Z(Ж), что

I{J(Ж) = ф[Z(Ж» +(
в некomоpoii окрестности нуля при nодходящей константе (.

./ Естественный вопрос: в каком случае и по каким приэнакам мож­


но гарантировать эквивалентность в нуле функоии I{J(Ж) и ее k-cтpyн /I{J(Ж)?
Иначе roвopA, какие свойства ПOJ1инома /I{J(Ж) обеспечивают эквивалентность
jt I{J(Ж) и jt I{J(Ж) + q(ж) при любой функоии q(ж), разложение которой начинаетсА
со степени m > k? При положительном ответе на этот вопрос функоию I{J(Ж)
наэывают k -onределенной в нуле.
По первому впечатлению УСЛОВИА k-onределенности не дOJ1ЖНЫ быть очень
СЛОЖНЫМИ, по крайней мере идейно. На такую ВOJ1HY настраивает СИ1УаUИА с невы­
рожденным гессианом. Однако СЛОЖНОСТЬ проблемы окаэываеТСА несоиэмерима
с ожидаНИАМИ. Пробные попытки дOВOJ1bHO быстро 38ВОдАТ В тупик.

n
Теорема 6.4.1. Если функция I{J : R -+ R яtlllJlется k-оnределенной, то любой
однородный .многочлен степени k +I npeдcтaвU.м в виде

где РI(Ж), ••. ,Рn(Ж) - полиномы, порядка не .менее nеplЮlO.

./ Трансверсальность - соответствует ПОНАТИЮ ситуации общего положения


n
при пересечении многообраэиЙ. два подпространства Х И у В R трансверсальны,
n
если любой вектор z Е R представим В виде

z = Ж + 11, Ж Е.х, 11 Е У.
n
Гиперплоскости (сдвинутые подпространства) L, М С R трансверсальны,
n
если их сумма ПОРОJКд8ет R •

HaKoHeu, гладкие .многоо6разия в R n пересекаЮТСА трансверсально в точке ЖО,


если их касательные гиперплоскости в ЖО трансверсальны. О трансверсальности
.мН0200бразиЙ _uеликом. rOВOPAT в том случае, Korдa в любой точке пересечеНИА
они пересекаЮТСА трансверсально.

Таким обра30М, трансверсальность пересечеНИА мноrooбpaэий, графиков -


есть некиli эквивалент типичности, ОТСУТСТВИА исключительности, которыli ока­
эываеТСА лакмусовой бумажкой при ВЫАснении СТРУК1Урноli устоliчивости. Не­
вырожденность нулевой критнческой точки I{J(Ж) равносильна трансверсальностн
пересечеНИА в нуле графика градиента VI{J(Ж) с графиком нулевой функоии. Ана­
логичным обра30М характеРИЭук>ТСА (как СТР)'1С1)'рно устойчивые) k-onределенные
функuии.
12.7. Вариационное исчисление 199

./ Onрелеление 6.6.1. Семейства функций ер(ж, 8), ф(ж, 8), т. е.

ер, Ф :к n
)( К" -+ К,

ЭlUlиволентНIJI 8 нуле, если

ер(ж, 8) = ф[z(ж, 8), t(,») + ~(8),


где ~(8) - ~aдKoe omо6ражение, t(8) - диффеоморфизм, z(ж,8) - семейство
диффеомopфuЗМ08.

Если ер(ж, 8) эквивалентно в указанном смысле любому ер(ж, 8) + Аер(ж, 8),


где Аер(ж,8) - достаточно мало, то ер(ж,8) считается структурно устойчиВIJIAI
семейством .

./ При двух параметрах есть всего два струХ'турно устойчивых семейства,


катастрофа сборки и катастрофа складки. При большем числе параметров коли­
чество структурно устойчивых эталонных семейств увеличивается.

12.7. Вариационное исчисление

./ Вариаuионнаязадача с закрепленными концоми состоит в поиске экстре­


мали функuионала

!
1,

W = L(q, q, t) dt (12.7)
10

на множестве гладких функций q(t), принимаюwих на KOHuax заданного проме­


жутка [t o, t l ) фиксированные значения q(to) и q(l.) .

./ Производная Фреше ер'(ж) функuионала ер: Е -+ R - это такой вектор


из Е', что
ер(ж + Аж) - ер(ж) = (ер' (ж), Аж) + о(IIАжll), (12.8)

кorорый называют градиентом Фреше функuионала ер(ж) в точке ж и обозначают


как Vер(ж). Линейную часть равенства (12.8).

6ер = ер(ж + 6ж) - ер(ж) = (ер' (ж), 6ж),

называют вариацией .

./ Функuионал ер : Е -+ R называется дифференцируемыJlf по Гато в точке ж,


если сушествует такой линейный ограниченный функционал 1 Е Е' , именуемый
гfЮдuентом Гато, что для любого h Е Е

ер(ж + th) - ер(ж) = t(/, h) + o(t).


200 Глава 12. Сводка определений и результатов

./ Лемма 7.2.1. НеобходlLltl_ условием достиженUR Функционало.м СР(Ж) в mO'l-


ке ЖО локального MaKclLltlyMa Шlи MUHlLltlyMa Н8IIнетсн обращение в нуль градиента
VСР(Жо), -равносШlЬНО>> - вариации 6ср(жо) .

./ Экстремаль обязана удовnетворятьуравненин.м Эйлера.

i = 1•.•• ,n.
./ Если система автономна, L не зависит от t. - уравнение Эйлера имеет
первый интеграл

L- (q, :~) = const.


./ Необходимые условия экстремума второго порядка: условие Лежандра

д1 L
дq 1 ~ О.

условие Вейерштрасса,
E(q. q. р. t) ~ О.

где

( .
Eq.q.p,t ( ' ) -Lq,p.t
) =Lq,q,t ( ) - дL(q.
дq
q. t) (q-p,
. )

а также условиR ВеЙерштрасса-Эрд.мана.требуюшие непрерывности производных

дL дL
и L- -q'
дq дq

в точках излома экстремалей.

./ Необходимое условие Вейерштрасса превраwaется в дocmamO'lHoe при


дополнительной оговорке о принадлежности экстремали собственному или цен­
тральному полю экстремалей. что обеспечиваетсяУСШlенн_ условием Лежандра:

./ При поиске экстремали функционала (12.7) граничные условия, одно


или оба. могут быть освобождены. Уравнения Эйлера обязаны выполняться, как
и прежде. дополнительные требования (трансверсальности) получаются варьиро­
ванием граничных условий .

./ Если свободен один конец (t.,ql). ql = q(t l ). - условиR трансвер-


сальности:

( L_qдL)1
дq '=',
=0. дLI
дq 1=1,
=0.
12.7. Вариационное исчисление 201

Если граничная точка (t l , ql) обязана лежать на некоторой кривой ql = /(t,), -


условие mрансверсальносmи приобретает вид:

(L+(j-q):~)1
q '=/,
=0.

./ И:юnеРu.Nеmри.,ескими:юда.,а.ми называют задачи на условный экстремум

I I
1,
"
S(q. q. ') dt -+ mах, P(q, q, ') dt = 1.
In In

Технология решения - та же самая, что и в конечномерном случае. Переход


к поиску стаuионарной точки лагранжиана

Цq,.л) = I"
In
"
S(q, q. ') dt + .л{1 P(q. q. ') dt -I}
In

сводит задачу к решению уравнения Эйлера с Функuией

L(q, q• .л) = S(q. q, ') + .лР(q, q, ') .


./ Задача оптимальногоуправления,

I F(ж, и,
т

S = ') dt -+ mах, :i: = /(ж. и, '), ( 12.9)


о

выглядит иначе чем - изопериметрическая, но это такая же по духу проблема


поиска условного экстремума.

Максимизаuия лагранжиана данной задачи

I {F(ж, и,
т

L(ж. и• .л) = ') + .л(t)lf(ж. и, ') - :i:J} dt


о

по ж и и при водит к уравнениям Эйлера,

дР -.л д/ + ~ [дР -.лJ = О


дж дж dt дж •

дР +.л д/ = О,
ди ди

которые необходимо решать совместно с ограничениями :i: = /(ж, и, '), ж(О) = О,


что можно интерпретировать как "i1 л L = О.

./ Уравнения Эйлера для задачи (12.9) с помоwью га.мuльmониана

В(ж. и,у, ') = F(ж, и, ') + у/(ж. и. ')


202 Глава 12. Сводка определений и результатов

MOryт быть записаны в форме:

. дН . дН дН
Ж=-,
ду У =- дж' ди =0.

Условие дН/ ди = О служит прообразом nринциnа максимума

Н(ж, и,у, е) = тах


v
Н(ж, 17, у, е).

12.8. Задачи оптимальногоуправления

./ Стандартная задача: поиск ynраВ1lения и(е) на отрезке 10, Т), которое


обеспечивает максимум одной координаты, например ж.(Т), при ДВНJкении

:i: = J(ж, и, е), ж(О) = О, и Е U. (12.10)


Остальные ж j (Т) MOryт быть закреплены либо свободны, полностью или частично.
Недостаточная общность постановки здесь обманчива. Наличие интеграль­
ного критерия, скажем,

f F(ж, и, е)
т

dt -+ тах,
о

ликвидируется введением дополнительной переменной жn+I' УДОВ1lетворяющей


дифференuиальномууравнению :i:n + 1 = F(ж,:i:, е), и тогда интегральный критерий
сводится к жn+1 -+ тах.

В те же рамки легко помещаются и друтие задачи, например максимизация


функционала Glж(Т»). Минимизация Жn+I(Т) В случае присоединения к (12.10)
уравнения :i:n + 1 = 1 равносильна задаче о бысmродеUсmвии .

./ Оптимальное ynраВ1lениеопределяется системой уравнений

дН
ж=­ Н(ж, и,у, е) = тах Н(ж, ",у, е),
ду' v

которую необходимо решать совместно с теми или иными граничными условиями,


вытекаюшими из постановки задачи. Гамильтониан определяется как обычно:

Н(ж, и,у, е) = F(ж, и, е) + уf(ж, и, е) .


./ Принцип максимума дает, вообще говоря, лишь необходимые условия
оптимума, как и уравнения Эйлера в вариационномисчислении, но для линейных
систем он превращается в не06ходимое и досmаmочное условие, с некоторыми
оговорками .

./ динамическоеnJXNpaммupoвaHueстроится на простом соображении:-часть


экстремали - сама ЯВ1lяется экстремалью-, - из которого, для Функuионала (12.9)
на экстремали, выводится уравнение Бellлмана:

OS· + ~(~Ix {(OS'


дt бi' f(ж, и, е) ) + S(ж, и, е) }= О,
12.9. НегладК8R ОnТНМНЭ8ЦИR 203

Т.е.

OS' +Н (OS')
7it ж, {ii,t =0.

./ Динамическое пporpaммирование эффективно ДЛЯ некоторых задач


упрамения с дискретным временем вида

ЖО = О, а· е и, Ic = 0'1' ... ,n.


llля этоА задачи дискретныА анanог уравнения 6еллмана:

12.9. Негnадкая оптимизация

./ Негладкость часто возникает в глубине задачи, и тогда от нее нелегко


избавиться. Например, если матриuа А(ж) гладко зависит от параметра ж, то
спектральныйрадиус р(ж) = pIA(z)] таким своАством не обладает, и минимизаuия
р(ж) -+ min, ж е Х,

в классическую теорию не помещается.

Функция

",(ж) = min ф(ж, у)



непрерывна, но никакая гладкость ф(ж,у) в обwем случае не обеспечивает
гладкость ",(ж) .

./ В отсутствие выпуклости не сразу ясно, чем заменитьсубдифференuиan.


Выход из положения дает су6дифференцuалКлар"а. Определениеопирается на но­
вое понятие npouзt1Oднои по наnраtJЛению ", ~(ж) дЛя лиnшицевои функции ",(ж),

, ()
",. ж =
('
1т sup
",(z + 8в)
8
- ",(z)
.
:-+ж,8!0

Функция ", ~(ж) выпукла и положительно однородна по в, независимо от выпук­


лости ",(ж).
Су6дuфференциал Клар"а функции ",(ж) в точке ж определяется как множество

д",(ж) = {h е Rn : '<1 в е R n : ",~(ж) ~ (B,h»,


которое в случае выпуклоА функции совпадает с обычным субдифференuиапом.
204 Глава 12. Сводка определений и результатов

12.10. rpадиентнь.е MeTOДbI

,f При безусловной оптимизаuиифункционала ер(ж) естественнодвигаться


по градиенту, чтобы найти максимум, либо против градиента, если ишется мини­
мум, Т.е.

ж = Vер(ж) или ж = -Vер(ж).

Не менее естественно в задачах оптимизации рассматривать движение мате­


риальной точки единичной массы z = -Vер(ж) под действием сил

дер
Qj=--.
дж;

Минимуму потенuиальнойэнергии ер(ж) отвечает опять-таки равенство обобшен­


ных сил нулю, -Vер(ж) = О. ДЛя погашения колебаний достаточно ввести трение,
что порождает решаюшую проuедуру

z= -Vер(ж) - Рж,

которую принято называть .методом fI'I1IжелOi!O шарика.

,f в дискретном случае вместо ж = -Vер(ж) для вычислений используется

ж'+1 = ж, - 7, Vrp(ж,).

Движение по-прежнемуосуществляетсяв направлении минус градиента, но ситу­


аuия иная. Теперь каждый раз необходимо принимать решение о величине шага,
которую реryлируют коэффиuиенты 7" и на их выборе конuентрируется .. вся
наука •. В .методе наискореuшею спуска шаг выбирается из решения задачи

Часто полагаются на требования

QD

Е"У'
, = 00,
которые в естественных предположениях обеспечивают сходимость.
Метод Ньютона-Канторови ..а приводит к итераuионной процедуре

Это довольно эфФективный вычислительный проuесс, более uелесообразный, чем


простое движение по градиенту.

,f Метод соnpRженньаградиентовопирается на минимизаuиюположитель­


но onределенной квадратичной Формы

1
ер(ж) = 2(Qж, ж) - (с, ж). (12.11)
12.11. Задачи 6ольшой размерности 205

Нanичие комплекта Q-сопряженных векторов и., ... ,/n},(Q/i,lj) = О,


позволяет решить задачу минимиэаuии квадратичной формы (12.11) за n шагов.
Алгоритм следуюшиЙ. Из любого начального положения жо ишется минимум 'р(Ж)
в направлении 1" т. е. решается задача

в результате чего определяется следуюшее приближение ж,. Затем И3 ж, ищется


минимум Ip(ж) в направлении 12, и так n ра3.
Если речь идет о минимизаuии квадратичной формы, такой проuесс, на­
зываемый методом сonptlженных градиентов, сходится за конечное число шагов,
но его можно применlПЬ и дЛЯ функций Ip(ж) более обшего вида. Конечно, в об­
шем случае рассчитывать на конечную сходимость алгоритма нелb:JЯ, но в малой
окрестности минимума Ip(ж) обычно хорошо приближается гессианом, и это дает
основание ожидать тех же результатов с точностью до -о-малых ...

12.11. Задачи большой размерности

./ Смысловые неточности моделированияпри больших размерностях накап­


ливаются, и сами постановки оптимюаuионных задач перестают отражать суть

дела. Возникает парадокс: чем больше учтено факторов, тем хуже становится мо­
дель. Большое число переменных свидетельствуето том, что в задаче не поймано
и не вьшелено главное.

Выход ю подобного положения требует изменения подхода. Отказ от де­


тальной информаuии выглядит неи:Jбeжным, но это отнюдь не -сдача позиuий".
Приближенные ответы в ec-reственнwх условиях оказываются довольно точны
и практически не зависят от -подробностей... Пример статистической физики -
тому подтверждение. Удивительно лишь то, что дЛЯ приемлемого агрегированного
описания системы -термодинамические размерности" порядка числа AlIOraдpo
не требуются .

./ Последовательностьфункuий In(ж) называется ocuмnтOти.,ecKипосто­


янной, если

ст{fn(ж)} -+ О при n -+ 00,

где ст{fn(ж)} - среднеквадратическое уклонение In(z) от своего среднего зна­


чения .

./ Теорема 11.1.1. Пусть nоследовательность функций In(ж) удовлетворяет


неравенствaN

![V In(ж)]2 dж • ••. dж n ~ 7n


с"

и 7n -+ О при n -+ 00. Тогда cт{fn} -+ О, т. е. nоследовательность функций In(ж)


асимnтomи.,ески постоянна на Кубе СП =
[О, 1J )( ••• )( [О, 1].
206 Глава 12. Сводка onрвдвлений и результатов

./ Феноменстабилизаuиинелинейныхфункций при больших размерностях


существенно влияет на понимание и трактовку задач оптимизаuии. Упрошенно
говоря, теоремы о стабилизаuии дают raрантию, что почти все выбранные Hayfaд
решения примерно одинаковы по качеству, а окрестность оптимума, в которой
/n(ж) ощутимо превышает среднее значение, весьма мала, - и туда очень трудно
попасть. Более того, -наличие оптимума в руках. практически ничего не дает,
потому что малейшие ошибки вычисления и реализаuии выбивают значения
uелевой функuии 8 область средних значений.
На практике ситуаuию чаще определяют несколькоагреraТ08. На формальном
уровне это при водит к замене функций

приближенными функuиональными зависимостями от агрегатов

/n<-> ~ 'P(~ У, Z).


СокращеНИII и 0603начеНИII

~ и ~
- начало и KOHeu рассуждения, темы, доказательства

(1) - премаraет проверить или доказать утверждение в качестве упражнения,


либо довести рассуждение до .;JогическоА точки-. - но не ЯВllяется вопросом
.правильно или неправильно?-

(!) - премагает обратить внимание

.в ТONN случае .. - .в том И только том случае-

А ~ в - из А следует В

ж Е Х - ж приналлежит Х

Х U У, Х n У, Х\У - объединение, пересечение и разность множеств Х и У

Х ~Y = (Х\У) U (У\Х) - симметрическая разность множеств Х и У

Х с У - Х подмножество У. в том числе имеется в виду возможность Х ~ У,


т. е. между Х С У и Х ~ У различия не делается

х - замыкание Х

.k - граниuа Х

z =Х +У - множество элементов z = ж + 1/, где ж Е Х, 1/ Е У

ХА(Ж) - функuия-индикатор множества А (равна I мя ж Е А и О в противном


случае)

2 Х - множество всех подмножеств множества Х

" - пустое множество

B(r. ж) - шар радиуса r с ueHтpoM в точке ж

В. = {ж : Ilжll < r} - шар радиуса r с ueHтpoM в нуле


208 Сокращения и обозначения

R = (-00.00) - вешественная прямая

dim Е - размерность пространства Е

z = ж + iy - комплексное чиCJIО, z = r(cos ~ + i sin~) - еro триroнометрическая


запись, ж = Re z - действительная часть, " = 1т z - миимая; z = z' = ж - i" -
комплексно сопряженное чиCJIО.

ж <у - векторное неравенство: все координаты Ж; ~ ,,;

(ж, у) - скалярное произведение вeкropoB ж и ", эквивалентныеобозначения:

ж". ж·"
р(А) - спектральный радиус оператора А

со Х - выпуклая оболочка множества Х

к+ - конус неотриuательных функций

R~ - неотриuательный ортант

Rn - n-мерное евклидово пространство

Arg пtiп ~(ж) - положение минимума функции f(ж)

v /(ж) = д/
дж = {д/ д/}
дж'.··· 'дж
n - rpanиент функции /(ж)
д1f [ дl~ ]
джду - матриua Гессе дж;д"i функции f(Ж,,,)

д~(ж) - субдифференuиал функции f в точке ж


Литература

1. Арнольд В. Н., Варченко А. Н., ГусеiJн-Зоде С. М. Особенности диффе­


ренuируемых отображений. Классификаuия критических точек, кау­
стик и волновых фронтов. М.: Наука, 1982.
2. АШAfОНОВ С. А., Тимохов А. В. Теория оптимизаuии в задачах и упраж­
нениях. М.: Наука, 1991.
3. БеммОН Р. Динамическое программирование. М.: ИЛ, 1960.
4. Болтянскиu В. r. Математические методы оптимального управления.
М.: Наука, 1969.
5. Босс В. Интуиuия И математика. М.: Айрис-Пресс, 2003.
6. Босс В. Лекuии по математике. Т. 1. Анализ: Т. 2. Дифференuиальные
уравнения; т.
3. Линейная алгебра: Т.4. Вероятность, информаuия,
статистика: т. 5. Функuиональный анализ: Т. 6. or Диофанта до Тью­
ринга. М.: URSS, 2004-2006.
7. Брекер т., Ландер Л. Дифференuируемые ростки и катастрофы.
М.: Мир, 1977.
8. Гельфонд Н. М., Фомин С. В. Вариаuионное исчисление. М.: Физматгиз,
1961.
9. Гзри М., Джонсон Д. Вычислительные машины и труднорешаемые
задачи. М.: Мир, 1982.
10. Данцер Л., Грюнбоум Б., Кли В. Теорема Хелли и ее применения.
М.: Мир, 1968.
11. демЬЯНОВ В. Ф., Васильев Л. В. Недифференuируемая оптимизаuия.
М.: Наука, 1981.
12. ЕмелЬЯНОВ С. В., Коровин С. к.. БоБылвв Н. А., Булотов А. В. Гомотопии
экстремальных задач. М.: Наука, 2001.
13. Ноффе А.Д., Тихомиров В. М. Теория экстремальных задач. М.: Наука,
1974.
14. Кларк Ф. Оптимизаuия и негладкий анализ. М.: Наука, 1988.
15. Линейные неравенства и смежные вопросы. Сб. статей / Под ред.
Г. У. Куна и А. У. Таккера. М.: ИЛ, 1959.
16. Милнор дж. Теория Морса. М.: Мир, 1965.
17. Оnоuцев В. Н. Нenинейная системостатика. М.: Наука, 1986.
18. Поляк Б. Т. Введение в оптимизаuию. М.: Наука, 1983.
210 Литература

19. Посmон т., Сmюорm И. Теория катастроф и ее приложения. М.: Мир,


1980.
20. Ро"офеллор Р. Выпуклый анализ. М.: Мир, 1973.
21. Эльаальц Л. Э. Вариационное исчисление. М.: КомКнига/URSS, 2006.
2002.
Предметный указатель

Активные ограничения 36 3алача Больua 142


асимптотическая устойчивость 16 - Герона 50
асимптотическое постоянство 173 - двойственная 81
- Евклида 51
Бифуркаuия 102 - Лагранжа 142
брахистохрона 118 - Майера 142
- о максимальном потоке 88
Вариаuионное исчисление 118 - с закрепленными конuами 120
вариаuия 121 - Шварua 51
вращение векторного поля 26
выпуклая комбинаuия 54 Идеальная выпуклость 57
- оболочка 54 изохронность 124
ВЫРОЖllенный случай 31 инвариантный интеграл Гильберта
132
fамильтониан 140
индекс 27
геодезический наклон 132
гессиан 14
Касательная плоскость 12
гиперплоскость 52. 54
катастрофа сборки 103
гомотопные отображения 26
катеноид 124
- функuионалы 22
квазилинеаризаuия 65
градиент 11
конус 55
- Гато 121
- двойственный 55
- Фреше 121
- заостренный 55
градиентное поле 15
- острый 55
грань многогранника 56
критическая операuия 157
грубость системы 109
- точка 13
Двойственная задача 44. 71 - - неВЫРОЖllенная 14
действие по Гамильтону 123 критический путь 157

деформаuия 22
дилемма заключенного 96 Лагранжиан 32. 138
динамическое программирование лемма Дюбуа-Реймона 126
153 - Минковского-Фаркаша 77
диффеоморфизм 105 - Морса 105
допустимое решение 36 линейная гомотопия 26
допустимый многогранник 80 - модель производства 78
212 Предметный указатель

локальная эквивалентностьфунк­ полиэдр 56


ций 107 полунепрерывность 22
полярная функция 66
Максимум неи:юлированный 12 порядок 105
- нестрогий 12 преобразование Лежандра 65
матрица выигрышей 94 - Юнга-Фенхеля 65
- обратная 53 принцип Ле Шателье-Самуэль­
метод наискорейшего спуска165 сона 45
- Ньютона-Канторовича 167 - максимума энтропии 186
- сопряженных градиентов 170 производная по напрамению 11,
- тяжелого шарика 165 160
- штрафных функций 46
многогранник 56 Равновесие по Нэшу 96
множество аффинное 54 ра~еляющая гиперплоскость 54
- выпуклое 53 реryлярная задача 31
множитель Лаграюка 32 - точка 31
монотонность функционала 59 реryлярность 35
морсовекое k-седло 105 решение игры по Нэшу 96
морсовекое l-седло 14
Седловая точка 70
Надграфик 58 сетевой график 156
нелинейное программирование 36 симплекс-метод 90
непротивоположная напрамен- скалярное произведение 52
ность 26 сопряженная точ ка 131
неравенство Иенсена 58 - функция 65
- Юнга 66 сопряженные векторы 169
неулучшаемая альтернатива 100 - переменные 141
стационарная точка 13
Обезьянье седло 15 степень свободы 49
область притяжения 16 стратегия 95
обобщенные координаты 48 структурная устойчивость 109
опорная гиперплоскость 55 - функция 177
оптимальность по Парето 100 структур но устойчивое семейство
отделимость 54 112
отображение аффинное 54 субградиент 61
субдифференциал 61
Пассивные ограничения 36 - Кларка 161
пере говор ное множество 100
подвижно гомотопные функцио- Теорема Бобылева 22
налы 24 - Дубовицкого-Милютина 63
поле экстремалей собственное 131 - Какутани 74
- - центральное 131 - Каратеодори 54
Предметный указатель 213

- Каруша-,джона 36 условный экстремум 31


- Куна-Таккера 69 устойчивость по Ляпунову 16
- Моро- Рокафеллара 63. 192 - экстремума 19
- о среднем 12
- отделимости 55 Функuионал 10
- ФелЫlбаума 150 функuия вогнутая 58
- Хелли 67 - выигрыша 95
теоремы об альтернативах 75 - выпуклая 58
трансверсальность 110. 135 - гладкая 10
- Ляпунова 17
Управляемость 144
- полезности 176
уравнение Беллмана 154
- собственная 58
- Гамильтона-Якоби 154
- Якоби 131
Циклоила 123
условие 8ейерштрасса 130. 133
- Лежандра 130
- - усиленное 125. 133 Эквивалентность критических то­
- Слейтера 69 чек 107
- Якоби 130
условия Вейерштрасса-Эрдмана k-определенность 108
130 k-струя 104
- дополняющей нежесткости 37. Q-базис 170
69 Q-сопряженные векторы 169

Вам также может понравиться