Вы находитесь на странице: 1из 216

М. П.

МОКЛЯЧУК

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ.
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ

Москва Ижевск
2006
УДК 517.97(076.1)
ББК 22.161.8я7
Оглавление
Утверждено Министерством образования и науки Украины
как учебник для студентов высших учебных заведений,
письмо № 14/18.2-1790 от 26.07.2004 года

Рецензенты: Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
А. М. Самойленко, академик НАН України, профессор; ГЛАВА 1. Экстремумы функций . . . . . . . . . . . . . . . . . . 9
П. С. Кнопов, доктор физ.-мат. наук, профессор; 1. Основные понятия, связанные с экстремальными задачами 9
М. Д. Копачевский, доктор физ.-мат. наук, профессор 2. Экстремумы функции одной переменной . . . . . . . . . . 11
Моклячук М. П. 3. Экстремумы функций n переменных . . . . . . . . . . . . . 14
Вариационное исчисление. Экстремальные задачи. Учебник. — Москва– 4. Задачи на условный экстремум. Метод Лагранжа . . . . . 18
Ижевск: НИЦ «Регулярная и хаотическая динамика», Институт ком- 4.1. Задачи с ограничениями-равенствами . . . . . . . . 18
пьютерных исследований, 2006. — 430 с. 4.2. Задача с равенствами и неравенствами . . . . . . . 22
Изложена теория вариационного исчисления. Показано, как решаются клас- ГЛАВА 2. Элементы анализа . . . . . . . . . . . . . . . . . . . . 32
сические задачи Лагранжа, Больца, изопериметрические задачи. Приведены 1. Линейные нормированные и банаховы пространства . . . 32
основные положения теории оптимального управления, в основу которой по-
2. Теорема Хана–Банаха и её следствия . . . . . . . . . . . . 34
ложен принцип максимума Понтрягина, обобщающий принцип неопределенных
множителей Лагранжа. С использованием принципа максимума и метода дина-
3. Теоремы о разделении . . . . . . . . . . . . . . . . . . . . . 35
мического программирования решены задачи Майера, Лагранжа, Больца. Среди 4. Теорема Банаха об обратном операторе . . . . . . . . . . . 38
этих задач, — в частности, задача о посадке космического аппарата на поверх-
ГЛАВА 3. Основы дифференциального исчисления . . . . . . . 39
ность Луны, о запуске искусственного спутника Земли. Принцип максимума
Понтрягина использован для анализа экономической модели Леонтьева. 1. Производные Гато, Фреше, строгая дифференцируемость . 39
Теоретический материал дополнен заданиями студентам, которые можно 2. Частные производные. Теорема о полном дифференциале . 47
решать самостоятельно или на лабораторных занятиях. Сложные задачи можно 3. Производные и дифференциалы высших порядков . . . . . 48
использовать как темы курсовых и дипломных работ. 4. Интегрирование . . . . . . . . . . . . . . . . . . . . . . . . 51
Для студентов университетов. 5. Формула Тейлора . . . . . . . . . . . . . . . . . . . . . . . . 54
6. Теорема о неявной функции. Теорема Люстерника . . . . 56
Рекомендовано к печати Ученым советом механико-математического фа- 7. Теорема Рисса. Формула Дирихле . . . . . . . . . . . . . . 59
культета Киевского национального университета имени Тараса Шевченко 8. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
30.06.2004.
ГЛАВА 4. Условия экстремума функционалов . . . . . . . . . . 64
ISBN 5-93972-546-5 ББК 22.161.8я7 1. Условия существования экстремума . . . . . . . . . . . . . 64
2. Необходимые и достаточные условия экстремума . . . . . 66
c М. П. Моклячук, 2006
3. Задачи с ограничениями-равенствами . . . . . . . . . . . . 69
c НИЦ «Регулярная и хаотическая динамика», 2006
4. Задачи выпуклого программирования . . . . . . . . . . . . 74
5. Задачи с ограничениями-неравенствами . . . . . . . . . . . 78
http://rcd.ru 6. Экономические интерпретации множителей Лагранжа . . 89
http://ics.org.ru 7. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4 Оглавление Оглавление 5

ГЛАВА 5. Уравнение Эйлера и его обобщения . . . . . . . . . . 99 5. Условие Вейерштрасса. Игольчатые вариации . . . . . . . 227
1. Задача о брахистохроне . . . . . . . . . . . . . . . . . . . . 99 6. Условия второго порядка в задаче Больца . . . . . . . . . 232
2. Простейшая задача вариационного исчисления . . . . . . . 100 7. Условия экстремума второго порядка в задачах со старши-
3. Интегралы уравнения Эйлера . . . . . . . . . . . . . . . . 109 ми производными . . . . . . . . . . . . . . . . . . . . . . . 239
4. Векторнозначные функции . . . . . . . . . . . . . . . . . . 115 8. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
5. Функционалы, зависящие от производных высшего порядка 121
6. Функционалы, зависящие от функций многих переменных 125 ГЛАВА 10. Изопериметрические задачи . . . . . . . . . . . . . . 252
7. Задача Больца. Условия трансверсальности . . . . . . . . . 132 1. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
8. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 ГЛАВА 11. Задача Лагранжа . . . . . . . . . . . . . . . . . . . . . 267
ГЛАВА 6. Каноническая форма уравнений Эйлера . . . . . . . . 144 1. Задача Лагранжа с неголономными связями . . . . . . . . 267
1. Инвариантность уравнений Эйлера и Остроградского . . . 144 2. Задача Лагранжа в форме Понтрягина . . . . . . . . . . . 268
2. Вариационные задачи в параметрической форме . . . . . . 148 3. Задача Лагранжа со свободными границами . . . . . . . . 276
3. Каноническая (Гамильтонова) форма уравнений Эйлера . 152 4. Задача Лагранжа на множестве функций с подвижными
4. Уравнение Гамильтона–Якоби . . . . . . . . . . . . . . . . 156 границами . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
5. Вариационные принципы механики . . . . . . . . . . . . . 160 5. Правило неопределенных множителей Лагранжа . . . . . 282
6. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 6. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292

ГЛАВА 7. Вариационные задачи с подвижными границами . . 168 ГЛАВА 12. Достаточные условия экстремума . . . . . . . . . . . 294
1. Задачи Больца и Лагранжа на множестве функций со сво- 1. Поле экстремалей. Построение центрального поля . . . . . 294
бодными границами . . . . . . . . . . . . . . . . . . . . . . 168 2. S-функция и ее дифференциал . . . . . . . . . . . . . . . . 299
2. Задача Лагранжа на множестве функций с подвижными 3. Основная формула Вейерштрасса . . . . . . . . . . . . . . 300
границами . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 4. Достаточные условия экстремума функционала простей-
3. Задачи Больца на множестве функций с подвижными гра- шей задачи вариационного исчисления . . . . . . . . . . . 301
ницами . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 5. Достаточные условия экстремума функционала задачи со
4. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 старшими производными . . . . . . . . . . . . . . . . . . . 304
6. Достаточные условия экстремума функционала задачи
ГЛАВА 8. Ломаные экстремали . . . . . . . . . . . . . . . . . . . 190 Больца . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
1. Неособенные экстремали . . . . . . . . . . . . . . . . . . . 190 7. Достаточные условия экстремума функционала изопери-
2. Условия Вейерштрасса–Эрдмана . . . . . . . . . . . . . . . 191 метрической задачи . . . . . . . . . . . . . . . . . . . . . . 309
3. Задача об отражении экстремалей . . . . . . . . . . . . . . 202
4. Задача о преломлении экстремалей . . . . . . . . . . . . . 204 ГЛАВА 13. Оптимальное управление. Принцип максимума Пон-
5. Односторонние вариации . . . . . . . . . . . . . . . . . . . 206 трягина . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
6. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 1. Некоторые задачи оптимального управления . . . . . . . . 313
2. Формализация задачи оптимального управления . . . . . . 318
ГЛАВА 9. Условия экстремума второго порядка . . . . . . . . . 210 3. Доказательство принципа максимума Понтрягина для за-
1. Условие Лежандра . . . . . . . . . . . . . . . . . . . . . . . 210 дачи оптимального управления на множестве функций со
2. Условие Якоби . . . . . . . . . . . . . . . . . . . . . . . . . 212 свободным концом . . . . . . . . . . . . . . . . . . . . . . . 325
3. Достаточные условия слабого экстремума . . . . . . . . . 215 4. Решение задач оптимального управления . . . . . . . . . . 330
4. Необходимые и достаточные условия слабого экстремума 5. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
функционала, зависящего от вектор-функций . . . . . . . 220
6 Оглавление

ГЛАВА 14. Принцип максимума и необходимые условия экстре-


мума в задачах вариационного исчисления . . . . . . . . . . 342
1. Необходимые условия экстремума в простейшей задаче ва-
риационного исчисления . . . . . . . . . . . . . . . . . . . 342 Предисловие
2. Необходимые условия экстремума в задаче со старшими
производными . . . . . . . . . . . . . . . . . . . . . . . . . 347
3. Необходимые условия экстремума изопериметрической за-
дачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
Этот учебник по теории вариационного исчисления и методов опти-
ГЛАВА 15. Экономическая модель Леонтьева . . . . . . . . . . 360
мального управления рассчитан на студентов университетов, изучающих
1. Динамическая модель производства Леонтьева . . . . . . . 360
курс «Вариационное исчисление и методы оптимизации».
2. Двойственная задача и ее экономическая интерпретация . 363
Структурно книга состоит из трех разделов: основы теории экстре-
3. Условия оптимальности. Экономическая интерпретация . . 366
мальных задач, вариационное исчисление, оптимальное управление.
ГЛАВА 16. Метод динамического программирования . . . . . . 372 В первом разделе изложены методы нахождения экстремумов функ-
1. Принцип оптимальности . . . . . . . . . . . . . . . . . . . 372 ций многих переменных, теория дифференциального исчисления в нор-
2. Задача оптимального быстродействия . . . . . . . . . . . . 373 мированных пространствах. На основании этой теории исследованы за-
3. Метод динамического программирования в задачах Май- дачи на безусловный и условный экстремум (задачи c ограничениями-
ера, Лагранжа, Больца . . . . . . . . . . . . . . . . . . . . 376 равенствами и задачи c ограничениями-неравенствами) в бесконечно-
4. Обоснование принципа максимума методом динамическо- мерных нормированных пространствах. Описаны необходимые и доста-
го программирования . . . . . . . . . . . . . . . . . . . . . 382 точные условия экстремума функционалов, метод неопределенных мно-
5. Задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 388 жителей Лагранжа. Отдельно рассмотрена задача выпуклого програм-
мирования. Доказана теорема Куна–Таккера. Описаны экономические
ГЛАВА 17. Ответы, указания, решения . . . . . . . . . . . . . . . 390 интерпретации множителей Лагранжа.
Предметный указатель . . . . . . . . . . . . . . . . . . . . . . . . 423 Второй раздел наиболее объемный по количеству материала. Здесь
исследуются как классические задачи вариационного исчисления, так
Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427 и их обобщения. Анализируются уравнения Эйлера, Эйлера–Пуассона,
Эйлера–Остроградского, вариационные задачи с подвижными граница-
ми, ломаные экстремали, канонические уравнения Эйлера, изоперимет-
рические задачи. Изложены необходимые и достаточные условия экс-
тремума в задачах вариационного исчисления. В этом разделе также
решено большое количество экстремальных задач, имеющих практиче-
ский интерес.
Третий раздел посвящен задачам оптимального управления. Описа-
ны два подхода к решениям таких задач: принцип максимума Понтряги-
на и метод динамического программирования Беллмана. Решены зада-
чи Майера, Лагранжа, Больца. Описана взаимосвязь между принципом
максимума и необходимыми условиями экстремума в задачах вариаци-
онного исчисления.
Принцип максимума Понтрягина использован для анализа экономи-
ческой модели Леонтьева.
8 Оглавление

В книге приведены примеры решения экстремальных задач. Среди


таких задач, в частности, — задача о посадке космического аппарата
на поверхность Луны, о запуске искусственного спутника Земли. Бо-
лее 400 задач предложено для самостоятельного решения. К задачам ГЛАВА 1
указаны ответы.
Первое издание учебника (Киев, «Лыбидь», 1994) отмечено премией Экстремумы функций одной и многих
имени Тараса Шевченко Киевского национального университета имени
Тараса Шевченко. переменных

1. Основные понятия, связанные с экстремальными


задачами
Слово максимум (от латинского maximum) означает наибольшее, а
слово минимум (от латинского minimum) означает наименьшее. Эти два
понятия объединяются термином экстремум (от латинского extremum),
что означает крайнее. Ещё пользуются термином оптимальный (от ла-
тинского optimus), что означает наилучший. Задачи определения наи-
больших и наименьших величин называют задачами на экстремум или
экстремальными задачами. Задачи на экстремум возникают в различ-
ных областях деятельности человека, и поэтому для описания таких
задач используются различные термины. Чтобы использовать теорию
экстремальных задач, необходимо описать задачу языком математики.
Этот процесс называется формализацией задачи.
Формализованная задача состоит из таких элементов:
1) функционала качества f : X → R;
2) области X определения функционала f ;
3) области C ⊂ X.
Здесь R — расширенная числовая прямая, то есть множество всех дей-
ствительных чисел, дополненное значениями +∞ и −∞, C — подмно-
жество области определения X функционала f . Таким образом, фор-
мализовать экстремальную задачу — это чётко определить и описать
элементы f , C, X. Формализованную задачу записывают в виде

f (x) → inf (sup), x ∈ C. (1.1)


10 Глава 1 2. Экстремумы функции одной переменной 11

Точки множества C называются допустимыми точками задачи (1.1). 2. Экстремумы функции одной переменной
Если C = X, то допустимыми будут все точки области определения
функционала. Задача (1.1) в этом случае называется задачей без огра- Пусть f : R → R — функция одной переменной.
ничений.
Определение 1.1. Функция f называется полунепрерывной снизу
Задачу на максимум всегда можно привести к задаче на минимум,
(полунепрерывной сверху) в точке x b, если для каждого ε > 0 существу-
заменив функционал f на функционал g(x) = −f (x). И наоборот, зада-
ет δ > 0 такое, что для всех x ∈ (b b + δ) выполняется неравенство
x − δ, x
чу на минимум таким же образом можно привести к задаче на макси-
мум. Поэтому необходимые условия экстремума в задачах на минимум и f (x) > f (b
x) − ε (f (x) < f (b
x) + ε).
максимум выписываем только для задачи на минимум. Если необходимо
исследовать обе задачи, то пишут
Определение 1.2 (Эквивалентное). Функция f называется полу-
f (x) → extr, x ∈ C. непрерывной снизу (полунепрерывной сверху) в точке x b, если для всех
a < f (b
x) (a > f (b x)), a ∈ R, существует δ > 0 такое, что для всех
Допустимая точка xb есть точка абсолютного или глобального миниму-
x ∈ (b b + δ) выполняется неравенство
x − δ, x
ма (максимума) экстремальной задачи, если для любого x ∈ C выпол-
няется неравенство f (x) > a (f (x) < a).
f (x) > f (b
x) (f (x) 6 f (b
x)).
Если функция принимает значения в R = R ∪ {−∞} ∪ {+∞}, то
Тогда пишем xb ∈ absmin (absmax). Точка абсолютного минимума (мак-
определение 1.2 имеет смысл, когда f (b x) = +∞ (f (bx) = −∞). Если
симума) называется решением задачи. Величина f (bx), где x
b — решение же f (b
x) = −∞ (f (bx) = +∞), то функция считается полунепрерывной
задачи, называется числовым значением задачи. Эту величину обозна-
снизу (сверху) по договоренности.
чают Smin (Smax ).
Приведём некоторые примеры.
Кроме глобальных, исследуют и локальные экстремумы. Пусть X — 1. Функция y = [x] (целая часть от x) полунепрерывна сверху в точ-
нормированное пространство. В точке xb достигается локальный мини-
ках разрыва.
мум (максимум) задачи, x b ∈ locmin (b
x ∈ locmax), если x b ∈ C и су- 2. Функция y = {x} (дробная часть от x) полунепрерывна снизу
ществует такое число δ > 0, что для любой допустимой точки x ∈ C, в точках разрыва.
которая удовлетворяет условию kx − x
bk < δ, выполняется неравенство
3. Функция Дирихле, равная 0 в рациональных точках и 1 в ирраци-
f (x) > f (b
x) (f (x) 6 f (b
x)). ональных точках, полунепрерывна снизу в каждой рациональной точке
и полунепрерывна сверху в каждой иррациональной точке.
Иначе говоря, если xb ∈ locmin (locmax), то существует окрестность O x 4. Если функция f : R → R имеет локальный минимум (максимум)


точки x
b такая, что x
b ∈ absmin (absmax) в задаче в точке x
b, то она полунепрерывная снизу (сверху) в точке x
b.
5. Функция f (x) = 1 при x 6= 0, f (0) = +∞ полунепрерывна
f (x) → inf (sup), x ∈ C ∩ Ox .


|x|
Теория экстремальных задач даёт общие правила решения экстремаль- снизу в точке 0. Если определить функцию в точке 0 как f (0) = b или
ных задач. Теория необходимых условий экстремума более развита. f (0) = −∞, то она останется полунепрерывной снизу.
Необходимые условия позволяют выделить множество точек, среди ко- Теорема 1.1. Пусть f , g — полунепрерывные снизу функции. То-
торых содержится решение задачи. Такое множество называется кри- гда:
тическим, а сами точки — критическими точками. Как правило, кри-
тическое множество содержит не очень много точек и решение задачи 1) функция f + g полунепрерывна снизу;
можно найти тем или другим методом.
12 Глава 1 2. Экстремумы функции одной переменной 13

2) функция αf полунепрерывна снизу при α > 0 и полунепрерывна или


сверху при α 6 0;
f 0 (b
x) = . . . = f (2m−1) (b
x) = 0,
3) функция f · g полунепрерывна снизу, если f > 0, g > 0;
f (2m) (b
x) > 0 (f (2m) (b
x) < 0)
4) функция 1/f полунепрерывна сверху, если f > 0;
при некотором m > 1, 2m 6 n.
5) функции max{f, g}, min{f, g} полунепрерывные снизу; ДОКАЗАТЕЛЬСТВО.
6) функции sup{fi } (inf{fi }) полунепрерывные снизу (сверху), если По формуле Тейлора для n раз дифференцируемой в точке x
b функ-
fi полунепрерывные снизу (сверху). ции
n
X f (k) (b
x) k r(x)
f (b
x + x) = x + r(x), → 0, x → 0.
Теорема 1.2 (Теорема Вейерштрасса). Полунепрерывная снизу k! xn
k=0
(сверху) на отрезке [a, b] функция f : R → R ограничена снизу (сверху)
Если n = 1, то утверждение теоремы справедливо вследствие теоремы
на [a, b] и достигает наименьшего (наибольшего) значения.
Ферма. Пусть n > 1, тогда
Теорема 1.3 (Теорема Ферма). Если x
b — точка локального экс-
b функции f (x), то f 0 (b
тремума дифференцируемой в точке x x) = 0. f 0 (b
x) = . . . = f (n) (b
x) = 0
Теорема Ферма даёт необходимое условие первого порядка суще- или
ствования локального экстремума функции f (x) в точке x
b. Следующие f 0 (b
x) = . . . = f (l−1) (b
x) = 0, f (l) (b
x) 6= 0, l 6 n.
теоремы дают необходимые и достаточные условия экстремума второго 1
порядка. b + u l , u ∈ R,
Пусть l — нечетное число. Тогда функцию g(u) = f x
Теорема 1.4 (Необходимые условия второго порядка). Если x
b— можно разложить в ряд по формуле Тейлора
точка локального минимума (максимума) функции f (x), которая n
X k 1
имеет в точке xb вторую производную, то выполняются условия f (k) (b
x)
g(u) = f (b
x) + ul +r ul ,
k!
k=l
f 0 (b
x) = 0, f 00 (b
x) > 0 (f 00 (b
x) 6 0).
1  n
r ul ul → 0 при u → 0.
Теорема 1.5 (Достаточные условия второго порядка). Если
функция f (x) имеет в точке x b вторую производную и выполняются Функция g(u) имеет производную в точке u = 0. Поскольку x b ∈ locmin f ,
условия то 0 ∈ locmin g. По теореме Ферма g 0 (0) = f (l) (b x)/l! = 0. Откуда
f 0 (b
x) = 0, f 00 (b
x) > 0 (f 00 (b
x) < 0), f (l) (b
x) = 0. Это противоречит условию f (l) (b
x) 6= 0. Поэтому число l
четное, l = 2m. По формуле Тейлора
b — точка локального минимума (максимума) функции f (x).
то x
Необходимые и достаточные условия высшего порядка существова- f (2m) (b
x) 2m
f (b
x + x) − f (b
x) = x + r1 (x),
ния экстремума функции f (x) приведены в следующих теоремах. (2m)!
Теорема 1.6 (Необходимые условия высшего порядка). Если r1 (x)
→ 0, x → 0.
b — точка локального минимума (максимума) функции f (x), которая
x x2m
b производную порядка n, то или
имеет в этой точке x Поскольку f (2m) (b
x) 6= 0, то f (2m) (b b ∈ locmin f и f (2m) (b
x) > 0 при x x) < 0
f 0 (b
x) = . . . = f (n) (b
x) = 0, при x
b ∈ locmax f.
14 Глава 1 3. Экстремумы функций n переменных 15

Теорема 1.7 (Достаточные условия высшего порядка). Если ДОКАЗАТЕЛЬСТВО.


b производную порядка n и
функция f (x) имеет в точке x Пусть функция f полунепрерывна снизу на Rn , a ∈ R, x ∈
−1
f ((a, +∞]). Тогда существует окрестность Ox точки x b такая, что для


f 0 (b
x) = . . . = f (2m−1) (b
x) = 0, всех точек x ∈ Ox выполняется неравенство f (x) > a. А это значит, что


f (2m) (b
x) > 0 (f (2m) (b Ox ⊂ f −1 ((a, +∞]). Поэтому множество f −1 ((a, +∞]) открыто.


x) < 0)
Наоборот, если множество f −1 ((a, +∞]) открыто для любого a ∈ R
при некотором m > 1, 2m 6 n, то функция f (x) достигает в точке иxb ∈ Rn , то или f (b
x) = −∞ и функция f полунепрерывна в точке x b по
b локального минимума (максимума).
x договоренности, или f (b x) > −∞ и x b ∈ f −1 ((a, +∞]) при a < f (b
x). По-
скольку множество f −1 ((a, +∞]) открыто, то существует δ-окрестность
ДОКАЗАТЕЛЬСТВО. Ox точки x b такая, что Ox ⊂ f −1 ((a, +∞]) и f (x) > a для любого x ∈ Ox .


Поскольку f 0 (b
x) = . . . = f (2m−1) (b
x) = 0, то по формуле Тейлора Это означает, что функция f полунепрерывна снизу в точке x b.
f (2m) (b
x) 2m Теорема 1.9 (Теорема Вейерштрасса). Полунепрерывная снизу
f (b
x + x) − f (b
x) = x + r1 (x),
(2m)! (сверху) функция на непустом ограниченном замкнутом подмноже-
r1 (x) стве пространства Rn ограничена снизу (сверху) и достигает наи-
→ 0, x → 0. меньшего (наибольшего) значения.
x2m
Теорема 1.10 (Теорема Вейерштрасса). Если функция f полуне-
Если f (2m) (b
x) > 0, то f (b x) > 0 при достаточно малых x, то
x + x) − f (b прерывна снизу и для некоторого числа a множество {x : f (x) 6 a}
b ∈ locmin f . Если же f (2m) (b
есть x x) < 0, то f (b x) 6 0 при
x + x) − f (b непустое и ограниченное, то функция f (x) достигает своего абсо-
достаточно малых x, или x b ∈ locmax f . лютного минимума.
Следствие 1.1. Если функция f полунепрерывна снизу (сверху)
3. Экстремумы функций n переменных на Rn и  
lim f (x) = +∞ lim f (x) = −∞ ,
kxk→∞ kxk→∞
Пусть f : Rn → R — функция n действительных переменных.
то f достигает своего минимума (максимума) на каждом замкнутом
Определение 1.3. Функция f называется полунепрерывной снизу подмножестве пространства Rn .
(полунепрерывной сверху) в точке x
b, если существует δ-окрестность
Теорема 1.11 (Необходимые условия первого порядка). Если
X
n 1 b — точка локального экстремума функции f (x), дифференцируе-
x
2
bk < δ},
Ox = {x : kx − x kxk = x2k , b, то все частные производные функции f равны нулю
мой в точке x


k=1 b:
в точке x
∂f (b
x) ∂f (b
x)
= ··· = = 0.
точки x
b такая, что для всех x ∈ Ox выполняется неравенство ∂x1 ∂xn


f (x) > f (b
x) − ε (f (x) < f (b
x) + ε). Теорема 1.12 (Необходимые условия второго порядка). Если
b — точка локального минимума функции f и эта функция диф-
x
Теорема 1.8. Функция f : Rn → R полунепрерывна снизу на b, то выполняется условие
ференцируема два раза в точке x
n
R тогда и только тогда, когда для каждого a ∈ R множество n X
X n
f −1 ((a, +∞]) открыто или дополняющее множество f −1 ((−∞, a]) за- ∂ 2 f (b
x)
hk hj > 0 ∀ h = (h1 , . . . , hn ) ∈ Rn .
мкнуто. j=1
∂x k ∂x j
k=1
16 Глава 1 3. Экстремумы функций n переменных 17

Это условие означает, что матрица 1) матрица A положительно определена, если


 j=1,n
∂ 2 f (b
x) ∆1 > 0, ∆2 > 0, . . . , ∆n > 0;
f 00 (b
x) =
∂xk ∂xj k=1,n
2) матрица A отрицательно определена, если
неотрицательно определена.
Теорема 1.13 (Достаточные условия второго порядка). Пусть ∆1 < 0, ∆2 > 0, . . . , (−1)n ∆n > 0;
функция f : Rn → R дифференцируема два раза в точке x
b и выполня-
ются условия: 3) матрица A неотрицательно (неположительно) определена, если

∂f (b
x) ∂f (b
x) ∆1 > 0, ∆2 > 0, . . . , ∆n > 0 (∆1 6 0, ∆2 > 0, . . . , (−1)n ∆n > 0)
1) = ··· = = 0;
∂x1 ∂xn
Xn X n и существует такое j, что ∆j = 0;
∂ 2 f (b
x)
2) hk hj > 0 ∀ h = (h1 , . . . , hn ) ∈ Rn , h 6= 0.
∂x k ∂x j 4) матрица A неопределена.
k=1 j=1
ПРИМЕР 1.1. Исследовать на экстремум функцию двух переменных
b — точка локального минимума задачи на экстремум
Тогда x
f (x) → inf, x ∈ Rn . f (x1 , x2 ) = x31 + x32 − 3x1 x2 → extr .

Условие 2) теоремы 1.13 означает, что матрица Решение. Функция непрерывна. Очевидно, что Smax = +∞. Со-
гласно следствию 1.1 из теоремы Вейерштрасса минимум достигается.
 j=1,n
∂ 2 f (b
x) Необходимые условия первого порядка
f 00 (b
x) =
∂xk ∂xj k=1,n ∂f (b
x) ∂f (b
x)
= 0, =0
положительно определена. ∂x1 ∂x2
Теорема 1.14 (Критерий Сильвестра). Матрица A положитель- дают уравнения
но определена тогда и только тогда, когда её главные миноры по- 3x21 − 3x2 = 0, 3x22 − 3x1 = 0.
ложительны. Матрица A отрицательно определена тогда и только
тогда, когда (−1)k det Ak > 0, где Решая эти уравнения, определяем критические точки (0, 0), (1, 1). Чтобы
использовать условия второго порядка, запишем матрицы, составленные
 j=1,k из вторых производных:
Ak = aij i=1,k , k = 1, . . . , n.
 2  
∂ 2 f (b
x) 6b
x1 −3
Запишем ряд главных миноров матрицы A A(b
x) = = ,
∂xk ∂xj k,j=1
−3 6b
x2

a11 · · · a1n 0 −3
a11 a12 A1 = A(0, 0) = ,
∆1 = a11 , ∆2 = , . . . ∆n = · · · ·
· . −3 0
a21 a22 an1 · ann  
6 −3
A2 = A(1, 1) = .
Тогда возможны следующие варианты: −3 6
18 Глава 1 4. Задачи на условный экстремум. Метод Лагранжа 19

Матрица A1 не является неотрицательно определенной. Поэтому точка по x функции Лагранжа


(0, 0) не удовлетворяет необходимым условиям минимума второго поряд-
x, λ, λ0 )
∂L(b
ка. Точка не может быть решением задачи, (0, 0) ∈
/ locextr f. Матрица L0x (b
x, λ, λ0 ) = 0 ⇐⇒ = 0, j = 1, . . . , n.
A2 положительно определена. Следовательно, согласно теореме 1.13 в ∂xj
точке (1, 1) достигается локальный минимум задачи. Для того чтобы λ0 6= 0, достаточно, чтобы векторы f10 (b 0
x), . . . , fm (b
x)
Ответ: (0, 0) ∈/ locextr; (1, 1) ∈ locmin . 4 были линейно независимыми.
Чтобы доказать теорему, используем теорему об обратной функции
4. Задачи на условный экстремум. Метод Лагранжа в конечномерном пространстве.
Теорема 1.16 (Теорема об обратной функции). Пусть F1 (x1 , . . . ,
4.1. Задачи с ограничениями-равенствами
xs ), . . . , Fs (x1 , . . . , xs ) — s функций s переменных, непрерывно диффе-
Пусть fk : Rn → R, k = 0, 1, . . . , m, — дифференцируемые функ- ренцируемых в некоторой окрестности точки x b, и якобиан
ции n действительных переменных. Задачей на условный экстремум  s
∂Fi (b
x)
(с ограничениями-равенствами) называется задача det
∂xj i,j=1
f0 (x) → extr, f1 (x) = . . . = fm (x) = 0. (1.2) не равен нулю. Тогда существуют числа ε > 0, δ > 0, K > 0 такие,
n что для любого y = (y1 , . . . , ys ), kyk 6 ε, можно найти x = (x1 , . . . , xs )
Точки xb ∈ R , которые удовлетворяют равенствам fk (b x) = 0, k = 1, m, такое, что выполняются условия kxk < δ, F (b x + x) = F (b
x) + y, kxk 6
называются допустимыми в задаче (1.2). Допустимая точка x b даёт ло- 6 Kkyk.
кальный минимум (максимум) задачи (1.2), если существует такое число
δ > 0, что для всех допустимых x ∈ Rn , которые удовлетворяют услови- ДОКАЗАТЕЛЬСТВО.
bk < δ, выполняется неравенство
ям fk (x) = 0, k = 1, 2, . . . , m, kx − x Докажем теорему Лагранжа методом от противного. Предположим,
что условие стационарности
f (x) > f (b
x) (f (x) 6 f (b
x)). m
X
λi fi0 (b
x) = 0
Основным методом решения задач на условный экстремум является ме- i=0
тод неопределенных множителей Лагранжа. Он базируется на том
факте, что условный экстремум в задаче (1.2) достигается в точках, ко- не выполняется и векторы fi0 (b
x), i = 0, 1, . . . , m, линейно независимы.
торые являются критическими в задаче на безусловный экстремум Это значит, что ранг матрицы
 i=0,m
L(x, λ, λ0 ) → extr, ∂fi (b
x)
A=
∂xj j=1,n
P
m
где L(x, λ, λ0 ) = λk fk (x) — функция Лагранжа, λ0 , λ1 , . . . , λm — равен m + 1. Поэтому существует подматрица матрицы A размерности
k=0 (m + 1) × (m + 1), определитель которой не равен нулю. Пусть это будет
множители Лагранжа. матрица, составленная из первых m + 1 столбцов матрицы A. Построим
Теорема 1.15 (Теорема Лагранжа). Пусть x b — точка локаль- функцию F : Rm+1 → Rm+1 при помощи функций fk (x), k = 0, . . . , m.
ного экстремума задачи (1.2), функции fi (x), i = 0, 1, . . . , m, непре- Пусть
рывно дифференцируемые в некоторой окрестности U точки x b. То- bm+2 , . . . , x
F1 (x1 , . . . , xm+1 ) = f0 (x1 , . . . , xm+1 , x bn ) − f0 (b bn ),
x1 , . . . , x
гда существуют одновременно не равные нулю множители Лагран-
жа λ0 , λ1 , . . . , λm такие, что выполняется условие стационарности bm+2 , . . . , x
Fk (x1 , . . . , xm+1 ) = fk−1 (x1 , . . . , xm+1 , x bn ), k = 2, . . . , m + 1.
20 Глава 1 4. Задачи на условный экстремум. Метод Лагранжа 21

Здесь x1 , . . . , xm+1 — переменные, а x bn — фиксированные


bm+2 , . . . , x Как и в случае безусловной задачи оптимизации, стационарные точ-
величины. Если x b = (b bn ) — решение задачи на условный экс-
x1 , . . . , x ки задачи на условный экстремум не обязательно являются её решением.
тремум, то F (b x) = 0. Функции Fk (x1 , . . . , xm+1 ), k = 1, . . . , m + 1, Для таких задач также существуют необходимые и достаточные условия
удовлетворяют условиям теоремы об обратной функции. Возьмём y = оптимальности в терминах вторых производных. Обозначим через
= (ε, 0, . . . , 0). Для достаточно малых по модулю значений ε существует ( )k=1, . . . ,n
вектор x(ε) = (x1 (ε), . . . , xm+1 (ε)) такой, что 00 ∂ 2 L(x, λ, λ0 )
Lxx (x, λ, λ0 ) =
∂xk ∂xj
F1 (x(ε)) = ε, j=1, . . . ,n

Fk (x(ε)) = 0, матрицу вторых производных функции Лагранжа L(x, λ, λ0 ).


k = 2, m + 1, Теорема 1.17 (Необходимые условия второго порядка). Пусть
функции fi (x), i = 0, 1, . . . , m, дважды дифференцируемы в точке x bи
то есть непрерывно дифференцируемы в некоторой окрестности U точки x b,
f0 (x(ε)) − f0 (b
x) = ε,
причём градиенты fi0 (b b—
x), i = 1, . . . , m, линейно независимы. Если x
fk (x(ε)) = 0, локальный минимум задачи (1.2), то
k = 1, m, hL00xx (b
x, λ, λ0 )h, hi > 0
где x(ε) = (x1 (ε), . . . , xm+1 (ε), x bn ) и kx(ε) − x
bm+2 , . . . , x bk < K|ε|. для всех λ, λ0 , которые удовлетворяют условию
А это противоречит тому, что x b — решение задачи на условный экс-
тремум (1.2), поскольку как при положительных, так и при отрицатель- L0x (b
x, λ, λ0 ) = 0,
ных значениях ε существуют близкие к x b векторы, на которых функ-
и всех h ∈ Rn таких, что
ционал f0 (x(ε)) принимает значения как меньше, так и больше f0 (b x).
Теорема доказана. hfi0 (b
x), hi = 0, i = 1, . . . , m.
Таким образом, для определения m+n+1 неизвестных λ0 , λ1 , . . . , λm ,
bn мы получили n + m уравнений
b1 , . . . , x
x Теорема 1.18 (Достаточные условия второго порядка). Пусть
b∈
функции fi (x), i = 0, 1, . . . , m, дважды дифференцируемы в точке x
f1 (b
x) = · · · = fm (b
x) = 0, Rn , которая удовлетворяет условиям
m  fi (b
x) = 0, i = 1, . . . , m.
∂ X
λk fk (b
x) = 0, j = 1, . . . , n. Допустим, что при некоторых λ, λ0 выполняется условие
∂xj
k=0
L0x (b
x, λ, λ0 ) = 0
Множители Лагранжа определены с точностью до пропорциональности.
Если известно, что λ0 6= 0, то можно выбрать λ0 = 1. Тогда количество и, кроме того,
уравнений и количество неизвестных одинаковое. hL00xx (b
x, λ, λ0 )h, hi > 0
Линейная независимость векторов производных f10 (b 0
x), . . . , fm (b
x) при всех ненулевых h ∈ Rn , которые удовлетворяют условию
есть то условие регулярности, которое гарантирует выполнение усло-
вия λ0 6= 0. Однако проверка этого условия сложнее, нежели непосред- hfi0 (b
x), hi = 0, i = 1, . . . , m.
ственная проверка того, что λ0 не может быть равным нулю. Со времен b — локальный минимум задачи (1.2).
Тогда x
Лагранжа, почти целое столетие, правило множителей использовалось
с λ0 = 1, несмотря на то, что в общем случае оно неверно. Правило неопределенных множителей Лагранжа решения задач
на условный экстремум с ограничениями-равенствами следующее.
22 Глава 1 4. Задачи на условный экстремум. Метод Лагранжа 23

1) Составить функцию Лагранжа 1) стационарности по x


m
X ∂L(b
x, λ)
L(x, λ, λ0 ) = λk fk (x). Lx (b
x, λ) = 0 ⇐⇒ = 0, j = 1, . . . , n;
∂xj
k=0

2) дополняющей нежесткости
2) Выписать необходимые условия экстремума функции L(x, λ, λ0 ) —
уравнения λi fi (b
x) = 0, i = 1, . . . , m;

L(x, λ, λ0 ) = 0, j = 1, . . . , n.
∂xj 3) неотрицательности
3) Найти стационарные точки, то есть решения этих уравнений при λi > 0, i = 0, . . . , m.
условии, что не все множители Лагранжа λ0 , λ1 , . . . , λm равны ну-
лю.
Итак, правило неопределенных множителей Лагранжа решения
4) Найти решение задачи среди стационарных точек или доказать, что задач на условный экстремум с равенствами и неравенствами следую-
задача не имеет решений. щее.

4.2. Задача с равенствами и неравенствами 1) Составить функцию Лагранжа

Пусть fi : Rn → R — дифференцируемые функции n действитель- m+s


X
ных переменных. Задачей на условный экстремум с равенствами и L(x, λ) = λi fi (x).
неравенствами называется задача i=0

f0 (x) → inf, (1.3) 2) Записать необходимые условия:


fi (x) 6 0, i = 1, . . . , m, а) стационарности
fm+k (x) = 0, k = 1, . . . , s.
∂L(x, λ)
Сформулируем необходимые условия минимума задачи (1.3). = 0, j = 1, . . . , n;
∂xj
Теорема 1.19 (Теорема о неопределенных множителях Лагран-
жа). Пусть x b — точка локального минимума задачи (1.3), функ- б) дополняющей нежёсткости
ции fi , i = 0, . . . , m + s, непрерывно дифференцируемые в некоторой
λi fi (b
x) = 0, i = 1, . . . , m;
окрестности U точки x b. Тогда существуют одновременно не равные
нулю множители Лагранжа λ0 , λ1 , . . . , λm+s такие, что для функции
в) неотрицательности
Лагранжа
m+s
X λi > 0, i = 0, . . . , m.
L(x, λ0 , λ1 , . . . , λm+s ) = λi fi (x)
i=0
3) Найти критические точки, то есть все допустимые точки, кото-
выполняются условия: рые удовлетворяют необходимым условиям с множителем Лагранжа
λ0 = 0 и λ0 6= 0.
24 Глава 1 4. Задачи на условный экстремум. Метод Лагранжа 25

4) Найти решение задачи среди всех критических точек или показать, ПРИМЕР 1.3. Решить экстремальную задачу
что решений нет.
1 ax2 + 1 bx2 → min, x31 + x32 = 1,
ЗАМЕЧАНИЕ 1. Пользуясь правилом неопределенных множителей Лагранжа 2 1 2 2
решения задач на условный экстремум с ограничениями-равенствами, можно
выбирать число λ0 как положительное, так и отрицательное. Для задач, где где a > 0 и b > 0 — заданные числа.
присутствуют ограничения равенства и ограничения неравенства, знак λ 0 суще-
ственный. Решение.
ПРИМЕР 1.2. Решить задачу на условный экстремум 1) Выпишем (регулярную) функцию Лагранжа (указанное в теоре-
ме 1.15 условие регулярности тут выполнено):
x1 → inf, x21 + x22 = 0.

Решение. Единственным очевидным решением этой задачи есть L(x1 , x2 , λ) = 1 ax21 + 1 bx22 + λ(x31 + x32 − 1).
2 2
точка x
b = (0, 0). Решим задачу методом Лагранжа.
1) Составим функцию Лагранжа L = λ0 x1 + λ(x21 + x22 ). 2) Поскольку

2) Запишем уравнения стационарности L0x1 (x1 , x2 , λ) = ax1 + 3λx21 , L0x2 (x1 , x2 , λ) = bx2 + 3λx22 ,

L0x1 = 0 ⇐⇒ 2λx1 + λ0 = 0, то система уравнений для определения стационарных точек будет


такой:
L0x2 = 0 ⇐⇒ 2λx1 = 0.
ax1 + 3λx21 = 0, bx2 + 3λx22 = 0 x31 + x32 = 1.
3) Если λ0 = 1, то получим уравнения
3) Эта система уравнений имеет три решения:
2λx1 + 1 = 0,
    !
2λx2 = 0. (a3 + b3 )1/3
0, 1, − b , 1, 0, − a , a , b , − .
3 3 (a3 + b3 )1/3 (a3 + b3 )1/3 3
Первое уравнение несовместимо с условием x21 +x22 = 0. Поэтому система
уравнений
4) Далее, матрица вторых производных
2λx1 + 1 = 0,  
00 a + 6λx1 0
2λx2 = 0, Lxx (x1 , x2 , λ) = .
0 b + 6λx2
x21 + x22 = 0
Для указанных решений эта матрица примет, соответственно, вид
решений не имеет. Если λ0 = 0, то x1 = 0, x2 = 0 — решение системы      
уравнений. a 0 −a 0 −a 0
A1 = , A2 = , A3 = .
Ответ: (0, 0) ∈ absmin . 4 0 −b 0 b 0 −b

Этот пример показывает, что не всегда можно брать λ0 = 1 при Условие hfi0 (b
x), hi = 0, i = 1, . . . , m, в данном случае имеет
составлении функции Лагранжа. вид 3x21 h1 + 3x22 h2 = 0. Для первых двух решений это означает,
26 Глава 1 4. Задачи на условный экстремум. Метод Лагранжа 27

что h1 = 0 и h2 = 0 соответственно. Отсюда ясно, что матрицы A1 и g2(x)=0 g1(x)=0


A2 удовлетворяют условиям теоремы 1.17 (хотя они не являются по- + - (0,1) + -
ложительно определёнными). Поэтому точки (0, 1), (1, 0) — строгие
локальные решения задачи. Для матрицы A3 условие теоремы 1.17 g1’(x*)
g3(x)=0
не выполняется. Поэтому точка x
!
-f ’(x*) x*
a , b
(-1,0)
(a3 + b3 )1/3 (a3 + b3 )1/3

не может быть решением задачи на минимум. Эта точка есть стро- g2’(x)
гим локальным решением задачи максимизации той же функции
при тех же ограничениях. + - (0,-1)
g1(x)=0 + -
Ответ: x b1 = (0, 1) ∈ locmin, x b2 = (1, 0) ∈ locmin (b
x3 = g2(x)=0
= (a/(a3 + b3 )1/3 , b/(a3 + b3 )1/3 ) ∈ locmax). 4
Рис. 1. Пример 1.5
ПРИМЕР 1.4. Решить экстремальную задачу

x21 + x22 + x23 → inf; 3) Если λ0 = 0, то из условия стационарности получим λ1 = 0, λ2 = 0.


Тогда все множители Лагранжа — нули. Это противоречит условиям
2x1 − x2 + x3 6 5, теоремы 1.19. Пусть λ0 = 1/2. Если λ1 6= 0, то из условия дополня-
x1 + x2 + x3 = 3. ющей нежёсткости следует, что 2x1 − x2 + x3 − 5 = 0. Выразим x1 ,
x2 , x3 через λ1 , λ2 и подставим в уравнения
Решение.
x1 + x2 + x3 = 3,
1) Составим функцию Лагранжа
2x1 − x2 + x3 = 5.
L = λ0 (x21 + x22 + x23 ) + λ1 (2x1 − x2 + x3 − 5) + λ2 (x1 + x2 + x3 − 3). Получим λ1 = −9/14 < 0. А это противоречит условию неотрица-
тельности. Пусть λ1 = 0, тогда x1 = x2 = x3 = 1 — критическая
2) Запишем необходимые условия: точка.
а) стационарности 4) Функция f (x) = x21 +x22 +x23 → ∞ при kxk → ∞. Согласно следствию
из теоремы Вейерштрасса решение задачи существует. Поскольку
L0x1 = 0 ⇐⇒ 2λ0 x1 + 2λ1 + λ2 = 0, критическая точка единственная, то решением задачи может быть
L0x2 = 0 ⇐⇒ 2λ0 x2 + λ2 − λ1 = 0, только она.
L0x3 = 0 ⇐⇒ 2λ0 x3 + λ2 + λ1 = 0; b = (1, 1, 1) ∈ absmin, Smin = 3. 4
Ответ: x
ПРИМЕР 1.5. Пример нерегулярной задачи. Рассмотрим экстремаль-
б) дополняющей нежёсткости
ную задачу
λ1 (2x1 − x2 + x3 − 5) = 0; f (x1 , x2 ) = x1 → min, g1 (x1 , x2 ) = −x31 + x2 6 0,
в) неотрицательности λ0 > 0, λ1 > 0. g2 (x1 , x2 ) = −x31 − x2 6 0, g3 (x1 , x2 ) = x21 + x22 − 1 6 0.
28 Глава 1 4. Задачи на условный экстремум. Метод Лагранжа 29

На рисунке изображены допустимое множество задачи и линии уровня ПРИМЕР 1.6. Решить экстремальную задачу
целевой функции. Решением задачи является точка xb = (0, 0). Активны-
ми в этой точке являются первое и второе ограничения. При этом f (x1 , x2 ) = x2 → min,
g1 (x1 , x2 ) = x21 + x22 − 1 6 0,
f 0 (b
x) = f 0 (0, 0) = (1, 0),
g2 (x1 , x2 ) = −x1 + x22 6 0,
g10 (b
x) = g10 (0, 0) = (0, 1),
g3 (x1 , x2 ) = x1 + x2 > 0.
g20 (b
x) = g20 (0, 0) = (0, −1).
Решение. Запишем регулярную функцию Лагранжа:
Вектор f 0 (b
x) = f 0 (0, 0) = (1, 0) нельзя представить в виде линейной
комбинации векторов g10 (b x) = g10 (0, 0) = (0, 1), g20 (b
x) = g20 (0, 0) = (0, −1). L(x, λ) = x2 + λ1 (x21 + x22 − 1) + λ2 (−x1 + x22 ) + λ3 (−x1 − x2 ).
Соотношение
Необходимые условия экстремума (стационарности, дополняющей не-
λ0 f 0 (b
x) + λ1 g10 (b
x) + λ2 g20 (b
x) + λ3 g30 (b
x) = 0 жёсткости, неотрицательности) дают следующую систему соотношений
для определения стационарных точек:
в точке x
b = (0, 0) может выполняться лишь при
2λ1 x1 − λ2 − λ3 = 0, 1 + 2λ1 x2 + 2λ2 x2 − λ3 = 0,
λ0 = 0, λ1 = λ, λ2 = −λ, λ3 = 0. λ1 > 0, x21 + x22 − 1 6 0, λ1 (x21 + x22 − 1) = 0,
Градиенты g10 (b
x) = g10 (0, 0) = (0, 1), g20 (b
x) = g20 (0, 0) = (0, −1) в данном λ2 > 0, −x1 + x22 6 0, λ2 (−x1 + x22 ) = 0,
случае линейно зависимы. λ3 > 0, x1 + x2 > 0, λ3 (x1 + x2 ) = 0.
Ответ: x b = (0, 0) ∈ absmin, Smin = 0. 4 √ √
Точка x = ( 2/2, − 2/2) является решением системы. В этой точке
первое и третье соотношения активные: x21 + x22 − 1 = 0, x1 + x2 = 0,
x2 + а второе — пассивное: −x1 + x22 < 0. Поэтому здесь λ2 = 0. В результате
1 - получим такую систему для определения λ1 и λ3 :
g3(x)=0
+ g2(x)=0
- √ √
2λ1 − λ3 = 0, 1 − 2λ1 − λ3 = 0, λ1 > 0, λ3 > 0.

Эта √система
√ имеет решение λ1 = 2/4, λ3 = 1/2. Точка x =
X
= ( 2/2, − 2/2) есть решение задачи. Убедитесь в том, что других
0 1 x1
стационарных точек√ и, следовательно,
√ решений задачи√ нет.
f(x)= 2/2 Ответ: xb = ( 2/2, − 2/2) ∈ absmin, Smin = − 2/2. 4
+ x*=( 2/2- 2/2)
-
- ПРИМЕР 1.7. Пусть числа a > 0, b > 0, причем a < b. Найти точку
g1(x)=0
+ локального минимума и максимума функции

f (x) = 1 ax21 + 1 bx22


Рис. 2. Пример 1.6
2 2
на множестве решений системы

x31 + x32 6 1, x21 + x22 > 1.


30 Глава 1 4. Задачи на условный экстремум. Метод Лагранжа 31

Обозначим это множество через X. Выпишем функцию Лагранжа Теперь проведем исследование стационарных точек на оптималь-
  ность. Функция f сильно выпукла на R2 . Поэтому она достигает гло-
 
L(x, λ0 , λ) = λ0 1 ax21 + 1 bx22 + λ1 x31 + x32 − 1 + λ2 −x21 − x22 + 1 . бального минимума на любом замкнутом множестве X. Вычислим зна-
2 2 чения f в стационарных точках задачи минимизации:
Система для определения стационарных точек имеет вид: f (0, 1) = f (0, −1) = b/2, f (1, 0) = f (−1, 0) = a/2.
aλ0 x1 + 3λ1 x21 − 2λ2 x1 = 0;
Поскольку a < b, то отсюда следует, что (1, 0) и (−1, 0) — точки
bλ0 x2 + 3λ1 x22 − 2λ2 x2 = 0; глобального минимума функции f на X.
 Представим f в виде
λ1 > 0, x31 + x32 6 1, λ1 x31 + x32 − 1 = 0,

λ2 > 0, x21 + x22 > 1, λ2 x21 + x22 − 1 = 0, 
f (x) = 1 a x21 + x22 + 1 (b − a)x22 .
(λ0 , λ1 , λ2 ) 6= 0. 2 2

Пусть x1 = 0. Тогда из системы следует, что x2 6 1, x22 > 1. Отсюда Если будем двигаться из точек (0, 1) и (0, −1), оставаясь на окружно-
или x2 = 1, или x2 6 −1. В противном случае λ1 = 0. Если при этом сти x21 + x22 = 1, а значит, и в X, то значение f будет уменьшаться.
x2 < −1, то λ2 = 0. Но тогда λ1 = 0, что противоречит условиям задачи. Следовательно, эти точки не являются точками локального минимума
Теперь легко находим первые две группы решений системы: f на X. В то же время при любом ε > 0 точка (-ε,1) лежит в X и
1) x1 = 0, x2 = 1, bλ0 + 3λ1 − 2λ2 = 0, λ1 > 0, λ2 > 0, (λ1 , λ2 ) 6= 0; f (0, 1) < f (−ε, 1). Поэтому точка (0, 1) не является точкой локального
2) x1 = 0, x2 = −1, bλ0 − 2λ2 = 0, λ1 = 0, λ2 > 0. максимума f на X. Итак, стационарные точки (0, 1) и (0, −1) оказались
Аналогично, полагая x2 = 0, находим еще две группы решений «посторонними».
системы: Рассмотрим теперь матрицу вторых производных функции Лагран-
3) x1 = 1, x2 = 0, aλ0 + 3λ1 − 2λ2 = 0, λ1 > 0, λ2 > 0, (λ1 , λ2 ) 6= 0; жа:  
aλ0 + 6λ1 x1 − λ2 0
4) x1 = −1, x2 = 0, aλ0 − 2λ2 = 0, λ1 = 0, λ2 > 0. L00xx = .
0 bλ0 + 6λ1 x1 − λ2
Допустим теперь, что x1 6= 0, x2 6= 0. Тогда уравнения системы
можно записать в виде При значениях из 5) эта матрица выглядит таким образом:
aλ0 + 3λ1 x1 − 2λ2 = 0, bλ0 + 3λ1 x2 − 2λ2 = 0.  
−aλ0 0
L00xx = .
Если здесь λ1 = 0, то λ0 = 0, поскольку a 6= b. Но тогда λ2 = 0, 0 −bλ0
что противоречит системе условий. Остается предположить, что λ 1 > 0.
Тогда x31 + x32 = 1. Учитывая, что λ1 6= 0, λ2 6= 0, получаем x21 + x22 > 1, Поскольку λ0 < 0, то эта функция положительно определена. √ 3 По-
и поэтому λ2 =√0. Теперь получаем этому выполняются достаточные условия экстремума и (a/ 3a + b3 ,
√ еще одну группу решений √ системы √ 3 3
b/ 3a + b ) — точка
5) x1 = a/ 3 a3 + b3 , x2 = b/ 3 a3 + b3 , λ0 < 0, λ1 = −λ0 3 a3 + b3 /3, √ строгого локального
√ максимума f на X.
λ2 = 0. b = (a/ 3 a3 + b3 , b/ 3 a3 + b3 ) ∈ absmin . 4
Ответ: x
Заметим, что в 1) и 3) множитель λ0 может принимать как положи-
тельные, так и отрицательные значения, в 2) и 4) — только положитель-
ные, а у 5) — отрицательные. Поэтому (0, 1) и (1, 0) — стационарные
точки как в задаче минимизации, так и в задаче максимизации, (0, −1)
и (−1, 0) — только в задаче минимизации, а точка из 5) — только в за-
даче максимизации.
1. Линейные нормированные и банаховы пространства 33

2) пространство C(K, Rn ) непрерывных вектор-функций x(·) : K → Rn ,


которые определены на компакте K с нормой

ГЛАВА 2 kx(·)k0 = kx(·)kC = max kx(t)k;


t∈K

Элементы анализа 3) пространство C k ([t0 , t1 ], Rn ) k раз непрерывно дифференцируемых


вектор-функций x(·) : [t0 , t1 ] → Rn , определённых на отрезке [t0 , t1 ]
с нормой

1. Линейные нормированные и банаховы пространства kx(·)kk = max{kx(·)k0 , kx0 (·)k0 , . . . , kx(k) (·)k0 };

Линейное пространство X называется нормированным, если на X 4) пространство l2 последовательностей


определён функционал k · k : X → R, который называется нормой и удо-
влетворяет аксиомам: x = (x1 , x2 , . . .),

X
1) kxk > 0 для всех x ∈ X и kxk = 0 ⇐⇒ x = 0; x2k < ∞,
k=1
2) kαxk = |α|kxk для всех α ∈ R, x ∈ X;
с нормой
3) kx1 + x2 k 6 kx1 k + kx2 k для всех x1 , x2 ∈ X. X 1

2
Чтобы подчеркнуть, что норма определена в пространстве X, будем kxk = x2k .
писать k · kX . k=1
Нормированное пространство X является метрическим простран-
ством с метрикой ρ(x1 , x2 ) = kx1 − x2 k. Полное (относительно указан- Пусть X, Y — линейные нормированные пространства. Их декар-
ной метрики) линейное нормированное пространство называется бана- тово произведение X × Y (множество всех пар (x, y), x ∈ X, y ∈ Y )
ховым. Множество X ∗ всех линейных непрерывных функционалов на X будет нормированным пространством, если определить норму элемен-
(сопряженное к X пространство) является банаховым пространством та (x, y) ∈ X × Y по формуле
с нормой
k(x, y)kX×Y = max{kxkX , kykY }.
kx∗ kX ∗ = sup hx∗ , xi,
kxkX 61
Декартово произведение банаховых пространств будет банаховым про-
где hx∗ , xi — результат действия на x функционала x∗ . странством.
Мы будем изучать экстремальные задачи в таких банаховых про-
странствах: Лемма 2.1. Каждый линейный непрерывный функционал Λ ∈
∈ (X × Y )∗ можно однозначно представить в виде
1) пространство Rn векторов x = (x1 , . . . , xn ) с нормой
hΛ, (x, y)i = hx∗ , xi + hy ∗ , yi,
X
n 1
2
2 где x∗ ∈ X ∗ , y ∗ ∈ Y ∗ .
kxk = |xk | ;
k=1
34 Глава 2 3. Теоремы о разделении 35

2. Теорема Хана–Банаха и её следствия Следствие 2.1. Пусть X — нормированное пространство и x0 ∈ X,


x0 6= 0. Тогда существует линейный функционал Λ ∈ X ∗ такой, что
В теории экстремальных задач важную роль играют теоремы о раз- kΛk = 1, hΛ, x0 i = kx0 k.
делении и другие результаты выпуклого анализа. Большинство из них
является следствием теоремы Хана–Банаха, которую часто называют Следствие 2.2. Если нормированное пространство X нетриви-
первым основным принципом линейного анализа. ально (X 6= {0}), то и сопряженное пространство X ∗ нетривиально.
Пусть X — линейное пространство, R — расширенная числовая
прямая: R = R ∪ {+∞} ∪ {−∞}. 3. Теоремы о разделении
Определение 2.1. Функция p : X → R называется выпуклой и од-
нородной, если: Пусть X — линейное топологическое пространство, X ∗ — сопряженное
к X пространство. Функционал x∗ ∈ X ∗ разделяет множества A ⊂ X
1) p(x + y) 6 p(x) + p(y) для всех x, y ∈ X;
и B ⊂ X, если
2) p(αx) = αp(x) для всех x ∈ X, α > 0. sup hx∗ , xi 6 inf hx∗ , xi,
x∈A x∈B

Пусть A — выпуклое множество линейного пространства X, содержащее и строго разделяет A и B, если


0. Функция Минковского µA(·) множества A определяется равенством
sup hx∗ , xi < inf hx∗ , xi.
x∈A x∈B
µA(x) = inf{t > 0 : x/t ∈ A}.

(Если таких t нет, то µA(x) = +∞.) Первое неравенство означает, что гиперплоскость H(x∗ , c) = {x :
hx∗ , xi = c}, где
Лемма 2.2. Функция Минковского неотрицательна, выпукла sup hx∗ , xi 6 c 6 inf hx∗ , xi,
x∈B
и однородна, кроме того {x : µA(x) < 1} ⊆ A ⊆ {x : µA(x) 6 1}. x∈A

Если X — линейное топологическое пространство [КФ, с. 180], то разделяет множества A и B. Множество A лежит в полупространстве
функция µA(·) непрерывна в точке 0 тогда и только тогда, когда 0 ∈ int A. H+ (x∗ , c) = {x : hx∗ , xi 6 c}, а множество B — в полупространстве
H− (x∗ , c) = {x : hx∗ , xi > c}. Второе неравенство означает, что мож-
Лемма 2.3. Для того чтобы линейный функционал x∗ на линей- но выбрать такое c, чтобы A и B принадлежали полупространствам
ном топологическом пространстве X был непрерывным, необходимо и не имели общих точек с гиперплоскостью H(x∗ , c).
и достаточно, чтобы для некоторой выпуклой однородной непрерыв-
ной в точке 0 функции p(·) для всех x ∈ X выполнялось неравенство Теорема 2.2 (Первая теорема о разделении). [АТФ, с. 124.] Если
hx∗ , xi 6 p(x). множества A ⊂ X, B ⊂ X выпуклые, непустые и не пересекаются
и множество A открыто, то существует ненулевой линейный непре-
Теорема 2.1 (Теорема Хана–Банаха). [КФ, с. 145.] Пусть рывный функционал, который разделяет A и B.
p : X → R — выпуклая однородная функция на линейном простран-
стве X и l : L → R — линейный функционал на подпространстве L ДОКАЗАТЕЛЬСТВО.
пространства X такой, что hl, xi 6 p(x) для всех x ∈ L. Тогда су- Поскольку A, B непустые, то существуют точки a0 ∈ A, b0 ∈ B.
ществует определённый на всём пространстве X линейный функци- Множество C = (A−a0 )−(B −b0 ) = {x : x = a−a0 −b+b0 , a ∈ A, b ∈ B}
онал Λ, который является продолжением l, то есть hΛ, xi = hl, xi, выпукло, содержит 0 и открыто. Действительно, если xb=b a − a0 − bb +
x ∈ L, и удовлетворяет неравенству + b0 и b
a ∈ A, то существует окрестность U точки b a ∈ U ⊂ A. Тогда
a: b
b ∈ U − a0 − bb + b0 ⊂ C. Кроме того, c = b0 − a0 ∈
x / C. Если это не
hΛ, xi 6 p(x) для всех x ∈ X.
36 Глава 2 3. Теоремы о разделении 37

так, то существуют b a ∈ A, bb ∈ B такие, что b0 − a0 = b


a − a0 + b0 − bb, b∈
в X, x / A. Тогда существует ненулевой линейный непрерывный функ-
тогда ba = bb ∈ A ∩ B. Но множества A, B не пересекаются. ционал который строго разделяет A и x b.
Обозначим через p(x) функцию Минковского множества C. Такая ДОКАЗАТЕЛЬСТВО.
функция неотрицательна, выпукла и непрерывна в точке 0. Кроме того, Поскольку xb ∈/ A и A — замкнутое множество, то существу-
p(x) 6 1 для всех x ∈ C. На подпространстве L = {x : x = αc = ет окрестность Ox точки xb такая, что A ∩ Ox = ∅. Пространство X


= α(b0 − a0 ), α ∈ R} определим линейный функционал l по формуле локально-выпуклое, поэтому существует выпуклая окрестность B ⊂ O x


hl, αci = αp(c). Если α > 0, то hl, αci = αp(c) = p(αc), а когда α < 0, точки x
b. Поскольку B ∩ A = ∅, то по первой теореме о разделении
то hl, αci = αp(c) 6 0 6 p(αc), поскольку p(·) неотрицательна. Следо- существует ненулевой функционал x∗ , который разделяет A и B:
вательно, для всех x ∈ L выполняется неравенство hl, xi 6 p(x), и по
теореме Хана–Банаха l можно продолжить до линейного функционала sup hx∗ , xi 6 inf hx∗ , xi.
Λ на X такого, что hΛ, αci = hl, αci = αp(c), α ∈ R; hΛ, xi 6 p(x), x∈A x∈B
x ∈ X. Функция p(·) непрерывна в точке 0, и поэтому функционал Λ
непрерывный. Для любых a ∈ A, b ∈ B выполняется неравенство Но inf hx∗ , xi < hx∗ , x
bi, поскольку нижняя грань ненулевого линейного
x∈B
функционала x∗ не может достигаться во внутренней точке x
b множе-
hΛ, a − bi = hΛ, a − a0 − b + b0 i + hΛ, a0 − b0 i 6 ства B.
6 p(a − a0 − b + b0 ) + hl, a0 − b0 i 6
6 1 − p(b0 − a0 ), Определение 2.2. Аннулятором A⊥ множества A линейного про-
странства X называется множество линейных функционалов l на X та-
поскольку a − a0 − b + b0 ∈ C, а на C функция p(x) 6 1. Но при 0 < t 6 1 ких, что hl, xi = 0, x ∈ A.
точка (b0 − a0 )/t = c/t не может принадлежать множеству C из-за того, Заметим, что A⊥ всегда содержит 0 ∈ X ∗ .
что множество C выпукло и содержит 0, а на отрезке [0, c/t] лежит точка
/ C. Поэтому
c = b0 − a0 ∈ Лемма 2.4 (Лемма о нетривиальности аннулятора). [КФ, с. 194.]
Пусть L — замкнутое подпространство локально-выпуклого топо-
p(b0 − a0 ) = inf{t : t > 0, (b0 − a0 )/t ∈ C} > 1. логического пространства X, причём L 6= X. Тогда аннулятор L⊥
содержит ненулевой элемент x∗ ∈ X ∗ .
Следовательно,
hΛ, a − bi 6 1 − p(b0 − a0 ) 6 0 ДОКАЗАТЕЛЬСТВО.
Пусть x
b ∈/ L. Согласно второй теореме о разделении существует
для любых a ∈ A, b ∈ B. В неравенствах hΛ, ai 6 hΛ, bi элементы a ∈ A, ненулевой функционал x∗ ∈ X ∗ который строго разделяет x
b и L:
b ∈ B можно выбирать независимо, поэтому
suphx∗ , xi < hx∗ , x
bi.
sup hΛ, ai 6 inf hΛ, bi. x∈L
a∈A b∈B
Покажем, что hx∗ , xi = 0 для всех x ∈ L. Пусть это не так. Тогда
Кроме того, существует x0 ∈ L такое, что hx∗ , x0 i 6= 0, но αx0 ∈ L для любого α ∈ R
hΛ, b0 − a0 i = p(b0 − a0 ) > 1, и
поэтому Λ 6= 0. Следовательно, Λ разделяет A и B. suphx∗ , xi > sup hx∗ , αx0 i = +∞.
x∈L α∈R

Теорема 2.3 (Вторая теорема о разделении). [АТФ, с. 126.] А это противоречит тому, что x∗ разделяет x
b и L. Следовательно,
Пусть X — локально-выпуклое линейное топологическое простран- x∗ ∈ L ⊥ .
ство [КФ, с. 183.], A — непустое замкнутое выпуклое множество
38 Глава 2

4. Теорема Банаха об обратном операторе


Теорема 2.4 (Теорема Банаха об обратном операторе). [КФ,
с. 241.] Пусть X, Y — банаховы пространства, Λ — непрерывный ГЛАВА 3
линейный оператор из X в Y. Если Λ — мономорфизм, то есть
Ker Λ = {x : Λx = 0} = {0}, и эпиморфизм, то есть Im Λ = {y : y = Основы дифференциального
= Λx, x ∈ X} = Y, то Λ — изоморфизм между X и Y, то есть суще-
ствует линейный непрерывный оператор M = Λ−1 : Y → X такой, исчисления в нормированных
что M Λ = IX , ΛM = IY .
Лемма 2.5 (Лемма о правом обратном отображении). [АТФ,
пространствах
с. 128.] Пусть X, Y — банаховы пространства, Λ — линейный непре-
рывный оператор из X в Y и Λ — эпиформизм. Тогда существует
отображение M : Y → X (может быть разрывным и нелинейным)
такое, что Λ ◦ M = IY , kM (y)k 6 Ckyk для некоторого C > 0. 1. Производные по направлению, первая вариация,
Лемма 2.6 (Лемма о замкнутости образов). [АТФ, с. 129.] Пусть производные Гато, Фреше, строгая
X, Y, Z — банаховы пространства, A : X → Y, B : X → Z — линей- дифференцируемость
ные непрерывные операторы, C : X → Y ×Z — линейный непрерывный
оператор, который определяется равенством Cx = (Ax, Bx). Если Пусть X, Y — линейные нормированные пространства, U — окрест-
подпространство Im A замкнуто в Y , а подпространство B Ker A ность точки x в X, F — отображение U → Y.
замкнуто в Z, то подпространство Im C замкнуто в Y × Z. Определение 3.1. Предел
Лемма 2.7 (Лемма об аннуляторе ядра регулярного оператора).
F (x + λh) − F (x)
[АТФ, с. 130.] Пусть X, Y — банаховы пространства, A : X → Y — lim = F 0 (x, h) (3.1)
линейный непрерывный эпиморфизм. Тогда (KerA)⊥ = Im A∗ . λ↓0 λ

Оператор называется регулярным, если он линейный непрерывный (если он существует) называется производной отображения F в точке x
эпиморфизм. по направлению h.
Определение 3.2. Отображение h → δF (x, h) называется первой
вариацией Лагранжа отображения F в точке x, если для любого h ∈ X
существует предел

F (x + λh) − F (x)
lim = δF (x, h). (3.2)
λ→0 λ

Определение 3.3. Если отображение F имеет в точке x пер-


вую вариацию Лагранжа и существует линейный непрерывный опера-
тор Λ ∈ (X, Y ) такой, что δF (x, h) = Λh, то оператор Λ называет-

ся производной Гато (слабой производной) отображения F в точке x
и обозначается FΓ0 (x).
40 Глава 3 1. Производные Гато, Фреше, строгая дифференцируемость 41

Определение 3.4. Отображение F называется дифференцируемым Теорема 3.1. Если отображение F сильно дифференцируемо в
по Фреше в точке x (пишут F ∈ D(x)), если в окрестности точки x точке x, то F непрерывно в этой точке. Если отображение F строго
можно записать соотношение дифференцируемо в точке x, то F непрерывно в окрестности точ-
ки x.
F (x + h) = F (x) + Λh + α(h)khk, (3.3)
Теорема 3.2. Между определениями 3.1–3.5 действуют такие
где Λ ∈ (X, Y ) и соотношения: 3.5 ⇒ 3.4 ⇒ 3.3 ⇒ 3.2 ⇒ 3.1. Ни одно из этих соотно-


lim kα(h)k = 0. (3.4) шений не может быть обращено.


khk→0
ДОКАЗАТЕЛЬСТВО.
Оператор Λ называется производной Фреше (сильной производной) Справедливость указанных соотношений вытекает из определений.
отображения F в точке x и обозначается F 0 (x). Приведем несколько примеров, иллюстрирующих взаимосвязь определе-
ний.
Соотношения (3.3), (3.4) можно записать в виде 1. Пусть f1 : R → R,
(  
F (x + h) = F (x) + Λh + o(khk). (3.5) 1 , x 6= 0;
x sin x
f1 (x) =
Итак, отображение F имеет производную Фреше в точке x, если суще- 0, x = 0.
ствует линейный непрерывный оператор Λ ∈ (X, Y ) такой, что для лю-

Функция непрерывна в точке x = 0, но не имеет производной ни по
бого ε > 0 существует δ > 0, при котором для всех h таких, что khk < δ, какому направлению.
выполняется неравенство 2. Пусть f2 : R → R, f1 (x) = |x|. Эта функция имеет производные по
направлениям в точке x = 0, но производные слева и справа не совпада-
kF (x + h) − F (x) − Λhk 6 εkhk. (3.6)
ют. Поэтому первая вариация в точке x = 0 не существует. Функция f 2
Определение 3.5. Отображение F называется строго дифферен- непрерывна, но не дифференцируема.
цируемым в точке x (пишут F ∈ SD(x)), если существует линейный 3. Пусть функция f3 : R2 → R определяется в полярных коорди-
непрерывный оператор Λ ∈ (X, Y ) такой, что для любого ε > 0 суще- натах по формуле f3 (x) = r cos(3ϕ), x = (x1 , x2 ) = (r cos(ϕ), r sin(ϕ)).


ствует δ > 0, при котором для всех x1 , x2 : kx1 − xk < δ, kx2 − xk < δ Такая функция в точке (0, 0) имеет первую вариацию Лагранжа, но не
выполняется неравенство дифференцируема по Гато, поскольку первая вариация нелинейна.
4. Пусть f4 : R2 → R,
(
kF (x1 ) − F (x2 ) − Λ(x1 − x2 )k 6 εkx1 − x2 k. (3.7)
1, x21 = x2 > 0;
f4 (x1 , x2 ) =
Оператор Λ называется строгой производной отображения F в точке x. 0 в других точках.
Если в (3.7) положим x1 = x + h, x2 = x, то получим (3.6). Поэтому Эта функция дифференцируема по Гато в точке (0, 0), но имеет разрыв
строго дифференцируемая функция дифференцируема по Фреше и Λ = в этой точке и не дифференцируема по Фреше.
= F 0 (x). 5. Пусть f5 : R → R,
Производная F 0 (x) (Гато, Фреше или строгая) по определению (
есть линейный непрерывный оператор, действующий из пространства X x2 , x — рациональное,
f5 (x) =
в пространство Y. Результат действия этого оператора на элемент h ∈ X 0, x — иррациональное.
называется дифференциалом (Гато, Фреше или строгим) отображе-
ния F в точке x и обозначается F 0 (x)[h]. В точке x = 0 такая функция дифференцируема по Фреше, но не явля-
ется строго дифференцируемой.
42 Глава 3 1. Производные Гато, Фреше, строгая дифференцируемость 43

Теорема 3.3. Пусть X, Y, Z — линейные нормированные про- где


странства, U — окрестность точки x в пространстве X. Если отоб- lim kα(v)k = 0.
kvk→0
ражения Fi : U → Y , i = 1, 2, и отображение A : U → (Y, Z) диф-


ференцируемы в соответствии с одним из определений 1–5 (одним и Вычислим
тем же для всех трех отображений), то для любых a, b ∈ R отобра- F (x + λh) − F (x)
жения F = aF1 + bF2 , Φ = AFi , i = 1, 2, соответственно, дифферен- lim
λ↓0 λ
цируемы в точке x и
Ψ(Φ(x + λh)) − Ψ(Φ(x))
= lim
F 0 (x) = aF10 (x) + bF20 (x) λ↓0 λ
 0
Ψ (y)[Φ(x + λh) − Φ(x)]
или = lim
λ↓0 λ
F 0 (x, h) = aF10 (x, h) + bF20 (x, h) 
α(Φ(x + λh) − Φ(x))kΦ(x + λh)) − Φ(x)k
и +
λ
Φ0 (x, h) = A0 (x, h)Fi (x) + A(x)Fi0 (x, h).  
Φ(x + λh) − Φ(x)
=Ψ0 (y) lim
Теорема 3.4 (Теорема о суперпозиции). Пусть X, Y, Z — ли- λ↓0 λ

нейные нормированные пространства, U — окрестность точки x Φ(x + λh) − Φ(x)
в пространстве X, V — окрестность точки y в пространстве Y, + lim α(Φ(x + λh) − Φ(x)) lim
λ↓0


λ↓0 λ
отображения Φ : U → V, Φ(x) = y; Ψ : V → Z, Ψ(y) = z; F =
= Ψ ◦ Φ : U → Z, F (x) = Ψ(Φ(x)) — суперпозиция отображений Φ =Ψ0 (y)[Φ0 (x, h)] + lim α(Φ(x + λh) − Φ(x))kΦ0 (x, h)k
λ↓0
и Ψ. Если отображение Ψ в точке y = Φ(x) дифференцируемо по 0 0
=Ψ (y)[Φ (x, h)].
Фреше и отображение Φ в точке x дифференцируемо по Фреше (диф-
ференцируемо по Гато, имеет первую вариацию, производную по на- Итак, F 0 (x, h) = Ψ0 (y)[Φ0 (x, h)].
правлению h), то F в точке x дифференцируемо по Фреше (дифферен- Покажем, что теорема о суперпозиции неверна, если отображение Ψ
цируемо по Гато, имеет первую вариацию, производную по направле- дифференцируемо лишь по Гато.
нию h). Производная F 0 (x) = Ψ0 (y)◦Φ0 (x) или F 0 (x, h) = Ψ0 (y)[Φ0 (x, h)].
Если отображение Ψ строго дифференцируемо в точке y, а отобра- ПРИМЕР 3.1. Пусть X = Y = R2 , Z = R,
жение Φ строго дифференцируемо в точке x, то и отображение F ϕ(x) = (ϕ1 (x1 , x2 ), ϕ2 (x1 , x2 )) = (x21 , x2 ),
строго дифференцируемо в точке x. (
1, y22 = y1 , y2 > 0,
ДОКАЗАТЕЛЬСТВО. ψ(y) = ψ(y1 , y2 ) =
Пусть Φ имеет производную по направлению. По определению, су- 0 в других точках.
ществует предел Отображение ϕ дифференцируемо по Фреше в точке (0, 0), а отображе-
Φ(x + λh) − Φ(x) ние ψ дифференцируемо по Гато в точке (0, 0). Тем не менее функция
lim = Φ0 (x, h). (
λ↓0 λ 1, x2 = |x1 |, x2 > 0,
2
f (x) = (ψ ◦ ϕ)(x) = ψ(x1 , x2 ) =
В соответствии с определением производной Фреше 0 в других точках

Ψ(y + v) = Ψ(y) + Ψ0 (y)v + α(v)kvk, не дифференцируема по Гато в точке (0, 0) и даже не имеет производных
по направлениям h1 = (1, 1), h2 = (−1, 1). 4
44 Глава 3 1. Производные Гато, Фреше, строгая дифференцируемость 45

Хорошо известно, что для числовых функций одной переменной функция дифференцируема в каждой точке t ∈ [0, 1]. Действительно, в
справедлива теорема Лагранжа, которую еще называют теоремой о сред- выражении
нем значении.  
f (t + ∆t) − f (t) ∗ F (a + t(b − a) + ∆t(b − a)) − F (a + t(b − a))
Теорема 3.5 (Теорема Лагранжа). Если функция f : [a, b] → R = y ,
непрерывна на отрезке [a, b] и дифференцируема на интервале (a, b), ∆t ∆t
то существует точка c ∈ (a, b) такая, что f (b) − f (a) = f 0 (c)(b − a). можно перейти к пределу при ∆t → 0 под знаком линейного непрерыв-
Эту формулу называют формулой конечных приращений. Она будет ного функционала y ∗ и получить
верна и для числовых функций f (x), аргументы которых принадлежат
топологическому векторному пространству. Если функция f (x) диффе- f 0 (t) = hy ∗ , F 0 (a + t(b − a))[b − a]i.
ренцируема по Гато, отрезок [a, b] и интервал (a, b) определены форму-
лами [a, b] = {x : x = a + t(b − a), 0 6 t 6 1}, (a, b) = {x : x = a + t(b − a), Применим к функции f (t) на отрезке [0, 1] формулу конечных прираще-
0 < t < 1}, то функция Φ(t) = f (a+t(b−a)), t ∈ R, удовлетворяет услови- ний. По теореме Лагранжа существует такое θ ∈ (0, 1), что f (1) − f (0) =
ям теоремы Лагранжа на отрезке [0, 1]. Формула конечных приращений = f 0 (θ) или
для функции Φ(t) на отрезке [0, 1] определяет соответствующую форму-
лу для функции f (x) на отрезке [a, b]. Для векторнозначных функций hy ∗ , F (b) − F (a)i = hy ∗ , F 0 (a + θ(b − a))[b − a]i.
формула конечных приращений неверна.
В соответствии со следствием 2.1 из теоремы Хана–Банаха для любого
ПРИМЕР 3.2. Пусть отображение f : R → R2 определяется равен- элемента y ∈ Y существует линейный непрерывный функционал y ∗ ∈ Y ∗
ством f (t) = (sin(t), − cos(t)). Тогда для любого t существует произ- такой, что ky ∗ k = 1 и hy ∗ , yi = kyk. Выберем такой функционал y ∗ для
водная Фреше и f 0 (t)[h] = (h cos(t), h sin(t)). В то же время для любого элемента y = F (b) − F (a). Тогда
c ∈ [0, 2π] имеем 0 = f (2π)−f (0) 6= f 0 (c)[2π−0] = (2π cos(c), 2π sin(c)). 4
Можно, однако, заметить, что сама формула конечных приращений kF (b) − F (a)k = hy ∗ , F (b) − F (a)i
используется в анализе не так часто, как оценка = hy ∗ , F 0 (a + θ(b − a))[b − a]i
|f (b) − f (a)| 6 M |b − a|, M = sup |f 0 (c)|, 6 ky ∗ k kF 0 (a + θ(b − a))[b − a]k
c∈[a,b] 6 sup kF 0 (c)k kb − ak.
c∈[a,b]
которая является следствием формулы конечных приращений. Та-
кую оценку можно установить для произвольных нормированных про-
странств.
Теорема 3.6 (Теорема Лагранжа). Пусть X, Y — линейные нор- Следствие 3.1. Пусть выполняются все условия теоремы Ла-
мированные пространства и открытое множество U ⊂ X содержит гранжа. Тогда для любого линейного непрерывного оператора Λ ∈
∈ (X, Y ) выполняется неравенство


отрезок [a, b]. Если отображение F : U → Y дифференцируемо по Га-
то в каждой точке x ∈ [a, b], то
kF (b) − F (a) − Λ(b − a)k 6 sup kF 0 (c) − Λk kb − ak.
0 c∈[a,b]
kF (b) − F (a)k 6 sup kF (c)k kb − ak.
c∈[a,b]

ДОКАЗАТЕЛЬСТВО.
ДОКАЗАТЕЛЬСТВО. Чтобы убедиться в справедливости неравенства, достаточно приме-
Возьмем произвольный функционал y ∗ ∈ Y ∗ и рассмотрим числовую нить теорему о среднем к отображению G(x) = F (x) − Λx.
функцию f (t) = hy ∗ , F (a + t(b − a))i, определенную на отрезке [0, 1]. Эта
46 Глава 3 2. Частные производные. Теорема о полном дифференциале 47

Следствие 3.2. Пусть X, Y — линейные нормированные про- функционал, а производная F 0 (x) — линейный непрерывный функционал
странства, U — окрестность точки x b ∈ X, отображение F : U → Y на X. Итак, F 0 (x) ∈ X ∗ при любом x ∈ X.
дифференцируемо по Гато в каждой точке x ∈ U. Если отображе-
ПРИМЕР 3.3. Пусть X — действительное гильбертово пространство.
ние x → FΓ0 (x) непрерывно в равномерной операторной топологии
Рассмотрим функционал F (x) = kxk2 . Для такого функционала
пространства (X, Y ) в точке x b, то отображение F строго диф-


ференцируемо в точке xb (следовательно, дифференцируемо по Фреше F (x + h) − F (x) = kx + hk2 − kxk2 = (2x, h) + khk2 .
в этой точке).
Величина (2x, h) есть главная линейная (по h) часть приращения функ-
ДОКАЗАТЕЛЬСТВО. ционала F (x) = kxk2 в точке x. Поэтому F 0 (x) = 2x, dF (x, h) =
Вследствие непрерывности FΓ0 (x) в точке x b для заданного ε суще- = F 0 (x)h = (2x, h). 4
ствует такое δ, что kFΓ0 (x) − FΓ0 (b
x)k < ε для всех x ∈ U , которые удо-
влетворяют неравенству kx − x bk < δ. Если kx1 − x bk < δ и kx2 − x
bk < δ, Если пространство X = R, то отображение F : R → Y называется
то для любого x ∈ [x1 , x2 ], x = x1 + t(x2 − x1 ), 0 6 t 6 1, справедливо абстрактной функцией. Производная F 0 (x) абстрактной функции —
неравенство это элемент пространства Y — касательный вектор к кривой F (x).
bk = kx1 + t(x2 − x1 ) − x
kx − x bk < δ. Производные Гато и Фреше абстрактных функций совпадают.
Поэтому kFΓ0 (x) − FΓ0 (b
x)k < ε для всех x ∈ [x1 , x2 ]. Применим теперь
следствие 3.1 при Λ = FΓ0 (b
x). Получим 2. Частные производные. Теорема о полном
дифференциале
kF (x1 ) − F (x2 ) − FΓ0 (b
x)(x1 − x2 )k
Пусть X, Y , Z— линейные нормированные пространства, U —
< sup kFΓ0 (x) − FΓ0 (b
x)k kx1 − x2 k < ε kx1 − x2 k.
x∈[x1 ,x2 ] окрестность точки (bx, yb) в X × Y , отображение F : U → Z и отобра-
жение x → F (x, yb) дифференцируемы в точке x b (по Гато, Фреше или
Это означает строгую дифференцируемость F в точке x
b. строго).
Пусть X, Y — линейные нормированные пространства, F : U → Определение 3.6. Частной производной по x отображения F
Y — отображение, определенное на некотором открытом множестве U ⊂ в точке (b x, yb) или ∂F
x, yb) (обозначается Fx (b x, yb)) называется произ-
∂x (b
X. Отображение F принадлежит классу C 1 (U ), если в каждой точке водная отображения x → F (x, yb) в точке x b.
x ∈ U оно имеет производную и отображение x → F 0 (x) непрерывно
Аналогично определяется производная по y
(в равномерной операторной топологии).
ЗАМЕЧАНИЕ 2. Следствие 3.2 показывает, что в пространстве C 1 (U ) все ∂F
x, yb) =
Fy (b x, yb).
(b
производные совпадают. Этим пользуются при проверке дифференцируемости ∂y
конкретных функционалов. Сначала доказывают, что существует производная
Гато. Потом показывают, что она непрерывна. А это гарантирует строгую диф- Теорема 3.7 (Теорема о полном дифференциале). Пусть X,
ференцируемость и существование производной Фреше. Y , Z — линейные нормированные пространства, U — окрестность
точки (b x, yb) в X × Y , отображение F : U → Z имеет в любой точ-
Определение производной и дифференциала были даны относитель- ке (x, y) ∈ U частные производные Fx (x, y), Fy (x, y) по Гато. Если
но отображения F , которое действует из одного линейного нормирован- отображения (x, y) → Fx (x, y), (x, y) → Fy (x, y) непрерывны в точ-
ного пространства X в другое линейное нормированное пространство Y. x, yb) ∈ U в равномерной операторной топологии, то F строго
ке (b
Производная F 0 (x) такого отображение при любом x — это линейный дифференцируемо в этой точке и
непрерывный оператор из пространства X в пространство Y , то есть
F 0 (x) ∈ (X, Y ). Если Y = R — числовая прямая, то F : X → R — это F 0 (b


x, yb)[u, v] = Fx (b
x, yb)u + Fy (b
x, yb)v.
48 Глава 3 3. Производные и дифференциалы высших порядков 49

ДОКАЗАТЕЛЬСТВО. в Y . Пространство (X, Y ) — нормированное. Поэтому F 0 отобража-


Вследствие непрерывности отображений Fx (x, y), Fy (x, y) в точ- ет линейное нормированное пространство X в линейное нормирован-
ке (b
x, yb) для любого ε > 0 можно подобрать такое δ > 0, что окрест- ное пространство (X, Y ). Если это отображение дифференцируемо,


ность V = B(b x, δ) × B(b bk < δ, ky − ybk < δ} точ-
y , δ) = {(x, y) : kx − x то его производная называется второй производной отображения F
ки (b
x, yb) помещается в U и для каждой точки (x, y) ∈ V выполняются и обозначается F 00 (x). Вторая производная F 00 (x) есть элемент про-
неравенства странства (X, (X, Y )) линейных непрерывных операторов из про-


странства X в пространство (X, Y ). Элементы такого пространства


x, yb)k < ε,
kFx (x, y) − Fx (b x, yb)k < ε.
kFy (x, y) − Fy (b допускают более естественную и удобную интерпретацию, такую как
билинейные отображения.
Пусть Мы говорим, что задано билинейное отображение пространства X
в пространство Y , если каждой упорядоченной паре элементов (x 1 , x2 )
x, yb)[x1 − x2 ] − Fy (b
∆ = F (x1 , y1 ) − F (x2 , y2 ) − Fx (b x, yb)[y1 − y2 ] из пространства X отвечает элемент y = B(x1 , x2 ) пространства Y так,
x, yb)[x1 − x2 ]
= F (x1 , y1 ) − F (x2 , y1 ) − Fx (b что выполняются условия:
x, yb)[y1 − y2 ].
+ F (x2 , y1 ) − F (x2 , y2 ) − Fy (b 1) для любых x1 , x2 , x3 , x4 из пространства X и любых чисел a, b
выполняются равенства
Если точки (x1 , y1 ), (x2 , y2 ) лежат в V , то и точка (x2 , y1 ) лежит в V
и отрезки [(x1 , y1 ), (x2 , y1 )], [(x2 , y1 ), (x2 , y2 )] лежат в V. Поэтому отоб- B(ax1 + bx3 , x2 ) = aB(x1 , x2 ) + bB(x3 , x2 ),
ражения x → F (x, y1 ), y → F (x2 , y) дифференцируемы по Гато. Первое B(x1 , ax2 + bx4 ) = aB(x1 , x2 ) + bB(x1 , x4 );
из них имеет производную Fx на [x1 , x2 ], а второе — производную Fy
на [y1 , y2 ]. Из следствия 3.2 из теоремы о среднем вытекает, что 2) существует число M > 0 такое, что при всех x1 , x2 ∈ X
k∆k 6 sup x, yb)k kx1 − x2 k
kFx (x, y1 ) − Fx (b kB(x1 , x2 )k 6 M kx1 k kx2 k.
x∈[x1 ,x2 ]

+ sup x, yb)k ky1 − y2 k


kFy (x2 , y) − Fy (b Первое из условий означает, что отображение B линейно по каж-
y∈[y1 ,y2 ] дому из двух своих аргументов. Второе условие равносильно непрерыв-
6 εkx1 − x2 k + εky1 − y2 k ности B по совокупности аргументов. Наименьшее из чисел M в нера-
венстве называется нормой билинейного отображения B и обознача-
для любых (x1 , y1 ) ∈ V , (x2 , y2 ) ∈ V. А это означает, что отображение F ется kBk. Линейные операции над билинейными отображениями опре-
строго дифференцируемо. деляются обычным образом и имеют обычные свойства. Билинейные
отображения пространства X в пространство Y сами образуют линей-
Следствие 3.3. Для того чтобы F ∈ C 1 (U ), необходимо и доста- ное нормированное пространство, которое обозначается B(X 2 , Y ). Если
точно, чтобы в U частные производные Fx , Fy были непрерывными. пространство Y полное, то и пространство B(X 2 , Y ) полное.
Каждому элементу A из пространства (X, (X, Y )) отвечает эле-


мент B из пространства B(X 2 , Y ) по правилу B(x1 , x2 ) = (Ax1 )(x2 ). Это
3. Производные и дифференциалы высших порядков соответствие изометрично и отображает пространство (X, (X, Y ))


на все пространство B(X 2 , Y ). Действительно, если y = B(x1 , x2 ) =
Пусть X, Y — линейные нормированные пространства, F — диф- = (Ax1 )(x2 ), то
ференцируемое по Фреше отображение из пространства X в простран-
ство Y . По определению, производная F 0 (x) для каждого x является эле- kyk 6 kAx1 k kx2 k 6 kAk kx1 k kx2 k.
ментом пространства (X, Y ) линейных непрерывных операторов из X


Отсюда kBk 6 kAk.


50 Глава 3 4. Интегрирование 51

С другой стороны, если заданное билинейное отображение B, то определив производную n-го порядка как производную от производ-
при фиксированном x1 ∈ X отображение x2 → B(x1 , x2 ) = (Ax1 )(x2 ) ной (n−1)-го порядка. Производная n-го порядка есть элемент простран-
есть линейное отображение пространства X в пространство Y. Таким ства (X, (X, . . . , (X, Y )) . . .). Каждому элементу этого простран-


образом, любому x1 ∈ X отвечает элемент Ax1 пространства (X, Y ). ства отвечает элемент пространства N (X n , Y ) n-линейных отображений


Итак, билинейное отображение B определяет элемент A простран- пространства X в пространство Y. Под n-линейным отображением по-
ства (X, (X, Y )) и нимают отображение упорядоченной системы элементов x1 , x2 , . . . , xn


пространства X в пространство Y , которое линейно по каждому x k ,


kAx1 k = sup k(Ax1 )(x2 )k = sup kB(x1 , x2 )k 6 kBk · kx1 k. k = 1, n, и удовлетворяет неравенству kN (x1 , . . . , xn )k 6 M kx1 k . . . kxn k.
kx2 k61 kx2 k61
Итак, n-ю производную отображения F можно считать элементом про-
странства N (X n , Y ).
Отсюда kAk 6 kBk. Итак, kAk = kBk.
Дифференциал отображения F — это результат действия линейно-
Таким образом, соответствие между B(X 2 , Y ) и (X, (X, Y )),


го оператора F 0 (x) на элемент h пространства X : dF (x, h) = F 0 (x)[h].
которое определяется равенством B(x1 , x2 ) = (Ax1 )(x2 ), линейное и изо-
Дифференциал второго порядка d2 F (x, h) = F 00 (x)[h, h] есть квадрати-
метричное, а потому взаимно однозначное. Вторая производная F 00 (x)
ческое выражение, которое отвечает отображению F 00 (x) ∈ B(X 2 , Y ).
есть элемент пространства (X, (X, Y )). В соответствии со сказан-


Аналогично, дифференциалом n-го порядка называется


ным можно считать F 00 (x) элементом пространства B(X 2 , Y ).
ПРИМЕР 3.4. Пусть X = Rn , Y = R. Линейное отображение из dn F (x, h) = F (n) (x)(h1 , . . . , hn ),
R в R можно задавать n-мерным вектором. Производная Фреше F 0 (x)
n

отображения F : Rn → R — это вектор частных производных в точке x: то есть тот элемент пространства Y , в который элемент (h1 , . . . , hn ) ∈ X n
  переводится n-линейным отображением F (n) (x).
∂F ∂F
F 0 (x) = ,··· , .
∂x1 ∂xn 4. Интегрирование
2
Вторая производная F 00 (x) определяется величинами akj = ∂x∂k ∂x
F
. Мат-
 k=1,n
j
Пусть F — абстрактная функция действительного аргумента t со значе-
рицу F 00 (x) = akj j=1,n можно рассматривать как линейное отобра- ниями в банаховом пространстве Y. Если функция F задана на отрез-
жение пространства X в пространство (X, Y ), которое определяется ке [a, b], то можно определить интеграл от функции F на отрезке [a, b].


формулой Этот интеграл понимают как предел (по норме пространства Y ) инте-
Xn гральных сумм
bk = akj xj , k = 1, n, n−1
X
j=1 F (ξk )(tk+1 − tk ),
k=0
или как определяемое формулой
отвечающим разбиениям a = t0 < t1 < · · · < tn = b, ξk ∈ [tk , tk+1 ]
n X
X n
(1) (2) интервала [a, b] при условии, что max(tk+1 − tk ) → 0. Интеграл есть
y= akj xk xj ; x(1) , x(2) ∈ X, k
k=1 j=1
элемент пространства Y и обозначается символом

билинейное отображение пространства X в Y. 4 Zb


F (t) dt.
По индукции можно ввести понятие третьей, четвертой и, вооб-
ще, n-й производной отображения F , которое действует из X в Y , a
52 Глава 3 4. Интегрирование 53

Соображения, аналогичные тем, которые приводятся для действитель- Здесь F (a + t(b − a))(b − a) при любом t ∈ [0, 1] есть элемент про-
ных функций действительной переменной, показывают, что интеграл от странства Y , который является образом элемента (b − a) при отобра-
непрерывной на отрезке функции существует. Он имеет свойства, ана- жении F (a + t(b − a)). Интеграл, стоящий в правой части формулы,
логичные свойствам обычного интеграла Римана. Например, существует и является элементом пространства Y.
Применим определенный таким образом интеграл к задаче восста-
1) пусть F (t) — абстрактная функция, A — фиксированное линейное новления отображения по его производной. Пусть отображение F дей-
непрерывное отображение пространства Y в пространство Z, тогда ствует из пространства X в пространство Y и имеет на отрезке [a, b]
сильную производную F 0 (x), которая непрерывно зависит от x. Тогда
Zb Zb
Rb
AF (t) dt = A F (t) dt; существует интеграл F 0 (x) dx.
a
a a Докажем для отображений формулу Ньютона–Лейбница

2) пусть F (t) имеет вид f (t)y0 , где f (t) — числовая функция, а y0 — Zb


фиксированный элемент пространства Y , тогда F 0 (x) dx = F (b) − F (a).
a
Zb Zb
F (t) dt = y0 f (t) dt; По определению,
a a
Zb n−1
X
Rb Rb F 0 (x) dx = lim F 0 (a + tk (b − a))(tk+1 − tk )(b − a)
3) F (t) dt 6 kF (t)k dt. a
δ→0
k=0
a a
n−1
X
Пусть X, Y — линейные нормированные пространства, а BC(X, Y ) = lim F 0 (xk )∆xk ,
δ→0
— линейное пространство всех непрерывных ограниченных (линейных k=0
и нелинейных) отображений пространства X в пространство Y. В про-
странстве BC(X, Y ) можно ввести топологию, порожденную окрестно- где
стями нуля
xk = a + tk (b − a),
Uk,ε = {F : sup kF (x)k < ε}.
kxk6k ∆xk = (tk+1 − tk )(b − a),
На подпространстве (X, Y ) ⊂ BC(X, Y ) всех линейных непрерыв- δ = max (tk+1 − tk ).


06k6n−1
ных отображений X в Y эта топология совпадает с обычной топологией
в (X, Y ), которая задается операторной нормой. Пусть [a, b] — отре- Вместе с тем, при таком разбиении отрезка [a, b]


зок в пространстве X, F (x) — отображение этого отрезка в простран-


ство BC(X, Y ), непрерывно зависящее от аргумента x. Тогда можно n−1
X  
определить интеграл от F (x) по отрезку [a, b] по формуле F (b) − F (a) = F (a + tk+1 (b − a)) − F (a + tk (b − a))
k=0
Zb Z1 n−1
X  
F (x) dx = F (a + t(b − a))(b − a) dt. = F (xk+1 ) − F (xk ) .
k=0
a 0
54 Глава 3 5. Формула Тейлора 55

Пользуясь формулой конечных приращений, получим для отображения F 0 (x) справедливо равенство
n−1 1 000
X  F 0 (x + h) = F 0 (x) + F 00 (x)h + F (x)[h, h] + · · ·
F (xk+1 ) − F (xk ) − F (xk )∆xk
0 2!

k=0 1
+ F (n) (x)[h, . . . , h] + ω1 (x, h),
n−1
X (n − 1)!

6 kb − ak (tk+1 − tk ) sup F 0 (xk + θ∆xk ) − F 0 (xk ) . kω1 (x, h)k = o(khkn−1 ).
k=0 06θ61
Интегрируя обе части последнего равенства на отрезке [x, x + h] и поль-
Поскольку производная F 0 (x) непрерывна, а потому и равномерно непре- зуясь формулой Ньютона–Лейбница, получим
рывна на отрезке [a, b], правая часть неравенства стремится к нулю
при δ → 0. Итак, формула Ньютона–Лейбница доказана. Z1
F (x + h) − F (x) = F 0 (x + th)h dt
5. Формула Тейлора 0
Z1 
Сильная дифференцируемость отображения F означает, что раз- t2 000
= F 0 (x) + tF 00 (x)h + F (x)[h, h] + · · ·
ность F (x + h) − F (x) можно представить в виде суммы линейного 2!
0
слагаемого и слагаемого, которое имеет высший от первого порядок от- 
носительно нормы приращения аргумента khk. Более общей является tn−1 (n)
+ F (x)[h, . . . , h] h dt + Rn ,
формула Тейлора для отображений, аналогичная формуле Тейлора для (n − 1)!
числовых функций.
где
Теорема 3.8 (Формула Тейлора). Пусть отображение F дей- Z1
ствует из пространства X в пространство Y, определено в неко- Rn = ω1 (x, th)h dt.
торой области U ⊂ X и имеет производную порядка n, которая 0
равномерно непрерывна в области U. Тогда справедлива формула
Это соотношение можно представить в виде
1
F (x + h) = F (x) + F 0 (x)h + F 00 (x)[h, h] + · · · + 1 00
2! F (x + h) − F (x) = F 0 (x)h + F (x)[h, h] + · · ·
2!
1 (n) 1 (n)
+ F (x)[h, . . . , h] + ω(x, h), + F (x)[h, . . . , h] + Rn ,
n! n!
где kω(x, h)k = o(khkn ). где
Z1
ДОКАЗАТЕЛЬСТВО.
Указанное равенство докажем по индукции. При n = 1 равенство — kRn k 6 kω1 (x, th)k khk dt = o(khkn ).
это определение производной. Возьмем произвольное фиксированное n и 0
предположим, что равенство уже доказано для всех отображений, удо- Тем самым доказана формула Тейлора для отображений.
влетворяющих условиям теоремы, в которых n заменено на n − 1. Тогда
56 Глава 3 6. Теорема о неявной функции. Теорема Люстерника 57

6. Теорема о неявной функции. Теорема Люстерника при kx1 k < ε, kx2 k < ε. Этого можно достичь, поскольку F ∈ SD(b x).
Константа C в неравенстве (3.8) определена в соответствии с леммой
Теорема 3.9 (Теорема о неявной функции). [АТФ, с. 161.] Пусть о правом обратном операторе M к оператору F 0 (0). Пусть x ∈ V =
X — топологическое пространство, Y , Z — банаховы пространства, = B(0, δ), где δ выбрано настолько малым, что kxk + CkF (x)k < ε/2 при
W — окрестность точки (x0 , y0 ) в X × Y , отображение Ψ действует kxk < δ. Построим последовательность ξn , n > 0, по правилу
из W в Z : Ψ(x0 , y0 ) = z0 . Пусть:
ξ0 = x, ξn+1 = ξn − M (F (ξn )), n > 0. (3.9)
1) отображение x → Ψ(x, y0 ) непрерывно в точке x0 ;
2. Докажем по индукции, что kξn k < ε, n > 0. Очевидно, что kξ0 k =
2) существует линейный непрерывный оператор Λ : Y → Z такой, = kxk < ε/2. При n = 1 из (3.9) и леммы о правом обратном операторе
что для любого ε > 0 можно указать число δ > 0 и окрестность вытекает такая оценка:
Ox0 точки x0 , для которых при условиях ky1 −y0 k < δ, ky2 −y0 k < δ
∀x ∈ Ox0 выполняется неравенство kξ1 − xk = kM F (x)k 6 CkF (x)k. (3.10)

kΨ(x, y1 ) − Ψ(x, y2 ) − Λ(y1 − y2 )k 6 εky1 − y2 k; Отсюда kξ1 k < ε. Пусть kξi k < ε при i = 0, 1, . . . , k. Докажем,
что kξk+1 k < ε. Для i = 0, 1, . . . , k из (3.9) получим такое соотноше-
3) ΛY = Z. ние:
F 0 (0)(ξi+1 − ξi ) + F (ξi ) = 0. (3.11)
Тогда существуют число K > 0, окрестность U точки (x0 , z0 ) в X ×Z
Поэтому
и отображение Φ : U → Y такие, что:
a) Ψ(x, Φ(x, z)) = z; kξi+1 − ξi k 6 CkF (ξi )k

b) kΦ(x, z) − y0 k 6 KkΨ(x, y0 ) − zk. = CkF (ξi ) − F (ξi−1 ) − F 0 (0)(ξi − ξi−1 )k 6 1 kξi − ξi−1 k. (3.12)
2

Теорема 3.10 (Теорема Люстерника). [АТФ, с. 173.] Пусть X, Из (3.10), (3.12) получим
Y — банаховы пространства, U — окрестность точки x b ∈ X, отоб-
ражение F : U → Y. Если F ∈ SD(b x) и F 0 (b
x) — эпиморфизм, то kξi+1 − ξi k 6 2−i kξ1 − xk < ε · 2−1−i (3.13)
существуют окрестность V ⊂ U точки xb, число K > 0 и отображе- для i = 1, 2, . . . , k. Из неравенства треугольника вытекает, что
ние Φ : V → X такие, что
kξk+1 k = kξk+1 − ξk + ξk − ξk−1 + · · · + ξ2 − ξ1 + ξ1 k
F (b
x + Φ(x)) = F (b
x), kΦ(x)k 6 KkF (x) − F (b
x)k.
6 kξk+1 − ξk k + kξk − ξk−1 k + · · · + kξ2 − ξ1 k + kξ1 k
 ε
ДОКАЗАТЕЛЬСТВО. < ε 2−2 + 2−3 + · · · + 2−k−1 + < ε.
2
Доказательство теоремы базируется на модифицированном методе
Ньютона. Итак, kξk+1 k < ε и, в соответствии с принципом математической индук-
1. Будем считать, что x
b = 0 и F (b
x) = 0. Выберем ε > 0 настолько ции kξn k < ε, для всех n.
малым, что окрестность B(0, ε) = {x : kxk < ε} ⊂ U и выполняется 3. Из неравенств (3.12), (3.13) получим
неравенство 
kξn+m − ξn k 6 kξn+1 − ξn k 1 + 2−1 + · · · + 2−m−1
1
kF (x1 ) − F (x2 ) − F 0 (0)(x1 − x2 )k 6 kx1 − x2 k (3.8) 6 2kξn+1 − ξn k 6 21/(n−1) kξ1 − xk → 0, n → ∞.
2C
58 Глава 3 7. Теорема Рисса. Формула Дирихле 59

Итак, ξn , n > 0, — фундаментальная последовательность в банаховом 2) Пусть X = R2 , M = {(x, y) | x > 0, y > 0} = R+ 2 . Тогда
пространстве X. Она имеет предел. Обозначим Φ(x) = lim ξn . Посколь-
n→∞
ку T1,0 M = {(a, 0) | a ∈ R}, T0,0 M = {0},
+
 T0,1 M = {(0, b) | b ∈ R}, T0,0 M = M,
kξn − xk 6 kξ1 − xk 1 + 2−1 + 2−2 + · · · + 2−n+1 6 2kξ1 − xk, +
T1,0 M = {(a, b) | a ∈ R, b > 0}.
то, переходя к пределу, получаем
ЗАМЕЧАНИЕ 3. В геометрии касательной прямой, плоскостью и т. п. назы-
kΦ(x) − xk 6 2kξ1 − xk 6 2CkF (x)k 6 KkF (x)k, вают не Tx M , а Tx M + x.





kΦ(x)k 6 kxk + 2kξ1 − xk < ε. Во многих случаях множество касательных векторов можно опре-
делить, воспользовавшись таким следствием из теоремы Люстерника.
Итак, F непрерывна в точке Ψ(x). Поэтому, в соответствии с (3.11),
Теорема 3.11 (Теорема о касательном пространстве). [АТФ,
F (Φ(x)) = lim F (ξn ) = − lim F 0 (0)(ξn+1 − ξn ) = 0. с. 173.] Пусть X, Y — банаховы пространства, U — окрестность
n→∞ n→∞
точки x b ∈ X, отображение F : U → Y. Если F ∈ SD(b x), F 0 (b
x) —
Теорема доказана. x)}, то Tx M = Ker F 0 (b
эпиморфизм и M = {x ∈ X | F (x) = F (b x).


Пусть X — нормированное пространство, M — подмножество X. ДОКАЗАТЕЛЬСТВО.
Определение 3.7. Элемент h называется односторонним каса- Пусть h ∈ Tx M , r(·) — отображение из определения касательного


тельным вектором к множеству M в точке x b ∈ M , если существуют вектора. Поскольку F ∈ SD(b x), то при малых α
число ε > 0 и отображение r : [0, ε] → X такие, что:
F (b
x) = F (b x) + αF 0 (b
x + αh + r(α)) = F (b x)[h] + o(α).
b + th + r(t) ∈ M для всех t ∈ [0, ε],
1) x
Поэтому αF 0 (b
x)[h] + o(α) = 0. Итак, F 0 (b
x)[h] = 0, а это означает,
2) kr(t)k = o(t) при t → +0. что Tx M ⊂ Ker F 0 (b
x).


Докажем теперь противоположное включение: Ker F 0 (b x) ⊂ Tx M.


Определение 3.8. Вектор h называется касательным к множе- Пусть h ∈ Ker F 0 (b
x), возьмем r(α) = Φ(b
x + αh), где Φ — отображение,
ству M в точке x
b, если h и −h — односторонние касательные векторы построенное в соответствии с теоремой Люстерника. Тогда
к M в точке x
b.
F (b
x + αh + r(α)) = F (b
x),
Множество всех касательных векторов к M в точке x b обознача-
kr(α)k = kΦ(b
x + αh)k 6 KkF (b x + αh) − F (b
x)k = o(α).
ют Tx M. Множество односторонних касательных векторов к M в точке x
b


обозначают Tx+ M. Множества Tx M и Tx+ M — это конусы. Если множе- Итак, h ∈ Tx M . Теорема доказана.




ство Tx M — это подпространство в X, то оно называется касательным


пространством к M в точке x
b. Приведем примеры таких множеств.
1) Пусть X = R2 , M = {(x, y) | x > 0}. Тогда
7. Теорема Рисса. Формула Дирихле

Tx+ M = M, T0,0 M = {(0, b) | b ∈ R}, Определение 3.9. Функция ограниченной вариации v(·) : [a, b] → R
называется канонической, если она непрерывна справа и v(a) = 0.


+
T1,0 M = T1,0 M = R2 .
60 Глава 3 8. Задачи 61

Теорема 3.12 (Теорема Ф. Рисса). [КФ, с. 388.] Для каждого если принять во внимание, что x(·) — это вектор-столбец, а v(·) —
линейного непрерывного функционала x∗ ∈ C ∗ [a, b] существует кано- вектор-строка.
ническая функция ограниченной вариации v(·) : [a, b] → R такая, что Каждая функция ограниченной вариации v(·) : [a, b] → R опреде-
для всех x(·) ∈ C[a, b] ляет обобщенную меру, интеграл в (3.14) есть интеграл по этой мере.
Аналогично векторнозначная функция ограниченной вариации опреде-
Zb ляет на [a, b] меру с векторными значениями, интегралом по которой яв-

hx , xi = x(t) dv(t). (3.14) ляется интеграл (3.16). Меру, которая отвечает v(t), обозначают dv(t).
a Если v1 (·), v2 (·) — две функции ограниченной вариации на [a, b], то на
квадрате [a, b] × [a, b] определено произведение мер dv1 (·) × dv2 (·) и спра-
Это соответствие однозначное: если для всех x(·) ∈ [a, b] и канониче- ведлива теорема Фуббини. Справедлива также формула для перестанов-
ской v(·) ки пределов интегрирования, которая называется формулой Дирихле:
Zb
x(t) dv(t) = 0, Zb Zt  Zb Zb 
f (t, s) dv1 (s) dv2 (t) = f (t, s) dv2 (t) dv1 (s). (3.17)
a
a a a s
то v(t) ≡ 0. Заметим, что интеграл в (3.14) — это интеграл Стилтьеса.
Теорему можно доказать и для векторных функций. Если e1 , e2 , . . . Для векторных функций формула (3.17) имеет вид
. . . , en — единичные векторы стандартного базиса в Rn , то функ-
цию x(·) = (x1 (·), . . . , xn (·)) ∈ C([a, b], Rn ) можно записать в виде Zb Zt  Zb Zb 
n
X dv2 (t) f (t, s) dv1 (s) = dv2 (s)f (t, s) dv1 (s). (3.18)
x(·) = xk (·)ek . a a a s
k=1

Если x∗ ∈ C ∗ ([a, b], Rn ), то


n
X n
X 8. Задачи
hx∗ , x(·)i = hx∗ , xk (·)ek i = hx∗k , xk (·)i,
k=1 k=1
Исследовать отображения на дифференцируемость по Фреше. Вычис-
где x∗k ∈ C ∗ [a, b], hx∗k , y(·)i = hx∗ , y(·)ek i. Применяя к x∗k теорему Рисса, лить производные и дифференциалы.
получим 3.1 f : Rn → Rm , f (x) = Ax, A — матрица размерности m × n.
X n Zb 3.2 f : X → Y , f (x) = Ax, X, Y — нормированные пространства,

hx , x(·)i = xk (t) dvk (t). (3.15) A ∈ (X, Y ).


k=1 a 3.3 f : R2 → R2( , f (x1 , x2 ) = (x1 · x2 , x21 + x22 ), x
b = (1, 2).
x31 x2
Набор функций ограниченной вариации v(·) = (v1 (·), . . . , vn (·)) на- 2 (x1 , x2 ) 6= (0, 0)
зывают векторнозначной функцией ограниченной вариации v(·) : [a, b] → 3.4 f (x1 , x2 ) = x1 +x2 ,
0, (x1 , x2 ) = (0, 0).
→ Rn . Формулу (3.15) можно записать в виде Pn
n
3.5 f : R → R, f (x) = x2k .
Zb k=1

hx , x(·)i = dv(t)x(t), (3.16) 3.6 f : H → R, f (x) = ha, xi, a ∈ H,
H — гильбертово пространство.
a
62 Глава 3 8. Задачи 63

3.7 f : H → R, f (x) = ehx,xi. p Rb p


3.29 f : C 1 [a, b] → R, f (x(·)) = 2 + t2 − sin(x0 (t)) dt.
3.8 f : H → R, f (x) = kxk = hx, xi. a
3.9 f : H → R, f (x) = hAx, xi, A — самосопряженный линейный Rb  t 
непрерывный оператор. 3.30 f : C 1 [a, b] → R, f (x(·)) = e x(t) + 3(x0 (t))4 dt + 2(x0 (a))2 .
x
3.10 f : H \ {0} → H, f (x) = kxk . a

R1 Rb  2 2 0

3.11 f : L2 [0, 1] → R, f (x(·)) = y(t)x(t) dt, y(·) ∈ L2 [0, 1]. 3.31 f : C 1 [a, b] → R, f (x(·)) = t x (t) + ex (t) dt.
0 a
R1 3.32 f : C 1 [a, b] → R, f (x(·)) = sin(x0 (a)) + cos(x(b)).
3.12 f : C[0, 1] → R, f (x(·)) = x3 (t) dt. !
0
1
Rb 2 0

1 2 3.33 f : C [a, b] → R, f (x(·)) = t x(t) + 2x (t) dt ×
R a
3.13 f : C[0, 1] → R, f (x(·)) = x(t) dt . !
0 Rb 2
1 3 0
(1 + x (t)) dt .
R a
3.14 f : L2 [0, 1] → R, f (x(·)) = x2 (t) dt . ! !
0
Rb Rb 
3.15 f: C[0, 1] → R, f (x(·)) = x(0). 3.34 f : C 1 [a, b] → R, f (x(·)) = x(t)dt / 1 + (x0 (t)) 2
dt .
3.16 f: C[0, 1] → R, f (x(·)) = x2 (1). a a

3.17 f: C[0, 1] → R, f (x(·)) = x(0)x(1). 3.35 f : C 1 [a, b] × C 1 [a, b] → R, f (x(·)) = f (x1 (·), x2 (·)) =
3.18 f: C[0, 1] → R, f (x(·)) = |x(0)|. Rb  
3.19 f: C[0, 1] → R, f (x(·)) = ex(0) . = (x1 (t))2 + (x02 (t))3 dt.
3.20 f: C[0, 1] → R, f (x(·)) = sin(x(1)). a
R1 3.36 f : C 1 [a, b] × C 1 [a, b] → R, f (x(·)) = f (x1 (·), x2 (·)) =
3.21 b(t) = at2 + bt + c,
f : C[0, 1] → R, f (x(·)) = |x(t)| dt, x Rb h x0 (t) i
0 = e 1 − t2 x1 (t)x02 (t) dt.
a, b, c ∈ R, f 0 (b
x(·)) =? a
3.22 f : C[0, 1] → C[0, 1], f (x(·)) = cos(x(·)).
p 3.37 f : C 1 [a, b] × C 1 [a, b] → R, f (x(·)) = f (x1 (·), x2 (·)) =
3.23 f : C 1 [0, 1] → C[0, 1], f (x(·)) = 1 + (x0 )2 (·). Rb  2 
3.24 f : C[0, 1] → C[0, 1], f (x(t)) = ϕ(t, x(t)), ϕ(·) ∈ C 1 (R2 ). = sin (x1 (t)) + tx2 (t) + x01 (t)(x2 (t))2 dt.
a
R1
3.25 f : C[0, 1] → R, f (x(·)) = ϕ(x(t)) dt, ϕ(·) ∈ C 1 (R1 ). Rb
0 3.38 f : C 2 [a, b] → R, f (x(·)) = L(t, x(t), x0 (t), x00 (t))dt,
1 2 a
3.26 f : C[t0 , t1 ] → R, f (x(·)) = ϕ(x(t0 ), x(t1 )), ϕ(·) ∈ C (R ). L(t, x, y, z) ∈ C 1 ([a, b] × R3 ).
Rt1 RR  0 2 
3.27 f : C 1 [t0 , t1 ] → R, f (x(·)) = L(t, x(t), x0 (t)) dt, 3.39 f : C 1 (D) → R, f (x(·, ·)) = (xt1 ) + (x0t2 )2 dt1 dt2 .
t0 D
1 3 1
RR p
L(·) ∈ C (R ). 3.40 f : C (D) → R, f (x(·, ·)) = 1 + (x0t1 )2 + (x0t2 )2 dt1 dt2 .
D
Rb 
3.28 f : C 1 [a, b] → R, f (x(·)) = x3 (t) + t(x0 (t))2 dt.
a
1. Условия существования экстремума 65

ДОКАЗАТЕЛЬСТВО.
Докажем утверждение о полунепрерывности снизу. Пусть функ-
ция f (x) полунепрерывна снизу. Тогда для всех a < f (b
x) существует
ГЛАВА 4 такая окрестность Ox точки x
b, что для всех x ∈ Ox выполняется нера-


венство a < f (x). Поэтому
Необходимые и достаточные условия
a 6 inf f (x) 6 sup( inf f (x)).
экстремума функционалов x∈Ox Ox x∈Ox



Итак, для всех a таких, что a < f (b
x), выполняется неравенство

1. Условия существования экстремума a 6 lim f (x).


x→x


Пусть X — топологическое пространство, f : X → R — числовая Поэтому
функция (функционал). f (b
x) 6 lim f (x).
x→x


Определение 4.1. Функция f : X → R называется полунепрерыв-
ной снизу (полунепрерывной сверху) в точке x b ∈ X, если для любо- Учитывая, что всегда lim f (x) 6 f (b
x), получим
го ε > 0 существует такая окрестность Ox точки x
b, что для всех x ∈ Ox x→x





выполняется неравенство
x) = lim f (x).
f (b
x→x


f (x) > f (b
x) − ε (f (x) < f (b
x) + ε).
Если
Определение 4.2 (Эквивалентное). Функция f называется по- x) = sup( inf f (x)),
f (b
лунепрерывной снизу (полунепрерывной сверху) в точке x b, если для Ox x∈Ox



каждого a < f (b x)), a ∈ R, существует такая окрестность O x
x) (a > f (b


то для всех a, a < f (b
x), существует такая окрестность O x , что a <


точки x
b, что для всех x ∈ Ox выполняется неравенство


x). Итак, для всех x ∈ Ox справедливо неравен-


< inf f (x) 6 f (b


x∈Ox


f (x) > a (f (x) < a). ство f (x) > a. А это означает, что f (x) полунепрерывна снизу в точке
b.
x
Определение 4.3. Функция f называется полунепрерывной, если
она полунепрерывна в каждой точке пространства X. Теорема 4.2. Полунепрерывная снизу (сверху) функция f : X → R
Теорема 4.1. Функция f полунепрерывна снизу (сверху) в точке x
b на компактном множестве A ⊂ X ограничена снизу (сверху) и до-
тогда и только тогда, когда стигает своей нижней (верхней) грани.

x) = lim f (x) (f (b
f (b x) = lim f (x)), ДОКАЗАТЕЛЬСТВО.
x→x Пусть функция f полунепрерывна снизу и inf f (x) = −∞. Тогда


x→x


x∈A
где существует такая последовательность {xn } ∈ A, что f (xn ) < −n. По-
скольку множество A компактно, то бесконечное множество {x n } имеет
lim f (x) = sup( inf f (x)), lim f (x) = inf ( sup f (x)),
Ox x∈Ox x→x Ox x∈Ox предельную точку x b. Функция f полунепрерывна снизу в точке x b, по-


x→x





этому существует окрестность Ox точки x b такая, что для всех x ∈ Ox


b.
Ox пробегают все окрестности точки x x)−1. Тогда окрестность Ox может иметь лишь конечное число
f (x) > f (b



66 Глава 4 2. Необходимые и достаточные условия экстремума 67

точек из множества {xn }, а это противоречит тому, что x b — предель- b, удовлетворяющие уравнение F 0 (x) = 0,
Определение 4.4. Точки x
ная точка множества {xn }. Итак, функция f имеет конечную нижнюю называются стационарными точками задачи на экстремум F (x) →
грань. Пусть inf f (x) = S. Тогда существует последовательность yn ∈ A → extr.
x∈A
такая, что f (yn ) 6 S + n1 . Множество {yn } компактно, поэтому имеет Теорема 4.4 (Необходимые условия второго порядка). Пусть
предельную точку y0 . Если f (y0 ) > S, то, в силу полунепрерывности F — действительный функционал на банаховом пространстве X,
снизу, существует δ > 0 и окрестность Oy0 такие, что для всех x ∈ Oy0 который имеет вторую вариацию Лагранжа в точке x b ∈ X. Если
f (x) > S + δ. Но такая окрестность не может содержать бесконечное b локальный минимум (максимум),
функционал F достигает в точке x
количество точек множества {yn }. Поэтому f (y0 ) = S. Итак, y0 ∈ A — то выполняются условия:
точка минимума функции f. 1) δF (b
x, h) = 0 для всех h ∈ X,
Следствие 4.1. Пусть функция f полунепрерывна снизу на то- 2) δ 2 F (b
x, h) > 0 для всех h ∈ X (δ 2 F (b
x, h) 6 0 для всех h ∈ X).
пологическом пространстве X. Если существует такое a, что мно-
жество La f = {x : f (x) 6 a} непустое и компактное, то функция f ДОКАЗАТЕЛЬСТВО.
достигает на X своего минимума. Доказательство теоремы базируется на определениях первой и вто-
рой вариаций Лагранжа функционала F в точке x b и теореме 1.4 для
2. Необходимые и достаточные условия экстремума функции одной действительной переменной ϕ(λ) = F (bx + λh), которая
имеет минимум (максимум) в точке λ = 0.
Пусть X — линейное нормированное пространство, F : X → R — Следствие 4.4. Пусть функционал F имеет в точке xb вторую
действительный функционал на X. b локальный мини-
производную Фреше. Если F достигает в точке x
Теорема 4.3 (Необходимое условие первого порядка). Если мум (максимум), то:
функционал F достигает в точке xb ∈ X локальный минимум (мак- 1) F 0 (b
x) = 0 ⇐⇒ dF (b
x, h) = 0 для всехh ∈ X,
симум) и имеет в этой точке производную по направлению h, то
2) F 00 (bx) > 0 ⇐⇒ d2 F (b
x, h) = F 00 (bx)[h, h] > 0 для всехh ∈ X,
0 0
F (b
x, h) > 0 (F (b
x, h) 6 0). 00
(F (b 2
x) 6 0 ⇐⇒ d F (b 00
x, h) = F (b x)[h, h] 6 0 для всех h ∈ X).

Следствие 4.2. Если функционал F достигает в точке x


b ∈ X ло- ДОКАЗАТЕЛЬСТВО.
кальный минимум и имеет в этой точке первую вариацию Лагранжа, По формуле Тейлора
то
δF (b
x, h) = 0 для всех h ∈ X. F (b
x + h) − F (b x)h + 1 F 00 (b
x) = F 0 (b x)[h, h] + o(khk2 ).
2
Следствие 4.3 (Теорема Ферма). Если функционал F достигает Если в точке x
b функционал F достигает минимум, то, в соответствии
b локальный минимум и имеет в этой точке производную
в точке x со следствием 4.3, F 0 (b
x)h = 0. Остается равенство
Фреше (Гато), то
F 0 (b
x) = 0 (FΓ0 (b
x) = 0) F (b x) = 1 F 00 (b
x + h) − F (b x)[h, h] + o(khk2 ). (4.1)
2
или
x, h) = F 0 (b
dF (b x)h = 0 для всех h ∈ X. Предположим, что существует такой элемент e h пространства X,
x)[e
что F 00 (b h, e
h] < 0. Поскольку F 00 (b
x)[εh, εh] = ε2 F 00 (b
x)[h, h], то в лю-
бой окрестности точки x b существуют элементы h = εe h пространства X,
68 Глава 4 3. Задачи с ограничениями-равенствами 69

удовлетворяющие неравенству F 00 (bx)[h, h] < 0. Но при малых khk знак Теорема 4.5 (Достаточные условия второго порядка). Если
выражения (4.1) определяется знаком главного слагаемого F 00 (b x)[h, h]. функционал F, определенный на банаховом пространстве X, имеет
Поэтому в любой окрестности точки x b существуют элементы h такие, вторую производную Фреше и выполняются условия:
что
1) F 0 (b
x) = 0;
F (b x) = 1 F 00 (b
x + h) − F (b x)[h, h] + o(khk2 ) < 0.
2
2) F 00 (b
x)[h, h] > Ckhk2 для всех h ∈ X
А это противоречит тому, что функционал F достигает в точке x b ло-
(F 00 (b
x)[h, h] 6 −Ckhk2 для всех h ∈ X),
кальный минимум. Поэтому F 00 (b x)[h, h] > 0 для всех h ∈ X.
Необходимые условия первого и второго порядка экстремума функ- b локальный минимум (максимум).
то F достигает в точке x
ционалов аналогичны соответствующим условиям экстремума функций ДОКАЗАТЕЛЬСТВО.
одной и многих переменных. Другое дело — достаточные условия экс- Пусть F 00 (b
x)[h, h] > Ckhk2 . Выберем ε > 0 так, чтобы величи-
тремума. Условие F 00 (b
x)[h, h] > 0, достаточное для минимума функции n на o(khk ) в формуле Тейлора (4.1) удовлетворяла неравенству |o(khk 2 )| 6
2
переменных, не будет достаточным для функционалов, определенных на 6 C4 khk2 при khk < ε. Тогда
банаховых пространствах бесконечной размерности.
C
ПРИМЕР 4.1. Пусть в гильбертовом пространстве `2 определен функ- F (b x) = 1 F 00 (b
x + h) − F (b x)[h, h] + o(khk2 ) > khk2 > 0
ционал F по формуле 2 4

X∞ ∞ при khk < ε. Итак, x


b — точка локального минимума.
x2n X 4
F (x) = − x . В конечномерном пространстве понятия сильной положительной
n3 n=1 n
n=1 определенности квадратичной формы и ее положительной определен-
ности совпадают. В бесконечномерном пространстве (как показывает
В точке xb = 0 первый дифференциал функционала равняется нулю,
пример) сильная положительная определенность — это более строгое
а второй дифференциал
условие.
X∞
h2n
d2 F (0, h) = 2 > 0 для всех h 6= 0.
n=1
n3 3. Задачи с ограничениями-равенствами. Метод
неопределенных множителей Лагранжа
Условие d2 F (0, h) > 0 выполняется для всех h 6= 0. Тем не менее функ-
ционал F в точке x b = 0 минимум не достигает. Чтобы убедиться в этом, Пусть X, Y — линейные нормированные пространства, F — отоб-
рассмотрим последовательность {en /n}, где {en } — ортонормированный ражение X в Y , f — функционал на X. Задача поиска экстремума
базис в `2 . Тогда функционала f : X → R на множестве тех элементов пространства X,
  которые удовлетворяют уравнению F (x) = 0, называется экстремальной
en 1 1 задачей с ограничениями-равенствами. Задачу записывают так:
F (0) = 0, F = 5 − 4 < 0.
n n n
f (x) → extr, F (x) = 0. (4.2)
Кроме того, в любой окрестности точки x b = 0 существуют элемен-
ты en /n при некотором довольно большом n. 4 Функцией Лагранжа задачи (4.2) называется функция
Определение 4.5. Квадратичный функционал B называется силь- L(x, y ∗ , λ0 ) = λ0 f (x) + hy ∗ , F (x)i, (4.3)
но (строго) положительно-определенным, если можно указать такое
число C > 0, что B(x, x) > Ckxk2 для всех x ∈ X. где λ0 ∈ R, y ∗ ∈ Y ∗ — множители Лагранжа.
70 Глава 4 3. Задачи с ограничениями-равенствами 71

Теорема 4.6 (О неопределенных множителях Лагранжа в зада- Из (4.6) и (4.7) вытекает, что x(ε) — допустимый элемент задачи (4.2)
чах с ограничениями-равенствами). Пусть X, Y — банаховы про- как угодно близкий к x b и, вместе с тем, f (x(ε)) < f (bx). Это противоре-
странства, U — открытое множество в X, функционал f : U → R и чит потому, что x
b — решение задачи (4.2) на минимум. Это противоречие
отображение F : U → Y строго дифференцируемы в точке x b ∈ U. доказывает, что равенство Im G0 (b x) = R × Y невозможно. Итак, верна
Если x b — точка локального экстремума в задаче (4.2) и образ первая часть теоремы.
Im F 0 (b
x) — замкнутое подпространство пространства Y, то суще- Перейдем к доказательству второй части. Пусть отображение F ре-
ствуют одновременно не равные нулю множители Лагранжа λ0 ∈ R, гулярно в точке x b и λ0 = 0. Тогда y ∗ 6= 0 и соотношение (4.4) имеет
y ∗ ∈ Y ∗ такие, что выполняется условие стационарности для функ- вид
ции Лагранжа hy ∗ , F 0 (b
x)[h]i = 0 для всех h ∈ X.

L0x (b
x, y ∗ , λ0 ) = 0 ⇐⇒ hλ0 f 0 (b
x), hi + hy ∗ , F 0 (b
x)[h]i = 0 ∀ h ∈ X. (4.4) Выберем такой элемент ye ∈ Y , чтобы hy ∗ , yei 6= 0. Это можно сделать,
поскольку y ∗ 6= 0. Теперь возьмем элемент e x)[e
h ∈ X такой, что F 0 (b h] =
Если, кроме того, Im F 0 (b
x) = Y (условие регулярности отображе- = ye, тогда
ния F : X → Y ), то множитель λ0 6= 0. x)[e
0 6= hy ∗ , yei = hy ∗ , F 0 (b h]i = 0.
ДОКАЗАТЕЛЬСТВО. Это противоречие доказывает справедливость утверждения второй части
Пусть x b — точка минимума задачи (4.2). Определим отображе- теоремы.
ние G : X → R × Y по формуле G(x) = (f (x) − f (b x), F (x)). Это отоб-
ражение строго дифференцируемо в точке x b и G0 (b
x) = (f 0 (bx), F 0 (b
x)). ЗАМЕЧАНИЕ 4.
0
Образ Im G (b x) совпадает или не совпадает с R × Y. 1) Уравнение (4.4) называется уравнением Эйлера–Лагранжа задачи (4.2).
1. Пусть Im G0 (b x) 6= R × Y. Применим к отображению G0 (b x) лемму 2) Метод неопределенных множителей Лагранжа показывает, что существуют
о замкнутости образа. Образ ImF 0 (b x) замкнут согласно условиям тео- такие λ0 ∈ , y ∗ ∈ Y ∗ , при которых условие локального экстремума в


ремы, образ f 0 (b x) (Ker F 0 (b
x)) равняется {0} или R. Итак, этот образ задаче (4.2) сводится к необходимому условию безусловного экстремума
замкнут. По лемме, образ Im G0 (b x) замкнут в R × Y. По предположению, функции Лагранжа (4.3).
он не совпадает с R × Y . Поэтому Im G0 (b x) — собственное замкнутое 3) Если выполняется условие регулярности ImF 0 (x) = Y , то условия экстре-


подпространство пространства R × Y . Из леммы о нетривиальности ан- мума можно записать так:
нулятора и леммы об общем виде линейного непрерывного функционала
на R × Y следует, что существуют число λ0 и элемент y ∗ ∈ Y ∗ такие, L0x (x, y ∗ , λ0 ) = 0, L0y∗ (x, y ∗ , λ0 ) = 0.
что |λ0 | + ky ∗ k 6= 0 и выполняется уравнение (4.4).
Указанные уравнения — это условие стационарности функции Лагранжа
2. Пусть теперь Im G0 (b x) = R × Y. Применим теорему о неявной
по переменным x, y ∗ .
функции. Согласно этой теореме существуют константа K > 0, окрест-
ность U точки (0, 0) в пространстве R × Y и отображение ϕ : U → X Теорема 4.7 (Необходимые условия второго порядка). Пусть X,
такие, что Y — банаховы пространства, функционал f : X → R и отображение
ϕ(0, 0) = xb; G(ϕ(α, y)) = (α, y);
(4.5) F : X → Y имеют вторые производные Фреше в точке x b. Если xb—
kϕ(α, y) − xbk 6 KkG(b x) − (α, y)k. точка локального минимума в задаче (4.2) и образ Im F 0 (b
x) = Y , то
Возьмем x(ε) = ϕ(−ε, 0) = ϕ(z(ε)), тогда из (4.5) получим существует множитель Лагранжа y ∗ ∈ Y ∗ такой, что для функции
Лагранжа
G(x(ε)) = z(ε) ⇐⇒ f (x(ε)) − f (b
x) = −ε, F (x(ε)) = 0; (4.6) L(x, y ∗ ) = f (x) + hy ∗ , F (x)i
bk = kϕ(z(ε)) − x
kx(ε) − x bk 6 Kk(0, 0) − (−ε, 0)k = K · ε. (4.7) выполняются условия:
72 Глава 4 3. Задачи с ограничениями-равенствами 73

1) стационарности Теорема 4.8 (Достаточные условия второго порядка). Пусть


X, Y — банаховы пространства, функционал f : X → R и отображе-
L0x (b
x, y ∗ ) = 0 ⇐⇒ hf 0 (b
x), hi + hy ∗ , F 0 (b
x)[h]i = 0 для всех h ∈ X, ние F : X → Y имеют вторые производные Фреше в точке x b, образ
(4.8) Im F 0 (b
x) = Y . Если существует множитель Лагранжа y ∗ ∈ Y ∗ такой,
что для функции Лагранжа
2) неотрицательности
L(x, y ∗ ) = f (x) + hy ∗ , F (x)i
L00xx (b
x, y ∗ )[h, h] > 0 для всех h ∈ Ker F 0 (b
x). (4.9)
выполняются условия:
ДОКАЗАТЕЛЬСТВО. 1) стационарности
Существование второй производной Фреше в точке x b обеспечивает
строгую дифференцируемость отображения в этой точке. Поэтому усло- L0x (b
x, y ∗ ) = 0 ⇐⇒ hf 0 (b
x), hi + hy ∗ , F 0 (b
x)[h]i = 0 для всех h ∈ X,
вие стационарности с множителем Лагранжа λ0 = 1 вытекает из правила (4.10)
множителей Лагранжа для гладкой задачи с равенствами.
Докажем справедливость второго условия. Пусть h ∈ Ker F 0 (b x). Из 2) строгой положительности
теоремы о касательном пространстве следует, что Ker F 0 (b x) = Tx M,


где M = {x ∈ X|F (x) − F (bx) = 0}. Следовательно, h ∈ Tx M. Поэтому L00xx(b
x, y ∗ )[h, h] > αkhk2 для всех ненулевых h ∈ Ker F 0 (b
x), (4.11)


существуют ε > 0 и отображение r : [−ε; ε] → X такие, что F (b x + th +
+ r(t)) = 0 ∀t ∈ [−ε; ε] и kr(t)k = o(t) при t → 0. Таким образом, b — точка локального минимума в задаче (4.2).
то x
b + th + r(t) — допустимый элемент в задаче (4.2) для всех t ∈ [−ε; ε],
x
ДОКАЗАТЕЛЬСТВО.
и так как x
b – точка локального минимума в задаче (4.2), то f (b
x) 6 f (b
x+
По лемме о правом обратном отображении для отображения F 0 (b
x) :
+ th + r(t)). По формуле Тейлора
X → Y существуют отображение M : Y → X и константа C > 0 такие,
f (b
x) 6 f (b x + th + r(t)) ± hy ∗ , F (b
x + th + r(t)) = f (b x + th + r(t))i = что
∗ ∗ F 0 (b
x) ◦ M = IY , kM (y)k 6 Ckyk для всех y ∈ Y.
= L(bx + th + r(t), y ) − hy , F (b
x + th + r(t))i =
Возьмем допустимый элемент x b + h в задаче (4.2) (F (b x + h) = 0). По-
= L(b x, y ∗ )[th + r(t)] + 1 L00xx (b
x, y ∗ ) + L0x (b x, y ∗ )[th + r(t), th + r(t)]+ ложим h2 = M (F 0 (b x)[h]) и обозначим h1 = h − h2 . Тогда F 0 (b x)[h1 ] =
2
2
= F 0 (b
x)[h − h2 ] = F 0 (b
x)[h] − F 0 (b
x)M (F 0 (b
x)[h]) = F 0 (b
x)[h] − F 0 (b
x)[h] = 0.
x) + t L00xx (b
+ o(kth + r(t)k2 ) = f (b x, y ∗ )[h, h] + o(t2 ). Значит, h1 ∈ Ker F 0 (bx). По формуле Тейлора
2
Отсюда 0 = F (b
x + h) = F (b x)[h] + 1 F 00 (b
x) + F 0 (b x)[h, h] + o(khk2 ).
2
t2 L00 (b
x, y ∗ )[h, h] + o(t2 ) > 0
2 xx Отсюда
при малых t. Разделим обе части последнего неравенства на t и устре- 2
x)[h] = − 1 F 00 (b
F 0 (b x)[h, h] − o(khk2 ).
2
мим t нулю. Получим
Поэтому существует такое δ > 0, что
L00xx (b
x, y ∗ )[h, h] > 0 для всех h ∈ Ker F 0 (b
x).
x)[h]k 6 1 kF 00 (b
kF 0 (b x)[h, h]k + ko(khk2 )k 6 C1 khk2
2
74 Глава 4 4. Задачи выпуклого программирования 75

с некоторой константой C1 > 0 для khk < δ. Следовательно, Определение 4.6. Напомним, что множество A ⊂ X называется
выпуклым, если вместе с точками x, y ∈ A оно содержит весь отре-
kh2 k = kM (F 0 (b
x)[h])k 6 CkF 0 (b
x)[h]k 6 CC1 khk2 6 CC1 δkhk = εkhk, зок [x, y] = {z : z = tx + (1 − t)y, 0 6 t 6 1}.
где ε = CC1 δ и Определение 4.7. Функция f : X → R называется выпуклой, если
для любых x, y ∈ X выполняется неравенство Иенссена
khk − kh2 k 6 kh1 k = kh − h2 k 6 khk + kh2 k
f (tx + (1 − t)y) 6 tf (x) + (1 − t)f (y) для всех t ∈ [0, 1].
при (1 − ε)khk 6 kh1 k 6 (1 + ε)khk. Вновь по формуле Тейлора
f (b x + h, y ∗ ) =
x + h) = L(b Определение 4.8. Элемент x ∈ X называется допустимым в за-
даче (4.12), если x ∈ A и fi (x) 6 0, i = 1, . . . , m.
= L(b ∗
x, y ) + L0x (b
x, y ∗ )[h] + 1 L00xx (b
x, y ∗ )[h, h] + o(khk2 ) =
2 Теорема 4.9. Пусть X — линейное нормированное простран-
x) + 1 L00xx (b
= f (b x, y ∗ )[h, h] + o(khk2 ). ство. Локальный минимум задачи выпуклого программирования яв-
2 ляется глобальным минимумом задачи.
Отсюда, обозначая B = kL00xx (b
x, y ∗ )k, получим ДОКАЗАТЕЛЬСТВО.
Пусть x b — локальный минимум задачи (4.12). Это означает, что
f (b
x + h) − f (b
x) = существует окрестность U точки x x) 6 f0 (x) для
b такая, что −∞ < f 0 (b
= 1 L00xx (bx, y ∗ )[h1 + h2 , h1 + h2 ] + o(khk2 ) = любой допустимой точки x ∈ U. Тогда для малых t > 0 вектор y = (1 −
2
  x + tx ∈ U будет допустимым. По неравенству Иенссена
− t)b
1
= Lxx (b 00 ∗ 00
x, y )[h1 , h1 ]+2Lxx(b ∗ 00
x, y )[h2 , h2 ] +o(khk2 )>
x, y )[h1 , h2 ]+Lxx (b ∗
2 f0 (b
x) 6 f0 (y) 6 (1 − t)f0 (b
x) + tf (x).

> 1 αkh1 k2 − 2Bkh1 kkh2 k − Bkh2 k2 + o(khk2 ) > Итак, f0 (b
x) 6 f0 (x) для любой допустимой точки x.
2
 Теорема 4.10 (Теорема Куна–Таккера). Пусть X — линейное
> 1 khk2 α(1 − ε)2 − 2B(1 + ε)ε − Bε2 + o(khk2 ) > 0 нормированное пространство, fi : X → R, i = 0, 1, . . . , m, — выпуклые
2
функции на X, A — выпуклое подмножество X.
при достаточно малых ε > 0 (при ε = 0 множитель в круглых скобках
равен α > 0). Из последнего соотношения следует, что x
b — точка ло- b — решение задачи выпуклого программирования (4.12), то
1) Если x
кального минимума в задаче (4.2). существуют одновременно не равные нулю множители Лагран-
жа λ0 , λ1 , . . . , λm , такие, что для функции Лагранжа
m
4. Задачи выпуклого программирования X
L(x, λ) = λi fi (x)
Пусть X — линейное пространство, A — выпуклое подмножество X, i=0
fi : X → R, i = 0, 1, . . . , m, — выпуклые функции. Задачей выпуклого выполняются:
программирования называется задача
a) принцип минимума
f0 (x) → inf, fi (x) 6 0, i = 0, 1, . . . , m, x ∈ A. (4.12)
min L(x, λ) = L(b
x, λ);
Подчеркнем, что (4.12) — это задача на минимум. x∈A
76 Глава 4 4. Задачи выпуклого программирования 77

b) условие дополняющей нежесткости Поскольку 0 ∈ B, то из (4.14) получим


m
X
λi fi (b
x) = 0, i = 1, 2, . . . , m;
0 > sup λi ci = sup λ0 c0 .
c∈C i=0 c∈C
c) условие неотрицательности

λi > 0, i = 0, 1, . . . , m. Отсюда λ0 > 0 и sup λ0 c0 = 0. Теперь неравенство (4.14) можно записать


c∈C
в виде
2) Если λ0 6= 0, то условия а), б), в) достаточные для того, чтобы m
X
допустимая точка x b была решением задачи. λi bi > 0 для всех b ∈ B. (4.15)
i=0
3) Для того чтобы λ0 6= 0, достаточно выполнения условия Слейте- Поскольку вектор (0, . . . , 1, 0 . . . , 0) ∈ B, то из неравенства (4.15) выте-
ра: существует точка x ∈ A такая, что fi (x) < 0, i = 1, . . . , m. кает, что λi > 0.
Проверим, что выполняется условие λi fi (b x) = 0, i = 1, . . . , m. Ес-
ДОКАЗАТЕЛЬСТВО. ли fi (bx) = 0, то равенство очевидно. Пусть fi (b x) < 0. Точка (0, . . . , 0,
Пусть x b — решение задачи (4.12). Будем считать, что f0 (b x) = 0. x), 0, . . . , 0) принадлежит B. Чтобы убедиться в этом, достаточно
fi (b
Определим множество взять точку x = x b в (4.13). Подставим эту точку в (4.15). Полу-
 чим λi fi (bx) > 0. В предшествующем пункте мы показали, что λi > 0.
B = b = (b0 , . . . , bm ) ∈ Rm+1 ∃ x ∈ A : fi (x) 6 bi , i = 0, 1, . . . , m . Поэтому λi = 0 и λi fi (b x) = 0.
(4.13) Покажем, что в точке x b выполняется принцип минимума. Пусть
Покажем, что множество B непустое и выпуклое. Действительно, x ∈ A. Тогда точка (f0 (x), . . . , fm (x)) ∈ B. Подставим эту точку в (4.14).
R+ m+1 ⊂ B, поскольку в (4.13) можно взять x = x b. Проверим вы- Получим
пуклость. Пусть b, b0 ∈ B, элементы x, x0 ∈ A такие, что fi (x) 6 bi , m
X
fi (x0 ) 6 b0i , i = 0, 1, . . . , m, xt = tx + (1 − t)x0 , 0 6 t 6 1. Тогда xt ∈ A, λi fi (x) = L(x, λ) > 0.
поскольку множество A выпуклое. Функции fi выпуклые, поэтому i=0

0 0 Если учесть, что f0 (b


x) = 0 и λi fi (b
x) = 0, то для любого x ∈ A
fi (xt ) = fi (tx + (1 − t)x ) 6 tfi (x) + (1 − t)fi (x )
m
X
6 tbi + (1 − t)b0i , i = 0, 1, . . . , m.
L(x, λ) > 0 = λi fi (b
x) = L(b
x, λ).
Итак, tb + (1 − t)b0 ∈ B. Это означает, что множество B выпукло. i=0
Пусть C = {c = (c0 , 0, . . . , 0) ∈ Rm+1 | c0 < 0}, тогда C ∩ B = ∅. Первое утверждение теоремы доказано.
Действительно, если существует точка c = (c0 , 0, . . . , 0) ∈ B, c0 < 0, Докажем второе утверждение теоремы. Пусть λ0 6= 0. Возьмем
то существует элемент x e ∈ A такой, что f0 (e
x) 6 c0 < 0, fi (e
x) 6 0, λ0 = 1. Тогда для допустимого x выполняется неравенство
i = 1, . . . , m. Это противоречит тому, что x b — решение задачи (4.12).
Итак, C ∩ B = ∅. m
X
Покажем, что множители λi > 0, i = 0, 1, . . . , m. По первой теореме f0 (x) = f0 (x) + λi fi (x) = L(x, λ) > L(b
x, λ)
отделимости множества B и C можно разделить. Существует вектор λ = i=0
m
= (λ0 , λ1 , . . . , λm ) 6= 0 такой, что X
= f0 (b
x) + λi fi (b
x) = f0 (b
x).
m
X m
X i=0
inf λi bi > sup λi c i . (4.14)
b∈B
i=0 c∈C i=0 Итак, x
b — решение задачи (4.12).
78 Глава 4 5. Задачи с ограничениями-неравенствами 79

Докажем третье утверждение. Если выполняется условие Слейтера 3) неотрицательности


и λ0 = 0, то
m
X λi > 0, i = 0, 1, . . . , m.
L(x, λ) = λi fi (x) < 0 = L(b
x, λ).
i=0 ДОКАЗАТЕЛЬСТВО.
Это противоречит принципу минимума. Теорема доказана. Будем считать, что f0 (b x) = 0. Если fi (b
x) 6= 0, i = 1, 2, . . . , m, то
такие ограничения не будем учитывать, поскольку для локального экс-
тремума ограничения fi (b x) < 0 несущественны. Таким образом, можно
5. Задачи с ограничениями-неравенствами считать, что условия дополняющей нежесткости выполнены.
А. Если Im F 0 (b x) есть собственное подпространство Y , то из лем-
Пусть X, Y — линейные нормированные пространства, F — отоб- мы о нетривиальности аннулятора следует, что существует функционал
ражение X в Y , fi : X → R, i = 0, 1, . . . , m, — функционалы на X. За- y ∗ ∈ Y ∗ , y ∗ 6= 0, такой, что hy ∗ , yi = 0 для всех y ∈ Im F 0 (b x) ⇔
дача поиска экстремума функционала f0 (x) на множестве тех элементов ⇔ hy ∗ , F 0 (b
x)[h]i = 0 для всех h ∈ X ⇐⇒ (F 0 (b x))∗ y ∗ = 0. Остается
пространства X, которые удовлетворяют уравнению F (x) = 0 и нера- определить λi = 0, i = 0, 1, . . . , m, чтобы доказать справедливость тео-
венству fi (x) 6 0, i = 1, . . . , m, называется экстремальной задачей с ремы.
ограничениями-неравенствами. Задачу записывают так: Б. Пусть теперь F 0 (bx) отображает X на все пространство Y , то есть
Im F 0 (b
x) = Y. Определим для 0 6 k 6 m множества
f0 (x) → inf, fi (x) 6 0, i = 1, . . . , m, F (x) = 0. (4.16)
Ak = {h | hfi0 (b
x), hi < 0, i = k, k + 1, . . . , m; F 0 (b
x)[h] = 0}.
Теорема 4.11 (О неопределенных множителях Лагранжа в за- Очевидно, что A0 ⊂ A1 ⊂ . . . ⊂ Am .
дачах с ограничениями-неравенствами). Пусть X, Y — банаховы
пространства, fi ∈ SD(b x), Im F 0 (b
x), i = 1, . . . , m, F ∈ SD(b x) — за- b — решение задачи (4.16), то A0 — пустое
Лемма 4.1. Если x
мкнутое подпространство в Y. Если x b — решение задачи (4.16), то множество.
существуют одновременно не равные нулю вектор λ ∈ Rm+1 и функ- ДОКАЗАТЕЛЬСТВО.
ционал y ∗ ∈ Y ∗ такие, что для функции Лагранжа Пусть это не так, A0 6= ∅. Тогда существует вектор h ∈ Ker F 0 (b x)
m
такой, что hfi0 (b
x), hi = bi < 0, i = 0, 1, . . . , m. В соответствии с теоремой
X Люстерника существуют отображения r : [−α, α] → X и число K такие,
L(x, y ∗ , λ) = λi fi (x) + hy ∗ , F (x)i
что
i=0

выполняются условия: x + λh + r(λ)) = 0 для всех λ ∈ [−α, α]


F (b
kr(λ)k 6 KkF (b x)k = KkλF 0 (b
x + λh) − F (b x)[h] + o(λ)k = o(λ). (4.17)
1) стационарности
Для достаточно малых λ > 0 выполняется неравенство
m
X
L0x (b
x, y ∗ , λ) = 0 ⇐⇒ λi fi0 (b
x) + (F 0 (b
x))∗ y ∗ = 0; fi (b x) + λhfi0 (b
x + λh + r(λ)) = fi (b x), hi + o(λ)
i=0 = λbi + o(λ) < 0, i = 0, 1, . . . , m. (4.18)

2) дополняющей нежесткости Соотношения (4.17) и (4.18) при i = 1, 2, . . . , m означают, что при ма-
лых λ элемент x b + λh + r(λ) допустимый в задаче (4.16). Но неравен-
λi fi (b
x) = 0, i = 1, 2, . . . , m; ство (4.18) при i = 0 противоречит тому, что x b — решение задачи (4.16).
80 Глава 4 5. Задачи с ограничениями-неравенствами 81

Лемма 4.2. Если Am — пустое множество, то для задачи (4.16)


P
m
Отсюда λi fi0 (b
x), h = 0 для любого h ∈ Ker F 0 (b
x). Итак,
выполняется принцип Лагранжа. i=k
m
X
ДОКАЗАТЕЛЬСТВО. ⊥
Поскольку Am = {h | hfm 0
x), hi < 0, F 0 (b
(b x)[h] = 0} — пустое мно- λi fi0 (b
x) ∈ Ker F 0 (b
x) .
0
жество, то hfm (bx), hi = 0 для любого h ∈ Ker F 0 (b 0
x). Поэтому fm (b
x) ∈ i=k
0
∈ (Ker F (b ⊥
x)) . Из леммы об аннуляторе ядра регулярного оператора Из леммы об аннуляторе ядра регулярного оператора следует, что
следует, что ⊥
(Ker F 0 (bx))⊥ = Im (F 0 (b

x)) . Ker F 0 (b
x) = Im (F 0 (b
x))∗ .

Поэтому существует y ∗ ∈ Y ∗ такой, что Поэтому существует y ∗ ∈ Y ∗ такой, что


m
X
0
fm x) + (F 0 (b
(b x))∗ y ∗ = 0. λi fi0 (b
x) + (F 0 (b
x))∗ y ∗ = 0.
i=k
Это и есть условие стационарности функции Лагранжа при λ0 = · · · = А это и есть условие стационарности функции Лагранжа L(x, y ∗ , λ)
= λm−1 = 0, λm = 1. при λ0 = λ1 = . . . = λk−1 = 0. Теорема доказана.
Таким образом, принцип Лагранжа обоснован (Am = ∅) или суще-
ЗАМЕЧАНИЕ 5. Если Im F 0 (x) = Y (отображение F регулярно в точке x) и


ствует такое число k, 0 6 k < m, что Ak = ∅, Ak+1 6= ∅.
существует элемент h ∈ Ker F 0 (x) такой, что hfi0 (x), hi < 0, i = 1, . . . , m (аналог


Лемма 4.3. Если существует число k, 0 6 k 6 m, такое, условия Слейтера), то λ0 6= 0 и можно брать λ0 = 1.
что Ak = ∅, Ak+1 6= ∅, то b
h = 0 есть решение задачи Теорема 4.12 (Необходимые условия второго порядка). Пусть
X, Y — банаховы пространства, функционалы fi : X → R, i = 0, 1, . . . , m,
hfk0 (b
x), hi → inf; hfi0 (b
x), hi 6 0, i = k + 1, . . . , m; F 0 (b
x)[h] = 0. (4.19) и отображение F : X → Y дважды дифференцируемы по Фреше в
некоторой окрестности U точки x b. Если x b — точка локального ми-
ДОКАЗАТЕЛЬСТВО. нимума в задаче (4.16) и образ Im F 0 (b
x) = Y , то
Снова используем метод от противного. Пусть утверждение леммы max L00xx (b
x, y ∗ , λ)[h, h] > 0 для всех h ∈ K,
неверно. Тогда существует такой элемент h ∈ X, что hfk0 (b x), hi < 0, (λ,y ∗ )∈


hfi0 (b
x), hi 6 0, i = k + 1, . . . , m; F 0 (b
x)[h] = 0. Пусть u — элемент Ak+1 . где
Тогда hfi0 (bx), ui < 0, i = k + 1, . . . , m, F 0 (b
x)[u] = 0. Но при малых ε > 0 m
X
элемент h + εu ∈ Ak , что противоречит условиям леммы. L(x, y ∗ , λ) = λi fi (x) + hy ∗ , F (x)i
i=0
Применим к задаче (4.19) теорему Куна–Таккера. В соответствии с
этой теоремой существуют неотрицательные числа λk = 1, λk+1 , . . . , λm — функция Лагранжа,
такие, что для функции Лагранжа задачи (4.19) K = {h ∈ X : hfi0 (b
x), hi 6 0, i = 0, 1, . . . , m; F 0 (b
x)[h] = 0}
m
X — конус допустимых вариаций, а
e λ) =
L(h, λi hfi0 (b
x), hi ( m
X
∗ m+1 ∗
i=k = (λ, y ) ∈ R ×Y λi fi0 (b
x) + (F 0 (b
x))∗ y ∗ = 0;



i=0
в точке b
h = 0 выполняется принцип минимума m
)
X
λi fi (b
x) = 0, i = 1, . . . , m; λi > 0, i = 0, 1, . . . , m; λi = 1 6= ∅
min L(h, e b
e λ) = L( h, λ) = 0.
h∈Ker F 0 (x) i=0

82 Глава 4 5. Задачи с ограничениями-неравенствами 83

— множество наборов (λ, y ∗ ), для которых выполнены условия тео- ДОКАЗАТЕЛЬСТВО.


ремы 4.11 о множителях Лагранжа для задач с равенствами и нера- Предположим, что 0 6∈ absmin(ϕ). Тогда существует вектор h ∈
венствами. ∈ Ker F 0 (b
x), для которого
Доказательство основано на лемме о минимаксе и теореме Люстер- max hfi0 (b
x), hi < 0 ⇐⇒ hfi0 (b
x), hi < 0, i = 0, 1, . . . , m.
ника. i=0,1, . . . ,m

Лемма 4.4 (Лемма о минимаксе). [АТФ, с. 280.] Пусть X, Y Поскольку Im F 0 (b x) = Y , то по теореме о касательном простран-
— банаховы пространства, Λ ∈ (X, Y ) — линейный непрерывный стве h ∈ Ker F 0 (b
x) = Tx M , где M = {x : F (x) = F (b x) = 0}. По опре-


оператор из X на пространство Y , ΛX = Y , x∗i ∈ X ∗ , i = 1, . . . , n — делению касательного вектора существует отображение r : [−ε, ε] → X
функционалы на X такие, что такое, что F (b
x + th + r(t)) = 0 ∀ t ∈ [−ε, ε], kr(t)k = o(t). Поэтому

max hx∗i , xi > 0 ∀ x ∈ Ker Λ. (4.20) fi (b x) + hfi0 (b


x + th + r(t)) =fi (b x), th + r(t)i + o(kth + r(t)k) =
i=1, . . . ,n
=thfi0 (b
x), hi + o(t) < 0, i = 0, 1, . . . , m,
Пусть для вектора a = (a1 , . . . , an ) ∈ Rn и элемента y ∈ Y при малых t. Таким образом, вектор x b + th + r(t) является допустимым
S(a, y) = min max (ai + hx∗i , xi). элементом в задаче (4.16), но при этом
x : Λx+y=0 i=1, . . . ,n
f0 (b
x + th + r(t)) < 0 = f0 (b
x).
Тогда
Получаем противоречие тому, что x
b — точка локального минимума в
1) величина S(a, y) имеет двойственное представление задаче (4.16).
n
! x), ai = 1 fi00 (b
Определим теперь x∗i = fi0 (b x)[h, h], i = 0, 1, . . . , m,
X 2

S(a, y) = s (a, y) = max λi ai + hy , yi ,


(λ,y ∗ )∈ x), y = 1 F 00 (b
Λ = F 0 (b x)[h, h], где h ∈ K — некоторый фиксированный


i=1 2
вектор. Из доказанной леммы следует, что вектор b
h = 0 доставляет
где s (a, y) — опорная функция в точке (a, y) множества


абсолютный минимум функции ϕ(h), определенной по формуле (4.21).


( )
Xn n
X Значит,
∗ n ∗ ∗ ∗ ∗ max hfi0 (b
x), hi > 0
= (λ, y )∈R ×Y λi xi +Λ y =0; λi > 0, i=1, . . . , n; λi =1 ;


i=0,1, . . . ,m
i=1 i=1
для любого h ∈ Ker F 0 (b
x). Следовательно, условие (4.20) леммы о мини-
2) минимум в определении S(a, y) и максимум в определении максе выполняется. Согласно этой лемме существует элемент ξ = ξ(h),
s (a, y) достигаются. Λξ + y = 0, такой, что


m
!
X
Докажем сначала следующую лемму. ∗
max (ai + hxi , ξi) = max ∗
λi ai + hy , yi =
i=0, . . . ,m (λ,y )∈



i=0
Лемма 4.5. Вектор b
h = 0 доставляет абсолютный минимум m
!
функции X
= 1 max λi fi00 (b
x)[h, h] ∗
+ hy , F (b00
x)[h, h]i =
ϕ(h) = max hfi0 (b
x), hi + δKer F 0 (b
x)(h) (4.21) 2 (λ,y∗ )∈


i=0,1, . . . ,m i=0

x) = 0, i = 0, 1, . . . , m, Im F 0 (b
в предположении, что fi (b x) = Y , = 1 max L00xx (b
x, y ∗ , λ)[h, h].
2 (λ,y∗ )∈


где δA(·) — индикаторная функция выпуклого множества A.
84 Глава 4 5. Задачи с ограничениями-неравенствами 85

По формуле Тейлора в силу условий F 0 (b


x)[h] = 0, Λξ + y = 0, Из доказанной леммы следует, что

x + th + t2 ξ) =
F (b 0= max fi (b
x) 6 max x + th + t2 ξ + r(t)) =
fi (b
i=0,1, . . . ,m i=0,1, . . . ,m
x) + F 0 (b
=F (b x)[th + t2 ξ]+ 
= max x) + fi0 (b
fi (b x)[th + t2 ξ + r(t)]+
+ 1 F 00 (b
x)[th + t2 ξ, th + t2 ξ] + o(t2 ) = i=0,1, . . . ,m
2 
2 + 1 fi00 (b
x)[th + t2 ξ + r(t), th + t2 ξ + r(t)] + o(t2 ) =
x)[ξ] + t F 00 (b
=t2 F 0 (b x)[h, h] + o(t2 ) = 2
2  
2
=t2 (Λξ + y) + o(t2 ) = o(t2 ). = max tfi0 (b
x)[h] + t2 fi0 (b x)[ξ] + t fi00 (b
x)[h, h] + o(t2 ) 6
i=0,1, . . . ,m 2
 
По теореме Люстерника существует отображение ϕ : U → X некоторой
окрестности U точки x
b такое, что 6 t2 max x)[ξ] + 1 fi00 (b
fi0 (b x)[h, h] + o(t2 ) =
i=0,1, . . . ,m 2
F (x + ϕ(x)) = 0, kϕ(x)k 6 KkF (x)k ∀ x ∈ U. = t2 max {hx∗i , ξi + ai } + o(t2 ) =
i=0,1, . . . ,m
2
x + th + t2 ξ), получим, что при малых t
Полагая r(t) = ϕ(b =t max L00xx (b
x, y ∗ , λ)[h, h] + o(t2 ).
2 (λ,y ∗ )∈


x + th + t2 ξ + r(t)) =F (b
F (b x + th + t2 ξ + ϕ(b
x + th + t2 ξ)) = 0,
Разделим выражение на t2 и устремим t к нулю. Получим
x + th + t2 ξ)k = o(t2 ).
kr(t)k 6KkF (b
max L00xx (b
x, y ∗ , λ)[h, h] > 0
Лемма 4.6. Вектор x
b доставляет локальный минимум задачи (λ,y ∗ )∈


max fi (x) → min, F (x) = 0 (4.22) для любого вектора h ∈ K.
i=0,1, . . . ,m

Теорема 4.13 (Достаточные условия второго порядка). [АТФ,


(в предположении, что fi (b
x) = 0, i = 0, 1, . . . , m). с. 293.] Пусть X, Y — банаховы пространства, функционалы fi: X→R,
ДОКАЗАТЕЛЬСТВО. i = 0, 1, . . . , m, и отображение F : X → Y дважды дифференцируемы
Докажем лемму от противного. Предположим, что x
b не доставляет по Фреше в некоторой окрестности U точки x b, образ Im F 0 (b x) = Y ,
локальный минимум задачи (4.22). Тогда для всех δ > 0 существует множество
точка x = x(δ) такая, что kx − x
bk < δ и (
X m
∗ m+1 ∗
= (λ, y ) ∈ R ×Y λi fi0 (b
x) + (F 0 (b
x))∗ y ∗ = 0;


max fi (x) < max fi (b
x) =0 ⇔
i=0,1, . . . ,m i=0,1, . . . ,m i=0
m
)
⇔ fi (x) < 0, i = 0, 1, . . . , m; F (x) =0. X
λi fi (b
x) = 0, i = 1, . . . , m; λi > 0, i = 0, 1, . . . , m; λi = 1 6= ∅
Это значит, что точка x = x(δ) является допустимой в задаче (4.22) i=0
x). А это значит, что точка x
и f0 (x) < f0 (b b не доставляет локальный
и выполняется условие строгой положительной определенности
минимум задачи (4.16). Получили противоречие.
max L00xx (b
x, y ∗ , λ)[h, h] > αkhk2
(λ,y ∗ )∈


86 Глава 4 5. Задачи с ограничениями-неравенствами 87

для некоторого α > 0 и для всех h, принадлежащих конусу допусти- Вектор h можно представить в виде суммы h = h1 + h2 , где h1 ∈ K,
мых вариаций kh2 k 6 C3 khk2 . Выберем δ2 так, чтобы из условия khk 6 δ2 следовало
неравенство C1 khk 6 1/2 (δ2 = 1/2C3 ). Тогда
K = {h ∈ X : hfi0 (b
x), hi 6 0, i = 0, 1, . . . , m; F 0 (b
x)[h] = 0}.
kh1 k > khk − kh2 k > khk − C3 khk >
b — точка локального минимума в задаче (4.16).
Тогда x
ДОКАЗАТЕЛЬСТВО. > khk(1 − C3 khk) > khk/2
Чтобы доказать справедливость теоремы, используем свойства отоб- и
ражений, сформулированные в конце параграфа в виде лемм (лемма kh2 k 6 C3 khk2 6 4C3 kh1 k2 . (4.26)
x) = 0, i = 0, 1, . . . , m. По-
Хоффмана и другие). Будем считать, что fi (b

кажем, что существует такое δ > 0, что условия Из леммы о компактности множества вытекает, что ky k 6 C4


при (λ, y ∗ ) ∈ . Выберем δ3 настолько малым, чтобы из условия khk 6 δ3


fi (b
x + h) 6 0, i = 0, 1, . . . , m; F (b
x + h) = 0 (4.23) следовало неравенство
противоречивы при khk 6 δ, h 6= 0. Из этого будет следовать, что xb —
Xm

точка локального минимума в задаче (4.16). Пусть условия (4.23) выпол- λi ri (h) + hy , r(h)i 6 α khk2 6 α kh1 k2 .

(4.27)
няются. Пользуясь формулой Тейлора, можем записать, что при khk 6 δ 1 16 4
i=0

fi (b
x + h) = fi (b x), hi + 1 fi00 (b
x) + hfi0 (b x)[h, h] + ri (h), kri (h)k = o(khk2 ), Обозначим
2 C5 = max kL00xx (b
x, y ∗ , λ)k.
(λ,y ∗ )∈


F (bx + h) = F (b x)[h] + 1 F 00 (b
x) + F 0 (b x)[h, h] + r(h), kr(h)k = o(khk2 ).
2 Если (λ, y ∗ ) ∈ , то по определению множества выполняются


Определим условия:
m
X
f (x) = max fi (x), ai = 1 fi00 (b
x)[h, h] + ri (h), i = 0, 1, . . . , m; λi = 1; λi > 0, i = 0, 1, . . . , m;
i=0,1, . . . ,m 2
i=0
x∗i = fi0 (b x), y = 1 F 00 (b
x), Λ = F 0 (b x)[h, h] + r(h). Xm
2 λi hx∗i , xi + hΛ∗ y ∗ , xi = 0 ⇔
Тогда указанные разложения можно записать в виде i=0
m
X
x + h) = hx∗i , hi + ai 6 0, i = 0, 1, . . . , m; Λh + y = 0.
fi (b (4.24) ⇔ λi hx∗i , xi + hy ∗ , Λxi = 0 для всех x ∈ X.
i=0
Отсюда следует, что
Отсюда
hx∗i , hi+ 6 |ai | 6 C1 khk2 , i = 0, 1, . . . , m; kΛhk = kyk 6 C1 khk2 . (4.25) m
X
λi hx∗i , xi = 0 для всех x ∈ KerΛ.
Из леммы Хоффмана следует, что расстояние от вектора h до конуса i=0
допустимых вариаций K оценивается по формуле
! Значит,
Xm max hx∗i , xi > 0 для всех x ∈ KerΛ.
d(h, K) 6 C2 hxi , hi+ + kΛhk 6 C3 khk2 .
∗ i=0,1, . . . ,m

i=0
88 Глава 4 6. Экономические интерпретации множителей Лагранжа 89

Следовательно, применима лемма о минимаксе. Из этой леммы следует, функционалы на X. Тогда множество
что ( n
X
 ∗ ∗ n ∗
= (λ, y ) ∈ R × Y λi x∗i + Λ∗ y ∗ = 0;


0 > max fi (b
x + h) = max hxi , hi + ai
i=0,1, . . . ,m i=0,1, . . . ,m i=1
 ∗ )
= min max hxi , hi + ai = n
X
Λx+y=0 i=0,1, . . . ,m λi > 0, i = 1, . . . , n; λi = 1
X m X m
i=1
= max λi 1 fi00 (b
x)[h, h] + hy ∗ , 1 F 00 (b
x)[h, h]i + λi ri (h)+
(λ,y )∈ 2 2 компактно.



i=0 i=0

Лемма 4.9 (Лемма Хоффмана). [АТФ, с. 279.] Пусть заданы ба-
+hy ∗ , r(h)i > max x, y ∗ , λ)[h1 + h2 , h1 + h2 ] − α kh1 k2 >
L00xx (b наховы пространства X, Y , линейный непрерывный оператор Λ ∈
(λ,y ∗ )∈ 4


(X, Y ) из X на пространство Y , ΛX = Y , функционалы x∗i ∈ X ∗ ,


> max L00xx (b
x, y ∗ , λ)[h1 , h1 ] − C5 kh1 kkh2 k−
(λ,y )∈ i = 1, . . . , n, на X, конус


− α C5 kh2 k2 − α kh1 k2 > K = {h ∈ X : hx∗i , hi 6 0, i = 0, 1, . . . , m; Λh = 0}.


4 4
α
> kh1 k − 4C3 C5 kh1 k3 − 8C32 C5 kh1 k4 − α kh1 k2 ,
2 Тогда существует константа C > 0 такая, что расстояние
2 4 !
m
X
если только из неравенства khk < δ 6 min{δ1 , δ2 , δ3 } следует неравен- d(x, K) 6 C ∗
hxi , hi+ + kΛhk .
ство i=0

α kh k2 > 4C C kh k3 + 8C 2 C kh k4 ⇔ α > 4C C kh k + 8C 2 C kh k2 ,
4 1 3 5 1 3 5 1
4 3 5 1 3 5 1
6. Экономические интерпретации множителей
которое всегда будет выполняться при достаточно малых h 1 , а в силу Лагранжа
неравенства khk 6 2kh1 k — и при достаточно малых h. Получили про-
тиворечие: Множителям Лагранжа можно давать разнообразные экономиче-
0> max fi (b
x + h) > 0. ские интерпретации в зависимости от вида задачи и ее толкования.
i=0,1, . . . ,m
Ниже приводятся две таких интерпретации. В первой множители Ла-
гранжа возникают как вектор дефицитности ресурсов, а во второй они
Лемма 4.7 (Лемма о замкнутости). [11, с. 95.] Пусть X — ба- совпадают с вектором цен, действующих в системе.
нахово пространство, L, L1 — подпространства в X, причем L — Рассмотрим задачу максимизации
замкнутое подпространство, а подпространство L1 конечной раз- f (x) → max, g (x) 6 b, x ∈ P, (4.28)
мерности (dim L1 < ∞). Тогда сумма L + L1 — замкнутое подпро-
странство X. где x — n-мерный вектор производства товаров предприятием; P —
множество технологически возможных планов производства товаров,
Лемма 4.8 (Лемма о компактности ). [11, с. 96.] Пусть X,


P ⊂ R+ n ; g (x) — m-мерный вектор затрат ресурсов на производства


Y — банаховы пространства, Λ ∈ (X, Y ) — линейный непрерывный


товаров x, g (x) > 0; b — вектор, который характеризует запасы ресур-


оператор из X на пространство Y , ΛX = Y , x∗i ∈ X ∗ , i = 1, . . . , n, —
сов, b > 0; f (x) — прибыль, которую получает предприятие от реализа-
ции x товаров. Задача (4.28) удовлетворяет условию Слейтера: g (0) < b.
90 Глава 4 6. Экономические интерпретации множителей Лагранжа 91

Необходимые для применения изложенной выше теории предположения где h = (h1 , . . . , hm ) — вектор купли-продажи ресурсов предприяти-
о выпуклости множества P , вогнутости функции f и выпуклости функ- ем: при hi > 0 ресурс i покупается, при hi < 0 ресурс продается.
ции g также имеют экономическую интерпретацию. Так, необходимым Условие h > −b означает, что предприятие не может продать ресурсов
(а при непрерывности f и достаточным) условием вогнутости f на P больше, чем у него есть. Пусть (b x, b b =
h) – решение задачи (4.29), а λ
есть неравенство b1 , . . . , λ
= (λ bm ) — ее множители Лагранжа, которые отвечают функцио-
нальному ограничению g (x) 6 b + h. Тогда по теореме 4.10 имеем
f (x + 2∆x) − f (x + ∆x) 6 f (x + ∆x) − f (x) ,
 
которое выполняется при всех x ∈ P и ∆x ∈ Rn таких, что x + 2∆x ∈ P . x, b
L(b b = min L x, h, λ
h, λ) b ,
x∈P,h>−b
При ∆x > 0 это неравенство означает, что с ростом масштабов произ-
водства прирост прибыли снижается (например, в связи с трудностями где
возникающими при реализации товаров). L (x, h, λ) = −f (x) + hp, hi + hλ, g (x) − b − hi .
Пусть теперь x b=x b (b) — решение задачи (4.28), а Φ (b) = f (b
x (b)) —
значение задачи (4.28), то есть оптимальный план выпуска товаров и Естественно считать, что b
h > −b, то есть предприятию не выгодно
 пол-
максимальная прибыль от реализации товаров при запасе ресурсов b. b
ностью продавать ресурсы. Тогда градиент функции L x, h, λ по h
b = (λ
Пусть λ bm ) — множители Лагранжа задачи (4.28), точнее
b1 , . . . , λ
x, b
в точке (b h) превращается в нуль:
эквивалентной задачи
x, b
L0h (b b =p−λ
h, λ) b = 0.
−f (x) → min, g (x) − b 6 0, x ∈ P.
Теперь множители Лагранжа задачи (4.29) — это вектор действующих
Тогда если i-й ресурс используется не полностью (gi (b bi = 0
x) < b), то λ цен.
в силу теоремы 4.10. При этом увеличение только i-го ресурса не мо-
жет привести к увеличению прибыли предприятия (Φ (b + αei ) = Φ (b)
при α > 0). В этом случае говорят, что i-й ресурс недефицитный. Ес-
ли же λ bi > 0, то i-й ресурс дефицитный: он используется полностью
x) = bi ). Увеличение его запаса приводит к росту прибыли предпри-
(gi (b
ятия (Φ (b + αei ) > Φ (b) при α > 0).
Как видно, множители Лагранжа задачи (4.28) выступают как ха-
рактеристика дефицитности ресурсов, которые используются для произ-
водства товаров.
Мы не учитывали, что приобретение дополнительных ресурсов тре-
бует определенных затрат со стороны предприятия. Будем теперь учи-
тывать это обстоятельство. Пусть P = (p1 , . . . , pm ) — заданный вектор
цен на ресурсы, p > 0. Будем считать, что предприятие может как поку-
пать необходимые ресурсы, так и продавать «ненужную» часть ресурсов
с целью максимизации общей прибыли, которая учитывает и резуль-
таты торговых операций с ресурсами. Тогда деятельность предприятия
описывается такой задачей:

f (x) − hp, hi → max, g (x) 6 b + h, x ∈ P, h > −b, (4.29)


92 Глава 4 7. Задачи 93

7. Задачи 4.28 f (x, y, z) = xy 2 z 3 (a − x − 2y − 3z) → extr, a > 0.


4.29 f (x, y, z) = x3 + y 2 + z 2 + 12xy + 2z → extr, x > 0, y > 0, z > 0.
Решить следующие задачи на экстремум. 4.30 f (x, y, z) = x + y 2 /4x + z 2 /y + 2/z → extr .
4.1 f (x, y) = x4 + y 4 − 4xy → extr . 4.31 f (x, y, z) = x2 + y 2 + z 2 + 2x + 4y − 6z → extr .
4.2 f (x, y) = ae−x + be−y + ln(ex + ey ) → extr . 4.32 f (x, y) = y → extr, x3 + y 3 − 3xy = 0.
4.3 f (x, y) = (x + y)(x − a)(y − b) → extr . 4.33 f (x, y) = x3 + y 3 → extr, ax + by = 1, a > 0, b > 0.
4.4 f (x, y) = x2 − 2xy 2 + y 4 − y 5 → extr . 4.34 f (x, y) = x3 /3 + y → extr, x2 + y 2 = a, a > 0.
4.5 f (x, y) = x + y + 4 sin (x) sin (y) → extr . 4.35 f (x, y) = x sin (y) → extr, 3x2 − 4 cos (y) = 1.
4.6 f (x, y) = xex − (1 + ex ) cos (y) → extr . 4.36 f (x, y) = x/a + y/b → extr, x2 + y 2 = 1.
2 2
4.7 f (x, y) = (x2 + y 2 )e−(x +y ) → extr . 4.37 f (x, y) = x2 + y 2 → extr, x/a + y/b = 1.
4.8 f (x, y) = xy ln (x2 + y 2 ) → extr . 4.38 f (x, y) = Ax2 + 2Bxy + Cy 2 → extr, x2 + y 2 = 1.
p
4.9 f (x, y) = x − 2y + ln ( x2 + y 2 ) + 3arctg(y/x) → extr . 4.39 f (x, y) = x2 + 12xy + 2y 2 → extr, 4x2 + y 2 = 25.
4.10 f (x, y) = sin (x) sin (y) sin (x + y) → extr, 0 6 x 6 π, 0 6 y 6 π. 4.40 f (x, y) = cos2 (x) + cos2 (y) → extr, x − y = π/4.
4.11 f (x, y) = sin (x) + cos (y) + cos (x − y) → extr, 4.41 f (x, y) = x/2 + y/3 → extr, x2 + y 2 = 1.
0 6 x 6 π/2, 0 6 y 6 π/2. 4.42 f (x, y) = x2 + y 2 → extr, 3x + 4y = 1.
4.12 f (x, y) = x2 + xy + y 2 − 4 ln (x) − 10 ln y → extr . 4.43 f (x, y) = exy → extr, x + y = 1.
2
+y 2 +xy) 4.44 f (x, y) = 5x2 + 4xy + y 2 → extr, x + y = 1.
4.13 f (x, y) = (5x + 7y − 25)e−(x → extr .
4.14 f (x, y) = ex2 −y
(5 − 2x + y) → extr . 4.45 f (x, y) = 3x2 + 4xy + y 2 → extr, x + y = 1.
4.15 f (x, y) = e 2x+3y
(8x2 − 6xy + 3y 2 ) → extr . 4.46 f (x, y, z) = xy 2 z 3 → extr, x + y + z = 1.
p 4.47 f (x, y, z) = xyz → extr, x2 + y 2 + z 2 = 1, x + y + z = 0.
4.16 f (x, y) = 1 − x2 + y 2 → extr .
p 4.48 f (x, y, z) = a2 x2 + b2 y 2 + c2 z 2 − (ax2 + by 2 + cz 2 )2 → extr,
4.17 f (x, y) = (ax + by + c)/ x2 + y 2 + 1 → extr .
p x2 + y 2 + z 2 = 1, a > b > c > 0.
4.18 f (x, y) = xy 1 − x2 /a2 − y 2 /b2 → extr . 4.49 f (x, y, z) = x+y +z 2 +2(xy +yz +zx) → extr, x2 +y 2 +z = 1.
4.19 f (x, y) = 2x4 + y 4 − x2 − 2y 2 → extr . 4.50 f (x, y, z) = x − 2y + 2z → extr, x2 + y 2 + z 2 = 1.
4.20 f (x, y) = x2 − xy + y 2 − 2x + y → extr . 4.51 f (x, y, z) = xm y n z p → extr, x + y + z = a,
4.21 f (x, y) = xy + 50/x + 20/y → extr . m > 0, n > 0, p > 0, a > 0.
4.22 f (x, y) = x2 − y 2 − 4x + 6y → extr . 4.52 f (x, y, z) = x2 + y 2 + z 2 → extr, x2 /a2 + y 2 /b2 + z 2 /c2 = 1,
4.23 f (x, y) = 5x2 + 4xy + y 2 − 16x − 12y → extr . a > b > c > 0.
4.24 f (x, y) = 3x2 + 4xy + y 2 − 8x − 12y → extr . 4.53 f (x, y, z) = xy 2 z 3 → extr,x + 2y + 3z = a,
x > 0, y > 0, z > 0, a > 0.
4.25 f (x, y) = 3xy − x2 y − xy 2 → extr .
4.54 f (x, y, z) = xy + yz → extr, x2 + y 2 = 2, y + z = 2,
4.26 f (x, y, z) = x2 + y 2 + z 2 − xy + x − 2z → extr .
x > 0, y > 0, z > 0.
4.27 f (x, y, z) = x2 + 2y 2 + 5z 2 − 2xy − 4yz − 2z → extr .
4.55 f (x, y, z) = sin (x) sin (y) sin (z) → extr, x + y + z = π/2.
94 Глава 4 7. Задачи 95

4.56 f (x, y) = ex−y − x − y → extr, x + y 6 1, x > 0, y > 0. b > 0, aj > 0, c = (c1 , . . . , cn ) 6= 0, α > 1.
Pn α
Pn α
4.57 f (x, y) = x2 +y 2 −2x−4y → extr, 2x+3y−6 6 0, x+4y−5 6 0. 4.76 j=1 |cj + xj | → max(min), j=1 |xj | = b,
4.58 f (x, y) = 2xy − x2 − 2y 2 → extr, x − y + 1 > 0, 2x + 3y + 6 6 0. b > 0, c = (c1 , . . . , cn ) 6= 0, α > 1.
4.59 f (x, y) = x2 + y 2 → extr, −5x + 4y 6 0, −x + 4y + 3 6 0. 4.77 Разделить число 8 на две части так, чтобы произведение их
4.60 f (x, y) = x2 + y 2 − 2x → extr, x − 2y + 2 6 0, 2x − y > 0. произведения на разность было максимальным (задача Тартальи).
4.61 f (x, y, z) = xyz → extr, x2 + y 2 + z 2 6 1. 4.78 Определить прямоугольный треугольник наибольшей площади
при условии, что сумма длин его катетов равняется заданному числу
4.62 f (x, y, z) = 2x2 + 2x + 4y − 3z → extr, (задача Ферма).
8x − 3y + 3z 6 40, −2x + y − z = −3, y > 0.
4.79 На стороне BC треугольника ABC определить точку E такую,
4.63 f (x, y, z) = x2 + 4y 2 + z 2 → extr, x + y + z 6 12, что параллелограмм ADEK, у которого точки D и K лежат, соответ-
x > 0, y > 0, z > 0. ственно, на сторонах AB и AC, имел наибольшую площадь (задача
4.64 f (x, y, z) = 3y 2 − 11x − 3y − z → extr, x − 7y + 3z + 7 6 0, Евклида).
5x + 2y − z 6 2, z > 0. 4.80 На заданной грани тетраэдра берут точку, через которую про-
4.65 f (x, y, z) = xy − 2y → extr, 2x − y − 3z 6 10, 3x + 2y + z = 6, водят плоскости, параллельные трем другим граням. Выбрать точку так,
y > 0. чтобы объем параллелепипеда был максимальным (обобщенная задача
4.66 f (x, y, z) = −4x − y + z 2 → extr, x2 + y 2 + xz − 1 6 0, Евклида).
x2 + y 2 − 2y 6 0, 5 − x + y + z 6 0, x > 0, y > 0, z > 0. 4.81 Определить полином второй степени t2 + x1 t + x2 такой, что
Qn αj Pn βj интеграл
4.67 j=1 xj → max, j=1 aj xj = b, Z1
b > 0, xj > 0, αj > 0, βj > 0, aj > 0, j = 1, 2, . . . , n.
Pn αj Qn βj (t2 + x1 t + x2 )2 dt
4.68 j=1 cj xj → min, j=1 xj = b, −1
b > 0, xj > 0, cj > 0, αj > 0, βj > 0, j = 1, 2 . . . , n.
Pn cj Qn βj принимает наименьшее значение (задача о полиноме Лежандра второй
4.69 j=1 αj → min, j=1 xj = b,
xj степени).
b > 0, xj > 0, cj > 0, αj > 0, βj > 0, j = 1, 2 . . . , n. 4.82 Определить полином третьей степени t3 + x1 t2 + x2 t + x3 такой,
P n cj Pn
4.70 j=1 xα → min, j=1 aj xj = b, что интеграл
j
b > 0, α > 0, xj > 0, cj > 0, j = 1, 2 . . . , n. Z1
Pn α
Pn (t3 + x1 t2 + x2 t + x3 )2 dt
4.71 j=1 cj xj → max, j=1 aj xj = b,
b > 0, 0 < α < 1, xj > 0, cj > 0, j = 1, 2 . . . , n. −1
Pn α
Pn
4.72 j=1 cj xj → min, j=1 aj xj = b, принимает наименьшее значение (задача о полиноме Лежандра третьей
cj > 0, a = (a1 , . . . , an ) 6= 0, α = 2m, m ∈ N. степени).
Pn Pn
4.73 α
j=1 cj |xj | → min, j=1 aj xj = b,
4.83 Среди всех дискретных случайных величин, принимающих n
cj > 0, a = (a1 , . . . , an ) 6= 0, α > 1. значений, определить случайную величину с наибольшей энтропией.
Pn Pn α (Энтропией последовательности положительных чисел p1 , . . . , pn , рав-
4.74 j=1 cj xj → max(min), j=1 aj xj = b, Pn
b > 0, aj > 0, c = (c1 , . . . , cn ) 6= 0, α = 2m, m ∈ N. ных в сумме единице, называется число H = − pi ln(pi ).)
Pn Pn α
i=1
4.75 j=1 cj xj → max(min), j=1 aj |xj | = b, 4.84 Вписать в окружность прямоугольник максимальной площади.
96 Глава 4 7. Задачи 97

4.85 Вписать в окружность треугольник максимальной площади. 4.102 Среди всех тетраэдров с заданными основанием и высотой
4.86 Вписать в шар цилиндр максимального объема (задача Кепле- отыскать тетраэдр с наименьшей боковой поверхностью.
ра). 4.103 Среди всех тетраэдров с заданными основанием и площадью
4.87 Вписать в шар конус максимального объема. боковой поверхности отыскать тетраэдр с наибольшим объемом.
4.88 Среди конусов, вписанных в шар, определить конус с макси- 4.104 Среди всех тетраэдров, которые имеют заданную площадь
мальной площадью боковой поверхности. поверхности, отыскать тетраэдр, который имеет наибольший объем.
4.89 Вписать в шар пространства R n прямоугольный параллелепи- 4.105 На плоскости заданы три точки x1 , x2 , x3 . Определить точку
пед наибольшего объема. x0 такую, что сумма квадратов расстояний от точки x0 до точек x1 , x2 ,
x3 наименьшая.
4.90 Вписать в сферу тетраэдр наибольшего объема.
4.106 В пространстве Rn задано N точек x1 , . . . , xN и N положи-
4.91 Среди треугольников, имеющих заданный периметр, опреде-
тельных чисел m1 , . . ., mN . Определить такую точку x0 , что сумма с
лить треугольник наибольшей площади.
коэффициентами mi квадратов расстояний от точки x0 до x1 , . . . , xN
4.92 Среди всех n-угольников, имеющих заданный периметр, опре- наименьшая.
делить n-угольник наибольшей площади (задача Зенона).
4.107 Решить задачу 4.106 при условии, что точка x0 лежит на шаре
4.93 Вписать в окружность n-угольник максимальной площади.
единичного радиуса.
4.94 На диаметре AB окружности единичного радиуса взята точ-
4.108 Решить задачу 4.106 при условии, что точка x0 принадлежит
ка E, через которую провели хорду CD. Определить положение хорды,
при котором площадь четырехугольника ACBD максимальна. сфере единичного радиуса.
4.95 Определить в треугольнике такую точку, чтобы сумма отноше- 4.109 Определить расстояние от точки до эллипса. Сколько норма-
ний длин сторон и расстояний от этой точки до соответствующих сторон лей можно провести из точки к эллипсу (задача Аполлония)?
была минимальной. 4.110 Определить расстояние от точки до параболы.
4.96 Вписать в круг треугольник с наибольшей суммой квадратов 4.111 Определить расстояние от точки до гиперболы.
сторон. 4.112 Определить расстояние от точки x0 в пространстве Rn до
4.97 Через заданную точку внутри угла провести отрезок с концами гиперплоскости H = {x ∈ Rn |ha, xi = β}.
на сторонах угла так, чтобы площадь образованного треугольника была 4.113 Определить расстояние от точки до гиперплоскости в гильбер-
наименьшая. товом пространстве.
4.98 Через точку внутри угла провести отрезок с концами на сто- 4.114 Определить расстояние от точки до прямой в пространстве R n .
ронах угла так, чтобы периметр образованного треугольника был наи-
4.115 Определить минимум линейного функционала на единичном
меньшим.
шаре.
4.99 Определить четырехугольник с заданными сторонами наиболь-
4.116 В эллипс x2 /a2 +y 2 /b2 = 1 вписать прямоугольник наибольшей
шей площади.
площади со сторонами, параллельными осям координат.
4.100 Среди сегментов шара, которые имеют заданную площадь бо-
4.117 В эллипсоид x2 /a2 + y 2 /b2 + z 2 /c2 = 1 вписать прямоугольный
ковой поверхности, отыскать сегмент с наибольшим объемом (задача
параллелепипед наибольшего объема с ребрами, параллельными осям
Архимеда).
координат.
4.101 Определить на прямой точку C такую, что сумма расстояний
от точки C до заданных точек A и B минимальна.
98 Глава 4

4.118 Доказать неравенство между средними степенными

 n 1  n 1
1X p 1X q
ГЛАВА 5
|xi |p 6 |xi |q , −∞ < p 6 q 6 ∞, p 6= 0, q 6= 0.
n i=1 n i=1
Уравнение Эйлера и его обобщения
4.119 Доказать неравенство

X
n 1 X
n 1
p q
p q
|xi | 6 |xi | , −∞ < p 6 q 6 ∞.
i=1 i=1
1. Задача о брахистохроне
И. Бернулли в 1696 г. сформулировал такую задачу. Пусть в верти-
4.120 Доказать неравенство между средним арифметическим и сред-
кальной плоскости заданы две точки A и B. Определить путь AM B,
ним геометрическим:
двигаясь по которому под действием силы собственного веса, тело пере-
Y 1 местится из точки A в точку B за минимальное время.
n n
n 1X Выберем в плоскости систему координат (x, y) так, чтобы ось X
xi 6 xi для всех xi > 0, i = 1, . . . , n. была горизонтальной, а ось Y была направлена вниз. Будем считать,
n i=1
i=1 что точка A совпадает с началом координат, а точка B имеет координа-
ты (x1 , y1 ), x1 > 0, y1 > 0.
4.121 Доказать неравенство Гельдера Пусть y(x) — функция, которая задает уравнение кривой, соеди-
няющей точки A и B. В соответствии с законом Галилея скорость тела
X X  1 X 1
n n
p
n
q 1 1 в точке M (x, y(x)) зависит
p не от формы кривой y(x), а от ординаты y(x).

xi a i 6 |xi | p
|ai | q
, + = 1, p > 1.
p q Эта скорость равна 2gy(x), где g — ускорение свободного падения. По-
i=1 i=1 i=1 этому время перемещения тела p из точки (x, y(x)) в точку (x + dx,
p y(x) +
Убедиться, что при a = (a1 , . . . , an ) 6= 0 равенство имеет место лишь + dy) по кривой длины ds = 1 + (y 0 (x))2 dx равняется ds/ 2gy(x).
при |xi | = λ|ai |, i = 1, . . . , n. Отсюда возникает такая формализация задачи о брахистохроне:
4.122 Доказать неравенство Минковского Zx1 p
1 + (y 0 (x))2
J(y(·)) = p dx → inf, (5.1)
X
n 1 X
n 1 X
n 1 2gy(x)
p p p 0
|xi + yi |p 6 |xi |p + |yi |p .
i=1 i=1 i=1
y(0) = 0, y(x1 ) = y1 .

Убедиться, что при a = (a1 , . . . , an ) 6= 0 равенство имеет место лишь Задача о брахистохроне свелась к задаче определения непрерывной
при xi = λai , λ > 0, i = 1, . . . , n. функции y = y(x) на отрезке [0, x1 ], принимающей заданные значения на
концах отрезка y(0) = 0, y(x1 ) = y1 , на которой достигает минимального
значения функционал J(y(·)), заданный формулой (5.1).
Главное отличие этой задачи от задачи исследования на экстремум
функции одной или многих переменных состоит в том, что функци-
онал J(y(·)) определен на множестве кривых, соединяющих две точки,
100 Глава 5 2. Простейшая задача вариационного исчисления 101

x t0 6 t 6 t1 , называются допустимыми в задаче (5.2), (5.3), если они


A принадлежат пространству C 1 ([t0 , t1 ], R) и удовлетворяют граничным
x
условиям (5.3).
g Функционал J(x(·)) достигает на допустимой функции x b(·) сильный
s(x) локальный минимум (сильный локальный максимум), если существует
такое число ε > 0, что для всех допустимых функций x(·), которые
(x, y(x)) удовлетворяют условию
(x1,y1)
B kx(·) − x b(t)| < ε,
b(·)k0 = max |x(t) − x
t0 6t6t1
y
выполняется неравенство
Рис. 3. Задача о брахистохроне.
J(x(·)) > J(b
x(·)) (J(x(·)) 6 J(b
x(·))).

а множество всех таких кривых имеет бесконечную размерность. То есть Функционал J(x(·)) достигает на допустимой функции x b(·) слабый
задача о брахистохроне — это задача на экстремум функции бесконеч- локальный минимум (слабый локальный максимум), если существует
ного числа переменных. такое число ε > 0, что для всех допустимых функций x(·), которые
удовлетворяют условию
 
2. Простейшая задача вариационного исчисления 0 0
b(·)k1 = max
kx(·) − x b(t)|, max |x (t) − x
max |x(t) − x b (t)| < ε,
t0 6t6t1 t0 6t6t1
Простейшая задача вариационного исчисления (задача Лагранжа
на множестве функций с закрепленными концами) — это задача опре- выполняется неравенство
деления экстремума интегрального функционала J(x(·)) > J(b
x(·)) (J(x(·)) 6 J(b
x(·))).
Zt1
При определении сильного минимума (максимума) сравниваются
J(x(·)) = L(t, x(t), x0 (t)) dt → extr (5.2) значения функционала J(x(·)) на допустимых функциях x(·), значения
t0 которых близки к значениям функции x b(·), то есть таких, которые удо-
на множестве функций из пространства C 1 ([t0 , t1 ], R) непрерывно диф- влетворяют условию |x(t) − x
b(t)| < ε для всех t ∈ [t0 , t1 ].
ференцируемых скалярных функций на отрезке [t0 , t1 ], которые удовле- При определении слабого минимума (максимума) сравниваются зна-
творяют граничным условиям чения функционала J(x(·)) на допустимых функциях x(·), значения ко-
торых близки к значениям x b(·) и значения производной x0 (·) близки к
x(t0 ) = x0 , x(t1 ) = x1 . (5.3) значениям производной x 0
b (·), то есть
1
Пространство C ([t0 , t1 ], R) является банаховым, то есть полным норми- b(t)| < ε для всех t ∈ [t0 , t1 ],
|x(t) − x
рованным пространством относительно нормы
|x0 (t) − x
b0 (t)| < ε для всех t ∈ [t0 , t1 ].
kx(·)k1 = max { max |x(t)|, max |x0 (t)|}.
t0 6t6t1 t0 6t6t1
Если на функции xb(·) достигается сильный экстремум, то достигается
0
Функция L(t, x, x ), которая задает функционал J(x(·)), называется и слабый экстремум. Поэтому необходимые условия слабого экстрему-
интегрантом или лагранжианом задачи. Будем считать, что функ- ма будут необходимыми условиями сильного экстремума, а достаточные
ция L(t, x, x0 ) непрерывна по совокупности переменных вместе со сво- условия сильного экстремума будут достаточными условиями слабого
ими частными производными Lx (t, x, x0 ), Lx0 (t, x, x0 ). Функции x(t), экстремума.
102 Глава 5 2. Простейшая задача вариационного исчисления 103

Теорема 5.1 (Необходимое условие экстремума в простейшей существует для каждой функции h(·) ∈ H0 . Функция h(·) → δJ(b x(·), h(·))
задаче классического вариационного исчисления). Пусть функция называется первой вариацией Лагранжа функционала J(x(·)) в точ-
b(·) ∈ C 1 ([t0 , t1 ], R) — решение задачи (5.2), (5.3). Тогда она удовле-
x ке x
b(·).
творяет уравнению B. Преобразование первой вариации с помощью интегрирования ча-
стями. Проинтегрируем частями второе слагаемое в выражении (5.5),
d 0 учитывая, что функция L b 0 0 (t) = L0 0 (t, x b0 (t)) непрерывно диффе-
b(t), x
L0x (t, x b0 (t)) −
b(t), x b0 (t)) = 0.
b(t), x
L 0 (t, x (5.4) x x
dt x ренцируема, а функция h(·) ∈ H0 удовлетворяет нулевым граничным
условиям h(t0 ) = h(t1 ) = 0. Получим
Уравнение (5.4) называют уравнением Эйлера. Допустимая функ-
ция, которая удовлетворяет этому уравнение, называется экстремалью. Zt1 Zt1 
d b0
Таким образом, локальные экстремумы задачи (5.2), (5.3) являются экс- b 0x0 (t)h0 (t) dt
L = b 0x0 (t)h(t) t1 −
L Lx0 (t) h(t) dt
t0 dt
тремалями. Теорему докажем методом Лагранжа. При этом будем до- t0 t0
полнительно предполагать, что функция L0x0 (t, x b0 (t)) непрерывно
b(t), x
Zt1 
дифференцируема на отрезке [t0 , t1 ]. Затем докажем теорему методом d b0
Дюбуа-Реймона без этих дополнительных предположений. =− L 0 (t) h(t) dt.
dt x
t0
ДОКАЗАТЕЛЬСТВО.
A. Определение первой вариации Лагранжа. Обозначим через H0 Первая вариация Лагранжа функционала J(b
x(·)) будет равна
подпространство в пространстве C 1 ([t0 , t1 ], R) функций h(t), t0 6 t 6 t1 ,
которые удовлетворяют нулевым граничным условиям h(t0 ) = h(t1 ) = 0. Zt1 
b 0 d b0
Если функция x(·) допустима в задаче (5.2), (5.3), то функции x(·) + δJ(b
x(·), h(·)) = Lx (t) − Lx0 (t) h(t) dt. (5.6)
dt
+ λh(·), h(·) ∈ H0 также допустимые в задаче (5.2), (5.3). Рассмотрим t0
функцию
Функционал J(x(·)) достигает на функции x b(·) экстремума. Поэтому
Zt1 функция действительной переменной ϕ(λ) имеет локальный экстремум
ϕ(λ) = J(b
x(·) + λh(·)) = b0 (t) + λh0 (t)) dt.
b(t) + λh(t), x
L(t, x в точке λ = 0. Из теоремы Ферма слудует, что ϕ0 (0) = δJ(b x(·), h(·)) = 0
для всех h(·) ∈ H0 . Сравнивая с (5.6), получим такое условие локального
t0
экстремума:
Ограничения, которым удовлетворяет функция L(t, x, x0 ), разрешают Zt1 
дифференцировать под знаком интеграла (для этого достаточно, чтобы b 0x (t) − d L
L b 0x0 (t) h(t) dt = 0 (5.7)
dt
функция, стоящая под знаком интеграла, и ее производная по λ были t0
непрерывны). Продифференцируем ϕ(λ) и подставим λ = 0. Получим
для каждой функции h(·) ∈ H0 .
Zt1 C. Основная лемма классического вариационного исчисления (лем-
 ма Лагранжа).
ϕ0 (0) = L b 0x0 (t)h0 (t) dt,
b 0x (t)h(t) + L (5.5)
t0
Лемма 5.1 (Лемма Лагранжа). Пусть a(t) — непрерывная на
отрезке [t0 , t1 ] функция. Если
b 0 (t) = L0 (t, x
где L b(t), x b 0 0 (t) = L0 0 (t, x
b0 (t)), L b0 (t)). Поэтому граница
b(t), x
x x x x Zt1
a(t)h(t) dt = 0
lim 1 (J(b x(·))) = ϕ0 (0) = δJ(b
x(·) + λh(·)) − J(b x(·), h(·))
λ→0 λ t0
104 Глава 5 2. Простейшая задача вариационного исчисления 105

для любой непрерывно дифференцируемой функции h(t) с нулевыми Лемма 5.2 (Лемма Дюбуа-Реймона). Пусть b(t) — непрерывная
граничными условиями h(t0 ) = h(t1 ) = 0, то a(t) = 0 для всех t ∈ [t0 , t1 ]. на отрезке [t0 , t1 ] функция. Если для любой непрерывной на [t0 , t1 ]
ДОКАЗАТЕЛЬСТВО. функции η(t), которая равняется нулю в среднем, то есть
Лемму докажем методом от противного. Предположим, что суще-
Zt1
ствует точка τ ∈ [t0 , t1 ] такая, что a(τ ) 6= 0. Вследствие непрерывности
функции a(t) существует отрезок ∆ = [τ0 , τ1 ] ⊂ [t0 , t1 ], на котором функ- η(t) dt = 0,
ция a(t) сохраняет знак. Пусть a(t) > m > 0, t ∈ ∆. Построим при k > 1 t0
функцию ( выполняется равенство
e (t − τ0 )2k (t − τ1 )2k , t ∈ ∆,
h(t) =
0, t 6= ∆. Zt1
b(t)η(t) dt = 0,
Она непрерывно дифференцируема и удовлетворяет нулевым граничным
условиям. Поэтому e
h(·) ∈ H0 . В то же время t0

Zt1 Z Z то функция b(t) постоянна на [t0 , t1 ], то есть b(t) = C = const,


a(t)e
h(t) dt = a(t)e
h(t) dt > m e
h(t) dt > 0. t ∈ [t0 , t1 ].
t0 ∆ ∆ ДОКАЗАТЕЛЬСТВО.
Это противоречие доказывает справедливость леммы. Лемму докажем при помощи метода от противного. Пусть функ-
ция b(t) не постоянна на [t0 , t1 ]. Тогда существуют точки τ1 , τ2 ∈ (t0 , t1 )
Сопоставляя A, B, C, убеждаемся в том, что теорема 5.1 доказана.
такие, что b(τ1 ) 6= b(τ2 ). Пусть τ1 < τ2 и b(τ1 ) > b(τ2 ). Вследствие непре-
рывности b(t) существует такое ε > 0, что интервалы ∆1 = (τ1 −ε, τ1 +ε),
Для доказательства мы использовали так называемый метод ва- ∆2 = (τ2 − ε, τ2 + ε) не пересекаются и
риаций. С его помощью доказывают необходимые условия экстремума.
Суть метода можно объяснить так. Пусть x b — точка, которая исследу- b1 = min b(t) > b2 = max b(t).
ется на экстремум в задаче f (x) → inf, x ∈ C. Тогда строят непрерыв- t∈∆1 t∈∆2

ное отображение λ → x(λ), λ ∈ R+ так, чтобы x(0) = x b и x(λ) ∈ C,


Построим функцию
0 6 λ 6 λ0 . Такую кривую естественно называть вариацией аргумента
функционала f (x). Пусть ϕ(λ) = f (x(λ)). Предположим, что функция 
 2 2
ϕ(λ) дифференцируема по λ в точке λ = 0. Если x b — это действительно (t − τ1 + ε) (t − τ1 − ε) , t ∈ ∆1 ,
точка минимума, то должно выполняться неравенство ϕ0 (+0) > 0. Если ηe(t) = −(t − τ2 + ε) (t − τ2 − ε)2 , t ∈ ∆2 ,
2

0,
удается построить достаточно массивное множество вариаций аргумен- t 6= ∆1 ∪ ∆2 .
та, то неравенства ϕ0 (+0) > 0, которые относятся ко всем вариациям,
дают необходимое условие минимума. Она удовлетворяет требованиям леммы: непрерывна и
Чтобы доказать теорему 5.1, мы использовали вариации по направ-
лению x(λ) = x b + λh. При доказательстве необходимого условия Вейер- Zt1
штрасса, а также принципа максимума Понтрягина используют вариа- ηe(t) dt = 0.
ции другого типа — так называемые «игольчатые» вариации. t0
Выведем уравнения Эйлера методом Дюбуа-Реймона без дополни-
тельного предположения о том, что производная L0x0 (t, x b0 (t)) непре-
b(t), x
рывно дифференцируема.
106 Глава 5 2. Простейшая задача вариационного исчисления 107

Тем не менее для всех непрерывно дифференцируемых функций h(t) таких, что h(t0 ) =
= h(t1 ) = 0. Поэтому
Zt1 Z Z
Zt1
b(t)e
η (t) dt = b(t)e
η (t) dt + b(t)e
η (t) dt d t1
(A(t)h(t)) dt = A(t)h(t) t0 = 0.
t0 ∆1 ∆2 dt
Z t0
> (b1 − b2 ) ηe(t) dt > 0. Функция h0 (t) непрерывна и равняется нулю в среднем,
∆1 Zt1
h0 (t) dt = h(t1 ) − h(t0 ) = 0.
Это противоречие доказывает справедливость леммы.
t0

Лемма 5.3. Пусть a(t), b(t) — непрерывные на отрезке [t0 , t1 ] Из уравнения (5.8) и леммы 5.2 вытекает, что b(t) − A(t) = C = const,
функции и для любой непрерывно дифференцируемой на [t0 , t1 ] функ- или
ции h(t) такой, что h(t0 ) = h(t1 ) = 0, выполняется условие Zt
b(t) = a(t) dt + C.
Zt1 t0
(a(t)h(t) + b(t)h0 (t)) dt = 0. Отсюда делаем вывод, что функция b(t) дифференцируема и b0 (t) = a(t).
t0 Лемма доказана.
Необходимое условие локального экстремума функционала J(x(·))
Тогда функция b(t) непрерывно дифференцируема на [t0 , t1 ] и b0 (t) = простейшей задачи вариационного исчисления имеет вид
= a(t), t ∈ [t0 , t1 ].
Zt1
ДОКАЗАТЕЛЬСТВО. x(·), h(·)) = (L
δJ(b b 0x (t)h(t) + L
b 0x0 (t)h0 (t)) dt = 0 (5.9)
Обозначим через A(t) первообразную функции a(t), равную нулю
при t = t0 , то есть t0
Zt для всех функций h(·) ∈ H0 . Применяя лемму 5.3, получим, что функ-
A(t) = a(t) dt. b 0 0 (t) = L0 0 (t, x
ция L b0 (t)) непрерывно дифференцируема и
b(t), x
x x
t0 d 0
b0 (t)) = L0x (t, x
b(t), x
L 0 (t, x b0 (t)).
b(t), x (5.10)
Тогда dt x
a(t)h(t) = A0 (t)h(t) Это уравнение Эйлера в дифференциальной форме.
d Преобразуем уравнение (5.9), интегрируя частями первое слагаемое.
= (A(t)h(t)) − A(t)h0 (t),
dt Получим
откуда Zt1
x(·), h(·)) = (L
δJ(b b 0 (t)h(t) + L
b 0 0 (t)h0 (t)) dt
Zt1 Zt1 Zt1 x x
0 d
(a(t)h(t)+b(t)h (t)) dt= (A(t)h(t)) dt+ (b(t)−A(t))h0 (t) dt = 0 t0
dt Zt1 Zt 
t0 t0 t0
(5.8) = − L b 0x0 (t) h0 (t)) dt = 0.
b 0x (u) du + L
t0 t0
108 Глава 5 3. Интегралы уравнения Эйлера 109

Функция h(·) ∈ H0 . Поэтому функция h0 (·) непрерывна и равняется 3. Интегралы уравнения Эйлера
нулю в среднем. Применяя лемму 5.2, получим
Рассмотрим примеры задач, для которых уравнение Эйлера инте-
Zt грируется.
b 0x0 (t) =
L b 0x (u) du + C,
L 1. Функция L не зависит от x0 : L = L(t, x). Уравнение Эйлера
t0 имеет вид L0x (t, x(t)) = 0. Это вообще не дифференциальное уравне-
ние. Решения уравнения не содержат неизвестных констант и могут не
или
Zt проходить через граничные точки (t0 , x0 ), (t1 , x1 ). Лишь тогда, когда ре-
шение уравнения L0x (t, x(t)) = 0 проходит через эти точки, существует
L0x0 (t, x b0 (t))
b(t), x = L0x (u, x b0 (u)) du + C.
b(u), x (5.11)
функция, которая может давать экстремум функционала.
t0
ПРИМЕР 5.2. Отыскать экстремали задачи
Это уравнение Эйлера в интегральной форме.
По предположению, функция L0x (t, x b0 (t)) непрерывна на [t0 , t1 ],
b(t), x Zt1
1
а функция x
b(·) ∈ C ([t0 , t1 ], R). Поэтому обе части уравнения (5.11) мож-
J(x(·)) = x2 (t) dt → extr,
но дифференцировать и получить уравнение Эйлера в дифференциаль-
ной форме (5.10). Его можно записать в таком виде: t0

00
x(t0 ) = x0 , x(t1 ) = x1 .
L0x (t, x b0 (t)) − Lx0 t (t, x
b(t), x b0 (t)) − L00x0 x (t, x
b(t), x b0 (t))b
b(t), x x0 (t)
− L0x0 x0 (t, x b0 (t))b
b(t), x x00 (t) = 0. Уравнение Эйлера имеет вид x(t) = 0. Экстремаль x(t) = 0 проходит
через граничные точки, если x0 = 0, x1 = 0. Если это условие не выпол-
Это нелинейное дифференциальное уравнение второго порядка отно- няется, то экстремума функционал на непрерывных функциях не дости-
сительно искомой функции x(t). Его общее решение зависит от двух гает.
неизвестных констант. Эти константы определяют, используя граничные Ответ. Если x0 = 0, x1 = 0, то x(t) = 0 — единственная экстре-
условия (5.3). маль. Если x0 6= 0 или x1 6= 0, то допустимых экстремалей не существу-
ет. 4
ПРИМЕР 5.1. Отыскать экстремали задачи
π
2. Функция L линейно зависит от x0 :
Z2  

J(x(·)) = (x0 )2 (t) − x2 (t) dt → extr, x(0) = 0, x π = 1. L(t, x, x0 ) = M (t, x) + x0 N (t, x).
2
0
Уравнение Эйлера имеет вид Mx0 (t, x(t)) − Nt0 (t, x(t)) = 0. Это также не
0
Поскольку L(t, x, x ) = (x ) − x , то0 2
= −2x, 2
= 2x ,L0x L0x0 0 d 0 00 дифференциальное уравнение, и в общем случае его решения не удовле-
dt Lx0 = 2x .
Уравнение Эйлера имеет вид x00 + x = 0. Его общее решение творяют граничным условиям. Если же Mx0 − Nt0 ≡ 0, то M dt + N dx есть
точный дифференциал и интеграл
x(t) = C1 cos t + C2 sin t.
Zt1  Zt1
Из граничных условий вычислим C1 = 0, C2 = 1. d
J(x(·)) = M +N dt = (M dt + N dx)
Ответ. Функция x(t) = sin t — единственная допустимая экстре- dt
маль. 4 t0 t0

В этом примере уравнение Эйлера легко интегрируется. Тем не ме- не зависит от пути интегрирования. Тогда вариационная задача не имеет
нее такое возможно не всегда. смысла.
110 Глава 5 3. Интегралы уравнения Эйлера 111

ПРИМЕР 5.3. Отыскать экстремали задачи Функционал l(x(·)) зависит лишь от x0 (·). Поэтому он может достигать
экстремума лишь на отрезках прямых линий. 4
Z1

J(x(·)) = x2 (t) + t2 x0 (t) dt → extr, 4. Функция L зависит лишь от t, x0 : L = L(t, x0 ). Уравнение Эйлера
d 0
имеет вид dt Lx0 (t, x0 ) = 0 или L0x0 (t, x0 ) = C. Этот так называемый ин-
0
теграл импульса. Если уравнение не решается относительно x0 , то его
x(0) = 0, x(1) = a. можно решить, если ввести определенным образом выбранный параметр.
Уравнение Эйлера имеет вид x(t) = t. Первое граничное условие удо- ПРИМЕР 5.6. Отыскать экстремали задачи
влетворяется, а второе — лишь при условии a = 1. Если a 6= 1, то экс-
тремалей, которые удовлетворяют граничным условиям, не существует. Zt1 p
Ответ. Если a = 1, то x b(t) = t — единственная экстремаль. Если 1 + (x0 )2 (t)
J(x(·)) = dt → extr,
же a 6= 1, то допустимых экстремалей не существует. 4 t
t0
ПРИМЕР 5.4. Отыскать экстремали задачи x(t0 ) = x0 , x(t1 ) = x1 .
Zt1
 Уравнение Эйлера L0x0 (t, x(t)) = C имеет вид
J(x(·)) = x(t) + tx0 (t) dt → extr,
t0 x0
p = C.
x(t0 ) = x0 , x(t1 ) = x1 . t 1 + (x0 )2
Уравнение Эйлера превращается в тождественность 1 = 1. Выражение
Это уравнение можно проинтегрировать, если ввести параметр. Пусть
под интегралом есть точный дифференциал, и интеграл не зависит от x0 = tg(u). Тогда из уравнения Эйлера
пути интегрирования
Zt1 Zt1 x0
t= p = C1 sin(u),
J(x(·)) = (x dt + t dx) = d(tx) = t1 x1 − t0 x0 . C 1 + (x0 )2
t0 t0
где C1 = 1/C. Чтобы отыскать выражение x через u, используем равен-
Ответ. Вариационная задача не имеет смысла. 4 ство x0 = dx
dt = tg(u). Тогда
3. Функция L зависит лишь от x0 . Уравнение Эйлера имеет
dx = x0 dt = tg(u) · C1 cos(u) du = C1 sin(u) du.
вид L00x0 x0 (x0 )x00 = 0. Решениями такого уравнения будут функции ви-
да x(t) = C1 t + C2 . Поэтому экстремалями задачи будут только прямые Интегрируя это уравнение, получим x = −C1 cos(u) + C2 . Теперь мы
линии. имеем зависимость переменных x, t от параметра u:
ПРИМЕР 5.5. Среди всех кривых, соединяющих точки A(t0 , x0 ),
B(t1 , x1 ), определить кривую, имеющую наименьшую длину. x = −C1 cos(u) + C2 , t = C1 sin(u).
Длина дуги кривой, соединяющей точки A(t0 , x0 ), B(t1 , x1 ), вычис-
ляется по формуле Исключая параметр, получим t2 + (x − C2 )2 = C12 . Это уравнение окруж-
ности. Неизвестные константы C1 , C2 определяем из граничных условий.
Zt1 p Ответ. Допустимые экстремали задачи определяются уравнениями
l(x(·)) = 1 + (x0 )2 (t) dt, x(t0 ) = x0 , x(t1 ) = x1 . x = −C1 cos(u)+C2 , t = C1 sin(u) или уравнением t2 +(x−C2 )2 = C12 . 4
t0
112 Глава 5 3. Интегралы уравнения Эйлера 113

5. Функция L зависит лишь от x, x0 . В этом случае уравнение Итак, формализованная задача имеет вид
Эйлера имеет первый интеграл (интеграл энергии)
Zb p
L(b 0
b (t)) − x
x(t), x b 0
(t)L0x0 (b b0 (t))
x(t), x = C. S(x(·)) = 2π y(x) 1 + (y 0 )2 (x) dx → inf, y(a) = a1 , y(b) = b1 .
a
Чтобы убедиться в этом, вычислим
2. Составим уравнение Эйлера. Подынтегральная функция зависит
d лишь от y, y 0 . Поэтому уравнение Эйлера можно записать в виде
(L − x0 L0x0 ) = L0x x0 + L0x0 x00 − x00 L0x0 − L00x0 x (x0 )2 − L00x0 x0 x0 x00
dt   p y(y 0 )2
d 0 y 1 + (y 0 )2 − p =C
0 0
= x L x − Lx 0 . 1 + (y 0 )2
dt
или y
Уравнение L − x 0
L0x0 = C можно интегрировать, вводя параметр. p = C.
1 + (y 0 )2
Это уравнение можно проинтегрировать, если ввести параметр. Пусть
y 0 = sh(u). Тогда y = C ch(u),
dy C sh(u) du
dx = = = C du.
y0 sh(u)
Отсюда x = Cu + C1 . Итак, минимальная поверхность вращения зада-
ется кривой, уравнение которой в параметрической форме имеет вид y =
= C ch(u), x = Cu + C1 . Исключая параметр, получаем
 
x − C1
y(x) = C ch .
C
Это уравнение цепных линий, от вращения которых получаются поверх-
ности, называемые катеноидами.
Рис. 4. Поверхность вращения Ответ. Наименьшая  поверхность получается от вращения кри-
вой y(x) = C ch x−C
C
1
.4
ПРИМЕР 5.7 (ЗАДАЧА О НАИМЕНЬШЕЙ ПОВЕРХНОСТИ ВРАЩЕНИЯ). ПРИМЕР 5.8 (ЗАДАЧА О БРАХИСТОХРОНЕ).
Определить кривую y = y(x), проходящую через точки A(a, a 1 ), B(b, b1 ),
Zx1 p
от вращения которой вокруг оси OX получается поверхность минималь- 1 1 + (y 0 )2 (x)
ной площади. J(x(·)) = √ p dx → inf, y(0) = 0, y(x1 ) = y1 .
2g y(x)
1. Формализация задачи. Площадь поверхности вращения вычисля- 0
ется по формуле Функция L под знаком интеграла зависит только от y, y 0 . Поэтому урав-
нение Эйлера имеет первый интеграл L−y 0 L0y0 = C. Это уравнение имеет
Zb p вид p
S(y(·)) = 2π y(x) 1 + (y 0 )2 (x) dx. 1 + (y 0 )2 (y 0 )2
a √ −√ p = C.
y y 1 + (y 0 )2
114 Глава 5 4. Векторнозначные функции 115

x 4. Обобщения простейшей задачи вариационного


q исчисления. Векторнозначные функции
Рассмотрим задачу на экстремум функционала
(x(q),y(q))
Zt1
J(x(·)) = L(t, x(t), x0 (t)) dt → extr, (5.12)
y (x1,y2)
t0

Рис. 5. Циклоида x(t0 ) = x0 , x(t1 ) = x1 ,



После упрощения получаем уравнение y 1 + (y 0 )2 (x) = C1 . Введем па- в классе функций x(t)=(x1 (t), x2 (t), . . . , xn (t)) из пространства C 1 ([t0 , t1 ], Rn )
раметр с помощью подстановки y 0 = ctg(u), тогда непрерывно дифференцируемых на отрезке [t0 , t1 ] функций. Считает-
ся, что функция L : R × Rn × Rn → R под знаком интеграла непре-
C1 C1 рывна и имеет непрерывные частные производные первого порядка по
y= = C1 sin2 (u) = (1 − cos(2u)), всем 2n + 1 аргументам. Как и в простейшей задаче вариационного ис-
1 + ctg2 (u) 2
dy 2C1 sin(u) cos(u) числения, функции x(t), t0 6 t 6 t1 , будем называть допустимыми в за-
dx = 0 = = 2C1 sin2 (u) du = C1 (1 − cos(2u)) du, даче (5.12), если они принадлежат пространству C 1 ([t0 , t1 ], Rn ) и удо-
y ctg(u) влетворяют граничным условиям x(t0 ) = x0 , x(t1 ) = x1 . Обозначим
 
sin(2u) C1 через H0 подпространство пространства C 1 ([t0 , t1 ], Rn ), образованное
x = C1 u − + C2 = (2u − sin(2u)) + C2 .
2 2 функциями, удовлетворяющими нулевым граничным условиям h(t0 ) =
= h(t1 )=0. Заметим, что функции x(·) и x(·) + h(·), h(·) ∈ H0 , одновре-
В параметрической форме уравнение искомой кривой имеет вид менно допустимые или недопустимые в задаче (5.12).
C1 C1 Теорема 5.2. Пусть функция xb(·) = (b bn (·)) доставляет
x1 (·), . . . , x
x= (2u − sin(2u)) + C2 , y= (1 − cos(2u)).
2 2 локальный экстремум задачи (5.12). Тогда она удовлетворяет систе-
ме уравнений Эйлера
Если положить 2u = θ и принять во внимание, что C2 = 0 так
как y(0) = 0, то получим уравнения семьи циклоид d 0
L0xk (t, x(t), x0 (t)) = L 0 (t, x(t), x0 (t)), k = 1, n.
C1 C1 dt xk
x= (θ − sin(θ)), y= (1 − cos(θ)),
2 2
ДОКАЗАТЕЛЬСТВО.
где C1 /2 — радиус катящегося круга. Этот радиус определяется из усло- Докажем теорему методом Лагранжа. Будем считать, что функция L
вия прохождения циклоиды через точку B(x1 , y1 ). удовлетворяет условиям, необходимым для применения леммы Лагран-
Ответ. Брахистохрона — это циклоида. 4 b
жа (функции L0x0 (t, x(t), b0 (t)) непрерывно дифференцируемы). Отыщем
x
k
первую вариацию Лагранжа функционала J(x(·)). Для этого используем
116 Глава 5 4. Векторнозначные функции 117

b + λh(·)), h(·) ∈ H0 . Вычислим


функцию ϕ(λ) = J(x(·) ПРИМЕР 5.9. Отыскать экстремали задачи

Zt1X
n Z2
π

0 b0 (t))hk (t)+
b(t), x 
ϕ (0) = L0xk (t, x J(x(·), y(·)) = (x0 )2 (t) + (y 0 )2 (t) + 2x(t)y(t) dt → extr,
t0 k=1
0
n
X 
0 x(0) = 0, x(π/2) = 1, y(0) = 0, y(π/2) = −1.
+ b
L0x0 (t, x(t), b (t))h0k (t) dt.
x (5.13)
k
k=1 Решение. Составим систему дифференциальных уравнений Эйлера.
0
Производная ϕ (0) существует вследствие непрерывности функций Она имеет вид
x00 − y = 0, y 00 − x = 0.
b
L0xk (t, x(t), b0 (t)),
x b
L0x0 (t, x(t), b0 (t)),
x k = 1, n.
k Исключая одну из переменных, например y, получим уравнение x(4) −
Поэтому для каждой функции h(·) ∈ H0 существует − x = 0. Интегрируя его, получим общее решение системы уравнений

b 1 b b
 x(t) = C1 et + C2 e−t + C3 cos(t) + C4 sin(t),
δJ(x(·), h(·)) = lim J(x(·) + λh(·)) − J(x(·)) = ϕ0 (0).
λ→0 λ y(t) = C1 et + C2 e−t − C3 cos(t) − C4 sin(t).
Преобразуем выражение (5.13), интегрируя частями слагаемые, учиты-
вая граничные условия hk (t0 ) = hk (t1 ) = 0, k = 1, n. Получим 2. Используем граничные условия и получим C1 = 0, C2 = 0, C3 = 0,
C4 = 1.
b
δJ(x(·), h(·)) = Ответ. Функции x(t) = sin(t), y(t) = − sin(t) — экстремали зада-
чи. 4
n 
Zt1 X 
b b0 (t)) d 0 b b 0
ПРИМЕР 5.10. Составить дифференциальное уравнение линии рас-
L0xk (t, x(t), x − Lx0 (t, x(t), x (t)) hk (t) dt.
dt k пространения света в оптически неоднородной среде, где скорость рас-
t0 k=1
пространения v(x, y, z).
В соответствии с первым необходимым условием экстремума функциона- Решение. 1. Формализация. В соответствии с принципом Ферма свет
ла в точке x b(·) выполняется условие δJ(x
b(·), h(·)) = 0 для всех h(·) ∈ H0 . проходит из точки A(x0 , y0 , z0 ) в точку B(x1 , y1 , z1 ) по линии, вдоль ко-
Это условие выполняется и для функции h(·) = (0, . . . , 0, hj (·), 0, . . . , 0), торой время T прохождения будет минимальным. Если уравнение ли-
hj (·) ∈ H0 . Эта функция имеет лишь одну ненулевую компоненту hj (·), нии y = y(x), z = z(x), то
для которой выполняется уравнение
Zx1 p
Zt1  (1 + (y 0 )2 (x) + (z 0 )2 (x))
T = dx.
b (t)) − d L0x0 (t, x
b(t), x
L0xj (t, x
0
b0 (t)) hj (t) dt = 0.
b(t), x v(x, y, z)
dt j x0
t0
Итак, формализованная задача такая:
Применяя лемму Лагранжа, получим
d Zx1 p
b
L0xj (t, x(t), b0 (t))
x b
= L0x0j (t, x(t), b0 (t)),
x j = 1, n. (1 + (y 0 )2 (x) + (z 0 )2 (x))
dt T (y(·), z(·)) = dx → min,
v(x, y, z)
x0
Теорема доказана.
Теорему 5.2 можно доказать и методом Дюбуа-Реймона. y(x0 ) = y0 , z(x0 ) = z0 , y(x1 ) = y1 , z(x1 ) = z1 .
118 Глава 5 4. Векторнозначные функции 119

2. Система уравнений Эйлера для такого функционала имеет вид Ответ. Дифференциальные уравнения (5.16), (5.17) определяют
p уравнение геодезической линии на поверхности. 4
∂v 1 + (y 0 )2 (x) + (z 0 )2 (x) d y0 1
2
+ p = 0,
∂y v (x, y, z) dx v(x, y, z) 1 + (y 0 )2 (x) + (z 0 )2 (x)
(5.14)
p
∂v 1 + (y 0 )2 (x) + (z 0 )2 (x) d z0 1
2
+ p = 0.
∂z v (x, y, z) dx v(x, y, z) 1 + (y ) (x) + (z 0 )2 (x)
0 2

(5.15)
Ответ. Дифференциальные уравнения (5.14), (5.15) определяют ли-
нии распространения света в оптически неоднородной среде. 4
ПРИМЕР 5.11 (ГЕОДЕЗИЧЕСКИЕ ЛИНИИ). Составить уравнение линии
наименьшей длины, которая лежит на данной поверхности и соединяет
две точки. Такая линия называется геодезической.
Решение. 1. Формализация. Пусть поверхность задана уравнени-
ем r = r(u, v), а линия на поверхности определена уравнением u = u(t),
v = v(t). Длина отрезка линии между точками, которые отвечают зна-
чениям t0 , t1 параметра t, равняется
Zt1 p Рис. 6. Геодезические линии на цилиндре
J(u(·), v(·)) = E(u0 )2 + 2F u0 v 0 + G(v 0 )2 dt,
t0 ПРИМЕР 5.12 (ГЕОДЕЗИЧЕСКИЕ ЛИНИИ НА ЦИЛИНДРЕ). Составить
уравнение линии наименьшей длины, которая лежит на цилиндре и со-
где E, F , G — коэффициенты первой квадратичной формы,
      единяет две точки.
∂r ∂r ∂r ∂r ∂r ∂r Решение. Пусть r = (a cos(θ), a sin(θ), z) — уравнение цилиндра.
E= , , F = , , G= , . Роль параметров u, v сыграют переменные θ, z. Первая квадратичная
∂u ∂u ∂u ∂v ∂v ∂v
форма имеет коэффициенты: E = a, F = 0, G = 1. Уравнения геодезиче-
Итак, формализованная задача такая:
ских линий для такой поверхности будут иметь вид
Zt1 p
d a2 θ 0 d z0
J(u(·), v(·)) = E(u0 )2 + 2F u0 v 0 + G(v 0 )2 dt → min, p = 0, p = 0,
dt a2 (θ0 )2 + (z 0 )2 dt a2 (θ0 )2 + (z 0 )2
t0
u(t0 ) = u0 , v(t0 ) = v0 , u(t1 ) = u1 , v(t1 ) = v1 . откуда dz
dθ = C, z = Cθ + A.
Итак, геодезические линии на цилиндре — это винтовые линии. 4
2. Уравнения Эйлера такой задачи имеют вид
Eu (u0 )2 + 2Fu u0 v 0 + Gu (v 0 )2 2(Eu0 + F v 0 ) ПРИМЕР 5.13 (ГЕОДЕЗИЧЕСКИЕ ЛИНИИ НА СФЕРЕ). Составить уравне-
p =p ; (5.16) ние линии наименьшей длины, которая лежит на сфере и соединяет две
E(u0 )2 + 2F u0 v 0 + G(v 0 )2 E(u0 )2 + 2F u0 v 0 + G(v 0 )2 точки.
Ev (u0 )2 + 2Fv u0 v 0 + Gv (v 0 )2 2(F u0 + Gv 0 ) Решение. Запишем уравнение сферы в виде
p =p . (5.17)
E(u0 )2 + 2F u0 v 0 + G(v 0 )2 E(u0 )2 + 2F u0 v 0 + G(v 0 )2 r = r(θ, ϕ) = (R cos(θ) sin(ϕ), R sin(θ) sin(ϕ), R cos(ϕ)).
120 Глава 5 5. Функционалы, зависящие от производных высшего порядка 121

5. Функционалы, зависящие от производных высшего


порядка
Рассмотрим задачу исследования на экстремум функционала

Zt1
J(x(·)) = L(t, x(t), x0 (t), . . . , x(n) (t)) dt → extr (5.18)
t0
(k)
x (t0 ) = x0k , x(k) (t1 ) = x1k , k = 0, 1, . . . , n − 1 (5.19)

в пространстве C n ([t0 , t1 ], R) n раз непрерывно дифференцируемых


функций. Будем считать, что функция L(t, x, x0 , . . . , x(n) ) имеет непре-
рывные частные производные первого порядка по всем аргументам.
Функции x(·) из пространства C n ([t0 , t1 ], R) будем называть допу-
Рис. 7. Геодезические линии на сфере стимыми в задаче (5.18), если они удовлетворяют граничным усло-
виям (5.19). Обозначим через H0n подпространство в пространстве
C n ([t0 , t1 ], R), образованное функциями, удовлетворяющими граничным
Тогда E = R2 sin2 (ϕ), F = 0, G = R2 и уравнение Эйлера имеет вид
условиям h(k) (t0 ) = h(k) (t1 ) = 0, k = 0, 1, . . . , n − 1. Если x(·) — до-
q пустимая функция в задаче (5.18), (5.19), то такими же будут и функ-
θ0 sin2 (ϕ) = C 1 + sin2 (ϕ)(θ0 )2 , ции x(·) + h(·), h(·) ∈ H0n .
откуда Теорема 5.3. Пусть допустимая функция x b(·) ∈ C n ([t0 , t1 ], R)
дает локальный экстремум функционала задачи (5.18), (5.19). Тогда
−Cd(ctg(ϕ)) она удовлетворяет уравнению Эйлера–Пуассона
θ0 = p ,
(1 − C 2 ) − C 2 ctg2 (ϕ)
p d 0 d2 dn
θ(ϕ) = arccos(C1 ctg(ϕ)) + C2 , C1 = C/ (1 − C 2 ), L0x − Lx0 + 2 L0x00 − · · · + (−1)n n L0x(n) = 0. (5.20)
dt dt dt
R cos(ϕ) = AR cos(θ) sin(ϕ) + BR sin(θ) sin(ϕ),
cos(C2 ) sin(C2 ) Это уравнение можно записать в виде
A= , B= .
C1 C1 n
X dk 0
(−1)k b0 (t), . . . , x
b(t), x
L (k) (t, x b(n) (t)) = 0.
В декартовых координатах это означает, что экстремаль лежит на сфере dtk x
k=0
и удовлетворяет уравнению z = Ax + By. Это уравнение плоскости,
которая проходит через центр сферы и пересекает сферу по большой ДОКАЗАТЕЛЬСТВО.
окружности. Итак, геодезическая линия на сфере — это дуга большой Докажем теорему методом Лагранжа. Для этого необходимо пред-
окружности. 4 положить, что существуют непрерывные производные

dk 0
b0 (t), . . . , x
b(t), x
L (k) (t, x b(n) (t)), k = 1, n.
dtk x
122 Глава 5 5. Функционалы, зависящие от производных высшего порядка 123

Вычислим первую вариацию Лагранжа функционала J(x(·)). Для этого Равенство нулю первой вариации (5.21) функционала J(x(·)) можно ис-
отыщем производную ϕ0 (0) функции ϕ(λ) = J(b
x(·) + λh(·)), h(·) ∈ H0n , пользовать, чтобы вывести уравнение Эйлера–Пуассона в интегральной
в точке λ = 0, форме. Для этого k-е слагаемое в сумме (5.21) проинтегрируем частями
и получим
ϕ0 (0) = δJ(b
x(·), h(·)) Zt1 Zt1 Zt Zt 
Zt1X n  b x(k) (t)h
L (k)
(t) dt = (−1) n−k
··· b x(k) (t) dt . . . dt h(n) (t) dt.
L
0 0 (n) (k)
= b(t), x
Lx(k) (t, x b (t), . . . , x
b (t))h (t) dt. (5.21) t0 t0 t0 t0
t0 k=0
Применим теперь обобщенную лемму Дюбуа-Реймона. Получим инте-
В соответствии с первым необходимым условием экстремума функцио- гральное уравнение Эйлера–Пуассона
нала в точке xb(·) выполняется равенство δJ(b x(·), h(·)) = ϕ0 (0) = 0 для Zt Zt Zt
n
всех h(·) ∈ H0 . Чтобы применить лемму Лагранжа, преобразуем выра- b x(n) − b x(n−1) (t) dt + b x(n−2) (t) dt dt + · · ·
жение (5.21), интегрируя частями k раз k-е слагаемое под знаком инте- L L L
грала при k = 1, 2, . . . , n. Учитывая нулевые граничные условия, которым t0 t0 t0
удовлетворяет функция h(·) ∈ H0n , получим Zt Zt
+ (−1) n
··· b x (t) dt . . . dt
L
δJ(b
x(·), h(·)) t0 t0
Zt1X
n k
 = C0 + C1 (t − t0 ) + · · · + Cn−1 (t − t0 )n−1 .
k d 0 0 (n)
= b(t), x
(−1) k Lx(k) (t, x b (t), . . . , x
b (t)) h(t) dt = 0.
dt Если функция x(·) непрерывно дифференцируема 2n раз, то, дифферен-
t0 k=0
цируя интегральное уравнение n раз, получим дифференциальное урав-
Применим теперь лемму Лагранжа. Получим уравнение (5.20). Теорема нение Эйлера–Пуассона. Если функция L(t, x, x0 , . . . , x(n) ) имеет непре-
доказана. рывную производную порядка n + 1 по всем аргументам, то полные
производные можно отыскать по правилу дифференцирования сложных
Докажем теорему методом Дюбуа-Реймона. функций.
Лемма 5.4 (Обобщенная лемма Дюбуа-Реймона). Если непре- ПРИМЕР 5.14. Отыскать экстремали функционала
рывная на отрезке [t0 , t1 ] функция M (t) удовлетворяет равенству
Z1

Zt1 J(x(·)) = 1 + (x00 )2 (t) dt → extr,
M (t)h(n) (t) dt = 0 0
t0 x(0) = 0, x(1) = 1, x0 (0) = 1, x0 (1) = 1.
для любой функции h(·) ∈ H0n , то Решение. 1. Уравнение Эйлера–Пуассона имеет вид

M (t) = C0 + C1 (t − t0 ) + · · · + Cn−1 (t − t0 )n−1 . d2


(2x00 ) = 0
dt2
Чтобы убедиться в этом, достаточно применить лемму Дюбуа- или x(4) = 0. Общее решение этого уравнения такое:
Реймона к функции M (t) − [C0 + C1 (t − t0 ) + · · · + Cn−1 (t − t0 )n−1 ].
x(t) = C1 t3 + C2 t2 + C3 t + C4 .
124 Глава 5 6. Функционалы, зависящие от функций многих переменных 125

2. Неизвестные константы C1 , C2 , C3 , C4 вычислим, используя гра- 2. Используя граничные условия, получим


ничные условия. Получим C1 = 0, C2 = 0, C3 = 1, C4 = 0. 2
ρ
Ответ. Единственная допустимая экстремаль функционала задачи y=− x2 − l 2 .
— прямая x = t. 4 24µ

ПРИМЕР 5.15. Отыскать экстремали функционала Ответ. Единственная допустимая экстремаль функционала зада-
ρ
2
π
чи — кривая y = − 24µ x2 − l 2 . 4
Z2
 Рассмотрим задачу со старшими производными на множестве век-
J(x(·)) = (x00 )2 (t) + x2 (t) + t2 dt → extr,
торнозначных функций
0
x(0) = 1, x0 (0) = 0, x(π/2) = 0, x0 (π/2) = −1. J(x1 (·), . . . , xm (·)) =
Решение. 1. Уравнение Эйлера–Пуассона имеет вид x(4) − x = 0. Zt1
(n ) (nm )
Его общее решение такое: = L(t, x1 (t), . . . , x1 1 (t), x2 (t), . . . , xm (t)) dt → extr, (5.22)
t0
x(t) = C1 et + C2 e−t + C3 cos(t) + C4 sin(t).
(j) (j)
xk (t0 ) = x0kj , xk (t1 ) = x1kj , k = 1, m, j = 0, nk − 1,
2. Неизвестные константы C1 , C2 , C3 , C4 вычислим, используя гра-
ничные условия. Получим C1 = 0, C2 = 0, C3 = 1, C4 = 0. где xk (·) ∈ C nk [t0 , t1 ], R), k = 1, m.
Ответ. Единственная допустимая экстремаль функционала зада-
чи — функция x(t) = cos(t). 4 Теорема 5.4. Пусть x bk (·), k = 1, m — решение экстремальной
задачи (5.22). Тогда функции xbk (·) удовлетворяют системе уравнений
ПРИМЕР 5.16. Определить экстремали функционала Эйлера–Пуассона

Zl   nk
X dj 0 (n )
J(x(·)) = 1 µ(y 00 )2 + ρy dx → extr, (−1)j L (j) (t, x b1 1 (t), . . . , x
b1 (t), . . . , x bm(nm )
(t)) = 0, k = 1, m.
2 j=0
dtj xk
−l
0
y(−l) = 0, y (−l) = 0, y(l) = 0, y 0 (l) = 0. Решения этой системы дифференциальных уравнений, удовлетворя-
ющие граничным условиям, будут экстремалями задачи (5.22).
К такой вариационной задаче сводится задача об определении оси упру-
гой цилиндрической балки, закрепленной на концах.
Решение. 1. Если балка однородна, то ρ, µ — постоянные и уравне- 6. Функционалы, зависящие от функций многих
ние Эйлера–Пуассона имеет вид переменных
d2 ρ Пусть G — замкнутая ограниченная область в просторные R 2 с глад-
ρ+ (µy 00 ) = 0 или y (4) = − .
dx2 µ кой границей ∂G. Рассмотрим экстремальную задачу вида
Общее решение этого уравнения такое: ZZ  
∂ ∂
J(z(·)) = L x, y, z(x, y), z(x, y), z(x, y) dx dy → extr (5.23)
ρ 4 ∂x ∂y
y=− x + C 1 x3 + C 2 x2 + C 3 x + C 4 . G
24µ
126 Глава 5 6. Функционалы, зависящие от функций многих переменных 127

в классе допустимых функций из пространства C 1 (G) один раз непре- Аналогично


рывно дифференцируемых по всем переменным функций z(x, y), которые
принимают на границе ∂G области G заданные значения z(x, t) = v(x, y), ∂ ∂z ∂p ∂q
{L0q } = L00qy + L00qz + L00qp + L00qq .
(x, y) ∈ ∂G. Пространство C 1 (G) является линейным нормированным ∂y ∂y ∂y ∂y
пространством с нормой
  Получим
∂ ∂ ZZ  

kz(·)k1 = max max |z(x, y)|, max z(x, y) , max z(x, y) .
∂ ∂
(x,y)∈G (x,y)∈G ∂x (x,y)∈G ∂y δJ(z(·), h(·)) = − L0z 0
{L } − 0
{L } h(x, y) dx dy
∂x p ∂y q
Обозначим через H0 (G) подпространство пространства C 1 (G), поро- G
ZZ  
жденное функциями h(x, y), удовлетворяющими нулевым граничным ∂ ∂
+ {L0p h} + {L0q h} dx dy.
условиям h(x, y) = 0, (x, y) ∈ ∂G. Если z(x, y) — допустимая функ- ∂x ∂y
ция задачи (5.23), то функции z(x, y) + h(x, y), h(x, y) ∈ H0 (G) также G
допустимые.
Пользуясь формулой Грина
Вычислим первую вариацию Лагранжа функционала J(z(·)). Как
и раньше, будем считать, что функция L непрерывно дифференцируема. ZZ   Z
∂N ∂M
Рассмотрим функцию ϕ(λ) = J(z(·) + λh(·)), h(·) ∈ H0 (G). Посколь- + dx dy = (N dy − M dx),
ку δJ(z(·), h(·)) = ϕ0 (0), то нужно вычислить ϕ0 (0). Получим ∂x ∂y
G ∂G
ZZ  
0 0 0 ∂ 0 ∂ запишем
δJ(z(·), h(·))=ϕ (0)= Lz h(x, y)+Lp h(x, y)+Lq h(x, y) dxdy,
∂x ∂y ZZ   Z
G ∂ ∂
{L0p h} + {L0q h} dx dy = (L0p dy − L0q dx)h(x, y) = 0,
где ∂x ∂y
∂ ∂ G ∂G
p= z(x, y), q = z(x, y), L = L(x, y, z, p, q).
∂x ∂y поскольку функция h(·) ∈ H0 (G) и равняется нулю на границе ∂G обла-
Если zb(·) — функция, которая дает экстремум функционалу (5.23), то сти G. Необходимое условие экстремума δJ(z(·), h(·)) = 0 будет иметь
необходимо, чтобы δJ(z(·), h(·)) = 0 для всех функций h(·) ∈ H0 (G). вид ZZ  
Преобразуем выражение δJ(z(·), h(·)) так, чтобы можно было применить 0 ∂ 0 ∂ 0
Lz − {L } − {L } h(x, y) dx dy = 0 (5.24)
лемму, аналогичную лемме Лагранжа. Для этого второе и третье слага- ∂x p ∂y q
емые заменим на выражения G

∂ ∂ ∂ для всех h(·) ∈ H0 (G).


L0p h(x, y) = {L0 h(x, y)} − {L0 }h(x, y), Используем теперь следующий аналог леммы Лагранжа.
∂x ∂x p ∂x p
∂ ∂ ∂ Лемма 5.5. Если для непрерывной функции a(x, y), (x, y) ∈ G,
L0q h(x, y) = {L0 h(x, y)} − {L0 }h(x, y),
∂y ∂y q ∂y q выполняется условие
∂ ZZ
где ∂x {L0p } — полная частная производная по переменной x. При ее
вычислении переменная y считается фиксированной, но зависимость z, a(x, y)h(x, y) dx dy = 0, для всех h(·) ∈ H0 (G),
p, q от x учитывается: G

∂ ∂z ∂p ∂q то a(x, y) = 0 для всех (x, y) ∈ G.


{L0 } = L00px + L00pz + L00pp + L00pq .
∂x p ∂x ∂x ∂x
128 Глава 5 6. Функционалы, зависящие от функций многих переменных 129

ДОКАЗАТЕЛЬСТВО. Уравнение Эйлера–Остроградского этой задачи превращается в уравне-


Докажем лемму методом от противного. Пусть существует такая ние Лапласа. Чтобы отыскать экстремали функционала, нужно опреде-
точка (x0 , y0 ) ∈ G, что a(x0 , y0 ) = c 6= 0. Возьмем c > 0. Построим лить непрерывную функцию z(x, y), которая удовлетворяет уравнению
вокруг точки параллелепипед A = {(x, y) : x1 6 x 6 x2 , y1 6 y 6 y2 } Лапласа и на границе области G принимает заданные значения v(x, y).
так, чтобы он полностью лежал в области G и для всех (x, y) ∈ A Это одна из основных задач математической физики — задача Дирихле.
выполнялось неравенство a(x, y) > c/2. Построим функцию Итак, экстремали данной задачи вариационного исчисления — это
(  2 y−y1  решения задачи Дирихле. 4
e sin2 π xx−x 1
2 −x1
sin π y2 −y1 , (x, y) ∈ A, ПРИМЕР 5.18. Определить экстремали функционала
h(x, y) =
0, (x, y) 6= A.
Z Z  2  2 
∂z ∂z
Такая функция принадлежит пространству H0 (G), но J(x(·)) = + + 2zf (x, y) dx dy → extr,
∂x ∂y
ZZ ZZ G

a(x, y)e
h(x, y) dx dy = a(x, y)e
h(x, y) dx dy > 0. z(x, y) = v(x, y), (x, y) ∈ ∂G.
G A Составим уравнение Эйлера–Остроградского. Оно имеет вид
Это противоречие доказывает лемму.
∂2z ∂2z
Применив лемму к соотношению (5.24), докажем следующее утвер- + = f (x, y) или ∆z = f (x, y).
∂x2 ∂y 2
ждение.
Теорема 5.5. Пусть zb(·) — решение экстремальной задачи (5.23). Уравнение Эйлера–Остроградского этой задачи превращается в уравне-
Тогда функция zb(·) удовлетворяет уравнению ние Пуассона. Итак, экстремаль функционала — это непрерывная функ-
ция z(x, y), которая удовлетворяет уравнение Пуассона и приобретает
∂ ∂ заданные значения v(x, y) на границе области G. 4
L0z − {L0 } − {L0 } = 0 (5.25)
∂x p ∂y q ПРИМЕР 5.19. Определить поверхность минимальной площади, ко-
торая натянута на заданный пространственный контур C.
с граничными условиями z(x, y) = v(x, y), (x, y) ∈ ∂G. Задача сводится к исследованию на минимум функционала
Уравнение второго порядка в частных производных (5.25) называет- s
ZZ  2  2
ся уравнением Эйлера–Остроградского. ∂z ∂z
S(z(·)) = 1+ + dx dy.
ПРИМЕР 5.17. Определить экстремали функционала ∂x ∂y
G
Z Z  2  2 
∂z ∂z Составим уравнение Эйлера–Остроградского. Оно имеет вид
J(x(·)) = + dx dy → extr,
∂x ∂y    
G ∂ p ∂ q
p + p =0
z(x, y) = v(x, y), (x, y) ∈ ∂G. ∂x 1 + p2 + q 2 ∂y 1 + p2 + q 2
Составим уравнение Эйлера–Остроградского. Оно имеет вид или
  2    2 
∂ 2z ∂2z ∂2z ∂z ∂z ∂z ∂ 2 z ∂2z ∂z
+ 2 = 0 или ∆z = 0. 2
1 + − 2 + 2
1 + = 0.
∂x 2 ∂y ∂x ∂y ∂x ∂y ∂x∂y ∂y ∂x
130 Глава 5 6. Функционалы, зависящие от функций многих переменных 131

Итак, средняя кривизна поверхности в каждой точке равняется нулю. удовлетворяет уравнению четвертого порядка в частных производных
Физической реализацией минимальных поверхностей являются мыльные
пленки, натянутые на заданный контур C. 4 ∂ ∂ ∂2 ∂2 ∂2
L0x − {L0p } − {L0q } + 2 {L0r } + {L0s } + 2 {L0t } = 0,
Пусть G — замкнутая ограниченная область в пространстве R n ∂x ∂y ∂x ∂x∂y ∂y
с гладкой границей ∂G. Рассмотрим задачу на экстремум в классе функ- где
ций z(x1 , x2 , . . . , xn ) n переменных из пространства C 1 (G), принимаю- ∂z ∂z ∂2z ∂2z ∂2z
щих на границе ∂G области G фиксированные значения p= , q= , r= , s= , t= .
∂x ∂y ∂x2 ∂x∂y ∂y 2
Z Z
ПРИМЕР 5.21. Функция z(x, y), которая дает экстремум функциона-
J(z(·)) = · · · L(x1 , . . . , xn , z, p1 , . . . , pn ) dx1 . . . dxn → extr, (5.26)
ла Z Z  2  2  2 
G ∂2z ∂2z ∂2z
J(z(·)) = + +2 dx dy,
z(x1 , . . . , xn ) = v(x1 , . . . , xn ), (x1 , . . . , xn ) ∈ ∂G, ∂x2 ∂y 2 ∂x∂y
G
∂z
где pk = ∂xk , k = 1, n. удовлетворяет так называемому бигармоническому уравнению
Теорема 5.6. Пусть zb(·) — решение задачи (5.26). Тогда функ-
∂4z ∂ 4z ∂4z
ция zb(·) удовлетворяет уравнению Эйлера–Остроградского + 2 + = 0,
∂x4 ∂x2 ∂y 2 ∂y 4
n
X ∂
L0z − {L0 } = 0. которое коротко записывается так: ∆∆z = 0.
∂xk pk Функция zb(x, y), которая дает экстремум функционала
k=1

Z Z  2  2  2 
ПРИМЕР 5.20. Составить уравнение экстремалей функционала ∂2z ∂ 2z ∂2z
J(z(·)) = + +2 − 2zf (x, y) dx dy,
Z Z Z  2  2  2  ∂x2 ∂y 2 ∂x∂y
∂u ∂u ∂u G
J(u(·)) = + + dx dy dz.
∂x ∂y ∂z удовлетворяет уравнению ∆∆z = f (x, y). 4
G

Уравнение Эйлера–Остроградского экстремали u


b(x, y, z) имеет вид К бигармоническому уравнению приведут также задачи на экстре-
мум функционала
∂2u ∂2u ∂2u ZZ  2
+ 2 + 2 = 0. ∂2z ∂2z
∂x2 ∂y ∂z J(z(·)) = + 2 dx dy
∂x 2 ∂y
Если функция L под интегралом зависит от производных более высоко- G
го порядка, то, применяя преобразования, такие как при выводе уравне-
ния Эйлера–Остроградского, получим уравнение, аналогичное уравне- и функционала более общего вида
нию Эйлера–Пуассона. 4 Z Z  2   2 
∂2z ∂2z ∂2z ∂2z ∂2z
Функция zb(x, y), которая дает экстремум функционала J(z(·)) = + − 2(1 − µ) − dx dy,
∂x2 ∂y 2 ∂x2 ∂y 2 ∂x∂y
ZZ   G
∂z ∂z ∂ 2 z ∂ 2 z
J(z(·)) = L x, y, z, , , , 2 dx dy, где µ — параметр.
∂x ∂y ∂x∂y ∂y
G
132 Глава 5 7. Задача Больца. Условия трансверсальности 133

7. Задача Больца. Условия трансверсальности Поэтому функция ϕ(λ) дифференцируема в точке λ = 0:

Простейшая задача вариационного исчисления (задача Лагранжа на 1


ϕ0 (0) = δB(b
x(·), h(·)) = lim [B(b
x(·) + λh(·)) − B(b
x(·))] =
множестве функций с закрепленными концами) — это задача с огра- λ→0 λ
ничениями. Граничные условия x(t0 ) = x0 , x(t1 ) = x1 образуют два Zt1
 0 
ограничения типа равенства. = L b 0 0 (t)h0 (t) dt + b
b (t)h(t) + L lx0 0 h(t0 ) + b
lx0 1 h(t1 ), (5.29)
x x
Задача Больца — задача исследования на экстремум функционала
t0

Zt1 где
B(x(·)) = L(t, x(t), x0 (t)) dt + l(x(t0 ), x(t1 )) → extr (5.27)
b 0x (t) = L0x (t, x
L b0 (t)),
b(t), x b 0x0 (t) = L0x0 (t, x
L b0 (t)),
b(t), x
t0
b
l0 = l0 (b b(t1 )),
x(t0 ), x b
l0 = l0 (b b0 (t1 )).
x(t0 ), x
x0 x0 x1 x1
в пространстве C 1 ([t0 , t1 ], R). Это задача без ограничений. Считается,
что функция L(t, x, x0 ) удовлетворяет таким же условиям, как и в случае Если функция x b(·) ∈ C 1 ([t0 , t1 ], R) — решение задачи (5.27), то необ-
простейшей задачи, то есть она непрерывна и непрерывно дифференци- ходимо, чтобы δB(b x(·), h(·)) = 0 для всех h(·) ∈ C 1 ([t0 , t1 ], R). Отсю-
руема по переменным x, x0 , а функция l(x0 , x1 ) непрерывно дифферен- да вытекает, что δB(b x(·), h(·)) = 0 для каждой функции из простран-
цируема по каждой из двух переменных. ства C 1 ([t0 , t1 ], R), которая удовлетворяет граничным условиям h(t0 ) =
Теорема 5.7 (Необходимые условия экстремума в задаче Боль- = h(t1 ) = 0. Для таких функций выполняется равенство
ца). Пусть функция xb(·) ∈ C 1 ([t0 , t1 ], R) — решение задачи (5.27).
Тогда выполняются уравнение Эйлера Zt1
 0 
b (t)h(t) + L
L b 0 0 (t)h0 (t) dt = 0.
x x
d 0
L0x (t, x b0 (t)) =
b(t), x b0 (t))
b(t), x
L 0 (t, x (5.28) t0
dt x
и условия трансверсальности: По лемме Дюбуа-Реймона функция L b 0 0 (t) непрерывно дифференцируема
x
и
∂ d b0 b 0 (t).
L0x0 (t0 , x b0 (t0 )) =
b(t0 ), x l(b b(t1 )),
x(t0 ), x L 0 (t) = L
∂x0 dt x x

∂ А это и есть уравнение Эйлера (5.28).


L0x0 (t1 , x b0 (t1 )) = −
b(t1 ), x l(b b(t1 )).
x(t0 ), x Проинтегрируем второе слагаемое в (5.29) и используем последнее
∂x1
соотношение. Тогда первая вариация Лагранжа функционала B(x(·)) бу-
дет иметь вид
ДОКАЗАТЕЛЬСТВО.
Как и при доказательстве теоремы о необходимом условии экс- Zt1 
тремума простейшей задачи вариационного исчисления, найдем выра- b 0 d b0
δB(b
x(·), h(·)) = Lx (t) − Lx0 (t) h(t) dt+
жение для первой вариации Лагранжа функционала B(x(·)). Пусть dt
t0
h(·) ∈ C 1 ([t0 , t1 ], R). Рассмотрим функцию ϕ(λ) = B(b x(·) + λh(·)). Функ-
ции L(t, x, x0 ), l(x(t0 ), x(t1 )), x
b(·), h(·) непрерывно дифференцируемы. +L b 0 0 (t)h(t) t1 +b lx0 0 h(t0 ) + b lx0 1 h(t1 ) =
x t0
 0   
b x0 (t1 ) + b
= L lx0 1 h(t1 ) + −L b 0x0 (t0 ) + b lx0 0 h(t0 ) = 0.
134 Глава 5 7. Задача Больца. Условия трансверсальности 135

Это равенство выполняется для любой функции h(·) ∈ C 1 ([t0 , t1 ], R). и условиям трансверсальности:
Выберем h(t) = t − t0 , а потом h(t) = t − t1 , получим условия трансвер-
сальности: L0x0j (t, x
b1 (tk ), . . . , x b01 (tk ), . . . , x
bn (tk ), x b0n (tk )) =
Lb 0 0 (t0 ) = b b 0 0 (t1 ) = −b
lx0 0 , L lx0 1 .
x x ∂
Теорема доказана. = (−1)k x1 (t0 ), . . . , x
l(b b01 (t1 ), . . . , x
bn (t0 ), x b0n (t1 )),
∂xj (tk )
Как и в задаче Лагранжа, мы получили дифференциальное урав-
нение второго порядка и два граничных условия — условия трансвер- k = 0, 1; j = 1, 2, . . . , n.
сальности. Эти условия дают возможность определить две неизвестных b(·) ∈ C 1 ([t0 , t1 ], Rn ) — решение за-
Теорема 5.10. Если функция x
константы, которые входят в общее решение дифференциального урав- дачи Лагранжа на множестве векторных функций со свободными
нения второго порядка. (незакрепленными) концами
Если функция l(x0 , x1 ) = 0, то задача Больца превращается в зада-
чу Лагранжа на множестве функций со свободными (незакрепленными) Zt1
концами и из теоремы 5.6 вытекает следующее следствие. J(x(·)) = L(t, x1 (t), . . . , xn (t), x01 (t), . . . , x0n (t)) dt → extr,
b(·) ∈ C 1 ([t0 , t1 ], R) — решение задачи
Теорема 5.8. Если функция x t0

Лагранжа на множестве функций со свободными (незакрепленными) b(·) удовлетворяет системе уравнений Эйлера (5.31) и граничным
то x
концами условиям
Zt1
J(x(·)) = L(t, x(t), x0 (t)) dt → extr, L0x0j (tk , x
b1 (tk ), . . . , x b01 (tk ), . . . , x
bn (tk ), x b0n (tk )) = 0, k = 0, 1.
t0

b(·) удовлетворяет уравнению Эйлера (5.28) и граничным услови-


то x ПРИМЕР 5.22. Решить задачу
ям Z1
L0x0 (tk , x b0 (tk )) = 0, k = 0, 1.
b(tk ), x B(x(·)) = ((x0 )2 (t) − x(t)) dt + x2 (1) → extr .
Необходимые условия экстремума в векторной задаче Больца 0

Zt1 Решение. 1. Составим уравнение Эйлера


B(x(·)) = L(t, x1 (t), . . . , xn (t), x01 (t), . . . , x0n (t)) dt+ d 0
L0x = −1, L0x0 = 2x0 , L 0 = 2x00 ,
t0 dt x
+ l(x1 (t0 ), . . . , xn (t0 ), x1 (t1 ), . . . , xn (t1 )) → extr (5.30) d 0
L0x = L 0 ⇐⇒ 2x00 = −1.
dt x
имеют такой же вид, как и в скалярной задаче.
Общее решение уравнения Эйлера
Теорема 5.9. Пусть функция x b(·) ∈ C 1 ([t0 , t1 ], Rn ) — решение
задачи Больца (5.30). Тогда компоненты x bk (·), k = 1, n, функции x b(·) x(t) = −t2 /4 + C1 t + C2 .
удовлетворяют системе уравнений Эйлера
2. Запишем условия трансверсальности
L0xj (t, x
b1 (t), . . . , x b01 (t), . . . , x
bn (t), x b0n (t)) =
b 0 0 (0) = b
L lx0 0 ⇐⇒ x
b0 (0) = 0;
x
d
= L0x0j (t, x
b1 (t), . . . , x b01 (t), . . . , x
bn (t), x b0n (t)), j = 1, 2, . . . , n (5.31) b 0 0 (1) = −b
L l0 ⇐⇒ xb0 (1) = −b
x(1).
dt x x1
136 Глава 5 7. Задача Больца. Условия трансверсальности 137

3. Определим допустимые экстремали. Из условий трансверсально- Итак, x002 = x2 , x001 = x1 . Общее решение этих уравнений такое:
сти получим такие значения неизвестных констант: C1 = 0, C2 = 3/4.
Итак, задача имеет одну допустимую экстремаль: x b(t) = (3 − t2 )/4. b1 (t) = C1 et + C2 e−t ,
x b2 (t) = A1 et + A2 e−t .
x
4. Покажем, что эта экстремаль дает абсолютный минимум в задаче.
Действительно, для любой функции h(·) ∈ C 1 ([0, 1], R) 2. Чтобы составить условия трансверсальности, вычислим

b 0 0 (0) = x
L b02 (0) = A1 − A2 , b
lx0 1 (0) = x
b2 (1) = A1 e + A2 e−1 ,
B(b
x(·) + h(·)) − B(bx(·)) = x1

Z1 Z1 Z1 b x0 (1) = x
L b02 (1) = A1 e − A2 e−1 , b
lx0 1 (1) = x
b2 (0) = A1 + A2 ,
1
0 0 0 2
= 2b x(1)h(1) + h2 (1).
x h dt + (h ) dt − h dt + 2b b 0 0 (0) = x
L b01 (0) = C1 − C2 , b
lx0 2 (0) = x
b1 (1) = C1 e + C2 e−1 ,
x2
0 0 0
b 0 0 (1) = x
L b01 (1) = C1 e + C2 e−1 , b
lx0 2 (1) = x
b1 (0) = C1 + C2 .
x2
2
Проинтегрируем частями и учтем, что x
b(t) = (3 − t )/4, тогда
Условия трансверсальности имеют вид
Z1
1
B(b
x(·) + h(·)) − B(b x0 h 0 −
x(·)) = 2b x00 + 1)h dt+
(2b b 0 0 (0) = b
L lx0 1 (0) ⇐⇒ A1 − A2 = A1 e + A2 e−1 ,
x1
0 b x0 (1) = −b
L lx0 1 (1) ⇐⇒ A1 e − A2 e−1 = −A1 − A2 ,
1
Z1
b 0 0 (0) = b
L lx0 2 (0) ⇐⇒ C1 − C2 = C1 e + C2 e−1 ,
+ (h0 )2 dt + 2b
x(1)h(1) + h2 (1) x2

0 b 0 0 (1) = −b
L lx0 2 (1) ⇐⇒ C1 e − C2 e−1 = −C1 − C2 .
x2
Z1
= (h0 )2 dt + h2 (1) > 0. Получили систему уравнений
 
0 A1 (1 − e) − A2 1 + e−1 = 0, A1 (1 + e) + A2 1 − e−1 = 0,
 
b(t) = (3 − t2 )/4 ∈ absmin. 4
Ответ. x C1 (1 − e) − C2 1 + e−1 = 0, C1 (1 + e) + C2 1 − e−1 = 0,
ПРИМЕР 5.23. Определить экстремали функционала из которых вытекает, что C1 = C2 = A1 = A2 = 0.
Ответ. Допустимые экстремали задачи: x b2 (t) ≡ 0. 4
b1 (t) ≡ 0, x
Z1
Рассмотрим задачу Больца на множестве функций многих перемен-
B(x1 (·), x2 (·)) = (x01 (t)x02 (t) + x1 (t)x2 (t)) dt
ных.
0 Будем исследовать на экстремум функционал
+ x1 (0)x2 (1) + x1 (1)x2 (0) → extr . ZZ Z
Решение. 1. Составим систему уравнений Эйлера B(z(·)) = L(x, y, z, zx, zy ) dx dy + F (s, z, zs ) ds (5.32)
G ∂G
d 0
L0x1 = x2 , L0x01 = x02 , L 0 = x002 , в классе C 1 (G) один раз непрерывно дифференцируемых в области G
dt x1
d 0 функций z(x, y), (x, y) ∈ G. Функция L(x, y, z, zx, zy ), как и функ-
L0x2 = x1 , L0x02 = x01 , L 0 = x001 . ция F (s, z, zs ), непрерывно дифференцируема.
dt x2
138 Глава 5 7. Задача Больца. Условия трансверсальности 139

Теорема 5.11. Если функция zb(·) ∈ C 1 (G) — решение задачи Решение. Составим уравнение Эйлера–Остроградского. Оно имеет
(5.32), то она удовлетворяет уравнению Эйлера–Остроградского (5.25) вид
и граничным условиям ∂2z ∂2z
+ = 0.
∂x2 ∂y 2
dy dx d
L0zx − L0zy + Fz0 − Fz0s = 0, (x, y) ∈ ∂G. Итак, экстремали функционала — это решения задачи Дирихле с гра-
ds ds ds
ничными условиями
ДОКАЗАТЕЛЬСТВО.
∂z
Чтобы доказать теорему, вычислим первую вариацию функциона- + σz = 0, (x, y) ∈ ∂G,
ла B(z(·)). Получим ∂n
ZZ   ∂z
где через ∂n обозначена операция дифференцирования по внешней нор-
∂ ∂
δB(z(·), h(·)) = L0z − {L0zx } − {L0zy } h(x, y) dx dy мали к кривой zb(·). 4
∂x ∂y
G
Z   Z  
0 dy 0 dx 0 d 0
+ Lzx − L zy h ds + Fz − Fzs h ds.
ds ds ds
∂G ∂G

В соответствии с необходимым условием экстремума


δB(b
z (x, y), h(x, y)) = 0
для всех допустимых функций h(x, y) ∈ C 1 (G). Применим теперь лемму
Лагранжа.
Теорема 5.12. Если функция zb(x, y) ∈ C 1 (G) — решение задачи
Лагранжа на множестве функций со свободными (незакрепленными)
граничными значениями
ZZ
J(z(·)) = L(x, y, z, zx , zy ) dx dy → extr,
G

то функция zb(·) удовлетворяет уравнению Эйлера–Остроградско-


го (5.25) и граничным условиям
dy dx
L0zx − L0zy = 0, (x, y) ∈ ∂G.
ds ds

ПРИМЕР 5.24. Определить экстремали функционала


ZZ ZZ
B(z(·)) = (zx2 + zy2 ) dx dy + σz 2 ds → extr .
G ∂G
140 Глава 5 8. Задачи 141

8. Задачи R1 
5.12 2tx1 − (x01 )2 + (x02 )3 /3 dt → extr, x1 (1) = 0, x1 (−1) = 2,
−1
Определить допустимые экстремали функционалов x2 (1) = 1, x2 (−1) = −1.
Rb R1 
5.1 (2tx + (t2 + ex )x0 ) dt → extr, x(a) = c, x(b) = d. 5.13 (x01 )2 + (x02 )2 + 2x1 dt → extr, x1 (0) = 1, x1 (1) = 3/2,
a 0
x2 (0) = 0, x2 (1) = 1.
Rπ 
5.2 (x0 )2 − x2 dt → extr, x(0) = 1, x(π) = −1. Rb 
0 5.14 2x1 cos(t) + 2x22 + 2x01 x02 + (x01 )2 − (x02 )2 dt → extr.
a
R1 
5.3 (x0 )2 + x2 dt → extr, x(0) = 0, x(1) = 1. R1 
0 5.15 (x01 )2 + (x02 )2 − 2x1 x2 dt → extr, x1 (0) = 0, x1 (1) = sh(1),
0
π/2
R  x2 (0) = 0, x2 (1) = − sh(1).
5.4 x2 − (x0 )2 − 8x ch(t) dt → extr, x(0) = 2,
0 R1 
x(π/2) = 2 ch(π/2). 5.16 x21 + x22 + 2x01 x02 dt → extr, x1 (0) = x2 (0) = 0,
0
3π/2
R  x1 (1) = x2 (1) = sh(1).
5.5 (x0 )2 − x2 − 4x sin(t) dt → extr, x(0) = 0, x(3π/2) = 0.
0 R1 
5.17 x01 x02 + x1 x2 dt → extr, x1 (0) = x2 (0) = 0, x1 (1) = e,
R1  0
5.6 (x0 )2 + 4x 2
dt → extr, x(0) = e2 , x(1) = 1. x2 (1) = 1/e.
0
π/2
R 
1/2
R −1
1 p 5.18 x01 x02 − x1 x2 dt → extr, x1 (0) = x2 (0) = 0, x1 (π/2) = 1,
5.7 x 1+ (x0 )2 2 dt → extr, x(0) = 1, x(1/2) = 5/2. 0
0 x2 (π/2) = −1.
ln(2)
R  π/2
5.8 (x0 )2 + 3x2 e2t dt → extr, x(0) = 0, x(ln(2)) = 15/8. R 
5.19 x01 x02 + 6tx1 + 12t2 x2 dt → extr, x1 (0) = x2 (0) = 0,
0 0
R2  x1 (1) = x2 (1) = 1.
5.9 (x01 )2 + x22 + (x02 )2 dt → extr, x1 (1) = 1, x1 (2) = 2, π/2
1 R 
x2 (1) = 0, x2 (2) = 1. 5.20 (x01 )2 + 2(x02 )2 + (x03 )2 + 2x1 x2 + 2x2 x3 dt → extr, x1 (0) =
0
Rπ  = x3 (0) = 1,
5.10 2x1 x2 − 2x21 + (x01 )2 − (x02 )2 dt → extr, x1 (0) = 0, x1 (π) = 1, x2 (0) = −1, x1 (π/2) = π/2, x2 (π/2) = 0, x3 (π/2) = −π/2.
0
x2 (0) = 0, x2 (π) = −1. R1 
5.21 x2 + 2(x0 )2 + (x00 )2 dt → extr, x(0) = x(1) = 0, x0 (0) = 1,
π/4
R  0
5.11 2x2 −4x21 +(x01 )2 −(x02 )2 dt → extr, x1 (0) = 0, x1 (π/4) = 1, x0 (1) = − sh(1).
0
x2 (0) = 0, x2 (π/4) = 1. R0 000 
5.22 240x − (x )2 dt → extr, x(−1) = 1, x(0) = 0,
−1
142 Глава 5 8. Задачи 143

x0 (−1) = −9/2, x0 (0) = 0, x00 (−1) = 16, x00 (0) = 0. R


e−1
5.35 (t + 1)(x0 )2 dt + 2x(0)(x(e − 1) + 1) → extr.
Rb  0
5.23 (x0 )2 + xx00 dt → extr, x(a) = A1 , x0 (A) = A2 , x(b) = B1 , R2
a
5.36 t2 (x0 )2 dt + 2x(1) + x2 (2) → extr.
x0 (b) = B2 . 1
π/2
R  π/2
000 R 
5.24 (x )2 − (x00 )2 dt → extr, x(0) = x0 (0) = x00 (π/2) = 0, 5.37 (x0 )2 − x2 − 2x dt − 2x2 (0) + x2 (π/2) → extr.
0 0
x(π/2) = x0 (π/2) = x00 (0) = 1.
Rπ 000 
5.25 (x )2 − (x00 )2 dt → extr, x(0) = x0 (0) = x00 (0) = x00 (π) = 0,
0
x(π) = π, x0 (π) = 2.
Rπ 000 
5.26 (x )2 − (x0 )2 dt → extr, x(0) = x0 (0) = x00 (0) = x00 (0) = 0,
0
x(π) = x00 (π) = sh(π), x0 (π) = ch(π) + 1.
R1 R1 0
5.27 ezy sin(zy0 ) dx dy → extr, z(x, 0) = 0, z(x, 1) = 1.
0 0
Отыскать допустимые экстремали функционалов в задачах Больца
Rπ 0 2 
5.28 (x ) − x2 − 2x sin(t) dt + x2 (0) + x2 (π) → extr.
0

π/2
R 
5.29 (x0 )2 − x2 dt − x2 (π/2) + 2x(π/2) → extr.
0

ln(2)
R 
5.30 (x0 )2 + 2x2 et dt + (x(0) − 9)x(ln(2)) → extr.
0

Re
5.31 2x0 (tx0 + x) dt + 3x2 (1) − x2 (e) − 4x(e) → extr.
1

R3
5.32 4x2 (x0 )2 dt + x4 (0) − x(3) → extr.
0

R1
5.33 ex (x0 )2 dt + 4ex(0) + 32e−x(1) → extr.
0

R1 
5.34 et+1 (x0 )2 + 2x2 dt + 2x(1)(x(0) + 1) → extr.
0
1. Инвариантность уравнений Эйлера и Остроградского 145

d
Воспользуемся обозначением [L]x = Lx − dt Lx0 . Определим функ-
цию ϕ(λ) = J(x(·)) + λh(·)), где h(·) — допустимая вариация функции
x(·) ∈ C 1 [t0 , t1 ]. Тогда δJ(x(·), h(·)) = ϕ0 (0). Для переменной t производ-
ГЛАВА 6 ная

Каноническая форма уравнений 0
ϕ (0) =
d
Zt1
0 0

L(t, x(t) + λh(t), x (t) + λh (t)) dt =
Эйлера dλ
t0
λ=0

Zt1
= [L]x h(t) dt.
t0
1. Инвариантность уравнений Эйлера и Остроградского
Для переменной u производная ϕ0 (0) равняется
Исследуя на экстремум функцию одной переменной y = f (x), мы
Zu1  
можем сделать замену независимой переменной x = g(u), где u — но- 0 d dx dh1 dt
вая независимая переменная. Пусть функция g(u) монотонна и имеет ϕ (0) = Φ u, x(u) + λh1 (u), +λ du =
dλ du du du λ=0
отличную от нуля производную g 0 (u). Тогда, в соответствии с правилом u0
дифференцирования сложной функции, Zu1 
dt
dy = Φ h1 (u) du, h1 (u) = h(t(u)).
= f 0 (x)g 0 (u). (6.1) du x
du u0

Необходимое условие экстремума функции y(u) = f (g(u)) имеет Сравнивая полученные выражения, получим
вид f 0 (x)g 0 (u) = 0. Поскольку g 0 (u) 6= 0, то это условие равносильно
Zt1   
условию f 0 (x) = 0 экстремума функции y = f (x). Такое свойство инва- dt du
риантности при замене переменных имеет и уравнение Эйлера. [L]x − Φ h(t) dt = 0.
du x dt
Рассмотрим основную задачу вариационного исчисления t0

Zt1 Это равенство выполняется для любой допустимой вариации h(·). Вос-
J(x(·)) = 0
L(t, x(t), x (t)) dt → extr, пользовавшись теперь леммой Лагранжа, получим
 
t0 dt du
[L]x = Φ . (6.2)
x(t0 ) = x0 , x(t1 ) = x1 . du x dt

Пусть u — новая независимая переменная и du dt


6= 0. Тогда Эта формула аналогична dtформуле
 (6.1) для функции одной переменной,
    а уравнение Эйлера Φ du x
=0 равносильно уравнению Эйлера [L]x =0.
dx/du dx Итак, свойство кривой быть экстремалью не зависит от системы коор-
L(t, x, x0 ) = L t(u), x, = Φ u, x, ,
dt/du du динат.
Zt1 Zu1   Можно делать замену и независимой переменной, и функции. Пусть
0 dx dt вместо координат (x, y) введены новые координаты по формулам x =
J(x(·)) = L(t, x(t), x (t)) dt = Φ u, x, du.
du du = x(u, v), y = y(u, v), xu yv − xv yu 6= 0. Кривая y = y(x) в новых коорди-
t0 u0 натах определяется уравнением v = v(u). При такой замене переменных
146 Глава 6 1. Инвариантность уравнений Эйлера и Остроградского 147

∂ ∂
функционал где h1 (u, v) = h(x(u, v), y(u, v)); [L]z = Lz − ∂x Lzx − ∂y Lzy ; B1 — об-
Zx1 раз B при преобразовании x = x(u, v) y = y(u, v). Если сделать замену
J(y(·)) = L(x, y(x), y 0 (x)) dx переменных в интеграле, который стоит в правой части равенства, и ис-
x0 пользовать лемму Лагранжа для функций двух переменных, то получим
 
переходит в функционал D(x, y) D(u, v)
[L]z = Φ .
Zu1   D(u, v) z D(x, y)
yu + y v vu
J1 (v(·)) = L x(u, v), y(u, v), (xu + xv vu ) du = Поэтому уравнение Остроградского [L]z = 0 равносильно уравнению
xu + x v v u  
u0 D(x,y)
Остроградского Φ D(u,v) = 0 для независимых переменных u, v.
Zu1 z
= Φ(u, v, v 0 ) du, ПРИМЕР 6.1. Определить экстремали функционала
u0
Zϕ1 p
и уравнение Эйлера [L]y = 0 равносильно уравнению Эйлера [Φ]v = 0. J1 = r2 + (r0 )2 dϕ.
Рассмотрим задачу на множестве функций, которые зависят от двух ϕ0
независимых переменных. Пусть
ZZ Решение. Экстремали функционала удовлетворяют уравнению Эй-
лера
J(z(·)) = L(x, y, z(x, y), zx (x, y), zy (x, y)) dxdy. r d r0
B
p − p = 0,
r2 + (r0 )2 dϕ r2 + (r0 )2
Заменим переменные (x, y) на новые независимые переменные (u, v) : x = которое решить не так уж и легко. Тем не менее замена переменных
= x(u, v), y = y(u, v). Будем считать, что функции x(u, v), y(u, v) непре- x = r cos(ϕ), y = r sin(ϕ) дает функционал
рывно дифференцируемые и определитель
Zb p
D(x, y) J2 = 1 + (y 0 )2 dx.
= xu yv − xv yu
D(u, v) a

не обращается в нуль. Тогда Экстремали такого функционала — это прямые линии y = cx + d.


Итак, экстремали функционала J1 описываются уравнением r sin(ϕ) =
L(x, y, z, zx, zy ) = L(x(u, v), y(u, v), z, zu ux + zv vx , zu uy + zv vy ) = = cr cos(ϕ) + d, где c, d — произвольные константы. 4
= Φ(u, v, z, zu , zv ). ПРИМЕР 6.2. Определить экстремали функционала
Пусть h(x, y), (x, y) ∈ D — допустимая вариация функции z(x, y). Опре- ln(2)
Z

делим функцию ϕ(λ) = J(z(·)+λh(·)). Сравнивая выражения ϕ0 (0) в раз- J1 (y(·)) = e−x (y 0 )2 − ex y 2 dx.
ных системах координат, получим
0
ZZ ZZ  
D(x, y) Решение. Уравнение Эйлера такого функционала
[L]z h(x, y) dxdy = Φ h1 (u, v) dudv,
D(u, v) z
B B1 y 00 − y 0 + e2x y = 0.
148 Глава 6 2. Вариационные задачи в параметрической форме 149

Сделаем замену переменных x = ln(u), y = v. Тогда функционал примет мы считали, что аргументы функционала — функции x(·) ∈ C 1 [t0 , t1 ]
вид заданы в явном виде x = x(t), t0 6 t 6 t1 . В некоторых задачах целесо-
Z2 образно функцию x = x(t) задавать в параметрической форме x = x(u),

J2 (v(·)) = (v 0 )2 − v 2 dv. t = t(u). Тогда функционал J можно записать так:
1
Zu1  
Уравнение Эйлера v 00 + v = 0 функционала J2 легко интегрируется. По- x0 (u) 0
J(x(·), t(·)) = L t(u), x(u), 0 t (u) du =
лучим v = C1 cos(u)+C2 sin(u). Перейдем к координатам x, y. Уравнение t (u)
экстремали будет таким: y = C1 cos(ex ) + C2 sin(ex ). 4 u0
Zu1
ПРИМЕР 6.3. Определить экстремали функционала, который зави-
сит от функций двух переменных = F (t, x, t0 , x0 ) du.
ZZ u0

J(u(·)) = u2x + u2y dxdy.
Этот функционал зависит от двух функций x(u), t(u), u0 6 u 6 u1 .
D
Функция F (t, x, t0 , x0 ) под знаком интеграла не зависит явным образом
Уравнение Эйлера–Остроградского такого функционала превращается в от переменной u. Она положительно однородна первого порядка относи-
уравнение Лапласа тельно x0 , t0 , то есть
uxx + uyy = 0.
Если сделать замену переменных x = r cos(ϕ), y = r sin(ϕ), то функци- F (t, x, kt0 , kx0 ) = kF (t, x, t0 , x0 ).
онал будет таким:
ZZ Z Z  2  2  Эти два свойства достаточны для того, чтобы функционал зависел от
2 2
 ∂r ∂ϕ ∂r ∂ϕ функции x = x(t) и не зависел от способа ее параметризации. Действи-
ux +uy dxdy= ur +uϕ + ur +uϕ r drdϕ =
∂x ∂x ∂y ∂y тельно, пусть задан функционал
D D1
ZZ   Zu1
2 1 2
= rur + uϕ drdϕ. J(x(·), t(·)) = F (t, x, t0 , x0 ) du,
r
D1 u0
Уравнение Эйлера–Остроградского такого функционала превращается
в уравнение Лапласа в полярных координатах где функция F не зависит явным образом от параметра u и однородна
первого порядка по отношению к t0 , x0 . Вместо u определим другой
1 параметр v так, чтобы u = u(v) и u0 (v) > 0. Тогда отрезок u0 6 u 6 u1
ur + rurr + uϕϕ = 0.
r переходит в отрезок v0 6 v 6 v1 , а функционал
Итак, экстремали функционала определяются уравнением Лапласа. 4
Zu1   Zv1  
dt dx dt dv dx dv du
J = F t, x, , du = F t, x, , dv =
2. Вариационные задачи в параметрической форме du du dv du dv du dv
u0 v0
Исследуя на экстремум функционал Zv1  
dt dx
Zt1 = F t, x, , dv
dv dv
0 v0
J(x(·)) = L(x, x(t), x (t)) dt,
t0
150 Глава 6 2. Вариационные задачи в параметрической форме 151

не зависит от преобразования параметра, которое не изменяет направ- Это так называемая форма Вейерштрасса уравнений Эйлера. К этому
ления движения вдоль кривой (u0 (v) > 0). Поэтому экстремаль не за- уравнению с двумя неизвестными функциями можно добавить еще одно
висит от выбора параметра. Однородная первого порядка по t 0 , x0 функ- уравнение, которое характеризует выбор параметра u. Если, например,
ция F (t, x, t0 , x0 ) удовлетворяет соотношению F (t, x, kt0 , kx0 ) = kF (t, x, t0 , за параметр берем длину дуги S искомой экстремали, то дополнительное
x0 ). Продифференцируем это равенство по k и возьмем k = 1. Получим 2 2
уравнение будет x0 + t0 = 1.
Если учесть, что радиус кривизны R плоской кривой, которая задана
t0 Ft0 (t, x, t0 , x0 ) + x0 Fx0 (t, x, t0 , x0 ) = F (t, x, t0 , x0 ). в параметрической форме x = x(u), t = t(u), вычисляется по формуле
Дифференцируем теперь по t, x, t0 , x0 . Получим 1 t0 x00 − t00 x0
= 02 ,
0 0
Ft = t Ftt0 + x Ftx0 , 0
Fx = t Fxt0 + x Fxx0 , 0 R (x + t0 2 )3/2
0 0
0 = t F t0 t0 + x F t0 x 0 , 0 = t 0 F t0 x 0 + x 0 F x 0 x 0 . то форму Вейерштрасса уравнений Эйлера можно записать в виде
Из последних двух равенств находим 0
1 Ftx − Fxt0
= .
F t0 x 0 F t0 x 0 Fx 0 x 0 R F1 (x + t0 2 )3/2
0 2
= = 0 2 = F1 (t, x, t0 , x0 ),
(x0 )2 −t0 x0 (t )
Эта форма инвариантна относительно преобразования параметра.
где через F1 (t, x, t0 , x0 ) обозначена величина всех трех отношений. Эти
ПРИМЕР 6.4. Отыскать экстремали функционала
соотношения можно записать в виде
Zt1
Ft0 t0 = (x0 )2 F1 , Ft0 x0 = −t0 x0 F1 , Fx0 x0 = (t0 )2 F1 . 2
J(x(·)) = x2 x0 dt, x(0) = 0, x(t1 ) = x1 .
Их можно использовать для анализа уравнений Эйлера 0

d d Если кривую x(t) задать в параметрической форме x = x(u), t = t(u), то


Fx − Fx0 = 0, Ft − F t0 = 0
du du 02
функция под знаком интеграла F = x2 xt0 2 t0 однородна первого порядка
d
функционала J(x(·), t(·)). Одно из этих уравнений является следствием относительно t0 , x0 . Уравнение Эйлера Ft − du Ft0 = 0 имеет вид
другого. Действительно,  2
d x2 x0
d = 0,
Fx − Fx0 = (t0 Fxt0 + x0 Fxx0 ) − (t0 Fx0 t + x0 Fx0 x + x00 Fx0 x0 + t00 Fx0 t0 ) = du t0
du
= −t0 [Ftx0 − Fxt0 − F1 (t0 x00 − t00 x0 )], 2
откуда x2 dx
dt = c21 , x2 = 2c1 t + c2 . Из граничного условия x(0) = 0
d вытекает, что c2 = 0.
Ft − Ft0 = (t0 Ftt0 + x0 Ftx0 ) − (t0 Ftt0 + x0 Fxt0 + t00 Ft0 t0 + x00 Ft0 x0 ) =
du Ответ. Экстремали функционала — это параболы x2 = 2c1 t. 4
= −x0 [Ftx0 − Fxt0 − F1 (t0 x00 − t00 x0 )].
ПРИМЕР 6.5. Определить экстремали функционала
0 0 02 02
Если x , t одновременно не равны нулю (x + t 6= 0), то два уравнения Zt1 q
Эйлера сводятся к одному уравнению 
J(x(·), y(·)) = x0 2 + y 0 2 + a2 (xy 0 − yx0 ) dt.
F1 (t, x, t0 , x0 )(t0 x00 − t00 x0 ) + Ftx0 − Fxt0 = 0. 0
152 Глава 6 3. Каноническая (Гамильтонова) форма уравнений Эйлера 153

p
Функция F = x0 2 + y 0 2 + a2 (xy 0 − yx0 ) положительно однородна пер- Функцией Гамильтона, или гамильтонианом H функционала J(x(·)),
вого порядка относительно x0 , y 0 . Воспользуемся формой Вейерштрасса называется функция переменных t, x, p, которая определяется равен-
уравнений Эйлера ством H = −L(t, x, x0 ) + x0 Lx0 (t, x, x0 ), где x0 = w(t, x, p). С помощью
функции H систему уравнений (6.6) можно записать в виде
Fx 0 x 0 1
Fxy0 = a2 , Fyx0 = −a2 , F1 = = 02 . ∂H dx ∂H dp
y0 2 (x + t0 2 )3/2 = , =− . (6.7)
∂p dt ∂x dt
1
Итак, уравнение Эйлера в форме Вейерштрасса имеет вид R = 2a2 .
Таким образом, кривизна экстремали постоянна. Поэтому экстремали — Эти уравнения называются канонической или Гамильтоновой системой
это дуги окружности. 4 уравнений Эйлера функционала J(x(·)). Переменные t, x, p называются
каноническими. В механике переменную p называют импульсом, а функ-
цию H — энергией.
3. Каноническая (Гамильтонова) форма уравнений Теорема 6.1. Уравнение Эйлера (6.3) эквивалентно канонической
Эйлера системе уравнений (6.7).
Уравнение Эйлера (дифференциальное уравнение второго порядка) ДОКАЗАТЕЛЬСТВО.
Действительно, пусть x(t) — решение уравнения (6.3). Покажем,
d что x(t), p(t) = Lx0 (t, x(t), x0 (t)) — это решение системы уравнений (6.7).
Lx − Lx0 = 0 (6.3)
dt Первое уравнение в (6.7) — следствие определения функции H. Чтобы
вывести второе, запишем
функционала основной задачи вариационного исчисления
dp d
Zt1 = Lx0 (t, x, x0 ) = Lx (t, x, x0 ) = −Hx0 .
dt dt
J(x(·)) = L(t, x(t), x0 (t))dt → extr,
Пусть теперь x(t), p(t) — решение системы (6.7). Тогда
t0
x(t0 ) = x0 , x(t1 ) = x1 dp ∂H dp d
=− = Lx , p = L x0 , = Lx 0 .
dt ∂x dt dt
можно заменить системой двух уравнений первого порядка, если ввести
обозначение Сравнивая правые части уравнений, получим уравнения Эйлера.
Lx0 (t, x, x0 ) = p. (6.4) Пользуясь канонической системой уравнений Эйлера, можно дока-
Тогда уравнение Эйлера (6.3) будет иметь вид зать, что гамильтониан H вдоль экстремали удовлетворяет уравнению
∂H dH
Lx = p 0 . (6.5) = . (6.8)
∂t dt
Если вторая производная Lx0 x0 6= 0, то уравнение (6.4) можно решить от- Действительно,
носительно x0 . Пусть x0 = w(t, x, p). Подставим это выражение в уравне-
ние (6.5). Получим систему двух уравнений относительно неизвестных dH ∂H ∂H dx ∂H dp
= + + =
функций p(t), x(t): dt ∂t ∂x dt ∂p dt
∂H ∂H ∂H ∂H ∂H ∂H
dx dp ∂ = + − = .
= w(t, x, p), = L(t, x, p). (6.6) ∂t ∂x ∂p ∂p ∂x ∂t
dt dt ∂x
154 Глава 6 3. Каноническая (Гамильтонова) форма уравнений Эйлера 155

В соответствии с уравнением (6.8) гамильтониан не меняется вдоль экс- Канонические переменные


тремали (H = C = const), если функция L не зависит явным образом √
от t. А это означает, что H(x, p) — первый интеграл канонической си- x0 x 2 + t 2 2 p2
p = L0x0 = p , x0 = 2 ,
стемы. 1 + x0 2 x + t2 − p 2
Если функционал p
H = [−L + x0 L0x0 ] x0 =p/√x2 +t2 −p2 = − x2 + t2 − p2 .
Zt1
J(x1 (·), . . . , xn (·)) = L(t, x1 (t), . . . , xn (t), x01 (t), . . . , x0n (t)) dt, Каноническая система уравнений будет такая:
t0
dp x dx p
зависит от n функций, то систему уравнений второго порядка =p , =p .
dt x + t2 − p 2
2 dt x + t2 − p 2
2
4
d
Lxk − Lx0k = 0, k = 1, n
dt
ПРИМЕР 6.7. Составить каноническую систему уравнений Эйлера
можно заменить канонической системой 2n уравнений первого порядка функционала
∂H dxk ∂H dpk Zt1
= , =− , k = 1, n. (6.9)
∂pk dt ∂xk dt J(x1 (·), x2 (·)) = (2x1 x2 − 2x21 + (x01 )2 − (x02 )2 ) dt.
Гамильтониан H(t, x1 , . . . , xn , p1 , . . . , pn ) функционала определяется ра- t0
венством
Пусть L0x0 = p1 , L0x0 = p2 . Тогда p1 = 2x01 , p2 = −2x02 . Определитель
H= −L(t, x1 , . . . , xn , x01 , . . . , x0n )+ 1 2

00
X n L x0 x0 L00 x0 x0 2 0
00 1 1 1 2
+ x0k Lx0k (t, x1 , . . . , xn , x01 , . . . , x0n ), L x0 x0 L00 x0 x0 = 0 −2 = −4 6= 0.
2 1 2 2
k=1
p1
где x0k = wk (t, x1 , . . . , xn , p1 , . . . , pn ) найдены из уравнений Lx0k = pk , Решим уравнения относительно x01 , x02 . Получим x01 = 2 , x02 = − p22 .
Гамильтониан данного функционала
k = 1, n, при условии, что определитель
p2 p2
Lx0 x0 6= 0. H = (−L + x01 L0x01 + x02 L0x02 ) x0 = p1 ,x0 =− p2 = 2x21 − 2x1 x2 + 1 − 2 .
k j k,j=1,n
1 2 2 2 4 4
Заметим, что дифференциальное уравнение второго порядка можно при- Каноническая система уравнений Эйлера будет иметь вид
вести к системе уравнений первого порядка и другими способами. Ка-
ноническая система имеет те преимущества, что она проста и симмет- dx1 p1 dx2 p2
рична. = , =− ,
dt 2 dt 2
ПРИМЕР 6.6. Составить каноническую систему уравнений Эйлера dp1 dp2
= −4x1 + 2x2 , = 2x1 .
функционала dt dt
Zt1 p p
J(x(·)) = x2 + t2 1 + x0 2 dt. Здесь x1 = x1 (t), x2 = x2 (t), p1 = p1 (t), p2 = p2 (t) — неизвестные
функции от t. 4
t0
156 Глава 6 4. Уравнение Гамильтона–Якоби 157

4. Уравнение Гамильтона–Якоби Это уравнение в частных производных называется уравнением Гамиль-


тона–Якоби. Канонические уравнения Эйлера — это уравнения характе-
Рассмотрим задачу вариационного исчисления ристик уравнения Гамильтона–Якоби.
Рассмотрим взаимосвязь между решениями уравнения Гамильтона–
Zt Якоби и первыми интегралами системы уравнений Эйлера.
Jt,v (x(·)) = L(s, x(s), x0 (s)) ds, x(a) = b, x(t) = v,
Теорема 6.2 (Теорема Якоби). Пусть S = S(t, x, α) ∈ C 2 [t0 , t1 ] —
a
полный интеграл Гамильтона–Якоби и ∂ 2 S/∂α∂x 6= 0. Тогда функция
зависящую от параметров t, v. Обозначим через x
b(s, t, v), s ∈ [a, t], функ- x(t, α, β) ∈ C 1 [t0 , t1 ], определенная из уравнения ∂S(t, x, α)/∂α = β,
цию, которая дает минимум функционала Jt,v (x(·)), а через S(t, v) — сам вместе с функцией
минимум функционала. Тогда
∂S(t, x(t, α, β))
p(t, α, β) =
Zt ∂x
S(t, v) = b(s, t, v), x
L(s, x bs (s, t, v)) ds = составляют общее решение канонической системы уравнений Эйле-
a ра.
Z
t−∆t
ДОКАЗАТЕЛЬСТВО.
= b(s, t, v), x
L(s, x bs (s, t, v)) ds+ Покажем сначала, что ∂S/∂α = β — это первый интеграл канони-
a ческой системы, то есть d(∂S/∂α)/dt = 0. Запишем
Zt
+ b(s, t, v), x
L(s, x bs (s, t, v)) ds = d ∂S ∂2S ∂ 2 S dx
= + . (6.11)
dt ∂α ∂t∂α ∂x∂α dt
t−∆t
b(t, t − ∆t, v)) + L(t, x
= S(t − ∆t, x b0t (t, t, v))∆t + o(|∆t|).
b(t, t, v), x Продифференцируем тождество
 
Разделим обе части на ∆t и перейдем к пределу при ∆t → 0. Получим ∂S(t, x, α) ∂S(t, x, α)
+ H t, x, =0 (6.12)
уравнение ∂t ∂x
dS(t, x)
b(t), x0 (t)).
= L(t, x по параметру α. Получим
dt
Учитывая, что ∂2S ∂H ∂ 2 S
dS(t, x) ∂S(t, x) ∂S(t, x) dx =− . (6.13)
= + , ∂t∂α ∂p ∂x∂α
dt ∂t ∂x dt
это уравнение можно записать так: Подставим уравнение в (6.11) и воспользуемся канонической системой
уравнений Эйлера
∂S(t, x) ∂S(t, x) 0 ∂H dx ∂H dp
− L(t, x, x0 ) + x = 0. = , =− . (6.14)
∂t ∂x ∂p dt ∂x dt
Если перейти к каноническим переменным x, p, то уравнение будет Тогда  
иметь вид   d ∂S ∂H dx ∂ 2 S
∂S(t, x) ∂S(t, x) = − + = 0.
+ H t, x, = 0. (6.10) dt ∂α ∂p dt ∂x∂α
∂t ∂x
158 Глава 6 4. Уравнение Гамильтона–Якоби 159

∂S ∂S
Проверим теперь, что функции p(t, α, β), x(t, α, β) удовлетворяют кано- 2) частные производные ∂a k
, ∂x k
, k = 1, n, непрерывно дифференци-
нической системе уравнений (6.14). Из определения функции x(t, α, β) руемы по всеми аргументам;
и равенства (6.13) вытекает, что
3) если определитель 2
dx ∂ 2 S/∂α∂t ∂H ∂ S
=− 2 = . (6.15) 6= 0,
∂xk ∂aj
dt ∂ S/∂α∂x ∂p k,j=1,n

Это одно из уравнений канонической системы. Чтобы составить второе то равенства


уравнение, продифференцируем по x тождество (6.12). Получим ∂S ∂S
= bk , = pk , k = 1, n,
∂ak ∂xk
∂2S ∂H ∂H ∂ 2 S где bk — произвольные константы, задают решение канонической
+ + = 0.
∂x∂t ∂x ∂p ∂x2 системы уравнений
В соответствии с определением функции p(t, α, β) из уравнения (6.14) ∂H dxk ∂H dpk
получим = , =− , k = 1, n,
∂pk dt ∂xk dt
dp ∂2S ∂ 2 S dx ∂2S ∂ 2 S dH
= + = + .
dt ∂x∂t ∂x2 dt ∂x∂t ∂x2 dp зависящей от 2n переменных.
Из последних двух уравнений выводим второе уравнение канонической ПРИМЕР 6.8. Отыскать экстремали функционала
системы (6.13). Теорема доказана.
Если функционал J(x1 (·), . . . , xn (·)) зависит от вектор-функции, то Zt1 p p
уравнение Гамильтона–Якоби имеет вид J(x(·)) = x2 + t 2 1 + (x0 )2 dt.
  t0
∂S ∂S ∂S p
+ H t, x1 , . . . , xn , ,..., = 0. (6.16)
∂t ∂x1 ∂xn Гамильтониан функционала H = − x2 + t2 − p2 . Уравнение Гамильто-
на–Якоби имеет вид
Полным интегралом уравнения в частных производных первого порядка s
называется решение уравнения, которое содержит столько неизвестных  2
∂S ∂S
констант, сколько независимых переменных. Уравнение Гамильтона– 2
= x +t −2 ,
Якоби (6.16) зависит только от частных производных неизвестной функ- ∂t ∂x
ции. Полный интеграл такого уравнения можно представить в виде S = или
= S(t, x1 , . . . , xn , a1 , . . . , an ) + a, где a, a1 , . . . , an — неизвестные кон-  2  2
∂S ∂S
станты. + = x2 + t2 .
∂x ∂t
Если функционал J(x1 (·), . . . , xn (·)) зависит от вектор-функции, то
верна теорема, аналогичная теореме 6.2. Если решение искать в виде S = 12 (At2 + 2Bxt + Cx2 ), то для неиз-
Теорема 6.3 (Теорема Якоби). Пусть S — полный интеграл вестных A, B, C будут выполняться такие соотношения: A2 + B 2 = 1,
Гамильтона–Якоби. Если выполняются условия: B(A + C) = 0, B 2 + C 2 = 1. Пусть A = −C = sin(β), B = cos(β).
Решение уравнения будет таким:
1) функция S непрерывно дифференцируема по параметрам ak , k =
= 1, n; 1 2
S= (t sin(β) − 2xt cos(β) − x2 sin(β)).
2
160 Глава 6 5. Вариационные принципы механики 161

В соответствии с теоремой Якоби интеграл уравнения Эйлера определя- Rt1


1
лера функционала (T − U ) dt имеет вид
ется из равенства ∂S 2 2
∂β =const= α, или t cos(β)+2tx sin(β)−x cos(β)=α.
t0
2
Это семейство гипербол. Итак, экстремали функционала — гипербо- ∂U d ∂T ∂U d ∂T
лы. 4 − − = 0, − − = 0,
∂xk dt ∂x0k ∂yk dt ∂yk0
∂U d ∂T
− − = 0,
5. Вариационные принципы механики ∂zk dt ∂zk0
или
Основным вариационным принципом механики является принцип mk x00k − Fkx = 0, mk yk00 − Fky = 0, mk zk00 − Fkz = 0.
стационарного действия Остроградского–Гамильтона, согласно которо-
му среди всех возможных движений системы материальных точек в Это обычные уравнения свободного движения системы n материаль-
действительности происходит движение, которое дает стационарное зна- ных точек. Если движение подчинено еще некоторой системе незави-
чение (то есть значение, отвечающее аргументу, при котором вариация симых связей ϕj (t, x1 , . . . , xn , y1 , . . . , yn , z1 , . . . , zn ) = 0, j = 1, . . . , m,
функционала равняется нулю) интеграла m < 3n, то из этих уравнений можно выразить m переменных через
3n − m независимых переменных (не считая t). Обозначим эти пере-
Zt1 менные через q1 , q2 , . . . , q3n−m . Тогда кинетическую и потенциальную
(T − U ) dt, энергии T , U также можно рассматривать как функции от переменных
q1 , q2 , . . . , q3n−m , t. Система уравнений Эйлера будет иметь вид
t0
∂(T − U ) d ∂T
где T — кинетическая, а U — потенциальная энергия системы. − = 0, k = 1, . . . , 3n − m.
∂qk dt ∂qk0
Применим этот принцип к некоторым задачам механики.
Рассмотрим канонические переменные для функционала
ПРИМЕР 6.9. Пусть задана система n материальных точек с массами
mk , k = 1, n, и координатами (xk , yk , zk ). На систему действуют силы F k Zt1 X n
с потенциалом −U , который зависит лишь от координат: J = (T − U ) dt, T = 1 mk ((x0k )2 + (yk0 )2 + (zk0 )2 ).
2
t0 k=1
∂U ∂U ∂U
Fkx =− , Fky =− , Fkz =− , Запишем pkx = Lx0k = mk x0k , pky = Lyk0 = mk yk0 , pkz = Lzk0 = mk zk0 . То
∂xk ∂yk ∂zk
есть pkx , pky , pkz — это компоненты импульса k-й материальной точки.
где Fkx , Fky , Fkz — координаты вектора F k , действующего на точ- Гамильтониан
ку (xk , yk , zk ). Составить дифференциальное уравнение движения си- Xn

стемы материальных точек. H= (x0k pkx + yk0 pky + zk0 pkz ) − L = 2T − (T − U ) = T + U


Решение. Кинетическая энергия k=1

n
— это полная энергия системы материальных точек. 4
X
T =1 mk ((x0k )2 + (yk0 )2 + (zk0 )2 ), Пользуясь видом функции под знаком интеграла, можно установить
2 закон сохранения энергии. Действительно, пусть система консерватив-
k=1
на, то есть функция Лагранжа L не зависит от t. (Это означает, что
а потенциальная энергия системы равняется U . Система уравнений Эй- энергия U не меняется с течением времени.) В таком случае, как было
показано раньше, H = const вдоль каждой экстремали, то есть полная
энергия консервативной системы не меняется во время движения.
162 Глава 6 5. Вариационные принципы механики 163

ПРИМЕР 6.10. Вывести дифференциальное уравнение свободных ко- а уравнение вынужденных колебаний струны будет таким:
лебаний струны.
Поместим начало координат в один из концов струны. В состоянии ∂ ∂
(ρu0t ) − (ku0x ) = ρf (t, x),
покоя под действием натяжения струна лежит на прямой, по которой ∂t ∂x
направим ось абсцисс. Отклонение от положения равновесия u(x, t) бу- или
дет функцией, которая зависит от абсциссы x и времени t. Потенци- k 00
u00tt − u = f (t, x).
альная энергия u элемента абсолютно гибкой струны пропорциональна ρ xx
растяжениюpструны. Отрезок dx в деформированном состоянии имеет Положение устойчивого равновесия струны описывается уравнением
длину ds = 1 + (u0x )2 dx. Поэтому приращение длины элемента равня- Остроградского функционала
p  p
ется 1 + (u0x )2 − 1 dx. По формуле Тейлора 1 + (u0x )2 ≈ 1 + 1 (u0x )2 .
2 Zl  
Считая u0x малым и пренебрегая более высокими степенями, определя- k 2
u − f (x)u dx.
ем потенциальную энергию элемента: 1 k(u0x )2 dx, где k — коэффици- 2 x
2 0
ент пропорциональности. Потенциальная энергия всей струны равняет-
Rl Rl Если внешняя сила f = f (x) не зависит от времени, то уравнение имеет
ся 1 k(u0x )2 dx. Кинетическая энергия струны равняется 1 ρ(u0t )2 dx, вид kuxx + f (x) = 0. 4
2 0
2 0
Rt1 ПРИМЕР 6.11. Вывести дифференциальное уравнение колебаний
где ρ — плотность струны. Интеграл (T − U ) dt имеет вид прямого стержня.
t0
Направим ось абсцисс по оси стержня, который находится в поло-
жении равновесия. Отклонение от этого положения u(x, t) будет функ-
Zt1 Z l
  цией координаты x и времени t. Кинетическая энергия стержня длиной l
v=1 ρ(u0t )2 − k(u0x )2 dxdt. равняется
2
t0 0 Zl
T = 1 ρ(u0t )2 dx.
Уравнением движения струны будет уравнение Остроградского функци- 2
онала v: 0
∂ ∂ Будем считать, что стержень растягивается. Потенциальная энергия
(ρu0t ) − (ku0x ) = 0.
∂t ∂x упругого стержня при постоянной кривизне пропорциональна квадрату
Если струна однородна, то ρ, k — постоянны, и уравнение колебаний кривизны. Поэтому потенциальная энергия стержня
струны упрощается: ρu00tt − ku00xx = 0. Пусть на струну действует внеш-
няя сила f (t, x), перпендикулярная к ее положению равновесия и рас- Zl
(u00xx )2
считанная на единицу массы. Силовая функция этой внешней силы, дей- U = 1k p dx.
2 (1 + u2x )3
ствующая на элемент струны, равняется ρf (t, x) dx. Поэтому интеграл 0
Остроградского–Гамильтона будет иметь вид
Если отклонение стержня от положения равновесия мало и слагаемым u 2x
Zt1 Zt1 Z l можно пренебречь, то
1  0 2 
(T − U ) dt = ρ(ut ) − k(u0x )2 + 2ρf (t, x)u dxdt,
2 Zl
t0 t0 0
U=1 k(u00xx )2 dx.
2
0
164 Глава 6 5. Вариационные принципы механики 165

Интеграл Остроградского–Гамильтона имеет вид Решение. Направим ось OY вверх. Тогда потенциал силы тяготе-
ния u = −gy. В соответствии с принципом наименьшего действия на
Zt1 Z l траектории γ движения интеграл действия
1  
ρ(u0t )2 − k(u00xx )2 dxdt.
2 Zt1
t0 0
J= T dt
Поэтому при свободных колебаниях стержня верно такое уравнение дви- t0
жения:
∂ ∂2 имеет минимальное значение. Принцип наименьшего действия можно
(ρu0t ) + 2 (ku00xx ) = 0.
∂t ∂x представить в форме Якоби
Если стержень однородный, то ρ, k — постоянные, и уравнение колеба- Z p
ний можно представить в виде 2(u + h) ds → min,
γ
∂ 2u ∂4u
ρ 2
+ k 4 = 0.
∂t ∂x где ds — дифференциал дуги траектории γ. Если материальная точка
двигается под действием силы тяготения, то функционал
Когда на стержень действует внешняя сила f (t, x), нужно учитывать
потенциал этой силы. В этом случае имеет место такое уравнение: Zx2 p q
J= 2(h − gy) 1 + y 0 2 dx.
∂2u ∂4u
ρ 2 + k 4 = f (t, x). x1
∂t ∂x
Уравнение равновесия под действием внешней силы f (x), не зависящей Уравнение Гамильтона–Якоби такого функционала имеет вид
от времени, приобретает вид s  2
∂S ∂S
∂4u − 2h − 2gy − = 0,
k = f (x). ∂x ∂y
∂x4
или  2  2
Решения дифференциальных уравнений удовлетворяют граничным усло- ∂S ∂S
виям + = 2(h − gy).
∂x ∂y
u(0) = ux (0) = u(l) = ux (l)
Его полный интеграл
(стержень с закрепленными концами) и
Z p
1p
uxx (0, t) = uxx (l, t) = uxxx (0, t) = uxxx(l, t) = 0 S = Ax + 2h − 2gy − A2 dy = Ax − (2h − 2gy − A2 )3 + B,
3g
(стержень со свободными (незакрепленными) концами). 4 где A, B — константы.
ПРИМЕР 6.12. Исходя из принципа наименьшего действия, опреде- Итак, экстремали задачи удовлетворяют уравнению
лить траекторию движения материальной точки единичной массы под
Ap
действием силы тяготения. x+ 2h − 2gy − A2 = C,
g
166 Глава 6 6. Задачи 167

откуда 6.12 Построить траекторию движения точки в плоскости под дей-


h A2 g ствием силы отталкивания от оси OX, пропорциональной расстоянию
y= − − (x − C)2 , точки от этой оси и направленной параллельно оси OY при условии,
g 2g 2A2
что интеграл живой силы имеет вид
где A, C — константы.
Если экстремали проходят через начало координат, то y(0) = 0, v2 y2
и уравнение имеет вид − = 0,
2 2

g 2 2h − A2 а интеграл действия равняется
y = − 2x + x.
2A A
Zx2 p
Итак, траектория движения материальной точки описывается однопара- y 1 + (y 0 )2 dx, y > 0.
метрическим семейством парабол. 4
x1

6. Задачи
6.13 Материальная точка описывает окружность ρ = 2R cos(ϕ)
(ρ, ϕ — полярные координаты) радиуса R под действием центральной
Составить канонические системы уравнений Эйлера функционалов силы k/ρ5 . Показать, что на любой дуге окружности (−π/2 < ϕ1 6 ϕ 6
R
6.1 tx(x0 )3 dt. 6 ϕ2 < π/2) интеграл действия достигает сильного минимума.
R √ 6.14 Определить траекторию движения материальной точки под дей-
6.2 tx x0 dt.
R ствием центральной силы протягивания, которая пропорциональна рас-
6.3 tx(x0 )2 dt. стоянию от центра, исходя из принципа наименьшего действия и приме-
R няя метод Гамильтона–Якоби.
6.4 ((x01 )2 + x22 + (x02 )2 ) dt.
R 2
6.5 (t + x1 (x01 )2 + x2 (x02 )2 ) dt.
R
6.6 (2tx1 − (x01 )2 + (x02 )3 /3) dt.
Отыскать общее решение уравнения Эйлера, решая уравнение
Гамильтона–Якоби, функционалов
R
6.7 1 (x0 )2 dt.
2

6.8 1 R ((x0 )2 + x2 ) dt.


2

6.9 1 R ((x0 )2 − x2 ) dt.


2
R √1+(x0 )2
6.10 x dt.
R p
p
6.11 x 1 + (x0 )2 dt.
1. Задачи Больца и Лагранжа 169

и точек b
t0 , b
t1 .


t1Z
+λτ1
ГЛАВА 7 ϕ(λ) = b0 (t) + λh0 (t)) dt+
b(t) + λh(t), x
L(t, x
Вариационные задачи на множестве


t0 +λτ0

+l(b b(b
t0 +λτ0 , x t0 +λτ0 )+λh(b
t0 +λτ0 ), b b(b
t1 +λτ1 , x t1 +λτ1 )+λh(b
t1 +λτ1 )),
функций с подвижными границами 
x(·), b
Поскольку δB (b t0 , b
t1 ), (h(·), τ0 , τ1 ) = ϕ0 (0), то

x(·), b
δB (b t0 , b
t1 ), (h(·), τ0 , τ1 ) = ϕ0 (0) =
1. Задачи Больца и Лагранжа на множестве функций


Zt1

со свободными границами = L b x0 (t)h0 (t) dt + L(
b x (t)h(t) + L b b b b
t1 )τ1 − L( t0 )τ0 +


Пусть ∆ — конечный замкнутый отрезок действительной прямой. t0

В пространстве C 1 (∆, Rn ) × R × R, состоящем из элементов (x(·), t0 , t1 ), +b


lt0 τ 0 + b
lt1 τ 1 + b
lx0 (h(b t0 )τ0 ) + b
b0 (b
t0 ) + x lx1 (h(b b0 (b
t1 ) + x t1 )τ1 ), (7.2)
рассмотрим задачу Больца
где
Zt1
B(x(·), t0 , t1 ) = L(t, x(t), x0 (t)) dt + l(t0 , x(t0 ), t1 , x(t1 )) → extr, (7.1) b = L(t, x
L(t) b0 (t), xb0 (t)), b x (t) = Lx (t, x
L b0 (t), x
b0 (t)),
t0 Lb x0 (t) = Lx0 (t, x
b0 (t), x
b0 (t)),
b
ltj = ltj (b b(b
t0 , x t0 ), b b(b
t1 , x t1 )), b
lxj = lxj (b b(b
t0 , x t0 ), b b(b
t1 , x t1 )), j = 0, 1.
где точки t0 , t1 не фиксированы. Известно лишь, что t0 , t1 ∈ ∆.
Допустимый элемент (b x(·), b
t0 , b
t1 ) дает слабый локальный минимум
(слабый локальный максимум) функционала задачи (7.1), если суще- x(·), b
Если элемент (b t0 , b
t1 ) пространства C 1 (∆, Rn )×R×R дает локальный
ствует такое число ε > 0, что для любого другого допустимого элемен- экстремум функционала (7.1), то
та (x(·), t0 , t1 ) ∈ C 1 (∆, Rn ) × R × R, удовлетворяющего условиям |t0 − 
−bt0 | < ε, |t1 − b b(·)kC 1 (∆,Rn ) < ε, выполняется неравенство
t1 | < ε, kx(·) − x δB (b t0 , b
x(·), b t1 ), (h(·), τ0 , τ1 ) = 0

 для любых допустимых вариаций из пространства C 1 (∆, Rn ) × R × R.


b(·), b
B x t0 , b
t1 6 B(x(·), t0 , t1 )
  Рассмотрим сначала вариацию (h(·), 0, 0), где h(·) ∈ C 1 (∆, Rn ), h(b
tj ) = 0,
b(·), b
B x t0 , b
t1 > B(x(·), t0 , t1 ) . j = 0, 1. Из (7.2) следует, что

Для того чтобы найти экстремали функционала (7.1), используем необ-


Zt1
ходимое условие экстремума первого порядка. Пусть функции L = 
b x (t)h(t) + L
L b x0 (t)h0 (t) dt = 0
= L(t, x, x0 ), l = l(t0 , x0 , t1 , x1 ) и их частные производные Lx , Lx0 , ltj ,
lxj , j = 0, 1, непрерывны. Вычислим первую вариацию функционала


t0

B x b(·), b
t0 , b
t1 . Для этого определим функцию ϕ(λ) = B(b x(·) + λh(·), b
t0 +
для любой вектор-функции h(·) ∈ C 1 ([b
t0 , b
t1 ], Rn ) такой, что h(b
t0 ) =
b
+ λτ0 , t1 + λτ1 ), где h(·), τ0 , τ1 — допустимые вариации функции x b(·)
= h(b
t1 ) = 0. Применяя лемму Дюбуа-Реймона, получим уравнение Эй-
170 Глава 7 1. Задачи Больца и Лагранжа 171

b x (t) = d L
лера L b x0 (t). Учитывая это соотношение, проинтегрируем ча- 1) уравнению Эйлера
dt
стями интегральное слагаемое в (7.2). Получим  
b x (t) = d L
L b x0 (t), t∈ b
t0 , b
t1 ;
b x0 (b
(α0 − L t0 ))h(b b x0 (b
t0 ) + (α1 + L t1 ))h(b
t1 ) + β0 τ0 + β1 τ1 = 0, dt

где αj = blx j , βj = b
ltj + b b b
b0t + (−1)j+1 L(
ltj x tj ), j = 0, 1. Последнее соотно- 2) условиям трансверсальности по x


j

шение выполняется для произвольных векторов h(b t0 ), h(b


t1 ) и чисел τ0 , b x0 (b b x0 (b
L t0 ) = 0, L t1 ) = 0;
τ1 . Поэтому каждое слагаемое равняется нулю. Итак, мы доказали такое
утверждение.
3) условиям стационарности по t0 , t1
Теорема 7.1 (Необходимые условия экстремума в задаче Боль-
ца на множестве функций со свободными границами). Если эле- b b
L( t0 ) = 0, b b
L( t1 ) = 0.
мент (b t0 , b
x(·), b t1 ) пространства C 1 (∆, Rn )×R×R дает слабый локаль-
ный экстремум функционала задачи Больца (7.1), то x b(t), b
t0 6 t 6 b
t1 ,
удовлетворяет: ЗАМЕЧАНИЕ 7. Граничные условия в задаче Лагранжа (7.3) отсутствуют.
Поэтому она и называется задачей Лагранжа на множестве функций со свобод-
1) уравнению Эйлера ными границами. Условия стационарности по t записываются только для таких
задач.
b x (t) = d L
L b x0 (t), t ∈ [b
t0 , b
t1 ];
dt ПРИМЕР 7.1. Исследовать на экстремум функционал

2) условиям трансверсальности по x ZT

b x0 (t0 ) = b b x0 (t1 ) = −b J(x(·), T ) = (x0 )2 − x + 1 dt → extr, x(0) = 0.
L lx 0 , L lx 1 ;
0

3) условиям стационарности по t Это задача Лагранжа на множестве функций с фиксированным левым


(−1) j+1 b
tj ) + b
L(b ltj + b b (b
lx j x 0
tj ) = 0, j = 0, 1. концом и свободным правым концом. Поэтому условие трансверсаль-
ности и условие стационарности по T записываются только на правом
конце. Воспользуемся необходимыми условиями экстремума.
ЗАМЕЧАНИЕ 6. Условия стационарности по t записываются только тогда, 1. Составим уравнение Эйлера для интегранта L = (x0 )2 − x + 1. Оно
когда задача исследуется на множестве функций со свободными границами. имеет вид
Теорема 7.2 (Необходимые условия экстремума в задаче Ла- Lbx = d Lb x0 ⇐⇒ 2x00 = −1.
гранжа на множестве функций со свободными границами). Если dt
элемент (b t0 , b
x(·), b t1 ) пространства C 1 (∆, Rn ) × R × R дает локальный 2
экстремум функционала задачи Лагранжа Общее решение уравнения x = − t + C1 t + C2 . Из граничного усло-
4
Zt1 вия x(0) = 0 следует, что C2 = 0.
2. Для определения неизвестных C1 , Tb используем условие транс-
J(x(·), t0 , t1 ) = L(t, x(t), x0 (t)) dt → extr, (7.3)
версальности по x
t0

b x0
L = 0, 2x0 (Tb) = 0 ⇐⇒ −Tb + 2C1 = 0, Tb = 2C1
x(·), b
то (b t0 , b
t1 ) удовлетворяет: 
t=T
172 Глава 7 2. Задача Лагранжа с подвижными границами 173

и условие стационарности по T Точки t0 , t1 ∈ ∆ не фиксированы, ∆ — заданный отрезок числовой пря-


мой.
L(Tb) = 0 ⇐⇒ (x0 )2 (Tb) − x(Tb) + 1 = 0,
Теорема 7.3 (Необходимые условия экстремума в задаче Ла-
(2C1 − Tb)2 − (4C1 Tb − Tb2 ) + 4 = 0, гранжа на множестве функций с подвижными границами). Пусть
Tb2 = 4, Tb = 2, C1 = 1. функция L(t, x, x0 ) и ее частные производные Lx (t, x, x0 ), Lx0 (t, x, x0 )
непрерывны, а функции ϕ0 (t), ϕ1 (t) непрерывно дифференцируемы.
b = t − t2 /4 на отрезке [0, 2].
Итак, существует одна экстремаль x Если элемент (b x(·), t0 , t1 ) пространства C 1 (∆, R) × R × R такой,
3. Покажем, что она не дает локального экстремума функционала. b b(t1 ) = ϕ1 (b
b(t0 ) = ϕ0 (t0 ), x
что x t1 ) дает локальный экстремум функци-
b = t − t2 /4
Действительно, для x онала задачи (7.4), (7.5), то (b x(·), t0 , t1 ) удовлетворяет:
ZT 1) уравнению Эйлера

J(b
x(·), T ) = x 0 )2 − x
(b b + 1 dt =
0 b x (t) = d L
L b x0 (t), t ∈ [b
t0 , b
t1 ];
dt
ZT
 (T − 2)3
= (1 − t/2)2 − (t − t2 /4) + 1 dt = + 4. 2) условиям трансверсальности
6 3
0
b b
L( b x0 (b
tj ) = L x0 (b
tj )(b tj ) − ϕ0j (b
tj )), j = 0, 1.
При T , близких к Tb = 2, значения функционала J(b x(·), T ) могут
быть как меньшими, так и большими J(b x, Tb). Кроме того, для последо-
вательности пар xn (t) = t, Tn = n Уравнение Эйлера выполняется потому, что x b(·) дает локальный
экстремум функционала (7.4) и при фиксированных граничных усло-
J(xn (·), Tn ) → −∞. виях x(b b(b
tj ) = x tj ), j = 0, 1. Выведем условие трансверсальности в точке
Итак, Smin = −∞. Аналогично показываем, что Smax = +∞. b
t1 . Условие трансверсальности в точке b t0 выводится аналогично. Опреде-
b = t − t2 /4 удовлетворяет необходимым усло-
Ответ. Экстремаль x лим однопараметрическое множество функций x(t, C) и функцию двух
виям экстремума функционала, но xb∈/ locextr. переменных ψ(t1 , C) = x(t1 , C) − ϕ1 (t1 ). По условиям теоремы

ψ(b b(b
t1 , 0) = x t1 ) − ϕ1 (b
t1 ) = 0, ψc0 (b
t1 , 0) = b
t1 − b
t0 6= 0.
2. Задача Лагранжа на множестве функций
с подвижными границами В соответствии с теоремой о неявной функции существует такая непре-
рывно дифференцируемая функция C(t1 ), что C(b t1 ) = 0 и x(t1 , C(t1 )) =
Рассмотрим в пространстве C 1 (∆, R) × R × R задачу на экстремум = ϕ(t1 ), C 0 (b
t1 ) = (ϕ01 (b x0 (b
t1 )−b t1 ))/(b
t1 − b
t0 ). Пусть τ1 — вариация точки b t1 ,
функционала t1 = b
t1 + τ1 . Определим функцию
Zt1
A(t1 ) = J(x(·, C(t1 )), b
t0 , t1 ) =
J(x(·), t0 , t1 ) = L(t, x(t), x0 (t)) dt → extr (7.4)
Z1
t
t0
= L(t, x b(t) + C(t1 )(t − b b0 (t) + C(t1 )) dt.
t0 ), x
с двумя подвижными границами


t0
x(t0 ) = ϕ0 (t1 ), x(t1 ) = ϕ1 (t1 ). (7.5)
174 Глава 7 2. Задача Лагранжа с подвижными границами 175

Поскольку элемент (b x(·), b


t0 , b
t1 ) дает локальный экстремум функциона- Пусть точка tj не фиксирована, а граничное условие имеет вид x(tj ) = a.
ла J(x(·), t0 , t1 ), то b
t1 дает локальный экстремум функции A(t1 ). Поэто- Это означает, что граничная точка двигается по горизонтальной прямой. На этот
му δA(t1 , τ1 ) = A0 (t1 )τ1 = 0 для всех возможных вариаций τ1 . Произ- раз условие трансверсальности такое:
водная





L(tj ) − x0 (tj )Lx0 (tj ) = 0.



Zt1
 ПРИМЕР 7.2. Записать условие трансверсальности для функционала
A (b
0 b b
t1 ) = L( t1 ) + C 0 (b
t1 ) b x (t)(t − b
L b x0 (t) dt.
t0 ) + L
Zt1


t0
0 p
J(x(·)) = f (t, x)earctg(x ) 1 + (x0 )2 dt, f (t, x) 6= 0.
Интегрируя частями, учитывая уравнение Эйлера и выражение для C 0 (b
t1 ), t0
получим
Решение. 1. Пусть левый конец экстремали фиксирован, x(t0 ) = x0 ,
A0 (b
t1 ) = а правый конец двигается по кривой x = ψ(t). Поскольку


Zt1  
t1 1


0
b b
=L( t1 ) + C 0 (b
t1 ) b d b b b b
Lx (t) − Lx0 (t) (t − t0 ) dt + (t − t0 )Lx0 (t) t0 = Lx0 = f (t, x)earctg(x ) (1 + x0 ) p ,


dt 1 + (x0 )2
t0
 то условие трансверсальности
b b
=L( t1 ) + ϕ01 (b
t1 ) b0 (b
−x t1 ) Lb x0 (b
t1 ).
 
L − (ψ 0 − x0 )Lx0 t=t1 = 0
Поэтому вариация функционала J(x(·), t0 , t1 ) на правом конце b t1 отрез-
t0 , b
ка [b t1 ] равняется имеет вид
  
p
δJ(b x(·), bt0 , b
t1 ) x(·, C(b
t1 + τ1 )) − x b(·), 0, τ1 f (t, x)earctg(x )
0
1 + (x0 )2 +
  
= L(b bt1 ) − ϕ01 (b b0 (b
t1 ) − x t1 ) Lb x0 (b
t1 ) τ 1 . (7.6) 
1 + x0
0 0
+(ψ − x )f (t, x)e arctg(x0 )
p = 0.

Вариация функционала на левом конце b t0 отрезка [b t0 , b
t1 ] вычисляется 0 2
1 + (x ) t=t1
аналогично и равняется
  ψ 0 − x0
x(·), b
δJ(b t0 , b
t1 ) x(·, C0 (b b(·), τ0 , 0 =
t0 + τ0 )) − x Поскольку f (t, x) 6= 0, то получим = −1.
1 − ψ 0 x0
  
= −L( b bt0 ) + ϕ00 (b b0 (b
t0 ) − x t0 ) Lb x0 (b
t0 ) τ0 , (7.7) Ответ. Условие трансверсальности в точке (t1 , x1 ) такое:

где τ0 — вариация точки bt0 , а функция C0 (t0 ) определяется аналогич- ψ 0 (t1 ) − x0 (t1 )
= −1.
но функции C(t1 ). Применяя необходимое условие экстремума первого 1 − ψ 0 (t1 )x0 (t1 )
порядка, выводим условия трансверсальности на левом и правом концах
отрезка. Теорема доказана. Это означает, что экстремали x
b = x(t) пересекают кривую x = ψ(t) под
углом π/4.
ЗАМЕЧАНИЕ 8. Пусть точка tj фиксирована, а граничное условие в этой
точке отсутствует. Это означает, что граничная точка двигается по вертикальной ПРИМЕР 7.3. Найти расстояние между параболой x = t2 и пря-


прямой. Условие трансверсальности в этом случае имеет вид Lx0 (tj ) = 0. мой x = t − 5.
176 Глава 7 3. Задачи Больца с подвижными границами 177

Решение. Чтобы решить задачу, нужно исследовать на экстремум ПРИМЕР 7.4. Исследовать на экстремум функционал задачи о бра-
функционал хистохроне
Zt1 p Zx1 p
1 + (y 0 )2
J(x(·), t0 , t1 ) = 1 + (x0 )2 dt J(y(·)) = √ dx, y(0) = 0,
y
t0 0

на множестве функций с подвижными границами ϕ0 (t) = t2 , ϕ1 (t) = если отсутствует граничное условие y(x1 ) = y1 .
= t − 5. Это задача Лагранжа на множестве функций с подвижными В этой задаче левый конец фиксирован, а правый двигается по
границами. Используем необходимые условия экстремума. вертикальной прямой. Экстремалями функционала являются циклоиды,
1. Уравнение Эйлера уравнения которых, учитывая условие y(0) = 0, имеют вид

p x = C1 (t − sin(t)), y = C1 (t − cos(t)).
(x0 )2
1 + (x0 )2 − p =C
1 + (x0 )2 Для определения неизвестной константы C1 используем условие транс-
b y0 (b
версальности L x1 ) = 0. Оно имеет вид
имеет решения x(t) = C1 t + C2 .
2. Условия трансверсальности y0
p = 0,

p
 y(1 + (y 0 )2
x 0
0 2 0
1 + (x ) + (2t − x ) p = 0,
0 2 откуда y 0 = 0. Итак, искомая циклоида должна пересекать прямую под
1 + (x ) t=t0
  прямым углом. Поэтому точка x = x1 , y = y1 должна быть верши-
p x 0
0 2 0
1 + (x ) + (1 − x ) p
= 0. ной циклоиды. Поскольку вершине циклоиды отвечает значение t = π,
0 2
1 + (x ) t=t1 то x1 = C1 π, C1 = x1 /π.
Ответ. Экстремаль функционала задачи о брахистохроне на мно-
3. Граничные условия x(t0 ) = t20 , x(t1 ) = t1 − 5 дают уравне- жестве функций таких, что левый конец фиксирован, а правый двигается
ния C1 t0 + C2 = t20 , C1 t1 + C2 = t1 − 5. Таким образом, мы отыскали по вертикальной прямой, определяется уравнениями
систему четырех уравнений для определения неизвестных C1 , C2 , bt0 , b
t1 :
x x
q x = π1 (t − sin(t)), y = π1 (1 − cos(t)).
C1
1 + C12 + (2t0 − C1 ) p = 0,
1 + C12 Это уравнение циклоиды. 4
q
C1
1 + C12 + (1 − C1 ) p = 0, 3. Задачи Больца на множестве функций с
1 + C12
подвижными границами
C1 t0 + C2 = t20 , C1 t1 + C2 = t1 − 5.
В пространстве C 1 (∆, Rn ) × R × R исследовать на экстремум функ-
Решив эту систему, получим C1 = −1, C2 = 3/4, b
t0 = 1/2, b
t1 = 23/8. ционал задачи Больца
Ответ. Уравнение экстремали √ b
x = −t + 3/4. Расстояние между
Zt1
параболой и прямой равняется (19 2)/8. 4
B(x(·), t0 , t1 ) = L(t, x(t), x0 (t)) dt + Ψ0 (t0 , x(t0 ), t1 , x(t1 )) → extr (7.8)
t0
178 Глава 7 3. Задачи Больца с подвижными границами 179

при условиях Эта теорема представляет собой частный случай теоремы Эйлера–
Лагранжа (Теорема 11.4).
Ψj (t0 , x(t0 ), t1 , x(t1 )) = 0, j = 1, . . . , m, (7.9)
Следствие 7.1. Пусть элемент (b x(·), yb(·), b
t0 , b
t1 ) пространства
где точки t0 , t1 ∈ ∆ не фиксированы, ∆ — заданный отрезок числовой C 1 (∆, R) × C 1 (∆, R) × R × R дает локальный экстремум функционала
прямой. задачи Лагранжа в трехмерном пространстве
Используя метод множителей Лагранжа, можно доказать следую-
щее утверждение. Zt1
Теорема 7.4 (Необходимые условия экстремума в задаче Боль- J(x(·), y(·)) = L(t, x(t), y(t), x0 (t), y 0 (t)) dt,
ца на множестве функций с подвижными границами). Пусть функ- t0
ция L(t, x, x0 ) и ее частные производные Lx (t, x, x0 ), Lx0 (t, x, x0 ) непре-
рывны, а функции Ψj , j = 0, 1, . . . , m, непрерывно дифференциру- когда точка A(t0 , x0 , y0 ) двигается по кривой x = ϕ0 (t), y = ψ0 (t),
а точка B(t1 , x1 , y1 ) двигается по кривой x = ϕ1 (t), y = ψ1 (t). Тогда
емы. Если элемент (b t0 , b
x(·), b t1 ) пространства C 1 (∆, Rn ) × R × R да-
b(·), yb(·) удовлетворяют уравнениям Эйлера
функции x
ет локальный экстремум функционала задачи Больца (7.8), (7.9),
то существуют одновременно не равные нулю множители Лагран-
жа λ0 , λ1 , . . . , λm ∈ R такие, что для функции Лагранжа Lx (t) − d Lx0 = 0, Ly (t) − d Ly0 = 0
dt dt
Zt1 и условиям трансверсальности
(x(·), t0 , t1 , λ) = λ0 L(t, x(t), x0 (t)) dt + l(t0 , x(t0 ), t1 , x(t1 )),


 
b + (ϕ0 (t) − x
L(t) b0 (t))L b y0 (t)
b x0 (t) + (ψ 0 (t) − yb0 (t))L = 0, k = 0, 1.
k k


t0 t=t k

где
m
X Чтобы убедиться в справедливости этого утверждения, запишем
l= λj Ψj (t0 , x(t0 ), t1 , x(t1 )), необходимые условия теоремы 7.4 при λ0 = 1. В этом случае
j=0
выполняются условия: l = λ1 (x(t0 ) − ϕ0 (t0 )) + λ2 (y(t0 ) − ψ0 (t0 ))
+ µ1 (x(t1 ) − ϕ1 (t1 )) + µ2 (y(t1 ) − ψ1 (t1 )),
1) стационарности по x — уравнение Эйлера
b
lt0 = −λ1 ϕ00 (b
t0 ) − λ2 ψ00 (b
t0 ),
b x (t) = d λ0 L
λ0 L b x0 (t); b
dt lt1 = −µ1 ϕ1 (b
0
t1 ) − µ2 ψ1 (b
0
t1 ),
lx(t0 ) = λ1 , b
b ly(t0 ) = λ2 , b lx(t1 ) = µ1 , b
ly(t1 ) = µ2 .
2) трансверсальности по x
Условия трансверсальности на левом конце
b x0 (b
λ0 L t0 ) = lx(t0 ) , b x0 (b
λ0 L t1 ) = −lx(t1 ) ;
t0 ) = b
Lx0 (b lx(t0 ) , b b
−L( t0 ) + b
lt0 + b b0 (b
lx(t0 ) x t0 ) = 0
3) стационарности по t0 , t1 (только на множестве функций с по-
движными концами) будут иметь вид
ct = 0 ⇐⇒ −λ0 L(
b bt0 ) = b
lt0 + b b0 (b
lx(t0 ) x t0 ) = 0, b x0 (b b y0 (b


0 L t0 ) = λ 1 , L t) = λ 2 ,
ct = 0 ⇐⇒ λ0 L(
b bt1 ) = b
lt1 + b b0 (b
lx(t1 ) x t1 ) = 0. b b
L( t0 ) + λ1 ϕ00 (b
t0 ) + λ2 ψ00 (b b0 (b
t0 ) − λ 1 x t0 ) − λ2 yb0 (b
t0 ) = 0.


1
180 Глава 7 3. Задачи Больца с подвижными границами 181

Исключая неизвестные λ1 , λ2 , получаем Следствие 7.2. Пусть элемент (b y (·), zb(·), x


b0 , x
b1 ) пространства
  C 1 (∆, R) × C 1 (∆, R) × R × R дает локальный экстремум функционала
b b
L( t0 ) + ϕ00 (b b0 (b
t0 ) − x t0 ) Lb x0 (b
t0 ) + ψ00 (b
t0 ) − yb0 (b
t0 ) Lb y0 (b
t) = 0. задачи Лагранжа

Аналогичным путем выводим условие трансверсальности на правом кон- Zx1


це. J(y(·), z(·)) = L(x, y(x), z(x), y 0 (x), z 0 (x)) dx
ПРИМЕР 7.5. Определить кратчайшее расстояние от точки A(t 0 , x0 , y0 ) x0

до прямой x = at + b, y = pt + q.
при условии, что точка A(x0 , y0 , z0 ) двигается по поверхности z =
Решение. Задача сводится к нахождению минимума функционала
= ϕ0 (x, y), а точка B(x1 , y1 , z1 ) двигается по поверхности z =
Zt1 p = ϕ1 (x, y). Тогда функции yb(·), zb(·) удовлетворяют уравнениям Эй-
лера и условиям трансверсальности
J(x(·), y(·)) = 1 + (x0 )2 + (y 0 )2 dt
 
t0 b y0 + L
L b0ky x=x = 0,
b z0 ϕ


k
 
при условии, что правый конец экстремали лежит на прямой x = at + b, b b 0
0 b
L − Ly yb + Lz + (ϕ
0
0 0
bkx − zb ) x=x = 0, k = 0, 1,


y = pt+q. Итак, ϕ1 (t) = at+b, ψ1 (t) = pt+q. Решения уравнений Эйлера k

имеют вид x = C1 t + C2 , y = C3 t + C4 . Из условий трансверсальности b0kx = ϕ0kx (x, yb(x)), ϕ


где ϕ b0ky = ϕ0ky (x, yb(x)).
  Действительно, на этот раз
p (a − x0 )x0 (p − y 0 )y 0
1 + (x0 )2 + (y 0 )2 + p +p =0

1 + (x0 )2 + (y 0 )2 1 + (x0 )2 + (y 0 )2 t=t1


l = λ(z(x0 ) − ϕ0 (x0 , y(x0 ))) + µ(z(x1 ) − ϕ1 (x1 , y(x1 ))),
находим уравнение 1 + aC1 + pC3 = 0. Это условие перпендикулярно- lx0 = −λϕ00x , lx1 = −µϕ01x
сти искомой прямой к заданной. Чтобы определить неизвестные C1 , ly(x0 ) = −λϕ00y , ly(x1 ) = −µϕ01y , lz(x0 ) = λ, lz(x1 ) = µ.
C2 , C3 , C4 , bt1 , используем тот факт, что прямая проходит через точ-
ку A(t0 , x0 , y0 ) и пересекает заданную прямую. Получим 5 уравнений Условия трансверсальности на левом конце имеют вид

x0 = C 1 t 0 + C 2 , y 0 = C 3 t 0 + C 4 , L x0 ) = b
b y0 (b b00y ,
ly(x0 ) = −λϕ L x) = b
b z0 (b lz(x0 ) = λ,
1 + aC1 + pC3 = 0, b x0 ) − λϕ
L(b b0 yb0 (b
b00x − λ z 0 (x0 ) = 0.
x0 ) + λb
0y
C1 b
t1 + C2 = ab t1 + b, C3 b t1 + C4 = pb t1 + q,
Исключая параметр λ, получаем условия трансверсальности в точке x
b0 :
из которых вычисляем неизвестные константы.
Ответ. Кратчайшее расстояние равняется длине перпендикуляра, b y0 (b
L x0 ) + Lb z0 (b
x0 )ϕ00y (b
x0 , yb(b
x)) = 0,
опущенного из точки A(t0 , x0 , y0 ) на прямую: 
L(b b y0 (b
b x0 ) − L y 0 (b
x0 )b b z0 (b
x0 ) + L x0 ) ϕ00x (b x0 )) − zb0 (b
x0 , yb(b x0 ) = 0.
x(·), yb(·)) =
h =J(b Условия трансверсальности в точке x
b1 выводятся аналогично.
  2  1
t0 + a(x0 − b) + p(y0 − q) 2 ПРИМЕР 7.6. Определить кратчайшее расстояние от точки A(1, 1, 1)
= t20 + (x0 − b)2 + (y0 − q)2 − 2 2
. до поверхности сферы x2 + y 2 + z 2 = 1.
1+a +p
182 Глава 7 3. Задачи Больца с подвижными границами 183

Задача сводится к исследованию на минимум функционала ПРИМЕР 7.7. Определить условия трансверсальности подынтеграль-
ных функций вида
Zx1 p p
J(y(·), z(·)) = 1 + (y 0 )2 + (z 0 )2 dx L = f (x, y, z) 1 + (y 0 )2 + (z 0 )2
1 и поверхности z = ϕ(x, y).
Решение. Условия трансверсальности можно записать так:
при условии, что y(1) = 1, z(1) = 1, а координаты точки B(x1 , y1 , z1 )  
удовлетворяют соотношению x2 + y 2 + z 2 = 1. 1 + ϕ0x z 0 x=x1 = 0, y 0 + ϕ0y z 0 x=x1 = 0


Решение. Используем необходимые условия экстремума. или
1. Уравнение Эйлера удовлетворяют функциям y = C1 x + C2 , 1 y 0
= 0 = z 0
. (7.10)
z = C3 x + C4 . Точка A(1, 1, 1) лежит на экстремали. Поэтому неизвест- ϕ0x x=x1 ϕy x=x1 − 1 x=x1


ные C1 , C2 , C3 , C4 удовлетворяют уравнениям C1 + C2 = 1, C3 + C4 = 1.
2. Условия трансверсальности функционала имеют вид Это условия параллельности вектора ~τ = (1, y 0 , z 0 ), касательного к экс-
тремали в точке B(bx1 , yb1 , zb1 ), и вектора ~n = (ϕ0x , ϕ0y , −1) нормали к по-
  верхности z = ϕ(x, y) в точке B(b x1 , yb1 , zb1 ).
y0 z0 y
p −p p =0 Ответ. Условия трансверсальности функционалов с подынтеграль-

1 + (y 0 )2 + (z 0 )2 1 + (y 0 )2 + (z 0 )2 1 − x2 − y 2 x=x1 ной функцией L указанного вида сводятся к условиям ортогональности


экстремали и поверхности z = ϕ(x, y). 4
 ПРИМЕР 7.8. Определить наименьшее расстояние между поверхно-
p (y 0 )2
1 + (y 0 )2 + (z 0 )2 − p стями z = ϕ(x, y), z = ψ(x, y).
1 + (y 0 )2 + (z 0 )2 Решение. Задачу можно формализовать так:
  
x z 0 Zx1 p
0
− z +p p = 0.
2 2 0 2 0 2 J(y(·), z(·)) = 1 + (y 0 )2 + (z 0 )2 dx → min,
1−x −y 1 + (y ) + (z ) x=x1

x0
Отсюда выводим уравнения zb1 − C3 x b1 = 0, C1 zb1 − C3 yb1 = 0. Поскольку z0 = ϕ(x0 , y0 ), z1 = ψ(x1 , y1 ).
точка B(bx1 , yb1 , zb1 ) лежит на экстремали, то zb1 = C3 x b1 + C4 , yb1 = C1 x b1 +
+ C2 . Учитывая составленные уравнения, вычислим неизвестные кон- Экстремалями задачи будут прямые линии. Функция под интегралом
станты: C1 = 1, C2 = 0, C3 = 1, C4 = 0. имеет вид, указанный в примере 7.7. Поэтому условия трансверсаль-
Итак, уравнение экстремали такое: y = x, z = x. Точка x1 , yb1 , zb1 ) ности как в точке (x0 , y0 , z0 ), так и в точке (x1 , y1 , z1 ) — это условия
√ B(b ортогональности (7.10).
лежит на сфере, поэтому x b21 + x
b21 + x
b21 = 1, x1 = ±1/ 3. Найденные
Ответ. Экстремум может достигаться лишь на прямых, ортого-
соотношения удовлетворяют двум точкам
нальных как к поверхности z = ϕ(x, y) в точке (x0 , y0 , z0 ), так и к по-
! ! верхности z = ψ(x, y) в точке (x1 , y1 , z1 ). 4
1
B1 √ , √ , √ 1 1 1
, B2 − √ , − √ , − √1 1 . ПРИМЕР 7.9. Отыскать экстремали функционала задачи
3 3 3 3 3 3
Z1
Ответ. Экстремаль y = x, z = x, соединяющая
√ точку A с точкой J(x(·)) = x2 (x0 )2 dt → extr, (7.11)
B1 , дает минимум функционала: Smin = 3 − 1, а экстремаль y = x, z = 0
= x, соединяющая точку A с точкой B2 , дает максимум функционала. 4
x(0) = 0, x(1) = 1.
184 Глава 7 3. Задачи Больца с подвижными границами 185

Решение. Запишем уравнения Эйлера что на геодезической окружности лежит точка (C 3 , C), а уравнение гео-
дезического радиуса (экстремали), который проходит через эту точку,
2x(x0 )2 − d (2x2 x0 ) = 0, таково: x2 = t/C. Откуда xx0 = 1 . Поэтому
dt 2C

xx00 + (x0 )2 = 0 = d (xx0 ), ZC


3
ZC
3
dt
R= (xx0 )2 dt = (4C 2 )−1 dt = C/4.
0 2
откуда xx = C1 , x = 2C1 t + C2 . Использовав граничные условия, по- 0 0
лучим x2 = t.
Ответ. Экстремаль функционала (7.11), соединяющая точки (0, 0), Итак, C = 4R и геодезическая окружность радиуса R с центром в начале
(1, 1), это парабола x2 = t. 4 координат описывается уравнением x4 = 4Rt. 4
ЗАМЕЧАНИЕ 9. Величину интеграла ЗАМЕЧАНИЕ 10. Определенные выше понятия разрешают говорить о неев-
клидовой
√ геометрии с дифференциалом дуги ds = L(t, x, x0 ) dt. Если L =
t1
= 1 + x2 , то геодезические прямые превращаются в обычные.


J(x(·)) = L(t, x(t), x0 (t)) dt,


ПРИМЕР 7.11. Определить экстремаль функционала
t0

Zx1 p
взятого вдоль линии x = x(t) от точки A(t0 , x0 ) до точки B(t1 , x1 ), называют 1 + (y 0 )2
J-длиной линии x = x(t). Если x = x(t) — экстремаль, то J(x(·)) называют J(y(·)) = dx,



y
геодезическим расстоянием между точками A, B или J-расстоянием, а са- 0
му экстремаль называют J-прямой. Если расстояние определяется функциона-
лом (7.11), то геодезическое расстояние J(A, B) между точками A(0, 0), B(1, 1) соединяющую точку (0, 0) и окружность (x−9)2 +y 2 = 9 трансверсально.
равняется 1/4. Решение. Уравнение Эйлера указанного функционала имеет вид
Геодезическим расстоянием от точки B до линии , которая задается урав-

нением x = ϕ(t), называют геодезическое расстояние от точки B до точки A ∈ p


1 + (y 0 )2 y0
такое, что функционал J(x(·)) вычисляется вдоль экстремали, которая соединя- − y0 p = C1 .
ет точки A и B, пересекая линию в точке A трансверсально. Геодезической y
1 + (y 0 )2

окружностью называют линию, все точки которой находятся на одинаковом


геодезическом расстоянии от заданной точки. Аналогично определяются геоде- p
зический эллипс и геодезическая гипербола.
После упрощений получим y 1 + y 2 = C1−1 = C. Такое уравнение мож-
но проинтегрировать подстановкой y 0 = tg(u). Тогда y = C cos(u), dx =
ПРИМЕР 7.10. Определить геодезическую окружность с центром в = dy/y 0 = −C cos(u) du, x = −C sin(u) + C2 . Параметрическое урав-
точке (0, 0) радиуса R, если геодезическое расстояние определяют при нение y = C cos(u), x = −C sin(u) + C2 — это уравнение окружности
помощи функционала (7.11). (x − C2 )2 + y 2 = C 2 с центром на оси OX. Искомая экстремаль про-
Решение. Экстремали функционала (7.11) удовлетворяют соотно- ходит через точку (0, 0), поэтому C2 = C > 0. Неизвестную константу
шению x2 = C1 t, 2xx0 = C1 , x0 = x . Из условия трансверсально- C определим из условия ортогональности касательных к окружностям
2t
(x − 9)2 + y 2 = 9, (x − C2 )2 + y 2 = C 2 в точке пересечения.
сти x2 x0 (2ϕ0 − x0 ) = 0 вытекает, что угловой коэффициент касательной
Ответ. Искомая экстремаль — это дуга окружности (x − 4) 2 + y 2 =
к геодезической окружности удовлетворяет уравнению ϕ 0 = x0 /2. Учи-
= 16. 4
тывая, что x0 = x/2t, составим дифференциальное уравнение геодезиче-
ской окружности x0 = x/4t. Итак, уравнение геодезической окружности
такое: x4 = Ct. Чтобы определить величину C, используем тот факт,
186 Глава 7 4. Задачи 187

ней полуплоскости можно провести только одну полуокружность с центром на


оси OX). Параллельными считаются две прямых, которые имеют общую беско-
нечно удаленную точку (то есть две полуокружности, которые касаются в точ-
ке B, лежащей на оси OX). Тогда через заданную точку a, не лежащую на
прямой y = g(x), можно провести две прямые y = g1 (x), y = g2 (x), парал-
лельные прямой y = g(x). Прямые, которые проходят через точку A и лежат
в вертикальных углах I и III, пересекают прямую y = g(x). Прямые, лежащие
в вертикальных углах II и IV, не пересекают прямую y = g(x).
Это модель Пуанкаре геометрии Лобачевского на плоскости.

4. Задачи

Исследовать на экстремум функционалы


R1 0 2
7.1 (x ) dt → extr, x(0) = 1.
0
Рис. 8. Модель Пуанкаре R1
7.2 (x0 )2 dt + αx2 (1) → extr, x(0) = 0.
0
ЗАМЕЧАНИЕ 11. В соответствии с принципом Ферма траектория движения RT
луча света со скоростью v(x, y) в неоднородной двумерной среде есть экстремаль 7.3 (x0 )2 dt → extr, x(0) = 0, T + x(T ) + 1 = 0.
функционала 0
x1

1 + (y 0 )2 RT


J(y(·)) = dx. 7.4 (x0 )2 dt → extr, x(0) = 0, (T − 1)x2 (T ) + 2 = 0.


v(x, y) 0
x0

Если скорость света пропорциональна лишь координате y, то экстремали функ- RT


7.5 (x0 )3 dt → extr, x(0) = 0, T + x(T ) = 1.
ционала J — это дуги окружностей, центры которых лежат на оси OX. Пусть 0
задана кривая y = g(x). Оптической длиной кривой y = g(x) называют вре-
R1 
мя T (g), за которое луч проходит эту кривую со скоростью v(x, y). Рассмотрим 7.6 (x0 )2 + x dt → extr, x(1) = 0.
верхнюю полуплоскость как среду, в каждой точке которой скорость света рав- 0
няется ординате этой точки v = y. Лучами света в этой среде будут полуокруж- R0
T 
ности с центрами на оси OX. Можно показать, что дуга AD полуокружно- 7.7 x − (x0 )2 dt → extr, x(0) = 0.
сти y = g(x), один из концов которой лежит на оси OX, имеет бесконечную оп- 0
тическую длину, поэтому точки оси называют бесконечно отдаленными. Будем RT 
считать, что полуокружности с центрами на оси — прямые. Оптические длины 7.8 (x0 )2 + x dt → extr, x(0) = 1.
дуг таких полуокружностей — их длины, углы между такими прямыми — углы 0
между касательными к полуокружностям в точке пересечения. Прямыми будем RT 
называть и полупрямые в верхней полуплоскости, перпендикулярные оси OX. 7.9 (x0 )2 + x dt → extr, x(T ) = T .
Такие полупрямые являются вырожденными полуокружностями. 0
При таком определении точек и прямых выполняются все аксиомы евкли- RT 
довой геометрии, кроме аксиомы о параллельных прямых. Например, через две 7.10 (x0 )2 + x dt → extr, x(0) = 0, x(T ) = ξ.
0
точки можно провести одну и только одну прямую (через две точки в верх-
188 Глава 7 4. Задачи 189

RT  R1

1 + (x0 )2
7.11 (x0 )2 + x dt → extr, x(0) = 0, x(T ) = T . 7.25 x dt → extr, x(0) = 1.
0 0
RT  RT

1 + (x0 )2
7.12 (x0 )2 + x + 2 dt → extr, x(0) = 0. 7.26 dt → extr, x(0) = 1, T − x(T ) = 1.
0 x
0
π
R0
T p
R4  7.27 x 1 + (x0 )2 dt → extr, x(T0 ) = ξ.
7.13 (x0 )2 − x 2
dt → extr, x(0) = 1. 0
0
R1 1 (x0 )2 + (x0 )2  − x x  dt → extr,
R0
T
0 2 2
 7.28 1 2 1 2 x1 (1) = x2 (1) = 1.
7.14 (x ) − x dt → extr, x(0) = 0. 0
2
0
π
7.29
R1 1 (x0 )2 + (x0 )2  − x x  dt → extr, x1 (0) = x2 (0) = 1.
1 2 1 2
R4  0
2
7.15 (x0 )2 − x2 + 4x cos(t) dt → extr, x(0) = 0.
0 7.30 Отыскать кратчайшее расстояние от точки A(1, 0) до эллипса
π 4x2 + 9y 2 = 36.
R2  7.31 Отыскать кратчайшее расстояние от точки A(−1, 5) до парабо-
7.16 (x0 )2 − x2 + 4x sin(t) dt → extr, x(π/2) = 0.
π
лы y 2 = x.
4 7.32 Отыскать кратчайшее расстояние между окружностью x 2 +y 2 =
R1  = 1 и прямой x + y = 4.
7.17 (x0 )2 + x2 dt → extr, x(0) = 1.
0 7.33 Отыскать кратчайшее расстояние от точки A(0, 0, 3) до поверх-
R1  ности z = x2 + y 2 .
7.18 (x0 )2 + x2 + 4x sh(t) dt → extr, x(0) = 0. 7.34 Отыскать кратчайшее расстояние между поверхностями
0
R1  2
7.19 (x0 )2 + x2 + 4x ch(t) dt → extr, x(1) = 0. x2 + y + z 2 = 1, x2 + y 2 + z 2 = 4.
0 25 16 9
R1 
7.20 (x0 )2 + x2 dt − x2 (1) → extr, x(0) = 1.
0 7.35 Отыскать геодезическое расстояние от точки A(0, 1) до точки
RT  B(1, 1), если расстояние определяется с помощью функционала
7.21 (x0 )2 + x 2
dt → extr, x(0) = 0, x(T ) = 1. Z
0 
J(y(·)) = 12xy + (y 0 )2 dx.
Отыскать допустимые экстремали
RT 0 2 
7.22 (x ) + x2 dt → extr, x(T ) + T − 1 = 0.
0 7.36 Отыскать геодезическую окружность радиуса R = 1 с центром
RT  в точке (0, 0), если геодезическое расстояние определяется функциона-
7.23 (x0 )2 + x 2
dt → extr, x(0) = 0, T + x(T ) + 1 = 0. лом Z
0
J(y(·)) = (y 0 )3 dx.
RT p
7.24 1 + (x0 )2 dt → extr, x(0) = 0, T 2 x(T ) = 1.
0
2. Условия Вейерштрасса–Эрдмана 191

Определим функцию Φ(t, z) по формуле

Zt
ГЛАВА 8 b(t), z) −
Φ(t, z) = L (t, x b0 (s)) ds − C.
b(s), x
Lx (s, x
x0

Ломаные экстремали t0

Уравнение Φ(t, z) = 0 имеет решение z = x b0 (t). Поскольку x b(·) — неосо-


бенная экстремаль, то

1. Неособенные экстремали Φ0z (t, z) z=x0 (t) = Lx0 x0 (t, x b0 (t)) 6= 0, t ∈ [t0 , t1 ].
b(t), x


При выводе уравнения Эйлера методом Лагранжа мы интегрировали В соответствии с теоремой о неявной функции решение z = x b0 (t) урав-
частями второе слагаемое в выражении нения Φ(t, z) = 0 имеет столько производных по t, сколько производных
имеет функция Φ(t, z) по переменным t, z. Поэтому экстремаль x b0 (t)
Zt1 0
b x (t)h(t) + L

b x0 (t), h0 (t) dt. непрерывно дифференцируема, если функция L(t, x, x ) непрерывно диф-
δJ(b
x(·), h(·)) = L ференцируема два раза по совокупности всех переменных.
t0
Определение 8.2. Экстремаль x b(·) ∈ C 1 ([t0 , t1 ], Rn ) функциона-
Эта операция обоснована, если функция L b x0 (t) = Lx0 (t, x b0 (t)) непре-
b(t), x ла J(x(·)), зависящего от вектор-функций, называется неособенной, ес-
d
рывно дифференцируема. Производная dx Lx0 (t, x b(t), x 0
b (t)) содержит вто- 
b x0 x0 (t) 6= 0 для всех t ∈ [t0 , t1 ].
ли det L
рую производную x b00 (t) функции x
b(t). Тем не менее в простейшей зада- k j

че вариационного исчисления существования x b00 (t) не предполагалось. b(·) ∈ C 1 ([t0 , t1 ], Rn ) при-


Теорема 8.2. Неособенная экстремаль x
Итак, необходимое условие экстремума (уравнение Эйлера) доказано 2 n
надлежит классу C ([t0 , t1 ], R ).
лишь для функций из класса C 2 [t0 , t1 ]. При выводе уравнения Эйле-
ра методом Дюбуа-Реймона доказано существование и непрерывность
функции dtd b 0
Lx (t). Однако это не означает, что существует x b00 (t) и функ-
2. Условия Вейерштрасса–Эрдмана
цию Lx0 (t, x 0 b
b (t)) = Lx0 (t) можно дифференцировать по правилу
b(t), x
дифференцирования сложных функций. Основная задача вариационного исчисления исследовалась в простран-
стве C 1 [t0 , t1 ] один раз непрерывно дифференцируемых функций. Однако
Определение 8.1. Экстремаль x b(·) называется неособенной, ес- в этом пространстве имеет решение не каждая задача. Даже при усло-
b x0 x0 (t) = Lx0 x0 (t, x
ли L b0 (t)) 6= 0 для всех t ∈ [t0 , t1 ].
b(t), x вии, что функция L(t, x, x0 ) под знаком интеграла вместе с производны-
Теорема 8.1 (Теорема Гильберта). Неособенная экстремаль при- ми Lx (t, x, x0 ), Lx0 (t, x, x0 ) непрерывны по совокупности переменных, не
надлежит классу C 2 [t0 , t1 ]. всегда существует решение задачи в пространстве C 1 [t0 , t1 ].
ДОКАЗАТЕЛЬСТВО. ПРИМЕР 8.1 (ПРИМЕР ГИЛЬБЕРТА). Исс