Вы находитесь на странице: 1из 92

Уфимский государственный авиационный технический университет

ЭЛЕМЕНТЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ


И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Учебное пособие

Уфа 2003
I. Элементы вариационного исчисления

1.1. Введение и вспомогательные утверждения

Вспомним понятие экстремума числовой функции числового


аргумента f : R ® R :
Точка a Î R- – точка локального максимума (минимума), а
значение f ( a ) - локальный максимум (минимум), если для всех
точек x ,
достаточно близких к a , выполняется
неравенство f ( x ) £ f ( a ) ( f ( x) ³ f ( a ) ) ,
т.е. существует окрестность
Vd ( a ) = ] a - d, a + d[ , такая, что
( " x Î Vd ( a) ) éëf ( x) £ f ( a ) ( f ( x ) ³ f ( a ) ) ùû.
При этом, если существует производная f ¢( a ) , то f ¢( a ) = 0
(необходимое условие локального экстремума). Если f ¢( a ) = 0 , то
наличие или отсутствие локального экстремума проверяется с
помощью достаточного признака локального экстремума.
В вариационном исчислении решают задачи на экстремум
числовых функций функционального аргумента: у таких функций
значениями функций тоже являются числа, но значениями аргумента
является не числа, а функции. В отличие от функций векторного
аргумента такие функции называют функционалами.
Пример. Среди всех гладких кривых, соединяющих точки ( 0,0)
и ( 1,1) , найти ту, длина которой
наименьшая (решение очевидное: y = x ).
Формализуем задачу. Обозначим M -
множество всевозможных функций
y = y ( x ) , непрерывно дифференцируемых
на [ 0,1] , т.е. гладких функций.
Нужно среди функций y Î M , принимающих заданные значения
y ( 0) = 0, y ( 1) = 1, найти ту, для которой длина графика

4
1

J [ y] = ò 1 + y ¢2 dx (1)
0
наименьшая.
Формула (1) каждой функции y Î M ставит в соответствие
определенное число J [ y ] - длину кривой, так что имеем отображение
J :M ® R . Это и есть пример функционала. Аргументом
функционала является гладкая кривая y Î M , а значением функции –
число J [ y ] Î R . При значении аргумента y0 ( x) = x функционал J [ y ]
имеет минимум, равный J [ y0 ] = 2.
Ввиду удобства геометрического языка аргумент y = y ( x)
функционала J [ y ] называют «точкой», так что функционал J [ y ] в
примере имеет минимум в точке y0 ( x) º x .
Для характеристики близости точек (т.е. близости функций)
вводят понятия расстояния между функциями, окрестности точки
(т.е. окрестности функции). Это позволяет рассматривать вопрос об
экстремуме функционала.
Рассмотрим некоторые утверждения, используемые в
дальнейшем.
1.1.1. Пример.

Построим бесконечно дифференцируемую


функцию, положительную на заданном
интервале ]a , b [ и равную нулю вне этого
интервала.

ìï - 1 x
ïe при x > 0,
□ Покажем сначала, что функция g ( x ) = í
ïï 0 при x £ 0
î
бесконечно дифференцируема (т.е. имеет производные любого
порядка) на ]- ¥ , + ¥ [ . В точках x ¹ 0 это очевидно: если x < 0 , то
g ( n) ( x ) = 0 , если x > 0 , то g ( n) ( x) можно найти по правилам
дифференцирования. При x > 0 имеем
æ1 ÷
2
ö - 1x æ æ1 ö3 æ1 ö4 ö÷
¢¢( x ) = çç- 2çç ÷
- 1
g ¢( x) = çç ÷ e , g ÷ + ç ÷
÷ ÷
÷e x
,
çè x ÷
ø ç ç ÷ ç
ç ÷
çè è x ø è x ø ø
÷

5
æ æ1 ö4 æ 1 ö
5
æ 1 ö

÷
g ¢¢¢( x ) = ççç6çç ÷
- 1
÷ - 6 ç ÷
÷ + ç ÷
÷ ÷
÷ e x
ç
çè è x ø ÷ ç
ç ÷ ç
ç
è x ø è x ø ø÷ ÷
и т.д. Заметим, что производная любого порядка имеет вид
æ1 ö - 1 x
g ( n) ( x ) = pn ççç ÷ ÷e ,
è x ø÷
æ1 ö 1
где pn ççç ÷ ÷ - некоторый многочлен от :
è x ø÷ x
2 3 4
æ1 ö÷ æ1 ö÷ æ1 ö÷ æ1 ö÷ æ1 ö÷
p1 ççç ÷ = ç ÷ , p2 ççç ÷ = - 2ççç ÷ + ç ÷ и т.д.
è x ø÷ èçç x ø÷ è x ø÷ è x ø÷ èçç x ø÷
В точке x = 0 производные придется вычислять по определению
производной:
( n) g ( n- 1) ( x) - g ( n- 1) ( 0)
g ( 0) = lim
x® 0 x- 0
(если пределы при x ® 0 слева и справа существуют и совпадают, то
( n)
их общее значение и будет g ( 0) ).
g ( x ) - g ( 0) 0- 0
Ищем g ¢( 0) : lim = lim = 0;
x® 0- x- 0 x® 0- x
1
e x - 0 1 = t ® + ¥ = lim tt = 0, так как
-
g ( x ) - g ( 0)
lim = lim = x t® + ¥ e
x® 0+ x- 0 x® 0+ x
экспонента растет быстрее t . Нашли g ¢( 0) = 0 .
g ¢( x ) - g ¢( 0) при x < 0 0- 0
Ищем g ( 0) : xlim
¢¢ = = lim = 0;
® 0- x- 0 g ¢( x) = 0 x® 0- x
æ1 ö÷ - 1x
при x > 0 P1 çç ÷ e - 0
g ¢( x ) - g ¢( 0) è x ø÷
lim = æ1 ö÷ - 1x = lim =
x® 0+ x- 0 g ¢( x) = P1 ççç ÷ e x® 0+ x
è x ø÷
1 P ( t) t
= = t ® + ¥ = lim 1 t = 0,
x x® + ¥ e
так как экспонента растет быстрее любого многочлена. Нашли
g ¢¢( 0) = 0 .

6
( n)
Так можно найти g ( 0) при любом n : если найдено, что
g ( n- 1) ( 0) = 0 , то
g ( n- 1) ( x ) - g ( n- 1) ( 0) 0- 0
lim = lim = 0,
x® 0- x- 0 x® 0- x
ö - 1x
æ1 ÷
Pn- 1 çç ÷ e - 0
g ( n- 1) ( x) - g ( n- 1) ( 0) èx÷ø 1
lim = lim = = t® +¥ =
x® 0+ x- 0 x® 0+ x x
Pn- 1 ( t ) t
= lim = 0.
x® + ¥ et
( n)
Нашли g ( 0) = 0 .
Итак, g ( x ) бесконечно дифференцируема во всех точках
интервала ]- ¥ , + ¥ [ .

Функции g1 ( x ) = g ( - x ) , g ( x - a ) , g1 ( x - b ) = g ( - ( x - b ) ) =
= g ( b - x) тоже бесконечно дифференцируемы во всех точках
x Î ]- ¥ , + ¥ [ как сложные функции, составленные из бесконечно
дифференцируемых звеньев (например, g ( b - x ) состоит из
бесконечно дифференцируемых функций y = g ( u ) (как было
показано) и u = b - x ). Поэтому произведение бесконечно
дифференцируемых функций
h ( x ) = g ( x - a ) ×g ( b - x )
бесконечно дифференцируема на ]- ¥ , + ¥ [ . Это и есть искомая
функция. Она положительна на интервале ]a , b [ , так как
1 1
- -
g( x - a ) = e > 0, g ( b - x ) = e
x- a b- x
> 0,
и равна нулю при x £ a , x ³ b .

7
1.1.2. Лемма Лагранжа
Если функция f : R ® R непрерывна на отрезке [ a, b ] и
b

ò f ( x) h( x) dx = 0 (2)
a
при любой функции h : R ® R , бесконечно дифференцируемой на
отрезке [ a, b ] и обращающейся на его концах в нуль: h ( a ) = h ( b) = 0,
то f ( x ) º 0 на отрезке [ a, b ] .
□ Допустим, что имеется точка c Î [ a, b ] , в которой f ( c ) ¹ 0 ,
например f ( c ) < 0 . Тогда по свойству сохранения знака непрерывной
функцией, в некоторой окрестности точки x = c будет f ( x ) < 0 :
найдется отрезок [ a , b ] Ì [ a, b ] такой, что ( " x Î [ a , b ]) éëf ( x ) < 0ùû( a или
b могут совпадать с одним из концов отрезка [ a, b ] ).
По условию леммы, для функции h ( x ) , построенной в примере
1.1 для этого отрезка, равенство (2) тоже выполняется, но, поскольку
b

h ( x ) = 0 вне ]a , b [ , то фактически ò f ( x) h( x) dx = 0 .
a
C другой стороны
( " x Î ]a , b [ ) éëf ( x) h ( x) < 0ùû.
Возьмем éëa ¢, b ¢ùûÌ ]a , b [ . На этом
отрезке функция F ( x ) = f ( x ) h ( x )
непрерывна и отрицательна.
По теореме Вейерштрасса она имеет в некоторой точке
x Î éëa ¢, b ¢ù
û максимальное значение F ( x ) , которое, конечно, тоже
отрицательно: ( " x Î éëa ¢, b ¢ùû) éëF ( x) £ F ( x ) < 0ùû поэтому
b¢ b¢

ò F ( x) dx £ ò F ( x ) dx = F ( x ) ( b ¢- a ¢) < 0. Значение этого интеграла


a¢ a¢

8
b¢ a¢ b

ò уменьшится, если добавим ò F ( x) dx £ 0 и ò F ( x) dx £ 0 , так что



a¢ a
b a¢ b¢ b

тем более ò F ( x) dx = ò + ò + ò < 0.


a a a¢ b¢
b

Таким образом, получим ò f ( x) h( x) dx < 0 , что противоречит


a
b

равенству ò f ( x) h( x) dx = 0 . Следовательно, допущение неверно. ■


a
Следующую теорему сформулируем без доказательства.

1.1.3. Теорема Лейбница (о дифференцировании под знаком


интеграла)
Если функция f ( x, y ) ( f : R ® R) и её частная производная
22 2

f y¢( x, y ) непрерывна в прямоугольнике { ( x, y ) : x Î [ a, b] , y Î [ c, d ]} , то


éb ù
êæ ö÷¢ b
ú
ê ç
( " y Î [ c, d ]) êççò f ( x, y ) dx÷÷ = ò f y ( x, y ) dxúú.
÷ ¢
ç
êëè a øy a ú
û

1.2. Основные понятия

Как известно из линейной алгебры, линейным пространством


называется множество L (с элементами произвольной природы),
если в этом множестве введены две линейные операции: операция
сложения элементов x, y Î L , сопоставляющая им элемент этого же
множества L , называемый суммой и обозначаемый x + y ( x + y Î L) ,
и операция умножения элемента x Î L на число l Î R ,
сопоставляющая им элемент этого же множества L , называемый
произведением элемента x на число l и обозначаемый l x ( l x Î L) ,
причем эти линейные операции удовлетворяют 8-ми аксиомам:
Для любых элементов x, y, z Î L и любых чисел l , mÎ R :
1) x + y = y + x (переместительность сложения),

9
2) ( x + y ) + z = x + ( y + z ) (сочетальность сложения),
3) существует элемент 0 Î L такой, что ( " x Î L) [ x + 0 = x ]
(существование нулевого элемента),
4) для каждого x Î L существует элемент, обозначаемый - x
( - x Î L) такой, что x + ( - x) = 0 (существование противоположного
элемента),
5) 1×x = x (поглощение единицы),
6) l ( mx ) = ( l m) x (сочетательность умножения на число),
7) ( l + m) x = l x + mx (распределительность умножения на
число относительно сложения чисел),
8) l ( x + y ) = l x + l y (распределительность умножения на
число относительно сложения элементов).
Примером линейного пространства является n - мерное
арифметическое пространство R n .

1.2.1. Определение. Линейное пространство L называется


нормированным пространством, если каждому элементу x Î L
поставлено в соответствие число x - норма этого элемента –
так, что для любых x, y Î L и любого числа l Î R
1) x > 0 Û x ¹ 0, 0 = 0 (неотрицательность),
2) l x = l x (однородность),
3) x + y £ x + y (неравенство треугольника).

Примером нормированного пространства является евклидово


пространство R n , в котором нормой элемента x Î R n является его
модуль x (так что x = x ).
В нормированном пространстве можно ввести понятие
расстояния между элементами.

1.2.2. Определение. Расстоянием между элементами x,y


нормированного пространства L называется норма их разности:
d ( x, y ) = x - y . В частности x = x - 0 = d ( x,0) , так что норма
элемента есть расстояние от этого элемента x до нулевого
элемента.

10
1.2.3. Теорема (о свойствах расстояния)
Число d ( x, y ) = x - y обладает свойствами:
1) d ( x, y ) > 0 Û x ¹ y , d ( x, x ) = 0 (неотрицательность).
2) d ( x, y ) = d ( y , x ) (симметричность),
3) d ( x, y ) £ d ( x, z ) + d ( z , y ) (неравенство треугольника).
□ 1) d ( x, y ) = x - y > 0 Û x - y ¹ 0 (по определению 1.2.1) Û x ¹ y;
d ( x, x ) = x - x = 0 = 0 (по определению 1.2.1).
2) d ( x, y ) = x - y = ( - 1) ( y - x ) = (по определению 1.2.1)
= - 1 × y - x = y - x = d ( y, x) .
3) d ( x, y ) = x - y = ( x - z ) + ( z - y ) £ ( по определению 1.2.1)
£ x - z + z - y = d ( x, z ) + d ( z , y ) . ■
Мы будем иметь дело с множеством функций, непрерывных на
отрезке [ a, b ] , которое будем обозначать C [ a, b ] , и с множеством
функций, n - раз непрерывно дифференцируемых на [ a, b ] (т.е.
имеющих непрерывные производные до n - го порядка
включительно), которое будем обозначать C [ a, b ] . Если сложение
n

функций и умножение функции на число понимать как обычно:


( " x Î [ a, b ]) éë( y1 + y2 ) ( x) = y1 ( x ) + y2 ( x ) ùû, ( " x Î [ a, b ]) éë( l y ) ( x ) = l y ( x ) ùû,
то при этих линейных операциях множества C [ a, b ] и C [ a, b ]
n

являются линейными пространствами. Например, если


y1 ( x ) , y2 ( x ) Î C 1 [ a, b ] , т.е. имеют непрерывные производные
y1¢( x ) , y2¢( x ) на [ a, b ] , то сумма y1 ( x ) + y2 ( x ) , тоже непрерывно
дифференцируема на [ a, b ] , т.е. ( y1 + y2 ) ( x) Î С [ a, b ] , если
1

y ( x ) Î С1 [ a, b ] , то ( l y ) x = l y ( x ) тоже непрерывно дифференцируема


на [ a, b ] , т.е. ( l y ) ( x) Î С [ a, b ] , Легко проверить, что эти линейные
1

операции удовлетворяют всем 8 аксиомам линейного пространства,


так как при каждом фиксированном x сложение функции и
умножение функции на число сводится к сложению и умножению
чисел, а для чисел все аксиомы выполняются. Нулевым элементом
пространства C [ a, b ] является функция, тождественно равная нулю
1

11
на [ a, b ] : y ( x) º 0. Противоположным элементом для функции
y ( x ) Î C 1 [ a, b ] является функция - y ( x ) Î C 1 [ a, b ] .
Аналогично, C [ a, b ] тоже является линейным пространством.
Итак, C [ a, b ] и C [ a, b ] являются линейными пространствами с
n

обычными правилами сложения функций и умножения функции на


число.
Введем нормы элементов в этих пространствах, что позволит
ввести понятие расстояния между элементами этих пространств (т.е.
между функциями).
Норма y есть расстояние от
функции y = y ( x ) до функции
y º 0. В пространстве
непрерывных функций C [ a, b ]
естественно считать функцию
y ( x ) близкой к функции y º 0 (на
всем отрезке
[ a, b ] !) если близко к нулю значение max y ( x ) (такое максимальное
[ a ,b ]

значение при некотором x Î [ a, b ] существует в силу теоремы


Вейерштрасса для функции, непрерывной на отрезке).
Поэтому положим y C = max y ( x) .[ a ,b ]

1.2.4. Теорема (о норме C [ a, b ] )


Величина, определенная равенством y C
= max y ( x ) , является
[ a ,b ]
нормой.
□ Проверим свойства нормы (1.2.1).
1) Очевидно, что max y ( x ) > 0 Û y ¹ 0 , так что y > 0 Û y ¹ 0.
[ a ,b ] C

Очевидно также, что 0 C = max


[ a ,b ]
0 = 0.

2) При l = 0 равенство l y C = l y C очевидно, так как


0 y C = 0 C = 0 и 0 × y C = 0 . Пусть l ¹ 0 . Тогда
é ù
( " x Î [ a, b ]) êl y ( x) = l × y ( x) £ l ×max y ( x ) = l × y C ú,
ë [ a ,b ] û
12
и, в частности, max l y ( x) £ l × y C , т.е. l y C£ l × y C . (1)
[ a ,b ]
1 1
Обратно, y c= ( l y ) c£ ( * по доказанному, для *)
l l
1 1
£ ×l y c = × l y c Þ l × y c£ l y c . (2)
l l
Из неравенств (1) и (2) получаем l y c= l × y c .
3) ( " x Î [ a, b ]) éë( y1 + y2 ) ( x ) = y1 ( x ) + y2 ( x ) £ y1 ( x ) + y2 ( x ) £
£ max y1 ( x ) + max y2 ( x) = y1 c + y2 c ù ú, и, в частности,
[ a ,b ] [ a ,b ] û
max ( y1 + y2 ) ( x) £ y1 C + y2 C , т.е. y1 + y2 C £ y1 C + y2 C .■
[ a ,b ]

Таким образом, пространство C [ a, b ] с нормой y C


= max y ( x)
[ a ,b ]
является нормированным пространством. Расстоянием между
точками y1 ( x ) и y2 ( x ) этого пространства является число
d ( y1 , y2 ) = y1 - y2 C = max y1 ( x ) - y2 ( x ) – максимальное расстояние
[ a ,b ]

по вертикали между графиками функций y = y1 ( x ) и y = y2 ( x ) .

Элементы пространства C 1 [ a, b ]
непрерывно
дифференцируемые, т.е. гладкие функции. Функция y ( x ) Î C [ a, b ] в
1

каждой точке x Î [ a, b ] имеет невертикальную касательную с угловым


коэффициентом y ¢( x ) , которая ввиду непрерывности y ¢( x )
непрерывно (без скачков) меняет свое положение при движении
вдоль графика y = y ( x ) . Поэтому элементы y1 ( x ) , y2 ( x ) этого
пространства естественно считать близкими, если не только мало
расстояние по вертикали между их графиками, но еще мало
13
отличаются их касательные на всем [ a, b ] , т.е. разность y1¢( x ) - y2¢( x )
мала. Поэтому расстоянием d ( y1 , y2 ) следует считать число

{
d ( y1 , y2 ) = max max y1 ( x) - y2 ( x ) ,max y1¢( x ) - y2¢( x ) =
[ a ,b ] [ a ,b ]
}
= max { y1 - y2 C , y1¢- y2¢ C }.
( max y1¢( x ) - y2¢( x) тоже существует, т.к. функция y1¢( x ) - y2¢( x )
[ a ,b ]

непрерывна на отрезке [ a, b ] ). Следовательно, нормой элемента


y ( x ) Î C1 [ a, b ] (т.е. расстоянием до y º 0 ) следует считать число
y C1= d ( y,0) = max { y C , y ¢ C } . Вообще,
y Cn {
= d ( y,0) = max y C , y ¢ C ,K , y ( n) C }.
1.2.5. Замечание.
Очевидно, что y C £ y Cn
, y¢C £ y Cn
, K , y ( n) £ y Cn .
C

1.2.6. Теорема (о норме C [ a, b ] )


n

Величина, определенная равенством


{
y C n = max y C , y ¢ C ,K , y( n) C , является нормой.
[ a ,b ]
}
□ Докажем для n = 1 (для n ³ 2 доказательство аналогично).
Проверим свойства нормы (1.2.1) учитывая, что для ×C они
проверены.
1) Пусть y C1 > 0 , т.е. max { y C , y ¢ C } > 0 . Тогда хотя бы
одно из чисел y и y ¢ C больше нуля. Если y C > 0 , то по теореме
C

1.2.4 (1) y ¹ 0 . Если y ¢ C > 0 , то по той же теореме y ¢¹ 0 , т.е.


y ¹ const Þ y ¹ 0 . Таким образом, в любом случае y ¹ 0 .
Пусть обратно, y ¹ 0 . Тогда по теореме 1.2.4 (1) y C > 0 ,
значит, max { y C , y ¢ C } > 0 Þ y C1
> 0.
Доказано, что y C1
> 0 Û y ¹ 0. Далее
0 C1 = max { 0 C , 0¢ C } = 0 очевидно.

14
2) При l = 0 равенство l y C1 = l y C 1 очевидно:
0 y C1 = 0 C1 = 0 и 0 y C1 = 0 . Пусть l ¹ 0 . Тогда то по теореме 1.2.4

(2) l y C= l × y C , ( l y) ¢ C= l y ¢ C = l × y ¢ C , а согласно

замечанию 1.2.5 y C
£ y C1
и y¢C £ y C1 . Поэтому l y C£ l × y C1

¢
и ( l y ) C£ l × y C1 . Значит, и

ïì ïü
max í l y C , ( l y ) ¢ C ý £ l × y C1 , т.е. l y C1£ l × y C1 . (3)
ïîï ïþï
1 1 1
Обратно, y C1= ( l y ) C1£ ( * по доказанному для *) £ × l y C1 =
l l l
1
= × l y C1Þ l × y C1£ l y C1 . (4)
l
Из неравенств (3) и (4) получаем l y C1 = l y C1 .
3) По теореме 1.2.4 (3) y1 + y2 C£ y1 C + y2 C ,
( y1 + y2 ) ¢ C = y1¢+ y2¢ £ y1¢ C + y2¢ C , а согласно замечанию 1.2.5
y1 C + y2 C£ y1 C1
+ y2 C1 и y1¢ C + y2¢ C£ y1 C1
+ y2 C1
. Поэтому
y1 + y2 C£ y1 C1
+ y2 C1 и ( y1 + y2 ) ¢ C£ y1 C1
+ y2 C1 , значит,

ïì ïü
max í y1 + y2 C , ( y1 + y2 ) ¢ C ý £ y1 C1
+ y2 C1 , т.е.
ïîï ïþï
y1 + y2 C1£ y1 C1 + y2 C1 . ■
Таким образом, пространство C n [ a, b ] с нормой
y C n {
= max y C , y ¢ C ,K , y( n) C } является нормированным
пространством.
Расстоянием между точками y1 , y2 Î C [ a, b ] является число
1

d ( y1 , y2 ) = y1 - y2 C n = max y1 - y2 { C
, y1
¢- y ¢
2 C
,..., y ( n)
1 - y ( n)
2
C
}.

15
Замечание. Функции, близкие по норме пространства C [ a, b ] ,
могут сильно отличаться по норме пространства C [ a, b ] . Например,
n

1
функции y0 ( x) º 0 и yn ( x) = sin nx ( n Î N ) обе принадлежат
n
и пространству C [ a, b ] и пространству

C1 [ a, b ] (при любых a, b Î R (возьмем

b ³ a + 2p )). По норме C [ a, b ] :

1 1
d ( y0 , yn ) = y0 - yn . По норме C [ a, b ] :
1
C = yn
C
= max sin nx =
[ a ,b ] n n
ì1 ü
d ( y0 , yn ) = y0 - yn C1= yn C1 = max { yn C , yn¢ C } = max ïí , yn¢ C ïý .
ïîï n ïþ
ï
Но yn¢= cos nx, yn¢ C = max cos nx = 1, так что
[ a ,b ]

ïì 1 ïü
d ( y0 , yn ) = max í ,1ý = 1 . С возрастанием n функция yn ( x )
ïîï n ïþï

становится сколь угодно близкой к функции y0 ( x) º 0 по норме

1
C [ a, b ] , т.к. d ( y0 , yn ) = ® 0 , тогда как всегда отстоит от неё на
n

расстояние d ( y0 , yn ) = 1 по норме C [ a, b ] .
1

1.2.7. Определение. d - окрестностьюVd ( y0 ) точки y0

пространства C [ a, b ] ( C [ a, b ]) называется множество точек (т.е.


n

функций) y Î C [ a, b ] ( y Î C [ a, b ]) , удовлетворяющих неравенству


n

d ( y0 , yn ) = y0 - yn ( g C или g C n )

16
т.е. отстоящих от y0 меньше чем на d .
y Î Vd ( y0 ) в пространстве C [ a, b ]

означает, что график функции


y = y ( x) находится между кривыми

y = y0 ( x ) - d
и y = y0 ( x ) + d . В пространстве C [ a, b ] этого недостаточно: надо
n

ещё, чтобы изгибы кривой y = y ( x ) мало отличались от изгибов

кривой y = y0 ( x ) .
1.2.8. Определение. Пусть M - множество каких – либо
функций. Отображение J , сопоставляющее каждой функции y Î M

определенное число J [ y] Î R , называется функционалом,


определенным на множестве функций M .
Отображение J , сопоставляющее каждому набору из k

функций y1 , y2 ,K yk Î M (т.е. вектор – функции y = ( y1 , y2 ,K yk ) )

определенное число J [ y1 , y2 ,K , yk ] = J [ y ] Î R ) называется


функционалом, определенным на множестве наборов функций из
M (на множестве вектор – функций).
В п. 1.1 был рассмотрен пример функционала
1

J [ y] = ò 1 + y ¢2 dx , определенного в пространстве C1 [ a, b ] . Еще


0
примеры:
1

Пусть J [ y ] = òy ( x) dx, y1 ( x ) = x, y2 ( x ) = x 2 , y3 ( x ) = e 2 x .
2

17
1 1
1 1
Тогда J [ y1 ] = ò x dx = , J [ y2 ] = ò x dx =
2 4
,
0
3 0
5
1
2 1 4
J [ y3 ] = ò( e ) ( e - 1) .
2x
dx =
0
4
p /2

Пусть J [ y1 , y2 ] = ò ( y ¢y1 2 - y22 ) dx, y1 ( x ) = 2 x, y2 ( x ) = cos x.


0
Тогда
p /2 p /2
æ ö p
J [ y1 , y2 ] = ò çç( 2 x) ¢cos x - cos 2 x÷ dx = ò ( 2cos x - cos 2 x) dx = 2 - .
è ø÷ 4
0 0

1.2.9. Определение. Говорят, что функционал J [ y ] = J [ y1 ,K , yk ] ,


определенный на множестве M допустимых вектор – функций
y = ( y1 ,K , yk ) с координатными функциями y1 ,K , yk Î C n [ a, b ] ,
имеет в точке y 0 = ( y10 ,K , yk0 ) Î M локальный максимум
(минимум), если для всех y Î M , достаточно близких к y 0 ,
выполняется неравенство
J [ y ] £ J éëy 0 ùûÛ J [ y1 ,K , yk ] £ J éëy10 ,K , yk0 ùû ( J [ y ] ³ J [ y0 ]) , т.е.
существует d > 0 такое, что
(" ( y1 ,K , yk ) Î M : y1 - y10 C n < d, y2 - y20 C n < d,K , yk - yk0 C n < d )
éJ [ y ,K , y ] £ J éy 0 ,K , y 0 ù( J [ y ,K , y ] ³ J éy 0 ,K , y 0 ù) ù.
êë 1 k ë1 kû 1 k ë1 k ûú
û
Для исследования функционала на экстремум введем понятие,
аналогичное понятию производной числовой функции числовой
переменной.
Пусть функционал J [ y ] определен на некотором множестве
допустимых функций M Ì C [ a, b ] , и y = y ( x ) , h = h ( x ) Î M -
n

фиксированные допустимые функции. Рассмотрим числовую


функцию числовой переменной j ( a ) = J [ y + a h ] (в предположении,
что при любом a Î R функция y + a h остается допустимой
функцией: y + a h Î M ). Приращение аргумента a h и просто h
называют вариацией аргумента.

18
1.2.10. Определение. Если существует производная функции
j ( a ) = J [ y + a h ] в точке a = 0 , то она называется первой
вариацией функционала J [ y ] в точке y при данной вариации h
аргумента, и обозначается d J [ y, h ] :
j ( a ) - j ( 0) J [ y + a h] - J [ y ]
dJ [ y, h ] = j ¢( 0) = lim = lim
a® 0 a- 0 a® 0 a
(заметим, что в числителе стоит приращение функционала J [ y ] в
точке y , вызванное приращением (вариацией) a h аргумента. При
a ® 0 это приращение аргумента стремится к нулю: a h C1 =| по
определению 1.2.1|= a h C1 ® 0 , так как h C1 = const ).
Для функционала от k функций (от k - мерной вектор –
функции) J [ y1 , y2 ,K yk ] = J [ y ] производная функции
j j ( a ) = J éëy1 , y2 ,K , y j + a h,K , yk ùû в точке a = 0 является первой
вариацией функционала J [ y1 , y2 ,K yk ] в точке y = ( y1 , y2 ,K yk ) по
аргументу y j при данной вариации h j этого аргумента:
J éëy1 , y2 ,K , y j + a h j ,K , yk ùû- J éëy1 , y2 ,K , y j ,K , yk ùû
é ù
dy j J ëy , h j û= j ¢j ( 0) = lim .
a® 0 a
1.2.11. Теорема (необходимое условие локального экстремума
функционала в терминах первой вариации).
Пусть функционал J [ y1 , y2 ,K , yk ] = J [ y ] , определенный на
множестве M допустимых вектор–функций y = ( y1 , y2 ,K , yk ) с
координатами y1 , y2 ,K , yk Î C n [ a, b ] имеет в точке
y 0 = ( y10 , y20 ,K , yk0 ) Î M локальный экстремум. Если в этой точке
функционал имеет первую вариацию по аргументу y j при какой-либо
вариации h j этого аргумента, то эта первая вариация равна нулю:
dy j J éëy 0 , h j ùû= 0 .
□ Пусть, например y 0 - точка минимума: существует d > 0
такое, что
(" ( y1 ,K , yk ) Î M : y1 - y10 C1 < d,K , y j - y 0j C1 < d,K , yk - yk0 C n < d )
éJ éy ,K , y ,K , y ù³ J éy 0 ,K , y 0 ,K , y 0 ùù. Возьмем точку
ëê ë 1 j kû ë1 j k ûûú
19
( y1 ,K , y j ,K , yk ) = ( y10 ,K , y 0j + a h j ,K , yk0 ) Î M. Для нее
y1 - y10 = 0,K , y j - y 0j = a h j ,K , yk - yk0 = 0 . При достаточно малом a
будет a h j C1 < d , так как a h j C1 = a h j C1 , где h j C1
= const .
Поэтому имеем
y1 - y10 C1 < d,K , y j - y 0j C1 < d,K , yk - yk0 C n < d Þ
J éëy1 ,K , y j ,K , yk ù é0 0 0ù
û³ J ëy1 ,K , y j ,K , yk û,
т.е. J éëy1 ,K , y j + a h j ,K , yk ùû³ J éëy1 ,K , y j ,K , yk ùû, или j j ( a ) ³ j j ( 0) .
0 0 0 0 0 0

Таким образом, при всех достаточно малых a выполняется


неравенство j j ( a ) ³ j j ( 0) . Это означает, что функция
j j ( a ) = J éëy1 , y2 ,K , y j + a h,K , yk ùû
имеет минимум в точке a = 0 . По условию, при данной вариации h j
существует первая вариация по аргументу y j , т.е. существует j ¢j ( 0) .
Но, по теореме Ферма, если в точке локального экстремума числовая
функция числового аргумента имеет производную, то она равна
нулю: j ¢j ( 0) = 0 .
Следовательно, dy j ( y , h j ) = 0 . ■
0

Замечание. Если найдена вектор – функция y = ( y1 , y2 ,K , yk ) в


которой первые вариации функционала J [ y ] = J [ y1 , y2 ,K , yk ]
обращаются в нуль, то это ещё не значит, что в точке y 0 функционал
действительно имеет экстремум: ведь это необходимое условие
экстремума. Достаточные условия экстремума функционала сложны,
их не будем рассматривать. Но если по смыслу задачи экстремум
есть, а найдена только одна вектор – функция y 0 , в которой первые
вариации обращаются в нуль (“критическая точка”), то в точке y 0
обязан быть экстремум.
В достаточных условиях экстремума используется понятие
второй вариации функционала, которое мы не будем рассматривать.
Поэтому в дальнейшем вместо “первая вариация” будем говорить
просто “вариация”.

20
1.3. Вычисление вариации интегрального функционала.

Мы будем рассматривать экстремумы только интегральных


функционалов, когда значения функционалов вычисляются с
помощью определенного интеграла:
J [ y ] = J [ y1 ,..., yk ] =
b

= ò f ( x, y ( x) ,..., y
1 k ( x) , y1¢( x ) ,..., yk¢( x ) ,..., y1( n) ( x ) ,..., yk( n) ( x ) ) dx =
a
b

= ò f ( x; y1 ,..., yk ; y1¢,..., yk¢,..., y1( n) ,..., yk( n) ) dx.


a
Подынтегральную функцию называют интегрантом
функционала. Это сложная функция с ( n + 1) k + 1 промежуточными
аргументами x, y1 ,..., yk , y1¢,..., yk¢,..., y1( ) ,..., yk( ) , которые являются
n n

функциями от x :
x = x, y1 = y1 ( x ) ,..., yk = yk ( x ) ,
y1¢= y1¢( x ) ,..., yk¢ = yk¢( x ) ,
...
y1( n) = y1( n) ( x ) ,..., yk( n) = yk( n) ( x ) .
Так как мы рассматриваем функции y Î C [ a, b ] , то все функции
n

y1 = y1 ( x) ,..., yk( n) = yk( n) ( x ) непрерывны на [ a, b ] . Будем предполагать в


дальнейшем, что функция f ( x, y1 ,..., yk ,..., y1 ,..., yk ) непрерывна при
( n) ( n)

всех x Î [ a, b ] и любых y1 ,..., yk , y1¢,..., yk¢,..., y1( ) ,..., yk( ) . Тогда интегрант
n n

как сложная функция от x непрерывна на [ a, b ] и потому интеграл


существует. Более того, будем предполагать, что функция
f ( x, y1 ,..., yk ,..., y1( n) ,..., yk( n) ) имеет непрерывные частные производные
нужных порядков по всем аргументам x, y1 ,..., yk( n) при x Î [ a, b ] и
любых y1 ,..., yk( ) . Это обеспечит законность предстоящих
n

вычислений.
Достаточно вычислить вариацию функционала от одной
функции

21
b

ò f ( x, y, y ¢, y ¢¢,..., y ) dx
n( )
J [ y] = (1)
a
(В п. 1.1 имели пример такого функционала с интегрантом
f ( x, y, y ¢) = 1 + y ¢2 ), так как вариация функционала от вектор-
функции J [ y1 ,..., yk ] по аргументу yj вычисляется при
фиксированных значениях остальных аргументов, т.е. как вариация
функционала от одной функции y j .
1.3.1. Теорема (о вариации интегрального функционала)
Пусть M Î C [ a, b ] - некоторое множество допустимых
n

функций. Вариация функционала (1) в точке y Î M при любой


допустимой вариации h Î M аргумента существует и равна
b

ò ( f ¢( x, y, y ¢,..., y ) h + f ¢( x, y, y ¢,..., y ) h¢+ ... +


( n) ( n)
d J [ y, h ] = y y¢
a (2)
)
+ f y¢( n) ( x, y, y ¢,..., y( n) ) h( n) dx.
□ Докажем при n = 1 (при n ³ 2 доказательство аналогично). В
b

этом случае J [ y] = ò f ( x, y, y ¢) dx . Как было отмечено выше,


a

интеграл при y Î C [ a, b ] существует. Надо найти d J [ y, h ] = j ¢( 0) , где


1

j ( a ) = J [ y + a h] = ò f ( x, y + a h, y ¢+ a h¢) dx .
a
¢ ¢
æb ö÷ æb ö÷
Имеем j ¢( a ) = ççò f ( x, y + a h, y ¢+ a h ¢) dx÷ ÷ = çççò F ( x, a ) dx÷÷ ,
çç ÷ ç ÷
èa øa è a øa
где F ( x, a ) = f ( x, y ( x ) + a h ( x ) , y ¢( x ) + a h ¢( x ) ) . Ввиду
непрерывности f ( x, y, y ¢) и непрерывности функций
y ( x ) + a h ( x ) , y ¢( x ) + a h ¢( x ) сложная функция F ( x, a ) непрерывна
при x Î [ a, b ] и любых a , т.е. в прямоугольнике (бесконечной длины)
{ ( x, a ) : x Î [ a, b] , a Î ]-
¥ , + ¥ [} .
Частная производная

22
¢
Fa¢( x, a ) = f x¢×xa¢ + f y¢×ya¢ + f y¢¢ ×( y ¢) a
=
æ ¢ ¢ ¢ ö
= çç* xa¢ = 0, ya¢ = ( y + a h) a = h;( y ¢) a = ( y ¢+ a h ¢) a = h ¢*÷÷=
è ø÷
= f y¢( x, y ( x ) + a h ( x ) , y ¢( x ) + a h ¢( x ) ) h ( x ) +
+ f y¢¢( x, y ( x ) + a h ( x ) , y ¢( x ) + a h ¢( x ) ) h ¢( x )
также непрерывна в этом прямоугольнике ввиду непрерывности
частных производных f y¢, f y¢¢ и непрерывности функций
y ( x ) , y ¢( x ) , h ( x ) , h ¢( x ) . Поэтому можно согласно теореме Лейбница
(1.1.2) дифференцировать по a под знаком интеграла:
æb ö¢
÷
b b
ç
j ¢( a ) = ççò F ( x, a ) dx÷ = ò Fa¢( x, a ) dx = ò ( f y¢( x, y + a h, y ¢+ a h ¢) h +
÷
÷
çè a øa a a

+ f y¢¢( x, y + a h, y ¢+ a h ¢) h ¢) dx .
b b

Отсюда j ¢( 0) = ò f ¢( x, y, y ¢) h + ò f ¢( x, y, y ¢) h¢dx Þ
y y¢
(2) ■
a a

1.4. Простейшая вариационная задача


(с закрепленными границами)

Простейшая вариационная задача для функционала для одной


функции с первой производной состоит в следующем:
Среди всех функций y Î C [ a, b ] , удовлетворяющих краевым
1

условиям y ( a ) = ya , y ( b) = yb ( ya , yb - заданные числа),


(1)
найти ту функцию, которая доставляет экстремум функционалу
b

J [ y] = ò f ( x, y, y ¢) dx .
a

В этой задаче допустимые функции – все функции y Î C [ a, b ] ,


1

удовлетворяющие краевым условиям (1). При вычислении вариации


рассматривается j ( a ) = J [ y + a h ] , поэтому функция y + a h тоже
должна быть допустимой: y + a h Î C1 [ a, b ] , ( y + a h) ( a ) = ya ,

23
( y + a h) ( b) = yb . Для этого допустимая вариация h = h ( x) должна
быть тоже непрерывно дифференцируемой: h Î C [ a, b ] , причем
1

такой, чтобы h ( a ) = h ( b) = 0 (тогда


y ( a ) + a h ( a ) = ya , y ( b) + a h ( b ) = yb ).
Для функционала с одной функцией и с производными до n - го
порядка простейшая задача такова:
Среди всех функций y Î C [ a, b ] , удовлетворяющих краевым
n

условиям
y ( a ) = ya( 0) , y ¢( a ) = ya¢,..., y( n- 1) ( a ) = ya( n- 1) ,
y ( b) = yb( 0) , y ¢( b) = yb¢,..., y( n- 1) ( b) = yb( n- 1)
( y( ) ,..., y(
a
0
b
n- 1)
- заданные числа ) , найти ту функцию, которая
доставляет экстремум функционалу
b

ò f ( x, y, y ¢, y ¢¢,..., y ) dx .
( ) n
J [ y] =
a
В этой задаче допустимыми вариациями h являются функции
h Î C n [ a, b ] , удовлетворяющие краевым условиям
h ( a ) = h ¢( a ) = ... = h( n- 1) ( a ) = 0, h ( b) = h ¢( b) = ... = h( n- 1) ( b) = 0
(так как, например, должно быть ( y + a h) ² ( a ) = y ¢¢( a ) + a h ¢¢( a ) = ya¢¢
а для этого надо, чтобы h ¢¢( a ) = 0 ).
Для функционала с k функциями и производными до n - го
порядка простейшая задача имеет вид:
Среди всех k – мерных вектор - функций y = ( y1 ,..., yk ) с
координатами y1 ,..., yk Î C n [ a, b ] , удовлетворяющих краевым
условиям
y1 ( a ) = y1( a0) , y1¢( a ) = y1¢a ,..., y1( n- 1) ( a ) = y1( an- 1) ,..., yk ( a ) = yka( 0) , yk¢( a ) = yka¢ ,..., yk( n- 1) ( a ) = yka( n- 1)
L (2)
y1 ( b) = y1( b0) , y1¢( b) = y1¢b ,..., y1( n- 1) ( b) = y1( bn- 1) ,..., yk ( b) = ykb( 0) , yk¢( b ) = ykb¢ ,..., yk( n- 1) ( b ) = ykb( n- 1)
( y1( a0) ,..., ykb
( n- 1)
- заданные числа) найти ту вектор-функцию, которая
доставляет экстремум функционалу

24
b

ò f ( x, y ,K , y , y ¢,K , y ¢,K , y ,K , yk( n) ) dx.


( n)
J [ y ] = J [ y1 ,K , yk ] = 1 k 1 k 1
a

В этой задаче допустимыми вариациями h j аргументов y j являются


функции h j Î C [ a, b ] , удовлетворяющие краевым условиям
n

h j ( a) = h¢j ( a ) = K = h(jn- 1) ( a ) = 0, h j ( b ) = h ¢j ( b ) = K = h(jn- 1) ( b ) = 0


( j = 1, 2,K , k ) .
1.4.1. Теорема (необходимое условие экстремума в простейшей
задаче в терминах интегранта)
Если функционал от вектор - функции
b

J [ y ] = J [ y1 ,K , yk ] = ò f ( x, y1 ,K , yk , y1¢,K , yk¢,K , y1( n) ,K , yk( n) ) dx,


a

определенный на множестве функций y = ( y1 ,K , yk ) , где


y1 ,K , yk Î C n [ a, b ] , удовлетворяющих краевым условиям (2):
y ( a ) = ( y1 ( a ) ,K , yk ( a ) ) = ( y1( a0) ,K , yka
( 0)
),
y ¢( a ) = ( y1¢( a ) ,K , yk¢( a ) ) = ( y1¢a ,K , yka
¢),
KKKK KKKKKKKKKKKK
y ( n- 1) ( a ) = ( y1( n- 1) ( a ) ,K , yk( n- 1) ( a ) ) = ( yk( n- 1) ,K , yka
( n- 1)
),
y ( b) = ( y1 ( b) ,K , yk ( b) ) = ( y1( b0) ,K , ykb
( 0)
),
y ¢( b) = ( y1¢( b) ,K , yk¢( b) ) = ( y1¢b ,K , ykb¢ ) ,
KKKK KKKKKKKKKKKK
y ( n- 1) ( b) = ( y1( n- 1) ( b) ,K , yk( n- 1) ( b) ) = ( y1( bn- 1) ,K , ykb
( n- 1)
),
имеет в допустимой точке y экстремум, то эта вектор-функция y
удовлетворяет системе дифференциальных уравнений Эйлера-
Пуассона:

25
ìï d d 2
n d
n
ïï f y¢- f ¢+ f ¢- K + ( - 1) f ¢ = 0,
ïï 1 dx y1¢ dx 2 y1¢¢ n y( n)
dx 1
ïï 2 n
ïï f ¢ - d f ¢ + d f ¢ - K + ( - 1) n d f ¢ = 0,
ïí y2 ¢ ¢¢ ( n)
dx y2 dx 2 y2 dx n y2 (3)
ïï
ïï K K K K K K K K K K K K K K K K K K K K K
ïï 2 n
ïï f ¢ - d f ¢ + d f ¢ - K + ( - 1) n d f ¢ = 0.
ïïî yk dx yk¢ dx 2 yk¢¢ dx n yk
( n)

□ Сначала докажем для функционала от одной функции


b

ò f ( x, y, y ¢, y ¢¢,K , y ) dx ,
( ) n
J [ y] =
a
b

причем при n = 2 : для J [ y ] = ò f ( x, y, y ¢, y ¢¢) dx , определенного на


a

множестве функций y Î C [ a, b ] ,
2
удовлетворяющих краевым
условиям
y ( a ) = ya( o) , y ¢( a ) = ya¢,
y ( b) = yb( o) , y ¢( b) = yb¢.
Допустимыми вариациями являются функции h Î C [ a, b ] такие, что
2

h ( a ) = h ¢( a ) = 0, h ( b ) = h ¢( b) = 0 (при n³ 3 доказательство
аналогично). Для упрощения доказательства добавим условие:
функция y = y ( x) , доставляющая экстремум функционалу,
четырежды непрерывно дифференцируема, т.е. y Î C [ a, b ] вместо
4

y Î C 2 [ a, b ] (теорема верна и без этого условия).


Согласно теореме 1.2.11, в точке локального экстремума y при
любой допустимой вариации h аргумента вариация функционала
равна нулю: d J [ y, h ] = 0 . Согласно теореме 1.3.1,
b

d J [ y, h ] = ò ( f ¢( x, y, y ¢, y ¢¢) h +
y f y¢¢( x, y , y ¢, y ¢¢) h ¢+ f y¢¢¢( x, y , y ¢, y ¢¢) h ¢¢) dx .
a

Значит, при любой функции h Î C [ a, b ] , удовлетворяющей


2

условиям
h ( a ) = h ¢( a ) = 0, h ( b) = h ¢( b) = 0,
выполняется равенство
26
b

ò ( f ¢×h +
y f y¢¢ ×h ¢+ f y¢¢¢ ×h ¢¢) dx = 0 .
a
Второй и третий интегралы возьмем по частям:
æ f y¢¢ = u , h¢dx = dv ö÷
b çç ÷
b
d
ç ÷ b
ò y¢
f ¢h ¢
dx = çç * d *
f ¢¢ dx, v = h ÷
÷
÷= f ¢

×h a
- ò dx
f y¢¢ ×h dx =
a çè du = ø÷ a
dx y
b
d
=- ò dx f y¢¢ ×h dx,
a

так как h ( a ) = h ( b) = 0;
æ f y¢¢¢ = u , h ¢¢dx = dv ö ÷
b çç ÷
b
d
ç ÷ b
ò yf ¢
¢
¢ h ¢
¢dx = çç *
du =
d
f ¢ dx , v = h ¢

÷
÷
= f y
¢¢
¢ ×h ¢
a
- ò dx
f y¢¢¢ ×h¢dx =
a çè ¢¢ ÷
ø a
dx y
æ d ö
÷
çç f ¢ = u , h ¢
dx = dv ÷
æ h¢( a ) = 0, ö÷ b
d ç dx y ¢¢ ÷
÷
çç* ç
çè h¢( b) = 0 ø÷
*÷÷= - ò dx f y
¢¢
¢ ×h ¢
dx = ç
çç
*
d 2

÷
÷
=
a çç du = 2 f y¢¢¢ dx, v = h ÷ ÷
÷
è dx ø
æd b
d2 ö÷ b d 2
ç b
= - çç f y¢¢¢ h a - ò 2 f y¢¢¢ ×hdx÷ = ò 2 f y¢¢¢ ×hdx ,
÷
÷
çè dx a
dx ø a dx
так как h ( a ) = h ( b) = 0.
Таким образом, при любой допустимой функции h
b
æ 2 ö
çç f ¢- d f ¢ + d f ¢÷
ò çè y dx y¢ dx 2 y¢¢ø÷÷÷h dx = 0 (4)
a

Здесь f y¢¢¢ содержит y ¢¢, и при двукратном дифференцировании по x в


d2 IV
слагаемом f ¢
¢
¢ появляется y ; для непрерывности этого
dx 2 y
слагаемого достаточно, чтобы y IV была непрерывна. Именно здесь
используется дополнительное условие y Î C [ a, b ] .
4

d d2
Итак, подынтегральная функция F ( x) = f y - ¢ f y¢ + 2 f y¢¢¢
¢
dx dx
непрерывна на отрезке [ a, b ] , и при любой функции h Î C [ a, b ] такой,
2

27
что h ( a ) = h ( b) = 0 , выполняется равенство (4). Тем более оно
выполняется при любой функции h( x) , бесконечно
дифференцируемой на [ a, b ] и такой, что h ( a ) = h ( b) = 0 (так как если
h ( x ) бесконечно дифференцируема, то производная любого порядка
h( n) ( x ) непрерывна: h ( x ) Î C n [ a, b ] , в частности, h ( x ) Î C 2 [ a, b ] ). Но
это означает выполнение условий леммы Лагранжа 1.1.2. Согласно
d d2
этой лемме, f y¢- f y¢¢ + 2 f y¢¢¢ º 0 на [ a, b ] . Таким образом, для
dx dx
функционала от одной функции доказано, что точка экстремума
y = y ( x) удовлетворяет на отрезке [ a, b ] уравнению Эйлера-Пуассона:
d d2 n d
n
f y¢- f y¢¢ + 2 f y¢¢¢ - ... + ( - 1) f ¢ = 0.
n y( n)
(5)
dx dx dx
Согласно теореме 1.2.11 у функционала от вектор – функции
J [ y ] = J [ y1 ,..., yk ] в точке экстремума y = y ( x ) = ( y1 ( x ) ,..., yk ( x ) )
вариация по каждому аргументу y j (при фиксированных остальных
аргументах y1 , y2 ,..., y j- 1 , y j+ 1 ,..., yk ) обращается в нуль при любой
вариации h j аргумента y j : dy j J éëy , h j ùû= 0 . Поэтому, рассматривая
функционал J [ y ] как функционал от одной функции y j , получаем,
что функция y j ( x ) удовлетворяет на [ a, b ] уравнению (5):
d d2 n d
n
f y¢j - f y¢¢j + 2 f y¢¢j¢ - ... + ( - 1) f ¢ = 0.
n y j( n)
dx dx dx
Это верно при каждом j = 1, 2,..., k , так что вектор- функция
y = ( y1 ,..., yk ) удовлетворяет на [ a, b ] системе уравнений (3) ■
1.4.2. Определение. Вектор-функция y = ( y1 ,..., yk ) ,
удовлетворяющая системе уравнений Эйлера-Пуассона, называется
экстремалью функционала J [ y ] = J [ y1 ,..., yk ] .
В случае функционала от одной функции J [ y ] экстремалью
является одна числовая функция числовой переменной.
Замечание. Уравнения Эйлера-Пуассона в случае, когда
функционал содержит только производные первого порядка,
называют уравнениями Эйлера.
1.4.3. Пример.
28
Среди гладких линий, соединяющих
данные точки ( x1 , y1 ) и ( x2 , y2 ) , найти
ту, которая при вращении вокруг оси
Ox образует поверхность
наименьшей площади.

□ Площадь поверхности вращения


x2

равна J [ y ] = 2p ò y 1 + y ¢ dx.
2

x1

Имеем простейшую вариационную задачу в пространстве C [ x1 , x2 ]


1

x2

J [ y] = ò 2p y 1 + y ¢2 dx ® min, y ( x1 ) = y1 , y ( x2 ) = y2 .
x1

Множитель 2p не влияет на наличие экстремума, поэтому будем


считать, что интегрант f ( x, y, y ¢) = y 1 + y ¢2 . Составим уравнение
Эйлера:
d dæ ç y ¢ ö÷ ÷
f y¢- f y¢¢ = 0 Û 1 + y ¢ -2
çç y ÷= 0 Û
dx dx çè 1 + y ¢ ø÷2
÷
æ y ¢y ¢¢ ö÷
çç y ¢¢ 1 + y ¢2 - y ¢ ÷
çç y¢ 1 + y ¢2 ÷÷
÷
Û - çç y ¢ + y ÷
÷+ 1 + y ¢2 = 0 Û
çç 1 + y ¢2 1+ y¢ 2
÷
÷
ç ÷
÷
çè ø÷
Û yy ¢¢- y ¢2 - 1 = 0.
Уравнение не содержит x . С помощью замены переменной
dp
y ¢= p ( y ) , y ¢¢= p находим общее решение
dy
2
ln C1 y + ( C1 y ) - 1 = ± C1 ( x + C2 ) .

29
Покажем, что если ln z + z 2 - 1 = ± t , то z = ch t . В самом деле,

z+ z 2 - 1 = e± t Þ z + z 2 - 1 = ± e± t Þ z 2 - 1 = - z ± e± t Þ

2 2 ±t ± 2te± 2 t + 1 e ± t + e mt
Þ z - 1 = z m 2 ze + e Þ z = = ,
2e± t 2
e t + e- t e- t + e t
т.е. z = = ch t или z = = ch t.
2 2
1
Поэтому C1 y = ch ( C1 ( x + C2 ) ) Þ y = ch ( C1 ( x + C2 ) ) . Мы нашли
C1
семейство экстремалей, зависящее от двух параметров C1 и C2 . Для
нахождения конкретных значений постоянных C1 и C2 используем
краевые условия:
1 üï
y ( x1 ) = y1 Þ y1 = ch ( C1 ( x1 + C2 ) ) ïï
C1 ïï
ý.
1 ï
y ( x2 ) = y2 Þ y2 = ch ( C1 ( x2 + C2 ) ) ïï
C1 ïï
þ
Это – система трансцендентных уравнений с неизвестными C1 и C2
(решается только численным методом, т.е. приближенно).
Экстремаль есть цепная линия (на рисунке – штриховая линия).
Она получена из простейшей цепной линии y = chx сжатием-
растяжением и сдвигом (свободно провисающая бельевая веревка
имеет форму цепной линии).■
1

1.4.4. Пример. J [ y ] = ò ( y¢ - y2¢¢2 ) dx ® extr ,


2
1
0

y1 ( 0) = 2, y1 ( 1) = 0; y2 ( 0) = 0; y2 ( 1) = 1; y2¢( 0) = 1; y2¢( 1) = 0
□ Составляем систему уравнений Эйлера-Пуассона для
f ( x, y1 , y2 , y1¢, y2¢, y1¢¢, y2¢¢) = y1¢2 - y2¢¢2 :
ìï d d2 ìï d d2
ïï ¢
f y1 - ¢
f ¢+ ¢
f ¢¢ = 0 ï
ïï 0 - ( 2 y1 ) + 2 ( 0) = 0,
¢
ïï dx y1 dx 2 y1 dx dx ìï y1¢¢= 0,
í Û í ï ï
Û í IV
ïï d d 2 ï d d 2 ï y = 0.
ïï f y¢2 - f y¢2¢ + 2 f y¢2¢¢ = 0 ïïï 0 - ( 0) + 2 ( - 2 y2¢¢) = 0, ïî 2
ïî dx dx ïî dx dx
Общее решение:

30
ìï y1 = C1 x + C2 ;
ïí .
ïïî y2 = C3 x 3 + C4 x 2 + C5 x + C6
Используем краевые условия:
ìï C1 = - 2,
ìï 2 = C1 0 + C2 , ïï
ïï ïï C2 = 2,
ïï 1 = C1 + C2 , ïï
ïï ïíï C3 = - 1,
í 0 = C3 0 + C4 0 + C5 0 + C6 , Þ
ïï ïï C4 = 1,
ïï 1 = C3 0 + 2C4 0 + C5 ,
ïï
ïï ïï C5 = 1,
ïî 0 = 3C3 + 2C4 + C5 ,
ïï
ïî C6 = 0.
ìï y1 = - 2 x + 2
Имеется единственная экстремаль ïí .■
ïïî y2 = - x 3 + x 2 + x
1.5. Вариационная задача с подвижными границами.

В простейшей задаче в качестве краевых условий,


определяющих класс допустимых функций, берется условие
закрепления концов.
Рассмотрим два примера вариационных задач с подвижными
границами, ограничившись функционалом, содержащим одну
функцию и первую производную.
1. Задача с подвижными концами.
b

Это – задача J [ y ] = ò f ( x, y, y ¢) dx ® extr , a, b - заданные числа,


a

y Î C [ a, b ] .
1

Краевые условия не заданы, т.е.


y ( a ) , y ( b) не заданы. С
геометрической точки зрения такая
задача состоит в определении
кривой – графика функции y = y ( x )
, концы которого расположены на
вертикальных прямых y = a, x = b
и для которой соответствующее
значение

31
функционала J [ y ] является экстремальным. Эту задачу называют
задачей с подвижными концами.
Для допустимой вариации h = h ( x ) аргумента y = y ( x ) условие
h ( a ) = 0, h ( b) = 0 теперь не требуется, так что допустимыми
вариациями аргумента являются любые функции h Î C [ a, b ] .
1

1.5.1. Теорема. (Необходимое условие экстремума в задаче с


подвижными концами).
Если допустимая функция y Î C [ a, b ] доставляет экстремум
1

функционалу J [ y ] = ò f ( x, y, y ¢) dx в задаче с подвижными концами,


a
то эта функция удовлетворяет уравнению Эйлера, и, кроме того,
так называемым естественным краевым условиям
f y¢¢ = 0, f y¢¢ = 0 .
x= a x= b
□ Как и в теореме 1.4.1, для упрощения доказательства добавим
условие: функция y = y ( x ) , доставляющая экстремум функционалу,
дважды непрерывно дифференцируема: y ( x ) Î C [ a, b ] вместо C [ a, b ]
2 1

(это используется при интегрировании по частям. Но теорема верна и


без этого дополнительного условия).
Согласно теореме 1.2.11 вариация d J [ y, h ] равна нулю при всех
допустимых h , в нашем случае – при всех h Î C [ a, b ] , так что
1

d J [ y, h ] = (*теорема 1.3.1*) = ò ( f ¢( x, y, y ¢) h +
y f y¢¢( x, y , y ¢) h ¢) dx = 0 .
a
Интегрируя по частям второе слагаемое, получаем
æ u = f y¢¢, h¢dx = dv ö÷
b çç ÷
b
d
ç ÷ b
ò y¢
f ¢×h ¢dx = çç * d
¢
* ÷
÷
÷
= f ¢
y¢ ×h a
- ò dx
f y¢¢ ×h dx . Значит,
a çè du = dx f y¢ ×dx, v = h ø÷ a

b
æ d ö÷
ç
ò ççè y¢ dx y¢ø÷÷h dx + f y¢¢ x= b ×h( b) - f y¢¢ x= a ×h ( a) = 0 .
f ¢ - f ¢
a

Это равенство верно при любой функции h Î C [ a, b ] , в


1

частности для функции h , у которой h ( a ) = h ( b) = 0 , и тем более для


любой такой бесконечно дифференцируемой функции h :
32
b
æ d ö÷
ç
ò ççè y dx y¢ø÷÷h dx = 0 .
f ¢ - f ¢
a
d
Но по лемме Лагранжа 1.1.2 f y¢- f y¢¢ º 0 на [ a, b ] , т.е. функция
dx
y = y ( x) удовлетворяет уравнению Эйлера. Значит, остается
равенство
f y¢¢ x= b ×h ( b) - f y¢¢ x= a ×h ( a ) = 0 ,
справедливое при любой функции h Î C [ a, b ] . В частности, оно верно
1

для функции h , у которой h ( a ) = 1, h ( b) = 0 :


f y¢¢ x= a = 0 ,
а также для функции h , у которой h ( a ) = 0, h ( b) = 1:
f y¢¢ x= b = 0 . ■
Можно рассматривать и «смешанную» задачу, в которой один
из концов закреплен, а другой конец свободно перемещается по
вертикальной прямой. Например, y ( a ) = y1 (задано), а правый конец
перемещается по прямой x = b . Это дает естественное краевое
условие
f y¢¢ x= b = 0 .
p
4
1.5.2. Пример J [ y ] = ò ( y¢ - y 2 + 4 y cos x) dx ® extr , y ( 0) = 0
2

0
(левый конец закреплен, правый подвижен).
d
□ Уравнение Эйлера: f y¢- f ¢¢ = 0 Û
dx y
d
Û - 2 y + 4cos x - ( 2 y ¢) = 0 Û
dx
Û y ¢¢+ y = 2cos x - линейное ДУ 2-го
порядка с постоянными коэффициентами с правой частью
специального вида.
Его общее решение: y = C1 cos x + C2 sin x + x sin x . Из краевого
условия y ( 0) = 0 находим 0 = C1 cos0 + C2 ×0 + 0 Þ C1 = 0 . На правом
конце естественное краевое условие имеет вид

33
f y¢¢ = 0 Û 2 y¢ = 0 Û y¢ = 0Û
x= p x= p x= p
4 4 4

Û - C1 sin x + C2 cos x + sin x + x cos x = 0Û


x= p
4
2 2 2 p 2
Û - C1 × + C2 + + = 0Û
2 2 2 4 2
2æçç0 + C2 + 1 + p ÷
ö p
Û ÷= 0 Û C = - 1 - .
2 çè 4 ø÷
2
4
æ pö
Имеется единственная экстремаль y = çççx - 1- ÷ ÷sin x .■
è 4 ø÷
2. Задача с подвижными границами.
x2

Рассмотрим функционал J [ y ] = ò f ( x, y, y ¢) dx , определенный


x1

на непрерывно дифференцируемых функциях y = y ( x) , у которых


концы графиков лежат на кривых y = j ( x ) и y = y ( x ) ( j ( x ) и y ( x ) -
тоже непрерывно дифференцируемые функции).

Например, если функция


y ( x ) такова, что
y ( x1 ) = j ( x1 ) , y ( x2 ) = y ( x2 ) ,
то для нее функционал
вычисляется по формуле
x2

J [ y] = ò f ( x, y, y ¢) dx , а если y ( x1¢) = j ( x1¢) , y ( x2¢) = y ( x2¢) , то по


x1
x2¢

формуле J [ y] = ò f ( x, y, y ¢) dx . Имеется в виду, что каждая


x1¢

допустимая функция непрерывна на своем отрезке [ x1 , x2 ] ,


содержащемся в отрезке [ a, b ] . Таким образом, пределы интеграла
меняются от функции к функции.
34
Требуется найти экстремум такого функционала.
Соответствующую теорему сформулируем без доказательства
(доказательство сложное).
1.5.3. Теорема (Необходимое условие экстремума в задаче с
подвижными границами).
Если допустимая функция y доставляет экстремум
функционалу
x2

J [ y] = ò f ( x, y, y ¢) dx (1)
x1

при краевых условиях y ( x1 ) = j ( x1 ) , y ( x2 ) = y ( x2 ) , то эта функция


y ( x ) является экстремалью функционала (1) (т.е. удовлетворяет
уравнению Эйлера для его интегранта f ( x, y, y ¢) ) и удовлетворяет
условиям трансверсальности
ìï f + ( j ¢- y ¢) f ¢
ïï y ¢ x= x1 = 0,
í (2)
ïï f + ( y ¢- y ¢) f ¢
ïî y ¢ x= x2 = 0

(Эти условия учитывают то, что концы кривой y = y ( x)


лежат на заданных кривых y = j ( x ) и y = y ( x ) ).
Таким образом, для решения этой задачи нужно:
1. Найти общее решение y = y ( x, C1 , C2 ) уравнения Эйлера (оно 2-го
порядка, поэтому две произвольные постоянные C1 и C2 ).
2. Из краевых условий y ( x1 , C1 , C2 ) = j ( x1 ) , y ( x2 , C1 , C2 ) = y ( x2 ) и из
условий трансверсальности (2) определить постоянные C1 , C2 и
неизвестные концы x1 , x2 .
3. Вычислить экстремум функционала (если есть уверенность, что
найденная функция y ( x ) действительно дает экстремум).
Можно рассматривать и «смешанную» задачу, в которой один из
концов закреплен или перемещается по вертикали, а второй конец
перемещается по графику какой-либо функции y = j ( x ) .
1.5.4. Пример. Найти кратчайшее расстояние между кривыми
y = x2 и x - y = 5 .

35
□ Задача состоит в нахождении минимума функционала
x2

J [ y] = ò 1 + y ¢2 dx (длина кривой y = y ( x ) ) при краевых условиях


x1

y ( x1 ) = j ( x1 ) , y ( x2 ) = y ( x2 ) , где j ( x ) = x 2 , y ( x ) = x - 5 .
Составим уравнение Эйлера:
d dæ ç y ¢ ö÷÷
f y¢- f y¢¢ = 0 Û - çç ÷+ 0= 0Û
dx ç
dx è 1 + y ¢ ø÷2 ÷
Û y ¢¢= 0 Его общее решение y = C1 x + C2
(прямая). Для нахождения C1 , C2 , x1 , x2
используем краевые условия:
ìï y ( x1 ) = C1 x1 + C2 = j ( x1 ) = x12 ,
ïí ,
ïïî y ( x2 ) = C1 x2 + C2 = y ( x2 ) = x2 - 5
и условия трансверсальности:
ìï æ
ïï ç y ¢ ö÷ ÷
ïï çç 1 + y ¢ + ( 2 x - y ¢)
2
÷ = 0,
ïï è ç 1 + y ¢ ø÷x= x 2 ÷
ïí æ ¢ ö
Û çç* y ¢= ( C1 x + C2 ) = C1 *÷
÷Û
1

ïï æ è ø
ïï çç y ¢ ö÷ ÷
ïï ç 1 + y ¢ + ( 1 - y ¢)
2
÷ = 0
2 ÷
ç
ïïî è 1 + y ¢ ø x= x ÷
2

ìï C1
ïï 1 + C12 + ( 2 x1 - C1 ) = 0,
ïï 1 + C1 2

Û ïí
ïï C1
ïï 1 + C1 + ( 1 - C1 )
2
= 0.
2
ïïî 1 + C1
ìï C x + C = x 2
,
ïï 1 1 2 1
ïï C1 x2 + C2 = x2 - 5,
ïï
ïï C1
Из системы уравнений í 1 + C 1
2
+ ( 2 x1 - C 1 ) 2
= 0,
ïï 1 + C1
ïï
ïï C1
ïï 1 + C 1
2
+ ( 1 - C1 ) 2
= 0.
ïî 1 + C1

36
3 1 23
находим C1 = - 1, C2 = , x1 = , x2 = .
4 2 8
3
Экстремаль: y = - x + . Она единственная, а по смыслу задачи
4
3
минимум имеется. Значит функция y = - x + и доставляет
4
экстремум функционалу. Найдем минимальное расстояние:
23 23
8 8
19 2
J min [ y ] = ò 1 + y ¢ dx = ( * y ¢= - 1 *) =
2
ò 2 dx = .■
1 1 8
2 2

1.6. Вариационные задачи на условный экстремум

В рассмотренных задачах решения должны были удовлетворять


некоторым краевым условиям. Но во многих приложениях
вариационного исчисления на решение задачи, кроме краевых
условий, накладываются некоторые дополнительные условия – так
называемые условия связи.
Пусть требуется найти экстремум функционала
b

J [ y ] = J [ y1 , y2 ,K , yk ] = ò f ( x y ,K , y , y ¢,K , y ¢) dx ,
1 1 k 1 k (1)
a
который будем называть целевым функционалом, на множестве
функций y1 ,K , yk Î C [ a, b ] , удовлетворяющих краевым условиям
1

y1 ( a ) = y11 y2 ( a ) = y21 K yk ( a ) = yk1


y1 ( b) = y12 y2 ( b) = y22 K yk ( b) = yk 2
и некоторым условиям связи, которые могут выражаться
дифференциальными уравнениями (их число m должно быть меньше
числа k функций)

37
ìï g1 ( x, y1 ,K , yk , y1¢,K , yk¢) = 0,
ïï
ïí K ( m < k) (2)
ïï
ïïî g m ( x, y1 ,K , yk , y1¢,K , yk¢) = 0
(производные y1¢,K , yk¢ могут не участвовать, тогда будут просто
функциональные уравнения g j ( x, y1 ,K , yk ) = 0, j = 1,2,K , m ), или
интегральными уравнениями
b

ò h ( x, y ,K , y , y ¢,K , y ¢) dx = L ,
1 1 k 1 k 1
a

... (3)
b

ò h ( x, y ,K , y , y ¢,K , y ¢) dx = L ,
s 1 k 1 k s
a

где L1 ,K , Ls - заданные числа.


Здесь предполагается, что функции f , gi , hi имеют непрерывные
частные производные до 2-го порядка включительно по всем своим
аргументам при x Î [ a, b ] и любых y1 ,K , yk , y1¢,K , yk¢.
Эта задача общего вида называется вариационной задачей на
условный экстремум. Если даны условия связи дифференциальными
(или функциональными) уравнениями (2), то это – задача Лагранжа,
если условия связи – интегральные уравнения (3) –
изопериметрическая задача (последнее название связано с тем, что
эта задача является обобщением старинной задачи Дидоны: среди
кривых с заданной длинной L (с равными – “изо” – периметрами)
найти ту, которая ограничивает на плоскости фигуру наибольшей
площади). Задача на условный экстремум может быть смешанной с
условиями связи обоих видов (2) и (3).
Функциональные условия связи g j ( x, y1 ,K , yk ) = 0 (не
содержащие производных) называются голономными связями в
отличие от дифференциальных связей.
Начнем с задачи Лагранжа. Сформулируем соответствующую
теорему без доказательства.
1.6.1. Теорема (необходимое условие экстремума в задаче
Лагранжа).
Пусть функционал от вектор - функции

38
b

J [ y ] = J [ y1 ,K , yk ] = ò f ( x, y ,K , y , y ¢,K , y ¢) dx ,
1 k 1 k
a

определенный на множестве функций y = ( y1 ,..., yk ) , где


y1 ,..., yk Î C1 [ a, b ] , удовлетворяющих краевым условиям
y1 ( a ) = y11 , y2 ( a ) = y21 ,..., yk ( a ) = yk1 ,
y1 ( b) = y12 , y2 ( b) = y22 ,..., yk ( b) = yk 2
и условиям связи: голономным
ìï g1 ( x, y1 ,..., yk ) = 0,
ïï
ïí L ( m < k) (4)
ïï
ïïî g m ( x, y1 ,..., yk ) = 0
или дифференциальным
ïìï g1 ( x, y1 ,..., yk , y1¢,..., yk¢) = 0,
ïï
í L (5)
ïï
ïï g m ( x, y1 ,..., yk , y1¢,..., yk¢) = 0
î
имеет в допустимой точке y = ( y1 ,..., yk ) экстремум.
o o o

Если матрица Якоби


æ¶ g1 ¶ g1 ¶ g1 ö÷
çç L ÷
çç ¶ y1 ¶ y2 ¶ yk ÷÷
÷
çç ÷
÷
( J ) = çç L ÷
÷
çç ÷
çç¶ g m ¶ gm ¶ gm ÷÷
÷
ççè ¶ y L ÷
1 ¶ y2 ¶ yk ø÷
в случае голономных связей (4),
æ¶ g1 ¶ g1 ¶ g1 ö÷
çç L ÷
çç ¶ y1¢ ¶ y2¢ ¶ yk¢ ÷÷
÷
çç ÷
÷
( J ) = çç L ÷
÷
çç ÷
çç¶ g m ¶ gm ¶ gm ÷ ÷
÷
ççè ¶ y ¢ L ÷
1 ¶ y2¢ ¶ yk¢ ø÷
в случае дифференциальных связей (5) после подстановки y1o ,..., yko
вместо функций y1 ,K , yk имеет ранг m (т.е. в матрице имеется
хотя бы один отличный от нуля минор m - го порядка – по числу
39
уравнений связи), то существуют такие функции l 1 ( x) ,K , l m ( x ) ,
определенные на отрезе [ a, b ] , что функция y = ( y1 ,..., yk ) является
o o o

экстремалью вспомогательного функционала


b

J1 [ y ] = J1 [ y1 ,K , yk ] = ò L ( x, y ,K , y , y ¢,K , y ¢) dx ,
1 k 1 k
a
интегрантом которого является функция Лагранжа
L ( x, y1 ,K , yk , y1¢,K , yk¢) = f + l 1 g1 + l 2 g 2 + K + l m g m (функции
l 1 ( x) ,K , l m ( x ) называется множителями Лагранжа).

1.6.2. Пример. Типичным примером является задача о


геодезических линиях: на поверхности g ( x, y, z ) = 0 найти
геодезическую линию, соединяющую точки ( x1 , y1 , z1 ) и ( x2 , y2 , z2 )
(т.е. линию наименьшей длины).
Если линию искать в виде
ìï y = y ( x )
ïí , т.е. как линию
ïï z = z ( x )
î
пересечения цилиндрических
поверхностей y = y ( x ) и z = z ( x ) ,
то, используя её параметрическое
представление (за параметр
возьмем x )
ìï x = x,
ïï
ïí y = y ( x) , x Î [ x1 , x2 ]
ïï
ïï z = z ( x ) ,
î
x2

получим ее длину ò 2
xx¢2 + y x¢2 + z x¢2 dx , так что имеем задачу
x1
x2

J [ y, z ] = ò 1 + y ¢2 + z ¢2 dx ® min при краевых условиях


x1

y ( x1 ) = y1 , y ( x2 ) = y2 , z ( x1 ) = z1 , z ( x2 ) = z2 и при одном голономном


условии связи g ( x, y, z ) = 0 (которое означает, что искомая линия

40
должна лежать на поверхности: g ( x, y ( x ) , z ( x ) ) º 0 ). При решении
этой задачи получается сложная система дифференциальных
уравнений с неизвестными функциями l ( x ) (множитель Лагранжа),
y ( x ) , z ( x ) . Мы для демонстрации решения задачи Лагранжа возьмем
более простой пример.

1.6.3. Пример
1

ò ( xy ¢+
1 y2¢y3¢) dx ® extr , y1 ( 0) = 0, y1 ( 1) = 1, y2 ( 0) = 2, y2 ( 1) = 0,
0

2
y3 ( 0) = 0, y3 ( 1) = , y1¢= y2 , y3¢= y1.
3
□ Условия связи (дифференциальные) имеют вид
y1¢- y2 = 0, y3¢- y1 = 0 так что
g1 ( x, y1 , y2 , y3 , y1,¢y2¢, y3¢) = y1¢- y2 , g 2 ( x, y1 , y2 , y3 , y1,¢y2¢, y3¢) = y3¢- y1 .
Матрица Якоби
æ¶ g1 ¶ g1 ¶ g1 ö÷
çç ÷
çç ¶ y1¢ ¶ y2¢ ¶ y3¢÷ ÷ æ1 0 0ö÷ 1 0
çç ÷
÷ = ç
çç ÷ имеет ранг 2 (минор ¹ 0 ).

çç 2 g ¶ g ¶ g ÷ è0 0 1ø÷ 0 1
2 2÷÷
çç ¢ ÷
è ¶ y1 ¶ y2¢ ¶ y3¢ø÷
Составляем функцию Лагранжа
L = xy1¢+ y2¢y3¢+ l 1 ( y1¢- y2 ) + l 2 ( y3¢- y1 ) , составляем систему
уравнений Эйлера для вспомогательного функционала с интегрантом
L:
ìï d ìï d
ïï Ly¢1 -
ïï dx
( Ly¢1¢) = 0, ïï - l 2 -
ïï dx
( x + l 1 ) = 0,
ïï ï ïìï l 2 + 1 + l 1¢= 0,
ïí L ¢ - d ( L ¢ ) = 0, Û ïïí - l - d ( y ¢) = 0, Û ïíï l + y ¢¢= 0,
ïï y2 dx y2¢ ïï 1 dx 3 ïï 1 3

ïï ïï ïïî y2¢+ l 2 = C1.


ïï L ¢ - d ( L ¢ ) = 0 ïï 0 - d ( y ¢+ l ) = 0.
ïîï y3 dx y3¢ ïîï dx
2 2

Присоединив условия связи, получим систему уравнений для


отыскания неизвестных функций l 1 ( x ) , l 2 ( x) , y1 ( x ) , y2 ( x) , y3 ( x ) :

41
ìï l 2 + 1 + l 1¢= 0,
ïï
ïï l 1 + y3¢¢= 0,
ïï
í y2¢+ l 2 = C1 ,
ïï
ïï y1¢- y2 = 0,
ïï
ïïî y3¢- y1 = 0.
Функции l 1 ( x ) и l 2 ( x) сыграли свою роль для получения этой
системы. Больше они не нужны (важно лишь, что они существуют).
Поэтому исключим их из системы: учитывая, что
l 1 = - y3¢¢, l 2 = - 1 - l 1¢= - 1 + y3¢¢,¢ получим систему
ìï y2¢- 1 + y3¢¢¢= C1 ,
ïï
ïí y ¢- y = 0,
ïï 1 2

ïïî y3¢- y1 = 0.
Отсюда находим
y3¢¢¢= C1 Þ y3 = C1 x 3 + C2 x 2 + C3 x + C4 , y1 = 3C1 x 2 + 2C2 x + C3 ,
y2 = 6C1 x + 2C2 .

Используем краевые условия:


y1 ( 0) = C3 = 0, y1 ( 1) = 3C1 + 2C2 = 1, y2 ( 0) = 2C2 = 2, y2 ( 1) = 6C1 + 2C2 = 0,
2
y3 ( 0) = C4 = 0, y3 ( 1) = C1 + C2 = .
3
1
Отсюда C1 = - , C2 = 1, C3 = 0, C4 = 0.
3
Нашли единственную экстремаль
æ ö÷
çç 2
æy1 ö÷ ç- x + 2 x ÷ ÷
÷
çç ÷ ç ÷
÷ ç ÷
y = çç y2 ÷ ÷= ç
ç - 2 x + 2 ÷
÷.
çç ÷ ç ÷
÷
çè y3 ø÷
÷ çç 1 3 2÷
çç- x + x ÷ ÷
è 3 ø÷
Рассмотрим теперь изопериметрическую задачу.

1.6.4. Теорема (необходимое условие экстремума в


изопериметрической задаче).
Пусть функционал от вектор-функции
42
b

J [ y ] = J [ y1 ,K , yk ] = ò f ( x, y ,K , y , y ¢,K , y ¢) dx,
1 k 1 k (6)
a

определенный на множестве функций y = ( y1 ,K , yk ) , где


y1 ,K , yk Î C1 [ a, b ] , удовлетворяющих краевым условиям
y1 ( a ) = y11 , y2 ( a) = y21 ,K , yk ( a ) = yk1 ,
(7)
y1 ( b) = y12 , y2 ( b) = y22 ,K , yk ( b) = yk 2
и интегральным условиям связи
b

ò h ( x , y ,K , y ,
1 1 k y1¢,K , yk¢) dx = L1 ,
a

... (8)
b

ò h ( x, y ,K , y ,
s 1 k y1¢,K , yk¢) dx = Ls ,
a

где L1 ,K , Ls - заданные числа ( s < k не требуется), имеет в


допустимой точке y = ( y1 ,K , yk ) экстремум.
0 0 0

Тогда существуют такие числа l 1 ,K , l s , что функция


y 0 = ( y10 ,K , yk0 ) является экстремалью вспомогательного
функционала
b

J1 [ y ] = ò L( x, y ,K , y , y ¢,K , y ¢) dx
1 k 1 k
a
интегрантом которого является функция Лагранжа
L ( x, y1 ,K , yk , y1¢,K , yk¢) = f + l 1h1 + l 2 h2 + K + l s hs (числа l 1 ,K , l s
называются множителями Лагранжа).
□ Сведем изопериметрическую задачу к задаче Лагранжа.
x

Введем функции j i ( x ) = ò h ( x , y ,K , y ,
i 1 k y1¢,K , yk¢) dx, i = 1,2,K , s , и
a
будем рассматривать функционал (6) как функционал от k + s -
мерной вектор-функции
b

J%[ y1 ,K , yk , j 1 ,K , j s ] = ò f ( x, y , K , y ,1 k y1¢,K yk¢) dx = J [ y1 ,K , yk ] (9)


a

43
(который от j 1 ,K , j s фактически не зависит), определенный на
множестве функций z = ( y1 ,K , yk , j 1 ,K , j s ) , где
y1 ,K , yk , j 1 ,K , j s Î C 1 [ a, b ] (так как функции hi непрерывны по x , то
¢
æx ö÷
j i¢( x ) = çççò hi ( K ) dx÷÷ = hi ( K ) непрерывны на [ a, b ] , т.е. все
çè a ÷
øx
j i Î C1 [ a, b ] ). Функции z = ( y1 ,K , yk , j 1 ,K , j s ) удовлетворяют
краевым условиям
y1 ( a ) = y11 , K yk ( a ) = yk1 , j 1 ( a ) = 0, K j s ( a ) = 0,
(10)
y2 ( a ) = y12 , K yk ( b) = yk 2 , j 1 ( b) = L1 , K j s ( b ) = Ls
и условиям связи
j 1¢= h1 ( x, y1 ,..., yk , y1¢,..., yk¢) ,
...
j s¢= hs ( x, y1 ,..., yk , y1¢,..., yk¢) ,
т.е. дифференциальным условиям связи
ìï g1 ( x, y1 ,..., yk , j 1 ,..., j s , y1¢,..., yk¢, j 1¢,..., j s¢) = 0,
ïï
ïí ... ( s < k + s !) (11)
ïï
ïï g s ( x, y1 ,..., yk , j 1 ,..., j s , y1¢,..., yk¢, j 1¢,..., j s¢) = 0
î
где
gi ( x, y1 ,..., yk , j 1 ,..., j s , y1¢,..., yk¢, j 1¢,..., j s¢) = hi ( x, y1 ,..., yk , y1¢,..., yk¢) - j i¢,
i = 1, 2,..., s.
Таким образом, если функция y = ( y1 ,.., yk ) удовлетворяет
краевым условиям (7) и интегральным условиям связи (8), то
функция z = ( y1 ,.., yk , j 1 ,..., j s ) удовлетворяет краевым условиям (10)
и дифференциальным условиям связи (11). При этом, если при
y o = ( y1o ,.., yko ) функционал (6) имеет экстремальное значение
J éëy1o ,.., yko ùû, то при z o = ( y1o ,.., yko , j 1o ,..., j so ) , где
x

j ( x) =
o
i ò
a
( )
f x, y1o ,.., yko , y1o¢,..., yko¢ dx, функционал (9) имеет

экстремальное значение (то же самое)

44
J%éëy1o ,.., yko , j 1o ,..., j so ù
û= J éy1o ,.., yko ù (так как функционал не содержит
ë û
j 1 ,..., j s ).
Итак, если y o = ( y1o ,.., yko ) является решением
изопериметрической задачи (6)-(7)-(8), то z = ( y1 ,.., yk , j 1 ,..., j s )
o o o o o

является решением задачи Лагранжа (9)-(10)-(11) и можно применить


теорему 1.6.1.
Матрица Якоби
æ¶ g1 ¶ g1 ¶ g1 ¶ g1 ¶ g1 ö÷
çç L K ÷
çç ¶ y1¢ ¶ y2¢ ¶ yk¢ ¶ j 1¢ ¶ j s¢÷
÷
÷
çç ÷
÷
( J ) = çç K ÷
÷=
çç ÷
÷
çç¶ g s ¶ g s K ¶ g s ¶ g s K ¶ g s ÷ ÷
ççè ¶ y ¢ ¶ y ¢ ÷
÷
1 2 ¶ y ¢
k ¶ j 1
¢ ¶ j ¢

æ¶ g1 ¶ g1 ö
çç K - 1 0 K 0÷ ÷
çç ¶ y1¢ ¶ yk¢ ÷
÷
ç ÷
÷
= ççç K ÷
÷
÷
çç ÷
÷
çç¶ g s K
¶ gs
0 0 K - 1÷
÷
çèç ¶ y ¢ ÷
÷
¶ yk¢
1 ø
имеет, очевидно, ранг, равный s (числу условий связи), так как минор
- 1 0 K 0 0
s
s -го порядка 0 - 1 K 0 0 = ( - 1) ¹ 0 .
0 0 K 0 - 1
Условия теоремы 1.6.1 выполнены. Значит, функция
z o = ( y1o ,.., yko , j 1o ,..., j so )
является экстремалью вспомогательного функционала с интегрантом
L%= f ( x, y1 ,..., yk , y1¢,..., yk¢) + l 1 g1 + ... + l s g s , где l 1 ( x) ,..., l s ( x ) -
множители Лагранжа. Это означает, что функция z o удовлетворяет
системе уравнений Эйлера
ìï % d %
ïï Ly¢i -
ï
( L¢¢) = 0, i = 1,2,..., k ,
dx yi
í
ïï % d %
L
ïï j j
ïî
¢ -
dx j j
( )
L ¢! = 0, j = 1,2,..., s.

45
Здесь
¢ ¢ ¢
L%y¢i = f y¢i + l 1 ( h1 ) y + K + l s ( hs ) y = ( f + l 1h1 + ... + l s hs ) y = Ly¢i ,
i i i

¢ ¢ ¢
L%y¢i¢ = f y¢i¢ + l 1 ( h1 ) y¢ + K + l s ( hs ) y¢ = ( f + l 1h1 + ... + l s hs ) y¢ = Ly¢i¢;
i i i

Кроме того,
d d
L%j¢j = 0, L%j¢¢j = l j ( - 1) Þ 0 - ( - l j) = 0Þ ( l j ) = 0 Þ l j = const .
dx dx
Таким образом, существуют постоянные числа l 1 ,..., l s такие,
что выполнены уравнения Эйлера для функции Лагранжа
L = f + l 1h1 + ... + l s hs :
ìï d
ïï Ly¢1 -
ïï
( L¢¢) = 0,
dx y1
ïí ...
ïï
ïï d
L
ïï yk
î
¢ -
dx
( Ly¢k¢ ) = 0

(после подстановки y1 ,... yk ; здесь j 1o ,...j so не участвуют). ■


o o

1.6.5. Пример (Задача Дидоны). В IX веке до н.э. финикийская


царевна Дидона со своими спутниками, спасаясь от преследования
тирской знати, бежала из города Тира и высадилась на африканском
берегу Средиземного моря. Решив поселиться здесь, Дидона
упросила местных жителей отдать в ее распоряжение участок земли,
который можно охватить шкурой быка. Простодушный правитель тех
мест не понял подвоха и согласился отдать участок земли, который
по его разумению, должен был по площади быть равным площади
расправленной шкуры быка. Дидона же разрезала шкуру быка на
тонкие полоски, связала их в длинный ремень и ограничила им
довольно значительную территорию на берегу моря. Так был заложен
город Карфаген (который впоследствии был разрушен римлянами).
Задача, которую поставила Дидона, может быть
сформулирована следующим образом. Найти такую гладкую кривую
в верхней полуплоскости, проходящую через точки ( - a,0) и ( a,0) и
имеющую данную длину 2l ( l > a ) , которая охватывала бы вместе с
отрезком [ - a, a ] максимальную площадь:

46
a

J [ y] = ò y ( x) dx ® max, y ( - a ) = 0, y ( a ) = 0.
- a
a

K [ y] = ò 1 + y ¢2 dx = 2l ( yÎ C 1 [ - a, a ]) .
- a

Функция Лагранжа L = y + l 1 + y ¢2 .
Уравнение Эйлера
d dæ çç y¢ ö÷
÷ dæ çç y¢ ö÷
÷
Ly¢- Ly¢¢ = 0 Û 1- l ÷= 0Û ççl ÷= 1 Þ
dx dx ççè 2 ÷
1+ y¢ ø ÷ dx è
2 ÷
1 + y ¢ ø÷
l y¢
Þ = x + C1
1 + y ¢2
2 2 2
Þ y = ± l 2 - ( x + C1 ) + C2 Þ ( x + C1 ) + ( y + C2 ) = l 2 .
Экстремалями являются окружности. Из краевых условий
y ( - a ) = 0, y ( a ) = 0 находим:
2 2
( - a + C1 ) + C2 2 = l 2 , ( a + C1 ) + C2 2 = l 2 Þ C1 = 0 , l 2 = a 2 + C2 2 , и
2
уравнение окружности имеет вид x 2 + ( y + C2 ) = a 2 + C2 2 .
Выразив отсюда y = y ( x , C2 ) ,
a

вычислив ò y ( x, C ) dx
2 и приравняв
- a
результат к 2l , получим одно уравнение
с неизвестным C2 (получается
трансцендентное уравнение, которое
можно решить только приближенно).
Вычислив C2 , получим уравнение
конкретной
окружности. Так как по смыслу задачи максимум есть, а экстремаль
только одна, то дуга найденной окружности и будет точкой
максимума.
1.6.6. Пример.
1

J [ y1 , y2 ] = ò y ¢×y ¢dx ® extr , y ( 0) =


1 2 1 y2 ( 0) = y1 ( 1) = 0 y2 ( 1) = 1
0

47
1 1

ò xy dx = 0, ò xy dx = 0 .
1 2
0 0

□ L = y1¢×y2¢+ l 1 xy1 + l 2 xy2 .


1) Уравнения Эйлера:
ìï d
ïï l 1 x - ( y2¢) = 0, ïì y ¢¢= l x,
ï dx
Þ ïí 2 1
í
ïï d ï y ¢¢= l x,
ïï l 2 x - ( y1¢) = 0, ïî 1 2
ïî dx
ìï l
ïï y1 = 2 x3 + C1 x + C2 ,
ïí 6
ïï l1 3
ïï y2 = x + C3 + C4 .
ïî 6
2) Определим l 1 и l 2 :
1 1
æl 2 3 ö
÷ l 2 C1 C2
ç
ò xy1 dx = 0 : ò çè 6
x ç x + C1 x + C 2 ÷
÷
ø
dx =
30
+
3
+
2
= 0 , откуда
0 0
l 2 = - 10C1 - 15C2 ,
1 1
æl 1 3 ö÷ l 1 C3 C4
ç
ò xy 2 dx = 0 :ò çè 6
x ç x + C3 x + C4
ø
÷
÷dx =
30
+
3
+
2
= 0 ,откуда
0 0
l 1 = - 10C3 - 15C4 .
3) Решение уравнений Эйлера:
æ 5 ö æ 5 3 ö÷
y1 = ççx - x 3 ÷ ÷
÷ C + çç1- x ÷C2 ,
çè 3 ø
1
èç 2 ø÷
æ 5 ö æ 5 3 ö÷
y2 = çççx - x 3 ÷ ÷
÷ C + çç1- x ÷C4 .
è 3 ø
3
èç 2 ø÷
4) Найдем постоянные
y1 ( 0) = 0 : C2 = 0, y2 ( 0) = 0 : C4 = 0,
æ 5 ö÷
y1 ( 1) = 0 : çç1 - ÷C1 = 0, C1 = 0,
çè 3 ø÷
æ 5 ö÷ 3
y2 ( 1) = 1: ççç1 - ÷C = 1, C = - .
3 ø÷
3 3
è 2
5 3 3
Экстремаль: y1 = 0, y2 = x - x. ■
2 2
48
II. Элементы оптимального управления

2.1. Постановка задачи оптимального управления

Будем рассматривать объект, состояние которого в


фиксированный момент времени описывается набором из n чисел
x1 , x2 ,K , xn . Например, если объект есть движение материальной
точки в пространстве, то x1 , x2 , x3 - координаты точки; если объект –
электрическая цепь, то x1 , x2 ,K , xn - напряжения или токи в
различных участках цепи, если объект – течение химической
реакции, то x1 , x2 ,K , xn - количества различных ингредиентов,
катализаторов. Эти числа называют координатами фазового
æx1 ö÷
çç ÷
состояния, вектор x = ççL ÷ ÷ называется фазовым вектором.
çç ÷ ÷
n
çèx ø÷
÷
Состояние объекта в каждый момент времени можно изобразить
точкой (вектором) n - мерного арифметического пространства R n ,
которое называется фазовым пространством.
Движение объекта (например, течение химической реакции)
проявляется в том, что его фазовые координаты меняются с течением
времени t , т.е. фазовый вектор является вектор – функцией
æx1 ( t ) ö÷
çç ÷
÷
x = x ( t ) = çççL ÷ ÷. При движении объекта фазовая (т.е.
çç ÷
÷
çèxn ( t ) ø÷
изображающая) точка x ( t ) описывает в фазовом пространстве R n
кривую – фазовую траекторию. Обычно фазовые координаты
49
являются инерционными (меняются плавно), так что вектор –
функция x ( t ) непрерывна.
Пусть множество S Ì R n представляет собой совокупность всех
фазовых состояний ( x1 , x2 ,K , xn ) , в которых объекту разрешается
находиться. Тогда при движении объекта его состояние x ( t ) в
каждый момент времени t должно подчиняться условию
x ( t ) Î S Ì Rn ,
которое называется фазовым ограничением.
Предположим, что объект находится под воздействием
управления, параметры которого в каждый момент времени
описываются набором из r чисел u1 , u2 ,K , ur (например, углы
поворота рулей, мощность двигателя; в химической реакции –
количество добавляемых или убираемых ингредиентов, и т.д.). Этот
æu1 ö÷
çç ÷
набор чисел составляет вектор управления u = ççL ÷ ÷, его можно
çç ÷ ÷
çèu ø÷
r
÷
изобразить точкой (или вектором) r - мерного пространства R r .
æu1 ( t ) ö÷
çç ÷
ç ÷
Управление - вектор – функция u = u ( t ) = ççL ÷ ÷- обычно является
çç ÷
÷
çèur ( t ) ø÷
кусочно-непрерывной функцией (может иметь конечное число
скачков в моменты переключения управления). Параметры
управления не могут быть совершенно произвольными из-за
конструктивных особенностей объекта, ограниченности ресурсов,
условий эксплуатации объекта. Это значит, что в пространстве R r
управляющих параметров выделяется некоторое множество U ,
называемое областью управления. В любой момент времени точки
u ( t ) должны принадлежать этому множеству:
u ( t) Î U Ì Rn .

50
Это условие называется
ограничением на управление.
Кусочно–непрерывные функции
управления u ( t ) , значения которых
попадают в область управления,
называется допустимыми
управлениями. В дальнейшем имеем
в виду допустимые управления.
Чтобы указать, как именно фазовая траектория объекта x ( t )
определяется по выбранному управлению u ( t ) , надо задать закон
движения объекта (управляемой системы). Будем предполагать, что
закон движения объекта задается системой обыкновенных
дифференциальных уравнений
æx1¢ö÷ æ f t , x , u ) ö÷ ìïï x1¢= f1 ( t , x1 ,K , xn , u1 ,K , ur ) ,
çç ÷ çç 1 ( ÷ ïï
÷
x ¢= f ( t , x , u ) Û ççL ÷ ÷ = çç L ÷
÷Û í L (1)
çç ÷ ÷ çç ÷
÷ ï
çèxn¢ø÷
÷ ççè f n ( t , x , u ) ø÷ ïï xn¢= f n ( t , x1 ,K , xn , u1 ,K , u r ) ,
ïî
æf1 ( t , x1 ,K , xn , u1 ,K , ur ) ö÷
çç ÷
ç ÷
÷
где f ( t , x , u ) = çç L ÷
÷
- известная вектор – функция,
çç ÷
çè f n ( t , x1 ,K , xn , u1 ,K , ur ) ø÷
непрерывная как функция n + r + 1 переменных и имеющая
непрерывные частные производные по фазовым переменным
x1 , x2 ,K , xn .
æu1 ( t ) ÷ ö
çç ÷
÷
При фиксированном допустимом управлении u ( t ) = çççL ÷ ÷
çç ÷
÷
çèur ( t ) ÷
ø
система (1) превращается в нормальную систему обыкновенных
дифференциальных уравнений с n неизвестными функциями
æx1 ( t ) ö÷
çç ÷
÷
x1 ( t ) , x2 ( t ) ,K , xn ( t ) . Её решение x ( t ) = çççL ÷ ÷ называется фазовой
çç ÷
÷
èxn ( t ) ø÷
траекторией, соответствующей выбранному управлению u ( t ) .

51
Говорят, что управление u ( t ) , определенное на отрезке времени
æx11 ÷ö
çç ÷
[ t1 , t2 ] , переводит объект (1) из фазового состояния x 1 = çççL ÷÷÷ в
ç 1÷ ÷
çèxn ÷
ø
æx12 ö÷
çç ÷
÷
фазовое состояние x = çççL ÷
2
÷, если соответствующая этому
ç 2÷ ÷
çèxn ø÷
управлению фазовая траектория – решение системы (1) с начальным
условием x ( t1 ) = x 1 удовлетворяет фазовому ограничению
( " t Î [ t1 , t2 ]) éëx ( t ) Î S Ì R n ùû и в момент времени t2 попадает в фазовое
состояние x ( t2 ) = x . Таким образом, задача управления состоит в
2

том, чтобы найти какое–нибудь допустимое управление u ( t )


(кусочно – непрерывную функцию из области управления
U : ( " t Î [ t1 , t2 ]) éëu ( t ) Î U Ì R r ùû), чтобы задача (1) с краевыми
условиями x ( t1 ) = x , x ( t2 ) = x , т.е. задача
1 2

x ¢= f ( t , x , u ) , x ( t1 ) = x 1 , x ( t2 ) = x 2 (2)
имела решение x = x ( t ) , удовлетворяющее фазовому ограничению
( " t Î [ t1 , t2 ]) éëx ( t ) Î S Ì R n ùû.
Если эта задача имеет решение при любых краевых условиях
(т.е. всегда найдется допустимое управление u ( t ) , переводящее
объект (1) из любого состояния x 1 в любое другое состояние x 2 ), то
говорят, что система (2) управляема.
Если система (2) управляема, то обычно она имеет бесконечно
множество решений: имеется бесконечно множество допустимых
управлений, переводящих объект (1) из фазового состояния x 1 в
фазовое состояние x 2 по различным траекториям x = x ( t ) . Поэтому
ставится задача оптимального выбора: среди допустимых
управлений, решающих задачу (2), выбрать такое, при котором
управляемый процесс будет наилучшим в каком – либо смысле.
Другими словами, если качество процесса оценивается некоторой
числовой характеристикой (себестоимость, время процесса и т.п.), то

52
задача заключается в том, чтобы выбором подходящего управления
обеспечить максимальное или минимальное значение этой числовой
характеристики. Такую числовую характеристику называют
критерием качества. Значение критерия качества определяется
фазовой траекторией x ( t ) и управлением u ( t ) : это – число, зависящее
от функций x ( t ) , u ( t ) , т.е. функционал J [ x , u ] = J [ x1 ,K xn , u1 ,K , ur ] .
Задача оптимального управления состоит в отыскании
управления u ( t ) , обеспечивающего экстремум этого функционала:
x ¢= f ( t , x , u ) , x ( t1 ) = x 1 , x ( t2 ) = x 2 , J [ x , u ] ® extr .
Управление u ( t ) , обеспечивающее экстремум критерия качества
J [ x , u ] , называется оптимальным управлением, а соответствующая
этому уравнению фазовая траектория x = x ( t ) - оптимальной
траекторией.
Наиболее широко используется интегральные критерии качества
– функционалы вида
t2

J [ x ,u ] = ò f 0 ( t , x , u ) dt ,
t1

где f ( t , x , u ) имеет такие же свойства, как и fi ( t , x , u ) (в смысле


0

непрерывности и дифференцируемости).

2.2. Линейная стационарная задача


оптимального быстродействия.

Мы рассмотрим только случай, когда закон движения (т.е.


система дифференциальных уравнений) x ¢= f ( t , x , u ) не содержит
явно время t :
x ¢= f ( x , u ) (1)
(время t скрыто в функциях x ( t ) и u ( t ) ). В этом случае скорость x ¢ в
точке x не зависит от времени. Поэтому, отправляясь из этой точки в
разные моменты времени t1 и t2 , за один и тот же промежуток
времени точка опишет одну и ту же траекторию и попадет в одну и ту
же точку (так ведут себя, например, частицы жидкости при
установившемся течении). Система дифференциальных уравнений
53
(1), не содержащее явно время t , называется стационарной или
автономной системой.
Кроме того, мы рассмотрим случай, когда система (1) линейная
(первой степени относительно переменных x1 ,K , xn , u1 ,K , ur ):
æx1¢ö÷ æf1 ( x1 ,K , xn , u1 ,K , ur ) ö÷
çç ÷ çç ÷
x ¢= f ( x , u ) Û ççL ÷ ÷= çç L ÷
÷=
çç ÷ ÷ ç ÷
÷
÷ ççè f n ( x1 ,K , xn , u1 ,K , ur ) ø÷
çèxn¢ø÷ ÷
æa11 x1 + K + a1n xn + b11u1 + K + b1r ur ö÷ æ x1¢ö÷ æ a11 K a1n öæ
÷ x1 ö÷
çç ÷ ç
çç ÷ ç
çç ÷ ç
çç ÷
= çç L ÷
÷Û L ÷
÷= L ÷
÷ L÷ ÷+
çç ÷ ç
çç ÷ ÷ ç
ç ÷ ç
ç ÷
÷ ÷ ÷
çèan1 x1 + K + ann xn + bn1u1 + K + bnr ur ø÷ çèxn¢ø÷ ÷ èççan1 K amn øè÷ççx ø÷
n

æb11 K b1r öæ ö
çç ÷
÷ ççu1 ÷
÷
+ çç L ÷ ÷
÷
ççL ÷
÷Û x ¢= Ax + Bu ,
çç ÷çç ÷ ÷
çèb K b øè
n1
÷çu ø÷
nr r

æa11 K a1n ö÷
çç ÷
где A = çç L ÷
÷- известная постоянная n ´ n - матрица,
çç ÷
÷
çèa K a ø÷
n1 nn

æb11 K b1r ö÷
çç ÷
B = çç L ÷ ÷
÷- известная постоянная n ´ r - матрица (матрица
çç ÷
çèb K b ø÷
n1 nr

управления).
Таким образом, мы рассматриваем линейную стационарную
задачу
x ¢= Ax + Bu , x ( t1 ) = x 1 , x ( t2 ) = x 2
(2)
( " t Î [ t , t é
2 ) ë
] x ( t ) Î S Ì R n
, u ( t ) Î U Ì R rù
û
где x ( t ) - искомая n - мерная вектор-функция, непрерывная с
кусочно-непрерывной производной, u ( t ) - r - мерное кусочно-непре-
рывное управление.
Сформулируем без доказательства критерий управляемости
задачи (2).
2.2.1. Теорема (критерий Калмана)

54
Линейная стационарная задача (2) управляема (т.е. найдется
допустимое управление u ( t ) , переводящее объект (1) из состояния
x ( t1 ) = x 1 в состояние x ( t2 ) = x 2 при любых x 1 , x 2 Î S ) тогда и
только тогда, когда
rg ( B, AB, A2 B,K , An- 1B) = n .
Под матрицей ( B, AB, A B,K , A B) понимается матрица,
2 n- 1

полученная приписыванием справа к матрице B элементов матрицы


AB (с сохранением порядка элементов), затем элементов матрицы
A2 B = A( AB ) и т.д.
Пример. Проверим управляемость задачи
æx1¢÷ ö
çç ÷ æ öæx1 ÷ö æ0 0ö÷
çç 0 1 0÷ ç çç æu1 ÷ ö
ççx2¢÷= çç- 1 0 1÷ççx2 ÷+ çç2 0÷
÷ ÷
÷ ç ÷
÷ ÷
֍
çç ÷ .
çç ÷ ÷ ç
ç
÷
÷ ç ÷
÷ ç ÷
÷ èu ÷
ø
çè x ¢÷
ø çè 0 0 0øè
÷ ÷çç x ÷
ø ççè0 2ø÷
2
3 3

Здесь n = 3 (r = 2) ,
æ0 1 0ö÷ æ0 0ö÷
çç ÷ çç ÷
A = çç- 1 0 1÷÷, B = çç2 0÷ ÷.
çç ÷
÷ ç ÷
÷
çè 0 0 0ø÷ ççè0 2ø÷

Составим матрицу ( B, AB, A B) :


2

æ 0 1 0öæ ÷ 0 0ö÷ æ 2 0ö÷


çç ÷çç ÷ çç ÷
AB = çç- 1 0 1÷ ÷
÷
çç2 0÷÷
÷= çç0 2÷÷
÷,
çç ÷ ç ÷ ç
÷çç0 2ø÷ èçç0 0ø÷÷
çè 0 0 0øè
æ 0 1 0öæ ÷ ö æ0
2 0÷ 2ö
÷
çç ÷ ç
çç ÷ çç ÷
ç
A B = A( AB ) = ç- 1 0 1÷
2 ÷ ÷= çç- 2 0÷
çç ÷ çç0 2÷
÷ çç
÷
÷,
÷
÷çç0 0÷ ÷ ÷
÷
çè 0 0 0øè ø çè 0 0ø
æ0 0 2 0 0 2÷ ö æ2 0 0 2 - 2 0ö÷
çç ÷ çç ÷
( B, AB, A B) = çç2 0 0 2 - 2 0÷÷÷~ ççç0
2 ç ÷ 2 0 0 0 0÷ ÷Þ
÷
÷
ççè0 2 0 0 0 0÷ ø èçç0 0 2 0 0 2ø÷
Þ rg ( B, AB, A2 B) = 3.
Задача управляема.

55
В качестве критерия качества будем брать интегральный
критерий
t2

J [ x ,u ] = òf
o
( t , x , u ) dt ® min
t1

с подынтегральной функцией f ( t , x , u ) º 1 :
o

t2

ò dt = t 2 - t1 ® min- критерий оптимального быстродействия.


t1

Для линейной стационарной задачи оптимального


быстродействия
x ¢= Ax + Bu , x ( t1 ) = x 1 , x ( t2 ) = x 2 , t2 - t1 ® min
( " t Î [ t1 , t2 ]) éëx ( t ) Î S Ì R n , u ( t ) Î U Ì R r ùû
сформулируем принцип максимума Понтрягина. В этой задаче t1 -
фиксированный начальный момент времени, конечный момент
времени t2 не фиксирован: его предстоит найти так, чтобы
промежуток времени t2 - t1 , в течение которого объект перейдет из
состояния x ( t1 ) = x в состояние x ( t2 ) = x , был минимальным (это
1 2

достигается за счет выбора оптимального управления u ( t ) ).

2.2.2. Определение.
Пусть дана однородная линейная система дифференциальных
уравнений
ïìï x1¢( t ) = a11 x1 ( t ) + K + a1n xn ( t ) ,
ï
x ¢= Ax Û ïí L где
ïï
ïïî xn¢( t ) = an1 x1 ( t ) + K + ann xn ( t ) ,
æa11 K a1n ö÷
çç ÷
A = ççK K K ÷ ÷
÷.
çç ÷
çèa K a ø÷
n1 nn

Однородная линейная система дифференциальных уравнений


ìï z1¢( t ) = - a11 z1 ( t ) - K - an1 zn ( t ) ,
ïï
z ¢= - A z Û ïí
T
L (3)
ïï
ïïî zn¢( t ) = - a1n z1 ( t ) - K - ann zn ( t ) ,

56
где AT - транспонированная матрица A , называется сопряженной
системой для данной системы x ¢= Ax .
Общее решение системы (3) содержит n произвольных
постоянных:
æz1 ( t , C1 ,K , Cn ) ö÷ æ ç z1 ( t , C ) ö÷
çç ÷ çç ÷
÷
z = çç L ÷
÷= ç L ÷
÷= z ( t,C ) ,
çç ÷
÷ ç
ç ÷
÷
÷ ç ÷
èçzn ( t , C1 ,K , Cn ) ø÷ ççèzn ( t , C ) ø÷ ÷
æC1 ö÷
çç ÷
т.е. содержат произвольный постоянный n - мерный вектор C = ççL ÷ ÷.
çç ÷ ÷
çèC ø÷ n

2.2.3. Определение.
Функция H ( t , C , u ( t ) ) = z T ( t , C ) Bu ( t ) , где
z T ( t , C ) = ( z1 ( t , C ) ,K , zn ( t , C ) ) - общее решение сопряженной
æb11 K b1r ö÷
çç ÷
системы (3), B = çç L ÷ ÷
÷- матрица управления, u ( t ) - управление,
çç ÷
çèb K b ø÷ n1 nr

называется функцией Понтрягина.


При фиксированном значении момента времени t и постоянного
вектора C значение функции Понтрягина зависит от значения
управления u ( t ) в точке t : при выборе разных значений управления в
фиксированной точке t функция Понтрягина принимает разные
значения.
Формулируем без доказательства принцип максимума
Понтрягина:

2.2.4. Теорема (принцип максимума Понтрягина).


Пусть на отрезке [ t1 , t2 ] при некотором постоянном n - мерном
векторе C = C 0 допустимые значения управления u ( t ) (т.е.
0

u 0 ( t ) Î U ) выбраны так, что выполняется принцип максимума


Понтрягина:
При каждом фиксированном t Î [ t1 , t2 ] , за исключением, может
быть, конечного числа значений t ,
57
1) значение функции Понтрягина H ( t, C 0 , u 0 ( t ) ) является
максимальным среди значений H ( t , C , u ( t ) ) , принимаемых при всех
0

других допустимых значениях управления u ( t ) Î U :


H ( t , C 0 , u 0 ( t ) ) = max H ( t , C 0 , u ( t ) ) ,
u( t) Î U

2) это максимальное значение положительно:


H ( t , C , u ( t ) ) > 0.
0 0

Тогда управление u ( t ) на [ t1 , t2 ] является оптимальным в


0

смысле быстродействия.

2.3. Примеры синтеза оптимального управления

Задача 1. Пусть материальная точка с массой m движется по


инерции вдоль прямой. Нужно быстрейшим образом остановить
движение этой точки в заданном месте, которое мы примем за начало
координат, с помощью ограниченной по величине силы.

Пусть x ( t ) - координата точки в момент времени t . Управление


движением начинается в момент времени t = 0 в точке x ( 0) = a 1 , со
скоростью x ¢( 0) = a 2 и должно закончиться за наименьшее время T в
точке x ( T ) = 0 со скоростью x ¢( T ) = 0 . Управлением u ( t ) является
сила, ограниченная по величине: - k £ u ( t ) £ k ( k > 0) , так что
область управления U = [ - k , k ] Ì R . Крайние значения u ( t ) = - k и
1

u ( t ) = k означают включение двигателя на полную мощность в


отрицательном и положительном направлениях оси Ox
соответственно. При движении в положительном направлении оси
Ox скорость положительна: x ¢( t ) > 0 , а при движении в
отрицательном направлении- отрицательна: x ¢( t ) < 0 .
Для простоты вычислений будем считать, что масса m = 1 ед.
Ускорение движения x ¢¢( t ) создается управлением (силой) u ( t ) ,
и по второму закону Ньютона имеем уравнение движения
58
x ¢¢( t ) = u ( t ) ( u ( t ) Î [- k , k ]) (1)
x ( 0) = a 1 , x ( T ) = 0.
с краевыми условиями
x ¢( 0) = a 2 , x ¢( T ) = 0.

Сведение задачи 1 к нормальной линейной системе


дифференциальных уравнений. Проверка управляемости.

Введем новые неизвестные функции x1 ( t ) и x2 ( t ) : x1 ( t ) = x ( t ) ,


x2 ( t ) = x ¢( t ) . Тогда уравнение движения (1) (уравнение 2-го порядка)
сведется к нормальной линейной системе двух дифференциальных
уравнений
ìï x1¢= x2 æx1¢ö÷ æx2 ö æ0ö
ïí Û çç ÷ = çç ÷
÷+ çç ÷÷
ïïî x2¢= u ÷ ÷
çèx2¢ø÷ èç0 ø çèu ø÷
с краевыми условиями x1 ( 0) = a 1 , x1 ( T ) = 0, x2 ( 0) = a 2 , x2 ( T ) = 0 .
æx2 ö÷ æx1 ö÷ æa11 a12 öæ x1 ö÷ æ a11 x1 + a12 x2 ö÷ æ0 1ö÷
Так как çç ÷ ç = A ç ÷ = ç ÷
÷ç ÷= ç ÷, то A = çç ÷
è0 ø ÷ ç
ç ÷
÷ ç
ç ÷ç
ç ÷ ç
ç
èx2 ø èa21 a22 øèx2 ø èa21 x1 + a22 x2 ø ÷ çè0 0ø÷,
æ0ö æb11 ö÷ æ0ö÷
а так как ççç ÷ ÷= Bu = çç ÷u , то B =
çèb21 ø÷
çç ÷ ( u ( t ) - скалярная функция:
èu ø÷ çè1ø÷
r = 1).
Таким образом, имеем стационарную линейную задачу
оптимального быстродействия
æx1¢ö÷ æ0 1öæx1 ö æ0ö
x = Ax + Bu Û çç ÷
¢ = çç ÷
÷ çç ÷÷+ çç ÷
÷u ,
÷ ÷
çèx2¢ø÷ çè0 0øçèx2 ø çè1ø÷
÷
T ® min. (2)
æx1 ( 0) ö÷ æa 1 ö÷ æx1 ( T ) ö÷ æ0ö÷
x ( 0) = çç ÷= çç ÷= a , x ( T ) = çç ÷= çç ÷= 0,
çèx2 ( 0) ø÷
÷ çèa 2 ø÷ çèx2 ( T ) ø÷
÷ çè0ø÷
Фазовое ограничение отсутствует: допустимые фазовые
состояния x = ( x1 , x2 ) заполняют всю плоскость: S = R 2 . На фазовой
плоскости первая координата x1 точки x = ( x1 , x2 ) означает
координату движущейся точки на оси Ox , вторая координата x2 -
скорость точки.
По критерию Калмана 8.1 проверим управляемость задачи (2)
(здесь n = 2 ):
59
æ0ö æ0 1öæ 0ö æ 1ö æ0 1ö
B = çç ÷ ÷, AB = çç ÷
÷çç ÷
÷= çç ÷
÷, ( B, AB ) = çç ÷
÷Þ rg ( B, AB ) = 2 ,
÷
çè1ø÷ ÷ç1ø÷ çè0ø÷
çè0 0øè çè1 0ø
задача управляема.

Нахождение оптимального управления и оптимальных


траекторий без краевых условий. Линия переключения.

Составим сопряженную систему


æz ¢ö æ0 0÷öæz1 ö÷ ìï z1¢= 0
z ¢= - AT z Û çç 1 ÷ ÷= - ç ÷çç ÷Û ïí .
÷ ç
çèz2¢ø÷ øèz2 ø÷
÷
çè1 0÷ç ïïî z2¢= - z1
ìïï z1 = C1 , æz1 ö÷ æ C1 ö÷
Ее общее решение í т.е. z = çç ÷ ç =ç ç ÷, где
ïïî z2 = - C1t + C2 , èz2 ø÷ èç- C1t + C2 ø÷
æC1 ö÷
C = çç ÷ -
çèC2 ø÷ произвольный постоянный вектор.
Составим функцию Понтрягина:
æ0ö
H ( t , C , u ( t ) ) = z T ( t , C ) Bu ( t ) = ( C1 , - C1t + C2 ) çç ÷ ÷u ( t ) = ( - C1t + C2 ) u ( t ) .
çè1ø÷
Пусть t фиксировано. Если - C1t + C2 > 0 , то среди всех
допустимых значений u ( t ) Î [ - k , k ] максимальное значение функции
Понтрягина доставляет знчение u ( t ) = k . Если - C1t + C2 < 0 , то
функция H ( t , C , u ( t ) ) получает максимальное значение при u ( t ) = - k
. Таким образом, при всех t (за исключением значения t , при котором
- C1t + C2 = 0 ) функция управления u ( t ) , доставляющая максимум
функции Понтрягина, принимает только два значения k и - k .
Отметим, что условие 2 принципа Понтрягина при таком выборе
значений u ( t ) ( u ( t ) = k или u ( t ) = - k ) автоматически выполняется:
ìï ( - C1t + C2 ) k при ( - C1t + C2 ) > 0
max H ( t , C , u ( t ) ) = ïí Þ
u( t ) Î U ïïî ( - C1t + C2 ) ( - k ) при ( - C1t + C2 ) < 0
Þ max H ( t , C , u ( t ) ) > 0
u( t ) Î U

(за исключением одного значения t , при котором - C1t + C2 = 0 ).

60
Согласно принципу максимума Понтрягина, оптимальные
траектории можно получить только при значениях
u ( t ) = k или u ( t ) = - k .
ìïï x1¢= x2
Пусть u ( t ) = - k . Тогда система (2) имеет вид í .
ïïî x2¢= - k
Ее общее решение
ìï k
ïï x1 = - ( t + a ) 2 + b
í 2 (3)
ïï
ïî x2 = - k ( t + a )
где a, b - произвольные постоянные (их обозначили a, b в отличие от
постоянных C1 и C2 в решении сопряженной системы. Кроме того,
вместо x2 = - k t + a записали x2 = - kt - ka = - k ( t + a ) , так как - ka
тоже произвольная постоянная, как и a ). Это – семейство
оптимальных фазовых траекторий под управлением u ( t ) = - k .
1 2
Исключая время t , получим x1 = - x2 + b - семейство парабол.
2k
Из уравнения x2 = - k ( t + a ) видно,
что с увеличением времени t
ордината x2 точки ( x1 , x2 ) на
параболе уменьшается.
Следовательно, движение фазовой
точки вдоль параболы происходит
вниз.
ìïï x1¢= x2
Пусть u ( t ) = k . Тогда система (2) имеет вид í . Её общее
ïïî x2¢= k
решение:
ìï k
ïï x1 = ( t + a ) 2 + b
í 2 (4)
ïï
îï x2 = k ( t + a ) .
Это – семейство оптимальных фазовых траекторий под управлением
1 2
u ( t ) = k . Исключая t , получаем x1 = x2 + b - семейство парабол.
2k
Из уравнения x2 = k ( t + a )

61
видим, что с возрастанием
времени t точка ( x1 , x2 )
движется вдоль параболы вверх.
Семейства оптимальных траекторий (3) и (4) получены без учета
краевых условий. Пока о роли этих семейств можно сказать
следующее:
Если точки x 1 и x 2 лежат на одной из парабол, то именно кусок
этой параболы, соединяющий точки x 1 и x 2 , является оптимальной
траекторией (при совпадении направления): объект перейдет из
фазового состояния x 1 в фазовое состояние x 2 за кратчайшее время
именно по этой траектории.
Движение фазовой точки x = ( x1 , x2 ) к пункту
назначения O = ( 0,0) происходит по верхней
части параболы семейства (3) при b = 0 :
ìï k
ïï x1 = - ( t + a ) 2
í 2
ïï
ïî x2 = - k ( t + a )
по нижней части параболы семейства (4) при b = 0 :
ìï k
ïï x1 = ( t + a ) 2
í 2 .
ïï
ïî x2 = k ( t + a )
ìï 1 2
ïï x2 при x2 < 0
ï 2k
Линия x1 = í , составленная из кусков парабол
ïï 1 2
ïï - x2 при x2 > 0
ïî 2k
семейств (3) и (4), входящих в начало координат, называется линией
переключения.

Синтез оптимальной траектории.

62
Пусть точка a лежит выше линии переключения.
Мы увидим, что оптимальной траекторией
окажется траектория, составленная из куска одной
из парабол семейств (3) или (4) и куска линии
переключения. Двигаясь из точки a по параболе
семейства (4) не попадем ни в начало координат,
ни на линию переключения.
Поэтому надо начать движение по параболе семейства (3),
которая проходит через точку a в момент t = 0 .
В некоторый момент t попадем в точку b , где эта парабола
пересекается с линией переключения. Затем, двигаясь с момента t из
точки b по линии переключения, в момент T попадем в точку O .
Полученная траектория и будет оптимальной. В самом деле,
проверим выполнение теоремы 2.2.4. При t < t , т.е. 1×t - t < 0 ,
выбрано управление u ( t ) = - k , а при t > t , т.е. 1×t - t > 0 , выбрано
o

управле-

ние u ( t ) = k . Значит, на отрезке [ 0,T ] при постоянном векторе


o

C o = ( - 1;- t ) значения u ( t ) выбраны так, что при каждом


фиксированном t Î [ 0, T ] , кроме t = t ,
1) значение функции Понтрягина
H ( t , C o , u ( t ) ) = ( - C1ot + C2o ) u o ( t ) =
ìï ( t - t ) ×( - k ) при t < t
= ( 1×t - t ) u ( t ) = ïí
o
- максимальное среди
ïïî ( t - t ) ×k при t > t
значений, принимаемых этой функцией при всех u ( t ) Î [ - k , k ] .
2) H ( t , C , u ( t ) ) > 0 - выполняется автоматически, как отмечалось
o o

раньше.
Условия теоремы 2.2.4 выполнены. Поэтому, согласно принципу
максимума Понтрягина, построенная траектория является
оптимальной в смысле быстродействия, а соответствующее
ìïï - k при t < t
управление u ( t ) = í является оптимальным.
ïïî k при t > t

63
Аналогично строится оптимальное управление и
оптимальная траектория в случае, когда точка a
находится ниже линии переключения (в этом
случае постоянный вектор C   1,  ). Если a

находится на линии переключения, то, очевидно,


оптимальной траекторией является кусок самой
линии переключения.

2.3.1. Пример
x ¢¢= u , x ( 0) = 2, x ¢( 0) = - 4, x ( T ) = 0, x ¢( T ) = 0,
T ® min, - 2 £ u ( t ) £ 2.
(В момент t = 0 точка проходит через положение x = 2 влево со
скоростью x ¢( 0) = - 4 . Нужно остановить ее в положении x = 0 ).
Пусть u = - 2 . Решаем систему
ïìï x1¢= x2 ïìï x1 = - ( t + a ) + b,
2

í í (5)
ïïî x2¢= - 2 ïï x2 = - 2( t + a ) .
î
1
Это – семейство парабол x1 = - x22 + b .
4
Пусть u = 2 ,
ìïï x1¢= x2 ïïì x1 = ( t + a ) 2 + b 1
í , í , x1 = x22 + b (6)
ïïî x2¢= 2 ïï x2 = 2( t + a ) 4
î
Линия переключения
ìï 1 2
ïï x2 при x2 < 0
x1 = ïí 4 .
ïï 1 2
ïï - x2 при x2 > 0
ïî 4
Находим закон движения из точки
   2; 4  с момента t  0 по
параболе семейства (6):
полагая x1 = 2, x2 = - 4, t = 0 , находим
ìï 2 = ( 0 + a ) 2 + b
ïí Þ a = - 2, b = - 2 ;
ïï - 4 = 2( 0 + a )
î
64
Закон движения
ìï x = ( t - 2) 2 - 2
ïí 1 . (7)
ïï x2 = 2( t - 2)
î
x22
Это движение происходит по параболе x1 = - 2 . Найдем
4
точку b пересечения с линией переключения. Пересечение
происходит при x2 > 0 .
ìï x 2
ïï x1 = 2
- 2
ï 4
Поэтому решаем систему уравнений í Þ
ïï 1 2
ïï x1 = - x2
ïî 4
x1 = - 1, x2 = + 2 .
Находим момент t попадания в эту точку b , используя закон
ìï - 1 = ( t - 2) 2 - 2
движения (7): ïí Þ t = 3.
ïï 2 = 2( t - 2)
î
Находим закон движения из точки b = ( - 1;2) с момента t = 3
по линии переключения, полагая в (5) x1 = - 1, x2 = 2, : t = 3 :
ìï - 1 = - ( 3 + a) 2 + b ìï x = - ( t - 4) 2
ïí Þ a = - 4, b = 0 . Закон движения ïí 1 .
ïï 2 = - 2( 3 + a ) ïï x2 = - 2( t - 4)
î î
Наконец, находим момент T попадания в начало координат
O = ( 0;0) :
ìï 0 = - ( T - 4) 2
ïí Þ T = 4.
ïï 0 = - 2( T - 4)
î
Итак, оптимальная траектория

ìï ( t - 2) 2 - 2 при t Î [ 0;3]
ï
x = x1 = í .
ïï - ( t - 4) 2 при t Î [ 3;4 ]
ïî
Оптимальное уравнение
ìï 2 при t Î [ 0,3[ ,
u ( t ) = ïí .
ïï - 2 при t Î ]3,4]
î

65
Судя по изображенной фазовой траектории, управление движением
происходило так:
В момент t = 0 точка проходила положение x = 2 со скоростью
x ¢( 0) = - 4, двигаясь влево. Чтобы остановить ее, включили
двигатель на полную мощность u ( t ) = + 2 (по оси Ox ). Точка
остановилась в положении x = - 2 с нулевой скоростью. Под тем же
управлением u ( t ) = 2 точка двигалась до положения x = - 1, где
имела уже положительную скорость 2 - к моменту t = 3. В этот
момент, чтобы точка, набирая положительную скорость, не
перескочила начало координат, управление переключили на
u ( t ) = - 2 . Это управление затормозило точку и к моменту T = 4
остановило ее в начале координат.

2.3.2. Пример.
Положим в примере 2.3.1 x ( 0) = - 1, x ¢( 0) = 2. Тогда точка
a = b находится на линии переключения. Закон движения из этой
æìï - 1 = - ( 0 + a ) 2 + b a = - 1ö÷ ìï x = - t - 1 2 ,
çï ÷ ïí 1 ( )
точки с момента t = 0 ççí Þ ÷:
ççèïï 2 = - 2( 0 + a ) b = 0 ø÷
÷ îïï x2 = - 2( t - 1) .
î
Находим момент T попадания в точку 0 = ( 0,0) :
ïìï 0 = - ( T - 1) 2
í ® T = 1. Оптимальная траектория
ïï 0 = - 2( T - 1)
î
2
x = - ( t - 1) , t Î [ 0,1] . Оптимальное управление u ( t ) = - 2, t Î [ 0,1] .
Задача 2. Математический маятник – груз M малых размеров с
массой m на невесомом стержне OM длиной l находится вблизи
верхнего (неустойчивого) положения равновесия. Требуется под
действием ограниченной по величине силы, направленной
перпендикулярно к оси маятника, за кратчайшее время привести
маятник к положению равновесия с нулевой скоростью (трением
пренебрегаем).
Обозначим x ( t ) угол отклонения маятника от положения
равновесия в момент времени t , отсчитываемый в направлении
против часовой стрелки.

66
Управление движением
начинается в момент времени
t = 0 при отклонении x ( 0) = a 1 ,
когда скорость отклонения
x ¢( 0) = a 2 , и должно
закончиться за наименьшее
время T при отклонении
x ( T ) = 0 и скорости отклонения
x ¢( T ) = 0 .

Управлением является сила u ( t ) Î [ - k , k ] ( k > 0) , крайние


значения u ( t ) = k и u ( t ) = - k означают включение двигателя на
полную мощность в положительном и отрицательном направлении
отклонения соответственно.
Составим уравнение движения маятника. Движение маятника по
окружности происходит под действием силы f ( t ) = mg sin x
(составляющая силы тяжести в направлении касательной) и
управления u ( t ) с линейным ускорением x ¢¢( t ) l . По второму закону
Ньютона
mx ¢¢l = mg sin x + u
Это – нелинейное (из-за sin ) дифференциальное уравнение второго
порядка с неизвестной функцией x ( t ) . Ограничиваясь положениями
маятника, достаточно близкими к положению равновесия, мы можем
заменить sin x на x (так как sin x » x при малых x ). Получим
линейное дифференциальное уравнение второго порядка
g u
mx ¢¢l = mgx + u Û x ¢¢= x + .
l ml
g
Для упрощения вычислений будем считать, что = 1, ml = 1:
l
x ¢¢= x + u .
Как и в задаче 1, перейдем к нормальной системе заменой
x1 ( t ) = x ( t ) , x2 ( t ) = x ¢( t ) . Получим линейную стационарную задачу
оптимального быстродействия

67
ìï x1¢= x2 , x1 ( 0) = a 1 , x2 ( 0) = a 2 , x1 ( T ) = 0, x2 ( T ) = 0, T ® min,
ïí (1)
ïïî x2¢= x1 + u , u ( t ) Î [- k , k ]
x ¢= Ax + Bu , x ( 0) = a , x ( T ) = 0, T ® min
или
u( t) Î [- k, k ],
æ0 1ö÷ æ0ö
где A = ççç ÷, B = çç ÷ ÷, a = ( a 1 , a 2 ) .
è1 0ø÷ èç1ø÷
Кроме ограничения на управление u ( t ) Î U = [ - k ; k ] , в этой задаче
имеется фазовое ограничение x ( t ) Î S Ì R , где S - некоторое
2

множество на фазовой плоскости R 2 . (например, первая координата


x1 = x ограничена некоторым отрезком [ - j , j ] , в пределах которого
считаем sin x = x ).
Пользуясь критерием Калмана, проверим управляемость задачи
(1) (в пределах фазового ограничения):
æ0 1öæ ö æ1÷ ö æ ö
AB = çç ÷çç0÷ çç ÷, ( B, AB ) = çç0 1÷
÷
÷ç1÷
èç1 0øè
÷=
ø èç0÷ø ÷Þ rg ( B, AB ) = 2, задача
÷
èç1 0ø
управляема.

Нахождение оптимального управления и оптимальных


траекторий без краевых условий. Линия переключения.

Сопряженная система
æz1¢ö÷ æ0 1÷ öæz1 ö÷ ìïï z1¢= - z2 ,
¢ T
z =- A zÛ ç ÷ ç =- ç ç ÷çç ÷ Û í
çèz2¢ø÷
÷ çè1 0÷ øèz2 ø÷ ïïî z2¢= - z1
֍
имеет общее решение
ìï z1 = C1e- t + C2et æz1 ö÷ æ C e- t
+ C e tö
÷
ïí çç ÷= ç ç
ïï z2 = C1e- t - C2et
Û z ( t , C ) = 1 2
çèz2 ø÷ ççèC e- t - C et ÷
÷, где C = ( C1 , C2 ) –
÷
î 1 2 ø

постоянный вектор. Функция Понтрягина имеет вид

68
æ0÷ö
H ( t , C , u ( t ) ) = z ( t , C ) Bu ( t ) = ( C1e + C2e , C1e - C2e ) ç ÷
T - t t - t tç u( t) =
çè1÷
ø
= ( C1e- t - C2 et ) u ( t ) = e- t ( C1 - C2e 2t ) u ( t )
При фиксированном t , если C1 - C2 e 2t > 0 или C1 - C2 e 2t < 0 , то
функция Понтрягина имеет максимальное значение, если взять
u ( t ) = k или u ( t ) = - k соответственно. Таким образом, функция
управления u ( t ) , доставляющая максимум функции Понтрягина,
имеет только два значения - k и k , и переключение этих значений
происходит в единственной точке t , в которой C1 - C2 e 2t = 0 .
При таком выборе функции u ( t ) будет автоматически
max H ( t , C , u ( t ) ) > 0 при всех t , кроме упомянутого исключительного
u( t ) Î U

значения.
Найдем фазовые траектории под управлениями u ( t ) = k и
u( t) = - k .
При u ( t ) = - k система (1) имеет вид
ìï x1¢= x2
ïí (2)
ïïî x2¢= x1 - k
Ее общее решение
ìï x1 = ae- t + bet + k ,
ïí (3)
ïï x2 = - ae- t + bet ,
î
где a, b - произвольные постоянные. Исключив отсюда et , получим
2
( x1 - k ) - x22 = 4ab – семейство
равнобочных гипербол с центром ( k ,0) и
асимптотами x2 = x1 - k и x2 = k - x1 . Из
равенства x1¢= x2 (в системе (2)) видно, что
если x2 ( t ) > 0, то x1¢( t ) > 0, а если x2 ( t ) < 0,
то x1¢( t ) < 0 . Это значит, что с возрастанием
времени t в верхней полуплоскости (где
x2 > 0 ) движение происходит слева направо
( x1 ( t ) возрастает), а в нижней полуплоскости
69
( x2 < 0 ) движение справа налево ( x1 ( t )
убывает).
ìïï x1¢= x2
Аналогично при u ( t ) = k из системы í получаем
ïïî x2¢= x1 + k
ìï x1 = ae- t + bet - k
ïí (4)
ïïî x2 = - ae- t + bet
семейство равнобочных гипербол
2
( x1 + k ) - x2 = 4ab с центром ( - k ;0) и с
2

асимптотами x2 = x1 + k и x2 = - x1 - k . Как
и в случае u ( t ) = - k , x1¢( t ) > 0 при x2 ( t ) > 0
и x1¢( t ) < 0 при x2 ( t ) < 0 : в верхней
полуплоскости движение происходит слева
направо, в нижней полуплоскости – справа
налево.
Движение фазовой точки x = ( x1 , x2 ) к пункту назначения
O = ( 0;0) происходит слева направо по верхней части левой ветви
гиперболы семейства (3) с уравнением
2
( x1 - k ) - x22 = k 2 (5)
( *( 0 - 2
)
k ) + 02 = 4ab Þ 4ab = k 2 * и справа налево по нижней части
правой ветви гиперболы семейства (4) с уравнением
2
( x1 + k ) - x22 = k 2 . (6)
Линия переключения имеет уравнения
ìï ( x - k ) 2 - x 2 = k 2 при x > 0
ï 1 2 2
í (7)
ïï ( x + k ) 2 - x 2 = k 2 при x < 0
ïî 1 2 2

Построение оптимальной траектории при данных краевых


условиях.
Как и в задаче 1, оптимальная траектория будет состоять из
куска одной из гипербол семейства (3) и (4) и куска линии
переключения. Из рисунка видно, что если точка a = ( a 1 , a 2 )
находится в полосе между прямыми x2 = k - x1 и x2 = - k - x1 , то
оптимальная траектория

70
найдется. Если же
точка находится вне
этой полосы или на
одной из прямых
x2 = k - x1 ,
x2 = - k - x1 , то
оптимальной
траектории нет (Это
объясняется тем, что в
задаче имеется
фазовое ограничение
x ( t ) Î S , так что a Î S
).
r
Пусть, например, точка a содержится в этой полосе левее
линии переключения в верхней полуплоскости.
Тогда по одной из гипербол
семейства (4) под
управлением u( t) = k в
некоторый момент t= t
дойдем до линии
переключения и затем по
линии переключения под
управлением u( t) = - k
дойдем до точки O = ( 0,0) .
Эта траектория будет
оптимальной, так как
выполняется принцип
максимума Понтрягина.
Действительно, при t < t , т.е. e - e2t > 0 Û C1 - C2e 2t > 0, где
2t

C1 = e 2 t , C2 = 1 , использовано управление u0 ( t ) = k , а при t > t , т.е.


C1 - C2 e 2t < 0 , использовано управление u0 ( t ) = - k . Это значит, что
при постоянном векторе C = ( C1 , C2 ) = ( e ,1) при всех t Î [ 0, T ]
2t

(кроме t = t ) управление u ( t ) выбрано так, что функция Понтрягина

71
H ( t , C , u ( t ) ) = e- t ( C1 - C2e 2t ) u ( t ) имеет максимальное значение –
выполняется п.1) принципа максимума Понтрягина. Как было
отмечено раньше, п.2) выполняется автоматически:
H ( t , C , u0 ( t ) ) = e- t ( C1 - C2e 2t ) u0 ( t ) > 0 .
Оптимальное управление имеет вид
ìï k при t Î [ 0,t [
u0 ( t ) = ïí .
ïï - k при t Î ]t , T ]
î
Аналогично определяются оптимальное
управление и оптимальная траектория при
других расположениях точки a
относительно линии переключения.

2.3.3. Пример.
x ¢¢= x + u , x ( 0) = 0, 2, x ¢( 0) = 1, x ( T ) = 0,
x ¢( T ) = 0, T ® min, - 2 £ u ( t ) £ 2
(в момент t = 0 маятник отклонен от
положения равновесия на угол 0,2
радиан и движется влево со скоростью
1 ед.). Здесь a = ( 0,2;1) . Можно
убедиться, что точка a содержится в
полосе управляемости между прямыми
x2 = 2 - x1 и x2 = - 2 - x1 , правее линии
переключения в верхней
полуплоскости.
До линии переключения дойдем по гиперболе семейства (3),
проходящей через эту точку, под управлением u ( t ) = - 2 . Найдем
закон движения по такой гиперболе с момента t = 0 из точки
a = ( 0,2;1) :

72
ìïï 0,2 = ae- 0 + be0 + 2 ïìï a = - 1,4
í Þ í
ïïî 1 = - ae- 0 + be0 ïïî b = - 0,4.
Закон движения имеет вид:
ìï x1 = - 1,4et - 0,4et + 2
ïí
ïïî x2 = 1,4e- t - 0, 4et .
Гипербола имеет уравнение:
2
( x1 - 2) - x22 = 2,24 ( 4ab = 4( - 1,4) ( - 0,4) = 2,24) .
Найдем точку её пересечения с линией переключения (7) (у нас
k 2 = 4, x2 < 0 )
ïìï ( x1 - 2) 2 - x22 = 2,24 ïì x1 = 0,22 ,
í Þ ïí
ïï ( x + 2) - x = 4 2 2 ïï x2 = - 0,9284 .
ïî 1 2 î
Найдем момент t = t попадания в эту точку:
ìï 0,22 = - 1,4e- t - 0,4et + 2 0,9284 + 3,1684
ïí Þ t = ln .
ïï - 0,9284 = - 1,4e- t - 0, 4et 0,8
î
Теперь найдем закон движения из точки ( 0,22; - 0,9284 ) с
момента t = t по линии переключения – гиперболе семейства (4):
ìï
ïï a = 2,22 + 0,9284 e t ,
ìï 0,22 = ae + be - 2
- t t
ïí Þ ïíï 2
ïï - 0,9284 = - ae- t + bet ïï 2,22 - 0,9284 - t
î ïï b = e .
ïî 2
Закон движения имеет вид:
ìï
ïï x = 2,22 + 0,9284 et ×e- t + 2,22 - 0,9284 e- t ×et - 2 ,
ïï 1 2 2
í
ïï 2,22 + 0,9284 t - t 2,22 - 0,9284 - t t
ïï x2 = - e ×e + e ×e .
ïî 2 2
Найдем момент T попадания в точку назначения 0 = ( 0,0)
(достаточно воспользоваться вторым равенством):
2,22 + 0,9284 t - T 2,22 - 0,9284 - t T
0= - e ×e + e ×e Þ
2 2
1 1
Þ T = ln ( 1,4642 + 1,11 0,9284 ) + t = ln ( 1,4642 + 1,11 0,9284 ) +
2 2
73
0,9284 + 3,1684
+ ln .
0,8
Итак, оптимальная траектория имеет вид:
ìï - 1,4e- t - 0,4et + 2 при t Î [ 0, t ] ( u ( t ) = - 2)
ïï
x ( t ) = í 2,22 + 0,9284 2,22 - 0,9284 - t
ïï et ×e- t + e - 2 при t Î ]t ,T ] ( u ( t ) = 2)
ïïî 2 2
где
0,9284 + 3,1684
t = ln ,
0,8
T = ln8 × 1,4642 + 1,11 0.9284 ( 0,9284 + 3,1684 ) ,
ïìï - 2 при t Î [ 0, t [
оптимальное уравнение u ( t ) = í
ïïî 2 при t Î ]t , T ] .
Судя по фазовой траектории на последнем рисунке, управление
движением маятника происходит так:
В момент t = 0 , когда включили управление, маятник был
отклонен от положения равновесия на угол 0,2 радиан влево и
продолжал отклоняться влево со скоростью 1 ед. Чтобы замедлить и
остано-
вить его отклонение влево, включили двигатель на полную мощность
u ( t ) = - 2 в направлении вправо. Маятник был остановлен (скорость
x2 = 0 ) при некотором положительном отклонении x1 = a 1¢ (слева от
положения равновесия). Это – фазовое состояние a ¢= ( a 1¢,0) . Под тем
же управлением u ( t ) = - 2 маятник стал приближаться назад к
положению равновесия (уже с отрицательной скоростью x2 ). Чтобы
маятник не перескочил через положение равновесия, в момент t = t
управление было переключено на u ( t ) = 2 (для замедления
маятника). Это – фазовое состояние a ¢¢= ( a 1¢¢, a 2¢¢) . После этого
маятник пришел в положение равновесия со скоростью x2 = 0 (в
момент t = T ).

III. ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ.

74
ВАРИАНТЫ РАСЧЕТНОЙ РАБОТЫ

3.1. Простейшие задачи вариационного исчисления


6

Пример 1. J [ y ] = ò ( 2 xy - y ¢2 ) dx; y ( 0) = 1, y ( 6) = 1.
0

□ F = 2 xy - y ¢ (Считаем F как функцию трех переменных)


2

а) Fy¢¢ = - 2 y ¢;
d d
б) Fy¢¢ = ( - 2 y ¢) = - 2 y ¢¢;
dx dx
в) Fy¢= 2 x .
Составляем уравнение Эйлера
2 x + 2 y ¢¢= 0, y ¢¢= - x . Интегрируем дважды:
x2 x3
y ¢= - + C1 , y = - + C1 x + C2 - экстремали (множество
2 6
кривых).
Используя краевые условия, находим
ìï 1 = C2 ,
ïï
í
ïï 1 = - 216 + 6C1 + C2 ,
ïî 6
C2 = 1, C1 = 6 .
x3
Единственная экстремаль y = - + 6 x + 1.■
6
e

Пример 2. J [ y ] = ò( 2y - x 2 y ¢2 ) dx ® extr , y ( 1) = e, y ( e) = 0 .
1
□ Уравнение Эйлера
d d d
f y¢-
dx
( f y¢¢) = 0 Û 2 +
dx
( 2 x 2 y ¢) = 0 Û
dx
( 2 x 2 y ¢) = - 2 Þ

1 C C
Þ 2 x 2 y ¢= - 2 x + C1 Þ y ¢= - + 12 Þ y = - ln x - 1 + C2 ,
x 2x 2x
C
или, с учетом x > 0, y = C2 - 1 - ln x .
x

75
Используем краевые условия:
ìï e = C2 - C1 ,
ïï ïìï C1 = - e,
í Þ í
ïï 0 = C2 - C1 - 1 ïïî C2 = 0.
îï e
e
Единственная экстремаль y = - ln x .■
x
b

Пример 3. J [ y ] = ò( 4y + 5 y ¢2 + y ¢¢2 ) dx .
2

□ F = 4 y + 5 y ¢ + y ¢¢ ,
2 2 2

d
Fy¢= 8 y, Fy¢¢ = 10 y ¢, F ¢¢ = 10 y ¢¢,
dx y
d2
Fy¢¢¢ = 2 y ¢¢, 2
Fy¢¢¢ = 2 y IV .
dx
Уравнение Эйлера – Пуассона:
8 y - 10 y ¢¢+ 2 y IV = 0, y IV - 5 y ¢¢+ 4 y = 0 .
Характеристическое уравнение
k 4 - 5k 2 + 4 = 0 имеет корни k1,2 = ± 2, k3,4 = ± 1 .
Тогда получаем экстремаль функционала
y = C1e 2 x + C2e- 2 x + C3e x + C4e- x .■
Пример 4.
1

J [ y] = ò y ¢¢dx, y ( 0) = y ( 1) = y ¢( 1) = 0, y ¢( 0) = 1.

¢
0
¢ d2
□ F = y . Уравнение Эйлера-Пуассона 2 Fy¢¢¢ = 0, т.е.
dx
2
d
2(
y ¢¢) = 0, y IV = 0, тогда y = Ax 3 + Bx 2 + Cx + D ,
dx
y ¢= 3 Ax 2 + 2 Bx + C .
Для нахождения коэффициентов используем граничные условия:
ìï D = 0,
ïï
ïï A + B + C + D = 0,
í Þ A = 1, B = - 2, C = 1, D = 0.
ïï 3 A + 2 B + C = 0,
ïï
ïî C = 1.

76
Получаем единственную экстремаль
y = x3 - 2 x 2 + x .■

p /2

Пример 5. J [ y ] = ò ( y ¢¢ - y 2 + x 2 ) dx .
2

y ( 0) = 1, y ¢( 0) = 0, y ( p / 2) = 0, y ¢( p / 2) = - 1 .
□ F = y ¢¢2 - y 2 + x 2 .
d2
Уравнение Эйлера-Пуассона: Fy¢+ 2 Fy¢¢¢ = 0 ,
dx
2
d
2(
Fy¢= - 2 y, Fy¢¢¢ = 2 y ¢¢, 2 y ¢¢) = 2 y IV ,
dx
тогда уравнение имеет вид - 2 y + 2 y IV = 0, y IV - y = 0,
k 4 - 1 = 0, ( k 2 + 1) ( k - 1) ( k + 1) = 0, k1,2 = ± i, k3 = 1, k4 = - 1,
ìï y = C1 cos x + C2 sin x + C3e x + C4e- x ,
ïí
ïï y ¢= - C1 sin x + C2 cos x + C3e x - C4e- x .
î
Используем граничные условия:
ïìï C1 + C3 + C4 = 1, C1 = 1,
ïï
ï C2 + C3 - C4 = 0, C2 = 0,
í
ïï C2 + C3ep / 2 + C4 e- p / 2 = 0, C3 = 0,
ïï
ïïî - C1 + C3ep / 2 - C4 e- p / 2 = - 1, C4 = 0.
Единственная экстремаль y = cos x . ■
b

Пример 6. J [ y1 , y2 ] = ò ( 2y y 1 2 + y1¢2 + y2¢2 ) dx,


a
d
□ Fy¢1 = 2 y2 , Fy¢1¢ = 2 y1¢, ( 2 y1¢) = 2 y1¢¢,
dx
d
Fy¢2 = 2 y1 , Fy¢2¢ = 2 y2¢, ( 2 y2¢) = 2 y2¢¢.
dx
Получаем систему уравнений Эйлера
ìï 2 y2 - 2 y1¢¢= 0, ìï y2 = y1¢¢,
ïí Þ ïí
ïîï 2 y1 - 2 y2¢¢= 0, ïîï y1 = y2¢¢.

77
Из второго уравнения находим y1¢¢= y2IV и подставим в первое:
y2 = y2IV , k 4 - 1 = 0
( k 2 + 1) ( k + 1) ( k - 1) = 0, k1,2 = ± i, k3 = - 1, k4 = 1
ìï y1 = y2¢¢= - C1 cos x - C2 sin x + C3e- x + C4 e x
ïí
ïï y2 = C1 cos x + C2 sin x + C3e- x + C4 e x .
î
Получили экстремаль ( y1 , y2 ) данного функционала. ■

Пример 7. J [ y1 , y2 ] = ò ( y ¢y ¢+
1 2 y1 y2 ) dx , y1 ( 0) = y2 ( 0) = 1,
0
1
y1 ( 1) = e , y2 ( 1) = .
e
d
□ F = y1¢y2¢+ y1 y2 , Fy¢1 = y2 , Fy¢1¢ = y2¢, ( y2¢) = y2¢¢,
dx
d
Fy¢2 = y1 , Fy¢2¢ = y1¢, ( y1¢) = y1¢¢.
dx
ìïï y2 - y2¢¢= 0,
Система уравнений Эйлера имеет вид: í
ïïî y1 - y1¢¢= 0.
Рассмотрим второе уравнение y1¢¢- y1 = 0, k - 1 = 0, k1,2 = ± 1,
2

тогда y1 = C1e x + C2 e- x , аналогично y2 = C3e x + C4 e- x .


Для определения констант используем граничные условия
ìï C1 + C2 = 1,
ïï
í C откуда C1 = 1, C2 = 0 .
ïï C1e + 2 = e,
ïî e
ïìï C3 + C4 = 1,
ïí
C 1 откуда C4 = 1, C3 = 0 .
ïï C3e + 4 = ,
îï e e
Получаем y1 = e x , y2 = e- x . ■

Пример 8. Найти экстремали функционала

78
p
2
J [ y1 , y2 ] = ò( y + y2 2 - y1¢2- y2¢2 ) dx ,
2
1
0
æp ö æp ö÷
y1 ( 0) = 1, y2 ( 0) = - 1, y1 çç ÷ = y ç = 1,
çè 2 ø÷
÷ 2 èçç 2 ø÷ ÷
y1 - y2 - 2cos x = 0 (т.е. g = y1 - y2 - 2cos x ).
□ Составим функцию Лагранжа:
L = y12 + y2 2 - y1¢2 - y2¢2 + l ( x ) ( y1 - y2 - 2cos x ) .
d
Ly¢1 = 2 y1 + l ; Ly¢1¢ = - 2 y1¢; ( - 2 y1¢) = - 2 y1¢¢.
dx
d
Ly¢2 = 2 y2 - l ; Ly¢2¢ = - 2 y2¢; ( - 2 y2¢) = - 2 y2¢¢.
dx
Система уравнений Эйлера имеет вид:
ìïï 2 y1 + l + 2 y1¢¢= 0,
í складываем эти уравнения:
ïïî 2 y2 - l + 2 y2¢¢= 0,
2( y1¢¢+ y2¢¢) + 2( y1 + y2 ) = 0,
откуда из граничных условий найдем
y1 + y2 = C1 cos x + C2 sin x,
C1 = 0, C2 = 2 . Тогда y1 + y2 = 2sin x . Добавляем уравнения связи
ìïï y1 + y2 = 2sin x,
í откуда y1 = cos x + sin x, y2 = sin x - cos x .■
ïïî y1 - y2 - 2cos x = 0,

Пример 9. J [ y1 , y2 ] = ò ( y ¢ + y ¢) dx , y1 ( 0) = - 1, y2 ( 0) = 0,
2 2
1 2
0

y1 ( 1) = - 1 y2 ( 1) = 1.
y1 + y2 - 2 x 2 + x + 1 = 0 – уравнение связи.
□ L = y1¢ + y2¢ + l ( y1 + y2 - 2 x + x + 1) .
2 2 2

d
Ly¢1 = l ; Ly¢1¢ = 2 y1¢; ( 2 y1¢) = 2 y1¢¢.
dx
d
Ly¢2 = l ; Ly¢2¢ = 2 y2¢; ( 2 y2¢) = 2 y2¢¢.
dx
Составляем систему

79
ìïï l - 2 y1¢¢= 0,
í вычитаем: 2 y2¢¢- 2 y1¢¢= 0 , y2¢¢- y1¢¢= 0 , обозначим
ïïî l - 2 y2¢¢= 0,
Y = y2 - y1 , тогда Y ¢¢= 0,
k 2 = 0; k1,2 = 0 Þ Y = C1 + C2 x, т.е. y2 - y1 = C1 + C2 x .
Используя граничные условия найдем C1 и C2 :
ìïï 0 + 1 = C1 ,
í Þ C1 = C2 = 1,
ïïî 1 + 1 = C1 + C2 ×1,
y2 - y1 = 1 + x, добавляем уравнение связи: y2 + y1 = 2 x 2 - x - 1 .
ìï y1 = x 2 - x - 1
Отсюда находим ïí .■
ïïî y2 = x 2

J [ y1 , y2 ] = ò ( y ¢ + y ¢) dx , y1 ( 0) = y2 ( 0) = 0,
2 2
Пример 10. 1 2
0
y1 ( 1) = 2ch1, y2 ( 1) = 2sh1, y1¢- y2 = 0 .
□ Функция Лагранжа L = y1¢ + y2¢ + l ( y1¢- y2 ) .
2 2

Система уравнений Эйлера:


ìï d
ïï - ( 2 y1¢+ l ) = 0,
ïï dx ïìï 2 y1¢¢+ l ¢= 0,
ïï
ïí - l - d ( 2 y ¢) = 0, Þ ïíï 2 y ¢¢+ l = 0,
2
ïï dx ïï 2
ïï ¢ ïïî y1¢- y2 = 0.
ïï 1 y - y 2 = 0,
ïïî
Дифференцируем по x второе и третье уравнения:
ìï 2 y1¢¢+ l ¢= 0,
ïï ì
ïí 2 y ¢¢¢+ l ¢= 0, Þ ïíï y1¢¢- y2¢¢¢= 0,
ïï 2 ïïî y1¢¢- y2¢= 0.
ïïî y1¢¢- y2¢= 0,
Подставляем второе уравнение в первое:
y2¢¢¢- y2¢= 0 , k3 - k = 0, k ( k 2 - 1) = 0 , k1 = 0 , k2,3 = ± 1 ,
y2 = C1 + C2 e x + C3e- x .
Из уравнения связи y1¢= y2

80
ò(C + C e + C3e- x ) dx = C1 x + C2 e x - C3e- x + C4 .
x
y1 = 1 2

Из граничных условий получаем систему:


ìï 0 = C2 - C3 + C4 ,
ïï
ïï 0 = C1 + C2 + C3 ,
í
ïï 2ch1 = C1 + C2e - C3e- 1 + C4 ,
ïï
ïïî 2sh1 = C1 + C2e + C3e- 1.
C2 = C3 = 1, C1 = C4 = 0.
Ответ: y1 = e x - e- x = 2sh x, y2 = e x + e- x = 2ch x. ■

p /2

Пример 11. J [ y1 , y2 ] = ò( y + y22 - y1¢2 - y2¢2 + cos x) dx .


2
1
0
y1 ( 0) = y2 ( 0) = y1 ( p / 2) = 1, y2 ( p / 2) = - 1, y1 - y2 - sin x = 0 .
□ L = y1 + y2 - y1¢ - y2¢ + cos x + l ( y1 - y2 - sin x ) .
2 2 2 2

ïìï d
ïï 1 2 y + l - ( - 2 y1¢) = 0,
ïï dx ìï 2 y1¢¢+ 2 y1 + l = 0,
ïï d ïï
í 2 y1 - l - ï
( - 2 y2¢) = 0, Þ íï 2 y2¢¢+ 2 y2 - l = 0,
ïï dx ïï y - y = sin x.
ïï ïî 1
ïï y1 - y2 - sin x = 0,
2

ïïî
Складываем первое и второе уравнения:
( y1¢¢+ y2¢¢) + ( y1 + y2 ) = 0,
y1 + y2 = C1 cos x + C2 sin x.
Из граничных условий получаем систему
ìïï 1 + 1 = C1 ×1 + C2 ×0,
í C = 2, C2 = 0.
ïïî 1 - 1 = C1 ×0 + C2 ×1, 1
ìïï y1 + y2 = 2cos x,
í
ïïî y1 - y2 = sin x.
Добавляем уравнение связи
sin x
2 y1 = 2cos x + sin x, y1 = cos x + ,
2

81
sin x sin x
y2 = 2cos x - cos x - = cos x - .■
2 2
Пример 12.
1

J [ y] = ò y ¢ dx,
2
y ( 0) = 0; y ( 1) = 1;
0
1

ò xy dx = 0.
0

□ L = y ¢2 + l xy .
d
Уравнение Эйлера l x - ( 2 y ¢) = 0 .
dx
l l 3
y ¢¢= x, y = x + C1 x + C2 .
2 12
Определим l .
1

Так как ò xy dx = 0, то
0
1
æl 3 ö÷ l x 3
x 2
1 l C1 C2
ç
ò çè12
5
x ç x + C1 x + C 2 ÷
÷ dx = x + C1 + C 2 = + + = 0,
0
ø 60 3 2 0 60 3 2
l = - 20 C1 - 30 C2 .
Тогда
x3 æ 5 ö
y = ( - 20 C1 - 30 C2 ) × + C1 x + C2 = ççx - x 3 ÷ ÷
÷ C1 + ( 1- 5/ 2 x 3 ) C2 .
12 ç
è 3 ø
Постоянные найдем из граничных условий:
y ( 0) = 0 ×C1 + 1×C2 = 0, ü
ïï C2 = 0,
ï
æ 5 ö÷ æ 5ö ÷ ý 3
y ( 1) = çç1- ÷ ×C + ç1 - ÷ ×C = 1, ï C = - .
çè 3 ø÷ 1 èçç 2 ø ÷ 2 ïï 1
ïþ 2
5 3
Ответ: y = x3 - x . ■
2 2

Пример 13. J [ y ] = ò y sin x dx.


0

82
p
3p
y ( 0) = 0, y ( p ) = p ; ò y ¢2 dx = .
0
2
□ L = y sin x + l y ¢ . 2

d
1) Уравнение Эйлера: sin x - ( 2 l y ¢) = 0 .
dx
sin x 1
y ¢¢= , y = C2 + C1 x - sin x .
2l 2l
2) Определим множитель Лагранжа:
p p 2
3p æ 1 ö÷
ò y ¢ dx = 2 , тогда ò çççèC1 - 2 l cos xø÷÷ dx =
2

0 0
p
æ 2 C1 cos 2 ö
x÷ æ 2 C1 1 1 ö÷ p
= ò ççC1 - cos x + ÷
2 ÷
dx = ç C
ççè 1 x - sin x + x + sin 2 x ÷0 =
÷
çè l 4 l ø l 8l 2
16l 2
ø
0
p 3p 1
= C12 p + 2 = , l =± .
8l 2 2 3 - 2C1 2

3) Общее решение уравнения Эйлера


y = C2 + C1 x ± 3 - 2C12 sin x .
4) Постоянные C1 и C2 найдем из граничных условий
y ( 0) = 0:C2 + C1 ×0 ± 3 - 2C12 ×0 = 0, üïïï C2 = 0
ý .
ï C
y ( p ) = p :C2 + C1 ×p ± 3 - 2C1 ×0 = p ,ïïþ 1
2 = 0
Ответ: Два решения y = x - sin x, y = x + sin x .■

Пример 14.
1

J [ y1 , y2 ] = ò y ¢×y ¢dx ® extr, y ( 0) =


1 2 1 y2 ( 0) = y1 ( 1) = 0 y2 ( 1) = 1,
0
1 1

ò xy dx = 0, ò xy dx = 0 .
1 2
0 0

□ 1) Уравнения Эйлера ( L = y1¢×y2¢+ l 1 xy1 + l 2 xy2 ) :

83
ìï d
ïï l 1 x - ( y2¢) = 0, ìï y ¢¢= l x,
ï dx
Þ ïí 2 1
í
ïï d ïïî y1¢¢= l 2 x.
ïï 2 l x - ( y ¢
1 ) = 0,
ïî dx
ìï l
ïï y1 = 2 x3 + C1 x + C2 ,
ïí 6
ïï l1 3
ïï y2 = x + C3 + C4 .
ïî 6
2) Определим l 1 и l 2 :
1 1
æl 2 3 ö
÷ l 2 C1 C2
ç
ò xy 1 dx = 0 :ò çè 6x ç x + C1 x + C 2 ÷
÷
ø
dx = +
30 3
+
2
= 0 откуда
0 0
l 2 = - 10C1 - 15C2 ,
1 1
æl 1 3 ö÷ l 1 C3 C4
ç
ò xy 2 dx = 0 :ò çè 6
x ç x + C3 x + C 4
ø
÷
÷dx = +
30 3
+
2
= 0 , тогда
0 0
l 1 = - 10C3 - 15C4 .

3) Решение уравнений Эйлера


æ 5 ö æ 5 3 ö÷
y1 = ççx - x 3 ÷ ÷
÷C + çç1- x ÷C2 ,
çè 3 ø
1
èç 2 ø÷
æ 5 ö æ 5 3 ö÷
y2 = çççx - x 3 ÷÷
÷C + çç1- x ÷C4 .
è 3 ø 3
èç 2 ø÷
4) Найдем постоянные
y1 ( 0) = 0 : C2 = 0, y2 ( 0) = 0 : C4 = 0,
æ
5 ö÷
y1 ( 1) = 0 : çç1 -
÷C1 = 0, C1 = 0,
3 ø÷
çè
æ
5 ö÷ 3
y2 ( 1) = 1: ççç1 -
÷
÷C3 = 1, C3 = - .
è
3 ø 2
5 3
Ответ: y1 = 0, y2 = x3 - x . ■
2 2

3.2. Задачи для самостоятельного решения

84
1

1. J [ y ] = ò ( y ¢ + xy) dx, y ( 0) = y ( 1) = 0 .
2

0
1

2. J [ y ] = ò ( 12 xy + yy ¢+ y ¢2 ) dx, y ( 0) = 1, y ( 1) = 4 .
0
1

3. J [ y ] = ò ( y¢ + yy ¢+ 12 xy ) dx, y ( 0) = y ( 1) = 0 .
2

0
p

4. J [ y ] = ò ( 4 y cos x + y ¢2 - y ) dx, y ( 0) = y ( p ) = 0 .
0
ln 2
15
5. J [ y ] = ò ( y ¢ + 3 y ) e dx, y ( 0) = 0, y ( ln 2) =
2 2 2x
.
0
8
1

6. J [ y ] = ò y ¢¢¢ dx, y ( 0) = y ¢( 0) = y ¢¢( 0) = 0,


2

0
y ( 1) = 1, y ¢( 1) = 4, y ¢¢( 1) = 12.
p

7. J [ y ] = ò ( y ¢¢¢ - y ¢¢2 ) dx, y ( 0) = y ¢( 0) = y ¢¢( 0) = 0,


2

y( p ) = p , y ¢( p ) = 2, y ¢¢( p ) = 0.
p
2 æp ö æp ö÷
8. J [ y1 , y2 ] = ò( y1¢2 y2¢2 - 2 y1 y2 ) dx , y1 ( 0) = y2 ( 0) = 0 , y1 ççç ÷÷
÷ = y 2ç
ç ÷= 1 .
è2ø èç 2 ø÷
0
1

9. J [ y1 , y2 ] = ò 1 + y1¢2 + y2¢2 dx ,
0
y1 ( 0) = 1, y2 ( 0) = 2, y1 ( 1) = 2, y2 ( 1) = 1.

10. J [ y, z ] = ò ( y¢ + z¢ - zy ¢) dx; y ( 0) = 2, y ( 1) = e, z ( 0) = 1, z ( 1) = 0.
2 2

y = z + ex .

85
p
2 æp ö÷ p
y ( 0 ) = 0, y çç ÷= ,
11. J [ y, z ] =
ò( y ¢ + z ¢ - 2 z ¢sin x) dx;
2 2
çè 2 ø÷ 2
0
æp ö
z ( 0) = 1, z ççç ÷ ÷= 0, при условии y ¢= z - cos x.
è 2 ø÷
1
1
12. J [ y, z ] = ò ( 2 xy - z ¢2 ) dx; y ( 0) = 0, y ( 1) =
5
, z ( 0) = 2, z ( 1) = 3,
0

при условии y ¢- z + 2 = 0.
p
2
13. J [ y, z ] =
ò ( y¢ + z¢ - 2 zco s x - 2 y 2 ) dx;
2 2

0
æp ö æp ÷ ö
y ( 0) = 1, y ççç ÷ ÷= 0, z ( 0 ) = 1, z çç ÷= 2, y = z - 2sin x.
è 2 ø÷ çè 2 ÷
ø
p p

14. J [ y ] = ò y ¢ dx; y ( 0) = 0, y ( p ) = 1, ò y sin xdx = 0.


2

0 0
1 1
1 1 - 3e- z
15. J [ y ] = ò ( y ¢ + y ) dx; y ( 0) = 0, y ( 1) = , ò
2 2 - x
ye dx = .
0
e 0
4
p p
p
16. J [ y ] = ò y ¢2 dx, ò y cos xdx = ,
0 0
2
p

ò y sin xdx = p + 2, y ( 0) = 2, y ( p ) = 0.
0
2 2
7
17. J [ y ] = ò x y ¢ dx, ò xydx = y ( 1) = 1, y ( 2) = 2.
2 2
,
1 1
3
1 1
e2 + 1
18. J [ y ] = ò( y ¢ + y ) dx, ò y ( 0) = 0, y ( 1) = e.
2 2 x
ye dx = ,
0 0
4

3.3. Варианты заданий: «Простейшие задачи вариационного


исчисления»

Задача 1.

86
a1

а) Вычислить функционал J = ò F dx для заданных функций y1 и y2 .


a2

б) Написать уравнение Эйлера для функций F .

N F y1 y2 a1 a2
1 y2 y¢ sin x cos 2x p p
4 3
2 y ¢y x2 + 1 x + ex 0 2
3 xy + y ¢ e4 x x2 + 1 1 2
4 y ¢x - y arctg x e2 x 1 2
p p
5 2xy - y ¢ e3x sin 2x
6 3
p p
6 ex y + y¢ sin x x2
4 2
p p
7 y ¢sin x + y 2 cos x sin x
6 3
p p
8 yy ¢cos x sin x ex
4 3
p
9 yy ¢sin x cos x e2 x 0
4
10 e y ×x + xy ¢ x+ 1 x2 1 2
11 y ¢2 + 3 y 2 x2 + 3 e x ×x 1 2

12 2e y x + x2 x 1 2
1+ x
13 y - y¢ 2
x2 - x xe x 0 1
x2
14 xy ¢+ y ¢ 2
e x
+ x 0 1
4
15 xe y - ye x x2 1+ x 1 2
16 y ¢2 + y arctg x sin x 0 1
1
17 x 2 y ¢2 e2 x 1 2
x
p
18 y ¢2 - y sin x ex x2 0
4
87
19 e y ×x - y ¢×x 4x x2 1 2
20 y ¢2 + 4 y xe x x3 - x 2 1 2

21 + e y ×x x x2 1 2
x- 1
p p
22 yy ¢2 sin 2x cos3x
6 2
23 y ¢- e x y cos x x2 1 2
p p
24 y ¢y tg x sin x sin 2x
6 3
y ¢3
25 + yx x3 + x x2 0 1
x+ 1

Задача 2.

Найти экстремали функционала


2
N N
J [ y] = ò éë( N + 2) xy - y ¢ ùûdx; y ( 1) = , y ( 2) = .
2

1
3 2
Где N - номер по списку.

Задача 3.
Найти экстремали, с заданным уравнением связи
2

J [ y1 , y2 ] = ò ( y¢ + y2¢2 ) dx;
2
1
1

N N N+1 N+1
y1 ( 1) = , y2 ( 1) = , y1 ( 2) = , y2 ( 2) = ,
2 3 2 3
y1 + y2 - Nx 2 + x + N = 0. N - номер по списку.

3.4. Задачи с подвижными границами

Дан функционал
x1

J [ y] = ò F ( x, y, y ¢) dx; x0 , x1 Î [ a, b ]
x0

88
и условия y ( x0 ) = j ( x0 ) , y ( x1 ) = y ( x1 ) .
Схема решения:
d
1. Из уравнения Эйлера Fy¢- Fy¢¢ = 0 находим y = y ( x, C1 , C2 ) .
dx
2. Запишем условия трансверсальности
éF + ( j ¢- y ¢) ×F ¢¢ù = 0
ëê ú
y û x= x0

éF + ( y ¢- y ¢) ×F ¢¢ù = 0
êë y úûx= x1
и уравнения связи
y ( x0 , C1 , C2 ) = j ( x0 )
y ( x1 , C1 , C2 ) = y ( x1 ) .
3. Решаем их совместно и определяем C1 , C2 и концы отрезка [ x0 , x1 ] .
Замечание: Если на одном из концов искомой кривой y ( x )
задано обычное граничное условие, т.е. y ( a ) = y0 или y ( b) = y1 , то
условие трансверсальности следует записать только для другого
конца кривой.

Задача 1.
x1

J [ y] = ò y ¢ dx,
2
y ( 0) = 0; y ( x1 ) = - x1 - 1.
0

d d
□ F = y ¢ , Fy¢= 0, Fy¢¢ = 2 y ¢
2
Fy¢¢ = ( 2 y ¢) = 2 y ¢¢.
dx dx
Уравнение Эйлера - 2 y ¢¢= 0, y ¢= C1 , y = C1 x + C2 .
Условие трансверсальности
éy ¢2 + ( - 1- y ¢) 2 y ¢ù = 0 т.к. y ¢ = C1 то
ë ûx= x1 x= x1

ìï C12 + ( 1 - C1 ) 2C1 = 0, C1 = - 2,
ïï
ïí C ×0 + C = 0, C2 = 0,
ïï 1 2

ïïî C1 x1 + C2 = - x1 - 1, x1 = 1.
Ответ: y = - 2 x, x1 = 1 . ■

Задача 2.
89
x1

J [ y] = ò 1 + y ¢2 dx y ( x0 ) = x02 , y ( x1 ) = x1 - 5 .
x0


□ F = 1 + y ¢ , Fy¢¢ =
2
.
1 + y ¢2
dæ çç y ¢ ÷
ö
÷

= C,
Уравнение Эйлера - ç ÷ = 0 , тогда
ç
dx è 1 + y ¢ ø÷2 ÷ 1+ y ¢2

C
y ¢2 = C 2 + C 2 y ¢2 , y ¢= 2
= C1 , тогда y = C1 x + C2 .
1- C
Условия трансверсальности совместно с уравнениями связи,
учитывая, что y ¢x= x0 = C1 и y ¢x= x1 = C1 :
ìï C
ïï 1 + C12 + ( 2 x0 - C1 ) = 0,
ïï 1 + C1 2
ïï
ïï C1
í 1 + C 1
2
+ ( 1 - C1 ) = 0,
ïï 1 + C1 2

ïï
ïï C1 x0 + C2 = x02 ,
ïï
ïî C1 x1 + C2 = x1 - 5.
Решаем совместно и получаем
C1 = - 1, C2 = 3 , x0 = 1 , x1 = 23 .
4 2 8
3
Ответ: y = - x + , x0 = 1 2 , x1 = 23 8 .■
4
Если граничное условие для y ( x0 ) не дано, то записываем
естественное граничное условие
éF ¢¢ù = 0 .
êë y úû x= x0

Задача 3. Найти экстремали функционала


1

J [ y] = ò ( y ¢ + y) dx ; y ( 1) = 0 .
2

0
d
□ 1. Уравнение Эйлера 1 - ( 2 y ¢) = 0 ,
dx
90
x x2
y ¢¢= 1 , y ¢= + C1 , y= + C1 x + C2 .
2 2 4
æx ö
2. éêëFy¢¢ù
ú
ûx= 0 = 0, F ¢ = 2 y ¢ = 2 ×ç
ççè + C ÷ .

y ¢ x= 0 x= 0
2 ø÷x= 0
Получаем систему
ïìï æ ç 0 ö÷
2
ïï ççè 2 × + C 1÷÷= 0,
ïí ø
ïï 1
ïï + C1 ×1 + C2 = 0,
ïî 4
C1 = 0, C2 = 1 .
4

1 2
y=
4
( x - 1) . ■

3.5. Варианты заданий: «Задачи с подвижными границами»

В каждом варианте (N) решить две задачи.


x1

1. Дано: J = ò F dx и
1 y ( x0 ) = j ( x0 ) , y ( x1 ) = y ( x1 ) .
x0

Найти y ( x ) и концы отрезка[ x, x1 ] , (если y ( 0) = 0 , тогда x0 = 0 ).


1

2. Дано: J = ò F dx и
2 y ( 1) = A . Найти y ( x ) .
0
N F1 y ( x0 ) y ( x1 ) F2 y ( 1)
1. 1 + 2 y ¢2 2 x0 - 1 4 x12 - 5 2 y ¢2 + 3 y 4
2. 4 y ¢2 x0 + 1 6 x12 - 7 4 y ¢2 + y 2 5
3. - 4 y + 2 y ¢2 y ( 0) = 0 3 x12 - 8 9 y ¢2 - y 2 1
4. 3 y ¢2 + 1/ 3 y ( 0) = 0 2 x12 - 9 y ¢2 + y ¢- 2 y 3
5. - 6 y ¢2 8x02 x1 - 10 y ¢2 + y ¢+ 3 y 5
6. - 7 y + 3,5 y ¢2 y ( 0) = 0 3 x12 - 8 y ¢2 + y 2 1
7. 1/ 5 + 5y ¢2 y ( 0) = 0 5 x12 - 7 y ¢2 + y 0
8. 7 y ¢2 x0 + 7 2 x12 - 3 2 y ¢2 + 3 y ¢- 4 y 4
91
9. 5 y ¢2 + 1 5 x0 - 3 x12 - 2 5 y ¢2 + 6 y ¢+ 9 y 6
10. 8 y ¢2 - 16 y y ( 0) = 0 7 x12 - 1 16 y ¢2 - 4 y 2 1
11. 2 y ¢2 + 1/ 2 y ( 0) = 0 5 x12 - 3 25 y ¢2 + 9 y 2 2
12. 6 y ¢2 x0 + 3 3x12 - 4 4 y ¢2 + 3 y 2 3
13. - 5y ¢2 3x02 x1 - 5 16 y ¢2 - y 2 7
14. 1 + 7 y ¢2 7 x0 - 4 2 x12 - 7 y ¢2 + 2 y ¢+ y 2
15. - 6 y + 3 y ¢2 y ( 0) = 0 2 x12 - 5 3 y ¢2 + 4 y ¢- y 3
16. 4 y ¢2 + 1/ 4 y ( 0) = 0 6 x12 - 4 2 y ¢2 + y 2 6
17. - 3y ¢2 7x02 x1 - 9 4 y ¢2 - y 8
18. 3 y ¢2 + 1 3 x0 - 5 3x12 - 9 4 y ¢2 + y ¢- 4 y 9
19. - 5 y + 4 y ¢2 y ( 0) = 0 5 x12 - 11 36 y ¢2 + y 2 3
20. 1/ 9 + 9 y ¢2 y ( 0) = 0 4 x12 - 13 36 y ¢2 - 9 y 2 5
21. 12 y ¢2 x0 + 11 13 x12 - 3 4 y ¢2 - 7 y ¢ 2
22. - 8y ¢2 15x02 x1 - 14 8 y ¢2 + 10 y ¢ 7
23. 1 + 6 y ¢2 9 x0 - 1 3 x12 - 13 2 y ¢2 + 2 y ¢- 3 y 5
24. - 9 y + y ¢2 y ( 0) = 0 9 x12 - 17 5 y ¢2 + 3 y ¢+ y 7
25. 1/10 + 10 y ¢2 y ( 0) = 0 7 x12 - 19 100 y ¢2 - 25 y 2 3
3.6. Варианты заданий: «Задачи по оптимальному
управлению»
1. Остановка точки, движущейся по инерции, в заданной точке за
кратчайшее время.
x ¢¢( t ) = u ( t ) , x ( 0) = a 1 , x&( 0) = a 2 , x ( T ) = 0, x&( T ) = 0,
k1 £ u ( t ) £ k2 , T ® min.
N a1 a2 k1 k2
1 -2 2 -2 1
2 -2 0 -2 1
3 -2 -2 -2 1
4 1 2 -2 1
5 1 1 -2 1
6 0 1 -2 1
7 0 -1 -2 1
92
8 -2 1 -1 2
9 -2 -1 -1 2
10 -2 0 -1 2
11 1 1 -1 2
12 1 -1 -1 2
13 2 0 -1 2
14 -1 1 -2 2
15 -1 0 -2 2
16 -2 -1 -2 2
17 1 -1 -2 2
18 1 2 -2 2
19 0 2 -2 2
20 0 -2 -2 2
21 -2 1 -1 1
22 -1 1 -1 1
23 -2 0 -1 1
24 2 0 -1 1
25 2 1 -1 1
2. Остановка математического маятника в верхнем положении
неустойчивого равновесия за кратчайшее время.
x ¢¢( t ) = x ( t ) + u ( t ) , x ( 0) = a 1 , x&( 0) = a 2 , x ( T ) = 0, x&( T ) = 0,
k1 £ u ( t ) £ k2 , T ® min
N a1 a2 k1 k2
1 -0,2 -0,4 -2 1
2 -0,2 0,8 -2 1
3 -0,2 1 -2 1
4 0,2 -0,8 -2 1
5 0,2 -1 -2 1
6 -0,2 -0,4 -2 1
7 -0,2 0,4 -2 1
8 -0,2 1 -1 2
9 -0,2 2 -1 2
10 0,2 0,2 -1 2
11 0,2 -0,4 -1 2
12 0,2 -1 -1 2
13 0,2 -0,4 -1 2

93
14 -0,2 1 -2 2
15 -0,2 0,1 -2 2
16 -0,2 0,6 -2 2
17 0,2 0,2 -2 2
18 0,2 -1,2 -2 2
19 0,2 0,2 -2 2
20 -0,2 0,4 -2 2
21 -0,2 2 -1 1
22 0,2 -0,7 -1 1
23 0,2 -0,2 -1 1
24 0,2 0,4 -1 1
25 -0,2 -0,4 -1 1

94

Вам также может понравиться