Вы находитесь на странице: 1из 105

Оглавление

1. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ................................................................................3
1.1. Управляемость и наблюдаемость линейных систем.................................3
1.2. Стабилизируемость и выявляемость..........................................................5
1.3. Уравнение Гамильтона-Якоби-Беллмана...................................................8
2. СОГЛАСОВАННАЯ И НЕСОГЛАСОВАННАЯ НЕОПРЕДЕЛЕННОСТИ...................10
2.1. Введение....................................................................................................10
2.2. Согласованная неопределенность...........................................................12
2.3. Несогласованная неопределенность.......................................................18
2.4. Неопределенность во входной матрице..................................................25
2.5. Выводы.......................................................................................................36
3. ИНТЕРВАЛЬНОЕ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ СИСТЕМАМИ.........................37
3.1. Введение....................................................................................................37
3.2. Согласованная неопределенность...........................................................38
3.3. Несогласованная неопределенность.......................................................44
3.4. Неопределенность во входной матрице..................................................50
3.5. Выводы.......................................................................................................66
4. ПОДХОД ХАРИТОНОВА.....................................................................................67
4.1. Введение....................................................................................................67
4.2. Предварительные теоремы.......................................................................68
4.3. Теорема Харитонова..................................................................................78
4.4. Синтез управления на основе теоремы Харитонова...............................81
4.5. Выводы.......................................................................................................83
5. РЕГУЛЯТОРЫ H2 иH∞........................................................................................84
5.1. Введение....................................................................................................84
5.2. Функциональные пространства................................................................85
5.3. Вычисление норм H2 И H∞........................................................................88
5.4. Задача интервального управления как задача H2 И H∞ управления. . .95
5.5. Синтез управления H2/H∞.........................................................................98

1. ДОПОЛНИТЕЛЬНЫЕ ГЛАВЫ
1.1.Управляемость и наблюдаемость линейных систем
Прежде чем мы обсудим управляемость и наблюдаемость линейных систем,
давайте рассмотрим следующий пример, который хорошо иллюстрирует эти
свойства.

2
Пример 1.1

Предположим, у нас есть следующая система:

 2 3 2 1 1 
− 2 − 3 0 0  − 2
x =  x +  u
− 2 − 2 − 4 0   2
   
 − 2 − 2 − 2 − 5  − 1
y = [ 7 6 4 2] x

Передаточная функция данной системы равна

Hs=CsI-A-1B+D=s3+9s2+26s+24s4+10s3+35s2+50s+24=1s+1

Действительно, порядок системы, представленной в пространстве состояний,


равен 4, но передаточная функция представляется лишь первым порядком.
Это происходит вследствие сокращения подобных членов. Для того чтобы
понять, что это означает, давайте переведем систему в Жорданову форму с
помощью преобразования: z=T-1x, где матрица T равна

 1 −1 0 0 
− 1 2 − 1 0 
T = 
 0 − 1 2 − 1
 
0 0 −1 2 

Для новой переменной z, уравнение в пространстве состояний будет равно:

− 1 0 0 0  1 
 0 −2 0 0  0
z =  z+ u
0 0 − 3 0  1 
   
0 0 0 − 4 0 
y = [1 1 0 0] z

3
Рис. 1.1 Диаграмма системы, приведенной в примере 1.1.

Для системы, показанной на рисунке 1.1, управляемыми являются лишь


переменные z1 и z3 (на них оказывает воздействие вход u), и только две
переменные z1 и z2 являются наблюдаемыми по выходу y.

Интуитивно, система называется управляемой, если можно управлять всеми


ее переменными состояния, т.е. их значения можно изменить с помощью
входных переменных. Система называется наблюдаемой, если можно
получить все ее переменные состояния, т.е. их значения могут быть
определены по выходу. Управляемость гарантирует, что с помощью обратной
связи мы можем передвинуть собственные числа или полюса системы в любую
желаемую область для достижения устойчивости и оптимальности.
Наблюдаемость гарантирует, что с помощью выхода мы можем оценить или
восстановить переменные состояния и отсюда организовать необходимую
обратную связь.

Наблюдаемость (observability)

Система

x=Ax+Bu

y=Cx+Du

называется наблюдаемой, если на конечном интервале t∈[0,∆] времени по


выходу системы y(∆)в конце этого интервала при известном управляющем
воздействии u(0) можно определить все начальные компоненты вектора
состояния x0=x0.
4
Управляемость (controllability)

Линейная система

x=Ax+Bu

y=Cx+Du

является управляемой, если существует такой вход, который переводил бы


начальное состояние системы xt1=x1 в конечное состояние xt2=x2, за
конечный интервал времени [t1,t2].

1.2.Стабилизируемость и выявляемость

В иностранной литературе помимо свойств управляемости и наблюдаемости


вводят еще понятия стабилизируемости (stabilizability) и выявляемости
(detectability).

Стабилизируемость

Линейная система

x=Ax+Bu

y=Cx+Du

является стабилизируемой если все ее неустойчивые собственные числа


управляемы.

Следующие два достаточных условия могут быть легко получены из


определения стабилизируемости:

1. Если система устойчива, то она стабилизируема.


2. Если система управляема, то она стабилизируема.

Необходимое и достаточное условия для проверки стабилизируемости


представляют более сложную задачу, так как вначале мы должны найти все
собственные вектора системы и затем определить являются ли собственные
числа управляемыми или нет.

Теорема 1.1

Собственные числа λi∈λA=λ(AT) линейной стационарной системы (A,B)


являются управляемыми тогда и только тогда, когда их соответствующий
собственный вектор vi от AT удовлетворяет условию viTB≠0.

Доказательство:

Докажем данную теорему для случая, когда все собственные числа λ1 λ2… λn
матрицы А являются действительными и различными. В этом случае мы знаем,
что существует матрица трансформации T, такая что

5
λ1 0 ... 0 
0 λ ... 0 
~
A = T AT = 
−1 2

 ... ... ... ... 


 
0 0 ... λn 

~
B = T −1 B

С другой стороны, мы знаем, что матрица, составленная из собственных


векторов системы

V=v1v2…vn

позволяет получить:

λ1 0 ... 0 
0 λ2 ... 0 
V −1 AT V = 
 ... ... ... ... 
 
0 0 ... λn 

Транспонируем эту матрицу

λ1 0 ... 0 
0 λ2 ... 0  ~
=
−1
V T AV T =A
 ... ... ... ... 
 
0 0 ... λ n 

Отсюда, мы можем предположить, что T=VT-1 или T-1=VT. Следовательно

v1T  v1T B 
 T  T 
~  v2  v B
−1
B =T B = B= 2 
 ...   ... 
 T  T 
v n  v n B 

Так как A является жордановой формой, ясно, что λi управляема тогда и


только тогда, когда viTB≠0 (т.е. на нее можно оказать воздействие).

Проверка стабилизируемости является более сложной задаче чем проверка


управляемости. Так как управляемость обеспечивает стабилизируемость, мы
можем вначале проверять управляемость. Если система управляема, то мы
знаем, что она стабилизируема. Если нет, то тогда нам надо проверять
свойство стабилизируемости так, как это показано в следующем примере.

Пример 1.2
6
Рассмотрим следующую систему

− 10 − 9 − 6 − 3 1 
 22 21 16 8   − 2
x =  x +  u
− 14 − 14 − 12 − 4 2
   
−2 − 2 − 2 − 5  − 1
y = [7 6 4 2] x

Собственные числа для AT равны λ1=-1,λ2=2,λ3=-3 и λ4=-4. Соответствующие


собственные вектора матрицы AT

 − 0.7303 0.6255 − 0.5547 0.5000


− 0.5477 0.6255 − 0.5547 0.5000
v1 =   v2 =   v3 =   v4 =  
 − 0.3651 0.4170 − 0.5547 0.5000
       
− 0.1826 0.2085 − 0.2774 0.5000

Для того, чтобы система была стабилизируема, необходимо чтобы


собственное число λ2=2 было управляемо; т.е. v2TB≠0. Тем не менее

v2TB=0.62550.62550.41700.20851-22-1=0

Следовательно, система не стабилизируема.

Выявляемость

Выявляемость является дуальным свойством по отношению к


стабилизируемости. Для выявляемости, мы рассмотрим наблюдаемость
собственных чисел λi∈λ(A). λi является ненаблюдаемым, если ∀Gλi∈λ(A+GC).

Линейная стационарная система

x=Ax+Bu

y=Cx+Du

является выявляемой, если все неустойчивые собственные числа является


наблюдаемыми.

Теорема 1.2

Собственные числа λi∈λA линейной стационарной системы (A,С) являются


наблюдаемыми тогда и только тогда, когда их соответствующий собственный
вектор vi от A удовлетворяет условию Cvi≠0.

Доказательство:

Докажем данную теорему для случая, когда все собственные числа λ1 λ2… λn
матрицы А являются действительными и различными. В этом случае мы знаем,
что существует матрица трансформации T

T=v1v2…vn
7
которая позволяет получить:

λ1 0 ... 0 
0 λ2 ... 0 
~
A = T −1 AT = 
 ... ... ... ... 
 
0 0 ... λ n 

Так как

C=CT=Cv1v2…vn=Cv1Cv2…Cvn

то становится понятно, что λi наблюдаема тогда и только тогда, когда Cvi≠0.

Пример 1.3

Рассмотрим систему

− 10 − 9 − 6 − 3 1 
 22 21 16 
8   − 2
x =  x +  u
− 14 − 14 − 12 − 4 2
   
 − 2 − 2 − 2 − 5  − 1
y = [ 7 6 4 2] x

Собственные числа для A равны λ1=-1,λ2=2,λ3=-3 и λ4=-4. Соответствующие


собственные вектора матрицы A

 − 0.7303 0.6255 − 0.5547 0.5000


− 0.5477 0.6255 − 0.5547 0.5000
v1 =   v2 =   v3 =   v4 =  
 − 0.3651 0.4170 − 0.5547 0.5000
       
− 0.1826 0.2085 − 0.2774 0.5000

Для того чтобы система была выявляема, необходимо чтобы собственное


число λ2=2 было наблюдаемо; т.е. Cv2≠0.

Cvi=76420.4082-0.81650.40820=-0.4082≠0

Следовательно, система является выявляемой.

1.3.Уравнение Гамильтона-Якоби-Беллмана

Давайте применим принцип оптимальности для нахождения оптимального


управления нелинейных систем. Давайте рассмотрим текущий момент
времени t и будущий момент t+∆t, близкий к t и управление в течение этого
интервала времени [t,t+∆t).

Оценочный функционал может быть записан:

8
Jx,t=ttfLx,udτ=tt+∆tLx,udτ+t+∆ttLx,udτ=tt+∆tLx,udτ+J(x+∆x,t+∆t)

где x+∆x это состояние в момент времени t+∆t и ∆x приблизительно будет


равна ∆x=f(x,u)∆t. Обозначим через * минимальное значение оценочного
функционала для оптимального управления, тогда согласно принципу
оптимальности:

J*x,t=minuτ∈Rm,t≤τ≤t+∆ttt+∆tLx,udτ+J*(x+∆x,t+∆t)

В приведенном выше уравнении, tt+∆tLx,udτ может быть аппроксимировано с


помощью L(x,u)∆t и J*(x+∆x,t+∆t) может быть аппроксимировано с помощью
уравнения Тейлора:

J*x+∆x,t+∆t=J*x,t+∂J*∂tT∆x+∂J*∂t∆t

Таким образом

J*x,t=minuτ∈Rm,t≤τ≤t+∆tLx,u∆t+J*x,t+∂J*∂tT∆x+∂J*∂t∆t

Так как J*x,t и ∂J*∂t∆t не зависят от uτ∈Rm,t≤τ≤t+∆t, указанное выше


уравнение может быть записано

J*x,t=J*x,t+∂J*∂t∆t+minuτ∈Rm,t≤τ≤t+∆tLx,u∆t+∂J*∂tT∆x

или

-∂J*∂t∆t=minuτ∈Rm,t≤τ≤t+∆tLx,u∆t+∂J*∂tT∆x

-∂J*∂t=minuτ∈Rm,t≤τ≤t+∆tLx,u+∂J*∂tT∆x∆t

Пусть ∆t→0, тогда ∆x∆t→x=f(x,u). Следовательно, мы получим следующее


уравнение Гамильтона-Якоби-Беллмана

-∂J*∂t=minuτ∈RmLx,u+∂J*∂tTf(x,u)

Очень часто будут рассматриваться стационарные системы, которые не


зависят от времени. Для таких систем J*x,t не зависит от t. Следовательно,
уравнение выродится в форму:

minuτ∈RmLx,u+∂J*∂tTf(x,u)=0

2. СОГЛАСОВАННАЯ И НЕСОГЛАСОВАННАЯ
НЕОПРЕДЕЛЕННОСТИ
2.1.Введение

В этой главе мы обсудим вопрос робастного управления линейных


стационарных систем вида

x=Ax+Bu

9
где x∈Rn и u∈Rm вектор состояния и вектор управляющих воздействий
соответственно. Матрицы A и B являются неопределенными. Следующий
пример покажет типы неопределенностей А и В.

Пример 2.1

Рассмотрим схему, приведенную на рисунке 2.1. с одним источником питания,


двумя катушками и тремя сопротивлениями.

Применяя правила Кирхгоффа, мы можем записать:

vin=R1i1+L1di1dt+R2(i1-i2)

R2i1-i2=L2di2dt+R3i2

Рис. 2.1 Электрическая схема системы для иллюстрации различных типов


неопределенностей

Выберем в качестве переменных состояния силы токов i1 и i2, в этом случае


мы получим следующие уравнения:

di1dtdi2dt=-(R1+R2)/L1R2/L1R2/L2-(R2+R3)/L2i1i2+1/L10vin

Если значение R1 не определено, то разница между действительным


значением R1 и номинальным R10, называемая неопределенностью в матрице
А, может быть представлена в виде:

AR1-AR10=-(R1+R2)/L1R2/L1R2/L2-(R2+R3)/L2--(R10+R2)/L1R2/L1R2/L2-
(R2+R3)/L2=-∆R1/L1000=1/L10-∆R10

где ∆R1=R1-R10 это отклонение R1от номинального значения. Заметим, что


размерность матрицы неопределенности ∆R1 (т.е. в данном случае имеется в
виду 1/L10) совпадает с размерностью матрицы B. Именно поэтому мы можем
представить нашу неопределенность в виде: AR1-AR10=Bϕ(R1).

Если R2 не определено, то неопределенность матрицы А в данном случае


представима в виде:

AR2-AR20=-(R1+R2)/L1R2/L1R2/L2-(R2+R3)/L2--(R1+R20)/L1R20/L1R20/L2-
(R20+R3)/L2=-∆R2/L1∆R2/L1∆R2/L2-∆R2/L2

10
где ∆R2=R2-R20. Заметим, что для R2 неопределенность не совпадает с
размерностью В (нам не удастся выделить матрицу ϕ(R2), чтобы получилось
выражение AR2-AR20=Bϕ(R2)), это значит что условие согласования не
выполняется. По сути, мы можем провести декомпозицию указанной выше
неопределенности на согласованный и несогласованный компоненты
следующим образом:

AR2-AR20=-∆R2/L1∆R2/L1∆R2/L2-∆R2/L2=-∆R2/L1∆R2/L100+00∆R2/L2-∆R2/L2

где согласованный компонент представляется следующим образом,

-∆R2/L1∆R2/L100=1/L10-∆R2∆R2

а несогласованный компонент

00∆R2/L2-∆R2/L2

Аналогично можно рассмотреть неопределенность R3

AR3-AR30=-(R1+R2)/L1R2/L1R2/L2-(R2+R3)/L2--(R1+R2)/L1R2/L1R2/L2-
(R2+R30)/L2=000-∆R3/L2

где ∆R3=R3-R30. Заметим, что для R3, неопределенность полностью


несогласованная.

Если значение L1 не определено, то неопределенны обе матрицы А и В.


Неопределенность в В выражается в виде:

BL1-BL10=1/L10-1/L100=∆L10

где ∆L1=1L1-1L10. Неопределенность А представляется

AL1-AL10=-(R1+R2)/L1R2/L1R2/L2-(R2+R3)/L2--(R1+R2)/L10R2/L10R2/L2-
(R2+R3)/L2=-(R1+R2)∆L1R2∆L100=1/L10-R1+R2L1∆L1R2L1∆L1

Заметим, что неопределенность L1 является согласованной для матрицы А.

Если L2 не определено, то неопределенность А представляется в виде:

AL2-AL20=-(R1+R2)/L1R2/L1R2/L2-(R2+R3)/L2--(R1+R2)/L1R2/L1R2/L20-
(R2+R3)/L20=00R2∆L2-(R2+R3)∆L2

где ∆L2=1L2-1L20

Держа эти примеры в уме, рассмотрим систему, которая удовлетворяет


условию согласованности.

2.2.Согласованная неопределенность

Система управления описывается в виде:

x=Apx+Bu

где p∈P вектор параметрической неопределенности. Вначале мы рассмотрим


случай, когда условие согласованной неопределенности выполняется,
другими словами матрица А может быть записана в виде: Ap-Ap0=Bϕ(p) (здесь

11
p0- номинальное значение параметров системы). Так как мы собираемся
перевести задачу интервального управления, в задачу оптимального
управления, мы должны гарантировать, что такое решение существует. Для
вышеуказанной линейной системы, задача оптимального управления
представляет собой задачу линейно- квадратичного регулирования. Решение
задачи линейно-квадратичного регулирования существует, если система
является стабилизируемой. Таким образом, мы сделаем следующие
допущения.

Предположение 2.1

Существует номинальное значение p0∈P, такое что матрица (Ap0,B)


стабилизируема (см. п. 1.3).

Предположение 2.2

Для любого p∈P, существует матрица ϕ(p) такая, что можно записать

Ap-Ap0=Bϕ(p) 2.1
и при этом ϕ(p) является ограниченной.

Нашей первой целью будет решение задачи интервального управления, а


именно – стабилизации системы с неопределенностью.

Задача интервального управления 2.1

Найти обратную связь u=Kx, такую, что замкнутая система

x=Ap0x+Bu+Bϕpx=Ap0x+BKx+Bϕpx

будет асимптотически устойчивой для всех p∈P.

Мы не будем пытаться решить указанную выше задачу прямо, так как


непосредственное (прямое) решение является очень сложным. Наш подход
это неявное (не прямое) решение данной задачи. Так как мы считаем, что
данные системы – линейны, то задача оптимального управления становится
задачей линейно-квадратичного регулирования. Покажем это в дальнейшем.

Задача линейно-квадратичного регулирования 2.2

Для номинальной системы

x=Ap0x+Bu

найти обратную связь u=Kx, которая минимизирует оценочную функцию

0∞(xTFx+xTx+uTu)dt

где F – верхняя граница неопределенности ϕpTϕp, такая что для всех p∈P

ϕpTϕp<F 2.2
Существование верхней границы гарантировано предположением 2.2
(ограниченность ϕp). Любая F, которая удовлетворяет уравнение 2.2. может
быть использована в задаче линейно-квадратичного регулирования.

12
Для решения задачи линейно-квадратичного регулирования, мы должны
вначале решить алгебраическое уравнение Риккати (замечу, что R=R-1=I)

A(p0)TS+SAp0+F+I-SBBTS=0

для S. Затем решение задачи линейно-квадратичного регулирования


получается равным u=-BTSx. Следующая теорема показывает, что мы можем
решить задачу интервального управления с помощью решения задачи
линейно-квадратичного регулирования.

Теорема 2.1

Задача интервального управления 2.1. решаема с предположениями 2.1 и 2.2.


Более того, решение задачи линейно-квадратичного регулирования 2.2.
является решением задачи интервального управления.

Доказательство:

Так как (Ap0,B) стабилизируема и F≥0, то решение задачи линейно-


квадратичного регулирования существует. Предположим, что решение
ищется в виде: u=Kx. Нам необходимо доказать, что решение этой задачи
также является решением задачи интервального регулирования, т.е.
доказательством того, что

x=Ap0x+BKx+Bϕpx 2.3
асимптотически устойчиво для всех p∈P.

Для доказательства этого факта, рассмотрим функцию

Vx0=minu∈Rm0∞(xTFx+xTx+uTu)dt

которую необходимо минимизировать. Мы покажем, что V(x) является


функцией Ляпунова для системы 2.3. По определению V(x) должна
удовлетворять уравнению Гамильтона-Якоби-Беллмана

minu∈RmLx,u+∂J*∂xTfx,u=0

которое вырождается до вида

minu∈RmxTFx+xTx+uTu+VxT(Ap0x+Bu)=0

где Vx=(∂V/∂x). Так как u=Kx является оптимальным управлением, то должно


выполняться:

1. минимум функции равен 0;


2. производная xTFx+xTx+uTu+VxT(Ap0x+Bu) по u равна нулю.

xTFx+xTx+xTKTKx+VxTAp0+BKx=0 2.4
2xTKT+VxTB=0 2.5
На основании вышеприведенных двух уравнений, мы можем показать, что V(x)
является функцией Ляпунова для системы 2.3. Очевидно, что

Vx>0 x≠0

Vx=0 x=0

Покажем, что Vx<0 для всех x≠0


13
Vx=VxTx=VxTAp0x+BKx+Bϕpx=VxTAp0+BK+Bϕpx

Из уравнение 2.4.

VxTAp0+BKx=-(xTFx+xTx+xTKTKx)

Из уравнения 2.5.

VxTBϕpx=-2xTKTϕpx

Таким образом,

Vx=-xTFx-xTx-xTKTKx-2xTKTϕpx==-xTFx-xTx-xTKTKx-2xTKTϕpx-
xTϕpTϕpx+xTϕpTϕpx=-xTFx+xTϕpTϕpx-xTx-xTKTKx-2xTKTϕpx-xTϕpTϕpx==-xTF-
ϕpTϕp-xTx-xT(K+ϕp)T(K+ϕp)x≤-xTx

Другими словами

Vx<0 x≠0

Vx=0 x=0

Таким образом, по теореме Ляпунова, система 2.3. является устойчивой для


всех p∈P. Другими словами u=Kx является решением задачи интервального
управления 2.1.

Пример 2.2.

Рассмотрим следующую систему второго порядка

x1x2=011+ppx1x2+01u

где p∈-10,1. Мы хотим организовать регулятор u=Kx такой, что замкнутая


система устойчива для всех p∈-10,1.

Для того чтобы перевести эту задачу в задачу линейно-квадратичного


регулирования, выберем в качестве p0=0 и проверим управляемость матрицы
(Ap0,B). Матрица управляемости в данном случае будет иметь вид:

BAp0B=0110

Так как это матрица полного ранга, то номинальная система устойчива. Так
как первоначальную системы мы можем записать в виде

x1x2=0110x1x2+01u+01ppx1x2

то можно говорить о том, что свойство согласованности выполняется.

Определим матрицу F

ϕpTϕp=pppp=p2p2p2p2≤100100100100=F

Таким образом, соответствующая задача линейно-квадратичного


регулирования будет представлена в виде: для номинальной системы

x1x2=0110x1x2+01u

необходимо найти обратную связь u=Kx, которая минимизирует оценочный


функционал
14
0∞xTFx+xTx+uTudt=0∞xTF+Ix+uTudt

Для задачи линейно-квадратичного регулирования матрицы Q и R


соответственно равны:

Q=F+I=101100100101

R=I=1

Чтобы решить задачу линейно-квадратичного регулирования необходимо


найти решение алгебраического уравнение Риккати (решение может быть
найдено, например, с помощью Matlab)

SA+ATS+Q-SBR-1BTS=0

Матрица S будет равна:

S=12.099511.099511.099511.0995

Собственные числа для различных значений p

p λ1 λ2
1 -9.0995 -1
0 -10.0995 -1
-1 -11.0995 -1
-5 -15.0995 -1
-10 -20.0995 -1
Соответствующее управление будет равно: u=-R-1BTSx

u=-11.0995-11.0995x

Итак, нашей целью было стабилизировать систему. Тем не менее, в некоторых


случаях нам нужно не только стабилизировать систему, но еще и обеспечить
некоторый запас устойчивости. Эта задача решается далее. Если мы усилим
наше допущение тем, что (Ap0,B) устойчива, то мы можем не только
стабилизировать систему, но еще и разместить полюса левее некоторого
значения –γ, где γ это некоторое положительное действительное число.
Другими словами, мы будем решать следующую задачу размещения полюсов
в интервальной системе.

Задача размещения полюсов в интервальной системе 2.3

Для произвольного положительного действительного числа γ, найдем


обратную связь u=Kx, такую, что все корни замкнутой системы

x=Ap0x+Bu+Bϕpx=Ap0x+BKx+Bϕpx

лежат левее –γ для всех p∈P.

Эта задача может быть решена с помощью задачи линейно-квадратичного


регулирования.

Задача линейно-квадратичного регулирования 2.4

Для вспомогательной системы

x=Ap0x+Bu+γx
15
найти обратную связь u=Kx, которая минимизирует оценочную функцию

0∞xTFx+xTx+uTudt

где F – супремум неопределенности ϕpTϕp определялся в 2.2.

Следующая теорема показывает, что результат, получаемый переводом


задачи интервального управления в задачу линейно-квадратичного
регулирования, является корректным.

Теорема 2.2

При предположении о том, что (Ap0,B) управляема и устойчива, задача


размещения полюсов в интервальной системе решаема. Более того, решение
задачи линейно-квадратичного регулирования 2.4. является решением задачи
размещения полюсов в интервальной системе 2.3.

Доказательство

Так как (Ap0,B) устойчива, то отсюда (Ap0+γI,B) тоже устойчива (для всех
положительных действительных значений γ), следовательно, решение задачи
линейно-квадратичного регулирования существует. По теореме 2.1. его
решение u=Kx обладает следующим свойством: система

x=Ap0x+BKx+γx+Bϕpx

асимптотически устойчива для всех p∈P, то есть

∀p∈P∀s,Re(s)≥0sI-Ap0-γI-BK-Bϕ(p)≠0

⇒∀p∈P∀s,Re(s)≥0s-γI-Ap0-BK-Bϕ(p)≠0

Примем в качестве s=s-γ, тогда Res=Res+γ=Res+Reγ≥0↔Res≥-γ. Таким


образом

∀p∈P∀s,Res≥-γsI-Ap0-BK-Bϕ(p)≠0

которая предполагает, что u=Kx это решение задачи размещения полюсов в


интервальной системе.

Пример 2.3

Рассмотрим систему, приведенную в примере 2.2.

x1x2=011+ppx1x2+01u

где неопределенность задана через p∈[-10,1]. Мы хотим разработать


интервальный регулятор u=Kx, такой что корни замкнутой системы лежат
левее -8 для всех p∈[-10,1].

Выбрав p0=0, мы можем проверить, что (Ap0,B) управляема.

Соответствующая задача линейно-квадратичного регулирования задается


следующим образом: для номинальной системы
16
x1x2=0110x1x2+8x1x2+01u=8118x1x2+01u

найти обратную связь вида u=Kx, такую что она минимизирует оценочную
функцию

0∞(xTFx+xTx+uTu)dt=0∞(xT(F+I)x+uTu)dt

где F=100100100100 рассчитана в примере 1.1. Другими словами

Q=F+I=101100100101 R=1

Решая задачу линейно-квадратичного регулирования, мы получаем, что

u=-323.5-36.5x

Для проверки результатов, мы определим собственные числа замкнутой


системы (они приведены ниже в таблице).

p λ1 λ2
1 -17.7474+j2.5501 -17.7474-j2.5501
0 -21.4863 -15.0086
-1 -24.0378 -13.4571
-5 -30.8952 -10.5997
-10 -37.6684 -8.8285

2.3.Несогласованная неопределенность

Рассмотрим систему

x=Apx+Bu

и сделаем следующие предположения

Предположение 2.3.

Существует номинальное значение p0∈P такое что (Ap0,B) стабилизируема.

Предположение 2.4.

Ap ограничено.

Наша цель – решить задачу интервального управления по стабилизации


несогласованной неопределенности.

Задача интервального управления 2.5

Найти обратную связь вида u=Kx, такую что замкнутая система

x=Apx+Bu=Apx+BKx

асимптотически устойчиво для всех p∈P.

Для решения этой задачи вначале представим неопределенность Ap-A(p0) в


виде суммы согласованного и несогласованного компонента. Это можно
сделать, используя псевдо инверсию B+ матрицы B. Если В матрица полного
ранга, то B+=(BTB)-1BT. Рассмотрим

17
Ap-Ap0=BB+Ap-Ap0+(I-BB+)Ap-Ap0

Тогда BB+Ap-Ap0 это согласованный компонент и (I-BB+)Ap-Ap0


несогласованный компонент. Заметим, что если условие согласования
выполняется, то несогласованная часть I-BB+Ap-Ap0=0. Предположим, что
ϕp= B+Ap-Ap0, тогда

Ap-Ap0=Bϕ(p)

Как и в секции 2.2. Определим матрицы F и H с помощью следующих верхних


границ неопределенности, для всех p∈P:

Ap-Ap0TB+TB+(Ap-Ap0)≤F 2.6
α-2(Ap-Ap0)T(Ap-Ap0)≤H 2.7
где α≥0 это дополнительный параметр, чья польза будет рассмотрена позже.
Заметим, что F, определенное в уравнении 2.6. точно такое же как и F,
определенное в 2.2.

Как и в секции 2.2. наш подход к решению указанной задачи 2.5.


представляет собой неявный метод перехода от задачи управления
интервальной системой к задаче линейно-квадратичного регулирования.

Задача линейно-квадратичного регулирования 2.6.

Для вспомогательной системы

x=Ap0x+Bu+α(I-BB+)v

найти обратную связь u=Kx, v=Lx которая минимизирует оценочную функцию

0∞(xTF+ρ2H+β2Ix+uTu+ρ2vTv)dt

где α≥0, ρ≥0 и β≥0 вспомогательные параметры.

В этой задачи линейно-квадратичного регулирования, v это дополнительное


управление, которое используется для того, чтобы работать с
несогласованной неопределенностью.

Заметим, что если выполняется свойство согласованности, то мы можем


принять в качестве параметров α=0, ρ=0, β=1. В этом случае, задача 2.6.
вырождается в задачу 2.2. Вспомогательные параметры должны быть
выбраны таким образом, чтобы выполнялось достаточное условие следующей
теоремы.

Решение задачи линейно-квадратичного программирования задается

uv=-R-1BTSx

где S – единственное положительно определенное решение алгебраического


уравнения Риккати

SA+ATS+Q-SBR-1BTS=0

В нашем случае

А=Ap0, B=Bα(I-BB+)

18
Q=F+ρ2H+β2I, R=I00ρ2I

Так как

BR-1BT=Bα(I-BB+)I00ρ2IBα(I-BB+)=BBT+α2ρ-2(I-BB+)2

То уравнение Риккати становится равным:

SAp0+A(p0)TS+F+ρ2H+β2I-SBBT+α2ρ-2I-BB+2S=0

Управление задается

uv=-BT-αρ2I-BB+Sx=KLx

Следующая теорема показывает связь между задачей интервального


управления 2.5 и задачей линейно-квадратичного регулирования 2.6.

Теорема 2.3

Если удается выбрать параметры α,ρ,β такие, что решение задачи 2.6., u=Kx,
v=Lx удовлетворяет

β2I-2ρ2LTL>0

то u=Kx является решением задачи интервального управления 2.5.

Доказательство

Так как (Ap0,B) стабилизируема и F≥0 H≥0, то решение задачи линейно-


квадратичного регулирования существует. Обозначим решения u=Kx, v=Lx.
Мы хотим доказать, что эти решения также являются решением задачи
интервального управления 2.5.; т.е.

x=Apx+BKx 2.8
асимптотически устойчиво для всех p∈P.

Для доказательства, мы определим функционал

Vx0=minu∈Rm0∞xT(F+ρ2H+β2Ix+uTu+ρ2vTv)dt

который необходимо минимизировать. Мы покажем, что V(x) является


функцией Ляпунова для системы 2.8. По определению V(x) должна
удовлетворять уравнению Гамильтона-Якоби-Беллмана, которое
представляется в виде:

minu,vxTF+ρTH+β2Ix+uTu+ρ2vTv+VxT(Ap0x+Bu+αI-BB+v)=0

Так как u=Kx, v=Lx оптимальное управление, то они должны удовлетворять

xTF+ρTH+β2Ix+xTKTKx+ρ2xTLTLx+VxTAp0x+BKx+αI-BB+Lx=0 2.9
2xTKT+VxTB=0 2.10
2ρ2xTLT+VxTαI-BB+=0 2.11
С помощью этих трех уравнение, мы можем показать, что V(x) является
функцией Ляпунова для системы 2.8. Действительно,

Vx>0 x≠0

Vx=0 x=0
19
Чтобы показать, что Vx<0 для всех x≠0, мы вначале используем уравнение 2.8

Vx=VxTx=VxTAp+BKx=VxTAp0x+BKx+αI-BB+Lx+VxTAp-Ap0x-VxTαI-
BB+Lx=VxTAp0x+BKx+αI-BB+Lx+VxTBB+Ap-Ap0x+VxTI-BB+Ap-Ap0x-VxTαI-
BB+Lx

Из уравнения 2.9.

VxTAp0x+BKx+αI-BB+Lx=-xTF+ρTH+β2Ix-xTKTKx-ρ2xTLTLx

Из уравнения 2.10

VxTBB+Ap-Ap0x=-2xTKTB+Ap-Ap0x

Из уравнения 2.11

VxTαI-BB+Lx=-2ρ2xTLTLx

VxTI-BB+Ap-Ap0x=-2a-1ρ2xTLTAp-Ap0x

Таким образом

Vx=VxTAp0x+BKx+αI-BB+Lx+VxTBB+Ap-Ap0x+VxTI-BB+Ap-Ap0x-VxTαI-BB+Lx=-
xTF+ρTH+β2Ix-xTKTKx-ρ2xTLTLx-2xTKTB+Ap-Ap0x-2a-1ρ2xTLTAp-Ap0x+2ρ2xTLTLx

Из уравнения 2.6.

-xTKTKx-2xTKTB+Ap-Ap0x=-xTK-B+(Ap-Ap0)TK-B+(Ap-Ap0)x+xTB+(Ap-Ap0TB+(Ap-
Ap0x≤xTB+(Ap-Ap0TB+(Ap-Ap0x≤xTFx

Из уравнения 2.7.

-2a-1ρ2xTLTAp-Ap0x≤ρ2xTLTLx+ρ2α-2xTAp-Ap0TAp-Ap0x≤ρ2xTLTLx+ρ2xTHx

Таким образом

Vx=-xTF+ρTH+β2Ix-xTKTKx-ρ2xTLTLx-2xTKTB+Ap-Ap0x-2a-1ρ2xTLTAp-
Ap0x+2ρ2xTLTLx≤-xTF+ρTH+β2Ix-
ρ2xTLTLx+xTFx+ρ2xTLTLx+ρ2xTHx+2ρ2xTLTLx=-xTβ2I-2ρ2LTLx

Если достаточное условие выполняется β2I-2ρ2LTL>0, то

Vx<0 x≠0

Vx=0 x=0

Таким образом, по теореме Ляпунова система 2.3. устойчива для всех p∈P.
Другими словами, u=Kx это решение задачи интервального управления.

Пример 2.4

Рассмотрим следующую систему второго порядка:

x1x2=p1+p10x1x2+01u

Где неопределенность p∈[-2,2]. Мы хотим разработать интервальный


регулятор u=Kx, такой что замкнутая система устойчива для всех p∈[-2,2].

20
Для перевода данной задачи в задачу линейно-квадратичного регулирования
выберем p0=0 и проверим управляемость (Ap0,B). Матрица управляемости
равна:

C=BAp0B=0110

Так как матрица С – полного ранга, то тогда (Ap0,B) управляема.

Условие согласованности не выполняется для этой системы. Давайте разобьем


неопределенность на два компонента: согласованный и несогласованный

Ap-Ap0=p1+p10-0110=pp00

B+=(BTB)-1BT=0101-101=01

Согласованный компонент будет равен:

BB+Ap-Ap0=0101pp00=0000

Другими словами, вся неопределенность является несогласованной:

I-BB+Ap-Ap0=1000pp00=pp00

Для определения соответствующей задачи линейно-квадратичного


регулирования мы должны определить параметры α,ρ и β. Вопрос выбора этих
параметров до сих пор является открытым. Мы выберем α=0.05,ρ=1 и β=10
основываясь на опыте проектирования похожих систем. Матрицы F и H могут
быть найдены:

Ap-A(p0)TB+TB+Ap-A(p0)=p0p00101pp00=0000=F

α-2Ap-A(p0)TAp-
A(p0)=400p0p0pp00=400p2400p2400p2400p2≤1600160016001600=H

Таким образом, задача линейно-квадратичного регулирования сводится к


следующей. Для вспомогательной системы

x1x2=0110x1x2+01u+0.05000v

Найти обратную связь u=Kx,v=Lx такую, что она минимизирует функционал

0∞xT0000+1600160016001600+10000100x+uTu+vTvdt

Комбинируя входы u,v мы получаем следующие матрицы:

A=0110 B=00.050100

Q=1700160016001700 R=100010001

Решая указанную выше задачу (например, с помощью Matlab), мы получим:

uv1v2=-41.7185-42.1792-6.5577-2.085900x1x2

Другими словами

u=Kx=-41.7185-42.1792x

v=Lx=-6.5577-2.085900x

21
Для того чтобы u=Kx было решением задачи интервального управления,
необходимо проверить достаточное условие: β2I-2ρ2LTL>0. Действительно

β2I-2ρ2LTL=100×1001-2×-6.557702.08590-6.5577-2.085900=56.9969-13.6788-
13.678895.6489>0

Собственные числа для различных значений p.

p λ1 λ2
-2 -1.0109 -43.1683
-1 -1.0000 -42.1792
0 -0.9885 -41.1907
1 -0.9765 -40.2027
2 -0.9638 -39.2154

Таким образом, u=Kx является решением задачи интервального управления.

Интересен вопрос, будет ли результат размещения полюсов интервальной


системы, полученный в Теореме 2.2. аналогичным для несогласованной
неопределенности. То есть если условие согласования не соблюдается, можно
ли разместить все полюса левее некоторого значения –γ для какого-то
положительного действительного числа γ при предположении управляемости
(Ap0,B)?

На первый взгляд это кажется невозможным. Впрочем, мы не можем доказать


эту гипотезу и она остается нерешенной. Но одна причина, по которой мы так
считаем, заключается в том, что для вспомогательной системы

x=Ap0x+γx+Bu+αI-BB+v

найти обратную связь в виде u=Kx, v=Lx, которая минимизирует оценочную


функцию

0∞xT(F+ρ2H+β2Ix+uTu+ρ2vTv)dt

где α≥0,ρ≥0,β≥0 вспомогательные параметры и матрицы F и H задаются


уравнениями 2.6. и 2.7. Мы можем показать, что условие β2I-2ρ2LTL>0 будет
нарушаться для достаточно больших γ.

Теорема 2.4

Пусть u=Kx,v=Lx являются решениями задачи линейно-квадратичного


регулирования. Если условие согласованности не выполняется, то при любом
выборе α,ρ и β

β2I-2ρ2LTL<0

При достаточно больших γ.

Доказательство

Решение задачи линейно-квадратичного управления определяется по


формуле:

uv=-R-1B-1Sx
22
Где S единственное положительно определенное решение алгебраического
уравнения Риккати

SA+ATS+Q-SBR-1BTS=0

где

А=Ap0+γI, B=Bα(I-BB+)

Q=F+ρ2H+β2I, R=I00ρ2I

Так как

BR-1BT=Bα(I-BB+)I00ρ2IBTα(I-BB+)=BBT+α2ρ-2I-BB+2

то уравнение Риккати принимает вид

SAp0+γI+Ap0T+γIS+F+ρ2H+β2I-SBBT+α2ρ-2I-BB+2S=0

Таким образом, для достаточно больших γ, решение уравнения Риккати


стремится

S→2γBBT+α2ρ-2I-BB+2-1

Соответствующее управление

uv=-R-1BTSx→-I00-ρ2IBTαI-BB+2γBBT+α2ρ-2I-BB+2-1x=-2γBTBBT+α2ρ-2I-BB+2-1-
2γαρ-2I-BB+BBT+α2ρ-2I-BB+2-1x

Таким образом, L→-2γαρ-2I-BB+BBT+α2ρ-2I-BB+2-1, поэтому для достаточно


больших γ

β2I-2ρ2LTL<0

Не важно, какие были выбраны α,β и ρ.

В любом случае, эта теорема не является доказательство данной гипотезы,


так как условие β2I-2ρ2LTL>0 является достаточным, но не необходимым.

2.4.Неопределенность во входной матрице

Теперь мы рассмотрим неопределенность в матрице управлений. Мы


рассмотрим несколько случаев.

Случай 1

Неопределенность по входу системы задается через матрицу В и


неопределенность A(p) удовлетворяет условию согласованности. Другими
словами, мы рассматриваем следующую систему

x=Apx+BDpu

Где D(p) это матрица размером m×m, отражающая неопределенность


матрицы входов. Вначале сделаем следующие допущения:

Предположение 2.5.

Существует номинальное значение p0∈P такое, что (Ap0,B) стабилизируема.


23
Предположение 2.6.

Существует постоянная матрица D, такая что для всех p∈P

0<D≤D(p)

Предположение 2.7.

Для любого p∈P существует матрица ϕ(p) размерами m×n, такая что

Ap-Ap0=BDϕ(p)

и ϕ(p) ограничена.

Согласно этим допущениям, динамическая система может быть записана


следующим образом:

x=Ap0x+BDu+Epu+BDϕpx

где Ep=D-1Dp-I≥0

Наша цель – решить следующую задачу стабилизации интервальной системы.

Задача интервального управления 2.7

Найти обратную связь вида u=Kx, такую что замкнутая система

x=Ap0x+BDu+Epu+BDϕpx=Ap0x+BDKx+EpKx+BDϕpx

Будет асимптотически устойчива для всех p∈P.

Мы попробуем перевести эту задачу в задачу линейно-квадратичного


регулирования.

Задача линейно-квадратичного регулировании 2.8

Для вспомогательной системы

x=Ap0x+BDu

Найти обратную связь u=Kx, которая минимизирует функционал

0∞xTFx+xTx+uTudt

где F – верхняя граница неопределенности ϕ(p)Tϕ(p), такая что для всех p∈P

ϕ(p)Tϕ(p)≤F

Для решения задачи линейно-квадратичного регулирования, мы вначале


должны найти решения алгебраического уравнения Риккати

A(p0)TS+SAp0+F+I-SBDDTBTS=0

Тогда решение задачи линейно-квадратичного регулирования будет найдено


следующим образом: u=-DTBTSx.

24
Следующая теорема показывает, что мы можем решить задачу интервального
управления с помощью перехода к задаче линейно-квадратичного
регулирования.

Теорема 2.5

Задача интервального управления 2.7. имеет решение. Более того, решение


задачи линейно-квадратичного регулирования 2.8. является решением
интервального управления 2.7.

Доказательство

Так как (Ap0,B) стабилизируема и F≥0, то решение задачи 2.8. существует.


Предположим, что оно равно u=Kx. Мы хотим доказать, что это решение
также является решением задачи интервального управления, т.е.

x=Ap0x+BDKx+EpKx+BDϕpx 2.12
Асимптотически устойчиво для всех p∈P.

Для доказательства, мы определим

Vx0=minu∈Rm0∞xTFx+xTx+uTudt

Для минимального значения оценочной функции оптимального управления


вспомогательной системы. Мы покажем, что V(x) является функцией Ляпунова
для системы (2.12). По определению V(x) должно удовлетворять уравнению
Гамильтона-Якоби-Беллмана, которое превращается в

minu∈RmxTFx+xTx+uTu+VxT(Ap0x+BDu)=0

Так как u=Kx оптимальное управление, то оно должно удовлетворять


следующим двум уравнениям

xTFx+xTx+xTKTKx+VxTAp0x+BDKx=0 2.13
2xTKT+VxTBD=0 2.14
На основании этих двух уравнение мы можем показать, что V(x) является
функцией Ляпунова для (2.12). Действительно

Vx>0 x≠0

Vx=0 x=0

Для того, чтобы показать, что Vx<0 для всех x≠0, вначале мы рассмотрим
уравнение 2.12.

Vx=VxTx=VxTAp0x+BDKx+BDEpKx+BDϕpx=VxTAp0x+BDKx+VxTBDEpKx+ϕpx

Из уравнения 2.13

VxTAp0x+BDKx=-(xTFx+xTx+xTKTKx)

Из уравнения 2.14

VxTBDEpK+ϕ(p)x=-2xTKTEpKx-2xTKTϕpx

Следовательно

25
Vx=-(xTFx+xTx+xTKTKx)-2xTKTEpKx-2xTKTϕpx=-xTFx-xTx-xTKTKx-2xTKTϕpx-
xTϕpTϕpx+xTϕpTϕpx-2xTKTEpKx=-xTFx+xTϕpTϕpx-xTx-xTKTKx-2xTKTϕpx-
xTϕpTϕpx-2xTKTEpKx=-xTF-ϕpTϕpx-xTx-xTK+ϕ(p)TK+ϕ(p)x-2xTKTEpKx≤-xTx

Другими словами

Vx<0 x≠0

Vx=0 x=0

Следовательно, по теореме Ляпунова, система 2.12 является устойчивой для


всех p∈P. Другими словами u=Kx является решением задачи интервального
управления 2.7.

Пример 2.5

Рассмотрим следующую систему второго порядка

x1x2=011+ppx1x2+0qu

Где неопределенности p∈[-10,1] и q∈[1,10]. Мы хотим разработать


интервальный регулятор u=Kx такой, что замкнутая система устойчива для
всех p∈[-10,1] и q∈[1,10]. Выберем p0=0.

Так как q>1>0, мы можем выбрать B=01 и D=1. Поэтому задача линейно-
квадратичного регулирования аналогично задаче линейно-квадратичного
регулирования в примере 22., т.е. для номинальной системы

x1x2=0110x1x2+01u

Найти обратную связь u=Kx такую, что она минимизирует оценочную функцию

0∞xTFx+xTx+uTudt=0∞xT(F+I)x+uTudt

Другими словами

Q=F+I=101100100101

R=I=1

Тогда решение будет

u=-11.0995-11.0995x

Для проверки результатов, мы должны посмотреть значения собственных


чисел замкнутой системы для различных значений p и q. Действительно,
результаты показывают, что данная система является устойчивой

p q λ1 λ2
-10 1 -1.0000 -20.0995
-10 5 -1.0000 -64.4975
-10 10 -1.0000 -119.9950
1 1 -1.0000 -9.0995
1 5 -1.0000 -53.4975
1 10 -1.0000 -108.9950

26
Случай 2

Неопределенность по входу, задаваемая в матрице B и неопределенность в


A(p) не удовлетворяют условию согласованности. Таким образом,
рассматриваемая система имеет следующий вид:

x=Apx+BDpu

Мы не будет использовать предыдущие допущения, а просто сделаем новые:

Предположение 2.8.

Существует номинальное значение p0∈P, такое что матрица Ap0,B


стабилизируема.

Предположение 2.9.

Существует постоянная матрица D, такая что для всех p∈P

0<D≤D(p)

Предположение 2.10

Матрица A(p) ограничена.

На основании этих допущений, система может быть записана в виде:

x=Apx+BD(u+Epu)

Где Ep=D-1Dp-I≥0

Наша цель – решить следующую задачу интервального управления по


стабилизации системы.

Задача интервального управления 2.9

Найти обратную связь u=Kx, такую что замкнутая система

x=Apx+BDu+Epu=Apx+BDKx+EpKx

Асимптотический устойчива для всех p∈P.

Для решения данной задачи мы вначале разобьем неопределенность Ap-A(p0)


на согласованный и несогласованный компоненты (проецируя ее на матрицу
BD), т.е.

Ap-Ap0=BDBD+Ap-Ap0+I-BDBD+Ap-Ap0

Определим матрицу H как это было сделано в уравнении 2.7., а матрицу G


следующим образом, для всех p∈P

Ap-Ap0TBD+TBD+Ap-Ap0≤G 2.15
Как всегда мы переведем задачу интервального управления в задачу
линейно-квадратичного регулирования.

Задача линейно-квадратичного регулирования 2.10

Для вспомогательной системы

27
x=Ap0x+BDu+αI-BDBD+v

Найти обратную связь u=Kx,v=Lx которая будет минимизировать оценочный


функционал

0∞xTG+ρ2H+β2Ix+uTu+ρ2vTvdt

где α≥0,ρ≥0 и β≥0 дополнительные параметры.

Решение задачи линейно квадратичного регулирования задается в виде:

uv=-R-1B-1Sx

где S единственное положительно определенное решение алгебраического


уравнения Риккати

SA+ATS+Q-SBR-1BTS=0

где

А=Ap0, B=BDα(I-(BD)(BD)+)

Q=G+ρ2H+β2I, R=I00ρ2I

Так как

BR-1BT=BDα(I-(BD)(BD)+)I00ρ-2I(BD)Tα(I-(BD)(BD)+)=(BD)(BD)T+α2ρ-2I-BB+2

то уравнение Риккати принимает вид

SA(p0)+Ap0TS+G+ρ2H+β2I-S(BD)(BD)T+α2ρ-2I-(BD)(BD)+2S=0

Управление определяется следующим образом:

uv=-(BD)TS-α2ρ-2I-(BD)(BD)+Sx=KLx

Следующая теорема связывает задачу интервального управления 2.9. и


задачу линейно-квадратичного регулирования 2.10.

Теорема 2.6

Если удается выбрать параметры α,ρ и β таким образом, что решение задачи
2.10. u=Kx, v=Lx удовлетворяет условию

β2I-2ρ2LTL>0

то u=Kx является решением задачи интервального управления 2.9.

Доказательство

Так как пара матриц (Ap0,B) стабилизируема и G≥0 H≥0, то решение задачи
2.10 существует. Обозначим решения u=Kx, v=Lx. Мы хотим доказать, что это
решение также является решением задачи интервального управления, т.е.
уравнение

x=Apx+BDKx+EpKx 2.16
асимптотически устойчиво для всех p∈P.

Для доказательства этого мы определим

28
Vx0=minu∈Rm0∞xTG+ρ2H+β2Ix+uTu+ρ2vTvdt

Функционал, который нужно минимизировать в задаче оптимального


управления вспомогательной системы. Покажем, что эта функция является
функцией Ляпунова для системы 2.16. По определению, V(x) должно
удовлетворять уравнению Гамильтона-Якоби-Беллмана, которое
превращается в

minu,vxTG+ρ2H+β2Ix+uTu+ρ2vTv+VxTAp0x+BDu+α(I-(BD)(BD)+)v=0

Так как u=Kx, v=Lx оптимальное управление, то они должны удовлетворять

xTG+ρ2H+β2Ix+xTKTKx+ρ2vTLTLv+VxTAp0x+BDKx+α(I-(BD)(BD)+)Lx=0 2.17
2xTKT+VxTBD=0 2.18
2ρ2xTLT+VxTαI-BDBD+=0 2.19
На основании этих двух уравнений мы покажем, что V(x) является функцией
Ляпунова. Действительно

Vx>0 x≠0

Vx=0 x=0

Чтобы показать, что Vx<0 для всех x≠0, мы рассмотрим уравнение 2.16

Vx=VxTx=VxTApx+BDKx+EpKx=VxTAp0x+BDKx+αI-BDBD+Lx+VxTAp-Ap0x-VxTαI-
BDBD+Lx+VxTBDEpKx=VxTAp0x+BDKx+αI-BDBD+Lx+VxTBDBD+Ap-Ap0x+VxTI-
BDBD+Ap-Ap0x-VxTαI-BDBD+Lx+VxTBDEpKx

Из уравнения 2.17

VxTAp0x+BDKx+α(I-(BD)(BD)+)Lx=-xTG+ρ2H+β2Ix-xTKTKx-ρ2vTLTLv

Из уравнения 2.18

VxT(BD)(BD)+Ap-Ap0x=-2xTKT(BD)+Ap-Ap0x

VxTBDEpKx=-2xTKTEpKx

Из уравнения 2.19

VxTαI-BDBD+=-2ρ2xTLT

VxTI-BDBD+Ap-Ap0x=-2α-1ρ2xTLTAp-Ap0x

Таким образом,

Vx=VxTAp0x+BDKx+αI-BDBD+Lx+VxTBDBD+Ap-Ap0x+VxTI-BDBD+Ap-Ap0x-VxTαI-
BDBD+Lx+VxTBDEpKx=-xTG+ρ2H+β2Ix-xTKTKx-ρ2vTLTLv-2xTKT(BD)+Ap-Ap0x-2α-
1ρ2xTLTAp-Ap0x+2ρ2xTLTLx-2xTKTEpKx

Из уравнения 2.15

-xTKTKx-2xTKT(BD)+Ap-Ap0x=-xTK-BD+(Ap-Ap0)TK-BD+(Ap-Ap0)x+xT(BD)+(Ap-
Ap0)T(BD)+(Ap-Ap0)x≤xTGx

Из уравнения 2.7.

-2α-1ρ2xTLTAp-Ap0x≤ρ2xTLTLx+ρ2xTHx
29
Так как

Vx=-xTG+ρ2H+β2Ix-xTKTKx-ρ2vTLTLv-2xTKT(BD)+Ap-Ap0x-2α-1ρ2xTLTAp-
Ap0x+2ρ2xTLTLx-2xTKTEpKx≤-xTG+ρ2H+β2Ix-
ρ2xTLTLx+xTGx+ρ2xTLTLx+ρ2xTHx+2ρ2xTLTLx-2xTKTEpKx=-xTβ2I-2ρ2LTLx-
2xTKTEpKx≤-xTβ2I-2ρ2LTLx

Если достаточное условие β2I-2ρ2LTL>0 выполняется, то

Vx<0 x≠0

Vx=0 x=0

Таким образом, по теореме Ляпунова, система 2.16 является устойчивой для


всех p∈P. Другими словами, u=Kx является решением задачи интервального
управления 2.9.

Пример 2.6

Рассмотрим следующую систему

x1x2=p1+p10x1x2+0qu

где неопределенность p∈-2,2 и q∈[1,10]. Мы хотим разработать такой


регулятор u=Kx, который стабилизирует замкнутую систему для всех p∈-2,2 и
q∈[1,10].

Для перевода этой задачи в задачу линейно-квадратичного регулирования


выберем p0=0 и проверим управляемость пары матриц Ap0,B. Как это было
показано в примере 2.3. эта пара матриц управляема.

Так как q>1>0 мы можем записать

B=01

и D=1. Следовательно, данная задача линейно-квадратичного регулирования


равносильна задаче в примере 2.5. Таким образом, для вспомогательной
системы

x1x2=0110x1x2+01u+0.05000v

Необходимо найти обратную связь u=Kx, v=Lx, которая минимизирует


функционал

0∞xT0000+1600160016001600+10000100x+uTu+vTvdt

Решение определяется

u=Kx=-41.7185-42.1792x

v=Lx=-6.5577-2.085900x

Для того чтобы решение u=Kx было решением задачи интервального


управления, нам необходимо проверить выполнение достаточного условия
β2I-2ρ2LTL>0. Действительно,

30
β2I-2ρ2LTL=1001001-2-6.55770-2.08590-6.5577-2.085900=56.9969-13.5788-
13.678895.6489>0

Таким образом, u=Kx является решением задачи интервального управления.

Для проверки результатов, можно посмотреть собственные числа замкнутой


системы

p q λ1 λ2
-2 1 -1.0109 -43.1683
-2 10 -1.0109 -422.7811
0 1 -0.9885 -41.1907
0 10 -0.9890 -420.8030
2 1 -0.9638 -39.2154
2 10 -0.9669 -418.8251

Случай 3

Неопределенность по входу НЕ задается через матрицу В. Если до этого мы


рассматривали системы в которых неопределенность D(p) задавалась через
матрицу В, то теперь будут исследованы системы более общего случая:

x=Ax+Bu+Dpu

Для того чтобы сфокусироваться на этой проблеме, предположим, что в


матрице А отсутствует неопределенность. Также мы определим следующие
допущения

Предположение 2.11

Пара матриц (A,B) стабилизируема.

Предположение 2.12

Матрица D(p) ограничена.

Нашей целью является решение следующей задачи интервального


управления.

Задача интервального управления 2.11

Найти обратную связь u=Kx такую, что замкнутая система

x=Ax+Bu+Dpu=Ax+BKx+DpKx

асимптотически устойчива для всех p∈P.

Как и раньше, мы переведем данную задачу в задачу линейно-квадратичного


регулирования.

Задача линейно-квадратичного регулирования 2.12

Для вспомогательной системы

x=Ax+Bu+αI-BB+v

31
найти обратную связь u=Kx, v=Lx, которая минимизирует оценочный
функционал

0∞xTM+ρ2N+β2Ix+uTu+ρ2vTvdt

где α≥0,ρ≥0 и β≥0 дополнительные параметры, и M≥0 и N≥0 дополнительные


матрицы.

Решение задачи линейно-квадратичного регулирования получается с


помощью алгебраического уравнения Риккати

SA+ATS+M+ρ2N+β2I-SBBT+α2ρ-2(I-BB+)2S=0

И получаемое управление задается

uv=-BTS-αρ2(I-BB+)Sx=KLx

Следующая теорема определяет взаимосвязь между задачей интервального


управления 2.11 и задачей линейно-квадратичного регулирования 2.12.

Теорема 2.7

Если удается выбрать параметры α,ρ,β,M и N такие, что решение задачи


линейно-квадратичного регулирования 2.12 u=Kx,v=Lx удовлетворяет

β2I-2ρ2LTL>0 2.20

M-KTDpTDpK≥0

N-α-2KTDpTDpK≥0
то u=Kx является решением задачи интервального управления 2.11.

Доказательство

Так как пара матриц (A,B) стабилизируема и M≥KTDpTB+TB+DpK>0 и N≥-α-


2KTDpTDpK то решение задачи линейно-квадратичного регулирования 2.12
существует. Обозначим решение u=Kx,v=Lx. Мы хотим доказать, что это
решение также является решением задачи интервального управления, т.е.

x=Ax+BKx+DpKx 2.21
является асимптотический устойчивой для всех p∈P.

Для доказательства этого мы определим

Vx0=minu∈Rm0∞xTM+ρ2N+β2Ix+uTu+ρ2vTvdt

функционал, который нужно минимизировать в задаче оптимального


управления вспомогательной системы. Покажем, что эта функция является
функцией Ляпунова для системы 2.21. По определению, V(x) должно
удовлетворять уравнению Гамильтона-Якоби-Беллмана, которое
превращается в

minu,vxTM+ρ2N+β2Ix+uTu+ρ2vTv+VxTAx+Bu+α(I-BB+)v=0

Так как u=Kx, v=Lx оптимальное управление, то они должны удовлетворять

xTM+ρ2N+β2Ix+xTKTKx+ρ2xTLTLx+VxTAx+BKx+α(I-BB+)Lx=0 2.22

32
2xTKT+VxTBD=0 2.23
2ρ2xTLT+VxTαI-BB+=0 2.24
На основании этих двух уравнений мы покажем, что V(x) является функцией
Ляпунова для системы 2.21. Действительно

Vx>0 x≠0

Vx=0 x=0

Чтобы показать, что Vx<0 для всех x≠0, мы рассмотрим уравнение 2.21-2.24

Vx=VxTx=VxTAx+BKx+DpKx=VxTAx+BKx+αI-BB+Lx+VxTDpKx-VxTαI-
BB+Lx=VxTAx+BKx+αI-BB+Lx+VxTBB+DpKx+VxTI-BB+DpKx-VxTαI-BB+Lx=-xTM-
ρ2xTNx-β2xTx-xTKTKx-ρ2xTLTLx-2xTKTB+DpKx-2α-1ρ2xTLTDpKx-2ρ2xTLTLx

Из уравнения 2.20

-xTKTKx-2xTKTB+DpKx≤xTKTDpTB+TB+DpKx≤xTMx-2α-
1ρ2xTLTDpKx≤ρ2xTLTLx+ρ2α-2xTDpTDpKx≤ρ2xTLTLx+ρ2xTNx

Тогда

Vx=-xTM-ρ2xTNx-β2xTx-xTKTKx-ρ2xTLTLx-2xTKTB+DpKx-2α-1ρ2xTLTDpKx-
2ρ2xTLTLx≤-xTM-ρ2xTNx-β2xTx-ρ2xTLTLx-2ρ2xTLTLx+ρ2xTLTLx+ρ2xTNx+xTMx=-
xTβ2I-2ρ2LTLx

Другими словами

Vx<0 x≠0

Vx=0 x=0

Таким образом, согласно теореме Ляпунова, система 2.21 является устойчивой


для всех p∈P. Другими словами u=Kx является решением задачи
интервального управления 2.11.

2.5.Выводы

В этой главе мы обсудили вопросы интервального управления для линейных


систем. Вначале мы рассмотрели случай согласованной неопределенности.
Для согласованной неопределенности интервальное управление всегда
существует если система управляема. Условие управляемости необходимо,
иначе в противном случае не будет существовать управления. Если мы
перейдем от стабилизируемости к управляемости, то мы можем не только
обеспечить устойчивость системы, но также разместить полюса замкнутой
системы левее некоторого заранее предопределенного положительно
действительного числа. Для обоих случаев, решения получаются на основе
решения задач линейно-квадратичного регулирования.

Задача интервального управления гораздо более сложна, если условие


согласованности не выполняется. На самом деле, существует не так уж много
результатов по несогласованной неопределенности. В этой главе мы частично
решили вопрос интервального управления для такого рода
неопределенности. Этот подход является не совсем традиционный, так как
33
мы вводим искусственное управление для регулирования несогласованной
неопределенности. Эта задача решается при использовании оптимального
управления, решение задачи оптимального управления является решением
задачи интервального управления.

34
3. ИНТЕРВАЛЬНОЕ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ
СИСТЕМАМИ
3.1. Введение

В этой главе мы будем рассматривать нелинейные системы вида:

x=Ax+Bxu

где Ax,B(x) нелинейные матричные функции от x:A:Rn→Rn и B:Rm→Rm.


Заметим, что мы полагаем, что управление u входит в систему линейно. Это
предположение выполняется в большинстве исследованных примерах.
Возможные пути по снятию этого ограничения еще не найдены, поэтому эта
задача еще не решена до конца. Рассмотрим следующий пример.

Пример 3.1

Рассмотрим механическую систему, приведенную на рис. 3.1. y1,y2 являются


перемещениями масс M1,M2.

Рис.3.1. Механическая система для иллюстрации различных типов


неопределенностей

Вход системы это сила f. K отражает коэффициент упругости пружины и


D1,D2,D3 – соответствующие коэффициенты трения. Сила упругости линейна
относительно смещения, т.е. K(y1-y2). Силы, ответственные за трение
являются нелинейными функциями перемещения и скорости, они
обозначаются следующим образом D1y1,y1,D2y2,y2,D3y1-y2,y1-y2.

Силы, действующие на каждое тело отдельно, приведены на рис. 3.2.

Рис. 3.2. Диаграмма сил, действующих на каждое тело.

35
Мы полагаем, что силы действуют горизонтально. Применяя второй закон
Ньютона, мы можем записать:

M1y1=f- Ky1-y2-D3y1-y2,y1-y2-D1y1,y1

M2y2= Ky1-y2+D3y1-y2,y1-y2-D2y2,y2

Из приведенных выше уравнений, мы можем записать уравнения состояния,


если обозначим переменные следующим образом: x1=y1,x2=y1,x3=y2,x4=y2,

x1x2x3x4=x2Kx3-Kx1-D3x1-x3,x2-x4-D1x1,x2M1x4Kx1-Kx3+D3x1-x3,x2-x4-
D2x3,x4M2+01M100f

Если D1x1,x2 является неопределенной, то разница для матрицы A между


действительным значением D1x1,x2 и номинальным значением D10x1,x2
может быть выражена в виде:

AD1x1,x2-AD10x1,x2=0-D1x1,x2-D10x1,x2M100= 01M100-∆D1x1,x2

где ∆D1x1,x2=D1x1,x2-D10x1,x2 это отклонение D1x1,x2 от ее номинального


значения. Заметим, что для D1x1,x2 неопределенность находится в пределах
матрицы B, т.е. в данном случае условие согласованности выполняется.

Если D2x3,x4 является неопределенной, то неопределенность для матрицы А:

AD2x3,x4-AD20x3,x4=000-D2x3,x4-D20x3,x4M2

В этом случае условие согласованности не выполняется.

Мы будем обсуждать оба вида неопределенностей, как согласованной, так и


несогласованной. Аналогично линейным системам, условие существования
интервального управления для систем с несогласованной неопределенностью
значительно более сложнее чем для согласованной неопределенности.
Поэтому вначале рассмотрим согласованную неопределенность.

3.2. Согласованная неопределенность

Рассмотрим следующую нелинейную систему

x=Ax+Bxu+Bxf(x)

где Bxf(x) представляет собой неопределенность в динамике системы (см.


пример далее). Так как матрица неопределенности в данном случае
представима через матрицу B, то тогда выполняется условие
согласованности. Сделаем следующие допущения:

Предположение 3.1

A0=0 и f0=0 вследствие того, что x=0 представляет собой точку равновесия
(она будет единственной точкой равновесия если задача интервального
управления имеет решение).

Предположение 3.2

36
Неопределенность f(x) ограничена, т.е. существует неотрицательная функция
fmax(x), такая что,

f(x)≤fmax(x) 3.1
Наша цель – решить следующую задачу интервального управления.

Задача интервального управления 3.1

Найти обратную связь u=u0(x) такую, что замкнутая система

x=Ax+Bxu0x+Bxf(x)

асимптотически устойчива для всех неопределенностей f(x),


удовлетворяющих f(x)≤fmax(x). Мы будем решать задачу интервального
управления с помощью перевода ее в задачу оптимального управления.

Задача оптимального управления 3.2

Для номинальной системы

x=Ax+Bxu

найти обратную связь u=u0(x), которая минимизирует следующий функционал

0∞fmax(x)2+xTx+uTudt

Связь между задачей интервального управления и задачей оптимального


регулирования задается следующей теоремой.

Теорема 3.1

Если решение задача оптимального управления 3.2. существует, то ее


решение является решением задачи интервального управления 3.1.

Доказательство

Положим, что u=u0(x) является решением задачи оптимального управления


3.2. Мы хотим показать, что

x=Ax+Bxu0x+Bxf(x) 3.2
является асимптотически устойчивой для всех неопределенностей f(x),
удовлетворяющих f(x)≤fmax(x).

Определим функционал

Vx0=minu∈Rm0∞fmax(x)2+xTx+uTudt

для минимизации в задаче оптимального управления номинальной системы.


Мы хотим показать, что V(x) является функцией Ляпунова для системы 3.2. По
определению V(x) должна удовлетворять уравнению Гамильтона-Якоби-
Беллмана, которое превращается в

minu∈Rmfmax(x)2+xTx+uTu+VxTAx+Bxu=0

Так как u=u0(x) является оптимальным управлением, то оно должно


удовлетворять этому уравнению, т.е.

fmax(x)2+xTx+u0xTu0(x)+VxTAx+Bxu0(x)=0 3.3
37
2u0(x)T+VxTBx=0 3.4
Используя приведенные выше уравнения, мы можем показать, что V(x)
является функцией Ляпунова для системы 3.2. Действительно,

Vx>0 x≠0

Vx=0 x=0

Чтобы показать, что Vx<0 для всех x≠0, мы можем использовать уравнения
3.2-3.4

Vx=VxTx=VxTAx+Bxu0x+Bxf(x)=VxTAx+B(x)u0x+VxTBxfx=-fmax(x)2-xTx-
u0xTu0x-2u0xTfx=-fmaxx2+fxTfx-xTx-u0xTu0x-2u0xTfx-fxTfx=-fmaxx2+fxTfx-xTx-
u0x+f(x)Tu0x+f(x)≤-fmaxx2+fxTfx-xTx

Из уравнения 3.1. fxTfx≤fmaxx2. Тогда

Vx≤-xTx

Другими словами

Vx<0 x≠0

Vx=0 x=0

Таким образом, условия теоремы устойчивости Ляпунова удовлетворяются.


Следовательно, существует окрестность 0, N=x:x<c для некоторого c>0
такая, что если xt попадает в N, то

x(t)→0 при t→∞

Предположим, что x(t) не может всегда находится внутри N. Другими словами,

x(t)≥c

для всех t>0 и

Vxt-Vx0=0tVxτdτ≤0t-xTxdτ≤-0tc2dτ≤-c2t

Положим, что t→∞, тогда получается

Vxt≤Vx0-c2t→-∞

что противоречит факту Vxt≥0 для всех x(t). Таким образом,

x(t)→0 при t→∞

При этом не важно, где начинается траектория. Т.е. система 3.2.


асимптотически устойчива для всех допустимых неопределенностей. Другими
словами u=u0(x) является решением задачи интервального управления 3.1.

Пример 3.2.

Рассмотрим следующую нелинейную систему

x1=x2

x2=p1x1cosp2x2+u

38
где p1∈[-0.2,2] и p2∈[-10,100]. Задачей интервального управления является
поиск регулятора u=u0(x) такого, что замкнутая система будет устойчива для
всех p1 и p2.

Переведем эту задачу в задачу оптимального управления, вначале мы


перепишем уравнения состояния следующим образом:

x1x2=0100x1x2+01u+01p1x1cos⁡(p2x2)

Неопределенность fx=p1x1cos⁡(p2x2) ограничена, это следует из

f(x)=p1x1cos⁡(p2x2)≤2x1=fmax(x)

Таким образом, задача оптимального управления задается следующим


образом. Для номинальной системы

x1x2=0100x1x2+01u

Найти обратную связь u=u0(x), которая минимизирует следующий


функционал

0∞fmax(x)2+xTx+uTudt=0∞5x12+x22+u2dt

Это задача линейно-квадратичного регулирования с матрицами

A=0100 B=01

Q=5001 R=1

Решение задачи линейно-квадратичного регулирования представляет собой:

u=-2.2361-2.3393x

Для тестирования интервального управления, воспользуемся системой


MATLAB. Промоделируем замкнутую через найденное управление систему с
начальными условиями x10=10 и x20=-10. Мы рассмотрим следующие четыре
случая

Случай 1: p1=-0.2 p2=-10


Случай 2: p1=-0.2 p2=100
Случай 3: p1=2 p2=-10
Случай 4: p1=2 p2=100
Результаты моделирования показаны на рисунках 3.3-3.6 (для x1траектория
начинается в 10). Хотя есть некоторая разница в этих четырех результатах, но
она достаточно мала.

39
Рис. 3.3. Результаты моделирования системы в случае 1

Рис. 3.4. Результаты моделирования системы в случае 2

40
Рис. 3.5. Результаты моделирования системы в случае 3

Рис. 3.6 Результаты моделирования системы в случае 4

41
3.3. Несогласованная неопределенность

Теперь мы полагаем, что неопределенность нельзя напрямую представить с


помощью матрицы B. Рассмотрим следующую нелинейную систему

x=Ax+Bxu+Cxf(x)

где f(x) представляет собой неопределенность в переменных состояния и C(x)


может быть любой матрицей. К примеру, если Cx=I, то Cxfx=f(x). Причина
введения матрицы C(x) - сделать более гибким задание неопределенностей.
Сделаем следующие допущения:

Предположение 3.3.

A0=0 и f0=0 тогда, когда x=0.

Предположение 3.4.

Неопределенность f(x) является ограниченной.

Мы хотим решить следующую задачу интервального управления.

Задача интервального управления 3.3.

Найти обратную связь вида u=u0(x) такую, что замкнутая система

x=Ax+Bxu0(x)+Cxf(x)

асимптотически устойчива для всех f(x).

Мы попробуем решить указанную выше задачу с помощью приведения ее к


задаче оптимального управления.

Задача оптимального управления 3.4.

Для вспомогательной системы

x=Ax+Bxu+αI-BxBx+Cxv

Найти обратную связь u0x,v0(x), которая минимизирует следующую


передаточную функцию

0∞fmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2dt

где α≥0,ρ≥0 и β≥0 вспомогательные параметры, fmax(x) и gmax(x) являются


неотрицательными функциями такими, что

Bx+Cxfx≤fmaxx 3.5
α-1f(x)≤gmax(x) 3.6
Связь между задачей интервального управления и задачей оптимального
управления задается следующей теоремой.

Теорема 3.2

42
Если удается выбрать параметры α,ρ,β такие, что решение задачи
оптимального управления 3.4., обозначаемое u0x,v0(x), существует и
выполняется следующей условие:

2ρ2v0(x)2≤β`2x2 ∀x∈Rn

для некоторого β` такого, что β`<β, тогда u0(x) является решением задачи
интервального управления 3.3.

Доказательство

Предположим, что u0x, v0(x) является решением задачи оптимального


управления 3.4. Мы хотим показать, что

x=Ax+Bxu0(x)+Cxf(x) 3.7
является асимптотически устойчивой для всех f(x).

Для доказательства этого, мы определим

Vx0=minu,v0∞fmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2dt

для того чтобы решить задачу оптимального управления вспомогательной


системы. Покажем, что V(x) является функцией Ляпунова для системы 3.7. По
определению V(x) должно удовлетворять уравнению Гамильтона-Якоби-
Беллмана, которое превращается в

minu,vfmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2+VxTAx+Bxu+αI-BxBx+Cxv=0

Так как u0x, v0(x) является оптимальным управлением, оно должно


удовлетворять приведенному выше уравнению, таким образом:

fmax(x)2+ρ2gmax(x)2+β2x2+u0(x)2+ρ2v0(x)2+VxTAx+Bxu0(x)+αI- 3.8
BxBx+Cxv0(x)=0
2u0(x)T+VxTBx=0 3.9
2ρ2v0(x)T+VxTαI-BxBx+Cx=0 3.10
На основании приведенных выше уравнений, мы можем показать, что V(x)
является функцией Ляпунова для системы 3.7. Действительно

Vx>0 x≠0

Vx=0 x=0

Чтобы показать, что Vx<0 для всех x≠0, мы можем использовать уравнения
3.7-3.10

Vx=VxTx=VxTAx+Bxu0x+Сxf(x)=VxTAx+Bxu0x+αI-BxBx+Cxv0(x)-VxTαI-
BxBx+Cxv0x+VxTСxfx=VxTAx+Bxu0x+αI-BxBx+Cxv0(x)-VxTαI-
BxBx+Cxv0x+VxTBxBx+Cxfx+VxTI-BxBx+Cxfx=-fmax(x)2-ρ2gmax(x)2-β2x2-
u0(x)2-ρ2v0(x)2+2ρ2v0(x)T-2u0(x)TBx+Cxfx-2α-1ρ2v0xTf(x)

С другой стороны

-u0(x)2-2u0xTBx+Cxfx≤Bx+Cxfx2≤fmaxx2-2α-1ρ2v0xTfx≤ρ2v0x2+ρ2α-
1f(x)2≤ρ2v0x2+ρ2gmax(x)2

Таким образом, если условие 2ρ2v0(x)2≤β`2x2, ∀x∈Rn удовлетворяется

43
Vx≤-β2x2+2ρ2v0(x)2=2ρ2v0(x)2-β`2x2-(β2-β`2)x2≤-(β2-β`2)x2

Другими словами

Vx<0 x≠0

Vx=0 x=0

Таким образом, условия теоремы Ляпунова удовлетворяются. Следовательно,


существует окрестность точки 0, N=x:x<c для некоторого c>0, такая что если
x(t) принадлежит области N, то

x(t)→0 при t→∞

Предположим, что x(t) может не всегда находится внутри N. Другими словами,

x(t)≥c

для всех t>0, это означает

Vxt-Vx0=0tVxτdτ≤0t-(β2-β`2)x2dτ≤-0t(β2-β`2)c2dτ≤-(β2-β`2)c2t

Положим, что t→∞, тогда получается

Vxt≤Vx0-(β2-β`2)c2t→-∞

что противоречит факту Vxt≥0 для всех x(t). Таким образом,

x(t)→0 при t→∞

При этом не важно, где начинается траектория. Это доказывает, что u0(x)
является решением задачи интервального управления 3.3.

Пример 3.3.

Рассмотрим следующую нелинейную систему

x1=x2+p1x1cos1x2+p2+p3x2sin⁡(p4x1x2)

x2=u

Здесь p1∈-0.2,2, p2∈-10,100,p3∈[0,0.2] и p4∈-100,0. Задача интервального


управления заключается в том, чтобы найти регулятор u=u0(x), который
делает замкнутую систему устойчивой для всех неопределенностей.

Чтобы перевести данную задачу в задачу оптимального управления запишем


уравнения состояния:

x1x2=0100x1x2+01u+10f(x)

где

fx=p1x1cos1x2+p2+p3x2sin⁡(p4x1x2)

является неопределенностью. Возьмем α=0.2, β=1 и ρ=1 (этот выбор был


сделан после нескольких экспериментов и многих ошибок). Тогда fmax(x) и
gmax(x) могут быть определены следующим образом

44
Bx+Cxf(x)=0110f(x)=0=fmax(x)

α-1f(x)=5p1x1cos1x2+p2+p3x2sin⁡(p4x1x2)≤x1+x2=gmax(x)

Тогда

fmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2=x1+x22+x12+x22+u2+v2

Таким образом, соответствующая задача оптимального управления будет


иметь вид. Для вспомогательной системы

x1x2=0100x1x2+01u+0.20v

найти обратную связь вида u0x,v0x, которая минимизирует следующий


функционал

0∞2x12+2x22+2x1x2+u2+v2dt

Это является задачей линейно-квадратичного регулирования с матрицами

A=0100 B=00.210

Q=2112 R=1001

Решение задачи линейно-квадратичного регулирования будет равно

u0=-1.3549-2.1532x

v0=-0.4054-0.2710x

Проверим, удовлетворяется ли условие

2ρ2v0(x)2≤β2x2 ∀x∈Rn

Действительно

β2x2-2ρ2v0(x)2=x2-2v0(x)2=x12+x22-2-0.4054x1-0.2710x22=xT0.6713-0.2197-
0.21970.8531x≥0

Таким образом

u0=-1.3549-2.1532x

является решением задачи интервального управления.

Для тестирования данного решения, воспользуемся системой Matlab.


Промоделируем реакцию системы на ненулевые начальные условия x10=100 и
x20=-50. Мы рассматриваем следующие четыре случая

Случай 1: p1=-0.2 p2=-10 p3=0 p4=-100


Случай 2: p1=0.2 p2=100 p3=0.2 p4=0
Случай 3: p1=0 p2=0 p3=0 p4=0
Случай 4: p1=-0.2 p2=100 p3=-0.2 p4=-100
Результаты моделирования показаны на рисунке 3.7.-3.10, соответственно.
Результаты для случаев 1,3 и 4 – одинаковы. Замкнутая система устойчива.

45
Рис. 3.7. Реакция системы в случае 1

Рис. 3.8. Реакция системы в случае 2

46
Рис. 3.9. Реакция системы в случае 3

Рис. 3.10. Реакция системы в случае 4

3.4. Неопределенность во входной матрице

47
Теперь обсудим проблему неопределенности во входной матрице. Мы будем
рассматривать три случая: (1) входная неопределенность задается через
матрицу B(x) и неопределенность A(x) удовлетворяет условию
согласованности; (2) входная неопределенность задается через матрицу B(x),
но неопределенность в матрице A(x) не удовлетворяет условию
согласованности; (3) входная неопределенность не задается через матрицу
B(x).

Случай 1

Рассмотрим систему

x=Ax+Bxu+hxu+Bxf(x)

где h(x) - матрица m×m отвечающая неопределенность по входу. Для первого


случая мы сделаем следующие допущения:

Предположение 3.5

A0=0 и f0=0 тогда x=0 является точкой равновесия.

Предположение 3.6

Неопределенность f(x) ограничена; т.е. существует неотрицательная функция


fmax(x) такая, что

f(x)≤fmax(x)

Предположение 3.7

h(x) является положительной полуопределенной матрицей

h(x)≥0

Мы хотим решить следующую задачу интервального управления по


стабилизации нелинейной системы

Задача интервального управления 3.5.

Найти обратную связь u=u0(x) такую, что замкнутая система

x=Ax+Bxu0(x)+hxu0(x)+Bxf(x)

асимптотически устойчива для всех fx,h(x) удовлетворяющих условиям 3.6 и


3.7.

Мы решим указанную выше задачу интервального управления посредством


перевода ее в задачу оптимального управления.

Задача оптимального управления 3.6

Для номинальной системы

x=Ax+Bxu

найти обратную связь u=u0(x), которая минимизирует следующий функционал

0∞fmax(x)2+xTx+uTudt

48
Мы можем решить задачу интервального управления с помощью задачи
оптимального управления. Этот результат приведен в следующей теореме.

Теорема 3.3

Если существует решения задачи оптимального управления 3.6, то ее


решение является также решением задачи интервального управления 3.5.

Доказательство

Предположим, что u=u0(x) является решением задачи оптимального


управления 3.6. Мы хотим показать, что

x=Ax+Bxu0(x)+hxu0(x)+Bxf(x) 3.11
является асимптотически устойчивой для всех неопределенностей fx,h(x),
удовлетворяющих допущениям 3.6 и 3.7.

Для этого определим функционал

Vx0=minu∈Rn0∞fmax(x)2+xTx+uTudt

который нужно минимизировать для определения оптимального управления.


Покажем, что V(x) является функцией Ляпунова для системы 3.11. По
определению V(x) должно удовлетворять уравнению Гамильтона-Якоби-
Беллмана, которое превращается в

minu,vfmax(x)2+xTx+uTu+VxTAx+Bxu=0

Так как u0x является оптимальным управлением, оно должно удовлетворять


приведенному выше уравнению, таким образом:

fmax(x)2+xTx+u0(x)Tu0(x)+VxTAx+Bxu0(x)=0

2u0(x)T+VxTBx=0

На основании приведенных выше уравнений, мы можем показать, что V(x)


является функцией Ляпунова для системы 3.11. Действительно

Vx>0 x≠0

Vx=0 x=0

Чтобы показать, что Vx<0 для всех x≠0, мы сделаем некоторые выкладки

Vx=VxTx=VxTAx+Bxu0(x)+VxTBxhxu0x+VxTBxfx=-fmax(x)2-xTx-
u0xTu0x+VxTBxfx+VxTBxhxu0x=-fmax(x)2-xTx-u0xTu0x-2u0xTfx-2u0(x)Thxu0x≤-
fmax(x)2-xTx-u0xTu0x-2u0xTfx=-fmax(x)2+fxTfx-xTx-u0xTu0x-2u0xTfx-fxTfx=-
fmax(x)2+fxTfx-xTx-u0x+fxTu0x+fx≤-fmax(x)2+fxTfx-xTx

Так как fxTfx≤fmax(x)2

Vx≤-xTx

Другими словами

Vx<0 x≠0

Vx=0 x=0
49
Таким образом, условия теоремы Ляпунова удовлетворяются. Следовательно,
существует окрестность точки 0, N=x:x<c для некоторого c>0, такая что если
x(t) принадлежит области N, то

x(t)→0 при t→∞

Предположим, что x(t) может не всегда находится внутри N. Другими словами,

x(t)≥c

для всех t>0, это означает

Vxt-Vx0=0tVxτdτ≤0t-xTxdτ≤-0tc2dτ≤-c2t

Положим, что t→∞, тогда получается

Vxt≤Vx0-c2t→-∞

что противоречит факту Vxt≥0 для всех x(t). Таким образом,

x(t)→0 при t→∞

При этом не важно, где начинается траектория. Это доказывает, что u0(x)
является решением задачи интервального управления 3.5.

Пример 3.4.

Рассмотрим систему

x1=x2

x2=p1x1cosx2+1+p2x22u

где p1∈[-0.2,2] и p2∈[0.1,1]. Задачей интервального управления является


поиск регулятора u=u0(x) такого, что замкнутая система является устойчивой
для всех p1 и p2.

Переведем данную задачу в задачу оптимального управления, для начала


запишем общий вид интервальных уравнений:

x1x2=0100x1x2+011+p2x22+0.20p1x1cosx2

Неопределенности hx=p2x22≥0 и fx=p1x1cosx2 соответственно ограничены

fx=1+p2x22≤2x1=fmaxx

Таким образом, задача оптимального управления будет следующей. Для


номинальной системы

x1x2=0100x1x2+01u

Найти обратную связь u=u0(x), которая минимизирует следующий


функционал:

0∞fmax(x)2+xTx+uTudt=0∞4x12+x22+u2dt

Это уже задача линейно-квадратичного регулирования с матрицами

A=0100 B=01

50
Q=5001 R=1

Находим решение данной задачи:

u=-2.2361-2.3393x

Для тестирования полученного управления промоделируем реакцию на


ненулевые начальные условия в системе Matlab при x10=10 и x20=-20.
Рассмотрим четыре случая

Случай 1: p1=-0.2 p2=0.1


Случай 2: p1=-0.2 p2=1
Случай 3: p1=2 p2=0.1
Случай 4: p1=2 p2=1
Результаты моделирования приведены на рисунках 3.11-3.14.

Рис. 3.11. Реакция системы на ненулевые начальные условия для случая 1

51
Рис. 3.12. Реакция системы на ненулевые начальные условия для случая 2

Рис. 3.13. Реакция системы на ненулевые начальные условия для случая 3

52
Рис. 3.14. Реакция системы на ненулевые начальные условия для случая 4

Случай 2

Рассмотрим систему

x=Ax+Bxu+hxu+Сxf(x)

где h(x) - матрица m×m отвечающая неопределенность по входу и f(x) не


удовлетворяет условию согласованности. Поэтому мы сделаем следующие
допущения:

Предположение 3.8

A0=0 и f0=0 тогда x=0 является точкой равновесия.

Предположение 3.9

Неопределенность f(x) ограничена; т.е. существует неотрицательная функция


fmax(x) такая, что

f(x)≤fmax(x)

Предположение 3.10

h(x) является положительной полуопределенной матрицей

h(x)≥0

Мы хотим решить следующую задачу интервального управления по


стабилизации нелинейной системы

53
Задача интервального управления 3.7

Найти обратную связь u=u0(x) такую, что замкнутая система

x=Ax+Bxu0(x)+hxu0(x)+Сxf(x)

асимптотически устойчива для всех fx,h(x) удовлетворяющих условиям 3.9. и


3.10.

Мы решим указанную выше задачу интервального управления посредством


перевода ее в задачу оптимального управления.

Задача оптимального управления 3.8

Для вспомогательной системы

x=Ax+Bxu+αI-BxBx+Cxv

найти обратную связь u0x,v0(x), которая минимизирует следующий


функционал

0∞fmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2dt

где α≥0,ρ≥0 и β≥0 вспомогательные параметры, fmax(x) и gmax(x) являются


неотрицательными функциями такими, что

Bx+Cxfx≤fmaxx

α-1f(x)≤gmax(x)

Связь между задачей интервального управления и задачей оптимального


управления задается следующей теоремой.

Теорема 3.4

Если удается выбрать параметры α,ρ,β такие, что решение задачи


оптимального управления 3.8., обозначаемое u0x,v0(x), существует и
выполняется следующей условие:

2ρ2v0(x)2≤β`2x2 ∀x∈Rn

для некоторого β` такого, что β`<β, тогда u0(x) является решением задачи
интервального управления 3.3.

Доказательство

Предположим, что u0x, v0(x) является решением задачи оптимального


управления 3.4. Мы хотим показать, что

x=Ax+Bxu0(x)+hxu0(x)+Сxf(x) 3.12
является асимптотически устойчивой для всех f(x).

Для доказательства этого, мы определим

Vx0=minu,v0∞fmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2dt

54
для того чтобы решить задачу оптимального управления вспомогательной
системы. Покажем, что V(x) является функцией Ляпунова для системы 3.7. По
определению V(x) должно удовлетворять уравнению Гамильтона-Якоби-
Беллмана, которое превращается в

minu,vfmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2+VxTAx+Bxu+αI-BxBx+Cxv=0

Так как u0x, v0(x) является оптимальным управлением, оно должно


удовлетворять приведенному выше уравнению, таким образом:

fmax(x)2+ρ2gmax(x)2+β2x2+u0(x)2+ρ2v0(x)2+VxTAx+Bxu0(x)+αI-
BxBx+Cxv0(x)=0

2u0(x)T+VxTBx=0

2ρ2v0(x)T+VxTαI-BxBx+Cx=0

На основании приведенных выше уравнений, мы можем показать, что V(x)


является функцией Ляпунова для системы 3.12. Действительно

Vx>0 x≠0

Vx=0 x=0

Чтобы показать, что Vx<0 для всех x≠0, выполним следующие


преобразования

Vx=VxTx=VxTAx+Bxu0(x)+hxu0(x)+Сxf(x)=VxTAx+Bxu0(x)+Cxfx+VxTBxhxu0x=V
xTAx+Bxu0(x)+Cxfx-2u0(x)Thxu0x≤VxTAx+Bxu0(x)+Cxfx=VxTAx+Bxu0x+αI-
BxBx+Cxv0(x)-VxTαI-BxBx+Cxv0x+VxTСxfx=VxTAx+Bxu0x+αI-BxBx+Cxv0(x)-
VxTαI-BxBx+Cxv0x+VxTBxBx+Cxfx+VxTI-BxBx+Cxfx=-fmax(x)2-ρ2gmax(x)2-β2x2-
u0(x)2-ρ2v0(x)2+2ρ2v0xTv0(x)-2u0xTBx+Cxfx-2α-1ρ2v0xTC(x)f(x)

С другой стороны

-u0(x)2-2u0xTBx+Cxfx≤Bx+Cxfx2≤fmaxx2-2α-1ρ2v0xTfx≤ρ2v0x2+ρ2α-
1f(x)2≤ρ2v0x2+ρ2gmax(x)2

Таким образом, если условие 2ρ2v0(x)2≤β`2x2, ∀x∈Rn удовлетворяется

Vx≤-β2x2+2ρ2v0(x)2=2ρ2v0(x)2-β`2x2-(β2-β`2)x2≤-(β2-β`2)x2

Другими словами

Vx<0 x≠0

Vx=0 x=0

Таким образом, условия теоремы Ляпунова удовлетворяются. Следовательно,


существует окрестность точки 0, N=x:x<c для некоторого c>0, такая что если
x(t) принадлежит области N, то

x(t)→0 при t→∞

Предположим, что x(t) может не всегда находится внутри N. Другими словами,

x(t)≥c

55
для всех t>0, это означает

Vxt-Vx0=0tVxτdτ≤0t-(β2-β`2)x2dτ≤-0t(β2-β`2)c2dτ≤-(β2-β`2)c2t

Положим, что t→∞, тогда получается

Vxt≤Vx0-(β2-β`2)c2t→-∞

что противоречит факту Vxt≥0 для всех x(t). Таким образом,

x(t)→0 при t→∞

При этом не важно, где начинается траектория. Это доказывает, что u0(x)
является решением задачи интервального управления 3.7.

Пример 3.5.

Рассмотрим следующую нелинейную систему

x1=x2+p1x1cos1x2+p3x2sin⁡(p4x1x2)

x2=(1+p2x22)u

Здесь p1∈-0.2,0.2, p2∈0.2,3,p3∈[0,0.2] и p4∈-100,0. Задача интервального


управления заключается в том, чтобы найти регулятор u=u0(x), который
делает замкнутую систему устойчивой для всех неопределенностей.

Чтобы перевести данную задачу в задачу оптимального управления запишем


уравнения состояния:

x1x2=0100x1x2+01(1+p2x22)+10f(x)

где

fx=p1x1cos1x2+p3x2sin⁡(p4x1x2)

является неопределенностью. Возьмем α=0.2, β=1 и ρ=1. Тогда fmax(x) и


gmax(x) могут быть определены следующим образом

Bx+Cxf(x)=0110f(x)=0=fmax(x)

α-1f(x)=5p1x1cos1x2+p3x2sin⁡(p4x1x2)≤x1+x2=gmax(x)

Тогда

fmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2=x1+x22+x12+x22+u2+v2

Таким образом, соответствующая задача оптимального управления будет


иметь вид. Для вспомогательной системы

x1x2=0100x1x2+01u+0.20v

Найти обратную связь вида u0x,v0x, которая минимизирует следующий


функционал

0∞2x12+2x22+2x1x2+u2+v2dt

Это является задачей линейно-квадратичного регулирования с матрицами

A=0100 B=00.210
56
Q=2112 R=1001

Решение задачи линейно-квадратичного регулирования будет равно

u0=-1.3549-2.1532x

v0=-0.4054-0.2710x

Проверим, удовлетворяется ли условие

2ρ2v0(x)2≤β2x2 ∀x∈Rn

Действительно

β2x2-2ρ2v0(x)2=x2-2v0(x)2=x12+x22-2-0.4054x1-0.2710x22=xT0.6713-0.2197-
0.21970.8531x≥0

Таким образом

u0=-1.3549-2.1532x

является решением задачи интервального управления.

Для тестирования данного решения, воспользуемся системой Matlab.


Промоделируем реакцию системы на ненулевые начальные условия x10=10 и
x20=10. Мы рассматриваем следующие четыре случая

Случай 1: p1=-0.2 p2=0.2 p3=0 p4=-100


Случай 2: p1=0.2 p2=0.2 p3=0.2 p4=0
Случай 3: p1=0 p2=3 p3=0 p4=0
Случай 4: p1=-0.2 p2=3 p3=-0.2 p4=-100
Результаты моделирования показаны на рисунке 3.15.-3.18, соответственно.

57
Рис. 3.15 Реакция системы на ненулевые начальные условия для случая 1

Рис. 3.16 Реакция системы на ненулевые начальные условия для случая 2

Рис. 3.17 Реакция системы на ненулевые начальные условия для случая 3

58
Рис. 3.18 Реакция системы на ненулевые начальные условия для случая 4

Случай 3

Далее мы будем полагать, что неопределенность не задается через входную


матрицу B(x); т.е. рассмотрим систему

x=Ax+Bxu+СxD(x)u

где D(x) - матрица отвечающая неопределенность по. Поэтому мы сделаем


следующие допущения:

Предположение 3.11

A0=0 тогда x=0 является точкой равновесия.

Предположение 3.12

Неопределенность D(x) ограничена; т.е. существует неотрицательная


функция Dmax(x) такая, что

D(x)≤Dmax(x)

Мы хотим решить следующую задачу интервального управления по


стабилизации нелинейной системы

Задача интервального управления 3.9

Найти обратную связь u=u0(x) такую, что замкнутая система

x=Ax+Bxu0(x)+СxD(x)u0(x)

асимптотически устойчива для всех D(x) удовлетворяющих D(x)≤Dmax(x).

59
Так как u является функцией от x, u=u0(x), мы можем видеть, что fx=Dxu0(x)
является неопределенностью и полагаем, что она ограничена:

Bx+CxDxu0(x)≤fmaxx

α-1D(x)u0(x)≤gmax(x)

Теперь мы можем решить указанную выше задачу, используя задачу


оптимального регулирования.

Задача оптимального управления 3.10

Для вспомогательной системы

x=Ax+Bxu+αI-BxBx+Cxv

найти обратную связь u0x,v0(x), которая минимизирует следующий


функционал

0∞fmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2dt

где α≥0,ρ≥0 и β≥0 вспомогательные параметры, fmax(x) и gmax(x) - функции


указанные выше.

Связь между задачей интервального управления и задачей оптимального


управления задается следующей теоремой.

Теорема 3.5

Если удается выбрать параметры α,ρ,β и функции fmax(x) и gmax(x) такие, что
решение задачи оптимального управления 3.10., обозначаемое u0x,v0(x),
существует и выполняется следующей условие:

Bx+CxDxu0x≤fmaxx

α-1D(x)u0(x)≤gmax(x)

2ρ2v0(x)2≤β`2x2 ∀x∈Rn

для некоторого β` такого, что β`<β, тогда u0(x) является решением задачи
интервального управления 3.10.

Доказательство

Предположим, что u0x, v0(x) является решением задачи оптимального


управления 3.10. Мы хотим показать, что

x=Ax+Bxu0(x)+hxu0(x)+СxD(x)u0(x) 3.13
является асимптотически устойчивой для всех D(x).

Для доказательства этого, мы определим

Vx0=minu,v0∞fmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2dt

60
для того чтобы решить задачу оптимального управления вспомогательной
системы. Покажем, что V(x) является функцией Ляпунова для системы 3.13. По
определению V(x) должно удовлетворять уравнению Гамильтона-Якоби-
Беллмана, которое превращается в

minu,vfmax(x)2+ρ2gmax(x)2+β2x2+u2+ρ2v2+VxTAx+Bxu+αI-BxBx+Cxv=0

Так как u0x, v0(x) является оптимальным управлением, оно должно


удовлетворять приведенному выше уравнению, таким образом:

fmax(x)2+ρ2gmax(x)2+β2x2+u0(x)2+ρ2v0(x)2+VxTAx+Bxu0(x)+αI-
BxBx+Cxv0(x)=0

2u0(x)T+VxTBx=0

2ρ2v0(x)T+VxTαI-BxBx+Cx=0

На основании приведенных выше уравнений, мы можем показать, что V(x)


является функцией Ляпунова для системы 3.13. Действительно

Vx>0 x≠0

Vx=0 x=0

Чтобы показать, что Vx<0 для всех x≠0, выполним следующие


преобразования

Vx=VxTx=VxTAx+Bxu0(x)+hxu0(x)+СxD(x)u0(x)=VxTAx+Bxu0(x)+CxDxu0(x)+VxT
Bxhxu0x=VxTAx+Bxu0x+CxDxu0(x)-
2u0xThxu0x≤VxTAx+Bxu0x+CxDxu0(x)=VxTAx+Bxu0x+αI-BxBx+Cxv0x-VxTαI-
BxBx+Cxv0x+VxTСxDxu0(x)=VxTAx+Bxu0x+αI-BxBx+Cxv0x-VxTαI-
BxBx+Cxv0x+VxTBxBx+CxDxu0(x)+VxTI-BxBx+CxDxu0(x)=-fmax(x)2-ρ2gmax(x)2-
β2x2-u0(x)2-ρ2v0(x)2+2ρ2v0xTv0(x)-2u0xTBx+CxDxu0(x)-2α-
1ρ2v0xTC(x)D(x)u0(x))=-fmax(x)2-ρ2gmax(x)2-β2x2-u0(x)2+ρ2v0(x)2-
2u0xTBx+CxDxu0(x)-2α-1ρ2v0xTC(x)D(x)u0(x)

По условию Bx+CxDxu0x≤fmaxx и α-1D(x)u0(x)≤gmax(x)

-u0(x)2-2u0xTBx+CxDxu0(x)≤Bx+CxDxu0(x)2≤fmaxx2-2α-
1ρ2v0xTDxu0(x)≤ρ2v0x2+ρ2α-1D(x)u0(x)2≤ρ2v0x2+ρ2gmax(x)2

Более того по условию 2ρ2v0(x)2≤β`2x2, ∀x∈Rn

Vx≤-β2x2+2ρ2v0(x)2=2ρ2v0(x)2-β`2x2-(β2-β`2)x2≤-(β2-β`2)x2

Другими словами

Vx<0 x≠0

Vx=0 x=0

Таким образом, условия теоремы Ляпунова удовлетворяются. Следовательно,


существует окрестность точки 0, N=x:x<c для некоторого c>0, такая что если
x(t) принадлежит области N, то

x(t)→0 при t→∞

61
Предположим, что x(t) может не всегда находится внутри N. Другими словами,

x(t)≥c

для всех t>0, это означает

Vxt-Vx0=0tVxτdτ≤0t-(β2-β`2)x2dτ≤-0t(β2-β`2)c2dτ≤-(β2-β`2)c2t

Положим, что t→∞, тогда получается

Vxt≤Vx0-(β2-β`2)c2t→-∞

что противоречит факту Vxt≥0 для всех x(t). Таким образом,

x(t)→0 при t→∞

При этом не важно, где начинается траектория. Это доказывает, что u0(x)
является решением задачи интервального управления 3.9.

3.5. Выводы

Эта глава посвящена проблемам нелинейных систем. Хотя концепция


решения очень схожа с линейными системами, доказательство теорем
значительно сложнее. Более того, вычисления решения также более емки.
Решения проиллюстрированы несколькими примерами, но есть множество
систем, для которых мы не можем определить решение.

Вначале была рассмотрена задача интервального управления при выполнении


условия согласованности. В отличие от линейных систем, где решение задачи
интервального управления всегда существует, решение для нелинейных
систем может и не существовать, если соответствующая задача оптимального
управления не может быть решена. Это конечно неприятно, но такова
особенность нелинейных систем.

Затем были исследованы нелинейные системы с несогласованной


неопределенностью. Здесь не только должно существовать решение задачи
оптимального управления, но также выполняться некоторое дополнительное
условие. Хотя это ограничивает применение данного подхода, но назвать
результаты неадекватными нельзя, так как большинство подходов вообще не
работают с несогласованной неопределенностью.

Также нами были рассмотрены задача интервального управления для систем


с неопределенностью во входной матрице. Это вводит дополнительные
сложности в задачу. Тем не менее, наш подход обеспечивает способ
преодоления таких трудностей.

62
4. ПОДХОД ХАРИТОНОВА
4.1. Введение

Данный подход рассматривает устойчивость интервальной системы. Другими


словами мы хотим проверить, является ли система устойчивой, когда ее
параметры не определены и изменяются в пределах интервала. Необходимо
ответить на два вопроса: (1) для заданного множества интервалов, в которых
изменяются параметры, можем ли мы проверить является ли система
устойчивой для всех возможных параметров?; (2) если так, то сколько
значений параметров нам необходимо проверить?

К примеру, рассмотрим систему со следующим характеристическим


полиномом

φs,p=p0+p1s+p2s2+p3s3

где pi∈pi-,pi+, i=0,1,2,3 коэффициенты, значение которых не определено, но


мы знаем их верхнюю и нижнюю границы. Для проверки того, является ли
система устойчива для всех возможных параметров, самый наивный подход –
это проверить множество полиномов:

ψ={p0+p1s+p2s2+p3s3: pi∈pi-,pi+, i=0,1,2,3}

Так как это множество бесконечно, невозможно проверить все его элементы
один за другим. Но мы не должны этого делать. Согласно критерию Рауса-
Гурвица, система третьей степени устойчива тогда и только тогда, когда
коэффициенты ее характеристического полинома удовлетворяют следующим
условиям:

p0>0,p1>0,p2>0,p3>0, p1p2>p0p3

Таким образом, данное множество полиномов ψ устойчиво тогда и только


тогда, когда

p0->0,p1->0,p2->0,p3->0,p1-p2->p0+p3+

Другими словами, для проверки того, являются ли все полиномы ψ


устойчивыми, мы должны проверить устойчивость следующих двух
полиномов:

φ1=p0-+p1-s+p2-s2+p3-s3

φ2=p0++p1-s+p2-s2+p3+s3

Из этого примера видно, что для проверки устойчивости бесконечного


множестве полиномов ψ, необходимо рассмотреть устойчивость лишь
конечного числа полиномов. В этом примере только два полинома должны
быть проверены. В общем случае, мы хотим узнать, сколько полиномов
необходимо проверить, чтобы определить устойчивость всей интервальной

63
системы. Также в этом примере, два конечных полинома представляют собой
два угла многоугольника, представляющего область возможных параметров
системы в пространстве. Должны ли мы проверять все углы? Как много углов
мы должны проверить? Заметим, что число углов возрастает экспоненциально
с ростом числа параметров. Теорема Харитонова элегантно отвечает на
поставленные выше вопросы: не важно, из сколько интервальных параметров
включает система, мы должны проверить только четыре определенных угла.

4.2. Предварительные теоремы

В этом пункте будут рассмотрены два результата, которые будут


использоваться при доказательстве подхода Харитонова. Этими двумя
подготовительными теоремами являются теорема краевых пересечений и
теорема чередований. Вначале рассмотрим теорему краевых пересечений.
Предположим, что

φs,p=a0p+a1ps+…+an-1psn-1+sn

является семейством полиномов, где коэффициенты aip, i=0,1,…,n-1


непрерывные функции неопределенного параметра p, заданного на
интервале p∈P=[p-,p+].

Разобьем комплексную плоскость С на три части:

C=S∪δS∪U

где S – открытое множество, которое рассматривается как «стабильная


область», δS - это граница S, и U это дополнение S∪δS , которое также
является открытым множеством и рассматривается как «неустойчивая
область». Для линейных стационарных систем, S является левой
полуплоскостью комплексной плоскости, δS - мнимая ось, и U – правая
полуплоскость.

Теперь докажем теорему краевых пересечений.

Теорема 4.1

Если все корни φ(s,p-) находятся в S и хотя бы один корень φ(s,p+) в U, то


существует, по крайней мере одно p∈[p-,p+]такое, что корни φs,p находятся в
S∪δS и при этом один в δS. Аналогично, если все корни φs,p+ лежат в S и
хотя бы один корень φ(s,p-) лежит в U, то существует по крайней мере одно
p∈p-,p+, при котором все корни φs,p принадлежат S∪δS и при этом один
корень лежит в δS.

64
Рис. 4.1. Устойчивая и неустойчивая области на комплексной плоскости

Доказательство

Результат следует из предположения, что aip, i=0,1,…,n-1 являются


непрерывными функциями от p и того факта, что корни полиномов являются
непрерывными функциями от их коэффициентов.

Пример 4.1

Рассмотрим следующий полином:

φs,p=40-p2+1+ps+9+3ps2+s3

где p∈p-,p+=[1,2]. Предположим, что S – открытая левая полуплоскость


комплексной плоскости. Для p=p-=1корни полинома

φs,p=39+2s+12s2+s3

будут равны -12,1011, 0.0505+j1.7945, 0.0505-j1.7945 (которые соответствуют


неустойчивой системе). Для p=p+=2 получаем следующий полином

φs,p=36+3s+15s2+s3

корни которого равны -14.9603, -0.0198+j1.5511, -0.0198-j1.5511 (которые


соответствуют устойчивой системе).

Согласно теореме краевых пересечений, существует по крайней мере одно


p∈p-,p+ такое, что все корни φs,p лежат в левой комплексной полуплоскости
и при этом один корень лежит на мнимой оси. Действительно, мы можем
обнаружить такое p, оно равно p=1.6623, при этом

φs,p=37.2368+2.6623s+13.9869s2+s3

и корни φs,p равны -13.9869, j1.6316, -j1.6316.

65
Теорема краевых пересечений используется для доказательства теоремы
чередований.

Для заданного полинома

φs=a0+a1s+…+an-1sn-1+ansn

мы запишем четную и нечетную части следующим образом: если степень


полинома n=2m четная, то тогда четная часть будет представлена в виде:

φчs=a0+a2s2+…+an-2sn-2+ansn

а нечетная (без s)

φнs=a1+a3s2+…+an-3sn-4+an-1sn-2

С другой стороны, если степень полинома n=2m+1, то четная часть будет


равна:

φчs=a0+a2s2+…+an-3sn-3+an-1sn-1

и нечетная часть (без s):

φнs=a1+a3s2+…+an-2sn-3+ansn-1

Интуитивно, такой результат объясняется тем, что если мы представим s=jw,


то

φjw=a0+a1jw+a2(jw)2+…+an-1(jw)n-1+an(jw)n

Тогда действительная часть φjw может быть представлена в виде (для n=2m)

Re(φjw)=a0+a2(jw)2+…+an-2(jw)n-2+an(jw)n

а для (n=2m+1)

Re(φjw)=a0+a2(jw)2+…+an-3(jw)n-3+an-1(jw)n-1

В обоих случаях

Re(φjw)=φч(jw)

Точно также мнимая часть φjw может быть представлена в виде (для n=2m)

jIm(φjw)=jw(a1+a3jw2+…+an-3jwn-4+an-1jwn-2)

а для (n=2m+1)

jIm(φjw)=jw(a1+a3jw2+…+an-2jwn-3+anjwn-1)

В любом случае

jIm(φjw)=iwφн(jw)

Таким образом, φч(s) и φн(s) - соответствующие действительная и мнимая


части φ(jw). Мы говорим, что φs=a0+a1s+…+an-1sn-1+ansn удовлетворяет
свойству чередования, если

1. an и an-1 одного знака


2. все корни φч(s) и φн(s) являются действительными различными числами
66
3. если n=2m четно, то φч(s) содержит m положительных корней
w1ч<w2ч<…wmч, φн(s) имеет m-1 положительных корней w1н<w2н<…
wm-1н, и они должны чередоваться следующим образом:
0<w1ч<w1н<w2ч<…<wm-1н<wmч
4. если n=2m+1 нечетно, то φч(s) содержит m положительных корней
w1ч<w2ч<…wmч, φн(s) имеет m положительных корней w1н<w2н<…
wmн, и они должны чередоваться следующим образом:
0<w1ч<w1н<w2ч<…<wm-1н<wmч<wmн

Условия для теоремы чередования могут быть проиллюстрированы с помощью


рисунков 4.2 и 4.3. На рисунке 4.2. показана кривая φ(jw) у которой w
изменяется от 0 до +∞. Кривая пересекает мнимую и действительную оси в
точках w=w1,w2,w3,…, и т.д. На рисунке 4.3. показаны кривые φч(jw) и φн(jw)
когда w изменяется от 0 до +∞. Эти две кривые чередуются.

Следующая теорема чередования связывает свойство чередования и


устойчивость.

Теорема 4.2

Корни полинома φs=a0+a1s+…+an-1sn-1+ansn лежат в левой полуплоскости


тогда и только тогда, когда он (полином) удовлетворяет свойству
чередования.

Рис. 4.2. Кривая φ(jw) при изменении w от 0 до +∞

67
Рис. 4.3. Чередование φч(jw) и φн(jw)

Прежде, чем доказать эту теорему, давайте вернемся к том (Лемма 3.1.), что
если корни полинома φs=a0+a1s+…+an-1sn-1+ansn лежат в левой
полуплоскости, то все его коэффициенты ai, i=0,1,2,…,n должны быть одного
знака.

Без потери общности, будем полагать, что все коэффициенты ai>0, i=0,1,2,…,
n больше нуля. Еще важным является тот факт, что если все корни полинома
лежат в левой полуплоскости, то ни один из его коэффициентов не равен
нулю.

Рассмотрим φ(jw). Когда w изменяется от -∞ до +∞, то фаза φ(jw),


обозначаемая ∠φ(jw), также изменяется. Величина изменения фазы может
быть определена с помощью следующей леммы.

Лемма 4.1

Если корни полинома φs=a0+a1s+…+an-1sn-1+ansn лежат в левой


полуплоскости, то фаза φ(jw) является непрерывной и строго возрастающей
функцией от w∈(-∞,+∞). Более того, величина изменения фазы ∠φ(jw) при w
от -∞ до +∞ определяется с помощью

∠φ+jw-∠φ-jw=nπ

или, если w изменяется от 0 до +∞

∠φ+jw-∠φj0=nπ2

Доказательство

Обозначим корни φs через r1,r2,…,rn, где

ri=ci+jdi ci<0 i=1,2,…,n

Запишем полином φs как:

φs=ans-r1s-r2…(s-rn)
68
где an>0. Тогда фаза φs определяется следующим образом (если
воспользоваться экспоненциальной записью комплексного числа):

∠φjw=∠jw-r1+∠jw-r2+…∠jw-rn

Так как ci<0, то ни один из корней не лежит на мнимой оси и все корни
принадлежат левой полуплоскости. Таким образом, для всех i=1,2,…,n =∠jw-
ri==∠jw-ci-jdi является непрерывной и строго возрастающей функцией,
зависящей от w при ее изменении -∞ до +∞.

Для w<di, ∠(jw-ci-jdi) фаза отрицательна. В частности, когда w=-∞, то ∠jw-ci-


jdi=-π2. Для w>di, ∠(jw-ci-jdi) фаза положительна. При w=+∞, ∠jw-ci-jdi=π2.
Таким образом, величина изменения фазы для ∠jw-ci-jdi от -∞ до +∞
определяется

∠+j∞-ci-jdi-∠-j∞-ci-jdi=π2--π2=π

Окончательно величина изменения фазы для ∠φjw при w от -∞ до +∞


определяется

∠φ+j∞-∠φ-j∞=i=1n∠+j∞-ci-jdi-∠-j∞-ci-jdi=nπ

Так как корни φs симметричны относительно действительной оси, то не


сложно определить изменение фазы ∠φjw при w от -∞ до 0 или при w от 0 до
+∞, которое равно

∠φ+jw-∠φj0=nπ2

Что и требовалось доказать.

Теперь давайте рассмотрим траекторию φjw при изменении w от -∞ до +∞.


Траектория должна быть симметрична относительно действительной оси, так
как φjw и φ-jw являются комплексно сопряженными. Тогда, нам необходимо
лишь траекторию φjw при изменении w от 0 до +∞. Так как φj0=a0>0, то
траекторию начинается с положительной действительной оси. Ранее мы
показали, что ∠φjw строго возрастающая функция от w, то траектория φjw
обходит начало координат против часовой стрелки. Она будет поочередно
пересекать мнимую и действительную оси. Предположим, что w1,w2,w3,…,
где w1<w2<w3<…, это частоты, при которых траектория φjwпересекает
мнимую и действительную оси. Очевидно, что w1,w3,… это частоты, при
которых траектория пересекает мнимую ось. Другими словами:

Reφjwi=φчjwi=0, i=1,3,…

Аналогично, w2,w4,… это частоты, при которых траектория пересекает


действительную ось:

Imφjwk=wkφнjwk=0, k=2,4,…

Если n=2m четное, то изменение фазы ∠φjw от 0 до +∞ равно ∠φ+jw-


∠φj0=nπ2=mπ. Таким образом, траектория φjw пересечет мнимую ось m раз (m
положительных корней у φч(jw): w1ч<w2ч<…wmч). Из определения
w1,w2,w3,…, становится ясно, что w1=w1ч,w3=w2ч,…,w2m-1=wmч.
Аналогично, траектория φjw будет пересекать действительную ось m-1 раз, в

69
соответствии с m-1 положительными корнями φн(jw): w1н<w2н<…wm-1н.
Другими словами w2=w1н, w4=w2н,…w2m-2=wm-1н.

Если n=2m+1 нечетное, то изменение фазы составит ∠φ+jw-


∠φj0=nπ2=mπ+π2. Таким образом, траектория φjw будет пересекать мнимую
ось m раз, что соответствует m положительным корням φч(jw): w1ч<w2ч<…
wmч. Тогда мы можем определить, что корни определяются
w1=w1ч,w3=w2ч,…,w2m-1=wmч. Также, траектория φjw пересечет
действительную ось m раз, что соответствует m положительным корням
φн(jw): w1н<w2н<…wmн и w2=w1н, w4=w2н,…w2m=wmн.

Лемма 4.2

Для полинома φs=a0+a1s+…+an-1sn-1+ansn, у которого все корни лежат в


левой полуплоскости, корни φч(jw) и φнjw удовлетворяют следующим
свойствам. Если n=2m четно, то 0<w1ч<w1н<w2ч<…<wm-1н<wmч, если
2m+1 нечетно, то 0<w1ч<w1н<w2ч<…<wm-1н<wmч<wmн.

Доказательство

Основываясь на предыдущих рассуждениях, если n=2m четно, то

0<w1<w2<w3<…<w2m-1 ⇒ 0<w1ч<w1н<w2ч<…<wm-1н<wmч

И если n=2m+1 нечетно, то

0<w1<w2<w3<…<w2m ⇒ 0<w1ч<w1н<w2ч<…<wm-1н<wmч<wmн

На основании данных рассуждений, мы можем доказать Теорему 4.2.

Доказательство теоремы 4.2

(Необходимость) Вначале докажем необходимость Теоремы 4.2. Мы


предполагаем, что корни φs=a0+a1s+…+an-1sn-1+ansn лежат в левой
полуплоскости и мы покажем, что φs удовлетворяет свойству чередования:

1. an и an-1 одного знака: это по Лемме 3.1


2. все корни φч(s) и φн(s) являются действительными различными числами:
это по той причине, что корни связаны с частотами, при которых
траектория φjw пересекает мнимую и действительную оси.
3. если n=2m четно, то φч(s) содержит m положительных корней
w1ч<w2ч<…wmч, φн(s) имеет m-1 положительных корней w1н<w2н<…
wm-1н, и они должны чередоваться следующим образом:
0<w1ч<w1н<w2ч<…<wm-1н<wmч: по Лемме 4.2
4. если n=2m+1 нечетно, то φч(s) содержит m положительных корней
w1ч<w2ч<…wmч, φн(s) имеет m положительных корней w1н<w2н<…
wmн, и они должны чередоваться следующим образом:
0<w1ч<w1н<w2ч<…<wm-1н<wmч<wmн: по Лемме 4.2.

(Достаточность) Теперь мы докажем достаточность Теоремы 4.2. Мы


предполагаем, что φs удовлетворяет свойству чередования, мы хотим
показать, что корни φs находятся в левой полуплоскости.

70
Рассмотрим случай, когда n=2m четно. Другой случай, когда n=2m+1,
доказывается аналогично.

Без потери общности, предположим, что оба числа an и an-1 положительные.


Так как у φч(jw) m положительных корней w1ч<w2ч<…wmч, то мы можем
записать

φчjw=a2mw2-w1ч2w2-w2ч2…(w2-wmч2)

Аналогично

φнjw=a2m-1w2-w1н2w2-w2н2…(w2-wm-1н2)

Теперь, предположим что у полинома

ψs=b0+b1s+…+bn-1sn-1+bnsn

все его корни лежат в левой полуплоскости. Согласно доказательству


необходимости, ψs удовлетворяет условию чередования. Пусть w1ч<w2ч<…
wmч положительные корни ψч(jw) и w1н<w2н<…wm-1н положительные корни
ψн(jw). Мы можем записать:

ψчjw=b2mw2-w1ч2w2-w2ч2…w2-wmч2

ψнjw=b2mw2-w1н2w2-w2н2…(w2-wm-1н2)

По определению следующий полином с параметром λ∈0,1:

ϕjw,λ=λa2m+1-λb2mw2-λw1ч2+1-λw1ч2×…×w2-λwmч2+1-λwmч2+ jwλa2m-
1+1-λb2m-1w2-λw1н2+1-λw1н2×…×w2-λwm-1н2+1-λwm-1н2

Ясно, что при λ=0, ϕs,0=ψs, и при λ=1, ϕs,1=φs.

Полином ψs содержит все свои корни в левой полуплоскости. Мы докажем, что


корни φs также лежат в левой полуплоскости. Предположим, что у φs есть по
крайней мере один корень, лежащий не в левой полуплоскости, тогда по
Теореме 4.1. существует по крайней мере одно λ∈0,1, такое что все корни ϕs,λ
лежат в левой полуплоскости и по крайней мере один корень лежит на
мнимой оси. Обозначим этот корень s=jw0, такой что ϕjw0,λ=0. Теперь мы
добились того, что мнимая и действительная части ϕjw0,λ должны равняться
нулю, должны существовать i∈1,2,…,m и j∈1,2,…,m-1 такие что следующие
два условия выполняются:

w02=λwiч2+(1-λ)wiч2 и w02=λwiн2+(1-λ)wiн2

Но это невозможно по причине свойства чередования, может быть выполнено:


wiч<wjн и wiч<wjн или wiч>wjн и wiч>wjн. В первом случае, мы определим,
что

λwiч2+1-λwiч2<λwiн2+1-λwiн2

Во втором случае, мы получаем, что

λwiч2+1-λwiч2>λwiн2+1-λwiн2

71
Таким образом, в обоих случаях, нельзя чтобы одновременно выполнялись оба
выражения

w02=λwiч2+1-λwiч2 и w02=λwiн2+1-λwiн2

Пример 4.2

Рассмотрим следующий полином

φs=1+2s+4s2+2s3+s4

Степень полинома четная, поэтому мы можем выделить соответственно


компоненты:

φчs=1+4s2+s4

φнs=2+2s2

Тогда корни φчjw=1-4w2+w4 равны -1.9319, -0.5176, 0.5176, 1.9319. Таким


образом: w1ч=0.5176 и w2ч=1.9319.

Корни φнjw=2+2w2 равны -1 и 1, поэтому w1н=1. Ясно, что условие


чередования выполняется (мы можем записать, что 0<w1ч<w1н<w2ч).

Теперь давайте проверим корни полинома φs=1+2s+4s2+2s3+s4, которые


равны: -0.7429+j1.5291, -0.7429-j1.5291, -0.2571+j0.5291, -0.2571-j0.5291.
Корни лежат в левой полуплоскости, поэтому полином устойчив.

Пример 4.3

Рассмотрим следующий полином

φs=11.1216+19.1866s+95.7330s2+67.3653s3+66.0427s4+42.2195s5

Выделяем четный и нечетный полиномы:

φчs=11.1216+95.7330s2+66.0427s4

φнs=19.1866s+67.3653s2+42.2195s4

Корни полинома φчs=11.1216+95.7330s2+66.0427s4 равны

-1.1499, -0.3569, 0.3569, 1.1499

Т.е. w1ч=0.3569 и w2ч=1.1499

Корни полинома φнs=19.1866s+67.3653s2+42.2195s4 равны

-1.1066, -0.6092, 0.6092, 1.1066

Таким образом, w1н=0.6092,w2н=1.1066. Так как неравенство


0<w1ч<w1н<w2ч<w2нневерно, то условие чередования не выполняется.
Корни φs=11.1216+19.1866s+95.7330s2+67.3653s3+66.0427s4+42.2192s5
могут быть определены и они равны:

-1.4518,0.0182+j1.3191,0.0182-j1.1391,-0.0744+j0.3664,-0.0744-j0.3664

Действительно, два корня не лежат в левой полуплоскости (это


подтверждает, что условие чередования не выполняется).
72
Теорема 4.3

Рассмотрим два устойчивых полинома одной степени. Они имеют одинаковую


четную часть, но различную нечетную:

φ1s=φчs+sφ1н(s)

φ2s=φчs+sφ2н(s)

Предположим, что нечетные части удовлетворяют условию:

φ1н(jw)≤φ2н(jw) для всех w∈[0,∞)

Тогда любой полином φs=φчs+sφн(s), удовлетворяющий условию

φ1н(jw)≤φ(jw)н≤φ2н(jw) для всех w∈[0,∞)

будет устойчивым.

Доказательство

По условию φ1s и φ2s устойчивы, поэтому они удовлетворяют свойству


чередования. Для доказательства того, что φs также является устойчивым,
покажем, что φs соответственно тоже удовлетворяет свойству чередования.
Обозначим

φнs=a1+a3s2+…+an-2sn-3+ansn-1

φ1нs=a1-+a3-s2+…+an-2-sn-3+an-sn-1

φ2нs=a1++a3+s2+…+an-2+sn-3+an+sn-1

Условие φ1н(jw)≤φ(jw)н≤φ2н(jw) для всех w∈[0,∞) определяет следующее:

A. Коэффициенты a1-,a1+ и a1 имеют один знак, так как в противном


случае условие φ1н(jw)≤φ(jw)н≤φ2н(jw) будет нарушено для w=0.
Примем их всех положительными.
B. Степени полиномов φ1s,φ2s и φs равны, так как в противном случае
условие φ1н(jw)≤φ(jw)н≤φ2н(jw) будет нарушено для w=∞.
C. Обозначим положительные действительные корни для
φjwн,φ1нjw,φ2н(jw) как w1,w2,…,wk,w1-,w2-,…,wk-,w1+,w2+,…,
wk+соответственно. Таким образом для всех i=1,2,…,k, корни
удовлетворяют неравенству wi-≤wi≤wi+. Это происходит по той
причине, что кривая φ(jw)н ограничена кривыми φ1н(jw) и φ2н(jw).

Согласно этим результатам мы можем проверить условия для теоремы


чередований.

1. an и an-1 одного знака. Это подтверждается условием А и


предположением того, что φ1s и φ2s удовлетворяют свойству
чередования.
2. все корни φч(s) и φн(s) являются действительными различными числами.
Подтверждается свойствами В и С и тем предположением, что φ1s и φ2s
удовлетворяют свойству чередования.
3. если n=2m четно, то φч(s) содержит m положительных корней
w1ч<w2ч<…wmч, φн(s) имеет m-1 положительных корней w1н<w2н<…
73
wm-1н, и они должны чередоваться следующим образом:
0<w1ч<w1н<w2ч<…<wm-1н<wmч. Согласно пункту С и тем, что φ1s и
φ2s удовлетворяют свойству чередования.
4. если n=2m+1 нечетно, то φч(s) содержит m положительных корней
w1ч<w2ч<…wmч, φн(s) имеет m положительных корней w1н<w2н<…
wmн, и они должны чередоваться следующим образом:
0<w1ч<w1н<w2ч<…<wm-1н<wmч<wmн. Согласно пункту С и тем, что
φ1s и φ2s удовлетворяют свойству чередования.

Наконец, согласно Теореме чередований, полином φs является устойчивым.

Теорема 4.4

Рассмотрим два устойчивых полинома с одинаковой степенью. У них


одинаковые нечетные части, но различные четные:

φ1s=φ1чs+sφнs

φ2s=φ2чs+sφнs

Предположим, что четные части удовлетворяют условию:

φ1ч(jw)≤φ2ч(jw) для всех w∈[0,∞)

Тогда любой полином φs=φчs+sφн(s), удовлетворяющий условию

φ1ч(jw)≤φ(jw)ч≤φ2ч(jw) для всех w∈[0,∞)

является устойчивым.

Доказательство аналогично теореме 4.3.

Теоремы, рассмотренные в этом пункте, будут использованы в следующей


секции для доказательства главной теоремы этой главы.

4.3. Теорема Харитонова

В этом пункте мы рассмотрим ключевой вопрос всей главы. Для заданного


множества полиномов, как определить будут ли они устойчивы? Мы будем
называть эту задачу – задачей интервальной устойчивости (в англ.
литературе robust stability problem). Понятно, что мы не можем проверить все
полиномы, так как их бесконечное множество. Поэтому нам необходимо найти
подход для проверки только конечного числа полиномов, с помощью которых
мы можем делать вывод обо всем множестве. Эта цель достижима не всегда.
Результат Харитонова показывает, что для множества интервальных
полиномов задача интервальной устойчивости может быть разрешена
проверкой только четырех полиномов. Давайте посмотрим как это делается.

Для заданного множества полиномов

φs,p=p0+p1s+…+pn-1sn-1+pnsn

где pi∈pi-,pi+, i=0,1,…,n-1,n коэффициенты, значения которых не определены.


Мы бы хотели знать, являются ли устойчивыми все полиномы в данном

74
множестве, т.е. является ли данное множество интервально устойчивым.
Другими словами, предположим что

p=[p0,p1…pn]

вектор неопределенных коэффициентов и

P=p0-,p0+×…×pn-,pn+

множество возможных значений вектора p.

Определим множество допустимых полиномов как

ψs,p={φs,p:p∈P}

Очевидно, это множество бесконечно. Для проверки, являются ли все


φ(s,p)∈ψ(s,p) устойчивыми, мы проверим на устойчивость следующие четыре
полинома Харитонова.

K1s=p0-+p1-s+p2+s2+p3+s3+p4-s4+p5-s5+…

K2s=p0-+p1+s+p2+s2+p3-s3+p4-s4+p5+s5+…

K3s=p0++p1-s+p2-s2+p3+s3+p4+s4+p5-s5+…

K4s=p0++p1+s+p2-s2+p3-s3+p4+s4+p5+s5+…

Теорема Харитонова утверждает, что устойчивости четырех приведенных


полиномов необходимо и достаточно для устойчивости всех полиномов в
бесконечном множестве ψs,p. Этот результат удивителен, так как интуитивно
мы ожидаем, что нам необходимо проверить как минимум устойчивость всех
полиномов при экстремальных значениях коэффициентов, которое состоит из
2n+1 полиномов. Но это факт: достаточно всего лишь четырех, как показано
на рисунке 4.4. Давайте установим этот результат формально.

Теорема 4.5

Множество полиномов ψs,p обладает свойством что все входящие в него


полиномы устойчивы тогда и только тогда, когда четыре полинома
Харитонова устойчивы.

Доказательство

Для множества полиномов

φs,p=p0+p1s+…+pn-1sn-1+pnsn

75
Рис. 4.4. Полиномы Харитонова в пространстве состояний

где pi∈pi-,pi+, i=0,1,…,n-1,n определим минимальные и максимальные четные


части как

φminчs=p0-+p2+s2+p4-s4+p6+s6+…

φmaxчs=p0++p2-s2+p4+s4+p6-s6+…

И минимальная и максимальная нечетные части без s

φminнs=p1-+p3+s2+p5-s4+p7+s6+…

φmштчs=p1++p3-s2+p5+s4+p7-s6+…

Каждый полином φчs+sφн(s)∈ψs,p ограничен минимальными и


максимальными частями. Для всех w∈[0,∞)

φminч(jw)≤φ(jw)ч≤φmaxч(jw)

φminн(jw)≤φ(jw)н≤φmaxн(jw)

С другой стороны, по определению полиномов Харитонова, ясно что

K1s=φminчs+sφminн(s)

K2s=φminчs+sφmaxн(s)

K3s=φmaxчs+sφminнs

K4s=φmaxчs+sφmaxн(s)

Согласно этим определениям мы можем доказать Теоремы 4.5.

Необходимость

Необходимость тривиальна, так как все полиномы Харитонова принадлежат


ψs,p (полиномы Харитонова входят в интервальное семейство).

76
Достаточность

Давайте предположим, что четыре полинома Харитонова устойчивы. Мы


хотим показать, что любой полином φчs+sφн(s)∈ψs,p устойчив.

Так как φminн(jw)≤φ(jw)н≤φmaxн(jw) для всех w∈[0,∞), то по Теореме 4.3


устойчивость K1s=φminчs+sφminн(s) и K2s=φminчs+sφmaxн(s) обозначает, что
φminчs+sφн(s) устойчиво. Аналогично, из K3s=φmaxчs+sφminнs и
K4s=φmaxчs+sφmaxнs следует, что φmaxчs+sφн(s) устойчив.

Мы также имеем, что φminч(jw)≤φ(jw)ч≤φmaxч(jw) для всех w∈[0,∞). Таким


образом, по Теореме 4.4. условия что φminчs+sφнs и φmaxчs+sφн(s)
обозначают, что φчs+sφн(s) устойчив.

Пример 4.4

Рассмотрим множество полиномов Ψs,p={φs,p:p∈P}

φs,p=p0+p1s+p2s2+p3s3+p4s4+p5s5+p6s6

Где p0∈1,3,p1∈9,13,p2∈2,4,p3∈11,14,p4∈10,12,p5∈7,10 и p6∈1,1. Для


определения интервальной устойчивости множества полиномов, составим
четыре полинома Харитонова

K1s=1+9s+4s2+14s3+10s4+7s5+s6

K2s=1+13s+4s2+11s3+10s4+10s5+s6

K4s=3+9s+2s2+14s3+12s4+7s5+s6

K4s=3+13s+2s2+11s3+12s4+10s5+s6

Мы можем проверить, что все четыре полинома не являются устойчивыми.


Таким образом, множество полиномов не является интервально устойчивым.

Пример 4.5

Рассмотрим множество полиномов 4ой степени

φs,p=p0+p1s+p2s2+p3s3+p4s4

где p0∈93,98,p1∈760,761,p2∈727,733,p3∈975,980 и p4∈501,508. Для


определения интервальной устойчивости множества полиномов, составим
четыре полинома Харитонова

K1s=93+760s+733s2+980s3+501s4

K2s=93+761s+733s2+975s3+501s4

K3s=98+760s+727s2+980s3+508s4

K4s=98+761s+727s2+975s3+508s4

Мы можем проверить, что все эти четыре полинома являются устойчивыми,


поэтому множество полиномов является интервально устойчивым.

4.4. Синтез управления на основе теоремы Харитонова

77
В этом пункте мы обсудим синтез регулятора для интервальной системы на
основе теоремы Харитонова. Как было показано в предыдущем пункте,
теорема Харитонова позволяет провести анализ интервальной устойчивости.
Тем не менее, это также удобный инструмент для синтеза регулятора.
Давайте рассмотрим этот подход:

Предположим, что управляемая система представлена через передаточную


функцию:

Gs,p=b0+b1s+…+bn-1sn-1p0+p1s+…+pn-1sn-1+sn

Мы можем представить данную систему в канонической форме (в


пространстве состояний):

 0 1 ... 0  0
 ... ... ... ...   
x =   x + ...u
 0 0 ... 1  0
   
− p0 − p1 ... − p n −1  1
y = [ b0 b1 ... bn −1 ] x

Характеристический полином не замкнутой системы представляется в виде:

φs,p=p0+p1s+…+pn-1sn-1+sn

С pi∈pi-,pi+, i=0,1,…,n-1. Если не замкнутая система не устойчива, то мы хотим


организовать обратную связь

u=-Lx=-l0l1…ln-1x

такую что замкнутая система будет устойчива на интервале для всех p∈P.
Понятно, что характеристический полином замкнутой системы
представляется в виде:

φs,p+l=(p0+l0)+(p1+l1)s+…+(pn-1+ln-1)sn-1+sn

Возникаем вопрос: является ли устойчивым множество полиномов φs,p+l для


всех p∈P. Для проверки этого, мы должны вычислить четыре полинома
Харитонова:

K1s=l0+p0-+l1+p1-s+l2+p2+s2+l3+p3+s3+l4+p4-s4+…

K2s=l0+p0-+l1+p1+s+l2+p2+s2+l3+p3-s3+l4+p4-s4+…

K1s=l0+++l1+p1-s+l2+p2-s2+l3+p3+s3+l4+p4+s4+…

K1s=l0+p0++l1+p1+s+l2+p2-s2+l3+p3-s3+l4+p4+s4+…

Мы можем рассчитать такое L=l0l1…ln-1, что приведенные выше полиномы


Харитонова будут устойчивы, соответственно согласно теореме Харитонова,
замкнутая система будет также устойчива.

Такая обратная связь всегда существует. Единственно, что нам придется


брать очень большие значения для L, такое что по сравнению с ним

78
параметры p малы и неопределенность p слабо влияет на устойчивость.
Большие значения L физически трудно реализуемы, так как требуют больших
затрат энергии и нежелательны в некоторых практических ситуациях. В
любом случае не существует простого и систематизированного способа для
нахождения L, только большие значения компонент регулятора будут
формировать устойчивость системы. Должны быть использованы специальные
методы, что мы попробуем показать на примерах.

Пример 4.6

Рассмотрим незамкнутую систему с передаточной функцией

Gs,p=5p0+p1s+p2s2+p3s3+p4s4+p5s5+s6

где p0∈1,3,p1∈9,13,p2∈2,4,p3∈11,14,p4∈10,12 и p5∈7,10. Мы можем


переписать эту систему в канонической форме (Фробениусова форма)

 0 1 0 0 0 0  0 
 0 0 1 0 0 0  0 
   
 0 0 0 1 0 0  0 
x =   x +  u
 0 0 0 0 1 0  0 
 0 0 0 0 0 1  0 
   
− p 0 − p1 − p 2 − p3 − p4 − p5  1
y = [ 5 0 0 0 0 0 x]

Как показано в примере 4.4. открытая система не является устойчивой. Для


того чтобы найти регулятор L, положим, что мы хотим разместить наши
полюса (корни характеристического полинома замкнутой системы) недалеко
от -100. Другими словами хотим чтобы передаточная функция замкнутой
системы была примерно следующей:

(s+100)6=1012+6∙1010s+15∙108s2+2∙107s3+15∙104s4+6∙102s5+s6

Таким образом, регулятор будет иметь вид:

L=10126∙101015∙1082∙10715∙1046∙102

Используя обратную связь u=-Lx, характеристический полином замкнутой


системы будем иметь вид:

(1012+p0)+6∙1010+p1s+(15∙108+p2)s2+(2∙107+p3)s3+(15∙104+p4)s4+(6∙102+p
5)s5+s6=0

Используя теоремы Харитонова, мы можем проверить, является ли данная


замкнутая система интервально устойчивой.

4.5. Выводы

Теорема Харитонова представляет собой важный и красивый результат в


теории интервальных систем. Она позволяет удивительно просто ответить на

79
сложный вопрос. Происхождение данной теоремы основано на некоторых
элементарных свойствах полиномов. Подход Харитонова наиболее употребим
для анализа проблем, где мы для заданных систем пытаемся определить
интервальную устойчивость. Этот подход менее полезен для синтеза
регуляторов. Для разработки регуляторов гораздо более применимы методы
описанные до этого.

80
5. РЕГУЛЯТОРЫ H2 иH∞

В этой главе мы обсудим еще один подход к задачам интервального


управления, это так называемый H2/H∞ подход. Этот подход использует
нормы H2/H∞. Вначале мы представим некоторые предварительные условия
относительно функциональных пространств и норм в них. Затем мы покажем
соответствующие способы вычисления норм H2 и H∞. Цель H2/H∞ подхода это
минимизировать H2/H∞ норму передаточной функции. Мы покажем, как это
может быть достигнуто с помощью синтеза соответствующего регулятора.

5.1. Введение

Вспомним задачи, обсуждаемые в главе 5. Система с неопределенностью


представляется в виде:

x=Ap0x+Bu+Bϕpx

Где p∈P является неопределенным вектором параметров и p0∈P -


номинальное значение вектора p. Неопределенность описывается с помощью
ϕp. Для решения задачи интервального управления мы переведем эту задачу
в задачу линейно-квадратичного регулирования: для номинальной системы

x=Ap0x+Bu

Найти обратную связь вида u=Kx, которая минимизирует функционал

0∞xTFx+xTx+uTudt

Где F верхняя граница неопределенности ϕ(p)Tϕ(p), т.е. ϕ(p)Tϕ(p)≤F.

Давайте переформулируем задачу оптимального управления в эквивалентную


задачу. Для линейной системы

x=Ap0x+w+Bu

z=F+I120x+0Iu

y=x

Найти обратную связь вида u=Ky, которая минимизирует

0∞g(t)2dt

Где g(t) импульсная функция управляемой системы от входа w к выходу z.

Мы покажем, что

0∞g(t)2dt

Является нормой H2 передаточной функции от w к z. Другими словами задача


линейно-квадратичного регулирования может быть рассмотрена как задача
по минимизации норму в H2.
81
5.2. Функциональные пространства

Эту секцию мы начнем с повторения определения скалярного произведения.


Скалярное произведение двух векторов

x=x1…x2 и y=y1…y2

в евклидовом пространстве Cn задается следующим образом

x,y=xTy=i=1nxiyi

где в качестве x обозначается сопряженный вектор. Идея скалярного


произведения может быть расширена в бесконечном векторном пространстве
V следующим образом. Скалярное произведение в пространстве это
комплексная функция

.,.:V×V→C

удовлетворяющая следующим условиям для всех x,y,z∈V и α,β∈C

1. x,αy+βz=αx,y+βx,z
2. x,y=y,x
3. x,x>0, если x≠0

Заметим, что x,x - действительное число из-за условия симметричности (2):


x,x=x,x. Два вектора x,y в пространстве, котором определено скалярное
произведение, являются ортогональными и обозначаются:

x⊥y, если x,y=0

Векторное пространство V с определенной в ней нормой называется


нормированным пространством. Скалярное произведение определяет
следующий вид нормы:

x=x,x

Нормированное пространство обладает следующими свойствами:

1. x,y≤x+y (неравенство Коши Буняковского или Коши-Шварца в ин.


литературе).
2. x+y2+x-y2=2x2+2y2 по правилу параллелограмма.
3. x+y2=x2+y2 если x⊥y

Банахово пространство – это полное нормированное векторное пространство.


Гильебтово пространство это полное пространство с нормой, введенной через
скалярное произведение. Хотя Гильбертово пространство является
Банаховым, обратное вообще говоря не верно.

С указанными выше определениями рассмотрим вопрос комплексных функций


от времени t.

Рассмотрим множество всех комплекснозначных функций над интервалом a,b,


f:a,b→C, таких, что у них есть конечный интеграл Лебега, т.е. p-норма
определена следующим образом.

82
fp=abf(t)pdt1p<∞

Очевидно, что это пространство является бесконечным банаховым


пространством и обозначается с помощью Lpa,b. В частности, L∞a,b это
множество функций, ограниченных на a,b, чья норма определяется
следующим образом:

f∞=limp→∞fp=infB≥0:f(t)≤B ∀t∈a,b

Точно так же мы можем определить скалярное произведение для L2a,b

f,g=abftgtdt

Из определения интеграла очевидно выполнение трех свойств скалярного


произведения (линейность, симметричность и неотрицательность).

Таким образом, L2a,b является Гильбертовым пространством бесконечной


размерности. Мы будем часто интересоваться Гильбертовым пространством
вида: L2[0,∞), которое состоит из множества ограниченных функций
переменной t. Норма L2[0,∞) задается следующим образом:

f2=0∞ftftdt

Теперь рассмотрим комплекснозначные функции, зависящие от частоты s∈C.


Предположим, что D⊆C открытое множество и s0∈D точка в этом множестве.
Положим, что F:D→C компелкснозначания функция, определенная на D.
Говорят, что F аналитическая в точке s0, если она дифференцируема в этой
точке и в ее окрестности. Говорят, что F аналитическая на множестве D, если
она аналитическая в каждой точке этого множества. Аналитические функции
обладают следующими свойствами.

1. Если F аналитическая в s0, то она имеет производную любого порядка в


этой точке и она непрерывна в точке s0.
2. Если F аналитическая в точке s0, то она раскладывается в степенной
ряд в этой точке.
3. Если F представима в виде аналитического ряда в точке s0, то она
аналитическая в этой точке.

К примеру, любая устойчивая передаточная функция является аналитической


в правой полуплоскости комплексной плоскости.

Мы используем L∞(jR) чтобы обозначить банаховое пространство всех


комплекснозначных функций F:C→C, которые ограничены на мнимой оси jR
нормой:

F∞=supw∈RF(jw) 5.1
Мы будем обозначать через H∞ подпространство L∞(jR), где функции F
являются аналитическими и ограниченными в правой полуплоскости. Для
функций в H∞ можно показать, что

supRe(s)≥0F(s)=supw∈RF(jw)=F∞ 5.2
Мы используем L2(jR) чтобы обозначить банаховое пространство всех
комплекснозначных функций F:C→C, таких, что соответствующий интеграл
является ограниченным:
83
-∞∞FjwFjwdw<∞ 5.3
Скалярное произведение в L2(jR) определяется следующий образом. Для
F,G∈L2(jR)

F,G=12π-∞∞FjwGjwdw<∞ 5.4
Очевидно, что три свойства скалярного произведения выполняются.

Мы будем обозначать через H2 подпространство L2(jR), где функции


Fявляются аналитическими и ограниченными в правой полуплоскости. Для
функций F∈H2 норма F2 может быть записана как:

F22=12π-∞∞FjwFjwdw=supσ>012π-∞∞Fσ+jwFσ+jwdw 5.5
Предположим, что F это изображение Лапласа функции f Lft=F(s). Тогда
получается следующая связь между пространствами во временной частотной
областями: f(t)∈L2[0,∞)↔F(s)∈H2.

По определению функциональных пространств, мы полагаем что функции


являются скалярными. Мы можем расширить эти определения до матричных
функций следующим образом.

Для L∞(jR) мы заменим уравнение 5.1. следующим

F∞=supw∈Rσ(F(jw))

Где σFjw=maxλF(jw)TF(jw) наибольшее сингулярное число F(jw) (в данном


случае λ(.) обозначает собственное число).

Для H∞ мы заменяем уравнение 5.3. следующим

-∞∞traceFjwTFjwdw<∞

И уравнение 5.4. следующим

F,G=12π-∞∞traceFjwTGjwdw

Для H2 мы заменим уравнение 5.5. следующим

F22=12π-∞∞traceFjwTFjwdw=supσ>012π-∞∞traceFσ+jwTFσ+jwdw

5.3. Вычисление норм H2 И H∞

Вначале рассмотрим вопрос о расчете нормы H2. По определению для


функции G∈H2 его норма задается:

G2=12π-∞∞traceGjwTGjwdw 5.6
Пусть G(s) будет изображение по Лапласу от функции g(t), т.е. Lft=G(s). Тогда
норма H2 может быть переписана следующим образом:

G2=g2=-∞∞tracegtTgtdt 5.7
Так как
84
traceGjwTGjw=traceGjwGjwT

tracegtTgt=tracegtgtT

Уравнения 5.6. и 5.7. могут быть переписаны следующим образом:

G2=12π-∞∞traceGjwGjwTdw=-∞∞tracegtgtTdt

В задачах управления, которые нас интересуют, G(s) это определенная


рациональная передаточная функция. Мы полагаем, что уравнения

x=Ax+Bu

y=Cx+Du

Могут быть переписаны в виде передаточной «матрице» G(s) если Gs=CSI-A-


1B+D. Иногда мы обозначаем G(s) следующим образом

Gs=ABCD

Для расчета G2 мы примем D=0. Заметим, что обратное преобразование


Лапласа g(t) изображения G(s), которое также является реакцией на
импульсную функцию, задается

gt=L-1Gs=L-1CsI-A-1B=CeAtB t≥00t<0

Тогда

G2=-∞∞tracegtTgtdt=0∞traceCeAtBTCeAtBdt=traceBT0∞eATtCTCeAtdtB

Определим интеграл

S=0∞eATtCTCeAtdt

в качестве Граммиана наблюдаемости (A,C). Тогда

G2=traceBTSB

Для расчета S, продолжим его рассмотрение. Определим

S(θ)=0θeATtCTCeAtdt

Действительно, S=limθ→∞S(θ). С другой стороны, положим t=θ-τ, мы имеем

Sθ=0θeATtCTCeAtdt=θ0eATθ-τCTCeAθ-τ-dτ=0θeATθ-τCTCeAθ-τdτ

Таким образом

dS(θ)dθ=ddθ0θeATθ-τCTCeAθ-τdτ=eATθ-τCTCeAθ-ττ=0+0θATeATθ-τCTCeAθ-
τdτ+0θeATθ-τCTCeAθ-τdτ=CTC+ATSθ+SθA

Так как θ→∞

dS(θ)dθ→dSdθ=0

Отсюда, S удовлетворяет уравнению

SA+ATS+CTC=0 5.8

85
Сравнивая уравнение 5.8 с алгебраическим уравнением Риккати

SA+ATS+Q-SBR-1BTS=0

Мы приходим к выводу, что мы можем решить уравнение 5.8 с помощью


алгебраического уравнения Риккати с матрицами A,B=0,Q=CTC,R=I.

Аналогично, мы можем рассчитать

G2=-∞∞tracegtgtTdt=0∞traceCeAtBCeAtBTdt=traceC0∞eATtBBTeAtdtCT

Определим

U=0∞eATtBBTeAtdt

Который называется Граммианом управляемости (A,B). U может быть


рассчитана через решение уравнения

AU+UAT+BBT=0

После расчета U, норма H2 матрицы G может быть получена:

G2=traceCUCT

Пример 5.1.

Рассмотрим следующую систему

x=010001-2-5-1x+001u

y=x

Передаточная функция системы будет равна

Gs=1s3+s2+5s+2ss3+s2+5s+2s2s3+s2+5s+2

Для расчета нормы G2 вначале мы решим уравнение

SA+ATS+CTC=0

Решение есть

S=2.41672.41670.25002.41675.75000.58330.25000.58331.0833

Следовательно

G2=traceBTSB=1.0408

Теперь мы обсудим вопрос расчета нормы H∞. К сожалению, это более


сложная задача чем расчет H2 нормы. Тем не менее, она относительно проста
для проверки, для любого γ>0, будет ли выполнятся неравенство G∞<γ или
нет. Этот результат показан в следующей теореме.

Теорема 5.1

Положим что Gs=C(sI-A)-1B+D. Соответственно, G∞<γ для γ>0 тогда и только


тогда, когда σD<γ и следующая матрица не имеет собственных чисел на
мнимой оси:

A+BV-1DTCBV-1BT-CT(I+DV-1DT)C-(A+BV-1DTC)T
86
Где V=γ2I-DTD

Доказательство:

Определим

Us=γ2I-G-sTG(s)

Тогда

G∞<γ ⇔supw∈RσGjw<γ

⇔∀w∈RσGjw<γ

⇔∀w∈RmaxλG(jw)TG(jw)<γ

⇔∀w∈RmaxλG(jw)TG(jw)<γ2

⇔∀w∈RmaxλG(-jw)TG(jw)<γ2

⇔∀w∈Rγ2I-G-jwTGjw>0

⇔∀w∈RUiw>0

⇔Uj∞>0 ⋀ ∀w∈RU(iw) неособенная

⇔γ2I-DTD>0 ⋀ U(s) не содержит нулей на мнимой оси

⇔σD<γ ⋀U(s)-1 не содержит полюсов на мнимой оси

Можно показать, что U(s)-1 представляется следующим образом:

x=A+BV-1DTCBV-1BT-CT(I+DV-1DT)C-(A+BV-1DTC)Tx+BV-1-CTDV-1u

y=V-1DTCV-1BTx+V-1u

Таким образом, U(s)-1 не содержит полюсов на мнимой оси тогда и только


тогда, когда следующая матрица не имеет собственных чисел на мнимой оси:

A+BV-1DTCBV-1BT-CTI+DV-1DTC-A+BV-1DTCT

Пример 5.2.

Этот пример показывает, что

x=A+BV-1DTCBV-1BT-CT(I+DV-1DT)C-(A+BV-1DTC)Tx+BV-1-CTDV-1u

y=V-1DTCV-1BTx+V-1u

Является реализацией (представлением) U(s)-1. Пусть

A=-1000-2000-3 B=123

C=-1-2-3 D=1

Тогда

Gs=s3-8s2-37s-30s3+6s2+11s+6

Пусть γ=10. Следовательно

87
Us=γ2I-G-sTGs=102--s3-8s2+37s-30-s3+6s2-11s+6s3-8s2-37s-
30s3+6s2+11s+6=100-s3+8s2-37s+30s3-6s2+11s-6s3-8s2-37s-
30s3+6s2+11s+6=100-s6-138s4+889s2-900s6-14s4+49s2-36=99s6-
1262s4+4011s2-2700s6-14s4+49s2-36

С другой стороны

V=γ2I-DTD=100-1=99

A+BV-1DTC=-1.0101-0.0202-0.0303-0.0202-2.0404-0.0606-0.0303-0.0606-3.0909

BV-1BT=0.01010.02020.03030.02020.04040.06060.03030.06060.0909

-CTI+DV-1DTC=-1.0101-0.0202-0.0303-2.0202-4.0404-6.0606-3.0303-6.0606-
9.0909

-(A+BV-1DTC)T=1.01010.02020.03030.02022.04040.06060.03030.06063.0909

BV-1=0.01010.02020.0303

-CTDV-1=0.01010.02020.0303

V-1DTC=-0.0101-0.0202-0.0303

V-1BT=0.01010.02020.0303

Используя MATLAB, мы можем рассчитать значение передаточной функции

x=A+BV-1DTCBV-1BT-CT(I+DV-1DT)C-(A+BV-1DTC)Tx+BV-1-CTDV-1u

y=V-1DTCV-1BTx+V-1u

Она равна

Λs=0.0101s6-0.1414s4+0.4949s2-0.3636s6-12.7475s4+40.5152s2-27.2727

Действительно получаем, что

Λs=U(s)-1

Так как проверка условия G∞<γ гораздо проще непосредственного расчета


нормы G∞, мы можем использовать следующий алгоритм деления пополам
для расчета нормы в H∞ для действительных значений передаточной функции
G(s).

Алгоритм 5.1

Вход: соответствующая действительная рациональная передаточная функция


G(s) и толерантность δ;

Выход: норма G∞ с ошибкой меньше чем δ;

Шаг 1. Определяем реализацию G(s):

Gs=ABCD

Шаг 2. Выбираем верхнюю границу γ и нижнюю границу γ, такие что γ<G∞<γ


(к примеру, м можем выбрать γ нулевым, а γ достаточно большим).

88
Шаг 3. Если (γ- γ)γ<2δ,

То полагаем, что G∞=(γ- γ)/2 и останов

Иначе полагаем γ=(γ- γ)/2 и переходим на шаг 4

Шаг 4. Находим все собственные числа матрицы

A+BV-1DTCBV-1BT-CT(I+DV-1DT)C-(A+BV-1DTC)T

Шаг 5. Если существуют собственные числа на мнимой оси

То γ=γ

Иначе γ=γ

Шаг 6. Переходим к шагу 3.

Пример 5.3.

Рассчитаем норму H∞ для

Gs=s3-8s2-37s-30s3+6s2+11s+6

Из примера 5.2. мы знаем, что G(s) представляется в виде:

A=-1000-2000-3 B=123

C=-1-2-3 D=1

Пусть γ=10 и γ=1. Тогда γ=γ-γ2=5.5, V=γ2I-DTD=29.25 и собственные числа


матрицы

Λ=A+BV-1DTCBV-1BT-CT(I+DV-1DT)C-(A+BV-1DTC)T

Равны

λΛ=-2.6443,-1.5428,-0.6231,2.6443,0.6231,1.5428

Ни одно из собственных чисел не находится на мнимой оси, поэтому новая


верхняя граница будет равна γ=γ=5.5.

На следующем шаге γ=γ-γ2=3.25. Мы находим следующие собственные числа

λΛ=j2.5258,-j2.5268,-2.4491,-1.1914,2.4491,1.1914

Так как два собственных числа лежат на мнимой оси, то новая нижняя
граница будет равна γ=γ=3.25. Этот процесс будет продолжаться до тех пор,
пока мы не найдем G∞ с нужной нам точностью.

Мы также можем использовать MATLAB для расчета норм H2 и H∞ используя


команды pss2sys, h2norm, hinfnorm как это показано в следующем примере.

Пример 5.4.

Пусть G(s) является передаточной функцией системы

x=010001-2-5-1x+001u

y=x
89
Т.е. она равна

Gs=1s3+s2+5s+2ss3+s2+5s+2s2s3+s2+5s+2

Используя команду h2norm, мы находим, что G2=1.041. Используя hinfnorm с


точностью 1%, мы находим, что G∞ находится между 1.8984 и 1.9174.

5.4. Задача интервального управления как задача H2 И H∞


управления

Для постановки и решения задача интервального синтеза в качестве задачи


H2 и H∞ управления, вначале давайте рассмотрим теорему о малых
возмущениях.

Пусть есть система с неопределенностью. Предположим, что мы можем


отделить неопределенность от номинальной системы и представить ее через
обратную связь так, как это показано на рисунке 5.1.

Рис. 5.1. Неопределенность и теорема о малых возмущениях

На рис. 5.1. G(s) является передаточной функцией номинальной системы, а


∆(s) неопределенностью. v и z входом и выходом возмущенной системы. w это
вход номинальной системы. Предположение о том, что неопределенность
может быть отделена от номинальной системы так, как это показано на
рисунке 5.1. не является ограничивающим, что показано в следующем
примере.

Пример 5.5.

Рассмотрим систему со следующей передаточной функцией общего вида:

Gs,p=b0+b1s+…+bn-1sn-1p0+p1s+…+pn-1sn-1+sn

Где неопределенность описывается с помощью параметров pi∈pi-,pi+,


i=0,1,…,n-1. Мы можем перевести эту систему из входо-выходной реализации
в пространство состояний.

90
 0 1 ... 0  0
 ... ... ... 
...  ...
x =  x +  v
 0 0 ... 1  0
   
− p 0 − p1 ... − p n −1  1
z = [ b0 b1 ... bn −1 ] x

Обозначим через pi0=pi-+pi+2 и pi=pi0+∆pi с ∆pi∈-pi+-pi-2,pi+-pi-2, i=0,1,…,n-


1. Следовательно, мы можем переписать уравнение как:

 0 1 ... 0  0
 ... ... ... ...   
x =   x + ... v
 0 0 ... 1  0
   
− p 0 − ∆p 0 − p1 − ∆p1 ... − p n −1 − ∆p n −1 
0 0 0
1 
 0 1 ... 0  0  0 1 ... 0 
 ... ... ... ...    
...  ... ... ... ... 
= x+  v+ x
 0 0 ... 1  0  0 0 ... 1 
     
− p 0 − p1 − p n0−1   1  − ∆p 0 − ∆p1 ... − ∆p n −1 
0 0
...

Положим, что

 0 1 ... 0  0
 ... ...
... ... ... 
A= B= 
 0 0 ... 1  0
 0   
− p0 − p10 ... − p n0−1  1

∆ = [ − ∆p 0 − ∆p1 ... − ∆p n −1 ]

Определим e=∆∙x. Тогда мы получим следующее уравнение

x=Ax+Bu+B∆∙x=Ax+Bu+Be=Ax+B(u+e)

z=x

Другими словами, мы можем перевести данную систему в ту, которая


показана на рисунке 5.2.

91
Рис. 5.2. Разделение неопределенности системы

Итак, давайте рассмотрим систему на рис. 5.1. Проблема, которую мы хотим


исследовать – следующая. Предположим, что номинальная система G(s)
является устойчивой. Насколько большой может быть неопределенность ∆(s)
прежде чем возмущенная система станет неустойчивой? Другими словами,
какова граница неопределенности, гарантирующая устойчивость данной
системы? На этот вопрос можно получить частичный ответ с помощью
следующей теоремы.

Теорема 5.2.

Рассмотрим систему на рисунке 5.1. Пусть что G(s) рациональная


действительная передаточная функция. Предположим, что G∞<γ для
некоторого γ>0. Тогда замкнутая система будет устойчива для всех
действительных рациональных устойчивых передаточных функций ∆(s), таких
что ∆∞<1γ.

Доказательство:

Легко проверить, что на рисунке 5.1. передаточная функция от v к z будет


равна

Ms=I-Gs∆s-1G(s)

Для того, чтобы возмущенная система была устойчива, все полюса Ms должны
принадлежать левой открытой полуплоскости. Так как все полюса G(s)
находятся в левой открытой полуплоскости, то для устойчивости требуется,
чтобы все полюса I-Gs∆s-1 находились в левой полуплоскости. Это означает,
что все нули I-Gs∆s должны принадлежать этой полуплоскости. Другими
словами

infRes≥0σ(I-G(s)∆(s))≠0

Отсюда, для доказательства теоремы, нам нужно только показать, что


указанное выше условие выполняется для всех действительных
рациональных передаточных функций ∆(s), таких что ∆∞<1γ. Доказывается
это следующим образом

G∞<γ и ∆∞<1γ

⇒G∆∞<1

⇒supRes≥0σGs∆s<1

⇒1-supRes≥0σGs∆s>0

⇒infRes≥0σI-Gs∆s>0

⇒infRes≥0σI-Gs∆s≠0

Давайте применим эту теорему о малых усилениях к следующему примеру.

Пример 5.6.

Рассмотрим следующую систему


92
x=010001-3+∆1-4+∆2-7+∆3x+001u

y=x

где ∆1,∆2,∆3 являются неопределенностями. Система может быть разложена


на номинальную систему (A,B) и неопределенность ∆, как это показано на
рисунке 5.2. Номинальная система является устойчивой. Пусть G(s)
передаточная функция номинальной системы

x=010001-3-4-7x+001u

Тогда мы можем сосчитать норму H∞ (например с помощью Matlab) и


обнаружить, что G∞<0.5522. Так как норма H∞ для ∆s=∆1∆2∆3 будет равна
∆∞=∆12+∆22+∆32, то по Теореме 5.2. возмущенная система будет устойчива
для всех неопределенностей, таких что

∆∞=∆12+∆22+∆32≤10.5522=1.811

Или

∆12+∆22+∆32≤3.2796 5.9

Замети, что это условие является обязательным. Для того чтобы увидеть это,
запишем характеристический полином для возмущенной системы как

s3+7-∆3s2+4-∆2s+3-∆1=0

Согласно критерию Рауса-Гурвица, мы знаем, что возмущенная система


является устойчивой тогда и только тогда, когда

7-∆3>0 и 4-∆2>0 и 3-∆1>0 и 7-∆34-∆2>3-∆1 5.10

Условие 5.10 более слабое чем условие 5.9. К примеру, если


∆1=2.5∆2=3.5∆3=5 то условие 5.10 будет удовлетворяться, с другой стороны

∆12+∆22+∆32=43.5

Что значительно больше чем 3.2796.

До настоящего времени мы обсуждали задачи анализа; т.е. для заданной


системы с ограниченной неопределенностью мы пытались проверить
выполняются ли условия теоремы 5.2. Если условие выполняется, то
интервальная устойчивость гарантируется, иначе система может быть
неустойчивой. В следующей секции мы обратимся к задаче синтеза; т.е.
рассмотрим как создать регулятор который будет обеспечивать интервальную
устойчивость на самом большом интервале.

5.5. Синтез управления H2/H∞

Прежде чем мы продолжим обсуждение вопроса синтеза систем в


пространствах H2/H∞, укажем, что подход H2/H∞ очень близок к
оптимальному подходу, описанному в главе 5 и 6. В методе оптимального

93
управления мы начинали с границ неопределенности. Затем мы
разрабатывали регулятор, основанный на этих границах. Как результат, если
регулятор существует, то интервальная устойчивость возмущенной системы
гарантируется. С другой стороны, в методе H2/H∞границы неопределенности
заранее не заданы. При синтезе будет производиться попытка достичь
наибольшего значения толерантности (наибольшего значения границы)
неопределенности. Однако, не существует гарантии, что значения этого
интервала будет достаточно чтобы покрыть возможные неопределенности.
Другими словами, подход H2/H∞ не может гарантировать грубость
полученного регулятора. С помощью этого подхода вы получите регулятор с
максимальной грубостью. Но будет ли этой грубости достаточно зависит от
природы неопределенности.

Для формулировки подхода H2/H∞ рассмотрим фигуру 5.1., но предположим


что G(s) может быть изменен введением регулятора, как это показано на
рисунке 5.3. На рисунке 5.3. F(s) это объект (передаточная функция), K(s) это
разрабатываемый регулятор (также передаточная функция), u вход
регулятора и y выход (измерение) для управления.

Рис. 5.3. H2/H∞ подход: введение регулятора, минимизирующего норму H2/H∞

Сравнивая рисунки 5.1. и рисунок 5.3. мы можем заметить, что номинальная


система G(s) теперь является эквивалентной управляемой системе, состоящей
из объекта F(s) и регулятора K(s). Объект F(s) задается в то время, как
регулятор K(s) разрабатывается. Из предыдущих рассуждений мы знаем, что
для увеличения уровня толерантности неопределенности мы должны создать
подходящий регулятор, который минимизирует норму передаточной функции
от w к z.

Официально, давайте предположим, что объект F(s) имеет следующую


реализацию

x=Ax+B1w+B2u

z=C1x+D11w+D12u

y=C2x+D21w+D22u

Иногда мы будем обозначать следующую реализацию F(s) как

94
Fs=AB1B2C1D11D12C2D21D22=F11(s)F12(s)F21(s)F22(s)

Где F11s=C1(sI-A)-1B1+D11это передаточная функция от w к z; F12s=C1(sI-A)-


1B2+D12 - передаточная функция от u к z; F21s=C2(sI-A)-1B1+D21 –
передаточная функция от w к y и F22s=C2(sI-A)-1B2+D22 - передаточная
функция от u к y. Действительно, F(s) это действительная рациональная
передаточная функция. Передаточная функция G(s) управляемой системы с
контроллером F(s) может быть получена следующим образом.

Z(s)Y(s)=F11(s)F12(s)F21(s)F22(s)W(s)U(s)

позволяет получить

Zs=F11sWs+F12sUs

Ys=F21sWs+F22sU(s)

Так как Us=KsY(s) то мы получаем, что

Ys=F21sWs+F22sKsYs

⇒I-F22sKsYs=F21sWs

⇒Ys=I-F22sKs-1F21sWs

⇒Us=K(s)I-F22sKs-1F21sWs

Отсюда

Zs=F11sWs+F12sUs=F11sWs+F12sKsI-F22sKs-1F21sWs=F11s+F12sKsI-F22sKs-
1F21sW(s)

Таким образом, передаточная функция от w к z задается следующим образом:

Gs=F11s+F12sKsI-F22sKs-1F21s 5.11

Одно основное требование к K(s) это то что он должен стабилизировать


управляемую систему. Это требует того, чтобы (A,B2) управляема и (A,C2)
наблюдаема, т.е. существуют L1,L2 такие, что A+B2L1 и A+C2L2 устойчивы.
Предполагая, что это верно, мы можем определить все стабилизирующие
регуляторы K(s) как это показано в следующей теореме.

Теорема 5.3.

Пусть модель представляется в виде

Fs=AB1B2C1D11D12C2D21D22=F11(s)F12(s)F21(s)F22(s)

и L1,L2 такие, что A+B2L1 и A+C2L2 устойчивы. Тогда все регуляторы, которые
стабилизируют управляемую систему могут быть представлены следующим
образом:

Ks=M11s+M12sQsI-M22sQs-1M21(s)

Где Q(s) это передаточная функция, такая что Q(s)∈H∞ и Mij(s) определяется
следующим образом:

95
M11(s)M12(s)M21(s)M22(s)=A+B2L1+L2C2+L2D22L1-L2B2+L2D22L10I-
C2+D22L1I-D22

Доказательство:

Мы докажем данную теоремы только для определенного случая, когда все


матрицы A,B1,B2,C1,C2,D11,D12,D21,D22 являются скалярными, так как это
иллюстрирует идею и позволяет избежать больших преобразований с
матрицами. В случае скалярных матриц:

M11sM12sM21sM22s=L1-C2+D22L11s-A+B2L1+L2C2+L2D22L1-
L2B2+L2D22+011-D22=1s-A+B2L1+L2C2+L2D22L1-L1L2s-A-L2C2s-A-B2L1-C2B2-
D22(s-A)

Отсюда

I-M22sQs=1-—C2B2-D22s-As-A-B2L1-L2C2-L2D22L1Qs=s-A-B2L1-L2C2-
L2D22L1+C2B2+D22s-AQ(s)s-A-B2L1-L2C2-L2D22L1

Ks=M11s+M12sQsI-M22sQs-1M21s=—L1L2s-A-B2L1-L2C2-L2D22L1+s-A-L2C2s-A-
B2L1-L2C2-L2D22L1×QsI-M22sQs-1s-A-B2L1s-A-B2L1-L2C2-L2D22L1=—L1L2s-A-
B2L1-L2C2-L2D22L1+s-A-L2C2s-A-B2L1-L2C2-L2D22L1Qs×s-A-B2L1-L2C2-
L2D22L1s-A-B2L1-L2C2-L2D22L1+C2B2+D22s-AQs×s-A-B2L1s-A-B2L1-L2C2-
L2D22L1=—L1L2s-A-B2L1-L2C2-L2D22L1+s-A-L2C2Q(s)s-A-B2L1-L2C2-L2D22L1×s-
A-B2L1s-A-B2L1-L2C2-L2D22L1+C2B2+D22s-AQs=—L1L2+s-AQ(s)s-A-B2L1-L2C2-
L2D22L1+C2B2+D22s-AQs

Пусть

K1s=—L1L2+s-AQs

K2s=s-A-B2L1-L2C2-L2D22L1+C2B2+D22s-AQs

Тогда мы можем записать

Ks=K1(s)K2(s)

Из уравнения 5.11 система управления задается

Gs=F11s+F12sKsI-F22sKs-1F21s

Мы можем определить G(s) следующим образом:

F11(s)F12(s)F21(s)F22(s)=C1C21s-AB1B2+D11D12D21D22=1s-
AC1B1C1B2C2B1C2B2+D11D12D21D22=1s-AC1B1+D11(s-A)C1B2+D12(s-
A)C2B1+D21(s-A)C2B2+D22(s-A)

По этой причине

I-F22sKs=1-C2B2+D22s-As-AKs=s-A-(C2B2+D22s-A)K(s)s-A=s-AK2(s)-(C2B2+D22s-
A)K1(s)s-A

Тогда
96
s-AK2(s)-(C2B2+D22s-A)K1s=s-As-A-B2L1-L2C2-L2D22L1+C2B2+D22s-AQs-
(C2B2+D22s-A)—L1L2+s-AQs=s-As-A-B2L1-L2C2+C2B2L1L2=s-A-L2C2s-A-B2L1

Мы получаем

KsI-F22sKs-1=K1(s)K2(s)×s-AK2(s)s-A-L2C2(s-A-B2L1)=s-AK1(s)s-A-L2C2(s-A-B2L1)

Gs=F11s+F12sKsI-F22sKs-1F21s=C1B1+D11(s-A)s-A+C1B2+D12(s-A)s-A×s-
AK1(s)s-A-L2C2(s-A-B2L1)×C2B1+D21(s-A)s-A=C1B1+D11(s-A)s-A+C1B2+D12s-
AC2B1+D21s-AK1s(s-A)s-A-L2C2(s-A-B2L1)=C1B1+D11(s-A)s-A+C1B2+D12s-
AC2B1+D21s-A—L1L2+s-AQs(s-A)s-A-L2C2(s-A-B2L1)=C1B1+D11(s-A)s-A-
C1B2+D12s-AC2B1+D21s-AL1L2(s-A)s-A-L2C2(s-A-B2L1)+C1B2+D12s-
AC2B1+D21s-AQ(s)s-A-L2C2(s-A-B2L1)=C1B1s-A-L2C2s-A-B2L1-C1B2+D12s-
AC2B1+D21s-AL1L2(s-A)s-A-L2C2(s-A-B2L1)+D11+C1B2+D12s-AC2B1+D21s-As-A-
L2C2s-A-B2L1Qs=C1B1-D12D21L1L2s-A-C1B1L2C2+B2L1-
D12C2B1+D21C1B2L1L2s-A-L2C2(s-A-B2L1)+D11+C1B2+D12s-AC2B1+D21s-As-A-
L2C2s-A-B2L1Qs

Так как A+B2L1 и A+L2C2 устойчивы, то наблюдая за собственными числами


Gs, становится ясно, что G(s) устойчивая тогда и только тогда, когда Q(s) это
рациональная передаточная функция, которая принадлежит пространству
Q(s)∈H∞.

Рассмотрим следующий пример.

Пример 5.7.

Пусть задана система

Fs=AB1B2C1D11D12C2D21D22

С матрицами

A=-52-40-3007-1 B1=7-31 B2=68-5 C1=-294 C2=63-1

D11=0,D12=1,D21=2,D22=0

Элементы передаточной функции F(s) могут быть найдены, они равны

F11s=-37s2-2509s-669s3+9s2+23s+15

F12s=s3+49s2+339s+1455s3+9s2+23s+15

F21s=2s3+50s2+113s+597s3+9s2+23s+15

F22s=65s2+448s-865s3+9s2+23s+15

Так как матрица A устойчива, мы можем принять L1=0 и L2=0. По этой


причине, матрица

M11sM12sM21sM22s=A0B2001-C210

Может быть рассчитана следующим образом

M11s=0

97
M12s=1

M21s=1

M22s=-65s2-488s+865s3+9s2+23s+15

Ks=M11s+M12sQsI-M22sQs-1M21s=0+QsI-M22sQs-1=Qs1--65s2-
488s+865s3+9s2+23s+15Q(s)-1=Qss3+9s2+23s+15--65s2-
488s+865Q(s)s3+9s2+23s+15-
1=(s3+9s2+23s+15)Q(s)s3+9s2+23s+15+65s2+488s-865Q(s)

Для нахождения полного выражения для системы, вначале определим

I-K22sKs=1-65s2+488s-
865s3+9s2+23s+15×(s3+9s2+23s+15)Q(s)s3+9s2+23s+15+65s2+488s-
865Q(s)=1-(65s2+488s-865)Q(s)s3+9s2+23s+15+65s2+488s-
865Q(s)=s3+9s2+23s+15s3+9s2+23s+15+65s2+488s-865Q(s)

KsI-F22sKs-1=s3+9s2+23s+15Qss3+9s2+23s+15+65s2+488s-
865Qs×s3+9s2+23s+15+65s2+488s-865Qss3+9s2+23s+15=Qs

Следовательно, полная система будет представляться в виде:

Gs=F11s+F12sKsI-F22sKs-1F21s=-37s2-2509s-
669s3+9s2+23s+15+s3+49s2+339s+1455s3+9s2+23s+15×Qs2s3+50s2+113s+
597s3+9s2+23s+15

Приведенный выше пример показывает, что передаточная функция системы


управления может быть записана в определенной форме. В общем,
использование контроллера

Ks=M11s+M12sQsI-M22sQs-1M21s

Передаточная функция системы управления может быть получена следующим


образом.

Теорема 5.4.

Пусть задан регулятор вида:

Ks=M11s+M12sQsI-M22sQs-1M21s

Система управления представляется следующей передаточной функцией

Gs=Ψ11s+Ψ12sQsΨ21(s)

Где Ψij(s) задается следующим образом

 A + B2 L1 − B2 L1 B1 B2 
 
 Ψ11 ( s ) Ψ12 ( s)   0 A + L2 C 2 B1 + L2 D21 0 
Ψ ( s ) Ψ ( s) =  C + D L − D12 L1 D11 D12 
 21 22   1 12 1

 0 C2 D12 0 

98
Доказательство

Мы докажем данную теорему только для определенного случая, когда все


матрицы A,B1,B2,C1,C2,D11,D12,D21,D22 являются скалярными. В теореме 5.3.
мы получили, что

Gs==C1B1-D12D21L1L2s-A-C1B1L2C2+B2L1-D12C2B1+D21C1B2L1L2s- 5.12
A-L2C2(s-A-B2L1)+D11+C1B2+D12s-AC2B1+D21s-As-A-L2C2s-A-B2L1Qs
С другой стороны

Ψ11(s)Ψ12(s)Ψ21(s)Ψ22(s)=C1+D12L1-D12L10C2s-A-B2L1B2L10s-A-L2C2-
1×B1B2B1+L2D210+D11D12D210=C1+D12L1-D12L10C2s-A-L2C2-B2L10s-A-
B2L1×1s-A-L2C2s-A-B2L1B1B2B1+L2D210+D11D12D210=C1+D12L1s-A-L2C2-
C1+D12L1B2L1-D12L1s-A-B2L10C2s-A-B2L1B1B2B1+L2D210×1s-A-L2C2s-A-
B2L1+D11D12D210=C1+D12L1s-A-L2C2B1-C1B2L1+D12L1s-
AB1+L2D21C1+D12L1s-A-L2C2B2C2s-A-B2L1B1+L2D210×1s-A-L2C2s-A-
B2L1+D11D12D210

Следовательно

Ψ11s=C1+D12L1s-A-L2C2B1-C1B2L1+D12L1s-AB1+L2D21s-A-L2C2s-A-
B2L1+D11=s-AC1B1-D12L1L2D12-C1+D12L1L2C2B1-C1B2L1B1+L2D12s-A-L2C2s-
A-B2L1+D11=C1B1-D12D21L1L2s-A-C1B1L2C2+B2L1-D12C2B1+D12C1B2L1L2s-A-
L2C2s-A-B2L1+D11

Также

Ψ12sΨ21s=C1+D12L1(s-A-L2C2)B2s-A-L2C2s-A-B2L1+D12C2s-A-B2L1B1+L2D21s-
A-L2C2s-A-B2L1+D21=C1+D12L1B2s-A-B2L1+D12C2B1+L2D21s-A-
L2C2+D21=C1+D12L1B2+D12s-A-B2L1s-A-B2L1×C2B1+L2D21+D21s-A-B2L1s-A-
B2L1=C1B2+D12(s-A)C2B1+D21(s-A)s-A-B2L1s-A-B2L1

Сравнивая эти выражения с уравнением 5.12. получаем, что

Gs=Ψ11s+Ψ12sQsΨ21(s)

Теорема доказана

На основании теорем 5.3. и 5.4. теперь мы можем представить подход H2/H∞.


Вначале рассмотрим H2 подход. Для нашего объекта мы сделаем следующие
допущения

Fs=AB1B2C1D11D12C2D21D22=F11(s)F12(s)F21(s)F22(s) 5.13

Допущение 5.1

Объект управления обладает следующими свойствами:

1. Пара матриц A,B2 управляема, а пара матриц A,C2 наблюдаема.


2. D11=0,D22=0, D12TD12>0 и D21D21T>0
3. Для всех w, rankA-jwIB2C1D12=количество столбцов rankA-
jwIB1C2D21=количество строк

Наша цель – решить задачу управления в пространстве H2.


99
Задача H2 управления 5.1.

Для объекта, заданного уравнением 5.13 и удовлетворяющего допущению


5.1., найти регулятор с рациональной передаточной функцией K(s), который
стабилизирует систему управления и минимизирует H2 норму G2
передаточной функции G(s) от w к z.

Мы будем называть этот регулятор оптимальным H2 регулятором. Для того


чтобы найти H2 регулятор, вначале решим следующие два алгебраические
уравнения Риккати.

A-B2D12TD12-1D12TC1TS1+S1A-B2D12TD12-1D12TC1-S1B2D12TD12- 5.14
1B2TS1+C1TI-D12D12TD12-1D12TC1=0

A-B1D21TD21TD21-1C2S2+S2A-B1D21TD21TD21-1C2T-S2C2TD21TD21- 5.15
1C2S2+B1I-D21TD21TD21-1D21B1T=0

Оптимальный H2 регулятор задается следующей теоремой.

Теорема 5.5

Пусть объект задан уравнением 5.13, которое удовлетворяет допущению 5.1.


Пусть S1,S2 решение двух алгебраических уравнений риккати 5.14 и 5.15
соответственно. Оптимальный H2 регулятор для задачи H2-управления 5.1
определяется следующим образом

Ks=-L1sI-A-B2L1-L2C2-1L2

Где

L1=-D12TD12-1B2TS1+D12TC1

L2=-S2C2T+B1D21TD21TD21-1

Доказательство:

Так как пара матриц A,B2 управляема и пара матриц A,C2 наблюдаемы, то
решение двух уравнений Риккати 5.14 и 5.15 существуют и соответствующие
объекты A+B2L2 и A+L2C2 устойчивые. По теореме 5.3., все регуляторы,
которые стабилизируют систему управления могут быть представлены в виде:

Ks=M11s+M12sQsI-M22sQs-1M21s

Где Q(s) является любой действительной передаточной функцией, при этом


Q(s)∈H∞ и Mij(s) задается следующим образом:

M11(s)M12(s)M21(s)M22(s)=A+B2L1+L2C2-L2B2L10I-C2I0

Более того, передаточная функция системы управления определяется:

Gs=Ψ11s+Ψ12sQsΨ21(s)

Где Ψij(s) задается

100
 A + B2 L1 − B2 L1 B1 B2 
 
 Ψ11 ( s ) Ψ12 ( s)   0 A + L2 C 2 B1 + L2 D21 0 
=
Ψ ( s ) Ψ ( s)  C + D L
 21   1 − D12 L1 D11 D12 
22 12 1

 0 C2 D12 0 

Так как регулятор получается из решений уравнений Риккати 5.14 и 5.15,


может быть показано, что Ψ11 и Ψ12QΨ21ортогональный. Отсюда

G2=Ψ112+Ψ12QΨ212

Соответственно для минимизации G2 мы должны выбрать Qs=0.


Следовательно

Ks=M11s=-L1(sI-A-B2L1-L2C2)-1L2

Теорема доказана

Следующий пример иллюстрирует разработанный оптимальный H2 регулятор.

Пример 5.8

Рассмотрим систему, заданную в примере 5.7. Вначале проверим:


выполняются ли условия допущения 5.1. Действительно,

1. Так как матрица A устойчива, то A,B2 управляема и A,C2 наблюдаема.


2. D11=0,D22=0, D12TD12=1>0 и D21D21T=4>0
3. Для всех w

 − 5 − jw 2 −4 6 
 
  A − jwI B2    0 − 3 − jw 0 8  
rank   = rank =4
  C1 D12    0 7 − 1 − jw − 5 
  
 − 2 9 4 1
 

 − 5 − jw 2 −4 7 
 
  A − jwI B1    0 − 3 − jw 0 − 3 
rank   = rank =4
  C2 D21    0 7 − 1 − jw 1  
  
 6 3 − 1 1
 

Таким образом, допущение 5.1. полностью удовлетворяется. Не сложно


заметить, что так как

C1TI-D12D12TD12-1D12TC1=C1T1-1C1=0

B1I-D21TD21TD21TD21B1T=B11-1B1T=0

Решение алгебраических уравнений Риккати

A-B2D12TD12-1D12TC1TS1+S1A-B2D12TD12-1D12TC1-S1B2D12TD12-
1B2TS1+C1TI-D12D12TD12-1D12TC1=0
101
и

A-B1D21TD21TD21-1C2S2+S2A-B1D21TD21TD21-1C2T-S2C2TD21TD21-
1C2S2+B1I-D21TD21TD21-1D21B1T=0

Соответственно равны

S1=0

S2=0

Тогда

L1=-D12TD12-1B2TS1+D12TC1==-D12TD12-1D12TC1=-C1=-2-94

L2=-S2C2T+B1D21TD21TD21-1=-B1D21TD21TD21-1=-B12=-3.51.5-0.5

Оптимальный H2 регулятор получается следующим:

A+B2L1+L2C2=-52-40-3007-1+68-5-2-94+-3.51.5-0.563-1=-14-62-24.525-70.5-
33.5-1350.519.5

Ks=-L1sI-A-B2L1-L2C2-1L2=-2-94s+146224.5-25s+70.533.513-50.5s-19.5-1-3.51.5-
0.5=18.5s2+125s+334.5s3+65s2+2275s+9665

K(s) может быть представлен следующим образом

η=-14-62-24.525-70.5-33.5-1350.519.5η+-3.51.5-0.5y

u=-2-94η

Пример 5.9. с использованием Matlab

Рассмотрим систему

Fs=AB1B2C1D11D12C2D21D22

Где

 − 5 2 − 4 − 7 0 7 6
 0 − 3 2 − 6  5 − 3 8
A=  B1 =   B2 =  
0 7 −1 4  0 1  − 5
     
− 2 3 5 8  − 2 6  2

− 2 9 4 − 1 C 2 = [ 6 3 − 1 7]
C1 =  
 3 0 −7 0 

и
0 0  0  D12 = [1 0] D22 = 0
D11 =   D12 =  
0 0  1

102
Мы можем проверить, что допущения 5.1. удовлетворяются. Используя
MATLAB «h2syn», мы можем получить следующее оптимальное H2 управление

− 34387 − 1864 385 − 4576  583 


 − 4550 − 2478 516 − 6067  773 
η =  η+ y
 − 2661 − 1199 5295 − 2630  434 
   
 4556 2232 − 816 5137  − 756
u = [108 − 195 − 324 − 815]η

Данные примеры показывают способ нахождения решения задачи H2


управления. Сейчас будет рассмотрен вопрос о проблеме H∞ управления.
Задача H∞ управления похожа на предыдущую, но является более сложной.
Вначале мы сделаем следующие допущения для уравнения 5.13.

Допущение 5.2.

Объект управления, заданный уравнением 5.13, обладает следующими


свойствами:

1. Пара матриц A,B1 управляема, а пара матриц A,C1 наблюдаема.


2. Пара матриц A,B2 управляема, а пара матриц A,C2 наблюдаема.
3. D11=0,D22=0
4. D12TC1D12=0I
5. B1D12D21T=0I

Фактически, возможно опустить указанные выше допущения но все равно


решить задачу H∞ оптимального управления. В любом случае, решение будет
более сложным. С этой точки зрения, в этой книге мы представим задачу H∞
оптимального управления, когда допущения 5.2. удовлетворяются. Задача H∞
оптимального управления следующая.

Задача H∞-управления 5.2.

Для объекта, заданного уравнением 5.13, удовлетворяющего условиям 5.2.,


для заданного числа γ, найти, если они существуют, все регуляторы K(s),
такие что:

1) K(s) стабилизирует систему управления;


2) Передаточная функция G(s) от w к z имеет норму H∞, удовлетворяющую
G∞<γ.

Укажем на разницу в задачи H2 управления 5.1 и задачи H∞ управления 5.2.


Задачей H2 управления является поиск регулятора, который минимизирует
норму G(s). А задачей H∞ управления является нахождение регуляторов,
которые гарантируют, что норма в H∞ передаточной функции G(s) будет
меньше чем заданная константа. Причина кроется в том, что гораздо проще
посчитать норму H2 и гораздо сложнее норму H∞.

103
Будем называть регулятор, решающий задачу H∞ управления 5.2,
регулятором H∞. Для нахождения регуляторов в H∞ вначале решим два
алгебраических уравнений Риккати:

ATS1+S1A+S1γ-2B1B1T-B2B2TS1+C1TC1=0 5.16

AS1+S1AT+S1γ-2C1TC1-C2TC2S1+B1B1T=0 5.17

Теорема 5.6

Пусть объект задан уравнением 5.13, которое удовлетворяет допущениям 5.2.


Пусть S1,S2 решения двух алгебраических уравнений Риккати 5.16 и 5.17
соответственно. При этом регулятор H∞ , удовлетворяющий G∞<γ существует
тогда и только тогда, когда

1. S1>0,S2>0
2. Радиус спектра матрицы S1S2 ρS1S2=maxλS1S2<γ2

Если эти условия выполняются, то множество регуляторов H∞ заданных


следующим образом

Ks=M11s+M12sQsI-M22sQs-1M21s

Где Q(s) любая соответствующая рациональная передаточная функция, такая


что Qs∈H∞, Q∞<γ и Mij(s) представляется в виде:

M11(s)M12(s)M21(s)M22(s)=A+γ-2B1B1TS1+B2L1+L2C2-L2I-γ-2S2S1-1B2L10I-C2I0

С L1=-B2TS1 и L2=-I-γ-2S2S1-1S2C2T.

Доказательство теоремы достаточно громоздкое и поэтому будет опущено.

Используя команду “hinfsyn”, мы можем синтезировать «оптимальный» H∞


регулятор, который стабилизирует систему управления и «минимизирует»
норму H∞ (G∞) для передаточной функции G(s) от w к z. Это делается на
основании алгоритма деления пополам, схожего с расчетом норму H∞. Также
эта теорема может быть использована для систем, неудовлетворяющий
допущению 5.2. так как данное допущение является достаточным, но не
необходимым.

Пример 5.10

Рассмотрим систему в примере 5.7. Используя Matlab и определяя границы


γ=10000,γ=0 и толерантностью (точностью) в 1%, мы можем найти, что
«оптимальный» H∞ регулятор будет представляться

η=-14-62-24.525-70.5-33.4-1350.519.5η+3.7596-1.61130.5371y

u=1.8619-8.3785-3.7238η

Закончим эту главу рассмотрением более сложного примера системы с


несколькими входами и выходами.

Пример 5.11
104
Пусть задана система

− 2.9252 − 1.5104 0.4013 − 4.8025 1.7004 


 3.5064 − 3.3745 1.9835 − 4.0158 − 0.4383
 
A =  2.1311 0.3975 − 4.9795 − 1.2584 3.3804 
 
 − 4.1958 4.2333 3.3660 4.6748 3.2310 
 3.1870 − 0.6288 3.8942 1.1959 0.4211 

 − 4.0761 0.4889   1.8911 − 0.2602


− 2.0472 − 3.4384 − 0.9903 − 4.8224
   
B1 =  1.0224 4.2507 , B2 =  − 1.2042 3.1995 
   
 − 3.1716 − 2.9784  4.0319 − 4.4261
 2.3317 − 4.9155  4.4335 − 4.0987
 1.9665 − 4.4242 2.2283 1.9572 1.2539
C1 =  
− 3.5285 − 4.3664 − 4.6629 − 2.7882 0.1329
 0.7571 3.9268 − 2.0752 4.9402 4.7309
C2 =  
− 2.1276 − 4.0741 3.2190 − 4.3218 4.2279
0 0  1 0  1 0  0 0 
D11 =   , D12 =   , D21 =   , D22 =  
0 0  0 2 0 3 0 0 

Используя Matlab, мы получаем что регулятор H∞ будет равен:

 13192 1162 6859 − 8014 3137   1 − 2


 15069 1283 7845 − 9176 3577   4 − 4
  
η = − 15053 − 1342 − 7808 9106 − 3587η +  4 0 y
   
 35705 3179 18529 − 21621 8503  − 5 − 1
 37162 3273 19304 − 22548 8812   3 − 1 
 4782 426 2483 − 2899 1134 
u= η
− 3229 − 283 − 1676 1958 − 767

105