Вы находитесь на странице: 1из 217

Е. Э.

СТРАШИНИН

ОСНОВЫ ТЕОРИИ
АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ

ЧАСТЬ I

ЛИНЕЙНЫЕ НЕПРЕРЫВНЫЕ
СИСТЕМЫ УПРАВЛЕНИЯ

1
Министерство образования Российской Федерации

Уральский государственный технический университет

Е. Э. СТРАШИНИН

ОСНОВЫ ТЕОРИИ
АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ
ЧАСТЬ I

ЛИНЕЙНЫЕ НЕПРЕРЫВНЫЕ
СИСТЕМЫ УПРАВЛЕНИЯ

УЧЕБНОЕ ПОСОБИЕ

Научный редактор –
профессор, канд. техн. наук Д.В.Астрецов

ЕКАТЕРИНБУРГ
2000

2
УДК 519.71:681.51

Рецензенты:
Кафедра автоматизации производственных процессов Уральской госу-
дарственной горно-геологической академии, проф. В.А.Лукас, зав. ка-
федрой доктор техн. наук проф. Э.С.Лапин, протокол заседания кафед-
ра от 22 февраля 2000 года.
Зав. лабораторией Института электрофизики УрО РАН, доктор физмат.
Наук А.М.Искольдский.

Автор: Е..Э.Страшинин

Основы теории автоматического управления, Часть 1. Линейные


непрерывные системы управления.: Учебное пособие / Е.Э.Страшинин.
Екатеринбург: УГТУ, 2000

Предлагаемое учебное пособие содержит первую часть конспекта


лекций по двухсеместровому курсу теории автоматического управления,
читаемому автором на радиотехническом факультете Уральского госу-
дарственного технического университета. Первая часть посвящена ли-
нейным непрерывным системам управления. Во второй части будут рас-
смотрены нелинейные и импульсные системы.

3
© Уральский государственный технический университет, 2000

ОТ АВТОРА

Вашему вниманию предлагается промежуточная версия первой


части конспекта лекций Е.Э.Страшинина по курсу "Теория автоматиче-
ского управления" - Линейные непрерывные системы автоматического
управления.
Конспект составлен на базе лекций, читавшихся для студентов
специальности 210100 - Управление и информатика в технических сис-
темах. Он может быть полезен также для студентов специальности
220100 - Вычислительные машины, комплексы, системы и сети.
Автор стремился в некоторой степени восполнить дефицит учеб-
ной литературы в области представления основ теории автоматического
управления в терминах пространства состояний – то, что уже на протя-
жении последних двадцати лет называется Современной теорией
управления. В Пособии этот подход неразрывно связан с традиционной,
классической теорией автоматического управления. Стали классически-
ми прекрасные учебники А.А. Воронова ([16], [17]), А.В. Нетушила ([14],
[15]), А.А. Красовского и Г.С. Поспелова [7], В.А. Бесекерского и Е.П. По-
пова [2]. Некоторая лаконичность в изложении традиционной теории
обусловлена наличием достаточно обширного перечня соответствую-
щей учебной литературы и ограничениями на объём Пособия.
Автор выражает глубокую признательность студентам группы Р-
371 Е.Заводчикову, С.Быкову, И.Варнаваскому, А.Головко, А.Муковнину,
А.Орлову, Б.Павлову, К.Павлову, А.Сосунову, которые провели очень
большую работу по подготовке электронной версии и редактированию
конспекта, Валентине Александровне Табуевой и Дмитрию Вячеславо-
вичу Астрецову, которые взяли на себя труд прочитать рукопись и сде-
лать чрезвычайно полезные для автора замечания.
Автор заранее благодарен за критические замечания и предложе-
ния по совершенствованию Пособия, которые можно направить на ка-
федру АИТ УГТУ-УПИ или по электронной почте по адресу
str@rtf.ustu.ru

4
1. Введение в теорию автоматического управления
На рубеже XVIII-XIX веков в эпоху промышленного переворота в Ев-
ропе начинается новый этап развития автоматики, связанный с внедре-
нием ее в промышленность. 1765 год знаменуется постройкой регулято-
ра уровня котла паровой машины И.И. Ползунова. В 1784 году появля-
ется центробежный регулятор скорости паровой машины Уатта.
В это время формируется ряд важных принципов автоматики: принцип
регулирования по отклонению Ползунова- Уатта и принцип регулирова-
ния по нагрузке Понселе. Первый из них развился в концепцию обратной
связи, второй - в теорию инвариантности (Г.В. Щипанов, Н.Н. Лузин, Б.Н.
Петров). Идея регулирования по нагрузке может быть проиллюстриро-
вана на примере генератора с последовательным (сериесным) возбуж-
дением (рис.1.1). При изменении нагрузки меняется ток возбуждения,
который соответствующим изменением магнитного потока компенсирует
дополнительное падение напряжения на внутреннем сопротивлении
якоря генератора. Однако, если при этом по каким-либо причинам изме-
няется скорость вращения якоря генератора, то застабилизировать на-
пряжение на нагрузке в этой схеме уже не удается.

OB1
U B1 Ia
Г RH
ОB2


Рис.1.1. Пример регулирования по
возмущению

От этого недостатка свободна схема, приведенная на рис. 1.2, -


именно вследствие использования принципа обратной связи. В этой
схеме входной потенциометр служит для задания (коэффициент α 1 ) ве-
личины стабилизируемого напряжения; потенциометр, подключенный к
якорю генератора, позволяет регулировать коэффициент обратной свя-
зи α 2 . В этом случае, в отличие от систем регулирования по возмуще-
нию, не важно, какая именно причина вызвала изменение регулируемой
величины. При изменении напряжения на щётках генератора в соответ-
ствии с электрической схемой изменяется напряжение на обмотке воз-
5
буждения. При отрицательном знаке обратной связи знак приращения
напряжения возбуждения противоположен знаку изменения напряжения
якоря генератора. В итоге результирующая величина отклонения напря-
жения генератора уменьшается по сравнению с соответствующим ухо-
дом напряжения в системе без обратной связи.

+ –

Uз Г α2
U0 UB RH

α1 U oc
+

Рис.1.2. Стабилизация напряжения генератора с


использованием обратной связи

На этом же принципе построена приведенная на рис.1.3 система


стабилизации скорости паровой машины Уатта. На рис.1.4 представлена
её функциональная схема. В данной системе с увеличением нагрузочно-
го момента M H падают обороты турбины ω , что приводит к уменьше-
нию расстояния 2 r между грузиками центробежного регулятора. Вслед-
ствие этого заслонка поднимается (увеличивается расстояние S ) и рас-
тет расход пара Q , подаваемого в турбину. Это приводит к росту числа
оборотов турбины ω , а следовательно, к компенсации нагрузочного
момента M H .
При изменении нагрузки на валу паровой машины после окончания
переходных процессов сохраняется так называемая статическая ошиб-
ка. Если бы это было не так, то грузики центробежного регулятора, а
вместе с ними и заслонка заняли своё первоначальное положение, и не
изменившееся в результате количество подаваемого в турбину пара не
смогло бы уравновесить изменившийся момент нагрузки. Такая система
называется статической. Работа её осуществляется именно за счёт
наличия статической ошибки.
Рассматриваемая система относится к классу систем прямого дей-
ствия, то есть таких, в которых для реализации регулятора не исполь-
зуются дополнительные источники энергии. В данном случае это плохо,
потому что для мощных установок перемещение тяжёлой заслонки по-
требует неразумно громоздкого и тяжёлого центробежного регулятора.

6
нагрузка

MH
ТУРБИНА
(объект) H
ω ω

Δl1 Δl2

Задатчик скорости
(гайка со взаимно- расход пара
обратной резьбой) Q

S- раскрытие заслонки

Рис. 1.3. Система стабилизации скорости паровой машины

Таким образом, система является статической системой прямого


действия.
Введём следующие определения:
ƒ Статической системой называют систему, работающую за счет ста-
тической ошибки;
ƒ Системой прямого действия называют систему, регулятор которой
не имеет собственных источников энергии.
Описание системы управления может быть представлено в графи-
ческом виде.
ƒ Функциональной схемой называется блок-схема, каждый элемент ко-
торой отображает некоторый физический элемент (группу физиче-
ских элементов) рассматриваемой системы.
7
ƒ Структурной схемой называется блок-схема, каждый элемент кото-
рой отображает некоторый математический оператор (группу опера-
торов), описывающий рассматриваемую систему.
Использование функциональных и структурных схем позволяет более
наглядно представить взаимосвязь между отдельными основными и
промежуточными переменными объектов и систем управления
MH
“Рычаг” S Исполнительный Q Объект:
ω
механизм Турбина

l1
Задающее r Центробежный
устройство регулятор

ϕ З
Регулятор

Рис.1. 4. Функциональная схема системы стабилизации скорости


турбины
Типовая функциональная схема системы автоматического управ-
ления (САУ) представлена на рис.1.5, где:
u – управляющий сигнал;
y – управляемый сигнал;
f – возмущающее воздействие.
Кружок с четырьмя секторами является сумматором, причём сигнал, по-
ступающий на зачернённый сектор, изменяет свой знак (вычитается).

f
u y
Исполнительный Объект управления
механизм

Преобразующие и Корректирующее
Датчик
согласующие устр. устройство

Задающее
устройство

Автоматическое управляющее устройство (регулятор)

Рис.1.5. Типовая функциональная САУ

8
Рассмотрим вариант системы стабилизации скорости турбины, в
котором сделана попытка устранить недостатки, присущие рассмотрен-
ной выше статической системе прямого действия. На Рис.1.6 показан
регулятор для этой системы.

r
Масляный
насос
Δlзол
Δl1

Силовой
цилиндр

Q
Золотник
Δlсц

Рис.1.6. Регулятор системы стабилизации скорости турбины


с использованием гидравлического усилителя

9
Для этого в систему введен гидравлический усилитель, включаю-
щий в себя золотник, силовой цилиндр и масляный насос. Такая систе-
ма, в которой энергия регулятора потребляется от отдельного источни-
ка, называется системой непрямого действия.
При заданной скорости расстояние между грузиками центробежно-
го регулятора равно номинальному значению ( r = r0 ), положение плеча
золотника l ЗОЛ также равно номинальному значению ( l ЗОЛ = l ЗОЛ 0 ), при
этом поршень золотника полностью перекрывает выходные отверстия,
следовательно, положение поршня силового цилиндра неизменно.
С увеличением нагрузочного момента M H падают обороты турби-
ны ω , что приводит к уменьшению расстояния r между грузиками цен-
тробежного регулятора. В результате изменяется положение поршенька
золотника. Это, в свою очередь, приводит к перемещению поршня сило-
вого цилиндра, а, следовательно, и к дополнительному приоткрытию
заслонки S . Соответственно увеличивается расход пара, возрастает
скорость оборотов турбины ω и увеличивается расстояние r . Статика
(установившееся состояние) в системе возможна только тогда, когда
l 2 = l 20 , то есть, когда полностью перекрыты перепускные отверстия зо-
лотникового устройства.
Теоретически в этой системе статическая ошибка равна нулю, то есть
данная система является астатической. В ней отсутствует статическая
связь между скоростью и положением заслонки.
Рассмотрим упрощенные уравнения системы. Начнём с уравнения объ-
екта. Очевидно, что изменение скорости турбины может происходить
лишь в тех случаях, когда нарушается равновесие между движущим мо-
ментом турбины M T и моментом нагрузки M H :
d Δω
J = ΔM T − ΔM Н , (1.1)
dt
где J – суммарный момент инерции, приведённый к валу турбины.
С целью упрощения в уравнении (1.1) использованы приращения ско-
рости и моментов. Более подробно такой подход будет рассмотрен в
разделе, посвященном линеаризации систем.
Будем полагать, что приращение момента турбины пропорционально
приращению количества подаваемого пара
ΔMT = K T ΔQ .
Запишем уравнение центробежного регулятора. Полагая, что сами от-
клонения скорости и вызванные ими приращения внутренних перемен-
ных регулятора малы, мы можем выразить все зависимости в линейном
виде. Тогда приращение скорости раскрытия грузиков и изменение по-
ложения поршенька золотника будут связаны линейными зависимостя-
ми:

10
Δr = K ω ⋅ Δω ;
(1.2)
Δl зол = −K r ⋅ Δr .
Составляя уравнение гидравлического усилителя, учтём, что скорость
перемещения поршня силового цилиндра пропорциональна величине
открытия перепускных отверстий золотника, то есть приращению Δl зол :

dΔl сц
= K зол ⋅ Δl зол . (1.3)
dt
Приращение координаты штока силового цилиндра повлечет за
собой изменение положения заслонки и, следовательно, изменение ко-
личества подаваемого в турбину пара:
ΔQ = K сц ⋅ Δl сц . (1.4)

Продифференцировав уравнение (1.4) и, учитывая уравнения для


центробежного регулятора (1.2) и гидравлического усилителя (1.3), по-
лучим уравнение для регулятора:

dΔQ
= −K P ⋅ Δω , (1.5)
dt
где K P = K СЦ ⋅ K Зол ⋅ K r ⋅ K ω - коэффициент регулятора.
Запишем совместно уравнения объекта и регулятора
⎧ d Δω
⎪ dt = K q ⋅ ΔQ − K H ⋅ ΔM H
⎨ dΔQ
,
⎪ = −K P ⋅ Δω
⎩ dt
продифференцируем первое уравнение и подставим в него второе:
d 2 Δω d Δω d ΔM H
= K q ( −K P ⋅ ) − K H .
dt 2 dt dt
При условии постоянства нагрузки, получаем уравнение свободного
движения всей системы
d 2 Δω
+ K ⋅ Δω = 0 , (1.6)
dt 2
где
K = KP ⋅ Kq .
Соответствующее характеристическое уравнение имеет вид:

11
λ2 + K = 0 ,
его корни -
λ1,2 = ± j K .
Таким образом, решение уравнения (1.6) имеет вид:
Δω (t ) = C1e λ1t + C2e λ2 t = A ⋅ Sin( K ⋅ t + ϕ ) , (1.7)
где A и ϕ определяются начальными условиями.
В результате решения получили, что в данной системе в принципе не
существует установившегося (статического) состояния. Следовательно,
система неработоспособна.
С целью успокоения незатухающих колебаний (1.7) введём в систему
демпфер (рис.1.7) и рассмотрим, что в ней происходит при изменении
нагрузки. С увеличением нагрузочного момента M H уменьшается ско-
рость вращения турбины ω , что приводит к уменьшению расстояния r
между грузиками центробежного регулятора. Это влечет за собой изме-
нение положения поршенька золотника Δl зол , а, следовательно, и изме-
нение положения поршня силового цилиндра. При этом одновременно
происходит два процесса.
Во-первых, вместе со штоком силового цилиндра опускаются поршень и
цилиндр демпфера, уменьшая первоначальное изменение Δl зол . Ско-
рость перемещения поршня демпфера относительно его цилиндра не-
велика и регулируется с помощью специального дросселя Др.
Во-вторых, приоткрывается заслонка, увеличивая количество подавае-
мого в турбину пара, и начинает расти скорость ω .
За счёт первого движения поршни золотника могут перекрыть перепуск-
ные отверстия ещё до восстановления номинального значения ω . В то
же время пружины стремятся вернуть демпфер в исходное положение,
и, в конечном итоге, Δl 2 стремится к нулю. Теперь уже перепускные от-
верстия золотника будут перекрыты только при номинальной скорости.
Следовательно, система с демпфером, как и предыдущая, является ас-
татической.
Рассмотрим, как повлияло введение демпфера на незатухающие
колебания, выявленные в предыдущем варианте системы. Считая от-
клонения от номинального режима малыми, запишем уравнения эле-
ментов регулятора. Как и раньше,

Δr = K ω Δω ; Δl 1 = −K r ⋅ Δr ; (1.8)

d
l сц = K зол ⋅ Δl зол . (1.9)
dt

12
В отличие от предыдущей системы, в данном случае положение штока
золотника зависит не только от центробежного регулятора, но и от
демпфера:

Демпфер

Др
r
Задающее
устройство

lзол
l2 l1

Силовой цилиндр Золотник

Δl сц

Рис.1.7. Регулятор системы стабилизации скорости турбины


с использованием успокоительного демпфера

13
Δl зол = K 1 ⋅ Δl 1 − K 2 ⋅ Δl 2 . (1.10)
Упрощенные уравнения демпфера основываются на равенстве сил пру-
жин:
ΔFпр = K пр ⋅ Δl 2
и сил, связанных с перемещением поршня демпфера относительно кор-
пуса:
d (l сц − l 2 )
Fд = K д .
dt
Переходя к преобразованиям Лапласа при нулевых начальных услови-
ях, запишем равенство этих сил в виде:
K д p ⋅ ( Δl сц − Δl 2 ) = K пр ⋅ Δl 2 ,
или
Kд K
⋅ pΔl 2 + Δl 2 = д ⋅ pΔl сц .
K пр K пр
Таким образом, изображения перемещений штока силового цилиндра и
корпуса демпфера связаны соотношением:
Tд p
Δl 2 = ⋅ Δl сц , (1.11)
Tд p + 1
где постоянная времени демпфера
Tд = K д K пр .
Из (1.9) и (1.10) следует:
p ⋅ Δl сц = K зол ⋅ (K 1Δl 1 − K 2 Δl 2 )
а с учётом (1.11) получаем
Tд p
p ⋅ Δl сц = K зол ⋅ (K 1Δl 1 − K 2 Δl сц ) ,
Tд p + 1
откуда
⎛ Tд ⎞
⎜⎜1 + K зол K 2 ⎟⎟ ⋅ p ⋅ Δl сц = K зол K 1Δl 1 . (1.12)
⎝ Tд p + 1⎠
Используя равенства (1.8), (1.12) и (1.4) получим связь между входом
регулятора Δω и его выходом ΔQ :

14
T1p + 1
K q рег pΔQ = K зол K1( −K r Kω )Δω , (1.13)
Tд p + 1
где
1+ K зол K 2Tд Tд
K qрег = ; T1 = .
K сц 1+ K зол K 2Tд
Если T1 << Tд , то (1.13) упрощается:

K q рег ⋅ p
ΔQ = −K ω рег Δω .
Tд p + 1
Это равенство можно разрешить относительно ΔQ :
Kω рег (Tд p + 1)
ΔQ = − Δω .
K q рег ⋅ p
Введём обозначения
K ω регTд K ω рег
K рег пропорц . = ; K рег интегр . =
K q рег K q рег

и окончательно получим уравнение регулятора, в котором выходная ве-


личина ΔQ формируется как сумма пропорциональной и интегральной
составляющих ошибки стабилизации Δω :
Δω
ΔQ = −K рег пропорц. ⋅ Δω − K рег интегр. . (1.14)
p
Запишем уравнение объекта (турбины) относительно изображений
по Лапласу его входной и выходной переменных:
p ⋅ Δω = K q ΔQ − K H ΔM H . (1.15)
Продифференцируем последнее равенство и подставим в него уравне-
ние регулятора (1.14). В результате получим уравнение системы в це-
лом:
p 2 Δω + K q K рег пропорц . ⋅ p ⋅ Δω + K q K рег интегр. Δω = −K H ⋅ p ⋅ ΔM H . (1.16)
Корни соответствующего характеристического уравнения
p1,2 = −0.5K q K рег пропорц ± (0.5K q K рег пропорц ) 2 − K q K рег интегр
всегда имеют отрицательные вещественные части. Это означает, что в
отличие от предыдущего случая свободная составляющая решения
уравнения (1.16) с течением времени стремится к нулю. Таким образом,
15
введение демпфера позволило получить устойчивую, работоспособную
систему.
Разработчики первых систем автоматического регулирования столкну-
лись со случаями катастрофической неустойчивости, на первый взгляд,
безукоризненных систем. В 1845 году братья Вильям и Вернер Сименсы
предложили метод регулирования по производной. Существо их пред-
ложения можно пояснить на примере следящей системы, функциональ-
ная схема которой приведена на рис.1.8. На рис.1.9 представлен фраг-
мент переходных процессов по выходной координате ϕ вых , рассогласо-
ванию (ошибке) ε и производной рассогласования ε& . Хотя в точках А1
и А2, В1 и В2 отклонение выходной координаты от входной соответст-
венно равны, управлявшее воздействия на объект должны быть различ-
ными, так как в точках А1 и В2 выходная координата движется к требуе-
мому значению, а в точках В1 и А2 - удаляется от него. Учитывая инер-
ционные свойства объекта, целесообразно в формирователе закона
управления реализовать управлявшее воздействие U, пропорциональ-
ное сумме α 1ε + α 2ε& . Добавление сигнала производной уменьшит абсо-
лютную величину управления в т.т. А.1 и В2 и увеличит её в точках B1 и
A2.
Распространение автоматических регуляторов вызвало потребность в
разработке теоретически обоснованных методов их расчета. В 1866 году
выходит в свет статья Максвелла "О регуляторах". В 1876 году появи-
лась работа, оказавшая большое влияние на науку о регулировании -
труд профессора И.А. Вышнеградского "Об общей теории регуляторов".
В этой работе было выведено условие устойчивости для линейных сис-
тем третьего порядка и даны конкретные указания о том, как влияют
конструктивные параметры на устойчивость. И.А. Вышнеградский явил-
ся основоположником классической теории регулирования. Работы
Вышнеградского были продолжены словацким учёным А. Стодолой. По
его просьбе швейцарский математик А. Гурвиц в 1895 году ввел алгеб-
раические условия устойчивости для линейных систем любого порядка.
Долгое время оставалась неизвестной инженерам аналогичная работа
Рауса, выполненная им еще в 1877 году по просьбе Максвелла.

ϕ δ ϕ
з
Формирователь U Исполнительный
Объект
вых

закона управления механизм

Рис.1.8. Функциональная схема следящей системы


Лишь впоследствии, с развитием вычислительной техники, стало
ясно, что критерий Рауса обладает гораздо большей алгоритмической и
вычислительной мощностью и весьма удобен для использования на
ЭВМ.
16
Рис. 1.9. К введению производной ошибки
в закон регулирования.

Большой вклад в теорию автоматического регулирования внес из-


вестный русский ученый Н.Е. Жуковский. В 1880 году вышла его работа
"О прочности движения". Он читал лекции по теории регуляторов в Мос-
ковском университете, Математическом обществе и Московском тех-
ническом училище. В 1909 году вышел его учебник по классической тео-
рии регулирования - "Теория регулирования хода машин".
Основы общей теории устойчивости динамических систем были за-
ложены выдающимся русским учёным А.М. Ляпуновым. В своей доктор-
ской диссертации в 1892 году им впервые были сформулированы усло-
вия устойчивости решений обыкновенных дифференциальных уравне-
ний, дано строгое определение понятия устойчивости, разработаны два
основных метода исследования устойчивости: первый метод Ляпунова
исследования устойчивости в малом и второй, прямой метод исследо-
вания устойчивости в большом.
В те годы, по-видимому, еще никто не подозревал о будущей роли
теории А.М. Ляпунова в общей теории управления. Лишь в 40-50 годах
его теоремы заработали в полную силу.
В 1932 году американский учёный Найквист разработал теорию устойчи-
вости усилителей с обратной связью. В 1936 году молодой советский
17
ученый А.В. Михайлов распространил критерии Найквиста на системы
автоматического регулирования и предложил свой собственный крите-
рии устойчивости, который с тех пор называется его именем.
В 1937 году вышла большая работа советских учёных А.А. Андронова,
С.Э. Хайкина и других по теории нелинейных колебаний, где впервые
были введены понятия периодических режимов, автоколебаний, фазово-
го пространства.
Сороковые годы нашего столетия отмечены бурным развитием
частотных методов, и большую роль в их пропаганде и внедрении в
практику проектирования в нашей стране сыграл профессор В.В. Соло-
довников и его ученики, в это же время Н. Винер и А.Н. Колмогоров соз-
дают теорию синтеза статистически оптимальных систем. В 1948 году
К.Ф. Теодорчиком в СССР и в I950 году Ивенсом в США закладываются
основы теории корневых годографов.
В 50-60 годы закладывается новое перспективное направлении - теория
оптимального управления. У истоков этой теории стояли советские уче-
ные А.А. Фельдбаум, Л.С. Понтрягин, А.М. Летов, Е.А. Барбашин, А.А.
Красовский, Н.Н. Красовский, американские учёные Р. Беллман, Р. Кал-
ман и другие.
В 60-е годы М.А. Айзерманом и В.М. Поповым разрабатывается
теория абсолютной устойчивости нелинейных систем. Большой вклад в
теорию импульсных и цифровых систем автоматического управления
внесли Ю.Ту, Я.З. Цыпкин, Л.Т. Кузин, Э. Джури. В.С. Пугачёв обогатил
теорию управления разработкой вопросов статистической динамики.
Родоначальником теории дифференциальных игр является академик
Н.Н. Красовский. Свердловские математики ведут продуктивную работу
в области распознавания образов и управления в условиях неопреде-
лённости. Всемирно известны работы российских учёных Б.Н. Петрова и
С.В. Емельянова в области теории и практики адаптивных систем.

Теория автоматического управления (ТАУ) – это наука, которая,


абстрагируясь от конкретного исполнения различных объектов и систем
АУ, изучает особенности установившихся и динамических режимов этих
систем и предлагает методы проектирования управления, обеспечи-
вающего выполнение требований, предъявляемых к ходу управляемого
технологического процесса.
По принципу формирования управления системы автоматического
управления (САУ) подразделяется на:
ƒ разомкнутые,
ƒ замкнутые,
ƒ комбинированные.
По цели управления САУ подразделяют на:
ƒ системы стабилизации,
ƒ системы программного управления,
ƒ следящие системы.
18
ТАУ работает с математическими моделями объектов системы
управления, сочетает анализ и синтез.
По математическому описанию и по свойствам САУ подразделяются на
следующие типы:
ƒ обыкновенные системы – системы, которые описываются дифферен-
циальными или разностными уравнениями с сосредоточенными па-
раметрами;
ƒ системы с распределенными параметрами;
ƒ непрерывные системы – системы, все координаты (переменные) ко-
торых являются непрерывными функциями времени;
ƒ дискретные системы – системы, в которых хотя бы одна из координат
(переменных) является импульсной (дискретной или решётчатой)
функцией времени;
ƒ детерминированные системы – системы с постоянными или изме-
няющимися известным (детерминированным) образом параметрами;
ƒ стохастические системы – системы, параметры которых изменяются
во времени случайным образом;
ƒ линейные системы – системы, которые описываются линейными
дифференциальными или разностными уравнениями;
ƒ нелинейные системы– системы, которые описываются нелинейными
дифференциальными или разностными уравнениями;
ƒ традиционные одноуровневые системы – системы с регулированием
только основных переменных;
ƒ системы с адаптивным управлением, в которых кроме основного кон-
тура с отрицательной обратной связью имеется контур, оценивающий
текущие параметры управляемого объекта и соответствующим обра-
зом изменяющий управляющее воздействие или перестраиваемые
параметры регулятора;
ƒ оптимальные системы.

Более подробная и обстоятельная классификация систем автомати-


ческого управления приведена в обширной литературе по теории управ-
ления В частности, можно порекомендовать учебник А.А. Красовского и
Г.С. Поспелова [7].

19
2. Методы анализа непрерывных систем

2.1. Понятие пространства состояний


С точки зрения анализа и синтеза систем все переменные, характе-
ризующие объект управления (рис.2.1) или имеющие к нему отношение,
делятся на три группы.

f1 f2 fnf
u1 y1
u2 y2

unu x1, x2 ,K, xnx y ny

Рис.2. 1. Объект управления

1.Входные воздействия, представляющие сигналы, генерируемые сис-


темами, внешними по отношению к исследуемому объекту, и влияющие
на его поведение. Внешние сигналы разделяют на сигналы управляю-
щие - u1, u 2 ,K, u nu и возмущающие - f1, f2 ,K, fnf .
2.Выходные переменные, или переменные, позволяющие описать не-
которые аспекты поведения объекта, представляющие интерес для ис-
следователя или потребителя результатов функционирования объекта -
y 1, y 2 ,K, y ny .
3.Переменные состояния, или промежуточные переменные
x1, x 2 ,K, x nx , характеризующие динамическое поведение исследуемого
объекта или системы.
Для удобства оперирования с многомерными величинами совокуп-
ность управляющих переменных представляют в виде вектора управле- r
r
ния u . Аналогичным образом вводятся понятия вектора возмущения f ,
r r
вектора выхода y и вектора состояния x :

⎛ u1 ⎞ ⎛ f1 ⎞ ⎛ y1 ⎞ ⎛ x1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
r ⎜ u2 ⎟ r ⎜ f2 ⎟ r ⎜ y2 ⎟ r ⎜ x2 ⎟
u = ⎜ ⎟, f = ⎜ ⎟, y =⎜ , x = ⎜ ⎟.
L ... ... ⎟ ...
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜u ⎟ ⎜f ⎟ ⎜ yn ⎟ ⎜x ⎟
⎝ nu ⎠ ⎝ nf ⎠ ⎝ y⎠ ⎝ nx ⎠

20
r
Множество всех значений, которые может принять вектор u в мо-
мент времени t , образует пространство управления. Аналогично вво-
дятся понятия пространства возмущений, пространства выходов и про-
странства состояний.
В любой момент времени t состояние системы
r является функцией
r r
начального состояния x(t 0 ) и векторов u(t 0 , t ) и f (t 0 , t ) . Если известно,
как изменялись эти векторы на интервале [t 0 , t ] , то однозначно может
r
быть определено состояние системы x(t ) :
r r r r
x(t ) = F { x(t 0 ), u(t 0 , t ), f (t 0 , t )} . (2.1-1)
Вектор выхода в момент времени t является функцией тех же пе-
ременных:
r r r
y (t ) = Ψ { x(t 0 ), u(t 0 , t ), f (t 0 , t )} . (2.1-2)
Состояние системы отделяет будущее от прошлого, так что состо-
яние содержит всю информацию, необходимую для определения реак-
ции объекта на произвольный входной сигнал. Понятие состояния явля-
ется основным исходным понятием и, следовательно, не может быть
определено более полно, чем, например, слово "множество" в матема-
тике. Наибольшее, что можно сделать, это сформулировать свойства,
какими должна обладать система, поведение которой отвечает понятию
состояния.
Основным свойством состояния является то, что будущие значе-
ния его не зависят от характера достижения системой её текущего со-
стояния. Состояние системы в данный момент времени, а также текущее
и будущие значения её входов единственным образом определяют на-
стоящее и будущие значения её состояния и выходов.
Уравнение (2.1-1) называют уравнением состояния системы, а
уравнение (2.1-2) - уравнением выхода. Если объект описывается диф-
ференциальным уравнением, то уравнения (2.1-1) и (2.1-2) превращает-
ся в
r& r r r r r
x (t ) = F { x (t ),u(t ), f (t ), t } , x (t 0 ) = x 0 ; (2.1-3)
r r r r
y (t ) = Ψ { x(t ), u(t ), f (t ), t ,v (t )} , (2.1-4)
r
где дополнительно введён вектор ошибок измерений v (t ) .
Как правило, выбор состояния естественным образом следует из
физического устройства системы, а уравнение (2.1-3), называемое
дифференциальным уравнением состояния, обычно следует из элемен-
тарных физических законов, которыми определяется её поведение.

21
2.2. Линеаризация исходных уравнений
Почти все реальные объекты и системы автоматического управле-
ния являются нелинейными. Однако, среди нелинейных функций F и Ψ
часто встречаются такие, которые при определённых допущениях в ра-
бочей области функционирования системы могут быть заменены линей-
ными. В качестве примера такого случая представлена элементарная
функция на рис.2.2. В данном случае возможна линеаризация, так как
если точка A перемещается на небольшие расстояния по кривой
V2 = f (V1 ) , то этот участок кривой можно заменить отрезком прямой. В
то же время, нелинейная функция на рис.2.3 не допускает подобную за-
мену, если в процессе работы системы происходит изменение уровня
выходного сигнала V2 . Системы с такого типа функциями называют су-
щественно нелинейными. Их исследованию будет посвящен специаль-
ный раздел пособия. Ниже будет рассмотрен класс систем, допускаю-
щих линеаризацию.
V2 V2

V1 V1
Рис. 2.2. Линеаризуемая Рис. 2.3. Существенная
нелинейность нелинейность

Пусть режим функционирования r объекта определяется некоторой


траекторией по вектору управления u0 (t ) , а действительная реализация
r
u(t ) близка к ней:
r r r
u ( t ) = u 0 ( t ) + Δu ( t ) . (2.2-1)
При этом решение уравнения (2.1-3) можно записать в виде
r r r
x (t ) = x 0 ( t ) + Δx (t ) , (2.2-2)
r r
где x 0 (t ) – решение уравнения (2.1-3) при u = u 0 (t ) .
r
Назовём функционирование объекта (системы) при u = u 0 (t ) базо-
r r r
вым режимом. Переменные Δx(t ), Δu (t ), Δf (t ) – это отклонения от со-
ответствующих переменных в базовом режиме.
r r
Подставим теперь выражения для x (t ) и u(t ) в исходное диффе-
ренциальное уравнение состояний
22
r& r& r r r r r r
x 0 (t ) + Δx(t ) = F { x 0 (t ) + Δx(t ), u 0 (t ) + Δu(t ), f0 (t ) + Δf (t ), t }
и разложим функцию F в ряд Тейлора:
r r r r r r r r r
x& 0 (t ) + Δx& (t ) = F { x 0 ,u 0 , f0 , t } + J x { x 0 ,u 0 , f0 , t } Δx +
(2.2-3)
r r r r r r r r
+ J U { x 0 , u 0 , f0 , t } Δu + J f { x 0 , u 0 , f0 , t } Δf + R .
Здесь R – остаточный член, содержащий высшие степени приращений,
r r
и им можно пренебречь, J x , J u , J f – матрицы Якоби функции F для x , u
r
иf .
Элемент матрицы Якоби определяется как соответствующая част-
dFi
ная производная ( J x ) ik = . Например, для системы второго порядка
dx k
соответствующее слагаемое в правой части (2.2-3) имеет вид

⎡ ∂F1 ∂F1 ⎤ ⎡ ∂F1 ∂F1 ⎤


Δx + Δx
r ⎢ ∂x 1 ∂x 2 ⎥ ⎡ Δx1 ⎤ ⎢ ∂x1
1
∂x 2
2 ⎥
J x ⋅ Δx = ⎢ ⎥⋅ =⎢ ⎥,
⎢ ∂F2 ∂F2 ⎥ ⎢⎣Δx 2 ⎥⎦ ⎢ ∂F2 ∂F2
Δx1 + Δx 2 ⎥
⎢⎣ ∂x 1 ∂x 2 ⎥⎦ ⎢⎣ ∂x1 ∂x 2 ⎥⎦

Пренебрегая в (2.2-3) остаточным членом R и учитывая уравнение


для базового режима, получим:
r& r r r r r r r r r r r r
Δx(t ) = J x { x 0 , u 0 , f0 , t } Δx + J U { x 0 , u 0 , f0 , t } Δu + J f { x 0 , u 0 , f0 , t } Δf . (2.2-4)

Введем обозначения:

{ }
r r r
A(t ) = J x x 0 (t ), u 0 (t ), f0 (t ), t ;

{ }
r r r
B(t ) = J u x 0 (t ), u 0 (t ), f0 (t ), t ;

{ }
r r r r
G(t ) = J f x 0 (t ), u 0 (t ), f0 (t ), t Δf (t ) .

В результате получим:
Линейное дифференциальное векторно-матричное уравнение с пере-
менными параметрами (коэффициентами)
r& r r r
Δx (t ) = A(t ) ⋅ Δx (t ) + B(t ) ⋅ Δu (t ) + G(t ) ⋅ Δf (t ) , (2.2-5)
Аналогичным образом проведем линеаризацию уравнения выхода:

23
r r r r
Δy (t ) = C(t ) ⋅ Δx (t ) + D(t ) ⋅ Δu (t ) + Δv (t ) . (2.2-6)
Впредь, рассматривая линейные модели системы, будем опускать сим-
вол Δ при записи приращений соответствующих векторов. Таким обра-
зом, линеаризованные уравнения объекта (системы) примут вид
r r r r
x& (t ) = A(t )x (t ) + B(t )u(t ) + G(t )f (t ) ; (2.2-7)
r r r r
y (t ) = C(t )x (t ) + D(t )u(t ) + v (t ) . (2.2-8)

Ha рис. 2.4 приведена структурная схема, являющаяся графичес-


ким изображением уравнений (2.2-7) и (2.2-8).

D(t )
r
r x (t ) r
u (t ) B(t ) ∫ C(t ) y (t )

r r
G(t ) A(t ) v (t )
f (t )

Рис. 2.4. Обобщённая структурная схема объекта


управления

В качестве примера рассмотрим смесительный бак, который на-


полняется с помощью двух потоков, имеющих переменные мгновенные
расходы F1 (t ) и F2 (t ) (рис. 2.5). Оба входных потока содержат раство-
римое вещество с неизменными концентрациями C1 и C2 . Выходной по-
ток имеет массовую скорость истечения (мгновенный расход) F (t ) .
Предполагается, что содержимое бака перемешивается так, что концен-
трация выходного потока равна концентрации C out (t ) в баке.

24
F1(t) F2(t) - расход

C1 C2- концентрация

Cout(t)
h(t) V(t) – объем

выход F(t),Cout(t)
Рис. 2.5. Смесительный бак

Запишем уравнения баланса масс в баке.


Для полной массы:
dV (t )
= F1(t ) + F2 (t ) − F (t ). (2.2-9)
dt
Для массы растворённого вещества:
d
{Cout (t )V (t )} = C1F1(t ) + C2F2 (t ) − Cout (t )F (t ). (2.2-10)
dt
Мгновенный расход выходного потока при естественном истечении за-
висит от уровня жидкости в баке h(t ) следующим образом:

F (t ) = k h(t ) , (2.2-11)
где k - некоторая константа. Это следует из уравнения Бернулли, кото-
рое описывает энергетический баланс жидкости перед сливным отвер-
стием и после него. Потенциальная энергия жидкости перед сливным
отверстием пропорциональна h . При истечении из бака энергия жидко-
сти превращается в кинетическую энергию потока, пропорциональную
квадрату скорости υ . Приравнивая эти энергии, получаем υ = kυ h .
2

Расход F пропорционален произведению скорости истечения на пло-


щадь сливного отверстия, откуда и следует (2.2-11).
Если бак имеет постоянную по высоте площадь поперечного сече-
ния S , то
V (t )
F (t ) = k . (2.2-12)
S
Тогда из (2.2-9) и (2.2-10) получаем:

25
dV (t ) V (t )
= F1(t ) + F2 (t ) − k ,
dt S

d V (t )
{C(t )V (t )} = C1F1(t ) + C2F2 (t ) − Cout (t )k .
dt S
Выберем в качестве базового режима установившееся состояние (ста-
тику), когда все величины являются постоянными - F10 , F20 , F0 ,C0 ,V0 . При
этом из предыдущих уравнений получаем
0 = F10 + F20 − F0 ,

0 = C1F10 + C2F20 − C0F0 .

V0
F0 = k .
S
При известных F10 и F20 эти уравнения могут быть разрешены относи-
тельно F0 ,V0 и C0 :

F02 C F + C2 F20
F0 = F10 + F20 ; V0 = S 2 ; C0 = 1 10 .
K F0
Предположим теперь, что возникли отклонения от установившего-
ся состояния
F1(t ) = F10 + ΔF1(t ) ,

F2 (t ) = F20 + ΔF2 (t )
и, как следствие,
F (t ) = F0 + ΔF (t ),
V (t ) = V0 + ΔV (t ) ;
Cout (t ) = C0 + ΔC(t ) .
Если эти отклонения невелики, то можно провести линеаризацию нели-
нейных дифференциальных уравнений объекта.
Сначала линеаризуем уравнение для полной массы
d V + ΔV (t )
{V0 (t ) + ΔV (t )} = F10 + ΔF1(t ) + F20 + ΔF2 (t ) − k 0 .
dt S
Используем разложение нелинейной функции в ряд Тейлора и учтём,
что:

26
d
dV
V |V =V0
⋅ΔV0 =
1 1
2 V0
ΔV .

Тогда
V k ΔV (t )
ΔV& (t ) = F10 + ΔF1(t ) + F20 + ΔF2 (t ) − k 0 − ⋅ + R(t ).
S S 2 V0
Учитывая уравнение статики, и пренебрегая остаточным членом, полу-
чим:
k
ΔV& (t ) = ΔF1(t ) + ΔF2 (t ) − ⋅ ΔV (t ). (2.2-13)
2 SV0
V0
Введём параметр Θ = , называемый временем заполнения ба-
F0
ка. Тогда, учитывая (2.2-12), получим
k 1
= . (2.2-14)
2 SV0 2Θ
Кроме того, отметим, что
k ΔV ΔV
= = ΔF . (2.2-15)
2 SV0 2Θ
Таким образом, вместо (2.2-13) запишем
1
ΔV& (t ) = ΔF1 (t ) + ΔF2 (t ) − ⋅ ΔV (t ). (2.2-16)

Проведем аналогичные действия для уравнения баланса масс
растворённого вещества.

d
{ [C0 + ΔC(t )] [V0 + ΔV (t )] } =
dt
V0 + ΔV (t )
= C1 [F10 + ΔF1 (t )] + C2 [F20 + ΔF2 (t )] − [C0 + ΔC(t )]k .
S
После разложения в ряд Тейлора получим
V0C& (t ) + C 0V& (t ) = C1F10 + C1ΔF1 (t ) + C 2 F20 + C 2 ΔF2 (t ) −

V0 V C0 k
− C0 k − k 0 ΔC (t ) − ΔV (t ) − R(t ).
S S 2 V0 S

27
Учтём уравнения статики и отбросим остаточный член:
V0C& (t ) + C 0V& (t ) = C1ΔF1 (t ) + C 2 ΔF2 (t ) −

V0 k V0
−k ΔC(t ) − C 0 ΔV (t ).
S 2V0 S
Подставим в это уравнение V& (t ) из (2.2-16). Получим:
C
V0 ΔC& = C1ΔF1 (t ) + C2 ΔF2 (t ) − F0 ΔC(t ) − 0 ΔV (t ) −

C0
− C0 ΔF1 (t ) − C0 ΔF2 (t ) − ΔV (t ) .

Таким образом, в результате линеаризации мы получили систему
следующих дифференциальных уравнений, которые описывают процес-
сы в смесительном баке:
⎧ & 1
⎪ Δ V ( t ) = ΔF ( t ) + ΔF ( t ) − ΔV ( t )

1 2

⎨ (2.2-17)
⎪ΔC& (t ) = − 1 ΔC(t ) + C1 − C0 ΔF (t ) + C2 − C0 ΔF (t ) .
⎪⎩ Θ V0
1
V0
2

На этом завершён для данного примера первый этап разработки -


составлено математическое описание объекта и в результате линеари-
зации получена его линейная модель. Далее это описание нужно пред-
ставить в удобной форме - в виде векторно-матричных дифференци-
альных уравнений и в виде структурной схемы.
Представим математическое описание объекта в виде векторно-
матричных дифференциальных уравнений. Введем обозначения:
⎡ ΔF ⎤
r ⎡ΔV (t )⎤ r Δ
⎡ 1 ⎤ r
F ( t )
x (t ) = ⎢ ⎥ ; u ( t ) = ⎢ ⎥ ; y (t ) = ⎢ ΔC ⎥ .
⎣ ΔC(t )⎦ ⎣ΔF2 (t )⎦ ⎢ ⎥
⎣⎢ΔV ⎦⎥
Теперь систему уравнений (2.2-17) можно записать в векторно-
матричном виде:
r r r
x& (t ) = Ax (t ) + Bu(t )
r r
y (t ) = Cx (t ),
где:

28
⎡ 1 0⎤
⎡− 1 0 ⎤⎥ ⎢ 2Θ ⎥
⎢ ⎡ 1 1 ⎤
A = ⎢ 2Θ ; B = ⎢C1 − C0 C 2 − C0 ⎥ ; C = ⎢ 0 1⎥ .
1⎥ ⎢ ⎥
⎢ 0 − ⎥ ⎣⎢ V0 V0 ⎦⎥ ⎢ 1 0 ⎥
⎣ Θ⎦
⎣ ⎦

Структурная схема объекта представлена на рис.2 6


ΔF1 ΔV

1

ΔF

C1 − C0 1
V0 Θ
C0 − C 2
V0 ∫
ΔF2 ΔC
Рис. 2.6. Структурная схема смесительного бака как
объекта управления

На основании полученных дифференциальных уравнений и струк-


турной схемы можно провести предварительный анализ свойств объекта
и сделать следующие выводы.
1. Изменение любой из входных переменных ΔF1 и ΔF2 приводит к од-
новременному изменению всех выходных переменных ΔV , ΔF и ΔC .
Это особенно наглядно следует из наличия перекрёстных связей на
структурной схеме объекта.
2. При ступенчатом изменении любой из входных переменных каждая из
выходных переменных изменяется по экспоненциальному закону, при-
чём темп изменения концентрации ΔC вдвое медленнее темпа изме-
нения объёма ΔV .
Предметом отдельного рассмотрения при проектировании системы
управления (СУ) должен стать анализ диапазонов изменения перемен-
ных объекта, в которых сохраняется адекватность линейной модели.
Прежде, чем закончить рассмотрение данного примера, имеет
смысл продемонстрировать некоторые последующие действия разра-
ботчика в части синтеза алгоритмов управления. Перед разработчиком
29
среди прочих встанут следующие две задачи. Одна из них - обеспечение
заданных требований по длительности и качеству процессов в системе,
то есть её динамических свойств. Рассмотрению соответствующих во-
просов посвящён третий раздел настоящего пособия.
Вторая задача - обеспечение возможности независимого управле-
ния объёмом и концентрацией. Введём понятие командных сигналов по
требуемым концентрации - Δrc и объёму - Δrv . В статике производные

всех переменных должны быть равны нулю, и как следует из структур-


ной схемы и дифференциальных уравнений объекта, должны выпол-
няться равенства:
1
ΔF1 + ΔF2 − ⋅ ΔVуст = 0 ;

1 C − C0 C − C2
− ΔC уст + 1 ΔF1 − 0 ΔF2 = 0 .
Θ V0 V0
V
Отсюда, с учётом равенства Θ = 0 , получаем
F0
ΔVуст = 2Θ( ΔF1 + ΔF2 ) ; (2.2-18)

C1 − C0 C − C2
ΔCуст = ΔF1 − 0 ΔF2 . (2.2-19)
F0 F0
Для компенсации перекрёстных связей в объекте введём перекрё-
стные связи в регуляторе:
ΔF1 = aVF 1ΔrV + aCF 1ΔrC ;

ΔF2 = aVF 2 ΔrV + aCF 2 ΔrC .


Подставим эти выражения в (2.2-18) и (2.2-19):
ΔVуст = 2Θ((aVF 1 + aVF 2 )ΔrV + (aCF 1 + aCF 2 )ΔrC ) ; (2.2-20)

C1 − C0 C − C2
ΔC уст = ( aVF 1 − 0 aVF 2 )ΔrV +
F0 F0

C1 − C0 C − C2
+( aCF 1 − 0 aCF 2 )ΔrC .
F0 F0 (2.2-21)
Для того, чтобы установившееся значение объёма жидкости в баке
ΔVуст определялось только командным сигналом ΔrV и не зависело от
ΔrC , а выходная концентрация ΔCуст определялась только командным

30
сигналом ΔrC и не зависела от, ΔrV , в равенстве (2.2-20) приравняем к
нулю коэффициент при ΔrC , а коэффициент при ΔrV приравняем к еди-
нице. В равенстве (2.2-21) приравняем к нулю коэффициент при ΔrV , а
коэффициент при ΔrC приравняем к единице. В результате решения
получившейся системы уравнений получим:
1 C0 − C2 1 C1 − C 0
aVF 1 = ; aVF 2 = ;
2Θ C1 − C 2 2Θ C1 − C 2
(2.2-22)
F0 F0
aCF 1 = ; aCF 2 = − .
C1 − C 2 C1 − C 2
. В итоге получаем представленную на рис.2.7 структурную схему
системы управления смесительным баком, в которой обеспечена раз-
вязка каналов. Последнее означает, что командный сигнал ΔrV влияет
только на изменение объёма жидкости в баке, а командный сигнал ΔrC -
только на изменение концентрации. Объём жидкости в баке связан с
расходом выходного потока ΔF коэффициентом пропорциональности
2Θ , поэтому регулирование первого можно рассматривать как регули-
рование второго.
ΔrV 1 C0 − C2 ΔF1 ΔV
2Θ C1 − C 2

1 C1 − C 0
2Θ C1 − C 2
ΔF
ОБЪЕКТ
F0
C1 − C2

F0
ΔrC C1 − C2
ΔF2 ΔC

Рис. 2.7 Система управления смесительным баком


с развязанными каналами.

31
2.3. Линейные системы, заданные обыкновенными диф-
ференциальными уравнениями в нормальной форме
Коши
2.3.1. Однородные дифференциальные уравнения

Рассмотрим, прежде всего, решение однородного векторно-матричного


дифференциального уравнения:
r r
x& (t ) = A(t )x (t ) , (2.3-1)
r
где каждому начальному условию x(t 0 ) соответствует одно и только од-
но решение дифференциального уравнения. Будем полагать, что мат-
рица A(t ) непрерывна на промежутке t ∈ [0, ∞] . Множество всех реше-
ний образует n-мерное векторное пространство. Среди множества ре-
шений всегда может быть выбрано n линейно независимых.
Это может быть сделано следующим образом. Зададим начальные ус-
r
ловия x i (t ) , где i = 1, 2,K, n , совпадающие с базисными векторами
r r r
ei пространства R n , то есть x i (t 0 ) = ei . Из свойства единственности
решений дифференциальных уравнений (через любую точку простран-
ства состояний проходит одна и только одна траектория) следует ли-
нейная независимость решений с указанными начальными условиями.
Матрица X (t )[n×n ] , столбцами которой являются n линейно независимых
решений системы (2.3-1), называется фундаментальной матрицей этой
системы дифференциальных уравнений.
Поскольку каждый столбец фундаментальной матрицы является реше-
нием системы (2.3-1), то фундаментальная матрица удовлетворяет
уравнению:
X& (t ) = A(t ) ⋅ X (t ) , при начальных условиях X 0 = X (t 0 ) . (2.3-2)
По определению в любой момент времени столбцы этой матрицы ли-
нейно независимы, значит ее определитель (определитель Вронского)
не равен нулю. на промежутке t ∈ [0, ∞] . Так как определитель матрицы
X не равен нулю, то существует обратная матрица X −1(t ) .
Матрица
Φ(t , t 0 ) = X (t ) ⋅ X −1(t 0 ) (2.3-3)
называется переходной матрицей уравнения (2.3-1) или переходной
матрицей, соответствующей матрице A(t ) . Переходная матрица явля-
ется определяющей при анализе и решении дифференциальных урав-
нений и собственно в теории управления. Поэтому ниже приводятся ос-

32
новные её свойства, в основном, непосредственно вытекающие из оп-
ределения этой матрицы.
1) Переходная матрица при совпадающих значениях первого и вто-
рого аргумента становится единичной матрицей:
Φ(t , t 0 ) t =t0 = Φ(t 0 , t 0 ) = X (t 0 ) ⋅ X −1 (t 0 ) = E .
2) При любых значениях аргументов t 1, t 2 переходная матрица
Φ(t1, t 2 ) не вырождена и её определитель не равен нулю:
Ф( t 1 , t 2 ) ≠ 0 .
3) Обращение матрицы Φ(t , t 0 ) эквивалентно изменению порядка
аргументов исходной матрицы:
Φ −1(t , t 0 ) = [X (t ) ⋅ X −1 (t 0 )] = X (t 0 ) ⋅ X −1 (t ) = Φ(t 0 , t ) .
−1

4) Если в качестве фундаментальной матрицы начальных условий


принять единичную матрицу, X (t 0 ) = E то при всех прочих t пере-
ходная матрица будет совпадать с фундаментальной матрицей.
Ф(t , t 0 ) = X (t ) . Но X (t ) – это решение матричного дифференци-
ального уравнения (2.3-2). Поэтому переходная матрица может
быть определена как решение матричного дифференциального
уравнения:
Ф& (t , t 0 ) = A(t ) ⋅ Ф(t, t 0 ), Φ( t 0 , t 0 ) = E . (2.3-4)
5) Переходная матрица определяет решение однородного векторно-
матричного дифференциального
r уравнения
r (2.3-1), удовлетво-
ряющее начальному условию x (t ) t =t = x (t 0 ) :
0
r r
x (t ) = Ф ( t , t 0 ) ⋅ x ( t 0 ) . (2.3-5)
Это действительно так, ибо, во-первых, при t = t 0
r r
Ф( t 0 , t 0 ) ⋅ x ( t 0 ) = x ( t 0 ) ,
во-вторых, с учетом свойства (4):
d r r r r
{Ф(t, t 0 )x (t 0 )} = Ф& (t, t 0 )x (t 0 ) = A(t )Ф(t , t 0 )x(t 0 ) = A(t )x (t ) .
dt
6) Из предыдущего свойства следует один из способов определения
переходной матрицы. Обозначим через ϕ i , j (t , t 0 ) элемент i-ой
строки и j-ого столбца переходной матрицы и запишем равенство
(2.3-5) в развернутом виде:

33
⎡ x1 (t ) ⎤ ⎡ϕ 11 (t , t 0 ) ϕ 12 (t, t 0 ) ... ϕ 1 j (t , t 0 ) ... ϕ 1n (t , t 0 ) ⎤ ⎡ x1 (t 0 ) ⎤
⎢ x (t )⎥ ⎢ϕ (t , t ) ϕ 22 (t , t 0 ) ... ϕ 2 j (t, t 0 ) ... ϕ 2 n (t, t 0 )⎥⎥ ⎢ x 2 (t 0 )⎥
⎢ 2 ⎥ ⎢ 21 0 ⎢ ⎥
⎢ ... ⎥ ⎢ ... ... ... ... ... ... ⎥ ⎢ ... ⎥
⎢ ⎥ = ⎢ϕ ( t , t ) ϕ i 2 (t , t 0 ) ... ϕ ij (t , t 0 )
⎥⋅
... ϕ in (t , t 0 ) ⎥ ⎢⎢ x j (t 0 )⎥⎥
,
x ( t )
⎢ i ⎥ ⎢ i1 0
⎢ ... ⎥ ⎢ ... ... ... ... ... ... ⎥ ⎢ ... ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣ x n (t )⎦ ⎢⎣ϕ n1 (t , t 0 ) ϕ n 2 (t , t 0 ) ... ϕ nj (t , t 0 ) ... ϕ nn (t, t 0 )⎥⎦ ⎣ x n (t 0 )⎦

откуда следует выражение для i-й координаты вектора состояния:

x i (t ) = ϕ i ,1(t, t 0 )x1(t 0 ) + K + ϕ i , j (t , t 0 )x j (t 0 ) + K + ϕ i ,n (t , t 0 )x n (t 0 ).
Если положить начальные условия по всем координатам вектора
стояния, кроме j-й, нулевыми, а по j-й - единичными, то есть
x k (t 0 ) = 0 , при k = 1, 2,K, n k ≠ j и x j = 1, (2.3-6)

то элемент i-й строки и j-го столбца матрицы Φ(t , t 0 ) можно опреде-


лить как процесс по i-й координате вектора состояния
ϕ i , j (t , t 0 ) = x i (t ). (2.3-7)
7) К переходной функции применимо правило композиции:
Φ(t 2 , t 0 ) = Φ(t 2 , t1 ) ⋅ Φ(t1, t 0 ). (2.3-8)
Действительно, решение уравнения (2.3-1) в момент t1 при началь-
r
ных условиях x (t 0 ) имеет вид:
r r
x (t1 ) = Ф(t1, t 0 )x (t 0 ).
Если теперь этот результат принять за новые начальные условия,
то к моменту времени t 2 будем иметь:
r r r
x(t 2 ) = Ф(t 2 , t1 )x(t1 ) = Ф(t 2 , t1 ) ⋅ Ф(t1, t 0 )x(t 0 ).
8) Переходная матрица может быть вычислена с помощью ряда Пеа-
но, или матрицианта матрицы A :
Φ(t , t 0 ) = M ( A) = E + Q( A) + Q( A ⋅ Q( A)) + Q( A ⋅ Q( A ⋅ Q( A))) + K,
где
t

Q( A) = ∫ A(τ )dτ .
t0

Для того, чтобы получить этот результат, проинтегрируем диффе-


ренциальное уравнение (2.3-1):
34
r r t
r
x(t ) = x(t 0 ) + ∫ A(τ 1 )x (τ 1 )dτ 1 .
t0

Теперь повторим эту процедуру многократно, учитывая что:


τ1
r r r
x (τ 1 ) = x(t 0 ) + ∫ A(τ 2 )x (τ 2 )dτ 2 .
t0

Тогда получим:
τ1
r r t
r t
r
x (t ) = x (t 0 ) + ∫ A(τ 1 )dτ 1x (t 0 ) + ∫ A(τ 1 ) ∫ A(τ 2 )dτ 2dτ 1x (t 0 ) +
t0 t0 t0

τ1 τ2
t
r
+ ∫ A(τ 1 ) ∫ A(τ 2 ) ∫ A(τ 3 )d (τ 3 )d (τ 2 )d (τ 1 )x (t 0 ) + ... =
t0 t0 t0

τ1
t t
r
= {E + ∫ A(τ 1 )dτ 1 + ∫ A(τ 1 ) ∫ A(τ 2 )dτ 2dτ 1 + ...} x (t 0 )
t0 t0 t0

Если объект – стационарный и матрица А состоит из постоянных и неза-


висящих от времени элементов, то матрициант матрицы А (или ряд
Пеано) превращается в выражение для матричной экспоненты:
A 2 (t − t 0 ) 2 A 3 (t − t 0 )3
Ф(t , t 0 ) = E + A(t − t 0 ) + + + ... =
2! 3! (2.3-9)
= exp( A(t − t 0 )) = e A( t −t0 ) .

Очевидно, что в стационарном случае переходная матрица является


уже функцией только одного аргумента, равного разности начального и
текущего (конечного) времени:

Φ(t , t 0 ) = Φ(t − t 0 ) = e AΔt . (2.3-10)


Переходная матрица для стационарного объекта обладает рядом до-
полнительных замечательных свойств, трансформирующихся из соот-
ветствующих свойств переходной матрицы для нестационарного объек-
та :
из 1) - Ф(0) = E ; (2.3-11)

из 3) - Ф ( Δt ) = Ф( − Δt ) = e
−1 − A⋅Δt
; (2.3-12)

dФ(t − t 0 ) 2 A 2 (t − t 0 ) 3 A 3 ( t − t 0 ) 2
из 4) - =0+A+ + + ... =
dt 2! 3!
= A ⋅Ф(t − t 0 ) = A ⋅ e A( t −t0 ) = e A( t −t0 ) ⋅ A ; (2.3-13)

35
из 5) - решение однородного дифференциального уравнения имеет
вид:
r r
x ( t ) = e A ( t −t 0 ) ⋅ x ( t 0 ) ; (2.3-14)

из 7) - Ф( k ⋅ Δt ) = Ф ⋅ ( Δt ) .
k
(2.3-15)

2.3.2. Решение неоднородных векторно-матричных дифференци-


альных уравнений
Ранее были получены выражения для определения решений одно-
родного дифференциального уравнения нестационарной:
r r
x (t ) = Ф ( t , t 0 ) ⋅ x ( t 0 ) (2.3-5)
и стационарной
r r
x (t ) = e A ( t − t 0 ) ⋅ x (t 0 ) (2.3-14)
систем. Используем эти результаты для определения решения неодно-
родного линейного векторно-матричного уравнения, соответствующего
(2.2-7):
r r r
x& = A(t ) ⋅ x(t ) + B(t ) ⋅ u (t ) . (2.3-16)
Произведем замену:
r r
x ( t ) = Ф( t , t 0 ) ⋅ z ( t ) (2.3-17)
и продифференцируем это выражение:
r r r
x& (t ) = Ф& (t , t 0 ) ⋅ z(t ) + Ф(t, t 0 ) ⋅ z& (t ) =
r r
= A(t ) ⋅ Ф(t , t 0 ) ⋅ z(t ) + Ф(t , t 0 ) ⋅ z& (t ) .
Сопоставляя это выражение с предыдущим, получим
r r
Ф(t , t 0 ) ⋅ z& (t ) = B(t ) ⋅ u (t ) ,
откуда
r r
z& (t ) = Ф(t 0 , t ) ⋅ B(t ) ⋅ u (t ) ,
или, интегрируя,
r r t
r
z(t ) = z(t 0 ) + ∫ Ф(t 0 ,τ )B(τ ) ⋅ u(τ )dτ .
t0

Из (2.3-17) видно, что


r r
z (t 0 ) = x (t 0 ) .

36
В итоге получаем выражение для решения векторно-матричного линей-
ного неоднородного дифференциального уравнения, известное под на-
званием формулы Коши
r r t
r
x(t ) = Ф(t , t 0 ) ⋅ x(t 0 ) + ∫ Ф(t ,τ )B(τ )u(τ )dτ . (2.3-18)
t0

2.4. Некоторые сведения из теории матриц


2.4.1. Собственные числа, характеристический полином, присоеди-
ненная матрица
r
Умножениеr квадратной матрицы A на некоторый вектор x дает новый
вектор z , который, в общем случае, иначе ориентирован в пространстве
и имеет другую длину по сравнению с исходным вектором. Однако, су-
ществуют и такие векторы, которые при выполнении этой операции ме-
няют только свою длину, но не меняют направления, то есть
r r
Av = λv , (2.4-1)
где λ - это вещественная или комплексная скалярная величина, назы-
ваемая собственным
r значением (характеристическим числом) матрицы
A , а вектор v называется собственным вектором этой матрицы. В раз-
вёрнутом виде уравнение (2.4-1) имеет следующий вид:
⎧ a11v 1 + a12v 1 + K + a1n v n = λv 1
⎪a v + a v + K + a v = λv
⎪ 21 1 22 1 2n n 2
⎨ .
⎪ K K K K K K K K K K K K K
⎪⎩an1v 1 + an 2v 1 + K + ann v n = λv n
Очевидно, что для существования ненулевых v i необходимо выполне-
ние условия:
det( λE − A) ≡ λE − A = 0 . (2.4-2)
Это уравнение называют характеристическим, или вековым уравнением
матрицы A . Левая часть этого уравнения называется характеристичес-
ким полиномом, которая является степенным полиномом от λ, и степень
его равна размеру n матрицы A .
ϕ A (λ ) =| λE − A |= λn + α 1λn −1 + α 2 λn − 2 + K + α n −1λ1 + α n . (2.4-3)
Таким образом, каждая квадратная матрица A имеет n собственных
значений λ1, λ2, K , λn, , которые могут быть определены путём решения

37
характеристического уравнения с использованием стандартного матема-
тического обеспечения на цифровых вычислительных машинах.

Алгебраическая кратность корня λ – это его кратность как корня харак-


теристического уравнения.
Геометрическая кратность корня λ – это количество линейно независи-
мых решений
r уравнения (2.4-2), или количество линейно независимых
векторов v , связанных с данным λ .
Если λ не является собственным значением матрицы A , то существует
матрица ( λE − A) . По правилу определения обратных матриц
−1

I (λ )
(λE − A)−1 = , (2.4-4)
λE − A
где I ( λ ) называется присоединённой матрицей для матрицы A . Ее
элементы определяются как алгебраические дополнения элементов
матрицы ( λE − A) . Здесь символ Т означает транспонирование. При-
T

соединённая матрица - это матричный полином степени n-1:


I (λ ) = Eλn −1 + I1λn −2 + K + I n − 2 λ + I n −1 , (2.4-5)
где E – единичная матрица [n × n ].
Если все собственные числа матрицы A различны, то собственные век-
торы матрицы A могут быть выбраны пропорциональными любым не-
нулевым столбцам матрицы I ( λi ) , i = 1, 2 , ... , n .

ПРИМЕР 2.4-1. Пусть объект задан структурной схемой, приведённой на


рис.2.8.

u x3 x2 x1

2 3

Рис.2.8. Структурная схема к примеру 2.4-1


Ему соответствует система уравнений
x&1 = −3 x1 + x 2 ;

x& 2 = −2 x 2 + x 3 ;

x& 3 = − x 3 + u ,
или в матричном виде

38
r r
x& (t ) = Ax (t ) + Bu (t ) ,
где
⎡− 3 1 0⎤ ⎡0⎤
A = ⎢ 0 − 2 1 ⎥ ; B = ⎢0⎥ .
⎢ ⎥ ⎢ ⎥
⎢⎣ 0 0 − 1⎥⎦ ⎢⎣ 1⎥⎦
Для этих исходных данных получаем характеристический полином
λ +3 −1 0
P (λ ) = 0 λ +2 − 1 = λ3 + 6λ2 + 11λ + 6 .
0 0 λ +1
Ему соответствуют собственные числа
λ1 = −1, λ2 = −2, λ3 = −3.
Найдем присоединенную матрицу
⎡(λ + 2)(λ + 1) λ +1 1 ⎤
I (λ ) = ⎢ 0 (λ + 3)(λ + 1) λ +3 ⎥=
⎢ ⎥
⎢⎣ 0 0 (λ + 3)(λ + 2)⎥⎦

⎡3 1 0⎤ ⎡2 1 1⎤
⎢ ⎥ ⎢
= E3 λ + 0 4 1 λ + 0 3 3 .
2 ⎥
⎢ ⎥ ⎢ ⎥
⎢⎣0 0 5⎥⎦ ⎢⎣0 0 6⎥⎦
Найдём собственные векторы матрицы A :
⎡0 0 1⎤ ⎡0 − 1 1⎤ ⎡2 − 2 1⎤
I (λ1 ) = ⎢0 0 2⎥; I (λ2 ) = ⎢0 − 1 1⎥; I (λ3 ) = ⎢0 0 0⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢⎣0 0 2⎥⎦ ⎢⎣0 0 0⎥⎦ ⎢⎣0 0 0⎥⎦
и можно выбрать
⎡1⎤ ⎡ 1⎤ ⎡ 1⎤
r ⎢ ⎥ r ⎢ ⎥ r ⎢ ⎥
v1 = 2 ; v 2 = 1 ; v 3 = 0 .
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣⎢2⎦⎥ ⎢⎣0⎥⎦ ⎣⎢0⎥⎦
Полученный результат нетрудно проверить прямой подстановкой в (2.4-
1).
Имеется ряд алгоритмов для определения коэффициентов характери-
стического полинома и присоединенной матрицы. Один из наиболее

39
употребимых - это алгоритм Фаддеева - Леверье. Он состоит в сле-
дующей последовательности вычислений:
A1=A; α1=− SpA1 ; I1=A1+α1E;

1
A2=AI1; α 2 = − SpA2 ; I2=A2+α2 E;
2
..........................................

1
An-1=AIn-2; α n −1 = − SpAn −1 ; In-1=An-1+αν−1 E;
n −1
1
An=AIn-1; α n = − SpAn ; In=An+α n E=0;
n
Здесь через SpA обозначен след матрицы A , то есть сумма ее диаго-
нальных элементов:
n
SpA = ∑ aii .
i =1

Последнее равенство процедуры используется для контроля точности


вычислений.
Для объекта, приведенного в примере 2.4-1,
⎡− 9 1 1⎤ ⎡− 6 0 0 ⎤
A2 = ⎢ 0 − 8 3 ⎥; A3 = ⎢ 0 −6 0 ⎥.
⎢ ⎥ ⎢ ⎥
⎢⎣ 0 0 − 5⎦ ⎥ ⎢⎣ 0 0 − 6⎥⎦
Если матрица A не вырожденна, то из промежуточных результатов ал-
горитма Фаддеева - Леверье, учитывая, что
An = −α n E,
получаем
1
A −1 = − I n −1 . (2.4-6)
αn
Для рассматриваемого примера
⎡2 1 1⎤
1
A −1 = − ⎢0 3 3⎥ .
6⎢ ⎥
⎢⎣0 0 6⎥⎦

40
В вырожденном случае α n = 0 . Иллюстрацией этого может служить
объект, структурная схема которого приведена на рис.2.9.
u x3 x2 x1

Рис.2.9. Структурная схема. Вариант с α n = 0

2.4.2. Собственные значения и собственные векторы транспониро-


ванной матрицы
Собственные значения транспонированной матрицы, это такие λ , для
которых система уравнений
r r
A d = λd
T
(2.4-7)
имеет нетривиальные решения, т.е. когда
λE − AT = 0 . (2.4-8)

Решение этого алгебраического уравнения дает n значений собст-


венных чисел λ1 , λ2 , ... , λn . Так как определитель квадратной матрицы
и её транспонированной матрицы равны, то собственные числа матриц
A и AT также равны.
Таким образом, собственному числу λi соответствует собственный век-
r r
тор v iматрицы A и собственный вектор d i матрицы A .
T

Если транспонировать обе части уравнения (2.4-7), то получим:


rT rT
d A = λd . (2.4-9)
r
В связи с этим векторr d называют левым собственным вектором матри-
цы A , в отличие от v , который, в таком случае, называют правым соб-
ственным вектором. Для i -го собственного числа и i -го левого собст-
венного вектора соответственно
r r
d iT A = λi d iT .
r
Умножим обе части этого равенства справа на вектор v j :
rT r rT r
d i Av j = λi d i v j . (2.4-10)
Учитывая свойства собственных векторов, в результате получаем урав-
нение

41
rT r rT r
d i λ j v j = λi d i v j ,
которое преобразуется к виду
rT r
d i v j (λ j − λi ) = 0 . (2.4-11)
Полагаем, что все собственные числа матрицы A различны. Тогдаrдля
i ≠ j имеем λi ≠ λ j и из равенства (2.4-11) следует, что векторы d iT и
r
v j взаимно ортогональны:
r r
d iT v j = 0 , i ≠ j . (2.4-12)
r
Это означает то, что d i ортогонален ( n − 1) - мерной гиперплоскости, с
r
базисом, образованным векторами v j для всех j ≠ i .
В качестве примера на рисунке 2.10 показан один из вариантов взаим-
ного расположения правых и левых собственных векторов некоторой
r A для случая n = 3 . Здесь хорошо видно, что каждый из век-
матрицы
r
торов d i ортогонален всем векторам v i при j ≠ i .
r
d2
r
r v2
d1
r
v1

r
d3 r
v3
Рис. 2.10. Пример взаимного расположения правых и
левых собственных векторов

Теперь рассмотрим случай, когда i = j . При этом скалярные произведе-


r r
ния векторов di и v i не должны быть равны нулю. Если предположить,
rT r r
что d i v i = 0 , то придется утверждать, что вектор d i ортогонален всему
r r r
n – мерному пространству с базисом v 1,v 2 , K ,v n . Но этого не может
r
быть, так как вектор di сам принадлежит этому пространству. Таким об-
разом,
rT r
d i v i ≠ 0 для i = 1, 2 , ... , n . (2.4-13)

42
В связи с тем, что собственные векторы можно выбирать с точностью до
постоянного (в том числе комплексного) сомножителя, то наборы, иначе
{}
r r
говоря, базисы {v } и d формируют так, чтобы для i = 1, 2 , ... , n вы-
полнялось условие
r r
d iT v i = 1 для i = 1, 2 , ... , n . (2.4-14)
Отметим ещё одно важное свойство собственных векторов:
Если матрица A не имеет кратных собственных чисел, то все её
собственные векторы линейно независимы, то есть образуют базис
в пространстве R . Это нетрудно доказать.
n

Действительно, предположим сначала, что среди собственных векторов


матрицы A первые два являются линейно зависимыми, то есть
2 r
∑γ v = 0,
i =1
i i (2.4-15)

где ни один из коэффициентов γ 1 и γ 2 не равен нулю. Умножив это


уравнение слева на A , получим
2 r
∑γ λ v = 0.
i =1
i i i (2.4-16)

Теперь умножим (2.4-15) на λ2 :


2 r
∑γ λ v = 0 .
i =1
i 2 i (2.4-17)

Вычтем (2.4-17) из (2.4-16) и в результате получим


r
γ 1(λ1 − λ2 )v 1 = 0 .
r
Из того, что λ1 ≠ λ2 и γ 1 ≠ 0 следует v 1 = 0 , чего не может быть, следо-
вательно, первые два собственных вектора не могут быть линейно зави-
симыми.
Теперь предположим, что число линейно зависимых векторов рав-
но r > 2 , то есть
r r
∑ γ v = 0 , γ ≠ 0 : i = 1, 2, ..., r .
i =1
i i i

Умножив это уравнение слева на A , получим


r r
∑γ λ v = 0.
i =1
i i i (2.4-18)

Умножим (2.4-18) на λr :
r r
∑γ λ v = 0 .
i =1
i r i (2.4-19)

43
Вычтем (2.4-19) из (2.4-18) и в результате будем иметь
r −1 r
∑ γ (λ − λ )v = 0 .
i =1
i i r i

Получается, что число линейно зависимых векторов r − 1 < r . Если со-


гласиться с этим, то дойдём до r = 2 , и круг замкнулся.
Таким образом, действительно, все собственные векторы матрицы A
являются
r r линейно
r независимыми, поэтому матрица
r
V = [v 1 , v 2 , ... , v n ], построенная из векторов базиса {v }, т.е. из правых
собственных векторов матрицы A , является невырожденной. Эта мат-
рица называется модальной матрицей. Из перечисленных выше свойств
для правых и левых собственных векторов следует равенство:
D TV = E , или DT = V −1 . (2.4-20)
DT - матрица, строки которой, являются транспонированными векторами
{}
r
двойственного базиса d , т.е. левыми собственными векторами матри-
цы A :
r
⎡d1T ⎤
⎢ rT ⎥
d
DT = ⎢ 2 ⎥ . (2.4-21)
⎢⋅ ⋅ ⋅⎥
⎢ rT ⎥
⎣⎢d n ⎦⎥

2.4.3. Определение функции от матрицы через её левые и правые


собственные векторы

Все n систем уравнений


r r
Av i = λi v i , i = 1,2,..., n
могут быть записаны с использованием блочных матриц:
r r r r r r
[ Av 1 Av 2 ... Av n ] = [λ1v 1 λ2v 2 ... λnv n ] .
Учтем, что
r r r
[ Av 1 Av 2 ... Av n ] = AV ,
и
r r r
[λ1v 1 λ2v 2 L λn v n ] =

44
⎡v 11 v 12 L v 1n ⎤ ⎡λ1 0 L 0⎤
⎢v v 22 L v 2 n ⎥ ⎢ 0 λ2 L 0⎥
= ⎢ 21 ⎥⋅⎢ ⎥ = VΛ ,
⎢L L L L ⎥ ⎢L L L L⎥
⎢v L v nn ⎥⎦ ⎢⎣ 0 0 L λn ⎥⎦
⎣ n1 v n 2
где Λ - диагональная матрица собственных чисел.
Таким образом, получено равенство
AV = VΛ ,
или
A = V ΛD T . (2.4-22)
Преобразование A = TCT , где T - произвольная невырожденная
−1

матрица, называется преобразованием подобия. Одно из основных


свойств этого преобразования заключается в том, что собственные чис-
ла подобных матриц (здесь - A и C ) совпадают. Действительно,
ϕ A (λ ) = λE − A = λTT −1 −TCT −1 = T λE − C T −1 = ϕ C (λ ) .
Говорят, что матрица A приводится к диагональному виду преобразо-
ванием
Λ = V −1 AV = DT AV . (2.4-23)
Более высокие степени A приводятся к диагональному виду таким же
способом:
Λ2 = V −1AVV −1 AV = V −1 A 2V
.....................................................
Λl = V −1A lV или A l = VΛlV −1 .
Таким образом, если рассмотреть матричный многочлен
N ( A) = A l + C1 A l −1 + K + C l −1 A + C l E,
то
N ( A) = V {Λl + C1Λl −1 + K + Cl −1Λ + C l E }V −1,
или
.

⎡N (λ1 ) 0 ⋅⋅⋅ 0 ⎤
⎢ 0 N ( λ2 ) ⋅⋅⋅ 0 ⎥ −1
N ( A) = V ⎢ ⎥V . (2.4-24)
⎢ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⎥
⎢ 0 0 ⋅ ⋅ ⋅ N (λl )⎥⎦

45
Если применить этот результат к характеристическому полиному, то по-
лучим
ϕ ( A) = 0, (2.4-25)
то есть каждая квадратная матрица удовлетворяет своему характе-
ристическому полиному. Это утверждение известно в теории матриц как
теорема Кэли-Гамильтона.
Для любой функции от матрицы f (A) , которую можно представить в ви-
де конечного или бесконечного степенного полинома, справедливо ана-
логичное выражение
⎡f (λ1 ) 0 K 0 ⎤
⎢ 0 f ( λ2 ) K 0 ⎥ T
f ( A) = V ⋅ ⎢ ⎥ ⋅D , (2.4-26)
⎢ M M M ⎥
⎢ ⎥
⎣ 0 0 K f (λn )⎦
или эквивалентное ему
n r rT
f ( A) = ∑ f (λi )v i d i . (2.4-27)
i =1

Отсюда вытекает, например, один из способов определения матричной


экспоненты или соответствующей переходной матрицы:
r rT n λ t
Φ( t ) = e = ∑ e v i d i .
At i
(2.4-28)
i =1

ПРИМЕР 2.4-2. Для объекта, представленного на рис.2.8. в примере 2.4-


1, найдём левые собственные векторы. Если обозначить присоединён-
ную матрицу к матрице A как I {A} , то очевидно равенство
I { A T } = I T { A} .
Поэтому
⎡λ + 3λ + 2 0 0 ⎤
2

I d ( λ ) = I { AT } = ⎢ λ + 1 λ2
+ 4λ + 3 0 ⎥.
⎢ ⎥
⎢⎣ 1 λ +3 λ + 5λ + 6⎥⎦
2

Учитывая, что
λ1 = −1; λ2 = −2; λ3 = −3 ,
имеем:

46
⎡0 0 0⎤ ⎡ 0 0 0⎤
I d (λ1 ) = ⎢0 0 0⎥ ; I d (λ2 ) = ⎢− 1 − 1 0⎥;
⎢ ⎥ ⎢ ⎥
⎢⎣1 2 2⎥⎦ ⎢⎣ 1 1 0⎥⎦

⎡ 2 0 0⎤
I d (λ3 ) = ⎢− 2 0 0⎥;
⎢ ⎥
⎢⎣ 1 0 0⎥⎦
Рассчитаем левые собственные векторы. Учтем при этом (2.4-14). Таким
r
образом, для первого собственного вектора d1 должны выполняться ус-
ловия
rT rT r
d 1 =ν 1 [0 0 1], d 1 v 1 = 2ν 1 = 1,
откуда
1 r
ν1 = и d 1T = [0 0 0.5].
2
Аналогично получим
⎡0⎤ ⎡ 1 ⎤
r ⎢ ⎥ r
d 2 = 1 ; d 3 = ⎢ − 1⎥ .
⎢ ⎥ ⎢ ⎥
⎢⎣− 1⎥⎦ ⎢⎣0.5⎥⎦
Теперь можно записать выражение для переходной матрицы. Из (2.4-28)
имеем
⎡0 0 0.5⎤ ⎡0 1 − 1⎤ ⎡1 − 1 0.5⎤
e At = ⎢0 0 1 ⎥e −t + ⎢0 1 − 1⎥e − 2t + ⎢0 0 0 ⎥e −3 t
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢⎣0 0 1 ⎥⎦ ⎢⎣0 0 0 ⎥⎦ ⎢⎣0 0 0 ⎥⎦
и окончательно
⎡e −3 t e −2t − e −3 t 0.5e − t − e −2t + 0.5e −3 t ⎤
⎢ ⎥
e At = ⎢ 0 e −2 t e −t − e − 2 t ⎥.
⎢⎣ 0 0 e −t ⎥⎦

Рассмотрим ещё несколько примеров.

Для

47
⎡− 3 1 0⎤
A = ⎢ 0 − 2 1 ⎥; λ1 = −1; λ2 = −2 ; λ3 = −3;
⎢ ⎥
⎢⎣ 0 0 − 1⎥⎦
имеем
⎡ 1⎤
⎢ 0 0 ⎡0 1 − 1⎤ ⎡1 − 1 0.5⎤
2⎥
A = j ⎢0 0 1 ⎥ + j 2 ⎢0 1 − 1⎥ + j 3 ⎢0 0 0 ⎥=
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ 0 0 1 ⎥ ⎢
⎣ 0 0 0 ⎥
⎦ ⎢
⎣0 0 0 ⎥⎦
⎢⎣ ⎥⎦
⎡ 1 3⎤
⎢ 3 2 − 3 − 2 + ⎥
⎢ 2 2 ⎥
= j⎢ 0 2 1 − 2 ⎥.
⎢0 0 1 ⎥
⎢ ⎥
⎣ ⎦
Проведём проверку:

⎡ 1 3⎤ ⎡ 1 3⎤
⎢ 3 2 − 3 − 2 + ⎥ ⎢ 3 2− 3 − 2+ ⎥
⎢ 2 2 ⎥ ⎢ 2 2 ⎥
j2⎢ 0 2 1− 2 ⎥ ⋅ ⎢ 0 2 1− 2 ⎥ =
⎢0 0 1 ⎥ ⎢0 0 1 ⎥
⎢ ⎥ ⎢ ⎥
⎣ ⎦ ⎣ ⎦
⎡− 3 1 0⎤
= ⎢ 0 − 2 1 ⎥.
⎢ ⎥
⎢⎣ 0 0 − 1⎥⎦

Для той же матрицы найдём A :


5

λ15 = −1, λ52 = −32 , λ53 = −243 и

48
⎡ 1⎤ ⎡ 1⎤
⎢0 0
2 ⎥ ⎡ 0 1 − 1⎤ ⎢1 − 1 2⎥
A 5 = − ⎢0 0 1 ⎥ − 32⎢0 1 − 1⎥ − 243 ⎢0 0 0⎥ =
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢0 0 1⎥ ⎢
⎣0 0 0 ⎦ ⎥ ⎢0 0 0⎥
⎢⎣ ⎥⎦ ⎢⎣ ⎥⎦
⎡− 243 211 − 90 ⎤
=⎢ 0 − 32 31 ⎥.
⎢ ⎥
⎢⎣ 0 0 − 1 ⎥⎦

2.5. Свойства движений линейных систем


2.5.1. Матричная весовая и переходная функции

Пусть заданы уравнения некоторого динамического объекта


r r r
x& (t ) = A(t )x + B(t )u(t ) ; (2.5-1)
r r
y (t ) = C (t ) x (t ) . (2.5-2)
В соответствии с формулой Коши выражение для вектора выхода
r r t
r
y (t ) = C(t )Φ(t, t 0 )x (t ) + ∫ C(t )Φ(t ,ξ )B(ξ )u(ξ )dξ . (2.5-3)
t0

Анализируя качество работы объекта, удобно рассматривать движение


r
y (t ) как сумму свободной составляющей, обусловленной, в основном,
свойствами самого объекта, и вынужденной составляющей, несущей от-
печаток входного сигнала - вектора управления. Строго говоря, это раз-
деление условно, но очевидно, что свободную составляющую целесо-
образно отождествить с первым слагаемым правой части равенства
(2.5-3). Отсюда следует вывод, что основные свойства объекта опреде-
ляются его переходной матрицей Φ(t ,t 0 ) , в то время как степень их
проявления зависит от вектора начальных условий.
Отметим, однако, что первопричиной всякого движения объекта являет-
ся вектор управления. Это означает, что даже при анализе собственных
движений объекта следует учитывать и матрицу управления B(t ) .
Обозначим
w y (t ,τ ) = C (t )Φ (t,τ )B (τ ) . (2.5-4)
Очевидно, что для i -й координаты вектора выхода при нулевых началь-
ных условиях справедливо выражение

49
t nu

y i (t ) = ∫ ∑ w ij (t ,ξ )u j (ξ )dξ .
t 0 j =1

Если положить
uk (ξ ) = δ (ξ − τ )
и u j (ξ ) = 0 при j ≠ k , то в соответствии со свойствами δ -функции по-
лучим
y i (t ) = w ik (t ,τ ) .
Таким образом, элемент, стоящий в i -ой строке и в k -м столбце
матрицы w y (t ,τ ) , можно интерпретировать как реакцию i -ой коорди-
r
наты вектора y (t ) на дельта-функцию δ (t − τ ) в k -ой координате
r
вектора управления u (t ) .
Матрица w y (t ,τ ) называется матричной весовой или матричной им-
пульсной переходной функцией объекта по вектору выхода. Аналогич-
ным образом определяется матричная весовая функция объекта по век-
тору состояния
w x (t ,τ ) = Φ (t ,τ )B (τ ) . (2.5-5)

u2
u1 k x1 10 x2
p 2p + 1

Рис. 2.11. К примеру на определение матричной


весовой функции

Интеграл от матричной весовой функции


t

H (t, t 0 ) = ∫ w (t ,τ )dτ (2.5-6)


t0

называют матричной переходной функцией объекта. Элементы этой


матрицы могут рассматриваться как реакции координат вектора выхода
(вектора состояния) на единичные функции по соответствующим коор-
динатам вектора управления. Если на вход объекта поступает постоян-
r
ный во времени вектор управления u0 × 1(t − t 0 ) , то при нулевых на-
чальных условиях
r r
y (t ) = H (t , t 0 )u 0 . (2.5-7)

50
В качестве примера на рис. 2.12 изображены элементы матричной
переходной функции по вектору состояния для системы, представлен-
ной на рис. 2.11.

Рис.2.12. Элементы матричной переходной функции


для системы, представленной на рис. 2.11

В стационарном случае рассмотренные матрицы являются функцией


одного аргумента:
w y (t, t 0 ) = w y (t − t 0 ) = w y (τ ) = Ce Aτ B = CΦ (τ )B (2.5-8)
и
t
H y (t ) = ∫ CΦ (t − τ )Bdτ . (2.5-9)
0

Это выражение для переходной функции можно упростить. Производя


замену аргумента
σ = t −τ ,
получим
0
H y (t ) = ∫ CΦ(σ )Bdσ
σ =t

и окончательно
t
H y (t ) = − ∫ CΦ (τ )Bdτ . (2.5-10)
0

Используя представление переходной матрицы через матричную экспо-


ненту, можно получить

51
⎧ t2 2 t
3
3 t
4

H y (t ) = C ⎨Et + A + A +A + K⎬B . (2.5-11)
⎩ 2 3! 4! ⎭
Один из наиболее употребимых способов вычисления Φ(t ) и H (t ) со-
стоит в определении (расчете) соответствующих окаймленных матрич-
ных рядов.

ПРИМЕР 2.5-1. Объект управления задан системой дифференциальных


уравнений, которым соответствует схема в переменных состояния, при-
веденная на рис. 2.13.

x2(0) x1(0)
u x2 x1 y
2

Рис.2.13. Структурная схема к примеру 2.5-1

Этой схеме соответствуют уравнения


⎧ x& 1 = x 2 ,
⎪&
⎨ x 2 = −2 x 2 + u,
⎪y = 2 x + x
⎩ 1 2.

Требуется найти переходную матрицу, матричные весовую и переход-


ную функции, реакцию объекта на постоянный входной сигнал.
Прежде всего, найдем переходную матрицу. Элемент первой строки и
первого столбца этой матрицы можно определить как реакцию коорди-
наты x1 на начальные условия x1 (0 ) = 1, x 2 (0 ) = 0 при u = 0 . Решение
первого дифференциального уравнения дает
ϕ11 (t ) = x1 (t ) = 1.
Аналогично
ϕ 22 (t ) = x 2 (t ) при x 2 (0 ) = 1, x1 (0 ) = u = 0 .
Решая при этих условиях второе дифференциальное уравнение, полу-
чим
ϕ 22 (t ) = e −2t .

52
Очевидно ϕ 21 (t ) = 0 , так как координата x 2 не зависит от x1 . Для того,
чтобы определить ϕ12 (t ) , следует взять интеграл
t
ϕ12 (t ) = ∫ e −2τ dτ = 0.5(1 − e −2t ).
0

Таким образом,
⎡1 0.5(1 − e −2t )⎤
Φ( t ) = ⎢ −2t ⎥.
⎣0 e ⎦
В соответствии с уравнениями объекта
⎡0 1 ⎤ ⎡0⎤
A=⎢ ⎥; B = ⎢ ⎥; C = [2 1],
⎣0 − 2⎦ ⎣1⎦
поэтому

w y (t ) = CΦ(t )B = 1
и
t
H y (t ) = ∫ CΦ (τ )Bdτ = t .
0

При нулевых начальных условиях и u = u 0 = const

y (t ) = u 0 ⋅ t .
Если начальные условия ненулевые, то
r
y (t ) = CΦ(t )x (0 ) + u 0 (t ) = 2 x 1 (0) + x 2 (0) + u 0 ⋅ t .
При этом
r r r t
x(t ) = Φ(t )x (0) + H x (t )u0 = Φ(t )x (0) + ∫ Φ(τ )Bdτ ⋅ u0 =
0

⎡1 1 ⎤
⎡ 1 ⎤ ⎢ t + (e −2t − 1)⎥
x (0) + (1 − e )x2 (0)⎥ 2
−2 t
4
=⎢ 1 2 +⎢ ⎥u0 .
1

⎣ e x2 (0)
−2 t ⎥
⎦ ⎢ (1 − e ) ⎥
−2 t

⎣ 2 ⎦
Видно, что в выходной координате участвуют не все составляющие дви-
жения, присутствующие в векторе состояния. Еще более характерная
ситуация возникнет, если изменить исходные данные. Если положить

53
⎧ x&1 = x 2
⎪&
⎨x2 = 2x2 + u ,
⎪y = −2 x + x
⎩ 1 2

то поведение выходной координаты принципиально не изменится


y (t ) = −2 x 1 (0) + x 2 (0) + u 0 ⋅ t ,
но процесс по координатам состояния будет неограниченно расти:
⎡ 1 1 2t 1 ⎤
r ⎢ x 1
(0 ) − (1 − e −2t
)x 2
(0 ) + (e − 1) − tu 0 ⎥
x (t ) = ⎢ 2 4 2
1 − 2t ⎥.
⎢ e x 2 (0) + (e − 1)u 0
2t

⎣ 2 ⎦
Такие случаи, когда вектор выхода не отражает характерные свойства
объекта, могущие привести к катастрофическим результатам, будут
подробно обсуждаться в последующих разделах.

2.5.2. Модальная (спектральная) интерпретация решения векторно-


матричных дифференциальных линейных стационарных
уравнений
Рассмотрим сначала движение автономной системы
r r r r
x& (t ) = Ax (t ), x (t ) = x 0 . (2.5-12)

Пусть все собственные числа матрицы A различны. Тогда ее собствен-


r
ные векторы v i , i = 1,2,..., n образуют базис в пространстве R , то есть
n

являются линейно независимыми. В соответствии с (2.3-5) и (2.4-28)


решение уравнения (2.5-12) можно записать в виде
r n rr r
x (t ) = ∑ e λi t v i d iT x (0) .
i =1

Обозначим скаляр
rT r
μ i = d i x (0 ) , (2.5-13)
тогда
r n r
x (t ) = ∑ μ i e λi t v i . (2.5-14)
i =1

Очевидно, что свободное движение вектора состояния объекта является


комбинацией движений по собственным векторам матрицы A . Такие
движения называют модами системы, а матрицу собственных векторов
V - модальной матрицей. Коэффициент μ i соответствует величине
возбуждения i - ой моды системы, обусловленной начальными условия-
54
ми. Иначе говоря, каждая мода возбуждается соответствующим выбо-
ром начального состояния.
Согласно (2.5-13),
⎡ x1(0) ⎤
⎢ x (0 )⎥
μ i = [d i 1 d i 2 ... d in ] ⎢ 2 ⎥ = d i 1x1(0) + d i 2 x 2 (0) + ... + d in x n (0) .
⎢ ... ⎥
⎢ ⎥
⎣ x n (0)⎦
r
Если вектор начальных условий x(0) совпадает по направлению с i - м
собственным вектором, то есть
r r
x (0 ) = α ⋅ v i ,
r r
то, учитывая, что согласно (2.4-13) и (2.4-14), d iT v j = 0 при i ≠ j и
rT r
d i v i = 1, получаем
rT r rT r
μ i = d i x (0 ) = α i и μ j = d j x (0 ) = 0 при j ≠ i.
Таким образом, при указанном выборе начальных условий, возбуждает-
ся только i-ая мода, или «частота».
Рассмотрим с этих же позиций движение неавтономного объекта
r r r
x& (t ) = Ax(t ) + Bu(t ).
Изложенный подход можно использовать и в этом случае, если вектор
r
Bu(t ) разложить по собственным векторам матрицы A :
r n r
Bu(t ) = ∑ β i (t ) × v i .. (2.5-15)
i =1

Для того, чтобы определить скалярные функции β i (t ) , умножим обе


rT
части этого равенства слева на d j :
rT r n rT r
d j Bu(t ) = ∑ β i (t )d j v i ,
i =1

откуда, учитывая (2.4-13) и (2.4-14), получаем


rT r
β i (t ) = d i Bu(t ). (2.5-16)
Таким образом, в соответствии с формулой Коши (2.3-18) и выражением
для переходной матрицы (2.4-28) имеем

55
r At r
t n r
x (t ) = e x (0 ) + ∫ e A (t −τ ) ⋅ ∑ β i (τ )v i dτ =
0 i =1

r t n n r r r
= e x (0 ) + ∫ ∑ e j ∑ β i (τ )v j d Tj v i dτ =
At λ ( t −τ )
(2.5-17)
0 j =1 i =1

n
⎧ λ j t t λ j (t −τ ) r T r ⎫ r
= ∑ ⎨μ i e + ∫ e d j Bu (τ )dτ ⎬ ⋅ v j .
j =1 ⎩ 0 ⎭
r
Если вынуждающая функция u (t ) выбирается таким образом, чтобы
r
вектор Bu (t ) совпадал с направлением одного из собственных векторов
матрицы A , то она будет возбуждать только одну соответствующую мо-
ду «частоту».

2.6. Модели стационарных линейных систем в комплексной


плоскости на основе преобразования Лапласа
2.6.1. Матрица передаточных функций
Известно, что преобразование Лапласа определяется парой преобразо-
ваний
r r ∞
r
X ( p ) = L{x (t )} = ∫ x (t )e − pt dt ,
0
(2.6-1)
r r
{ }
C + j∞
r 1
x (t ) = L−1 X ( p ) = ∫ X ( p )e pt dp .
2π ⋅ j C − j∞
Первое из них называется прямым, а второе - обратным. Векторная
r r
функция x(t ) называется оригиналом, а X ( p ) - изображением этого
оригинала по Лапласу; p - комплексная переменная преобразования
Лапласа. Преобразование Лапласа можно осуществить, если
p = σ + jω и σ > σ c , где σ c - абсцисса абсолютной сходимости. Ве-
r
личина σ C выбирается исходя из требования, чтобы функция x (t )e −σt
при σ > σ C была абсолютно интегрируемой.
При вычислении обратного преобразования Лапласа интегрирование
ведется на плоскости комплексной переменной p по прямой, парал-
лельной мнимой оси, лежащей на прямой с, причем с выбирается так,
r
чтобы все полюсы X ( p ) оказались слева от прямой интегрирования
(рис. 2.14). На этом рисунке показано расположение полюсов некоторой
r
функции X ( p ) .

56
+j Плоскость p

σc с +

Рис.2.14. К вычислению обратного преобразования


Лапласа

Пусть, как обычно, уравнения объекта имеют вид


r r r
x& (t ) = A(t )x(t ) + B(t )u(t );
r r
y (t ) = C(t )x (t ).
Перейдем к изображениям по Лапласу
r r r r
pX ( p) − x(0) = AX ( p ) + BU ( p );
r
Y ( p ) = CX ( p ).
r
Перенесем AX(p) в левую часть равенства, а x(0) - в правую:
r r r
( pE − A) X ( p ) = x(0) + BU ( p).
Отсюда получаем выражение для изображения вектора состояния
r r r
X ( p ) = ( pE − A) x (0) + ( pE − A) BU ( p ) .
−1 −1

Сравнивая это равенство с формулой Коши


r r t
r
x(t ) = e ⋅ x(0) + ∫ e A( t −τ ) ⋅ Bu(τ )dτ ,
At

отмечаем, что резольвента матрицы A может рассматриваться как изо-


бражение по Лапласу от переходной матрицы (матричной экспоненты):
( pE − A ) −1 = L {e At }.
Справедливо равенство
I ( p)
( pE − A) −1 = , (2.6-2)
ϕ A ( p)

57
где I ( p ) - присоединенная матрица для матрицы А, и ϕ A (p ) - характе-
ристический полином матрицы A . I ( p ) и ϕ A (p ) могут быть определе-
ны по методу Фаддеева - Леверье.
При нулевых начальных условиях
r r
X ( p ) = ( pE − A)−1 BU ( p ), (2.6-3)

где функция

Wux ( p ) = ( pE − A) −1 ⋅ B (2.6-4)
называется матричной передаточной функцией от вектора управления
до вектора выхода или передаточной функцией по каналу «u-x».
Аналогично, при нулевых начальных условиях
r r
Y ( p ) = C( pE − A) BU ( p ),
−1
(2.6-5)
где функция
Wuy ( p ) = C( pE − A) −1 ⋅ B (2.6-6)
называется матричной передаточной функцией от вектора управления
до вектора выхода или передаточной функцией по каналу «u-y». Функ-
цию ( pE − A) называют резольвентой матрицы A .
−1

С использованием передаточной функции можно записать:


r r
X ( p ) = Wux ( p ) ⋅ U ( p )
r r . (2.6-7)
Y ( p ) = Wuy ( p ) ⋅ U ( p )
Принимая во внимание, что изображение по Лапласу δ - функции равно
единице, можно представить передаточную функцию как изображение
от весовой функции
W ( p ) = L{w (t )}. (2.6-8)
Передаточная функция является функцией от матрицы A , поэтому в
соответствии с (2.4-27) можно записать
r rT
n C ⋅v i ⋅ d i B
Wuy ( p ) = ∑ (2.6-9)
i =1 ( p − λi )
и
r rT
n
C ⋅ v i ⋅ di B r
Y ( p) = ∑ ⋅ U ( p) . (2.6-10)
i =1 ( p − λi )
Графическое изображение последней формулы представлено в виде
структурной схемы, изображённой на рис. 2.15.
58
rT 1 r
d1 B C v1
p − λ1

r r
U ( p) rT 1 r Y ( p)
d2 B
p − λ2
Cv2 ∑

rT 1 r
dn B Cvn
p − λn
Рис. 2.15. Структурная схема системы на базе представления
передаточной функции через собственные числа и собственные
векторы матрицы динамики

ПРИМЕР 2.6-1. Для объекта, схема в переменных состояния кото-


рого приведена на рис.2.16, уравнения состояния имеют вид
x&1 = x 2 − u1 ;
y 1 = x1 ;
x& 2 = x 3 + u1 ;
y 2 = x3 .
x& 3 = x 2 + u2 ;
Им соответствует матрицы
⎡0 1 0⎤ ⎡− 1 0⎤
⎡ 1 0 0⎤
A = ⎢0 0 1⎥; B = ⎢ 1 0⎥; C = ⎢ ⎥.
⎢ ⎥ ⎢ ⎥ ⎣0 0 1⎦
⎢⎣0 1 0⎥⎦ ⎢⎣ 0 1⎥⎦
Характеристический полином имеет вид
ϕ A (λ ) = λ3 − λ .
Собственные числа
λ 1 = 0 ; λ 2 = 1; λ 3 = − 1 .

59
u1
x2 x1 y1

u2 x3
y2

Рис.2.16. Структурная схема к примеру 2.6-1

Присоединенная матрица
⎡λ 2 − 1 λ 1⎤

I (λ ) = ⎢ 0 λ2 λ ⎥⎥.
⎢⎣ 0 λ λ2 ⎥⎦
Резольвента
⎡1 1 1 ⎤
⎢λ λ − 1 λ (λ2 −1) ⎥
2

I (λ ) ⎢⎢ λ 1 ⎥⎥
(λE − A ) =
−1
= 0 .
ϕ A (λ ) ⎢ λ2 − 1 λ2 − 1 ⎥
⎢ 1 λ ⎥
⎢0 λ2 − 1 λ2 − 1 ⎥⎦

В соответствии с (2.6-4) передаточная функция по вектору состояния
⎡− p + p +1 1 ⎤
2

⎢ p( p 2 − 1) p( p 2 − 1) ⎥
⎢ ⎥
p 1
Wux ( p ) = ( pE − A ) B = ⎢ ⎥
−1

⎢ p −12
p −1 ⎥
2

⎢ 1 p ⎥
⎢ ⎥
⎣ p −1 p2 −1 ⎦
2

и по вектору выхода
⎡ − p + p +1 1 ⎤
2

⎢ p( p 2 − 1) p 2 − 1⎥
Wuy ( p ) = C ( pE − A ) B = ⎢
−1
⎥.
⎢ 1 p ⎥
⎢⎣ p −12
p − 1⎥⎦
2

Используя присоединенную матрицу, можно найти матрицу правых соб-


ственных векторов

60
⎡1 1 1 ⎤
V = ⎢0 1 − 1⎥ .
⎢ ⎥
⎢⎣0 1 1 ⎥⎦
Присоединенная матрица для A
T

⎡λ − 1 0 0⎤
2

I d (λ ) = ⎢ λ λ 2
λ ⎥⎥ .

⎢⎣ 1 λ λ2 ⎥⎦
Левые собственные векторы
1 0 0 ⎤
r ⎡ ⎤ r ⎡ ⎤ r ⎡
d 1 = ⎢ 0 ⎥; d 2 = ⎢0.5⎥; d 3 = ⎢− 0.5⎥ .
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎣⎢− 1⎦⎥ ⎣⎢0.5⎦⎥ ⎣⎢ 0.5 ⎦⎥
Базовые матрицы
⎡1 0 − 1⎤ ⎡0 0.5 0.5⎤
r r r r
v 1d 1T = ⎢0 0 0 ⎥ ; v 2 d 2T = ⎢0 0.5 0.5⎥ ;
⎢ ⎥ ⎢ ⎥
⎢⎣0 0 0 ⎥⎦ ⎢⎣0 0.5 0.5⎥⎦

⎡0 − 0.5 0.5 ⎤
r r
v 3 d 3T = ⎢0 0.5 − 0.5⎥ .
⎢ ⎥
⎢⎣0 − 0.5 0.5 ⎥⎦
Вычислим коэффициенты суммы (2.6-9):
r r ⎡− 1 − 1⎤ r r ⎡0.5 0.5⎤
Cv 1d 1T B = ⎢ ⎥; Cv 2 d 2T B = ⎢ ⎥;
⎣ 0 0 ⎦ ⎣0 .5 0 .5 ⎦
r rT ⎡− 0.5 0.5⎤
Cv 3 d 3 B = ⎢ ⎥
⎣− 0.5 0.5⎦
и получим результат, естественно, совпадающий с уже полученным
1 ⎡−1 − 1⎤ 1 1 ⎡1 1⎤ 1 1 ⎡− 1 1⎤
Wuy ( p ) = + ⋅ + ⋅ .
p ⎢⎣ 0 0 ⎥⎦ p − 1 2 ⎢⎣1 1⎥⎦ p + 1 2 ⎢⎣− 1 1⎥⎦
Практически без дополнительных выкладок получаем

61
⎡− 1 − 1⎤ 1 ⎡1 1⎤ t 1 ⎡− 1 1⎤ −t
w y (t ) = ⎢ ⎥ + 2 ⎢1 1⎥ ⋅ e + 2 ⎢− 1 1⎥ ⋅ e .
⎣ 0 0 ⎦ ⎣ ⎦ ⎣ ⎦
Интегрируя весовую функцию, получаем матричную переходную функ-
цию
⎡ 1 t 1 t −t ⎤
⎢ − t + (e − 2 + e −t
) − t + (e − e )⎥
H y (t ) = ⎢ 2 2
1 t 1 t ⎥.
⎢ (e − 2 + e )
−t
(e − e ) ⎥
−t

⎣ 2 2 ⎦

2.6.2. Основные свойства передаточных функций

Понятие передаточной функции лежит в основе классической теории ав-


томатического регулирования. В связи с этим ниже перечисляются ос-
новные её свойства, используемые при анализе систем автоматического
управления.
1. Элемент i -й строки и j -го столбца матричной передаточной функции
равен отношению изображения i -й координаты вектора выхода к j -ой
координате вектора управления при нулевых начальных условиях:
Yi ( p )
Wij (p ) = . (2.6-11)
U j ( p)
Таким образом,
nu
Yi ( p ) = ∑W ij ( p )U j ( p ) . (2.6-12)
j =1

2. Для стационарных объектов с сосредоточенными параметрами эле-


менты матричной передаточной функции - это дробно-рациональные
функции комплексной переменной p :
Rij ( p ) b0 p m + b1p m −1 + ... + bm
Wij ( p ) = = . (2.6.13)
Qij ( p ) a0 p n + a1p n −1 + ... + an

3. По известной передаточной функции легко восстанавливаются соот-


ветствующие дифференциальные уравнения. По данным предыдущего
примера

62
− p2 + p + 1 1
Y1 ( p ) = U ( p ) + U 2 ( p) .
p( p 2 − 1) p( p 2 − 1)
1

После приведения к общему знаменателю получаем


p 3Y1 (p ) − pY1 (p ) = − p 2U1( p ) + pU1( p ) + U1( p ) + U 2 ( p ) ,
и в результате имеем
&y&&1(t ) − y& 1(t ) = −u&&1 (t ) + u&1(t ) + u1(t ) + u2 (t ) .
4. Знаменатель передаточной функции - это соответствующий характе-
ристический полином. Полюсы передаточной функции - это корни соот-
ветствующего характеристического полинома.
5. Поскольку весовая функция является оригиналом для передаточной,
то при всех различных полюсах
n
w ij (t ) = ∑ Cl e pl t , (2.6.14)
l =1

где pl - полюсы функции;


m

Rij ( pl )
b ∏ (p l
− rv )
Cl = ' = 0⋅ v =1
n
; (2.6.15)
Q ij ( pl ) a0
∏ (p
v =1,v ≠ l
l
− rv )

b0 ,a0 - коэффициенты при старших степенях p числителя и знамена-


теля передаточной функции Wij (p ) ;
rv - нули W ij (p ) .
6. В физически реализуемых системах порядок числителя m элемен-
тарной передаточной функции не может превышать порядка ее знаме-
нателя n .
7. В простейших случаях элементарная передаточная функция может
быть непосредственно получена из соответствующего дифференциаль-
ного уравнения. Например, для динамического звена с уравнением
dy (t ) du(t )
T + y (t ) = T
dt dt
путем перехода к изображениям по Лапласу при нулевых начальных ус-
ловиях получаем
T pY ( p) + Y ( p) = T p U ( p) ,
откуда

63
Y ( p) Tp
W ( p) = = .
U ( p ) Tp + 1
При описании пассивных электрических цепей передаточные функции
могут вычисляться в соответствии с правилами электротехники с ис-
пользованием полных символических сопротивлений. Так, например,
для схемы, приведенной на рис.2.17,
С

R1
U R2 Uвых=Y

Рис.2.17. Пассивное дифференцирующее звено

Y ( p) R2 R2 R1Cp + 1
W ( p) = = = ⋅ .
U ( p) 1 R1 + R2 R2
R1 ⋅ R1Cp + 1
pC R1 + R2
R2 +
1
R1 +
pC

64
2.7. Комплексный передаточный коэффициент
2.7.1. Способы определения понятия «Комплексный передаточный
коэффициент»

Известно несколько подходов к введению понятия «Комплексный


передаточный коэффициент». Рассмотрим основные из них.
♦ Формальная замена комплексной переменной в передаточной функ-
ции.
Изображения по Лапласу вектора выхода и вектора управления
связаны между собой с помощью передаточной функции
v v
Y ( p ) = W ( p )U ( p ) . (2.7-1)
Если в этом равенстве комплексную переменную p принять чисто мни-
мой величиной p = jω , то формально получаем следующее равенство
v v
Y ( jω ) = W ( jω )U ( jω ) . (2.7-2)
Здесь комплексный передаточный коэффициент W ( jω ) определяется
формально:
W ( jω ) = W ( p ) | p = jω .
Строго говоря, эта замена не всегда правомерна.
♦ Использование преобразования Фурье
Прямое и обратное преобразования Лапласа выглядят следую-
щим образом:

1 C + jω
Y ( p ) = ∫ y (t )e dt ;
− pt
y (t ) = ∫ Y ( p )e pt dp (2.7-3)
0 2πj C − jω
Преобразование Лапласа существует тогда, когда вещественная часть
комплексной переменной p удовлетворяет неравенству σ > σ C .
Если функция y (t ) , t ∈ [0, ∞ ) является односторонней и абсолютно ин-

тегрируемой, т.е. ∫0 y (t )dt < ∞ , то её абсцисса абсолютной сходимости
σ C <0, и можно принять p = jω (σ = 0 ). В этом случае прямое преобра-
зование Лапласа совпадает с прямым преобразованием Фурье:

Y ( jω ) = ∫ y (t )e − jωt dt . (2.7-4)
0

Практически столь же просто обратное преобразование Лапласа пре-


вращается в обратное преобразование Фурье:

65
1 + j∞
y (t ) = ∫ Y ( jω )e j∞t d ( jω ) ⇒
2πj − j∞
(2.7-5)
1 +∞
y (t ) = ∫ Y ( jω )e jωt dω .
2π −∞
r r r r r
Таким образом, если x& (t ) = Ax (t ) + Bu (t ); y (t ) = Cx (t ) и если
r r r
функции x (t ) , y (t ) и u (t ) абсолютно интегрируемы, то можно к указан-
ным уравнениям применить не только преобразование Лапласа, но и
преобразование Фурье:
r r r
jωX ( jω ) = AX ( jω ) + BU ( jω );
r r
X ( jω ) = ( jωE − A) −1 ⋅ B ⋅U ( jω );
r r
X ( jω ) = W x ( jω ) ⋅U ( jω );

W y ( jω ) = C ⋅ ( jωE − A ) −1 B . (2.7-6)

Функция W y ( jω ) = C ( jωE − A) B называется комплексным передаточ-


−1

ным коэффициентом, или частотной функцией соответствующего дина-


мического звена или системы. Аналогично передаточной функции, она
может быть выражена через левые и правые собственные, векторы мат-
рицы А векторно-матричного дифференциального уравнения этого зве-
на или системы:
r v
Cv i d iT B
n
W ( jω ) = ∑ . (2.7-7)
i =1 jω − λ
i

2.7.2. Реакция динамических звеньев на гармонические воздействия


Рассмотрим реакцию системы
r r r
x (t ) = A ⋅ x ( t ) + b ⋅ u ( t )
со скалярным управлением на гармоническое воздействие
U m jωt U m − jωt
u(t ) = U m ⋅ Cosωt = ⋅e + e . (2.7-8)
2 2
Каждое из слагаемых последнего выражения вызывает свою реакцию,
то есть,
r r r
x (t ) = x 1 (t ) + x 2 ( t ) . (2.7-9)

66
В силу линейности рассматриваемых систем применим принцип супер-
позиции, и достаточно определить реакцию на первое слагаемое
U m jωt
u 1 (t ) = ⋅e . (2.7-10)
2
r
Ищем x 1 (t ) в виде:
ro
r X
x1 (t ) = 1 ⋅ e jωt , (2.7-11)
2
где
⎡ Xo ⎤
or
⎢ o11 ⎥
⎢ ⎥
X = ⎢ X 12 ⎥ ,
⎢ Mo ⎥
⎢X ⎥
⎣ 1n ⎦
o
а X i - комплексные амплитуды по координатам вектора состояния:
o
X i = X i max e jϕ i . (2.7-12)
r r
Подставим x1 (t ) и u1 (t ) в исходное дифференциальное уравнение и
проведём элементарные преобразования:
⎛ ro ⎞ ro
d ⎜ X 1 jωt ⎟ X 1 jωt r U m jωt
⋅e ⎟ = A⋅ ⋅e + b ⋅ ⋅e ;
dt ⎜⎜ 2 ⎟ 2 2
⎝ ⎠
ro ro r
X 1 ⋅ jω ⋅ e = A ⋅ X 1 ⋅ e jωt + b ⋅ U m ⋅ e jωt ;
jωt

ro ro r
X 1 ⋅ jω − A ⋅ X 1 = b ⋅ U m ;
ro r
X 1 = ( jωE − A) ⋅ b ⋅ U m ,
−1

то есть:
ro
X 1 = W ( jω ) ⋅ U m , (2.7-13)
где матричный комплексный передаточный коэффициент
r
W ( jω ) = ( jωE − A) b , −1

что совпадает с (2.7-6).


67
Аналогичным образом можно получить реакцию на вторую составляю-
U m − jωt
щую входного сигнала u 2 (t ) = ⋅e :
2
ro
X 2 = W ( − jω ) ⋅ U m . (2.7-14)
Полная реакция системы на гармоническое воздействие (2.7-8) в соот-
ветствии с (2.7-13)) , ((2.7-14)) и ((2.7-9)
r W ( jω )U m jωt W ( − jω )U m − jωt
x (t ) = e + e =
2 2
⎡ W1 ( jω ) cos(ωt + ϕ 1 ) ⎤
⎢ ⎥
W ( jω ) cos( ω t + ϕ )
=⎢ ⎥U .
2 2

⎢ .......... .... ⎥ m
⎢ ⎥
W
⎣ n ( jω ) cos( ω t + ϕ )
n ⎦

Таким образом, элемент матричной функции W ( jω ) , которая, по


понятным теперь причинам, называется частотной функцией, определя-
ется как отношение вынужденной гармонической составляющей (част-
ное решение неоднородного дифференциального уравнения) к гармони-
ческому входному воздействию при условии записи их в символической
форме. Комплексный передаточный коэффициент определяет измене-
ние в зависимости от частоты амплитуды и фазы гармонического сигна-
ла при прохождении его от вектора управления до каждой из координат
вектора состояния или вектора выхода:
X i max jϕ i
W i ( jω ) = ⋅e . (2.7-15)
Um
Модуль W ( jω ) определяет отношение амплитуд:
X i max
W i ( jω ) = , (2.7-16)
Um
а фаза – сдвиг по фазе между входным и выходным гармоническими
сигналами:
arg(W i ( jω )) = ϕ i . (2.7-17)

2.7.3. Частотные характеристики


Элементы матричной частотной функции связывают между собой
соответствующие координаты векторов входа и управления:

68
Yi ( jω )
W ik ( jω ) = . (2.7-18)
U k ( jω )
Такие скалярные функции принято иллюстрировать графическими час-
тотными характеристиками:
– амплитудно-фазовой характеристикой (АФХ), построенной в поляр-
ной системе координат {модуль, фаза}; можно рассматривать и соот-
ветствующую декартову систему координат, по осям которой откла-
дываются вещественная и мнимая части годографа вектора W ( jω ) ;
– логарифмическими частотными характеристиками (ЛЧХ) - амплитуд-
но-частотной (ЛАЧХ), построенной в осях | W ( jω ) | в децибелах, - ω
в логарифмическом масштабе, и фазочастотной (ЛФЧХ), построен-
ной в осях фаза - ω в логарифмическом масштабе
Модуль частотной функции в децибелах определяется в соответствии с
выражением
| W ik ( jω ) | ∂σ = 20 lg | W ik ( jω ) | . (2.7-19)
2
⎛ 4p +1 ⎞ k
В качестве примера для звена W ( p ) = ⎜ ⎟ ⋅ 3 приведены
⎝ 0.08 p + 1⎠ p
АФХ (рис.2.18) и ЛЧХ (рис.2.19).
+j

ω1

ω2
-1 1
ω=8 +
ω4
ω3

Рис 2.18. Амплитудно-фазовая характеристика

69
Рис 2.19. Логарифмические амплитудно-частотная
и фазочастотная характеристики

В учебной литературе по теории автоматического управления достаточ-


но подробно рассматривается методика построения частотных характе-
ристик типовых или более общего вида динамических звеньев и систем.
Поэтому в настоящем пособии эти вопросы не затрагиваются.

70
2.8. Графическое представление объектов и систем управ-
ления
Графическое изображение с использованием функциональных
блоков, передаточных функций, сигналов и их изображений называют
структурными схемами. Для представления систем в виде совокупности
отдельных функционально определенных блоков (подсистем) использу-
ются функциональные схемы.
2.8.1. Соглашение об обозначениях
Элементарно-+\.е динамическое звено (система) с передаточной
функцией W ( p ) представлено на рис 2.20, где

Yвх ( p ) Yвых ( p )
W (p)
Рис. 2.20. Динамическое звено

Yвх ( p ) – изображение по Лапласу входного сигнала;


Yвых ( p ) – изображение по Лапласу выходного сигнала;
W ( p ) – передаточная функция звена;
Связь между элементами выражается уравнением:
Yвых ( p ) = Yвх ( p )W ( p ) .
Варианты изображения элементов сравнения, или сумматоров на
структурных схемах представлены на рис.2.21

U1 U3 U1 U3 U1 U3
+


U2 U2 U2
Рис. 2.21. Элементы сравнения, сумматоры

Все три варианта равносильны и описываются уравнением:


U 3 = U1 − U 2 .

Если на вход сумматора подается несколько входных сигналов, то


он изображается в виде, представленном на рис.2.22 (три входных сиг-
нала).

71
U1
U2 U4
U3 Σ
Рис. 2.22. Сумматор с тремя входными
сигналами

Варианты элементов умножения на структурных схемах пред-


ставлены на рис 2.23. Оба вида равносильны в применении и описыва-
ются уравнением: U 2 = K × U1 .

U1 U2 U1 U2
K

Рис. 2.23. Элементы умножения

В качестве примера функциональной схемы на рис 2.24 представ-


лена функциональная схема системы стабилизации крена ракеты. На
рисунке использованы обозначения:
БЦВМ – бортовая цифровая вычислительная машина;
УМ – усилитель мощности;
РМ – рулевая машина;
ЦАП – цифро-аналоговый преобразователь;
АЦП – аналого-цифровой преобразователь;
δ - положение управляющего органа (сопло, руль);
ϕ - угол крена;
ϕ& - угловая скорость крена;
Возмущающие факторы:
W – ветер;
T – окружающая температура;
PAT – атмосферное давление;
r
r – вектор командных сигналов.

72
W PAT T
ϕ
Датчик угла
δ Объект
(ракета) ϕ& Датчик угловой
скорости

АЦП
РМ

УМ
r
r
ЦАП БЦВМ

Рис. 2.24. Функциональная схема угловой стабилизации ракеты

2.8.2. Структурные схемы и графы стационарных систем


2.8.2.1. Типовые соединения многомерных линейных систем
Одной из характерных задач анализа САУ является задача преобразо-
вания и упрощения исходных структурных схем. При этом используются
правила преобразования простейших, типовых соединений, к которым
относят параллельное (согласно-параллельное) - рис 2.25, последова-
тельное – рис 2.26, и встречно-параллельное, когда одно динамическое
звено включено в обратную связь другому – рис 2.27. Для каждой из этих
ситуаций нетрудно найти передаточную функцию эквивалентного звена.
Пусть исходные динамические звенья имеют следующее описа-
ние:
r r r r r
x& 1 (t ) = A1 x1 (t ) + B1u1 (t ); y 1 (t ) = C1 x1(t ) ;
(2.8-1)
r r r r r
x& 2 (t ) = A 2 x 2 (t ) + B2u 2 (t ); y 2 (t ) = C2 x 2 (t ) .
Параллельное соединение (рис. 2.25).
В случае параллельного соединения звеньев введем в рассмотре-
ние следующие очевидные равенства из блочных векторов и матриц

73
r r r
⎡ x& 1 ⎤ ⎡ A1 0 ⎤ ⎡ x1 ⎤ ⎡ B1 ⎤ r r ⎡ x1 ⎤
⎢ r& ⎥ = ⎢ ⋅ r + ⋅ u; y = [C1 C2 ] ⋅ ⎢ r ⎥ . (2.8-2)
⎣x2 ⎦ ⎣ 0 A2 ⎥⎦ ⎢⎣ x 2 ⎥⎦ ⎢⎣B2 ⎥⎦ ⎣x2 ⎦
В соответствии с этим можно записать выражение для эквивалентной
передаточной функции соединения
r r
u1 I y1
r
x1
r r
u y

II
r r r
u2 x2 y2

Рис. 2.25. Параллельное соединение

WЭ ( p ) = C( pE − A) −1 B , (2.8-3)
где:
⎡A 0⎤ ⎡ B1 ⎤
A=⎢ 1
A2 ⎥⎦
; B = ⎢B ⎥; C = [C1 C2 ]. (2.8-4)
⎣0 ⎣ 2⎦
Учитывая, что
r r r
y = y1 + y 2 ,
а
r r r r
Y1 ( p ) = W1 ( p )U ( p ); Y2 ( p ) = W2 ( p )U ( p ) ,
получаем
WЭ ( p ) = W1 ( p ) + W2 ( p ) . (2.8-5)
С другой стороны, передаточную функцию эквивалентного звена можно
расписать следующим образом:
−1
⎛ ⎡A 0 ⎤ ⎞ ⎡B1 ⎤
WЭ (p) =C⋅(pE− A) ⋅B =[C1 C2 ] ⎜ pE−⎢ 1
−1
⎥ ⎟ ⎢B ⎥ =
⎝ ⎣ 0 A2⎦ ⎠ ⎣ 2⎦

−1
⎡pE − A 0 ⎤ ⎡B1 ⎤
=[C1 C2 ]⎢ n1 1 ⎢B ⎥,
⎣ 0 pEn2 − A2 ⎥⎦ ⎣ 2⎦
74
где: n1, n 2 – размерности соответствующих единичных матриц.
Продолжим преобразования:
⎡( pE n1 − A1 )
−1
0 ⎤ ⎡ B1 ⎤
WЭ ( p ) = C ⎢ −1 ⎥ ⎢ ⎥=
⎣ 0 ( pE n2 − A2 ) B
⎦⎣ 2 ⎦

⎡ ( pE n1 − A1 ) ⎤
−1

= [C1 C2 ]⎢ −1 ⎥
=
⎣( pE n2 − A2 ) ⎦
C1 ( pE n1 − A1 ) −1 B1 + C 2 ( pE n 2 − A2 ) −1 B2 .
Таким образом, в результате получаем:

WЭ ( p ) = W1 ( p ) + W 2 ( p );
C1I1 ( p ) ⋅ B1 C 2 I 2 ( p ) ⋅ B2 (2.8-6)
WЭ ( p) = + ,
Q1 ( p ) Q2 ( p )
где
I1,I 2 – соответствующие присоединенные матрицы для матриц А1 и
А2 ;
Q1 ( p ), Q2 ( p ) - характеристические полиномы первого и второго
звеньев, то есть:
Q1 ( p ) = ϕ A1 ( p ) = det( pE n1 − A1 )

Q2 ( p ) = ϕ A 2 ( p ) = det( pE n 2 − A2 )
Характеристический полином эквивалентной системы (матрицы А )
имеет вид:
Q( p ) = Q1 ( p ) ⋅ Q2 ( p ) . (2.8-7)
Отсюда следует, что нули характеристического полинома (полюсы) эк-
вивалентной передаточной функции соединения состоят из нулей харак-
теристических полиномов (полюсов передаточных функций) первого и
второго звеньев.
Таким образом, если каждое из параллельных звеньев устойчивы, то и
всё соединение в целом устойчиво; если в соединении присутствует
хотя бы одно неустойчивое звено, то соединение в целом неустойчи-
во (связь между характером полюсов передаточной функции и устойчи-
востью соответствующей системы будет обсуждаться в п. 2.9).

75
Последовательное соединение (рис. 2.26).
При последовательном соединении блочные уравнения имеют вид

r r r r r r
u = u1 I y 1 = u2 II y2 = y
r r
x1 x2

Рис. 2.26. Последовательное соединение

⎡ x&1 ⎤ ⎡ A1 0 ⎤ ⎡ x1 ⎤ ⎡B1 ⎤ ⎡x ⎤
⎢ x& ⎥ = ⎢B C ⋅ + u; y = [0 C2 ] ⎢ 1 ⎥ , (2.8-8)
⎣ 2⎦ ⎣ 2 A2 ⎥⎦ ⎢⎣ x 2 ⎥⎦ ⎢⎣ 0 ⎥⎦ ⎣ x2 ⎦
и в выражении (2.8-3) для эквивалентной функции
⎡ A 0⎤ ⎡B1 ⎤
A=⎢ 1
A2 ⎥⎦
; B = ⎢ 0 ⎥; C = [0 C2 ]. (2.8-9)
⎣B2C1 ⎣ ⎦
Кроме того, нетрудно получить связь между передаточными функциями
отдельных звеньев, входящих в соединение, и эквивалентной переда-
точной функцией
WЭ ( p ) = W1 ( p )W2 ( p ) . (2.8-10)
Вывод о связи между устойчивостью отдельных звеньев и устойчиво-
стью их последовательного соединения аналогичен выводу для случая
параллельного включения.

Встречно-параллельное включение звеньев рис. 2.27.


r r r r
u u1 r y1 = y
x1
m
r
x2 r r
r u2 = y1
y2
Рис. 2.27. Встречно-паралельное соединение

r rДляr встречно-параллельного соединения, учитывая, что


u1 = u m y 2 , получаем:
⎡ A m B1C2 ⎤ ⎡B1 ⎤
A=⎢ 1
A2 ⎥⎦
; B = ⎢ 0 ⎥; C = [C1 0] (2.8-11)
⎣B2C1 ⎣ ⎦
и

76
WЭ ( p) = [E ± W1 ( p )W2 ( p )] W1 ( p ) .
−1
(2.8-12)
Поскольку полюсы передаточной функции эквивалентного соединения в
данном случае не удается выразить непосредственно через полюсы пе-
редаточных функций отдельных звеньев, то однозначного ответа об ус-
тойчивости соединения без дополнительного анализа получить не уда-
ется.

2.8.2.2. Графы динамических систем


Графом называется множество вершин и ребер, в котором каждо-
му ребру соответствует две вершины - начало и конец ребра.
Основные характеристики графов:
1) каждой вершине на графе, изображаемой кружком или точкой, ста-
вится в соответствие величина одной из переменных (координат сис-
темы);
2) каждое ребро, изображаемое на графе линией со стрелкой, имеет
вершину –“начало” и вершину – “конец”. Стрелка обозначает направ-
ление передачи сигнала от начала к концу, таким образом, граф про-
хождения сигналов является направленным (антисимметричным)
графом;
3) величина, соответствующая началу (вершине) ребра, называется
входной величиной ребра. Если из вершины выходит несколько ре-
бер, то входные величины этих ребер одинаковы и равны величине
соответствующей вершины;
4) ребро изображает одно из звеньев в системе и ему ставится в соот-
ветствие передаточная функция;
5) если к вершине подходит несколько ребер, то сопоставляемая ей
величина равна сумме выходных величин ребер.

Между графом прохождения сигналов и структурной схемой имеется


взаимно - однозначное соответствие. Стрелка структурной схемы соот-
ветствует вершине графа, а прямоугольник (звено) – ребру. При необхо-
димости в граф системы могут вводиться дополнительные единичные
ребра для выявления промежуточных координат, являющихся, в основ-
ном, выходами отдельных ребер. Для примера, приведены графические
представления некоторой системы в виде структурной схемы (рис 2.28)
и графа (рис 2.29).
Простейшие правила преобразования структурных схем и графов
линейных систем представлены в таблице 2.1.

77
W1
y1
v ε u3
W3
y3 u4
W4
y

W2
y2 y5
W5

Рис. 2.28. Структурная схема системы

W1 y1 W4
1 ε u3 W3 y3 1 u4 y 1 y
v

W5
W2

-1

Рис. 2.29. Граф системы

Таблица 2.1
№ Структурная схема Граф Эквивалентная
передаточная
функция
1 Параллельное соединение звеньев.

W1
y W1
U WЭ = W1 ( p ) +
U y
+ W2 ( p)
W2
W2
2 Последовательное соединение звеньев.

U y U y WЭ = W1 ( p) ⋅
W1 W2 W1 W2
⋅ W2 ( p )

3 Встречно-параллельное соединение звеньев.

78
U y W1
W1 U 1 Wэ ( p) =W1( p) /
1
/1±W1( p)W2 ( p)
m

W2 m W2

Встречаются и более сложные случаи соединения звеньев, так,


например, соединения с перекрестными связями (рис. 2.30).

W1
S1
u p1 p2 y
W2 W4

S2
W3

Рис. 2.30. Соединение с перекрестными связями

В этих случаях можно пользоваться правилом переноса динамического


звена через сумматор или точку разветвления.
Любое динамическое звено можно перенести через сумматор
или точку разветвления; при этом звено должно войти во все входя-
щие и ответвляющиеся ветви. В те ветви, в которые звено входит
без изменения направления распространения сигнала, звено проходит
со своей передаточной функцией. В тех ветвях, при продвижении в
которые меняется направление распространения сигнала, переда-
точная функция звена изменяется на обратную.
Это правило иллюстрируется элементарными примерами, приве-
дёнными на рис. 2.31÷2.34.

79
u p y u y
W W

y
W

Рис. 2.31. Перенос звена W через точку разветвления p

S S
u1 y u1 y
W W

u2 W

u2

Рис. 2.32. Перенос звена W через сумматор S

u p y1
W1 W2

W3

y2
u p y1
W1 W2

1/ W 2

W3

y2

Рис. 2.33. Перенос звена W2 через точку разветвления p

80
S
U1 y
W1 W3

W2

u2
S
u1 y
W1 W3

1/W 2

W2

u2
Рис. 2.34. Перенос звена W1 через сумматор S.

В качестве примера проведём упрощение структурной схемы, при-


ведённой на рис. 2.30. Перенесём динамическое звено с передаточной
функцией W 2 через точку разветвления p2 . После этого получим схему,
состоящую только из элементарных соединений (рис. 2.35.).

1/ W2 W1

r
u p1 y
W2 W4
p2
S1
S2
W3

Рис. 2.35. Схема соединения после переноса

81
Теперь исходная система может быть представлена в упрощенном виде
W2 ⎛W ⎞
(рис 2.36.) и будет описываться выражением: W э = ⋅⎜ 1 +W4 ⎟
1+ W2W3 ⎝ W2 ⎠

u W2 W1 y
+ W4
1 + W 2W 3 W2

Рис. 2.36. Исходная схема в упрощенном виде

2.8.2.3. Формула Мейсона


В случае громоздких систем с большим числом звеньев и перекре-
стных связей наиболее эффективным является использование для по-
лучения эквивалентных передаточных функций правила Мейсона. В
связи с этим введем необходимые дополнительные определения.
Прямой путь между двумя заданными вершинами графа – это не-
прерывная последовательность ветвей одного направления, в которой
каждая из вершин встречается не более одного раза.
Контур – замкнутая цепь, при однократном обходе которой в на-
правлении, указанном стрелками, каждая из вершин встречается не бо-
лее одного раза.
Согласно правилу Мейсона, передаточная функция W между входом в
точке А и выходом в точке B равна:
χ
WK ( p ) ⋅ Δ K ( p )
W AB ( p ) = ∑ , (2.8-13)
K =1 Δ( p )
где:
χ – число прямых путей между вершинами A и B ;
W k ( p ) – передаточная функция k-го прямого пути от вершины A к вер-
шине B (она равна произведению передаточных функций всех ре-
бер, входящих в последовательность прямого пути);
Δ( p ) – определитель графа;
Δ k ( p) – k-й минор определителя графа, равный определителю более
простого графа, который получается из данного графа путем уда-
ления из него всех ребер и вершин, лежащих на k-м прямом пути, а
также всех ребер входящих и исходящих из этих вершин.
Определитель графа определяется из соотношения:

Δ( p ) = 1− ∑Woi ( p ) + ∑Woi ( p )Woj ( p ) −


i i,j

82
− ∑Woi ( p )Woj ( p )Wok ( p ) + K , (2.8-14)
i , j ,k

где
Woi ( p ) – передаточные функции различных контуров графа;

Woi ( p )Woj ( p ) – произведения передаточных функций непересекающих-


ся пар контуров;
W oi ( p )W oj ( p )W oz ( p ) – произведения передаточных функций непересек-
ающихся троек контуров.

ПРИМЕР 2.8-1. Найти передаточную функцию Wuy для системы,


структурная схема которой приведена на рис. 2.37.
u u1 y1 u2 y
W1 W2
y4
y3
W3 W4

Рис. 2.37. Структурная схема системы с


перекрёстными связями

Этой схеме соответствует граф, представленный на рис. 2.38.


y3 W3
-1
u 1 u2 W2 1 y
u1 W1 y 1
1
1
y4 W4

Рис. 2.38. Граф системы с перекрёстными связями

Для этого графа:


• передаточная функция единственного прямого пути
Wпр = W1 W2 ;
• передаточные функции контуров
W01 = −W1 W3 ; W02 = W2 W4 ;

83
• главный определитель
Δ = 1+ W1 W3 −W2 W4 ;
• определитель прямого пути
Δ1 = 1;
• искомая передаточная функция
W1W2
Wuy = .
1 + W1 W3 − W2 W4

ПРИМЕР 2.8-2. Найти передаточную функцию между точками A и


B для графа, приведённого на рис. 2.39.
Wg

Wf

1 1
Ws

Wd We Wh
A Wa Wc 1 B

Wb
Wi Wm Wn
Wp Wr

Wq

Рис. 2.39. Граф системы

• Передаточные функции прямых путей:


W1=Wa·Wb·Wc;

W2=Wa·Wd·We·Wc;

W3=Wa·Wd·Wg·Wh.

84
• Передаточные функции контуров:
W01= Wd·Wg·Wh·Wn·Wr·Wp·Wl;
W02= Wd·We·Wc·Wn·Wr·Wp·Wl;

W03= Wb·Wc·Wn·Wr·Wp·Wl;
W04= Wc·Wn·Wr·Wm;

W05= Wr·Wp·Wq;
W06= Wg·Wf.
• Произведения передаточных функций непересекающихся пар конту-
ров:
W02·W07; W03·W06; W03·W07; W04·W06; W04·W07; W05·W06; W05·W07.
• Непересекающихся троек контуров нет.
• Определитель графа:
Δ=1- W01 - W02 - W03 - W04 - W05 - W06 - W07+
+ W02·W07+W03·W06+W03·W07+W04·W06+W04·W07+W05·W06+W05·W07 .
• Миноры определителя графа:
Δ1=1-W05-W07-W06+W05·W06+W05·W07;
Δ2=1-W05-W07+W05·W07;

Δ3=1-W05.
• Результирующая передаточная функция
W1Δ1 + W2 Δ 2 + W3 Δ 3 + W4 Δ 4 + W5 Δ 5
WAB = .
Δ

85
2.9. Устойчивость систем
2.9.1. Асимптотические свойства собственного движения и весовой
матрицы линейной системы
Пусть нелинейное дифференциальное уравнение состояния имеет
вид
r. r r
x (t ) = F { x (t ), u(t ), t } . (2.9-1)
r
Пусть также u 0 (t ) – некоторая заданная (номинальная) функция време-
r
ни и x 0 (t 0 ) – некоторый номинальный вектор начальных условий.
r
Решение x 0 (t ) является устойчивым в смысле Ляпунова, если для
любого t 0 и для любого ε > 0 существует δ (ε , t 0 ) > 0 такое, что при
r r
x (t 0 ) − x 0 ( t 0 ) ≤ δ (2.9-2)
удовлетворяется неравенство
r r
x (t ) − x 0 (t ) ≤ ε . (2.9-3)
r
Норма вектора x в простейшем случае совпадает с его евклидовой
длиной
r n
x = ( ∑ x i )1/ 2 .
2
(2.9-4)
i =1

Возможно так же использование и других форм нормы, например


r r n
x = max x i ; x = ∑ x i . (2.9-5)
i i =1

Введение нормы в пространстве состояний дает возможность ввести


понятие близости точек пространства. Устойчивость в смысле Ляпунова
r
гарантирует, что состояние x(t ) не отклоняется далеко от «номинально-
r r
го» режима x 0 (t ) при начальном состоянии x (t 0 ) , достаточно близком к
r
номинальному начальному состоянию x 0 (t 0 ) .
r
Решение x 0 (t ) называется асимптотически устойчивым, если оно
устойчиво в смысле Ляпунова, и для любого t 0 существует такое ρ (t 0 ) ,
что при
r r
x ( t 0 ) − x 0 (t 0 ) ≤ ρ (2.9-6)
выполняется условие
r r
lim x (t ) − x 0 (t ) = 0 . (2.9-7)
t →∞

86
r
Решение x 0 (t ) является асимптотически устойчивым в целом, если оно
r
устойчиво по Ляпунову, и для любых t 0 и x (t 0 )
r r
lim x (t ) − x 0 (t ) = 0 . (2.9-8)
t →∞

Применительно к нелинейным системам, вследствие сложности


характерных для них явлений, обсуждается обычно устойчивость реше-
ний. В линейных системах ситуация проще, и в этом случае целесооб-
разнее говорить об устойчивости уже не решения, а самой системы.
Пусть дано уравнение системы
r. r r
x C (t ) = A(t ) x C (t ) + B(t )u(t ) , (2.9-9)
r r r
и для t 0 , x C 0 (t 0 ) и u 0 (t ) , при t ≥ t 0 известно xC 0 (t ) , то есть спра-
ведливо уравнение

r. r r
x C 0 (t ) = A(t ) x C 0 (t ) + B(t )u 0 (t ) . (2.9-10)
r r
Естественно, что при других начальных условиях xC 1 (t 0 ) решение xC 1 (t )
будет другим
r. r r
x C1 (t ) = A(t ) x C1 (t ) + B(t )u 0 (t ) . (2.9-11)
Вычтем из (2.9-11) уравнение (2.9-10):
d r r r r
{x C1 (t ) − xC 0 (t )} = A(t ){xC1 (t ) − xC 0 (t )} (2.9-12)
dt
Обозначив,
r r r
x (t ) = x C 1 ( t ) − x C 0 ( t ) ,
при начальных условиях
r r r
x (t 0 ) = x C 1 ( t 0 ) − x C 0 ( t 0 ) .
получим уравнение
r. r r r
x (t ) = A(t )x(t ) , при t = t 0 x = x (t 0 ) . (2.9-13)
Таким образом, понятие устойчивости решения можно свести к понятию
устойчивости линейной системы.
Линейная система устойчива в определенном смысле (по Ляпу-
нову, асимптотически, или асимптотически в целом), если тривиаль-
r
ное решение x 0 (t ) ≡ 0 устойчиво в этом смысле.
Линейная система асимптотически устойчива тогда и только
тогда, когда она асимптотически устойчива в целом.
87
Таким образом, исследование вопроса устойчивости решений ли-
нейной неавтономной системы сводится к исследованию решения соот-
ветствующего однородного дифференциального уравнения, которое оп-
ределяется матрицей A(t ) и имеет вид:
r r
x (t ) = Φ(t , t 0 )x (t 0 ) ; (2.9-14)
r r
y = C(t )Φ(t, t 0 )x (t 0 ) . (2.9-15)
Рассмотрим три возможных случая.
1. Φ(t , t 0 ) – ограниченная матрица в интервале [t 0 , ∞ ) , то есть сущест-
вует такое положительное число М что
Φ ij (t, t 0 ) ≤ M, t ≥ t 0 ; i , j = 1,2.., n.
Тогда получаем, что
r
x (t ) ≤ n 2 M max x i (t 0 ) ,
i

и условие устойчивости выполняется, если взять, например,


ε
δ≤ .
n 2M
2. Переходная матрица удовлетворяет условию
lim Φ(t, t 0 ) = 0 .
t →∞

При этом движение, а значит, и сама система являются асимптотически


устойчивыми.
3. Φ(t , t 0 ) – неограниченная матрица в интервале [t 0 , ∞ ) . При этом дви-
r
жение неустойчиво, так как для любого x (t 0 ) ≠ 0 :
r
lim x (t ) = ∞ .
t →∞

Это означает и неустойчивость самой системы.


Если система является наблюдаемой и управляемой, (эти понятия
будут рассмотрены в п.п. 3.2, 3.3), то устойчивость системы можно ис-
следовать с помощью весовой функции. Система асимптотически устой-
чива, если
lim w y (t ,τ ) = 0 .
t →∞

Итак, линейная система является асимптотически устойчивой, ес-


ли ее переходная матрица с течением времени стремится к нулевой
матрице. Для стационарных систем, то есть для систем с постоянными
параметрами, это условие эквивалентно требованию, чтобы все собст-
венные числа матрицы А имели отрицательные действительные части,
то есть лежали в левой полуплоскости плоскости комплексной перемен-

88
ной λ . Это следует из формы представления переходной матрицы че-
рез собственные числа и правые и левые собственные векторы матрицы
А в соответствии с (2.4-28). Таким образом, анализ устойчивости сис-
темы может быть сведен к анализу расположения собственных чисел
матрицы А , или, что, то же самое, расположения полюсов передаточной
функции полностью управляемой и наблюдаемой системы.
В теории автоматического управления разработан ряд методов,
называемых критериями устойчивости, позволяющих проанализировать
расположение собственных чисел относительно мнимой оси плоскости
λ , и не требующих при этом точного решения соответствующего харак-
теристического уравнения. К первой группе этих методов относятся, так
называемые, алгебраические критерии, которые путем элементарных
вычислений по коэффициентам характеристического полинома позво-
ляют проанализировать устойчивость исследуемой системы с извест-
ными значениями ее параметров.
2.9.2. Необходимое условие устойчивости
Для устойчивости системы с характеристическим полиномом
ϕ (λ ) = a0 λn + a1λn −1 + ...an −1λ + an (2.9-16)
необходимо, чтобы при a0 > 0 все коэффициенты характеристического
полинома были положительны, то есть a i > 0 при i = 1, 2 , ..., n .
Докажем это утверждение. Если λ1 , λ2 ,,,,, λn - нули характеристи-
ческого полинома (корни характеристического уравнения ϕ ( λ ) = 0 ), то
(2.9-16) может быть записано в виде
ϕ (λ ) = (λ − λ1 )(λ − λ2 )...(λ − λn ) . (2.9-17)
Если λi - вещественный корень в левой полуплоскости, то есть
λi = −α i (α i > 0 - положительное вещественное число), то
(λ − λi ) = (λ + α i )
и произведение таких сомножителей даст полином только с положи-
тельными коэффициентами.
Пусть λi - комплексный корень в левой полуплоскости, то есть
λi = −α i + jω i (α i > 0 ). Тогда при всех вещественных коэффициентах
характеристического полинома среди его нулей должен быть комплекс-
но сопряжённый: λi +1 = −α i − jω i . Произведение двух соответствующих
сомножителей даст полином второй степени с положительными коэф-
фициентами:
(λ − λi )(λ − λi +1 ) = λ2 + 2α i λ + α i2 + ω i2 ) .
Следует обратить внимание на то, что рассмотренное условие ус-
тойчивости не является достаточным. Если среди коэффициентов ха-
89
рактеристического полинома имеются отрицательные, то это означает,
что соответствующая система неустойчива. Если все коэффициенты по-
ложительны, то система может быть как устойчивой, так и неустойчивой.
В этом случае необходим дополнительный анализ.
2.9.3. Критерий устойчивости Гурвица.

Пусть характеристический полином некоторой системы имеет вид


(2.9-16). Сопоставим этому полиному матрицу Гурвица:
⎡ a1 a3 a5 ... 0 0⎤
⎢a a a ... 0 0⎥
⎢ 0 2 4

⎢ 0 a1 a3 ... 0 0⎥
Gϕ = ⎢ . (2.9-18)
⎢ ... ... ... ... ... ... ⎥⎥
⎢0 0 0 ... an −1 0⎥
⎢ ⎥
⎣0 0 0 ... an −2 an ⎦
По главной диагонали стоят коэффициенты полинома, остальные
элементы строятся по следующему принципу: вверх от диагонального
элемента ставятся коэффициенты полинома в порядке возрастания ин-
дексов, вниз - коэффициенты полинома в порядке убывания индексов.
Элементы, требующие индексов, больших степени полинома, или отри-
цательных, устанавливаются нулевыми.

Критерий Гурвица.
Для устойчивости системы необходимо и достаточно чтобы при
а0>0 были положительны все (n) главные миноры матрицы Гурвица.
Рассмотрим примеры конкретизации критерия Гурвица для простейших
случаев.
• n = 1.
Запишем дифференциальное уравнение
dy
a0 ⋅ + a1 y = 0
dt
и характеристическое уравнение
a0 λ + a1 = 0 .
В данном случае применение критерия Гурвица даёт тривиальный
результат
а0 > 0, a1 > 0 .
• n = 2.
Запишем дифференциальное уравнение
90
d 2y dy
a0 ⋅ 2 + a1 ⋅ + a2 y = 0 ,
dt dt
характеристическое уравнение
a0 λ2 + a0 λ + a1 = 0
и матрицу Гурвица
⎡a 0⎤
G=⎢ 1 .
⎣a0 a2 ⎥⎦
Как и в предыдущем случае, при a0 > 0 применение критерия Гурви-
ца даёт тривиальный результат:
a1 > 0, a2 > 0 .
Отметим, что для систем первого и второго порядка необходимое
условие устойчивости является и достаточным.
• n = 3.
Запишем характеристическое уравнение
a0 λ3 + a1λ2 + a2 λ + a3 = 0
и матрицу Гурвица
⎡ a1 a3 0⎤
G = ⎢a0 a2 0 ⎥.
⎢ ⎥
⎢⎣ 0 a1 a3 ⎥⎦
Для устойчивости системы по критерию Гурвица необходимо и дос-
таточно, чтобы при a0 > 0 были положительны первый
Δ 1 = a1 > 0 ,
второй

a1 a3
Δ2 = = a1a2 − a0 a3 > 0
a0 a2
и третий
a1 a3 0
Δ 3 = a0 a2 0 = a3 Δ 2 > 0
0 a1 a3

91
главные миноры матрицы Гурвица. С учётом необходимого условия
устойчивости (требования положительности всех коэффициентов ха-
рактеристического уравнения) критерий Гурвица для устойчивости
системы третьего порядка требует выполнения неравенства
a1a2 − a0 a3 > 0 . (2.9-19)
• n = 4.
Запишем характеристическое уравнение
a0 λ4 + a1λ3 + a2 λ2 + a3 λ + a 4 = 0
и матрицу Гурвица
⎡ a1 a3 0 0⎤
⎢a a2 a4 0⎥
G=⎢ 0 ⎥.
⎢0 a1 a3 0⎥
⎢ ⎥
⎣0 a0 a2 a4 ⎦
Для устойчивости системы по критерию Гурвица необходимо и дос-
таточно, чтобы при a0 > 0 были положительны первый
Δ 1 = a1 > 0 ,
второй

a1 a3
Δ2 = = a1a2 − a0 a3 > 0 ,
a0 a2
третий
a1 a3 0
Δ 3 = a0 a2 a 4 = a3 (a1a2 − a0 a3 ) − a 4 a12 > 0
0 a1 a3
и четвёртый
Δ 4 = a4 Δ 3 > 0
главные миноры матрицы Гурвица. С учётом необходимого условия
устойчивости (требования положительности всех коэффициентов ха-
рактеристического уравнения) критерий Гурвица для устойчивости
системы четвёртого порядка требует выполнения неравенства
a3 (a1a2 − a0 a3 ) − a 4 a12 > 0 . (2.9-20)
Для системы пятого порядка критерий Гурвица выливается в тре-
бование выполнения уже двух неравенств:

92
a1a2 − a0 a3 > 0
(2.9-21)
(a1a2 − a0 a3 )(a3 a4 − a2 a5 ) − (a1a4 − a0 a5 ) > 0 .
2

С дальнейшим увеличением порядка систем использование критерия


Гурвица становится всё более громоздким и теряет смысл. Если возни-
кает необходимость привлечения вычислительной техники, то в наше
время стало проще непосредственное вычисление корней характери-
стического уравнения. Тем не менее, для систем третьего - четвёртого
порядков привлекает простота использования критерия Гурвица.

ПРИМЕР 2.9-1. Рассмотрим систему, представленную на рис. 2.40,


с входным сигналом v , сигналом ошибки ε , и выходным сигналом y .

v ε k y
(Tp + 1)3

Рис 2.40 Структурная схема системы


Этой системе соответствует передаточная функция
k
(Tp + 1) 3 k
Wvy ( p ) = = 3 3 .
k T p + 3T 2 p 2 + 3Tp + 1 + k
1+
(Tp + 1) 3
В соответствии со свойствами передаточных функций характеристиче-
ский полином замкнутой системы имеет вид
ϕ ( p ) = T 3 p 3 + 3T 2 p 2 + 3Tp + 1+ k .
По критерию Гурвица система устойчива, если выполняется неравенст-
во
a1a2 − a0 a3 = 9T 3 − T 3 (1 + k ) > 0 .
Отсюда, с учётом требования положительности всех коэффициентов
характеристического полинома, следует, что система устойчива, если
при T > 0 выполняются неравенства
−1< k < 8.
Значения параметров, при которых система находится на границе
устойчивости, принято называть критическими. В данном примере у ко-
эффициента k имеется два критических значения - нижнее k кр = −1 и
н

верхнее k кр = 8 .
в

93
2.9.4. Частотный критерий устойчивости (критерий Найквиста)
Часто рассмотрению подлежат замкнутые системы, структурные
схемы которых могут быть приведены к типовому виду, представленно-
му на рис. 2.41. Как правило, передаточная функция разомкнутой систе-
мы W (p ) имеет относительно простой вид и несложно определить рас-
положение её полюсов относительно мнимой оси. Таким образом, пред-
полагается, что анализ устойчивости разомкнутой системы проведён. В
то же время, анализ устойчивости замкнутой системы представляет со-
бой нетривиальную задачу. Критерий устойчивости Найквиста оперирует
с частотными характеристиками, достаточно нагляден и позволяет ис-
пользовать физические представления о свойствах исследуемой систе-
мы. Критерий Найквиста позволяет судить об устойчивости системы в
замкнутом состоянии по частотным характеристикам разомкнутой сис-
темы.
2.9.4.1. Понятие логарифмического вычета
Пусть задана некоторая функция Ψ(p ) , аналитичная всюду в об-
ласти G , за исключением конечного числа изолированных особых точек.
Будем полагать, что все особые точки являются полюсами. Будем пола-
гать также, что граница C области G не содержит ни нулей, ни полюсов
функции Ψ(p ) .
Рассмотрим логарифмическую производную функции Ψ(p ) :

L ( p) =
d
[ln Ψ( p)] = Ψ ( p) (2.9-22)
dp Ψ( p )
и назовем логарифмическим вычетом функции Ψ(p ) в точке p = a вы-
чет в этой точке ее логарифмической производной:
LnRes{Ψ(p), a} = Res {L ( p ), a} . (2.9-23)
Пусть функция Ψ(p ) имеет в точке p = a ноль порядка k , то есть
Ψ( p ) = ( p − a ) k F ( p ) ,
где
F (a ) ≠ 0 .
Тогда
Ψ ′( p ) = k ( p − a ) k −1 F ( p ) + ( p − a ) k F ′( p )
и
k F ′( p )
L ( p) = + . (2.9-24)
p − a F ( p)

94
Отметим, что полюсы функций F (p ) и F ′(p ) совпадают. Так как нули
аналитической функции изолированы, то в достаточно малом круге
p − a < ρ функция F ′( p ) F ( p ) является аналитической и может быть
разложена в окрестности точки p = a в ряд Тейлора:
F ′( p ) ∞
= ∑α n ( p − a)n .
F ( p ) n =0
С учётом этого (2.9-24) превращается в
k ∞
L ( p) = + ∑α n ( p − a)n .
p − a n =0
Эта формула представляет собой разложение в ряд Лорана функции
L (p) в окрестности точки p = a . Из этой формулы следует, что точка
p = a является полюсом первого порядка функции L (p) и
Res{L ( p ), a} = k . (2.9-25)
Пусть теперь функция Ψ(p ) имеет в точке p = b полюс кратности
s , то есть
Ψ( p ) = ( p − b ) − s J ( p ) ,
где b не является ни нулём, ни полюсом функции J (p ) . Тогда
Ψ ′( p ) = −s( p − b ) −( s +1) J ( p ) + ( p − b ) − s J ′( p )
и
−s J ′( p )
L ( p) = + .
p − b J ( p)
По аналогии с предыдущим случаем получим, что в окрестности точки
p=b
−s ∞
L ( p) = + ∑ β n ( p − b)n ,
p − b n =0
следовательно,
Res{L ( p ), b} = −s . (2.9-26)
Таким образом, в нулях и полюсах функции Ψ(p ) ее логарифми-
ческая производная (2.9-22)
Ψ ′( p )
L ( p) =
Ψ( p )

95
имеет полюсы первого порядка, причем в нуле функции Ψ(p ) логариф-
мический вычет равен порядку нуля, а в полюсе – взятом со знаком ми-
нус порядку полюса.
По теореме вычетов имеем
1 Ψ ′( p ) ⎧ Ψ′( p ) , p ⎫ = k − s ,

2πj C Ψ( p )
dp = ∑v Res ⎨
⎩ Ψ( p )
v⎬
⎭ v
∑ v ∑v v
или окончательно
1 Ψ′( p )
∫ dp = N − Π , (2.9-27)
2πj C Ψ( p )
где N – число нулей, а Π –число полюсов функции Ψ(p ) в области G.
2.9.4.2. Принцип приращения аргумента
Обозначим
Ψ( p ) = Ψ( p) e jϕ Ψ ( p ) , (2.9-28)
тогда
ln Ψ( p ) = ln Ψ( p ) + jϕ Ψ ( p ) . (2.9-29)
С учётом (2.9-27), получаем:
1 Ψ ′( p ) 1
∫ dp = ∫ d ( ln Ψ( p)) =
2πj C Ψ( p ) 2πj C
(2.9-30)
1 1
= ∫ d ln Ψ( p ) + ∫ djϕ Ψ ( p ) = N − Π.
2πj C 2πj C
Поскольку в правой части равенства стоит вещественное число, то мни-
мая часть левой части равенства также равна нулю.
Таким образом, если функция Ψ(p ) аналитична в замкнутой об-
ласти G , ограниченной контуром C , за исключением конечного числа
полюсов в области G , и если функция Ψ(p ) не имеет ни полюсов, ни
нулей на контуре C , то приращение аргумента функции Ψ(p ) при дви-
жении вектора p по замкнутому контуру C определяется выражением

Δϕ ΨC = 2π (N − Π ) . (2.9-31)

2.9.4.3. Анализ устойчивости замкнутой системы


Рассмотрим замкнутую систему с единичной обратной связью (рис.
2.41)

96
v ε y
W ( p)

Рис 2.41. Замкнутая система с единичной


обратной связью

Пусть известно, что среди n полюсов p1, p2 ,..., pn передаточной функ-


ции разомкнутой системы
R( p )
W ( p) = (2.9-32)
Q( p )
имеется v 1 нулевых и v2 чисто мнимых полюсов на верхней полуплоско-
сти плоскости комплексной переменной p (рис 2.42) , то есть

+ j

C C

Рис 2.42. Расположение нулей ( ) и полюсов ( )


передаточной функции разомкнутой системы

Q( p ) = p v1 ( p − jω q )v 2 Q1 ( p ) . (2.9-33)
Образуем функцию
Q( p ) + R ( p ) S ( p )
Ψ( p ) = 1 + W ( p ) = = , (2.9-34)
Q( p) Q( p )
характерную тем, что ее знаменатель является характеристическим по-
линомом разомкнутой системы, а числитель – характеристическим по-
линомом замкнутой.

97
Выберем в качестве области G всю правую полуплоскость плос-
кости комплексной переменной p . Контур C сформируем из мнимой
оси, за исключением точек, совпадающих с полюсами передаточной
функции разомкнутой системы, дуг окружностей бесконечно малого ра-
диуса, охватывающих эти полюсы, как показано на рис. 2.42, и окружно-
сти бесконечно большого радиуса, охватывающей всю правую полу-
плоскость.
Допустим, в общем случае, что разомкнутая система неустойчива,
и её передаточная функция имеет m "неустойчивых" полюсов, то есть
m полюсов в правой полуплоскости плоскости комплексной перемен-
ной p . Предположим, что замкнутая система также неустойчива, и z –
число неустойчивых полюсов передаточной функции замкнутой систе-
мы.
Тогда, в соответствии с принципом приращения аргумента
Δϕ Ψc = 2π ( z − m ). (2.9-35)
Если обходить контур C в отрицательном направлении, совпадающим с
положительным направлением мнимой оси, то
Δϕ Ψ−C = 2π (m − z ) . (2.9-36)
Будем сопоставлять изменение комплексной переменной р при пе-
ремещении ее вдоль контура C на плоскости p и соответствующее ему
изменение функции Ψ(p ) на комплексной плоскости Ψ . Для этого ра-
зобьем контур C на несколько характерных участков.
На участке I годограф комплексной переменной p изменяется по
окружности бесконечно большого радиуса, охватывая всю правую полу-
плоскость, то есть
pI = ρe jΘ , ρ → ∞. (2.9-37)
Ранее отмечалось, что в физически реализуемых системах порядок чис-
лителя передаточной функции не может превышать порядок ее знаме-
нателя. Отсюда следует, что степени полиномов S(p) и Q(p) равны, а
значит
S( ρe jΘ )
Ψ| ( p) = lim = const . (2.9-38)
ρ →∞
Q( ρ e j Θ )
Таким образом, приращение фазы функции Ψ(p ) при изменении p
вдоль первого участка равно нулю:
Δϕ ΨI = 0 . (2.9-39)
В качестве участка II выберем мнимую ось плоскости p , то есть
pII = jω (2.9-40)

98
за исключением тех ее точек, в которых располагаются полюсы разомк-
нутой системы. Соответствующая этому изменению p функция
Ψ|| ( p ) = Ψ( jω ), −∞ <ω <∞ (2.9-41)
легко может быть вычислена.
Участок III – это участок движения комплексной переменной p
вдоль окружности бесконечно малого радиуса с центром в начале коор-
динат, где по условию находится v 1 полюсов передаточной функции ра-
зомкнутой системы. При этом, в соответствии с (2.9-33), функция Ψ(p )
будет иметь вид
S( ρe jΘ )
Ψ||| ( p) = lim =
ρ →0
ρ v1 e jv1Θ ( ρe jΘ − jω q )v 2 Q1 ( ρe jΘ )
(2.9-42)
− jv1Θ
S (0 ) e
= lim ⋅ ,
ρ →0
( − jω q ) 2 Q1 (0) ρ v1
v

то есть на плоскости Ψ(p ) будет иметь место перемещение («доворот»)


по окружности бесконечно большого радиуса. Направление этого пере-
мещения противоположно по знаку направлению перемещения на плос-
кости p , а абсолютная величина приращения угла - в v 1 раз больше.
Таким образом, третьему участку соответствует изменение фазы функ-
ции Ψ(p ) на величину
Δϕ Ψ||| = −v 1π . (2.9-43)
Наконец, рассмотрим движение комплексной переменной p вдоль ок-
ружности бесконечно малого радиуса с центром в точке p = jω q , где
расположено v 2 полюсов передаточной функции разомкнутой системы.
На этом, четвертом участке контура С
pIII = jω q + ρe jΘ , ρ → 0. (2.9-44)
В соответствии с (2.9-33), функция
S( jω q ) e − jv 2Θ
ΨIV ( p ) = lim ⋅ ν2 (2.9-45)
ρ →0
( jω q ) Q1( jω q ) ρ
v1

будет образовывать годограф, перемещающийся на плоскости Ψ по ок-


ружности бесконечно большого радиуса, и соответствующее прираще-
ние фазы будет равно
π
Δϕ ΨIV = −2v 2 . (2.9-46)
2

99
Пользуясь тем, что Ψ(p ) является дробно–рациональной функцией от
p, и
Ψ( p ∗ ) = Ψ ∗ ( p ) , (2.9-47)
можно произвести обход лишь верхней половины контура C . Тогда
суммарное приращение фазы
Δϕ ΨSum = Δϕ ΨI + Δϕ ΨII + Δϕ ΨIII + Δϕ ΨIV = π (m − z ). (2.9-48)
Удобнее строить не функцию Ψ(p ) , а функцию W (p ) . Как видно
из равенства (2.9-34), годограф функции Ψ(p ) поворачивается вокруг
начала координат на тот же угол, что и годограф функции W (p ) повора-
чивается относительно точки ( −1, j 0) .
Выше приведенные рассуждения позволяют сформулировать кри-
терий устойчивости замкнутой системы, который называют частотным
критерием, или критерием Найквиста.
Критерий Найквиста.
Если передаточная функция разомкнутой системы имеет m по-
люсов с положительной вещественной частью, то для устойчивости
системы в замкнутом состоянии необходимо и достаточно, чтобы
при изменении ω от 0 до + ∞ расширенная амплитудно-фазовая ха-
рактеристика разомкнутой системы повернулась вокруг точки
( −1, j 0) на угол + mπ . Расширение частотной характеристики
W ( jω ) необходимо при наличии у передаточной функции разомкнутой
системы полюсов на мнимой оси. Каждому нулевому полюсу соответ-
ствует на амплитудно-фазовой характеристике доворот по окруж-
ности бесконечно большого радиуса на угол − π 2 . Каждому чисто
мнимому положительному полюсу соответствует на амплитудно-
фазовой характеристике доворот по окружности бесконечно большо-
го радиуса на угол − π .
Естественно, что, давая формулировку критерия устойчивости, ис-
ходят из условия z = 0 . Можно получить и более общий результат. Ос-
новываясь на формуле (2.9-48), в каждом конкретном случае можно вы-
числить количество «неустойчивых» полюсов замкнутой системы
Δϕ SUM
z=m− . (2.9-49)
π
Здесь Δϕ SUM – результирующий угол поворота расширенной амплитуд-
но-фазовой характеристики разомкнутой системы вокруг точки ( −1, j 0)
при изменении ω от 0 до + ∞ .
На практике удобнее пользоваться другой формулировкой крите-
рия, которая предложена Я. З. Цыпкиным и использует понятие перехо-

100
дов расширенной амплитудно-фазовой характеристикой участка веще-
ственной оси ( −1, − ∞ ) .
Переходом называется пересечение амплитудно-фазовой ха-
рактеристикой вещественной оси на интервале ( −∞ , − 1] . Переход
считается положительным, если при увеличении частоты в точке
перехода фаза растет, и отрицательным, – если уменьшается. Если
амплитудно-фазовая характеристика начинается, или заканчивается
на указанном участке вещественной оси, то имеет место половина
перехода с соответствующим знаком.
На рис. 2.43 приведены примеры, иллюстрирующие понятие пере-
ходов и критерий Найквиста. Все три примера соответствуют системам,
устойчивым в замкнутом состоянии.

+j +j
m=1
m=1 W2 ( jω )
+0.5п 1,0j
o A -1,0j o
A
+ -0.5п +1п +
W1( jω ) ϕз ϕз

+j
m=0
B
A
-1, j0 o +
-1п +1п 0п
ϕз
W3 ( jω )

Рис 2.43. Иллюстрация к анализу устойчивости

В системе координат логарифмических частотных характеристик


переход имеет место, если фазочастотная характеристика пересекает
линию − π ± kπ (к=1,2...), и при этом логарифмическая амплитудно-
частотная характеристика идет выше оси абсцисс (модуль комплексного
передаточного коэффициента больше единицы).

101
Приведем теперь формулировку критерия Найквиста, использую-
щую понятие переходов.
Если передаточная функция разомкнутой системы имеет m
полюсов с положительной вещественной частью, то для устойчиво-
сти системы в замкнутом состоянии необходимо и достаточно, что-
бы суммарное число переходов расширенной логарифмической час-
тотной характеристики было равно + m / 2 . Если замкнутая систе-
ма неустойчива, то число ее «неустойчивых» полюсов
z = m − 2∑ Π , (2.9-50)
где ∑ Π – суммарное число переходов расширенной частотной ха-
рактеристики разомкнутой системы.
2.9.4.4. Понятие запасов устойчивости
Естественно, что каждая система автоматического управления
должна быть устойчивой. В инженерной практике часто используется
понятие запасов. Например в строительстве и машиностроении обще-
принятым является термин "запас прочности". Аналогично этому при
проектировании систем управления пользуются понятиями запасов ус-
тойчивости.
Запасом устойчивости по модулю будем называть число, большее
единицы, которое показывает, во сколько раз (на сколько децибел) нуж-
но изменить исходный передаточный коэффициент разомкнутой систе-
мы, чтобы вывести замкнутую систему на границу устойчивости. Соот-
ветственно различают запасы по модулю на увеличение и уменьшение
коэффициента. На рис. 2.43 для каждого из вариантов длина отрезка oA
численно равна запасу устойчивости по модулю на уменьшение; вели-
чина, обратная длине отрезка oB для третьего варианта - запасу устой-
чивости по модулю на увеличение.
Запасом устойчивости по фазе ϕ з называют минимальный по мо-
дулю угол, на который следует довернуть вектор W ( jω ) с модулем,
равным единице, чтобы его конец оказался в точке ( −1, j 0) . На рис.
2.43 для каждого из вариантов АФХ указан запас устойчивости по фазе.
2.9.4.5. Устойчивость систем с запаздыванием
Звено транспортного запаздывания смещает по времени выходной
сигнал относительно входного на величину запаздывания τ :
y (t ) = u (t − τ ) . (2.9-51)
Передаточная функция и комплексный передаточный коэффициент со-
ответственно представлены выражениями (2.9-52) и (2.9-53):
W з ( p ) = e −τp ; (2.9-52)

W з ( jω ) = e − jωτ . (2.9-53)

102
При исследовании устойчивости системы, в которую входит звено
запаздывания, приводят её структурную схему к виду (рис. 2.44), в кото-
ром это звено оказывается включённым последовательно с остальной
частью системы
v y
Wз ( p ) W0 ( p )

Рис. 2.44. Типовая структура системы


с запаздыванием

При этом, если обозначить


R0 ( p )
W0 ( p ) = ,
Q0 ( p )
то характеристическое уравнение замкнутой системы примет вид
Q0 ( p ) + R 0 ( p ) e − p τ = 0 . (2.9-54)
В связи с тем, что разложение в ряд Тейлора экспоненциальной функ-
ции имеет вид
1
e − pτ = ,
1 1
1 − pτ + ( pτ ) 2 − ( pτ ) 3 + ...
2! 3!
то характеристическое уравнение (2.9-54) имеет бесконечно большое
число корней. При этом, естественно, алгебраические критерии устойчи-
вости неприменимы. В то же время, для данной системы может быть ис-
пользован критерий Найквиста.

ПРИМЕР 2.9-2. Пусть структурная схема системы с запаздыванием


приведена к виду, представленному на рис. 2.44 и
2
W0 ( p ) = .
(Tp + 1)2
На рис. 2.45 представлены амплитудно-фазовые характеристики
звена запаздывания и последовательно с ним включённого звена
W0 ( jω ) .

103
+j

e − jωτ

−1 1 2 +

Δϕ

W 0 ( jω )

Рис. 2.45. Исследование устойчивости системы


с запаздыванием

Так как модуль комплексного передаточного коэффициента звена за-


паздывания на всех частотах равен единице, то АФХ разомкнутой сис-
темы
W ( jω ) = W0 ( jω )e − jωτ (2.9-55)
отличается от W0 ( jω ) только фазой:
ϕ (ω ) = ϕ 0 (ω ) − ωτ . (2.9-56)
Если провести дугу окружности единичного радиуса с центром в начале
координат от отрицательной вещественной полуоси до пересечения с
АФХ W0 ( jω ) в точке ω = ω '1' , то полученное значение Δϕ из соотно-
шения
Δϕ = ω '1' ⋅ τ кр (2.9-57)

позволит найти так называемое критическое время запаздывания τ кр ,


то есть время запаздывания, при котором система выводится на границу
устойчивости. Здесь ω '1' - значение частоты, при которой
W 0 ( jω '1' ) = 1. (2.9-58)
В рассматриваемом примере

104
2
W0 ( jω ) = , (2.9-59)
1 + (ωT ) 2
откуда
1 π π
ω '1' = , ϕ 0 (ω "1" ) = − , Δϕ = (2.9-60)
T 2 2
и
πT
τ кр = . (2.9-61)
2

2.10. Качество процессов управления


2.10.1. Основные показатели качества
Устойчивость - это необходимое, но недостаточное условие эф-
фективной работы системы.
Комплекс требований, определяющих поведение системы в уста-
новившихся и переходных процессах отработки заданного воздействия,
определяется понятием «качество процесса управления» или качество
системы.
На этапе разработки системы управления рассматривают процес-
сы управления в устойчивых системах при воздействии особо "тяжелых"
для них сигналов, заданных в виде определенных или случайных функ-
ций времени
Качество работы системы проверяется по ее реакции на:
1) дельта функцию δ (t ) ;
2) единичную функцию 1(t ) ;
3) гармонический сигнал A ⋅ sin ω H t ;
4) случайные воздействия с заданными вероятностными характеристи-
ками.
Качество отработки типовых сигналов оценивают либо непосред-
ственно по выходному сигналу y (t ) , либо путем сравнения этого сигна-
ла y (t ) с реакцией некоторой эталонной системы (рассогласование
ε e (t ) на рис.2.46), либо по ошибке воспроизведения командного сигнала
ε v ( t ) = v (t ) − y ( t ) .

105
Управляемая y (t )
система
v (t )
ε e (t )
Эталонная
система
y e (t )

Рис. 2.46. Сравнение управляемой


системы с эталонной

На рис. 2.47 представлена реакция некоторой следящей системы


на линейно возрастающий командный сигнал
v (t ) = (0.5 + 0.025 t )1(t ) ,
на рис. 2.48 – реакция на единичную функцию.

Tk / 2

ε vуст

ε vуст
ε vm 2Δ
ε v (t )

tн tм tр
Рис. 2.47. Иллюстрация к характеристикам качества системы
(реакция на линейно изменяющийся сигнал)

106
T
k

E vуст

t t tр
н м

Рис. 2.48. Иллюстрация к определению показателей качества


(реакция на единичную функцию)

С помощью этих рисунков удобно проиллюстрировать основные


показатели качества, используемуе при анализе систем управления.

1. Установившаяся ошибка:
ε уст = ε ( ∞ ) = lim(v (t ) − y (t )) . (2.10-1)
t →∞

2. Время регулирования t р - минимальное время, в течение которого


переходный процесс перестает выходить за пределы заданной
«трубки». Определяется из условия

ε (t ) − ε уст ≤ Δ при t ≥ t p , (2.10-2)

где Δ - заранее заданное значение, определяемое требованиями к


точности системы (обычно 2-5% от значения командного или выход-
ного сигнала в установившемся режиме).
3. Максимальное перерегулирование σ - наибольший выброс управляе-
мого процесса относительно установившегося значения по отноше-
нию к разности ε уст и ε (0) .

ε мах − ε уст
σ = 100% ⋅ (2.10-3)
ε уст − ε (0)
107
Обычно требуют σ ≤ 30 ÷ 40% .
4. Время нарастания: t н - время первого входа процесса в трубку.
5. Время максимального перерегулирования: t m .
6. Число перерегулирований N в интервале: 0 ≤ t ≤ t p -
число выбросов, для которых

ε уст − ε m > Δ .
7. Частота или период Tk колебательной составляющей переходного
процесса.
2.10.2. Ошибки системы регулирования в установившихся режи-
мах. Статические и астатические системы
Рассмотрим одну из самых распространённых структурных схем -
схему типа следящей системы (рис.2.49), назначение которой с мини-
мальной ошибкой воспроизвести на выходе y (t ) командный сигнал
v (t ) .
v ε y
W ( p)

Рис.2.49. Простейшая типовая структура


следящей системы

В общем случае разомкнутая система может быть представлена


последовательным соединением объекта (неизменяемой части систе-
мы) с передаточной функцией Wоб (p ) и регулятора (корректирующего
звена) с передаточной функцией W рег (p ) . Кроме того, учтем дополни-
тельно возмущающее воздействие f (t ) . С учетом этого передаточная
функция разомкнутой системы W ( p ) = W рег ( p )Wоб ( p ) , а исходная
структурная схема примет вид, представленный на рис.2.50.

f y
v ε
Wpег ( p) Wоб ( p )

Рис.2.50. Структурная схема системы для анализа точности


в установившихся режимах

108
В соответствии с этой структурной схемой изображение по Лапласу
от ошибки E (p ) зависит как от командного сигнала, так и от возмуще-
ния:
E ( p ) = Wvε ( p ) ⋅ V ( p ) + Wfε ( p ) ⋅ F ( p ) = Ev ( p ) + Ef ( p ) , (2.10-4)
где
1 ,
W vε ( p ) = (2.10-5)
1+W ( p )
− Wоб ( p )
Wfε ( p ) = . (2.10-6)
1 + W ( p)
Широкий класс командных сигналов и возмущающих воздействий может
быть представлен степенными функциями времени
(α 0 + α 1t + α 2 t 2 + ...) ⋅1(t ) . (2.10-7)
Сначала рассмотрим реакцию системы на возмущающее воздей-
ствие, вида:
fν ν
f (t ) = ⋅ t ⋅ 1(t ) , (2.10-8)
ν!
где fν = const и имеет размерность возмущения f , деленную на
сек . Такая функция имеет ненулевые производные от нулевого до ν
ν

порядка и нулевые производные порядка выше, чем ν . Причем,

f (ν ) (t ) = fν . (2.10-9)
Изображение по Лапласу возмущения (2.10-8) имеет вид

F ( p) = . (2.10-10)
pν +1
Пусть
K об Rоб ( p)
Wоб ( p) = , (2.10-11)
Qоб ( p)

K рег R рег ( p )
Wрег ( p ) = (2.10-12)
p l Q1рег ( p )
и
Rоб (0) = R рег (0) = Qоб (0) = Q1рег (0) = 1. (2.10-13)
Тогда изображение ошибки можно представить в виде:
109
− K об ⋅ Rоб ( p ) ⋅ p l ⋅ Qрег ( p ) fν
Ef ( р) = ⋅ .
Qоб ( p ) ⋅ p ⋅ Q1рег ( p ) + K об ⋅ K рег ⋅ Rоб ( p ) ⋅ R рег ( p ) p
l ν +1

(2.10-14)
В соответствии с предельной теоремой преобразования Лапласа,
если существует lim ε (t) , то
t →∞

− K об
lim ε f (t ) = lim p ⋅ Ef ( p ) = lim ⋅ fν ⋅ p l −ν . (2.10-15)
t →∞ p →0 p →0
K об ⋅ K рег
Если ν = l , то
− fν
lim ε f (t ) = . (2.10-16)
t →∞
K рег
Очевидно, в этом случае размерность коэффициента K рег равна
−l
отношению размерностей возмущения и ошибки, умноженному на сек .
Такая система называется астатической по возмущающему воздейст-
вию с порядком астатизма l . Если на вход такой системы подать воз-
мущающий сигнал типа степенной функции времени с ν < l , то устано-
вившаяся ошибка будет равна нулю.
Если l = 0 , то нетрудно убедится в том, что если возмущение яв-
ляется единичной функцией:
f (t ) = f0 ⋅ 1(t ) , (2.10-17)
то
− K об
ε f (∞ ) = ⋅ f0 . (2.10-18)
1 + K об ⋅ K рег
Такая система называется статической, поскольку при постоянном
возмущении ошибка в статике не равна нулю, пропорциональна величи-
не возмущения f0 и тем меньше, чем больше коэффициент усиления ра-
зомкнутого контура K = K об K рег .
Аналогичные рассуждения можно провести для случая, когда
f = 0 , а командный сигнал является степенной функцией времени:
vν ν
v (t ) = ⋅t . (2.10-19)
ν!
В этом случае положим
Q( p ) = Qоб ( p ) ⋅ Qрег ( p ) = p l ⋅ Q1( p) и Q1 (0) = 1. (2.10-20)

110
Тогда

p l ⋅ Q1( p ) vν
lim E ( p ) = lim p ⋅ . (2.10-21)
p ⋅ Q1( p ) + K ⋅ R( p ) pν
t →∞ v p →0 l

Такая система при l ≠ 0 называется астатической по командному


сигналу с порядком астатизма, равным l .В этом случае коэффициент
K называется добротностью системы. Его размерность сек − l .
Если ν = l , то

ε v (∞ ) = = const . (2.10-22)
k
Если ν < l , то ε v (∞ ) = 0 .
При l = 0 система называется статической. Для нее, при
v (t ) = v 0 ⋅ 1(t ) (2.10-23)
имеем
v0
ε v (∞ ) = . (2.10-24)
1+ K
В рассмотренном случае регулятор содержал l интеграторов,
то есть, был астатическким, а объект интеграторов не содержал –
был статическим. Если рассмотреть другой вариант, где, в отличие
от (2.10-11), (2.10-12),
K об Rоб ( p ) K рег R рег ( p )
Wоб ( p ) = ; W рег ( p ) =
p l Q1об ( p ) Qрег ( p )
и
Rоб (0) = R рег (0) = Q1об (0) = Qрег (0) = 1,
то выводы по отработке командного сигнала не изменятся, а при возму-
щении (2.10-8)
− fν 1
lim ε f (t ) = lim ⋅ .
t →∞ t →∞
K рег pν
При ν = 0 получаем
− f0
ε f (∞ ) = ,
K рег
а при ν > 0 ошибка с течением времени неограниченно растёт.
Таким образом,

111
порядок астатизма системы по отношению к какому-либо внешнему воз-
действию равен числу интегрирующих звеньев, включенных в обратную
связь между координатой ошибки и этим воздействием.
Системой с астатизмом l -го порядка по отношению к команд-
ному сигналу v называется система автоматического управления,
вынужденная ошибка которой при отработке сигнала, выражаемого в
виде полинома степени l по t
Al l
A0 + A1t + ... + t ,
l!
постоянна и пропорциональна величине Al , то есть старшей производ-
ной воздействия. При отработке сигнала, выражаемого полиномом
меньшей степени, установившаяся ошибка в такой системе равна нулю.
Изложенные выше рассуждения приводят к выводу, что с точки зрения
стремления к уменьшению ошибки желательно иметь более высокий
порядок астатизма и более высокое значение K рег . И то и другое, как
правило, вступает в противоречие с требованиями устойчивости. Уже
синтез устойчивой системы с астатизмом выше третьего порядка ставит
перед разработчиком серьёзные проблемы.

ПРИМЕР 2.10-1. Пусть дана система со структурной схемой представ-


ленной на рис.2.51. Система обладает астатизмом 1-го порядка, как по
командному, так и по возмущающему воздействиям, так как система со-
−1
держит один интегратор с передаточной функцией p в регуляторе
(корректирующем звене). Для данной системы:
1) если f = const и v = const , то ε уст = 0 ;
f _Kf__
Tf p+1

v ε K p(1+Tk p) _____K0_______ y
(1+αTk p)p T02 p2+2ζ0 T0 p+1

Рис.2.51. Иллюстрация к примеру 2.10-1

2) если v = v 1 ⋅ t , v 1 = const , а f – константа или нулевая вели-


чина, то кинетическая ошибка
v1
ε уст = ε (∞) = ,
K
где добротность
112
K = K p ⋅ Kоб ;
3) если f = f1 ⋅ t , f1 = const , а v - константа или нулевая величи-
на, то
f1 ⋅ Kf
ε уст = ;
Kp
4) если v = v 2 ⋅ t , v 2 = const , или f = f2 ⋅ t , f2 = const , то ошиб-
2 2

ка будет непрерывно нарастать.


2.10.3. Точность систем при отработке гармонических сигналов
Каждый командный сигнал может быть разложен либо в дискрет-
ный (ряд Фурье для периодической функции времени), либо в непре-
рывный спектр гармоник (интегральное преобразование Фурье). Для то-
го, чтобы воспроизвести командный сигнал с малыми искажениями, не-
обходимо точно воспроизвести хотя бы существенные гармоники этого
спектра. В интервале этих существенных частот амплитудно-частотная
характеристика замкнутой системы (АЧХ) должна быть близка к едини-
це, а фазочастотная (ФЧХ) - к нулю (рис. 2.52). При этом, естественно,
полоса пропускания системы должна быть заведомо шире спектра ко-
мандного сигнала.
Для оценки величины ω в рассмотрим спектральную плотность сиг-
нала (спектр мощности):
2
SV (ω) =V( jω)⋅V(−jω) = V(iω) . (2.10-25)

Ф {v (t )} = V ( jω )

Wvy ( jω )
1

ωB ω
Рис. 2.52. Спектральная характеристика командного
сигнала Ф {v (t } и АЧХ системы Wvy (ω )

Полная энергия сигнала определяется выражением



Е V = ∫ S (ω )d ω . (2.10-26)
0

113
Величину ω В целесообразно выбрать так, чтобы площадь под кривой
S(ω ) на интервале частот [0,ω В ] составляла не менее 90% от площади
под этой кривой во всём диапазоне частот от нуля до бесконечности
(рис. 2.53).

Sν (ω )

ωв ω

Рис. 2.53. К обоснованию выбора


величины ω В

Применительно к структурной схеме, приведённой на рис. 2.41,


для которой частотная функция от командного сигнала к ошибке имеет
вид
1
Wvε ( jω ) = , (2.10-27)
1 + W ( jω )
этим требованиям соответствует неравенство
1
<Δ , 0 ≤ ω < ωВ , (2.10-28)
1 + W ( jω )

где Δ - некоторая заданная величина. В рассматриваемом диапазоне


частот обычно W ( jω ) >> 1. Поэтому неравенство (2.10-28) будет все-
гда выполняться, если
1
< Δ. (2.10-29)
− 1 + W ( jω )
Отсюда следует
1+ Δ 1
W > ≈ . (2.10-30)
Δ Δ

Таким образом, для точного воспроизведения командного сигнала тре-


буется, чтобы в спектре частот от 0 до ω В выполнялось условие
1
W > . (2.10-31)
Δ

114
Обычно принимают: Δ = 0.05 ÷ 0.1 . Применительно к ЛАЧХ неравенство
(2.10-31) превращается в требование того, чтобы в диапазоне 0 ≤ ω < ω В
выполнялось условие
W ( jω ) дБ > (26 ÷ 20 )дБ . (2.10-32)

2.10.4. Связь между логарифмическими амплитудно-частотными


характеристиками и качеством переходных процессов в САУ
Между частотными и временными характеристиками систем суще-
ствует однозначная взаимозависимость. Особенно много внимания уде-
лялось этому вопросу в те времена, когда вычислительная техника была
недоступна рядовому инженеру, и он должен был судить о свойствах
разрабатываемых систем, пользуясь только косвенными оценками.
Часть таких методик косвенных оценок качества по частотным характе-
ристикам представляет интерес и в настоящее время. На эту тему име-
ется обширная учебная литература. В настоящем пособии затрагивает-
ся один фрагмент из этих методик, который позволяет достаточно про-
сто связать качество временных процессов в замкнутых системах с ви-
дом амплитудно-частотных логарифмических характеристик соответст-
вующих разомкнутых систем. Здесь следует отметить, что дальнейшее
содержание параграфа относится лишь к так называемым неминималь-
нофазовым системам, то есть к таким, передаточные функции которых
не содержат ни нулей, ни полюсов с положительной вещественной ча-
стью.
Весь диапазон частот при рассмотрении ЛАЧХ (рис. 2.54) разбива-
ют на три поддиапазона:

1) Область низких частот [0 ≤ ω < ω н ]. Этот диапазон определяет в


значительной мере точность воспроизведения "медленно" меняющихся
воздействий. В этом диапазоне в соответствии с результатами, полу-
ченными в предыдущем разделе, должно быть выполнено условие:

⎛ 1 ⎞ ⎧⎪26дБ , если Δ = 0.05 ;


L(ω ) ≥ 20 lg⎜ ⎟ = ⎨ (2.10-33)
⎝ Δ ⎠ ⎪⎩34дБ , если Δ = 0.02 .
Кроме того, вид ЛАЧХ в этой области указывает на порядок астатизма и
статическую или кинетическую точность системы. Наклон низкочастот-
ной асимптоты равен − 20 ⋅ ν дБ/дек., где ν - порядок астатизма.
Ширина интервала [0, ω н ] позволяет найти ширину спектра частот
управляющих воздействий, воспроизводимых системой без каких-либо
значительных искажений и позволяет судить о том, какие воздействия
для рассматриваемой системы можно считать медленно изменяющими-
ся.

115
2) Диапазон средних частот [ω н , ω к ] – определяет запасы устойчивости
и качество системы при воздействии типа ступенчатой функции. В этом
интервале находится частота среза ω с , позволяющая оценить время ре-
гулирования:
π
t р ≈ (3 ÷ 4 ) . (2.10-34)
ωс
Частота среза ω с примерно равна собственной частоте замкнутой
системы (частоте, где у замкнутой системы может быть некоторый резо-
нанс).

W ( jω ) дБ
1 2 3

-20дБ/дек
ωн ωс ωк ω

Рис. 2.54. Типовая ЛАЧХ

Для удовлетворительного качества переходных процессов необхо-


димо, чтобы ЛАЧХ на этом интервале имела наклон -20дБ/дек, а длина
этого интервала примерно равнялась 1дек. На этом интервале опреде-
ляются запасы устойчивости системы. Рекомендуемые значения этих
запасов составляют примерно 10дБ по модулю и 350 - 400 по фазе.

3) Интервал высоких частот ω > ω c . Этот интервал примерно соответст-


вует W ( jω ) дБ ≤ −16 дБ. На этот интервал приходятся сопрягающие
частоты, пренебрежение которыми не оказывает существенного влияния
на качество переходных процессов.

ПРИМЕР 2.10-2.
Дана система с передаточной функцией
2
k 1 + T1p ⎞
W ( p ) = 3 ⎛⎜ ⎟ .
p ⎝ 1 + T2 p ⎠

116
Это система с астатизмом третьего порядка. На рис.2.55 представлена
её логарифмическая амплитудно-частотная характеристика. Цифрами 1,
2, 3 обозначены соответственно области низких, средних и высоких час-
тот.
L 1 2 3
-60 дБ/дек

mзум -20 дБ/дек mзув


ω
ωн
ϕ
1/Т1
ω ср 1/Т2

0 -60 дБ/дек
0

0
-90

0
-180
ϕз
-270
0 ω

Рис. 2.55. Иллюстрация к примеру 2.10-2

2.10.5. Соотношение масштабов во временной и частотной облас-


тях
1. Если функция f (t ) преобразуема по Фурье, F ( jω ) = Ф{f (t )} -
ее преобразование по Фурье и a - положительное вещественное чис-
ло, то справедливо равенство
⎧ ⎛ t ⎞⎫
Ф ⎨ f ⎜ ⎟ ⎬ = aF ( j ω ) . (2.10-35)
⎩ ⎝ a ⎠⎭
.
Докажем, это. Прямое преобразование Фурье выражается формулой

F ( jω ) =
− jω t
∫0 f ( t ) ⋅ e dt (2.10-36)

ω
Введем новые переменные t = t ⋅ a, ω= . Тогда
a
1 ∞
⎛ t ⎞ − ja ω ⎛⎜⎝ at ⎞⎟⎠
F ( jω a ) = ∫0 f ⎜ a ⎟ e dt ,
a ⎝ ⎠
117
откуда

⎛ t ⎞ − ja ω ⎛⎜⎝ at ⎞⎟⎠
aF ( j ω a ) = ∫0 ⎜ a ⎟ e
f dt
⎝ ⎠
и равенство (2.10-35) доказано.
Таким образом, при растяжении (сжатии) в "а" раз графика функ-
ции f (t ) вдоль оси времени, график модуля спектральной характеристи-
ки F ( jω ) , во-первых, сжимается (растягивается) вдоль оси частот в "а"
раз и, во-вторых, увеличиваются (уменьшаются) в "а" раз его значения.
Известно, что чем короче импульс, тем шире его спектр.
2. Изображение по Фурье от переходной функции h(t ) системы с
передаточной функцией W (p ) имеет вид
W ( jω )
H ( jω ) = , (2.10-37)

поэтому сама функция h(t ) может быть определена с помощью обрат-
ного преобразования Фурье:
1 +∞W ( jω ) jωt
h(t ) = ⋅∫
2π −∞ jω
e dω . (2.10-38)

По аналогии с пунктом 1 введем новые переменные


ω
t =t ⋅a , ω = ,
a
и, подставив их в (2.10-38), получим:
⎛ t ⎞ 1 +∞ W ( ja ω ) jaω at 1 +∞ W ( ja ω ) jωt
h⎜ ⎟ = ⋅∫ e da ω = 2π ⋅ ∫ jω e dω .
⎝ a ⎠ 2π − ∞ ja ω −∞

(2.10-39)
Таким образом, если частотная характеристика системы, получа-
ется путем сжатия (или растяжения) вдоль оси частот частотной харак-
теристики некоторой исходной системы (рис. 2.56), то ее переходная
функция соответственно растягивается (или сжимается) вдоль оси вре-
мени.

118
t

W1 W2 W3

Рис. 2.56. Связь между изменением полосы пропускания


системы и длительностью её переходной функции

119
2.11. Интегральные критерии качества с позиций общности
задач оптимального и модального синтеза
При рассмотрении качества систем управления большое место за-
нимает группа интегральных критериев качества. Они достаточно полно
изложены в обширной литературе по теории автоматического регулиро-
вания и управления. Это – интегралы от координат вектора состояния,
вектора управления, ошибки регулирования. Интегральные показатели,
или критерии качества непосредственно выходят на синтез оптимально-
го управления. При этом под оптимальностью понимается минимум ка-
кого-либо интегрального критерия. Наиболее простой из них – это инте-
грал от квадрата ошибки отработки командного сигнала на бесконечном
интервале времени

J 0 = ∫ ε 2 (t )dt . (2.11-1)
t =0

Однако, как показала практика, стремление к минимизации такого


критерия приводит к чрезмерной колебательности переходных процес-
сов. В связи с этим стали усложнять функционал. Так например, кроме
квадрата ошибки с целью уменьшения выбросов в переходных процес-
сах в функционал стали вводить квадрат от её производной

J1 = ∫ (c 0ε 2 (t ) + c1ε& 2 (t ))dt . (2.11-2)


t =0

Кроме этого, оказалось полезным учитывать величину управляю-


щего воздействия:

J 2 = ∫ (c0ε 2 (t ) + c1ε& 2 (t ) + cU u 2 (t ))dt . (2.11-3)


t =0

Различные исполнения системы в некоторых случаях стало удоб-


ным сравнивать по величине соответствующих интегральных показате-
лей. Такой анализ неизбежно стал перерастать в синтез оптимального
управления с различными интегральными критериями. В одной из наи-
более общих форм интегральные критерии, используемые оптимальном
синтезе, записывают в виде:

r r r r r r
J = ∫ ( x T (t )QX x (t ) + 2 x T (t )QXU u (t ) + u T (t )QU u(t ))dt . (2.11-4)
0

Возникло целое направление в теории оптимальных систем – ана-


литическое конструирование регуляторов (АКР). Был разработан специ-
альный математический аппарат, обеспечивающий расчёт управления,
которое минимизирует функционал вида (2.11-4).
Однако, возникла очередная проблема, - проблема выбора значе-
ний элементов матриц Q X , Q XU , QU в соответствующих квадратичных

120
формах. Эту задачу в общем виде формализовать не удалось до сих
пор. В то же время, при проектировании систем выявилась важная зако-
номерность: эталонные процессы, к которым притягивается движение в
системе, должны соответствовать структуре управляемого объекта. Это
означает, что уравнения эталонной системы, отображённой на рис. 2.46,
должны иметь такой же вид, как и уравнения объекта. Поэтому в качест-
ве эталонной системы можно выбрать систему того же порядка, что и
объект, но с собственными числами, а значит, и с характеристическим
полиномом, отвечающими требованиям, предъявляемым к замкнутой
системе.
Рассмотрим способ формирования ошибки ε E , характеризующей
отклонение некоторой конкретной системы от эталонной. Пусть эталон-
ная система n однородных дифференциальных уравнений первого по-
рядка приведена к одному дифференциальному уравнению n -го поряд-
ка:
xЭ( n ) + γ 1x Э( n −1) + ... + γ n −1xЭ(1) + γ n x Э = 0 . (2.11-5)
В левую часть равенства (2.11-5) вместо координаты xЭ подставим
одну из координат вектора состояния объекта. Скорее всего, при этом
равенство нулю нарушится. Получаем уравнение невязки:
xОб
(n )
+ γ 1xОб
( n −1)
+ ... + γ n −1xОб
(1)
+ γ n xОб = ε E . (2.11-6)
Переменная ε E характеризует отклонение процессов объекта от эта-
лонных. Она равна нулю на интервале времени t = [0, ∞ ) только лишь в
том случае, когда процессы в объекте или в проектируемой системе
полностью тождественны процессам в эталонной системе.
Учтём уравнение объекта
r r r
x& (t ) = Ax(t ) + Bu(t ) (2.11-7)
и приведём уравнение (2.11-6) к такому
r виду, чтобы rв него входили
только координаты векторов состояния x и управления u :
q x 1x1(t ) + q x 2 x 2 (t ) + ... + q xn x n (t ) +
(2.11-8)
qu 1u1(t ) + qu 2u2 (t ) + ... + qunu unu (t ) = ε E (t ).
Это уравнение, используя очевидные обозначения, можно записать ина-
че:
r r r r
q Tx x (t ) + quT u (t ) = ε E (t ) . (2.11-9)

В соответствии с введённой текущей ошибкой ε E (t ) может быть исполь-


зован интегральный критерий качества (функционал)

J = ∫ ε E2 (t )dt . (2.11-10)
0

121
Квадрат ошибки можно записать с помощью квадратичных форм:
r T r r T r r T r rT r r r
⎡ x ( t ) q q
⎤ ⎡ ⎤⎡ ⎤ ⎡ x ( t )⎤ ⎡ x ( t )⎤ ⎡ q
q q x q uT ⎤ ⎡ x(t )⎤
ε E2 = ⎢ r ⎥ ⎢ r x ⎥ ⎢ r x ⎥ ⎢ r ⎥ = ⎢ r ⎥ ⎢ r x r Tx r r r ,
⎣u (t )⎦ ⎣q u ⎦ ⎣q u ⎦ ⎣u(t )⎦ ⎣u(t )⎦ ⎣q u q x q u q uT ⎥⎦ ⎢⎣u(t )⎥⎦
(2.11-11)
где
⎡ q x1 ⎤ ⎡ q u1 ⎤
r ⎢q ⎥ r ⎢q ⎥
qx = ⎢ x2 ⎥ ; qu = ⎢ ⎥.
u2
(2.11-12)
⎢L⎥ ⎢L⎥
⎢q ⎥ ⎢q ⎥
⎣ xn ⎦ ⎣ u nu ⎦
Обозначив
r r r r r r
Q X = q Tx q x ; QU = q uT q u ; Q XU = quT qu , (2.11-13)
в итоге получаем критерий (2.11-4).
В связи с тем, что порядки уравнений объекта и эталонной систе-
мы совпадают, в результате оптимального синтеза удастся найти опти-
мальное управление, при котором минимум функционала окажется рав-
ным нулю. Так как при этом для процессов в системе с оптимальным
управлением окажется выполнимым равенство (2.11-6) при ε E = 0 , то
полученная система будет иметь характеристический полином
ϕ C (λ ) = ϕ Э (λ ) = λn + γ 1λn −1 + ... + γ n −1λ + γ n (2.11-14)
и, следовательно, собственные числа синтезированной системы совпа-
дут с собственными числами эталона.
Таким образом, результаты АКР при таком подходе обеспечивают
не только минимум критерия (2.11-4), равный нулю, но и позволяет по-
лучить систему с желаемыми собственными числами. Поскольку связь
переходных процессов с собственными числами (модами) системы бо-
лее очевидна и непосредственна, модальный синтез часто оказывается
предпочтительнее метода АКР, тем более, что алгоритм модального
синтеза существенно проще алгоритмов АКР.

ПРИМЕР 1. Для иллюстрации изложенного рассмотрим объект,


представленный на рис. 2.9. Уравнения объекта имеют вид:
x& 1 (t ) = x 2 (t );

x& 2 (t ) = −2 x 2 (t ) + x 3 (t ); (2.11-15)

x& 3 (t ) = − x 3 (t ) + u(t ) .

122
Пусть эталонная система (эталонный процесс) определяется уравнени-
ем
x Э( 3 ) (t ) + γ 1 x Э( 2 ) (t ) + γ 2 x Э(1) + γ 3 x Э (t ) = γ 3v (t ) , (2.11-16)
соответствующим желаемым собственным числам. Из этого уравнения
видно, что при постоянном командном сигнале v = v 0 = const в статике
lim( x Э (t )) = x Э уст = v 0 . (2.11-17)
t →∞

Подставив в левую часть равенства (2.11-16) координату объекта x1 (t ) и


получим уравнение невязки:
ε E (t ) = x1( 3 ) (t ) + γ 1 x1( 2 ) (t ) + γ 2 x1(1) (t ) + γ 3 x1 (t ) . (2.11-18)

Заменим производные от координаты x1 на координаты вектора состоя-


ния объекта с учётом уравнений (2.11-15):
x1(1) = x 2 ;

x1( 2 ) = x 2(1) = −2 x1 + x 3 ; (2.11-19)

x1( 3 ) = −2 x 2(1) + x 3(1) = 4 x 2 − 3 x 3 + u .


В результате уравнение невязки принимает вид
ε E (t ) = γ 3 x1 (t ) + ( 4 − 2γ 1 + γ 2 )x 2 (t ) + (γ 1 − 3)x 3 (t ) + u(t ) , (2.11-20)
откуда получаем:
⎡ γ3 ⎤
r
q x = ⎢4 − 2γ 1 + γ 2 ⎥ ; q u = 1. (2.11-21)
⎢ ⎥
⎢⎣ γ 1 − 3 ⎥⎦
Теперь в соответствии с (2.11-13) могут быть вычислены матрицы Q X ,
QU , Q XU и получен функционал (2.11-4) для использования при решении
задачи АКР.
В то же время, приравняв нулю ε E (t ) в (2.11-20), можно непосред-
ственно получить выражение для формирования управления u(t ) через
координаты вектора состояния объекта. Более того, если потребовать
выполнения равенства
x1( 3 ) (t ) + γ 1x1( 2 ) (t ) + γ 2 x1(1) (t ) + γ 3 x1(t ) = γ 3v (t ) , (2.11-22)
то с учётом (2.11-20) получим систему с обратной связью по вектору со-
стояния и управлением
r
u(t ) = Lx (t ) + k v v (t ) , (2.11-23)

123
где фигурируют матрица обратной связи

L = [− γ 3 − 4 + 2γ 1 − γ 2 3 − γ 1] (2.11-24)
и передаточный коэффициент по командному сигналу
kv = γ 3. (2.11-25)
Таким образом, без решения задачи АКР получено оптимальное
управление, обеспечивающее процессы в замкнутой системе, имеющей
собственные числа, соответствующие характеристическому полиному
эталонной системы (2.11-14). Кроме того, в полученной системе обеспе-
чена единичная статика по командному сигналу v (2.11-17).
В этом примере проиллюстрирована идентичность задачи АКР с надле-
жащим образом выбранным критерием оптимальности задаче модаль-
ного синтеза. В следующих разделах будет подробно изложена методи-
ка модального синтеза.

124
3. Синтез линейных непрерывных систем

3.1. Выбор корректирующих звеньев. Метод желаемых ЛЧХ

Как уже отмечалось, существует связь между частотными характе-


ристиками системы, как в замкнутом, так и в разомкнутом состоянии, и
протекающими в ней переходными процессами. На протяжении многих
лет инженерами накоплен большой опыт по синтезу систем автоматиче-
ского управления на базе формирования эталонных, желаемых частот-
ных характеристик соответствующих разомкнутых систем. В литературе
имеются обширные таблицы таких эталонных логарифмических ампли-
тудно-частотных характеристик для большого числа типовых передаточ-
ных функций объектов управления. В настоящем пособии излагается
лишь основная идея такого подхода.
Рассматривается одноконтурная система (рис. 3.1). Разомкнутый
контур состоит из последовательно включённых неизменяемой части
системы (в неё входят объект, привод, датчики, преобразующие и согла-
сующие устройства) с передаточной функцией W 0 ( p ) и корректирую-
щее звено с передаточной функцией W k (p ) .

v y
Wk ( p ) W0 ( p )

Рис. 3.1. Исходная структурная схема

Предполагается, что заданы требования к основным показателям


качества, обсуждавшимся в п.2.10.1. В соответствии с этим по упомяну-
тым таблицам, или на основе подхода, изложенного в п.2.10.4, строится
асимптотическая логарифмическая амплитудно-частотная характери-
стика (ЛАЧХ) L жел (ω ) разомкнутой системы, удовлетворяющая указан-
ным требованиям. На этом же рисунке строится асимптотическая ЛАЧХ
неизменяемой части системы
L0 (ω ) = W0 ( jω ) дБ . (3.1-1)

Потребуем, чтобы комплексный передаточный коэффициент ра-


зомкнутой системы был равен функции, определяемой желаемой ЛАЧХ,
то есть
W жел ( jω ) = W k ( jω ) W 0 ( jω ) (3.1-2)

125
или
L жел (ω ) = Lk (ω ) + L0 (ω ) . (3.1-3)
В соответствии с этим простой операцией графического вычитания легко
получить асимптотическую ЛАЧХ корректирующего звена
Lk (ω ) = L жел (ω ) − L0 (ω ) . (3.1-4)
По ней уже нетрудно восстановить передаточную функцию W k (p ) .

ПРИМЕР 3.1-1. Передаточная функция неизменяемой части сис-


темы
1
W ( p) = .
p ( p + 1)( 0 .1p + 1)
0

Требования к системе.
1) При отработке командных сигналов, меняющихся со скоростью до
10ед/с, ошибка не должна превосходить 0.1 ед..
2) Время регулирования t р ≈ 1с.
3) Ошибка воспроизведения гармонических сигналов с амплитудой Av
на частотах до 1рад/c должна быть не более 0.05 Av .
Последовательность расчёта.
1. Построить асимптотическую ЛАЧХ неизменяемой части системы
L0 (ω ) (рис. 3.2).
2. Построить желаемую ЛАЧХ L жел (ω ) .
ƒ В связи с тем, что согласно п.1 требований к системе при линейно
изменяющемся во времени командном сигнале допустима постоянная
ошибка, система должна иметь астатизм первого порядка. Поэтому
низкочастотная асимптота должна идти с наклоном -20 дБ/дек. В со-
ответствии с (2.10-22) добротность системы
v1 10 [ ед / c ]
K= = = 100 −1c .
ε (∞ ) 0.1[ ед ]
Следовательно, низкочастотная асимптота должна пересекать ось
частот при ω = 100 рад/с.
ƒ Частота среза определяется с учётом требуемого времени регули-
рования из (2.10-34):
(3 ÷ 4)π
ωc = ≈ 10 рад / c .

Таким образом, среднечастотный участок желаемой ЛАЧХ на этой
частоте пересекает ось абсцисс, имеет наклон -20 дБ/дек имеет
протяжённость, равную одной декаде, то есть занимает интервал
126
3.16 ≤ ω ≤ 31.6 .

ƒ Диапазон частот ω > 31.6 считаем высокочастотным. Наклон


высокочастотной асимптоты выбираем равным -60 дБ/дек, - та-
ким же, как наклон высокочастотной асимптоты неизменяемой
части системы.
ƒ Для того, чтобы упростить реализацию корректирующего звена,
низкочастотную и среднечастотные асимптоты соединяем от-
резком прямой с наклоном -40 дБ/дек. При этом следует учесть
требование по точности воспроизведения гармонического сиг-
нала: в соответствии с (2.10-33) на частоте 1 рад/c желаемая
ЛАЧХ должна пройти выше уровня 26 дБ.
L[ дБ ]

Lk
60
-20 дБ/дек
+40 дБ/дек

40 Lk

20
-20 дБ/дек
26 дБ
L жел
ω
0.1 0.33 1 3.16 10 31.6 100

-20

-40 дБ/дек L0
-40

-60 дБ/дек

-60

Рис. 3.2. Иллюстрация к методу желаемых ЛЧХ

3. Построить ЛАЧХ корректирующего звена, производя графическое вы-


читание отрезков прямых в соответствии с (3.1-4).
127
4. Замерить значения сопрягающих частот асимптотической ЛАЧХ кор-
ректирующего звена и записать соответствующее выражение для пе-
редаточной функции
1 1
100( p + 1)( p + 1)( p + 1)
Wk ( p) = 3.16 10 .
1 1
( p + 1)( p + 1) 2

0.33 31.6

3.2. Управляемость линейных стационарных систем

Непрерывная линейная система


r r r
x& ( t ) = A x ( t ) + B u ( t ) (3.2-1)
является полностью управляемой тогда и только тогда,
r когда она может
быть переведена из любого начального состояния x (t 0 ) в произвольный
r
момент времени t 0 в любое конечное состояние x (t1 ) за конечное время
t1 − t 0 .
r
Примем начальные условия нулевыми: x (t 0 ) = 0 . Тогда, в соответ-
ствии с формулой Коши
r t1 r
x ( t 1 ) = ∫ e 1 B u (τ )d τ .
A ( t −τ )
(3.2-2)
t0
Принимая во внимание выражение для матричной экспоненты в
виде бесконечного ряда
A(t 1 − τ ) A 2 (t 1 − τ ) 2
e A ( t1 −τ )
=E+ + + ... , (3.2-3)
1! 2!
равенство (3.2-2) можно записать в виде
r t1 r t1 r t 1( t − τ )2 r
x(t1 ) = B ∫ u(τ )dτ + AB ∫ ( t1 − τ )u(t )dτ + A B ∫ 1
2
u(τ )dτ + ...
t0 t0 t0 2!
Обозначим:

⎡ α i1 ⎤
r t1
( t1 − τ ) r
2 ⎢α ⎥
αi = ∫ u (τ )d τ = ⎢ ⎥.
i2
(3.2-4)
t0 i! ⎢ ... ⎥
⎢α ⎥
⎣ i , ni ⎦

128
Представим произведения A B в виде блочных матриц векторов
i
r
β:
⎡ r r r ⎤
A B = ⎢ β i1 β i 2 ...β i n ⎥ .
i
(3.2-5)
⎣ ⎦

Тогда
t1
(t −τ ) r
i
r
[ r r
]
nu r
A B∫
i 1
u (τ )dτ = β i1 β i2 ... β i nu = ∑ α iν β iν (3.2-6)
t0 i! ν =1

и
r ∞ nu r
x (t 1 ) = ∑ ν∑ α ν ⋅ β ν .
i =0 =1
i i
(3.2-7)
r
В результате вектор x (t1 ) может рассматриваться как линейная
r
комбинация векторов β iν , являющихся вектор-столбцами матриц
r
B, AB, A2B, A3B, ... . Иначе говоря, конечное состояние x (t1 ) принад-
лежит линейному подпространству, порождаемому вектор-столбцами
бесконечной последовательностью матриц B, AB, A B, A B, ... .
2 3

В этой последовательности должна появиться матрица A B , все


l

вектор-столбцы которой линейно зависят от вектор-столбцов предыду-


l −1
щих матриц B, AB, A B, ..., A B. Такая матрица обязательно должна
2

иметь место, так как в линейном n-мерном пространстве не может быть


более чем n линейно–независимых векторов. Отсюда же следует, что
l ≤ n.
Таким образом, можно записать
A l B = BΛ 0 + AB Λ 1 + ... + A l −1BΛ l −1 , (3.2-8)
где Λ i - соответствующие диагональные матричные коэффициенты

⎡λ i 1 0 ⋅ ⋅ ⋅ 0 ⎤
⎢0 λ ⋅⋅⋅ 0 ⎥
Λi = ⎢ i2
⎥. (3.2-9)
⎢⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⎥
⎢ ⎥
⎣ 0 0 ⋅ ⋅ ⋅ λ in ⎦

l +1
Очевидно, тем же свойством обладает и матрица A B , так как
A l +1B = AA l = ABΛ 0 + A 2 BΛ 1 + ... + A l −1BΛ l − 2 + A l BΛ l −1 . (3.2-10)

По индукции можно утверждать то же самое и для всех A B при k ≥ l .


k

129
r
Итак, конечное состояние x (t 1 ) принадлежит линейному подпро-
странству, порождаемому вектор-столбцами матриц
B, AB, A 2 B, ... , A n −1B
(здесь учтено, что l ≤ n ). Если эти вектор-столбцы не порождают n -
мерное пространство, то в такой системе можно достичь лишь тех со-
стояний, которые принадлежат подпространству меньшей размерности.
Таким образом, критерий управляемости формулируется следую-
щим образом:
r r r
Система x& (t ) = Ax (t ) + Bu (t ) полностью управляема тогда и
только тогда, когда ранг матрицы управляемости
U = [B AB A2B L An−1B] (3.2-11)
равен n , то есть полной размерности линейного пространства. При
этом говорят, что пара матриц {A, B} полностью управляема.

ПРИМЕР 3.2-1. Определить управляемость системы


x&1 = −4x1 + 5x2 − 5U ;

x& 2 = 3x1 − 2x2 + 3U ;

y = x1 .
Для этой системы
⎡− 4 5⎤ ⎡− 5⎤
A= ⎢ ⎥ , B = ⎢ 3⎥
⎣ 3 − 2⎦ ⎣ ⎦
и матрица управляемости
⎡ −5 35⎤
U = [A AB ] = ⎢ ⎥.
⎣ 3 − 21⎦
Определитель этой матрицы равен нулю, она имеет ранг меньше двух,
то есть порядка системы, и система является неуправляемой.
Отметим, что собственные числа матрицы динамики системы
λ1 = +1; λ2 = −7 ,
то есть система неустойчива. В тоже время передаточная функция по
выходной координате
5
Wuy ( p ) = − ,
p+7

130
у неё только один, устойчивый полюс и по ней не видно, что в действи-
тельности система неустойчива.
Матричная передаточная функция по вектору состояния
⎡ 5 ⎤

⎢ p + 7⎥
Wux ( p ) = ⎢ ⎥.
⎢ 3 ⎥
⎢⎣ p + 7 ⎥⎦
Ей соответствует решение дифференциального уравнения системы
r r ⎡− 5⎤ t −7 ( t −τ )
x (t ) = e x ( 0 ) + ⎢ ⎥ ⋅ ∫ e
At
u(τ )dτ .
⎣ ⎦3 0

Как видно, в вынужденной составляющей решения отсутствует одна -


неустойчивая - мода. Кроме того, независимо от управляющего сигнала
для координат вынужденной составляющей вектора состояния сущест-
вует линейная связь
x 2В (t ) = −0.6 x1В (t ) .

ПРИМЕР 3.2-2. Определить управляемость системы


x&1 = −4x1 + 5x2 − 10U ;

x& 2 = 3x1 − 2x2 + 3U ;

y = x1 .
Для этой системы
⎡− 4 5⎤ ⎡− 10⎤
A=⎢ ⎥ , B = ⎢ ⎥
⎣ 3 − 2⎦ ⎣ 3⎦
и матрица управляемости
⎡ − 10 25⎤
U = [A AB ] = ⎢ ⎥.
⎣ 3 − 36⎦
Определитель этой матрицы не равен нулю, она имеет ранг, равный
двум, то есть порядку системы, и система является полностью управ-
ляемой.
Отметим, что в данном случае полюсы передаточной функции
10( p + 1)
Wuy ( p ) = −
( p − 1)( p + 7)
полностью повторяют все собственные числа матрицы A .
131
3.3. Наблюдаемость линейных стационарных систем.

В теории автоматического управления большую роль играет зада-


ча восстановления вектора состояния по результатам наблюдения за
входом и выходом объекта.
Непрерывная система
v v v
x& (t ) = Ax (t ) + Bu(t )
(3.3-1)
v v
y (t ) = Cx(t )
v
называется наблюдаемой, если вектор состояния x (t 0 ) можно опреде-
r
лить, зная y (t ) на некотором интервале времени t = [t 0 , t1 ] . Если это
справедливо для любого t 0 , то система называется полностью наблю-
даемой. Задачей настоящего параграфа является вывод критерия на-
блюдаемости.
r
Достаточно рассмотреть задачу при u(t ) = 0 . Тогда
r r
y (t ) = Ce At x (0 ) . (3.3-2)
В развёрнутом виде - это система алгебраических уравнений

C11 x 1 + C12 x 2 + ... + C1n x n = y 1 (t 1 )

C 21 x1 + C 22 x 2 + ... + C 2 n x n = y 1 (t 1 )
, (3.3-3)
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
C ny x 1 + ... + C ny ,n x n = y ny (t n )
в качестве неизвестных в которой выступают координаты вектора со-
стояния. В связи с тем, что, как правило, n y < n , число уравнений ока-
зывается меньше числа неизвестных, и решение невозможно.
В соответствии с теоремой Кэли-Гамильтона каждая квадратная
матрица удовлетворяет собственному характеристическому уравнению:
An + α1An−1 + ... + α n−1A + α n E = 0 . (3.3-5)
Поэтому матричная экспонента, являющаяся степенным рядом относи-
тельно матрицы A , может быть представлена в виде полинома степени
n − 1. С учетом этого равенство (3.3-2) можно записать в виде:

132
r n −1 r
y (t ) = ∑ γ l (t ) ⋅ C ⋅ A l x ( 0 ) , (3.3-5)
l =0

где γ l (t ) – соответствующие коэффициенты этого полинома. Для i-й со-


ставляющей вектора выхода соответственно будем иметь
v n −1 v
y i (t ) = ∑ γ l (t )(CA l ) i x (0) . (3.3-6)
l =0

Здесь (CA ) i – i -я строка матрицы (CA ) .


l l

Если набор (CA ) i для i = 1,2,..., n y ; l = 0,1,2,..., n − 1 не содержит пол-


l

ного базиса, то есть n линейно независимых строк, иначе говоря, если


матрица
⎡ C ⎤
⎢ CA ⎥
⎢ ⎥
N = ⎢ CA 2 ⎥ (3.3-7)
⎢ ... ⎥
⎢ n −1 ⎥
⎣CA ⎦

имеет ранг, меньший, чем n , то в качестве ненулевого вектора началь-


r
ных условий x (0 ) ≠ 0 может быть выбран вектор, ортогональный всем
строкам матрицы N. Тогда в соответствии с (3.3-5) получим, что
r
y ( t ) = 0 для всех t , т.е. система не наблюдаема.
r
Теперь докажем, что если ранг матрицы N равен n , то x(t 0 ) может
быть
v определен с помощью конечного числа измерений вектора выхода
y (t ) . Обозначим
Γ(t k ) = [γ 0 (t k )E γ 1(t k )E ... γ n−1(t k )E ] , (3.3-8)
где Е – квадратная единичная матрица размером [n y × n y ] . Моменты
измерения t k выберем таким образом, чтобы для различных значений k
элементы γ i (t k ) отличались друг от друга. С учетом введенного обозна-
чения равенство (3.3-5) примет вид
r r
y ( t k ) = Γ ( t k )N x ( 0 ) . (3.3-9)
Известно, что ранг произведения любых двух матриц не превосхо-
дит ранга каждого из сомножителей. Ранг матрицы Γ ( t k ) не превосхо-
дит числа ее строк n y < n . Проводя многократные измерения на интер-
вале времени переходного процесса системы, построим расширенный
вектор выхода

133
r
⎡ ( t1 ) ⎤
y
r ⎢ yr ( t ) ⎥
YR = ⎢ 2 ⎥ (3.3-10)
⎢ ... ⎥
⎢r ⎥
⎣ y ( t n )⎦

и обозначим

⎡ Γ( t 1 ) ⎤
ΓR = ⎢ ... ⎥ . (3.3-11)
⎢ ⎥
⎣Γ( t n ) ⎦
Матрица Γ имеет n y × n строк. Моменты измерений должны быть
выбраны таким образом, чтобы выполнялось условие rank ΓR = n . Как
было обусловлено, ранг матрицы N также равен n . Поэтому уравнение
r r
ΓR ⋅ N ⋅ x ( 0 ) = Y R (3.3-13)
содержит n линейно независимых скалярныхv уравнений, то есть оно
может быть разрешено относительно вектора x(0) .
Таким образом, доказан следующий критерий полной наблю-
даемости стационарных линейных систем:
Линейная стационарная система вполне наблюдаема тогда и только то-
гда, когда ранг матрицы наблюдаемости N равен n .

ПРИМЕР 3.3-1. . Объект управления задан уравнениями


x&1 = −8 x1 + 3 x 2 + 3u ;
x& 2 = − x1 − 4 x 2 + 2u ;
y = x1 − 2 x 2 .
Этим уравнениям соответствуют матрицы
⎡− 8 3⎤ ⎡3⎤
A=⎢
− 1 − 4 ⎥; B = ⎢2⎥; C = [1 − 2].
⎣ ⎦ ⎣ ⎦
Определитель матрицы управляемости
⎡ 3 − 15⎤
U=⎢
⎣ 2 3⎥⎦
не равен нулю, поэтому система управляема. Матрица наблюдаемости

134
⎡ C ⎤ ⎡ 1 − 2⎤
N=⎢ ⎥=⎢ ⎥
⎣CA⎦ ⎣− 6 − 5⎦
Её определитель также отличен от нуля, следовательно, система
полностью наблюдаема.
Для данного объекта нетрудно рассчитать собственные числа
λ1 = −5; λ 2 = −7 ,
правые
r ⎡1⎤ r ⎡3⎤
v1 = ⎢ ⎥; v 2 = ⎢ ⎥
⎣1⎦ ⎣1⎦
и левые
rT rT
d1 = [− 0.5 1.5] ; d 2 = [0.5 − 0.5]
собственные векторы.
В соответствии с (2.4-27), (2.6-4) и (2.6-6) нетрудно получить пере-
даточные функции по векторам состояния и выхода:
⎡ 1.5 1.5 ⎤
⎢p + 5 + p + 7⎥
W x ( p) = ⎢ ⎥;
⎢ 1.5 + 0.5 ⎥
⎢⎣ p + 5 p + 7 ⎥⎦

1.5 0.5
W y ( p) = − + .
p+5 p+7
В данном случае полюсы передаточной функции по выходу полностью
отображают собственные числа матрицы динамики.

ПРИМЕР 3.3-2. . Объект управления задан уравнениями


x&1 = −8 x1 + 3 x 2 + 3u
; y = x1 − 3x 2 .
x& 2 = − x1 − 4 x 2 + 2u
Матрицы A и B здесь такие же, как и в предыдущем примере, следова-
тельно, объект управляем. Матрица выхода
C = [1 − 3].
Ранг матрицы наблюдаемости
⎡ C ⎤ ⎡ 1 − 3⎤
N=⎢ ⎥=⎢ ⎥
⎣CA⎦ ⎣− 5 15 ⎦
135
в данном случае меньше порядка объекта и равен единице, так как вто-
рой столбец пропорционален первому. Следовательно, данный объект
неуправляем.
Правые и левые собственные векторы матрицы динамики и пере-
даточная функция по вектору состояния такие же, как и в предыдущем
примере. Передаточная функция по выходу
3
W y ( p) = − .
p+5
У неё отсутствует полюс, равный второму собственному числу матрицы
A.
Определим свободное движение объекта по вектору состояния и
по выходу:
r r 2
λi t r
rT r
x (t ) = e x ( 0 ) = ∑ e v i d i x ( 0 ) ;
At

i =1 .
r
y (t ) = Cx (t ).
Получаем:
r ⎡− 0.5 1.5⎤ r ⎡1.5 − 1.5 ⎤ r
x (t ) = ⎢ ⎥ x ( 0 )e −5t
+ ⎢ ⎥ x (0)e −7 t ;
⎣− 0.5 1.5⎦ ⎣0.5 − 0.5⎦
r
y (t ) = [1 − 3]x (0)e −5t .
Если выбрать
r r ⎡3⎤
x (0 ) = v 2 = ⎢ ⎥ ,
⎣1⎦
r r
то так как векторы v 2 и d1 взаимно ортогональны, и их скалярное произ-
ведение равно нулю, получим
r ⎡3⎤
x (t ) = ⎢ ⎥ e − 7 t ,
⎣ 1⎦
в то время как
r
y (t ) = 0 .

136
3.4. Замена базиса в линейном конечномерном пространст-
ве

Линейное пространство R называется конечномерным, а число n –


числом измерений этого пространства или его размерностью
( dimR = n ), если в R существует n линейно независимых векторов, в то
время как любые n + 1 векторов в R линейно зависимы.
Система из nr линейно
r r независимых, заданных в определенном
порядке векторов e1 ,e 2 ,..., e n в n -мерном пространстве называется ба-
зисом этого пространства.
Если каждый из векторов базиса ортогонален любому другому век-
тору этого базиса, т.е. их скалярные произведения равны нулю, то такой
базис называется ортогональным. Если, кроме того, модуль каждого
вектора базиса равен единице, то базис называется ортонормирован-
ным. r r r r r
Векторы x, e1 ,e 2 ,..., e n , где x - любой вектор из R , линейно зави-
симы, так как их n + 1. Отсюда справедливо равенство:
r r r r
α 0 x + α1e1 + α 2 e2 + ... + α n en = 0 , (3.4-1)
откуда
r r r r
x = x e1e1 + x e 2 e 2 + ... + x en en . (3.4-2)
Здесь:
r
x e1, x e 2 ,..., x en - координаты вектора x в базисе {e} .
Столбец
⎡ x e1 ⎤
r ⎢x ⎥
xe = ⎢ e2 ⎥ (3.4-3)
⎢ ... ⎥
⎢ ⎥
⎣ x en ⎦
r
r координатным столбцом вектора x в этом базисе.
называют
x - вектор в пространстве, и только если в этом пространстве вы-
r
берем базис, то возникает понятие координатного вектор-столбца x e .
Если установим другой базис, то ему будет соответствовать другой ко-
ординатный вектор-столбец.
Пусть в n -мерном пространстве задано два базиса:
r r r
{e} : e1, e2 ,..., en
и

137
r r r
{f } : f1, f 2 ,..., fn .
Так как это векторы одного и того же пространства, то каждый из векто-
ров базиса {f } можно разложить через векторы базиса {e} :
r r r r
f1 = fe11e1 + fe 21e2 + ... + fen1en ;
r r r r
f 2 = fe12 e1 + fe 22 e2 + ... + fen 2 en ;
(3.4-4)
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
r r r r
f n = fe1n e1 + fe 2n e2 + ... + fenn en .
Коэффициенты f eik (здесь i –номер координаты, а k –номер расклады-
ваемого вектора) можно представить в виде квадратной матрицы
⎡ fe11 fe12 ... fe1n ⎤
⎢f fe22 ... fe2n ⎥
Fe = ⎢ e21 ⎥, (3.4-5)
⎢..... ..... ..... .....⎥
⎢f fe n2 ... fe nn ⎥⎦
⎣ e n1
или
[ ]
r r r
Fe = fe1 fe2 ⋅ ⋅ ⋅ fen . (3.4-6)
Каждый из столбцов матрицы F e – это координатные столбцы векторов
r r r
f1, f 2 ,..., fn базиса {f } в базисе {e} .
С учетом введенных обозначений систему равенств (3.4-4) можно
записать в виде
r r r r r r
⎧f1 = [e1 e 2 ... e n ] ⋅ fe1 = [e ] ⋅ fe1

⎪r r
f
⎪2 = [e ] ⋅ f e2
⎨ . (3.4-7)
⎪.......... .......... .......... .......... ..........
⎪r r
⎪f = [e ] ⋅ f
⎩n en

Можно ещё более упростить (укрупнить) эти равенства, используя поня-


тия блочных матриц:
[f ] [ ]
r r r r r r
1 f2 ⋅ ⋅ ⋅ f n = [e] ⋅ fe1 [e] ⋅ fe 2 ⋅ ⋅ ⋅ [e] ⋅ fen (3.4-8)
или, в итоге
[f ] = [e ] F e . (3.4-9)
138
Матрица F e называется матрицей перехода от базиса {e} к бази-
су {f } . Так как F e невырожденная, то
[e] = [f ] ⋅ E , f
(3.4-10)
где матрица
Ef = Fe -1 (3.4-11)
называется матрицей перехода от базиса {f } к базису {e} .
r r
ПРИМЕР 3.4-1. Пусть в R2 задан базис {e} векторами e1,e 2 (рис. 3.3).

r r
e2 f1

r
f2
r
e1

Р ис . 3 .3 . Св я зь ме ж д у в ек тора ми
р а зли ч ны х ба зис ов

Введем базис {f } следующим образом:


r r r
f1 = 1 ⋅ e 1 + 1 ⋅ e 2 ;
r r r
f2 = − 1 ⋅ e 1 + 0 ⋅ e 2 .
Запишем матрицу перехода от базиса {e} к базису {f } :

⎡1 − 1⎤
Fe = ⎢ ⎥.
⎣1 0 ⎦
Найдем обратную матрицу
⎡ 0 1⎤
Fe −1 = ⎢ ⎥
⎣− 1 1⎦
и, в соответствии с (3.4-10), получаем

[ ] [ ]
r r r r ⎡ 0 1⎤ r r r
[e1 e2 ] = f1 f2 ⋅ ⎢ ⎥ = − f2 f1 + f2 .
⎣− 1 1⎦
Этот результат подтверждается анализом рис. 3.3.

139
Рассмотрим, как связаны между
r собой компоненты, (координатные
столбцы) одного и того вектора x в разных базисах. В соответствии с
(3.4-2)
r r r r
x = x e1e1 + x e 2 e2 + ... + x en en (3.4-12)
и
r r r r
x = x f 1f1 + x f 2 f2 + ... + x fn f n . (3.4-13)
Приравнивая правые части последних двух равенств, получим
r r
[e] ⋅ x e = [f ] ⋅ x f , (3.4-14)
а с учётом (3.4-9)
r r
[e ] x e = [e ]F e x f (3.4-15)

Окончательно получаем
r r r r
xe = Fe xf ; x f = F e − 1 ⋅ x e . (3.4-16)

3.5. Линейные операторы и матрицы линейных операторов.


Отображение A линейного пространства X в линейное пространство
Y
A : X →Y
называют линейным преобразованием или линейным оператором, если
оно удовлетворяет двум условиям:
а)
r r r r r r
A ( x + v ) = A ( x ) + A (v ) для всех x,v ∈ X ; (3.5-1)
б)
r r r r
A (αx ) = αA ( x ) для всех x v ∈ X и любого α . (3.5-2)
r
rЕсли отображение A переводит вектор x в некоторый другой век-
тор y :
r r
A (x) = y , (3.5-3)
r r r r
то вектор y - называют образом вектора x , а x - прообразом вектора y .
Линейный оператор, отображающий линейное пространство R
n

само в себя, называется линейным оператором в R .


n

140
r r r r
Пусть x ∈ R ; y ∈ R и y = A ( x ) . Рассмотрим, как связаны в
n n

r r
этом случае координаты векторов x и y . Будем ориентироваться сна-
r r r
чала на базис [e] = [e1 e 2 ⋅ ⋅ ⋅ en ]. Очевидно при этом, что
r n r
x = ∑ x ek ek ; (3.5-4)
k =1

r n r
y = ∑ y ei ei . (3.5-5)
i =1

Рассмотрим, прежде всего, как действует оператор A на элемен-


ты базиса. Пусть
r r r r
A (e1 ) = a11e e1 + a21
e
e2 + ... + ane1en

................................................
r r r r
A (ek ) = a1ek e1 + a2ek e2 + ... + anke en (3.5-6)

.................................................
r r r r
A (en ) = a1en e1 + a2en e2 + ... + ann e
en
Из соотношений (3.5-3) и (3.5-4) следует
r n r
y = ∑ x A (e ) .
k =1
ek k (3.5-7)

Учтём (3.5-6):
r n n r
y = ∑ x ek ∑ a ike e i . (3.5-8)
k =1 i =1

Сопоставляя это равенство с (3.5-5), получим


r n
y ei = ∑ aike x ek , i = 1,2,..., n (3.5-9)
k =1

Запишем этот результат в матричной форме:


r r
y e = Ae ⋅ xe , (3.5-10)
r r
где, как и раньше y e и x e - координатные вектор-столбцы, соответст-
вующих векторов в базисе [e] , а матрица

141
⎡ a11 a12e ... a1en ⎤
e

⎢a e a22e
... a 2en ⎥
Ae = ⎢ 21 ⎥ (3.5-11)
⎢.......... ..... .....⎥
⎢ e e ⎥
⎣a n1 a ne2 ... a nn ⎦
называется матрицей оператора A в базисе [e] . Элементы её столб-
r r
цов по построению - это координаты векторов A (e 1 ), A (e 2 ).....
базисе [e] . Аналогично вводится понятие матрицы Af того же операто-
ра A в некотором другом базисе [f ] .
Рассмотрим теперь, как изменяется матрица оператора A при
r r
замене базиса в пространстве R . Пусть, как и прежде y = A ( x ) и
n

матрица Ae , в соответствии с (3.5-10) связывает между собой коорди-


r r
натные столбцы векторов x и y в базисе [e] .
Согласно ранее полученным результатам - соотношениям (3.4-16),
r r
x e = Fe ⋅ x f (3.5-12)
и
r r
y e = Fe ⋅ y f . (3.5-13)
Из этих двух соотношений и (3.5-10) легко выводится равенство
r r
y f = Af ⋅ x f , (3.5-14)
где
Af = Fe −1 ⋅ Ae ⋅ Fe . (3.5-15)
Эта формула позволяет связать между собой матрицы одного и то-
го же оператора в различных базисах. В математике такие матрицы на-
зываются подобными. Ранее (п.2.4.3) уже отмечалось, что подобные
матрицы имеют одинаковые собственные числа.

ПРИМЕР 3.4-2. Пусть имеется базис [e] (рис. 3.4)


1. Зададим оператора A его действием на векторы базиса [e] :
r r r
A (e1 ) = e1 + 2e 2 ;
r r
A (e 2 ) = −e1 .
Тем самым мы определили матрицу оператора A в базисе [e] :

⎡1 − 1⎤
Ae = ⎢ ⎥.
⎣2 0 ⎦

142
r
2. Зададим вектор x в базисе [e] :
r r r
x = e1 − e 2 .
r r
A (e1 ) y

r
e2
r r
A (e2 ) e1

r r r
f1 x
f2

Рис. 3.4. Действие оператора


на вектор

Отсюда
r ⎡ 1⎤
xe = ⎢ ⎥ .
⎣ − 1⎦
3. Рассчитаем координатный вектор, используя (3.5-14):
r r ⎡1 − 1⎤ ⎡ 1 ⎤ ⎡2⎤
y e = Ae xe = ⎢ ⎥ ⋅ ⎢− 1⎥ = ⎢2⎥ .
⎣2 0 ⎦ ⎣ ⎦ ⎣ ⎦
4. Введем новый базис [f ] :
r r
f1 = −e2 ;
r r r
f2 = −e1 − e2 .
Тогда матрица перехода от базиса [e] к базису [f ] будет иметь вид

⎡ 0 − 1⎤
Fe = ⎢ ⎥.
⎣ − 1 − 1⎦
5. Определим матрицу Af оператора A в базисе [f ] :

⎡ 1 − 1⎤ ⎡1 − 1⎤ ⎡ 0 − 1⎤ ⎡ 1 2⎤
Af = Fe −1 AeFe = ⎢ ⎥ ⋅⎢ ⎥ ⋅⎢ ⎥ =⎢ ⎥ .
⎣− 1 0 ⎦ ⎣2 0 ⎦ ⎣− 1 − 1⎦ ⎣− 1 0⎦

143
r
6. Найдём координатный столбец вектора x в базисе [f ] . В соответст-
вии с рис. 3.4
r r r
x = 2f1 − f 2 .
С другой стороны, согласно (3.5-12)
r r
xf = Fe −1 ⋅ xe . (3.5-16)
Оба подхода дают один и тот же результат:
r ⎡2⎤
xf = ⎢ ⎥ .
⎣ − 1⎦
r
В итоге получим координатный столбец вектора y в базисе [f ] :
r r ⎡0⎤
y f = Af x f = ⎢ ⎥ .
⎣ − 2⎦

ПРИМЕР 3.5-1. Дана матрица Ae оператора A в базисе [e] :

⎡0 1⎤
Ae = ⎢ ⎥
⎣0 0⎦
r r
и два вектора - f1 и f 2 , координатные столбцы которых в том же базисе
имеют вид:
r ⎡ 1⎤ r ⎡0⎤
f e1 = ⎢ ⎥ ; f e 2 = ⎢ ⎥ ,
⎣2⎦ ⎣3⎦
то есть
r r r
f1 = e 1 + 2e 2 ;
r r
f 2 = 3e 2 .
Примем эти векторы в качестве нового базиса и вычислим в нём матри-
цу Af оператора A . Для этого выполним следующие действия.
1. Составим матрицу перехода от базиса [e] к базису [f ] :

⎡1 0 ⎤
Fe = ⎢ ⎥.
⎣ 2 3⎦
2. Вычислим обратную матрицу:

144
⎡ 1 0⎤
Fe −1
=⎢ 2 1⎥ .
⎢⎣− 3 3 ⎥⎦
3. Вычислим матрицу Af :

⎡ 2 3⎤⎥

Af = Fe −1 ⋅ Ae ⋅ Fe = ⎢ ⎥.
4
⎢− − 2⎥
⎣ 3 ⎦

3.6. Замена базиса в пространстве состояний динамиче-


ской системы

Пусть заданы уравнения системы


r r r
x = A x (t ) + B u (t ) ;
r r (3.6-1)
y (t ) = C x (t ) .
Для этой системы могут быть найдены матрицы управляемости
U = [B AB A 2 B ... A n −1B ] , (3.6-2)
наблюдаемости
⎡ C ⎤
⎢ CA ⎥
N =⎢ ⎥, (3.6-3)
⎢ ... ⎥
⎢ n −1 ⎥
⎣ CA ⎦
передаточной функции
W y ( p ) = C( pE − A) −1 B . (3.6-4)
Могут быть также записаны выражения для векторов состояния и выхо-
да
r r t
r
x (t ) = Φ(t − t 0 )x (t 0 ) + ∫ Φ(t − τ )Bu (τ )dτ ;
t0
(3.6-5)
r r t
r
y (t ) = CΦ(t − t 0 )x (t 0 ) + ∫ CΦ(t − τ )Bu (τ )dτ .
t0

Полученные в предыдущих разделах результаты не были ограни-


чены выбором какого-либо конкретного базиса в пространстве состоя-

145
ний. Все они были справедливы для любого базиса, в котором записаны
матрицы A , B , C , Ф , W , U , N . Для определённости назовём этот ба-
зис базисом [e] . В этом случае можно подразумевать, что символы
всех векторов и матриц в выражениях (3.6-1) - (3.6-5) снабжены индек-
сом " e ". В дальнейшем нам будет удобно выбирать вполне опреде-
ленный базис в пространстве состояний X таким образом, чтобы мат-
рицы имели «хорошую», каноническую форму. Такой выбор базиса мо-
жет оказаться целесообразным, так как, во-первых, канонические пред-
ставления матриц системы имеют минимальное число ненулевых эле-
ментов и поэтому удобны для моделирования и других вычислений, а
во-вторых, канонические представления позволяют получить чрезвы-
чайно простые алгоритмы синтеза управления.
Рассмотрим перевод уравнений (3.6-1) в некоторый новый базис
F . Отметим при этом, что, переходя к новому базису в пространстве
состояний, преобразовывая базис для пространства вектора состояний,
не будем изменять базис пространства
r r входов и пространства выходов
системы. Заменим в (3.6-1) x e на x f согласно (3.5-12):
r r r
Fe ⋅ x& f = Ae ⋅ Fe x f + Be u ;
r r (3.6-6)
y = C eF e x f .
−1
Умножая слева обе части дифференциального уравнения на F , полу-
чим:
r r r
x& f = Fe −1 AeFe x f + Fe −1Be u . (3.6-7)
Учитывая (3.5-15), и вводя дополнительные обозначения
Af = Fe −1 ⋅ Ae ⋅ Fe ;

Bf = Fe −1 ⋅ Be ; (3.6-8)

C f = C e ⋅ Fe ,
окончательно получаем уравнения системы в базисе [f ] :
r r
x& f = Af + B f ⋅ u (t );
(3.6-9)
r r
y& (t ) = C f ⋅ x (t ).

ПРИМЕР 3.6-1. Пусть система задана схемой моделирования, приве- r


денной на рис. 3.5. Выберем в качестве координат вектора состояний x
в исходном базисе [e] выходы интеграторов 1 и 2. В результате полу-
чим уравнения системы в исходном базисе:

146
r r r
x& e (t ) = Ae x e (t ) + Be ⋅ u (t );
r r
y ( t ) = Ce ⋅ x e ( t ) ,

u x e1 xe2 y
1 2

Рис. 3.5. Схема моделирования в исходном


базисе [ e ]

где
1 − 1⎤ ⎡1⎤
Ae = ⎡ ; Be = ⎢ ⎥ ; Ce = [0 1].
⎢⎣1 − 1⎥⎦ ⎣0⎦
Зададим матрицу перехода к новому базису:
1 1⎤
Fe = ⎡ ,
⎢⎣1 0⎥⎦
которой соответствуют уравнения
r r r
f1 = e1 + e2 ;
r
f2 = e1 .
Вычислим обратную матрицу
0 1⎤
Fe −1 = ⎡ .
⎢⎣1 − 1⎥⎦
В соответствии с (3.6-8) находим
⎡0 1⎤ ⎡0 ⎤
Af = ⎢ ⎥; B f = ⎢ ⎥; Cf = [1 0] .
⎣0 0 ⎦ ⎣ 1⎦
Этим матрицам соответствуют уравнения
x& f1 = x f2 ;

x& f2 = u ;

y = x f1 ,

147
которым, в свою очередь, отвечает схема, приведённая на рис. 3.6.

xf 2 xf1 y
u

Рис. 3.6. Схема


моделирования в базисе [f ]

Собственные числа системы, естественно, сохранились, так как


матрицы А l и Af подобны. Связь между входом и выходом осталась
неизменной, а схема моделирования стала заметно проще.

3.7. Вычисление матрицы преобразования базиса в про-


странстве состояний динамической системы с помо-
щью матриц управляемости и наблюдаемости
Пусть матрицы управляемой системы представлены rв двух раз-
личных базисах [e] и [f ] в пространстве состояний вектора x :
{Ae , B e }, {Af , B f } .
Рассмотрим матрицу управляемости:
U f = [B f Af B f Af2 B f ... Afn −1 B f ] . (3.7-1)
В соответствии с (3.6.-8)
Af Bf = Fe −1 Ae Be :

Af2Bf = Fe −1AeFeFe −1AeFeFe −1Be = Fe −1Ae2Be ;


………….

Afk = Fe −1Aek Be . (3.7-2)


Учитывая эти равенства в (3.7-1), получим выражение для перевода
матрицы управляемости из одного базиса в другой:
U f = Fe −1Ue . (3.7-3)

Умножая это равенство справа на Ue , получаем:


T

Uf UeT = Fe −1UeU eT . (3.7-4)


Если система управляема, то rank U e = rank U f = n . Это значит,
что матрица U e имеет n линейно независимых строк и может быть
представлена в виде

148
r
⎡z1T ⎤
⎢ rT ⎥
z
Ue = ⎢ 2 ⎥ , (3.7-5)
⎢ ... ⎥
⎢ rT ⎥
⎣zn ⎦
r r r
где векторы z1, z2 ...zn – линейно независимы. Следовательно, матрица
r
⎡z1T ⎤
⎢ rT ⎥
z r r r
UeU eT = ⎢ 2 ⎥ ⋅ [z1 z2 ... zn ], (3.7-6)
⎢ ... ⎥
⎢ rT ⎥
⎣ zn ⎦
которая является матрицей Грама, имеет положительный определитель,
а значит – невырождена. Следовательно,
Fe −1 = Uf UeT (UeUeT )−1 . (3.7-7)
Если система имеет скалярный вход (u-скаляр), то матрица B ста-
r
новится вектором (B = b ) , а матрица Ue – квадратной, в управляемой
системе – невырожденной. Тогда:
Fe −1 = Uf Ue−1 . (3.7-8)

Отметим, что в данном рассуждении Fe – матрица перехода от базиса


[e] к базису [f ] , поэтому обратная ей - это матрица перехода от базиса
[f ] к базису [e] :
Fe −1 = Ef . (3.7-9)
Рассмотрим другой случай, когда переход от базиса [e] к базису
[f ] задан парой матриц
{Ae ,C e }, {Af ,C f }
некоторой наблюдаемой системы. Запишем матрицу наблюдаемости
(3.3-7) и с учётом (3.6-8) проведём аналогичные предыдущим преобра-
зования:
⎡ C f ⎤ ⎡ C eF e ⎤
⎢C A ⎥ ⎢C AF ⎥
N f = ⎢ f f ⎥ = ⎢ e e e ⎥ = N eFe . (3.7-10)
⎢ ⋅⋅⋅ ⎥ ⎢ ⎥
⎢C A n −1 ⎥ ⎢C A n −1F ⎥
⎣ f f ⎦ ⎣ e e e⎦
Так как система наблюдаема, то

149
rank (N e ) = rank (N f ) = n
и матрица наблюдаемости имеет n линейно независимых столбцов
r r r
N = [z1 z2 ⋅ ⋅ ⋅ zn ] ,
а квадратная матрица
rT
⎡ z1 ⎤
⎢zr T ⎥ r r r
N T N = ⎢ 2 ⎥[z1 z2 ⋅ ⋅ ⋅ zn ]
⎢⋅ ⋅ ⋅⎥
⎢ rT ⎥
⎣z n ⎦
не вырождена. Умножим обе части равенства (3.7-10) слева на N e :
T

N eT N f = N eT N eFe , (3.7-11)
откуда получим
Fe = (N eT N e ) −1 N eT N f . (3.7-12)
Если система имеет скалярный выход, то
Fe = N e−1N f . (3.7-13)

3.8. Канонические представления систем


3.8.1. Управляемое каноническое представление системы со ска-
лярным входом

Пусть в некотором исходном базисе [h] пространства состояний


X записаны уравнения движения объекта со скалярным управлением:
r& r r
x h (t ) = Ah x h (t ) + bhu(t ) ; (3.8-1)
r r
y (t ) = Ch x h ( t ) . (3.8-2)
Болееr общая запись связывает не координатные столбцы, а сами
векторы в x ∈ X с помощью соответствующего оператора A :
r& r r
x (t ) = A ⋅ x ( t ) + b ⋅ u ( t ) . (3.8-3)

{ }
r
Если система A ,b управляема, то n векторов
r r r
b , A b, ... , A n −1b образуют базис в пространстве X в силу того, что
rank U = n . Следовательно, в пространстве X в качестве базиса может
быть выбрана следующая система векторов:

150
r r
⎧e1 = b;
⎪ r
⎪er = A b;
⎪ 2
⎪r r
⎨e3 = A b
2
(3.8-4)

⎪............
⎪r r
⎪en = A n −1b.

Пусть характеристический полином оператора A , а значит и его матри-
цы в преобразованном базисе имеет вид:
ϕ A (λ ) = λn + αλn −1 + ... + α n −1 λ + λn . (3.8-5)
Построим ещё один базис - базис [u ] следующим образом:
r r r r r
u1 = α n −1 b
{ + α A
n −2 {
b + ... + α A n −2
1 123
b + n −1
123 ;
A b
e1 e2 e n −1

r r r r r
u 2 = α n −2 b
{ + α A
n −3 {
b + ... + α A n −3
1 123
b + n −2
123 ;
A b
e1 e2 en − 2 en −1

r r r r r
u 3 = α n −3 b
{ + α A
n−4 {
b + ... + α A n −4
1 123
b + n −3
123 ;
A b
e1 e2 en − 3 en − 2

⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
r r r r
u n −2 = α 2 b + α
{ 1 { {;A b + A 2
b
e1 e2 e3

r r r
u n −1 = α 1 b +
{ {;A b
e1 e2

r r
un = b (3.8-6)
{.
e1

Проверим, действительно ли это базис? Матрица перехода от базиса


[e] к базису [u ] в соответствии с (3.4-4) и (3.4-5) имеет вид:

151
⎡α n −1 α n −2 α n −3 ... α 2 α1 1⎤
⎢α α n −3 α n − 4 ... α 1 1 0⎥
⎢ n −2 ⎥
⎢α n −3 α n − 4 α n −5 ... 1 0 0⎥
U e = ⎢⎢ ... ... ... ... ... ... ...⎥⎥ . (3.8-7)
⎢ α2 α1 1 ... 0 0 0⎥
⎢ ⎥
⎢ α1 1 0 ... 0 0 0⎥
⎢⎣ 1 0 0 ... 0 0 0 ⎥⎦
Эта матрица является треугольной, её определитель равен про-
изведению диагональных элементов, умноженному на (−1) , т.е. не ра-
n

вен нулю. Следовательно, U e не вырождена и система векторов


r r r
{u1 u 2 ...u n } действительно образует базис в пространстве X.
Вычислим теперь представление матрицы оператора A в базисе
[u ] . При этом воспользуемся равенством
r
( ) r r r r
n
A fk = a1k u1 + a2 k u 2 + ... + ank u n = ∑ aiku A (u i ) .
u u u
(3.8-8)
i =1

С учётом (3.8-6)
r r r r r r
A (u1 ) = A n b + α 1 A b + ... + α n −1 A b + α n b − α n b =
n −1

r r
= ( A n + α 1 A n −1 + ... + α n −1 A + α n E )b − α n b = (3.8-9)
r r
= ϕ A ( A )b − α n b.
r r
По теореме Кэлли-Гамильтона ϕ A ( A ) = 0 , а значит A (u1 ) = −α n b , от-
куда следует, что an1 = −α n и a i 1 = 0 при i < n , то есть
u u

r
auT1 = [0 0 ... 0 − α n ] . (3.8-10)
Далее действуем аналогичным образом:
r r r r r r
A (u 2 ) = A b + α 1 A b + ... + α n −2 A b + α n −1b − α n −1 b
n −1 n−2
{r , (3.8-11)
144444442 r
4444444 3 un
u1

откуда следует, что a12 = 1, a i 2 = 0 при 1 < i < n; an 2 = −α n −1 , то есть


u u u

r
auT2 = [0 1... 0 − α n −1 ] .
Далее:
r r r r r r
A (u 3 ) = A n −2 b + α 1 A n −3 b + ... + α n −3 A b + α n −2 b − α n − 2 b
{ , (3.8-12)
144444442 r
4 4 4 4 4 4 4 3 r
un
u2

152
откуда следует, что
a13u = 0; a 23
u
= 1; a iu3 = 0 при 2 < i < n; anu3 = −α n −2 ,
то есть
r
auT3 = [0 0 1 0 ... 0 − α n − 2 ] .
Вычислим предпоследний столбец матрицы:
r r r r r
A (u n −1 ) = A b + α 1 A b + α 2 b − α 2 b
2
{ , (3.8-13)
1444r2444 3 r
un
un − 2

откуда следует, что ai,n-1 = 0 для 1 ≤ i < n − 2 , an −2 ,n −1 = 1, a n- 1,n-1 = 0 и


u u u

an,n-
u
1
= −α 2 , то есть
r
auT n −1 = [0 0 ⋅ ⋅ ⋅ 0 1 0 − α n − 2 ] .
Наконец,
r r r r r r
A (u n ) = A b + α 1b − α 1b = u n −1 − α 1u n , (3.8-14)
откуда следует, что a i,n = 0 для 1 ≤ i < n − 1, и an −1,n = 1, a n,n = −α 2 , то
u u u

есть
rT
aun = [0 0 ⋅ ⋅ ⋅ 0 1 − α 1 ].
Таким образом, матрица AU оператора A в базисе [u ] имеет вид:

⎡ 0 1 0 ... 0 ⎤
⎢ 0 0 1 ... 0 ⎥
⎢ ⎥
⎢ 0 0 0 ... 0 ⎥
AU = ⎢ ... ... ... ... ... ⎥. (3.8-15)
⎢ ⎥
⎢ 0 0 0 ... 0 ⎥
⎢ ⎥
⎢ 0 0 0 ... 1 ⎥
⎢⎣− α n − α n −1 − α n − 2 ... − α 1 ⎥⎦
r r
Так как b = u n , то есть является последним вектором базиса [u ] , то ко-
r
ординатный столбец вектора b в этом базисе
r
buT = [0 0 0 ... 0 0 1] . (3.8-16)
r
{ }
Пара AU , bU называется управляемым каноническим пред-
ставлением (УКП) системы с одним (скалярным) входом. Матрица AU
называется сопровождающей по отношению к полиному ϕ A ( λ) .

153
Таким образом, мы доказали, что если исходная система управ-
ляема, то
r в пространстве состояний Х существует базис, в котором
{ }
пара Α, b имеет управляемое каноническое представление.
r
Если в некотором исходном базисе [h] заданы матрицы AH , bH и,
если система управляема, то для того, чтобы вычислить их (матриц)
УКП, достаточно вычислить коэффициенты характеристического поли-
нома ϕ A (λ ) . После этого может быть вычислена матрица пре-
образования от исходного базиса [h] к УКП в соответствии с (3.7-8):
U H−1 = U U U H−1 . (3.8-17)
Далее индекс “h” для системы в исходном базисе будем опускать.

ПРИМЕР 3.8-1. Для системы


r& r r
x = Ax + b u ;
r
y = Cx
известны матрицы

⎡2 3⎤ r ⎡1 ⎤
A=⎢ ⎥, b = ⎢ ⎥, C = [1 1] .
⎣4 5⎦ ⎣⎢2⎦⎥
Нетрудно вычислить матрицу
⎡1 8 ⎤
U ≡ UH = ⎢ ⎥.
⎣ 2 14 ⎦
Её определитель U = −2 ≠ 0 , откуда следует, что система управляема
и, значит, для неё существует УКП. Вычислим характеристический по-
лином:
λ −2 −3 ⎤
ϕ A ( λ ) = λE − A = ⎡⎢ = λ2 −
{ 7λ −
{2 .
⎣ − 4 λ − 5⎥⎦ α1 α2

Это позволяет сразу же записать матрицы A и B в базисе УКП:


0 1⎤ r 0
AU = ⎡ , bU = ⎡ ⎤ .
⎢⎣2 7⎥⎦ ⎢⎣1⎥⎦

Векторно-матричные уравнения системы в УКП имеют вид:


r r r
x& u = Au x u + bu u;
r
y = Cu x u .

154
Для того, чтобы найти матрицу CU , требуется рассчитать матрицу пере-
хода от исходного базиса к базису УКП. Для этого предварительно вы-
числим
⎡− 7 4 ⎤ ⎡0 1⎤
U H−1 = ⎢ ⎥ и U = ⎢ 1 7⎥ .

U
⎣ 1 0 .5 ⎦ ⎣ ⎦
Тогда искомая матрица
⎡0 1⎤ ⎡− 1 4 ⎤ ⎡ 1 − 1/ 2⎤ ⎡1 1⎤
U H−1 = ⎢ =
⎥ ⎢ 1 − 1/ 2⎥ ⎢0 1/ 2 ⎥ , U H = ⎢0 2⎥ .
⎣ 1 7 ⎦⎣ ⎦ ⎣ ⎦ ⎣ ⎦
После этого в соответствии с (3.6-8) находим
CU = C HU H = [1 3] .

3.8.2. Передаточная функция и структурная схема для системы в


УКП
Уравнения системы
r& r r
xU (t ) = AU xU (t ) + bU u(t )
(3.8-18)
y = CU xU
со скалярным входом u (t ) и скалярным выходом y (t ) , где матрицы AU и
r
bU определяются выражениями (3.8-15) и (3.8-16), а матрица CU имеет
вид
CU = [c u1 c u 2 L c un ] , (3.8-19)
можно записать в развёрнутом виде :
x& u 1 = x u 2 ;

x& u 2 = x u 3 ;

x& u 3 = x u 4 ;
(3.8-20)
... ... ...

x& u n −1 = x u n ;

x& u n = −α n x u 1 − α n −1 x u 2 − ... − α 2 x u n −1 − α 1 x u n + u ;

y = c u 1 x u 1 + c u 2 x u 2 + ... + c u n x u n . (3.8-21)

155
Этим уравнениям соответствует схема, представленная на рис.3.7.
y

cu n c u n −1 cu 3 cu 2 cu 1

u xu n x u n −1 xu 3 xu 2 xu1

-α 1 -α 2 -α n-2 -α n-1 -α n

Рис. 3.7. Схема моделирования системы в УКП

В соответствии с этим рисунком передаточная функция системы имеет


вид
cu 1p − n + cu 2 p − ( n −1) + ... + cu n −1p −2 + cu n p −1
W ( p) = =
1 + α1p −1 + α 2 p −2 + ... + α n p −n
(3.8-22)
cu 1 + cu 2 p + ... + cu n −1p n −2 + cu n p n −1
= .
p n + α 1p n −1 + α 2 p n −2 + ... + α n −1p + α n
Отметим, что статический передаточный коэффициент
cu 1
W (0 ) = . (3.8-23)
αn

3.8.3. Идентификационное каноническое представление системы с


одним (скалярным) выходом
С помощью рассуждений, аналогичных проведённым в п.3.8.1,
можно получить следующие результаты.
Если пара матриц {A,C} полностью наблюдаема, то в простра-
нстве состояний Х всегда существует базис, в котором пара {A,C}
имеет идентификационное каноническое представление (ИКП):

156
⎡0 0 ... 0 −αn ⎤0
⎢1 0 ... 0 0 − α n −1 ⎥
⎢ ⎥
⎢0 1 ... 0 0 − α n −2 ⎥
AI = ⎢⎢... ... ... ... ... ... ⎥⎥ ; (3.8-24)
⎢0 0 ... 0 0 − α 3 ⎥
⎢ ⎥
⎢0 0 ... 1 0 − α 2 ⎥
⎢⎣ 0 0 ... 0 1 − α 1 ⎥⎦

CI = [0 0 ... 0 0 1] . (3.8-25)
Отметим, что:
r
AIT = AU ; CIT = bU . (3.8-26)
Если в некотором исходном базисе [h] заданы матрицы
AH , C H и, если система полностью наблюдаема, то для того, чтобы
вычислить их (матриц) ИКП, достаточно вычислить коэффициенты ха-
рактеристического полинома ϕ A ( λ ) . После этого может быть вычислена
матрица преобразования от исходного базиса [h] к ИКП в соответствии
с (3.7-13):
I H
−1
= N H−1N I . (3.8-27)
Если известна матрица BH при векторе управления в исходном ба-
зисе, то с учётом (3.6-8) в базисе ИКП она может быть определена с
помощью соотношения
BI = I H
−1
BH . (3.8-28)

3.8.4. Передаточная функция и структура для системы в ИКП


В соответствии с видом матриц AI и CI уравнения системы со ска-
лярным входом u и скалярным выходом y имеют вид:

⎧ x& i 1 = −α n x i n + bi 1u ;
⎪ x& = x − α x + b u ;
⎪ i2 i1 n −1 i n i2

⎪ x& i 3 = x i 2 − α n −2 x i n + bi 3 u ;
⎨ (3.8-29)
⎪... ... ... ... ... ...
⎪ x& i n −1 = x i n − 2 − α 2 x i n + bi n −1u ;

⎩ x& i n = x i n −1 − α 1 x i n + bi n u ;

157
y = xi n . (3.8-30)
Этим уравнениям соответствует структурная схема, представленная на
рис. 3.8.

bi 1 bi 2 bi n −2 bi n −1 bi n

xi 1 xi 2 x i n −2 x i n −1 y
xi n
-α n -α n-1 -α 3 -α 2 -α 1

Рис. 3.8. Схема моделирования системы в ИКП

В соответствии с этим рисунком передаточная функция системы имеет


вид:
bi 1 p − n + bi 2 p − ( n −1) + ... + bi n −1 p −2 + bi n p −1
W ( p) = =
1 + α 1 p −1 + α 2 p −2 + ... + α n p −n
(3.8-31)
bi 1 + bi 2 p + ... + bi n −1 p n −2 + bi n p n −1
= .
p n + α 1 p n −1 + α 2 p n −2 + ... + α n −1 p + α n
Отметим, что статический передаточный коэффициент
bi 1
W (0 ) = . (3.8-32)
αn

158
3.9. Обратная связь по состоянию, обеспечивающая задан-
ное (желаемое) расположение собственных чисел в
замкнутой системе с одним (скалярным) входом
Даны уравнения полностью управляемого объекта управления в
некотором исходном базисе
r& r r
x H (t ) = AH x(t ) + bH u(t );
r (3.9-1)
y (t ) = C H x H ,
каждая координата вектора состояния которого доступна для измерения.
Требуется синтезировать такое управление, которое бы обеспечило
требуемое качество отработки внешнего командного сигнала v (t ) .
Динамические свойства системы управления, в основном, опреде-
ляются её собственными числами, то есть нулями характеристического
полинома
n
ϕ A (λ ) = ∏ (λ − λi ) =λn + α 1λn −1 + ... + α n . (3.9-2)
i =1

Время переходного процесса каждой моды определяется расстоя-


нием до мнимой оси вещественной части; колебательность - соотноше-
нием мнимой и вещественной частей соответствующих собственных чи-
сел. Эти зависимости могут быть проанализированы при изучении ха-
рактеристик типовых звеньев, кроме того, они рассматриваются в об-
ширной учебной литературе по теории автоматического регулирования и
управления.
В соответствии со структурной схемой, приведённой на рис. 3.9,
сформируем сигнал управления объектом в виде:
r
u(t ) = LH x H (t ) + k v v (t ) , (3.9-3)
где: LH – некоторая матрица-строка обратной связи:
LH = [l h 1 lh2 ... l h n ]; (3.9-4)

k v – коэффициент по командному сигналу.


Тогда уравнение системы примет вид:
r r r r r
x& H (t ) = AH x H (t ) + bH LH x H (t ) + bH k v v (t ) , (3.9-5)
или
r& r r v
x H (t ) = AH x H (t ) + bH k v (t ) ,
C
(3.9-6)

где AH - матрица замкнутой системы в исходном базисе:


C

r
AHC = AH + bH LH . (3.9-7)

159
y
v u Объект
kv
r
x
Регулятор L

Рис. 3.9. Структурная схема замкнутой


системы

Поскольку объект полностью управляем, то существует базис [u ] ,


{ }
r
в котором пара A, b имеет управляемое каноническое представление
r
{ }
AU , bU . Поэтому перейдём к записи уравнений системы в базисе УКП.
В соответствии с (3.4-16) произведём замену
r r
x H = U H xU . (3.9-8)
Тогда из (3.9-1) получим
r r r
U H x& U (t ) = AHU H x U (t ) + bH u(t ) ; (3.9-9)
r
y (t ) = C HU H x U . (3.9-10)
−1
Умножив уравнение (3.9-9) слева на U H , будем иметь
r& r r
x U (t ) = AU x U (t ) + bU u(t );
r , (3.9-11)
y (t ) = C U x U ( t ) ,
r
где AU bU и CU - соответствующие матрицы в УКП.
Используя подстановку (3.9-8), из (3.9-3) получим
r
u(t ) = LU x U + k v v (t ) , (3.9-12)
где матрица обратной связи в базисе УКП
LU = LHU H . (3.9-13)
В результате, уравнение замкнутой системы в базисе управляе-
мого канонического представления будет иметь вид:
r r r
x& U (t ) = AUC x U (t ) + bU ⋅ k v v (t ) . (3.9-14)

Здесь AU является сопровождающей матрицей по отношению к харак-


C

теристическому полиному замкнутой системы


160
n
ϕ AC (λ ) = ∏ (λ − λ3i ) =λn + γ 1λn −1 + ... + γ n , (3.9-15)
i =1

поэтому она имеет стандартный вид


⎡ 0 1 0 ⋅⋅⋅ 0 ⎤
⎢ 0 0 1 ⋅⋅⋅ 0 ⎥
⎢ ⎥
AUC = ⎢ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⋅⋅⋅ ⎥ . (3.9-16)
⎢ 0 0 0 ⋅⋅⋅ 1 ⎥⎥

⎢⎣ −γ n − γ n −1 − γ n −2 ⋅⋅⋅ − γ 1 ⎥⎦
С другой стороны, очевидно, что
r
A = AU + bU LU .
C
U (3.9-17)

Отсюда сразу же следует связь между коэффициентами характеристи-


ческого полинома (3.9-2) объекта и коэффициентами характеристическо-
го полинома (3.9-14) желаемой системы:

− γ i = −α i + l U n −i +1 , i = 1, 2, K, n . (3.9-18)
Далее обусловлены следующие действия.
1. Задание желаемых собственных чисел замкнутой системы
λ13 , λ32 ,..., λ3n .
2. Вычисление коэффициентов характеристического полинома замкну-
той системы γ 1 , γ 2 , ...,γ n в соответствии с выражением (3.9-14).
3. Вычисление согласно (3.9-17) коэффициентов матрицы обратной
связи в базисе УКП:
lU ,n −i +1 =α i −γ i , i = 1,2,..., n . (3.9-19)
4. Вычисление в соответствии с (3.9-12) и (3.8-17) матрицы обратной
связи в исходном базисе:
LH = LU U U U H−1 . (3.9-20)

5. Определение величины коэффициента k в соответствии с требова-


v

ниями по статике.
Так например, если требуется обеспечить единичную статику по
командному сигналу v , то это значит, что установившееся значение пе-
реходной функции h(t ) замкнутой системы должно быть равно единице.
Одним из свойств передаточной функции устойчивой системы является
равенство:
lim h(t ) = limWvy ( p ) . (3.9-21)
t →∞ p →0

161
Согласно структурной схеме, приведённой на рис. 3.9, передаточная
функция между командным v и выходным y сигналами имеет вид:
Wvy ( p ) = k v ⋅ W ( p ) , (3.9-22)

где передаточная функция W (p ) , может быть определена аналогично


выражению (3.8-22). Таким образом, получаем:
cU1
h( ∞ ) = k v = 1, (3.9-23)
γn
откуда окончательно,
γn
kv = . (3.9-24)
cU1

162
3.10. Синтез управления в многомерной системе. Задача
разделения каналов

В предыдущих разделах, посвящённых синтезу, рассматривались


объекты со скалярным управлением (входом) и скалярным выходом. На
практике встречаются и более сложные объекты. Один из них был упо-
мянут в разделе 2.2. Это смесительный бак, у него две входные величи-
ны – два входных потока с различными концентрациями растворённого
вещества, и две выходных – концентрация и расход выходного потока. В
качестве другого примера может быть взят объект, связанный с пере-
моткой некоторой полосы с одного рулона на другой. Для этого объекта
выходные переменные – это натяжение и линейная скорость перемотки;
входные – напряжения или токи приводных двигателей моталки и раз-
матывателя. Наконец, самолёт. В качестве выходных переменных могут
выступать углы тангажа, курса и крена; в качестве входных, управляю-
щих, - угловые положения руля высоты, руля направления и элеронов.
Как правило, в таких объектах каждая выходная величина зависит
от всех входных. В то же время, при синтезе управления такими объек-
тами часто требуется обеспечить не только заданные динамические и
статические свойства системы, но и независимое управление по каждой
из выходных переменных.
Пусть уравнения объекта имеют вид
r r r
x& (t ) = Ax (t ) + Bu(t ) ; (3.10-1)
r r
y (t ) = Cx(t ) , (3.10-2)
где размерность вектора состояния [n × 1] , вектор управления и вектор
выхода имеют одинаковую размерность [ p × 1] . Такую же размерность
r
имеет вектор командного сигнала v , поступающий на вход системы.
r
Требуется синтезировать управление u такое, чтобы:
1) i –я составляющая вектора выхода y i зависела только от i –й
составляющей командного сигнала v i ;
2) по каждому из каналов была обеспечена заданная динамика,
Yi (p)
иными словами, передаточная функция Wvi ,yi (p) = , имеющая за-
Vi (p)
данные полюсы;
3) для каждого из каналов был обеспечен заданный статический
коэффициент передачи.

3.10.1. Разделение исходного объекта на подсистемы интеграторов


Представим (3.10-2) в виде

163
⎡C1 ⎤
r r ⎢⎢C2 ⎥⎥ r
y = Cx = x,
⎢M⎥
⎢C ⎥
⎣ p⎦
где Ci - строки матрицы C . Тогда i -я координата вектора выхода
r
y i = Ci x .
Рассмотрим процедуру многократного дифференцирования коор-
динат вектора выхода:
r r r
y i′ = C i x& = C i A x + C i B u ;
r r r
y i′′ = C i A 2 x + C i AB u + C i B u ′;
r r r r
y i( 3 ) = C i A 3 x + C i A 2 B u + C i AB u ( 1) + C i B u ( 2 ) ; (3.10-3)
L LL LL LL LL LL LL L LL LL LL
r r r r
y i( m ) = C i A m x + C i A m −1B u + C i A m −2 B u ( 1) + ... + C i B u ( m −1)
Сократим запись:
r r m−1 r
y i( m) = Ci Am x + Ci Am−1Bu + ∑Ci Am−1−ν Bu (ν ) (3.10-4)
ν =1

Для каждой координаты найдем максимальное число дифферен-


r
цирований, при котором еще не появляется производная вектора u , то
есть, найдем такие числа m i , что
C i A m i −1B ≠ 0 и C i A m i − 2 B = 0 .
Таким образом, получим систему уравнений:
r r
y 1( m1 ) = C1 A m1 x + C1 A m1−1B u ;
r r
y 2( m2 ) = C 2 A m2 x + C 2 A m2 −1B u ;
(3.10-5)
LLLLLLLLLLL
(m ) m r m −1 r
y p p = C p A p x + C p A p Bu .
Запишем эту систему равенств в векторно-матричном виде:
m −1
⎡ y 1 1 ⎤ ⎡ C1A 1 ⎤ ⎡ C1A 1 ⎤
(m ) m

⎢ y ( m2 ) ⎥ ⎢C A m2 ⎥ r ⎢C A m2 −1 ⎥ r
⎢ 2 ⎥=⎢ 2 ⎥x + ⎢ 2 ⎥Bu = −F* xr + B*ur . (3.10-6)
⎢ M ⎥ ⎢ M ⎥ ⎢ M ⎥
⎢ ( mp ) ⎥ ⎢ mp ⎥ ⎢ m p −1 ⎥
⎣ y 1 ⎦ ⎣C1A ⎦ ⎣C1A ⎦
164
Обозначим
⎡ y1 1 ⎤
(m )

r ⎢ y 2( m2 ) ⎥
q=⎢ ⎥ (3.10-7)
⎢ M ⎥
⎢ ( mp ) ⎥
⎣y1 ⎦
и
m −1
⎡ C1A 1 ⎤ ⎡ C1A 1 ⎤
m

⎢C A m2 ⎥ ⎢C A m2 −1 ⎥
F* = − ⎢ 2 ⎥; B* = ⎢ 2 ⎥. (3.10-8)
⎢ M ⎥ ⎢ M ⎥
⎢ mp ⎥ ⎢ m p −1 ⎥
⎣C1A ⎦ ⎣C1A ⎦
Тогда (3.10-6) можно переписать в виде
r r r
q = −F* x + B* u . (3.10-9)
Если задача разделения каналов имеет решение, то матрица B * не
вырождена и:
r r r
u = B *−1q + B *−1F* x . (3.10-10)
На рис. 3.10 представлена промежуточная структурная схема, со-
ответствующая уравнениям (3.10-1), (3.10-2) и (3.10-8).
→ → → →
q u x y
В*-1 В ∫ C

B*-1 F*

Рис. 3.10. Промежуточная структурная схема

Для этой схемы справедливы уравнения


r r r
x& = ( A + BB*−1F* )x + BB*−1q ;
r r (3.10-11)
y = Cx .
Обозначим
A = A + BB*−1F* ;

(3.10-12)
B = BB . −1
*

165
Теперь (3.10-11) превратится в
r r r
⎧⎪ x& = A x + B q ;
⎨r V
r
V
(3.10-13)
⎪⎩ y = C x ,
r
а структурная схема промежуточной системы с входным вектором q
примет вид, представленный на рис. 3.11.

→ → →
q x y
B
V ∫ C

A
V

Рис. 3.11. Структурная схема системы


r
относительно входного вектора q

r r
С другой стороны, вектор выхода y связан с вектором q равенством
(3.10-7) и поэтому схеме, представленной на рис. 3.11 полностью экви-
валентна схема, составленная из p подсистем последовательно вклю-
чённых интеграторов. Эта схема представлена на рис. 3.12.

∫ ∫ ∫ ∫
q1 y1

m1 интеграторов

∫ ∫ yi
qi

mi интеграторов

∫ ∫
qp yp

mp интеграторов

Рис. 3.12. Структурная схема объекта, представленного в


виде изолированных подсистем интеграторов

Общее количество интеграторов не может быть больше n , то есть:

166
p

∑1 m ≤ n .
i=
i

Таким образом, система { A , B } (3.10-13), у которой в качестве входного


r V V

вектора выбран вектор q ,


а) развязана по каналам, то есть y i зависит только от q i для всех
значений i ;
p

б) имеет ∑1 m
i=
i
собственных значений, равных нулю.

Теперь систему { A , B } нужно попытаться привести к удобному ба-


V V
зису, в котором синтезировать обратную связь, реализующую желаемые
собственные числа по каждому каналу.
Прежде всего, установим некоторые свойства матриц A и B . Ана-
V V
логично (3.10-4) запишем:
r r m −1
= C i A x + C i A B q + ∑ C i A i B q (ν ) .
( mi ) mimi −1 m −1−ν
y i
V V V V V
ν =1

С другой стороны, y i
( mi )
= q i . Отсюда следует:
mi
1) Ci A
V
= 0 для всех i = 1,2,…,p ; (3.10-14)

⎡ q1 ⎤
2) Ci A
V
mi −1 r
V
mi −1
B q = Ci A b1 b2
r r
V
[ V V V
]
r ⎢ q2 ⎥
... bp ⋅ ⎢ ⎥ = qi ,
⎢ M ⎥
(3.10-15)

⎢q ⎥
⎣ ny ⎦
откуда:
m i −1
r
C i AV bi = 1; (3.10-16)
V

m i −1
r
Ci A bj = 0 , при j ≠i ; (3.10-17)
V
V

m i −ν
r
3) C i A
V
b j = 0 для ν > 1 и для всех j , i . (3.10-18)
V

3.10.2. Преобразование базиса в пространстве Rn


Перейдём от исходного базиса [e] к новому базису [f ] с помощью
некоторой матрицы преобразования F е . При выборе базиса [f ] учтем,
следующие обстоятельства:
• Объект управляем, поэтому ранг матрицы управляемости
167
r r r r r r r
U = [b1 b2 ... bp M A bp ]
n −1 n −1

V
b1 ... A
V
bp M ... M A
V
b1 ... A
V
(3.10-19)
V V V V V V V

равен порядку системы;


• так как каждый канал этой системы с размерностью mi управ-
ляем, то столбцы
r r m1 −1
r r r m p −1
r
b1, A
V
b1 , ... , A
V
b1, ... , b p , A
V
b p , ... , A
V
b p
V V V V V V

линейно независимы.
Теперь выберем базис [f ] , соответствующий следующим коорди-
натным столбцам:
r m1−1
r r m1− 2
r r r
fe1 = A

b1 ; fe 2 = A

b1 ; ...; fe m1 = b1 ;
∨ ∨ ∨

r m2 −1
r r m2 − 2
r r r
fe m1+1 = A

b2 ; fe m1+2 = A

b2 ; ... ; fe m1+m2 = b2 ; (3.10-20)
∨ ∨ ∨

..................................
r m p −1
r r mp − 2
r r r
fe m1+...+mp−1+1 = A

bp ; fe e m1+...+mp−2 = A

bp ; f e m1+...+mp = bp ;
∨ ∨ ∨

p
Если ∑m i < n , то оставшуюся часть векторов базиса [fост ] можно выби-
i =1

рать, перебирая оставшиеся столбцы матрицы U :


m1
r m1+1 r ν 1 −1
r
A
V
b ,
1 VA b1 ,... A
V
b1
V V V
r ν
до тех пор, пока следующий вектор A b1 не будет выражаться в виде
V V
линейной комбинации всех предыдущих векторов базиса. Далее доба-
m2
r m2 +1 r
вим A b2 , A b2 и так далее, пока число векторов базиса не достиг-
V V V V

нет числа n . Тогда матрица преобразования базиса [e] в базис [f ] бу-


дет иметь вид

r r r r r r
Fe = [A [fост ]].
m1−1 m −2 m2 −1

V
b1 L A 1 b1 L b1 L A
V
b2 L b2 L bp
∨ V V V V V ∨

Рассмотрим вид матрицы B в базисе [f ] . Первый столбец этой


V
r
матрицы, то есть вектор b1 совпадает с m1 -м столбцом базиса [f ] ; вто-
r
рой столбец матрицы B , то есть вектор b2 совпадает с ( m1 + m2 ) -м
столбцом базиса [f ] и так далее. Следовательно,

168
r
⎡ β1 0 L 0⎤
⎢ r ⎥
⎢ 0 β2 L 0⎥
Bf = ⎢L L L L⎥ , (3.10-21)
⎢ r ⎥
⎢0 0 L βp ⎥
⎢⎣ 0 0 L 0 ⎥⎦
где
⎡0⎤ ⎫
⎢0⎥ ⎪
r ⎢ ⎥ ⎪⎪
β i = ⎢L⎥ ⎬mi строк. (3.10-22)
⎢ ⎥ ⎪
⎢0⎥ ⎪
⎢⎣ 1 ⎥⎦ ⎪⎭
Теперь обратим внимание на матрицу С . В соответствии с (3.6-8)
r r
⎡ 1⎤
C ⎡ C1fe1 L C1fen ⎤
⎢C ⎥ r r ⎢ r r ⎥
Сf = C F е
2

⎢M⎥
[ r C
⎢ L
f
= ⎢ ⎥ ⋅ fe1 fe2 L fen = ⎢ 2 e1 ] L
L
C2fen ⎥
L ⎥
. (3.10-23)
⎢ ⎥ ⎢ r r ⎥
C
⎣ p⎦ ⎢⎣Cpfe1 L Cpfen ⎥⎦
Из этого равенства с учётом (3.10-14), (3.10-16), (3.10-17) получим:
⎡s1 0 L 0 0⎤
⎢ 0 s L 0 0⎥
Cf = ⎢ ⎥,
2
(3.10-24)
⎢ M M M M M⎥
⎢ ⎥
⎣ 0 0 L sp 0⎦
где
si = [1 0 L 0] . (3.10-25)
14 42443
mi

Наконец, займемся матрицей Af . Прежде всего, рассмотрим важ-


V

ную интерпретацию элементов матрицы Af . В соответствии с (3.6-8)


Аf = Fе −1 Ае Fе ,
поэтому
Fе Аf = Ае Fе . (3.10-26)

169
Левую часть этого равенства можно расписать следующим образом:
⎡a11f a12f L a1fn ⎤
[ r r
Fе Аf = fe1 fe2 ... fen ⋅ ⎢ M
r ⎢
] M M

M ⎥=
⎢⎣anf 1 anf 2 L annf
⎥⎦
r r r r r r
= [a11f fe1 + ... + anf 1fen a12f fe1 + ... + anf 2fen L a1fn fe1 + ... + ann
f
fen ] .
С другой стороны:
r r
Ае Fе = [Ае fe1 L Аеfen ].
Таким образом, получаем:
r r r r
Aefei = a1fi fe1 + a2f i fe 2 + ... + anif fen . (3.10-27)
Это означает, что элементы i -го столбца матрицы Af
V

⎡ a1i ⎤
f

r f ⎢a2f i ⎥
ai = ⎢ ⎥
⎢L ⎥
⎢⎣a f ⎥⎦
ni
r r
являются коэффициентами разложения произведения A fei ≡ Ae fei по


r r r
координатным векторам fe1 , fe 2 , ..., fen .
r
Используя , (3.10-20), сопоставим произведения A fei с координат-

ными столбцами векторов базиса [f ] :


r m
r
A fe1 = A 1 b1 ;
∨ ∨ ∨
r m1−1
r r
A fe 2 = A b1 = fe1 ;
∨ ∨
r
∨ (3.10-28)
m1− 2
r r
A fe 3 = A b1 = fe 2 ;
∨ ∨ ∨

LLLLLLLL .
Так как A fe1 , A fe m1+1 т. д. не совпадают ни с одним из собственных
V V
p
векторов с номерами от 1 до n − ∑ mi − 1, то в соответствующих столб-
i =1

цах матрицы Af на позициях строк с номерами, большими p , могут на-


V
ходиться ненулевые элементы. Такие ячейки матрицы помечены симво-
170
лом " × ". Кроме того, на данном этапе нет смысла рассматривать столб-
цы этой матрицы с номерами, большими p . В результате получаем вы-
ражение для матрицы A в базисе [f ] :

171
010…0 000…0 : 000…0
001…0 000…0 : 000…0
…………. …………. : …………. m1
000…1 000…0 : 000…0
000…0 000…0 : 000…0
000…0 010…0 : 000…0
0 0 0… 0 001…0 : 000…0
………… …………. : …………. m2
000…0 000…1 : 000…0
000…0 000…0 : 000…0
Af = …………. …………. ………….
V
000…0 000…0 : 010…0
000…0 000…0 : 001…0
…………. …………. : …………. mp
000…0 000…0 : 000…1
000…0 000…0 : 000…0
*00…0 *00…0 : *00…0
…………. …………. : …………. n − ∑ mi
*00…0 *00…0 : *00…0
m1 m2 mp n − ∑ mi

Эту же матрицу удобнее записать в блочном виде:


⎡ A11 0 L 0 A10 ⎤
⎢ 0 A 22 L 0 A 20 ⎥
⎢ ⎥
A = ⎢ M M M M M ⎥. (3.10-29)
V f
⎢ 0 0 LA p p A p 0 ⎥⎥

⎢⎣ A 01 A 02 LA 0 p A 00 ⎥⎦
r
Разобьём вектор состояния x на систему ( p + 1) частных векторов
и обозначим
r
z
⎡ 1⎤
⎢ zr ⎥
r ⎢ 2⎥
xf = ⎢ M ⎥ , (3.10-30)
⎢ zr ⎥
⎢ rp ⎥
⎢⎣ z 0 ⎥⎦

172
r
где zi имеет размерность [mi × 1] . Тогда уравнения (3.10-13) в базисе
[f ] примут вид:
r r r
⎡ z&1 ⎤ ⎡ A11 0 L 0 A10 ⎤ ⎡ z1 ⎤ ⎡ β 1 0 L 0 ⎤ ⎡ q1 ⎤
⎢ r& ⎥ ⎢ r
A20 ⎥ ⎢ z 2 ⎥ ⎢ 0 ⎥ ⎢ ⎥
r
⎢z2 ⎥ ⎢ 0 A22 L 0
⎥ ⎢ ⎥ ⎢ β2 L 0 ⎥ ⎢q 2 ⎥
⎢ M ⎥ =⎢ M M M M M ⎥∗⎢ M ⎥+⎢ M M M M ⎥∗⎢ M ⎥;
⎢ r& ⎥ ⎢ ⎢ r ⎥ ⎢ ⎥
A p 0 ⎥⎥ ⎢z p ⎥ ⎢ 0
r
⎢zp ⎥ ⎢ 0 0 L Ap p
⎢r ⎥ 0 L βp ⎥ ⎢ M ⎥
⎢⎣zr& ⎥⎦ ⎢⎣ A01 A02 L A0 p A00 ⎥⎦ ⎢⎣ z 0 ⎥⎦ ⎢⎣ 0 0 L 0 ⎥⎦ ⎢⎣q p ⎥⎦
0

r
z
⎡ ⎤
⎡ y 1 ⎤ ⎡s1 0 L 0 0⎤ ⎢ r1 ⎥
⎢y ⎥ ⎢ 0 s L 0 z
0⎥ ⎢ 2 ⎥
⎢ 2⎥ = ⎢ 2
⎥ ∗⎢ M ⎥. (3.10-31)
⎢ M ⎥ ⎢M M M M M⎥ ⎢r ⎥
⎢y ⎥ ⎢ 0 0 L s z
⎣ p⎦ ⎣ 0⎥⎦ ⎢ rp ⎥
p
⎢⎣z0 ⎥⎦
Отсюда следуют уравнения для частных подсистем:
r r r r
z& i = A ii z i + A i 0 z 0 + β i q i (3.10-32)
r
y i = s i zi , (i = 1,2,..., p )
r p r r
z& 0 = ∑ A0ν zν + A00 z 0 . (3.10-33)
ν =1

Раскроем систему дифференциальных уравнений для i -й подсистемы:


r
⎧z& i 1 = zi 2 + a1i 10 z0 = zi 2 + g i 1

⎪z& i 2 = zi 3 + g i 2


⎨................. , (3.10-34)

⎪z& i ,mi −1 = zi ,mi + g i ,mi −1

⎪⎩z& i ,mi = g i ,mi + q i
{y i = zi 1
где a - первая строка матрицы Ai 0 . Такой подсистеме соответствует
i 10
1

структурная схема, представленная на рис. 3.13.

173
g i mi gi 2 gi1

qi zi mi zi 3 zi 2 zi 1
∫ ∫ ∫ yi

Рис. 3.13. Структурная схема частной подсистемы

Из сопоставления этой схемы со схемой, приведённой на рис. 3.12, сле-


дует:
а) zi 1 = y i ; ziν = y i при ν > 1;
(ν )

б) q iν = 0 и Aν 0 = 0 для ν = 1,2,..., p .
Таким образом, выходы интеграторов частных подсистем, пока-
r
занных на рис. 3.12, совпали с координатами вектора x в базисе [f ] .
Кроме того, все блочные матрицы A00 , A10 ,..., A p 0 в (3.10-29)- нулевые.
3.10.3. Формирование управления
Работая в базисе [f ] , мы имеем p изолированных подсистем,
сумма выходов которых подаётся на вход общей подсистемы с матри-
p
цей динамики A00 размерности n − ∑ mi :
i =1
r r r
⎧z&1 = A11z1 + β 1q1; y 1 = z11 ;

⎪...................

⎨zr& = A zr + βr q ; y = z ; (3.10-35)
⎪ p pp p p p p p1


⎪zr& = A zr + ∑ A zr .
p

⎩ 0 00 0
ν =1
0ν ν

Соответствующая структурная схем представлена на рис. 3.14.


r
Пары матриц { Aii , β i } для i = 1, 2 , ... , p имеют форму УКП, при-
чем, каждая из матриц A ii имеет только нулевые собственные значения.
Это вполне согласуется с тем, что в п. 3.10.1 было произведено преоб-
разование объекта на подсистемы последовательно включённых инте-
граторов. Сформируем управление q i для i = 1, 2 , ... , p в следующем
виде:
r
qi = ki v i (t ) + l fi zi (t ) , (3.10-36)

174
А11

q1 →
β1 ∫ →
А01

z1 z0
... ..... .... ..... .... ..... .... ∑ ∫

qp zp

→ A0p A00
βp

Ap,p

Рис. 3.14. Структурная схема объекта в базисе [f ]

где
l fi = [l if1 l if2 K l if,m i ] -

матрица обратной связи для i -й подсистемы в базисе [f ] .


Тогда получим следующее дифференциальное уравнение для i -й под-
системы:
r& r r r r
z i = Aii z i + β i l fi z i + β i k i v i ,
или
r r r
z& i = χ fi z i + β i k i v i . (3.10-37)

Нетрудно убедиться, что матрица динамики i -й подсистемы в базисе [f ]


имеет вид

⎡0 1 0 L 0 ⎤
⎢0 0 1 L 0 ⎥
⎢ ⎥
χ fi = ⎢ M M M M M ⎥. (3.10-38)
⎢ ⎥
⎢0 0 0 L 1⎥
⎢⎣l if1 l if2 l if3 L l if,mi ⎥⎦
Следовательно, определены характеристические полиномы подсистем:
ϕ i ( λ ) = λmi − l if,mi λmi −1 − l if,mi −1λmi −2 − ... − l if1 . (3.10-39)
Согласно (3.8-22) а также с учетом (3.10-13), (3.10-24) и (3.10-37) запи-
шем выражение для передаточной функции замкнутой i -й подсистемы:

175
ki
Wv i y i ( p ) = . (3.10-40)
p mi − l if,mi p mi −1 − ... − l if1
Очевидно:
ki
W v i y i (0 ) = . (3.10-41)
− l if1
Задавая расположение полюсов и статику для каждой подсистемы,
в итоге получим матрицы:
⎡l f 1 0 L 0 0⎤ ⎡k 1 0 L 0 ⎤
⎢0 l L 0 0⎥ ⎢0 k L 0 ⎥
Lf = ⎢ ⎥ ; k=⎢ ⎥.
f2 2
(3.10-42)
⎢M M M M M⎥ ∨ ⎢ M M M M⎥
⎢0 0 L l 0⎥⎦ ⎢0 0 L k ⎥
⎣ f ,p ⎣ p⎦

Возвращаясь в исходный базис для уравнений (3.10-13), получим:


LV = Lf Fе −1 . (3.10-43)
r
При этом вектор q формируется в соответствии с выражением
r r r
q(t ) = LV x(t ) + k∨ v (t ) . (3.10-44)

Учитывая (3.10-10), окончательно получим:


r r r r r
u = B* F* x + B* LV x + B* kV V (t ) = Lx + kV ,
−1 −1 −1
(3.10-45)

где
L = B*−1 (F* + LV ); k = B*−1 kV . (3.10-46)

На этом можно закончить синтез, если часть системы, оказавшаяся вне


обратной связи, имеет допустимые динамические свойства. Если же нет,
например, A00 - неустойчива, то приходится идти на то, чтобы ввести
r
обратную связь L0 , по z0 , по крайней мере, через один из каналов (q r ) ,
оставив полностью развязанными остальные ( p − 1) каналов. В этом
случае k r , l fr , l f 0 нужно рассчитывать совместно. Связь L0 должна обес-
V

печить «надзор» за бывшими ранее без контроля ( n − ∑ mi ) полюсами


(собственными числами) системы. Эта часть расчета может быть произ-
ведена по обычной методике синтеза системы с одним входом. Резуль-
тирующая структура в базисе [f ] приведена на рис. 3.15.

176
l f1

А11

v1 q1 →
k1
V β1 ∫ →
А01

z1
............................................

vi ki qi zi
∫ A0i

V βi

A ii ∑
l fi

............................................

vp kp qp zp

→ A0p
V βp

App

l fp


vr kjr qr zj
∫ A0r


V βr

Arr
A00

l fr

l f0

Рис. 3.15. Структурная схема системы в базисе [f ]

3.10.4. Итоговый алгоритм


1) Расчет чисел mi , i = 1,2,..., p :

⎧Ci A m−1B ≠ 0;
mi = mmax ⎨ (3.10-47)
⎩Ci A B = 0.
m −2

177
Эти числа можно также находить непосредственно из схемы в перемен-
ных состояния.
2) Вычисление матриц F* ,B* :
m −1
⎡ C1 A 1 ⎤ ⎡ C1 A 1 ⎤
m

F* = − ⎢ M ⎥; B* = ⎢ M ⎥B. (3.10-48)
⎢ ⎥ ⎢ m p −1

⎢⎣C p A ⎥⎦ ⎢⎣C p A ⎥⎦
mp

−1
3) Вычисление B* . Если B* - вырождена, то задача разделения
каналов не имеет решения.
4) Вычисление матриц A, B :
V V

A = A + BB*−1 F* ; B = BB*−1 . (3.10-49)


V { V
B
v

5. Построение матрицы Fe :
r r r r r
Fe = ⎡⎢ A 1 b1 M...M b1 MM A 2 b2 M...M b2 M...M bp M[fост ]⎤⎥ .
m −1 m −1
(3.10-50)
⎣V V V V V V V ⎦
6. Расчет коэффициентов характеристических уравнений каналов, то
есть строк l fi . Для этого предварительно должны быть заданы наборы
желаемых собственных чисел ( λi 1 , λi 2 , ... , λi mi ) по каждому из кана-
лов, после чего в соответствии с равенством
mi


ν =1
( λ − λ iν ) =λm − l if,m λm −1 − l if,m −1λm − 2 − ... − l if1
i
i
i
i
i
(3.10-51)

следует рассчитать
l fi = [l if1 ... l if,mi ]. (3.10-52)
и сформировать матрицу
⎡l f 1 0 L 0 ⎤
⎢0 l L 0⎥
Lf = ⎢ ⎥ ..
f2

⎢M M M M⎥
⎢ ⎥
⎣ 0 0 L l fp ⎦

7. Расчет (построение в соответствии с выбранным базисом) матрицы


A00 и вычисление ее собственных чисел.
8. Принятие решения о необходимости завязки каналов для коррекции
собственных чисел полинома ϕ 0 ( λ ) . В случае необходимости - вы-
брать канал для коррекции и далее провести для него расчет по ме-

178
тодике синтеза системы с одним входом. В конечном итоге должна
быть получена Lf - полная матрица обратной связи промежуточной
системы в базисе [f ] .
9. Расчет матрицы k по заданным коэффициентам Wi (0) :
V

k i = −Wi (0)l if1 (3.10-53)


V

и
⎡k 1 0 L 0 ⎤
⎢V ⎥
⎢ 0 k 2 L 0 ⎥
kV = ⎢ . (3.10-54)
M⎥
V
M M M
⎢ ⎥
⎢ 0 0 L kp ⎥
⎣ V ⎦

10. Расчет матрицы обратной связи промежуточной системы в исходном


базисе
LV = Lf Fe −1. (3.10-55)

11. Расчет результирующей матрицы обратной связи


L = B*−1(F* + LV ) . (3.10-56)

12. Расчет матрицы передаточных коэффициентов по вектору команд-


ных сигналов
k = B*−1 kV . (3.10-57)

Вектор управления формируется традиционным образом:


r r r
u ( t ) = L x ( t ) + kv ( t ) . (3.10-58)
При необходимости может быть синтезирован идентификатор (наблю-
датель) неизмеряемых координат вектора состояния.

179
3.11. Основы построения идентификаторов состояния (на-
блюдателей)
3.11.1. Наблюдатель Люенбергера полного порядка
3.11.1.1. Синтез архитектуры наблюдателя
Рассмотрим линейную стационарную систему, которая описывает-
ся векторно-матричными дифференциальными уравнениями:
r r r
⎧ x& (t ) = Ax (t ) + Bu(t );
⎨r r (3.11-1)
⎩y (t ) = Cx(t ).
Для такой системы существуют алгоритмы модального синтеза, которые
позволяют найти управление:
r r r
u (t ) = Lx (t ) + kv (t ) , (3.11-2)
обеспечивающее заданные динамику и статику системы. Проблема за-
ключается в необходимости использования вектора обратной связи для
формирования такого управления. Фактически в распоряжении разра-
r
ботчика системы управления лишь вектор выхода y (t ) . Возникает во-
r r
прос: как, наблюдая за вектором y (t ) , восстановить вектор x (t ) , или
)r r
найти его оценку x (t ) ? При этом ошибка оценки вектора x (t )
r r )r
e ( t ) = x ( t ) − x (t ) (3.11-3)
должна быть относительно малой, и тем более, с течением времени не
должна расти.
Будем полагать, что разработчику достаточно хорошо известны
) ) )
параметры объекта, то есть оценки A, B, C , матриц A, B, C . Более
того, положим
) ) )
A = A, B = B, C = C . (3.11-4)
В этом случае, если построить аналоговую или цифровую модель объ-
екта в соответствии с уравнениями
)r& )r r
x = Ax (t ) + Bu(t );
(3.11-5)
)r )r
y (t ) = Cx (t ) ,
как показано на рис. 3.16, то можно было бы ожидать выполнения ра-
венств
)r r )r r
x = x и y = y. (3.11-6)

180
r r
u Объект
x r
Рис.4 y
)r
x
В
Модель
объекта А

Рис. 3.16. Неудачный вариант построителя


оценки вектора состояния

Однако, априорное знание объекта (в том числе, матриц A , B и C ) яв-


ляется приближённым, параметры его могут дрейфовать во времени,
начальные условия для вектора состояния, которые следовало бы под-
ставить в модель, неизвестны. Поэтому в действительности в такой
схеме ошибка оценки вектора состояния может иметь склонность к неог-
раниченному росту с течением времени.
Американским учёным Д.Г.Люенбергером впервые были изучены
структуры работоспособных асимптотических идентификаторов (наблю-
дателей, восстановителей) вектора состояния, названных позднее его
именем. Основополагающая идея состоит в том, чтобы в рассмотренную
структурную схему ввести дополнительную обратную связь по ошибке
r
оценки вектора y , заведомо обеспечивающую асимптотическое затуха-
ние ошибки оценки вектора состояния. Внешне структурная схема на-
блюдателя Люенбергера полного порядка, которая приведена на рис.
3.17, совпадает с одной из форм известного фильтра Калмана. Разли-
чие в том, что матрица K , которая в фильтре Калмана называется его
именем (матрицей Калмана), в наблюдателе Люенбергера рассчитыва-
ется из других соображений.

181
r r r r
u x& x y
В ∫ C

A
объект
r
ey
K
)r& )r
x x
B
∫ C )r
y
A Модель
объекта
Наблюдатель

Рис. 3.17. Наблюдатель Люенбергера


полного порядка

В соответствии с рис.3.17 уравнение наблюдателя будет иметь


вид:
)r& )r r r
( )r
x ( t ) = Ax ( t ) + Bu ( t ) + K y ( t ) − y ( t ) .) (3.11-7)
Получим уравнение для ошибки оценки вектора состояния. Для этого в
равенство (3.11-3) подставим выражения для вектора состояния и его
оценки из (3.11-1) и (3.11-7):
r r r )r r r
( )r
e& (t ) = Ax(t ) + Bu (t ) − Ax (t ) − Bu(t ) − K Cx(t ) − Cx(t ) , )
откуда
r r
e& (t ) = L ⋅ e(t ) , (3.11-8)
где
L = (A − KC) (3.11-9)
называют матрицей динамики наблюдателя. Выражение (3.11-8) являет-
ся однородным дифференциальным уравнением. Решение его имеет
вид:
r r
e(t ) = exp(L ⋅ t ) ⋅ e (0) . (3.11-10)

Поведение ошибки во времени зависит от собственных чисел матрицы


наблюдателя L . Выбрав их соответствующим образом, можно доста-
точно быстро свести ошибку к нулю, и получать от наблюдателя точную
оценку вектора состояния. Далее будет показано, что если пара {A, C}
наблюдаема, то соответствующим выбором матрицы K можно обеспе-
чить любое желаемое расположение собственных чисел наблюдателя,
182
т.е. матрицы L . Практически, собственные значения наблюдателя вы-
)r
бираются так, чтобы состояние наблюдателя x сходилось к состоянию
наблюдаемой системы несколько быстрее затухания переходных про-
цессов в желаемой замкнутой системе. Чрезмерное ускорение наблю-
дателя приводит к затруднениям при его реализации.

3.11.1.2. Алгоритм определения матрицы К для систем со ска-


лярным входом.

Если пара {A,C} наблюдаема, то в пространстве вектора состоя-


ния существует базис [i ] , в котором эта пара имеет идентификационное
каноническое представление (ИКП) {AI , CI }.
Обозначим некоторый исходный базис как [h] . В этом базисе
дифференциальное уравнение для ошибки оценки вектора состояния
имеет вид
r r
e&h (t ) = L h eh (t ) . (3.11-11)
Перейдём к базису ИКП. Используем уже известное соотношение, свя-
зывающее координатные столбцы одного и того же вектора в разных ба-
зисах
r r
eh = I h eI . (3.11-12)
Используя эту подстановку, запишем
r r
I h ⋅ e&I (t ) = L h ⋅ I h ⋅ eI (t ) .
−1
Умножив обе части последнего равенства на I h , получим
r r
e&I (t ) = L I eI ,
где
L I = I h−1L hI h . (3.11-13)
Кроме того,
L I = AI − K ICI , (3.11-14)
где
AI = I h
−1
Ah I h ;
(3.11-15)
CI = Ch I h ; K I = I h
−1
Kh.
Матрица динамики наблюдателя в базисе ИКП в соответствии с урав-
нением (3.11-4) имеет вид:

183
⎡ 0 0 0 K 0 0 −α n ⎤ ⎡ 0 0 K 0 K I1 ⎤
⎢ 1 0 0 K 0 0 −α ⎥ ⎢ 0 0 K 0 K ⎥
⎢ n −1
⎥ ⎢ I2

⎢ 0 1 0 K 0 0 − α n −2 ⎥ ⎢ 0 0 K 0 K I 3 ⎥
LI = ⎢ ⎥ − ⎢K K K K K ⎥ =
⎢K K K K K K K ⎥ ⎢ ⎥
⎢ 0 0 0 K 1 0 − α 2 ⎥ ⎢ 0 0 K 0 K In −1 ⎥
⎢ ⎥ ⎢ ⎥
⎣ 0 0 0 K 0 1 − α 1 ⎦ ⎣ 0 0 K 0 K In ⎦

⎡ 0 0 0 K 0 0 − βn ⎤
⎢1 0 0 K 0 0 − β ⎥
⎢ n −1

= ⎢K K K K K K K ⎥,
⎢ ⎥
⎢ 0 0 0 K 1 0 − β2 ⎥
⎢⎣ 0 0 0 K 0 1 − β1 ⎥⎦
где β j – коэффициенты характеристического полинома наблюдателя,
которые вычисляются на основании желаемых собственных чисел на-
блюдателя λi согласно выражению
N

ϕ L (λ ) = ∏ (λ − λNi ) =λn + β 1λn −1 + ... + β n .


n
(3.11-16)
i =1

Очевидно выражение для элементов матрицы K в базисе ИКП:


k I j = β n +1− j − α n +1− j , j = 1, 2 , ..., n . (3.11-17)
Перевод матрицы K в исходный или какой-либо другой базис может
быть произведён в соответствии с выражением (3.11-15).

ПРИМЕР 3.11-1. Построить наблюдатель полного порядка для объекта


со структурной схемой, приведённой на рис. 3.18.
u x2 x1 y

Рис. 3.18. Объект для примера 3.11-1

Запишем матрицы объекта в исходном базисе:


⎡− 2 1 ⎤ r r ⎡0⎤
A = AH = ⎢
0 − 1⎥ , b = bH = ⎢1⎥ , C = CH = [1 0].
⎣ ⎦ ⎣ ⎦
184
Характеристический полином объекта (матрицы динамики A )
ϕ A (λ ) = (λ − λ1 )(λ − λ2 ) = λ2 + 3λ + 2 ,
его коэффициенты
α1 = 3 ; α2 = 2,
нули (собственные числа)
λ1 = −1; λ2 = −2 .
Время переходного процесса в объекте определяется наиболее близким
к мнимой оси собственным числом λ1 :
3
t рег ≈ = 3c .
− λ1 1
Зададим собственные числа наблюдателя
λ1N = λN2 = −3 .
Им соответствует характеристический полином наблюдателя:
ϕ L (λ ) = (λ + 3)2 = λ2 + 6λ + 9 ,
его коэффициенты
β1 = 6 ; β2 = 9 .
В соответствии с (3.11-17) определяем элементы матрицы K и са-
му эту матрицу в базисе ИКП:
ki 1 = β 2 − α 2 = 7; ⎡7⎤
KI = ⎢ ⎥ .
k i 2 = β1 − α1 = 3 ; ⎣3⎦
Для того, чтобы перевести матрицу K в исходный базис, рассчитаем
матрицу наблюдаемости и обратную ей в исходном базисе
⎡ 1 0⎤ ⎡ 1 0⎤
NH = ⎢ ⎥; NH−1 = ⎢ ⎥;
⎣ − 2 1⎦ ⎣ 2 1⎦
учитывая представление в базисе ИКП
⎡0 − 2⎤
CI = [0 1]; AI = ⎢ ⎥,
⎣ 1 − 3 ⎦
рассчитаем в этом базисе матрицу наблюдаемости
⎡0 1 ⎤
NI = ⎢ ⎥.
⎣ 1 − 3 ⎦

185
В соответствии с (3.11-13) вычислим матрицу перехода от исходного ба-
зиса [h] к базису ИКП [i ] :

⎡ 0 1⎤
I = NH−1NI = ⎢ ⎥ .
⎣ 1 − 1⎦
H

Используя (3.11-15), получим матрицу K в исходном базисе


⎡3 ⎤
KH = I HKI = ⎢ ⎥ .
⎣4⎦
Теперь можно заняться уравнением наблюдателя в исходном ба-
зисе. В соответствии с (3.11-9) имеем
⎡− 5 1 ⎤
L H = AH − K HCH = ⎢ ⎥.
⎣ − 4 − 1⎦
Учитывая (3.11-17), запишем, опуская далее индекс исходного базиса
)r& )r
x = L ⋅ x + Bu + Ky . (3.11-18)
Тогда уравнение наблюдателя будет иметь вид:

x&ˆ1 = −5xˆ1 + xˆ 2 + 3y ⎫⎪
&xˆ = −4xˆ − xˆ + 4y + u⎬⎪ .
2 1 2 ⎭

3.11.2. Наблюдатель пониженного порядка

Из предыдущего примера четко видно, что искать x̂1 было излишне


r
так, как y = x1 . В тех случаях, когда некоторые координаты вектора y
r
совпадают с какими-либо из координат вектора x , то очевидно, что рас-
сматриваемый выше наблюдатель – наблюдатель полного порядка -
выдает излишнюю информацию. Рассмотрим, каким образом можно по-
лучить наблюдатель с более простыми алгоритмами,
r полностью исполь-
зующими информацию о векторе состояния x , имеющуюся в векторе
r r
выхода y . В более общем случае, когда вектор y имеет размерность
ny , оказывается достаточным построить наблюдатель, порядок которого
равен n − ny .
r r
Пусть вектор y имеет размерность ny и связан с вектором x ра-
венством:
r r
y = Cx , (3.11-19)

186
или

y 1 = c11x1 + c12 x 2 + ... + c1n x n ⎫


y 2 = c 21x1 + c 22 x 2 + ... + c 2 n x n ⎪

⎬. (3.11-20)
⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ ⎪
y ny = c ny ,1x1 + c ny ,2 x 2 + ... + c ny ,n x n ⎪⎭
Если x1, x 2 ,..., x n рассматривать как неизвестные, то здесь мы
имеем n неизвестных и ny < n уравнений. Таким образом, недостаёт
(n − n ) уравнений. Полагаем, что
y
rankC = ny , т. е. все строки матрицы
r
C линейно независимы. Введем (n − ny )- мерный вектор q , дополнив
матрицу C до квадратной невырожденной матрицы C p с помощью мат-
рицы Cq :

⎡C ⎤
Cр = ⎢ ⎥ . (3.11-21)
⎣C q ⎦
Запишем:
r
⎡y ⎤ ⎡ C ⎤ r
⎢qr ⎥ = ⎢C ⎥ x , (3.11-22)
⎣ ⎦ ⎣ q⎦

откуда следует
r
r ⎡ y ⎤
x = C p−1 ⎢ r ⎥ . (3.11-23)
⎣q ⎦
Обозначим
C p−1 = [Fy [ n×ny ] Fq [n×( n −ny )] ] , (3.11-24)

тогда
r r r
x = Fy y + Fq q . (3.11-25)
r r
Если удастся найти оценку q̂ вектора q , то можно будет вычис-
лить оценку вектора состояния
r r r
xˆ = Fy y + Fq qˆ . (3.11-26)
r r
Так как q = C q x , то
r r r
q& = Cq Ax + Cq Bu . (3.11-27)

187
r
Подставим сюда x из (3.11-26):
r r r r
q& = C q AFy y + C q AFq q + C q Bu . (3.11-28)
r
Построим наблюдатель для вектора q . В последнем уравнении
r r
векторы u и y выступают в качестве входов. Если попытаться коррек-
)
цию наблюдателя ввести традиционным образом: K y − y , то получим: ( r r)
r r r r
yˆ = Cxˆ = CFy y + CFq qˆ . (3.11-29)
Но из (3.11-21) и (3.11-24) имеем
⎡C ⎤ ⎡ CFy CFq ⎤
С pC p−1 = ⎢ ⎥[Fy Fq ] = ⎢ = En ,
⎣Cq ⎦ ⎣Cq Fy Cq Fq ⎥⎦
r r
откуда должно следовать: CFy = E ny ; CFq = 0 , то есть, yˆ = y и инфор-
r
мации о q здесь нет. Поэтому примем:
)r& )r r )r r )r&
q = Cq AFq q + Cq Bu + Cq AFy y + K y& − y . ( ) (3.11-30)
Проведем необходимые преобразования. Так как
r r r
y& = Cx& = СAxˆ + СBu ,
то с учетом (3.11-26) получим:
r& r r r
yˆ = CAFy y + CAFq qˆ + CBu . (3.11-31)
Проследим за поведением ошибки оценки
r r r
Δq(t ) = q(t ) − qˆ (t ) .
r r̂&
Используя полученные выше выражения для q& и q - (3.11-28) и (3.11-
30), получим:
r r
(
r )r&
Δq& = Cq AFq Δq − K y& − y . )
r r&
Вычислим разность y& − yˆ :
r r r r r r r
y& = Cx& = CAx + CBu = CAFy y + CAFq q + CBu
___
)r& )r& )r r )r )r r
y = Cx = CAx + CBu = CAFy y + CAFq q + CBu

r r& r r r
y& − yˆ = CAFy ( y − yˆ ) + CAFq Δq .

188
r r
Так как выше было показано, что yˆ = y , то окончательно получим:
r r
Δq& (t ) = L q Δq , (3.11-32)
где матрица наблюдателя
L q = Cq AFq − KCAFq . (3.11-33)
Очевидно, что можно «заказать динамику обнуления ошибки», вы-
бирая К ( Cq AFq и CAFq - заданные матрицы). Матрицу К следует вы-
бирать таким образом, чтобы обеспечить заданное расположение соб-
ственных чисел наблюдателя. Если, например, ny = 1, то Cq AFq имеет
размер [(n − ny ) × (n − n y )], а CAFq - [1× (n − n y )] и К - [(n − ny ) × 1]. В
этом случае задача решается аналогично расчету наблюдателя полного
порядка со скалярным выходом.
Таким образом, рассчитав собственные значения матрицы Cq AFq ,
задавшись желаемыми собственными значениями наблюдателя пони-
женного порядка и получив соответствующие значения коэффициентов
его характеристического полинома, легко записать выражение для мат-
рицы K в базисе идентификационного канонического представления.
После этого потребуется перевести матрицу К в исходный базис. Если
{ }
известна пара матриц Cq AFq ,CAFq , то через матрицы наблюдаемости
в исходном базисе и в базисе идентификационного канонического пред-
ставления N h и NI , причем N h должна быть построена с использовани-
{ }
ем пары матриц Cq AFq ,CAFq , можно найти матрицу перехода от бази-
са [i ] к исходному базису [h] .
Теперь следует позаботиться о реализуемости алгоритма наблю-
дателя. Из уравнения (3.11-30) с учетом (3.11-25) получим:
)r& )r r r r
q = L q q + (Cq B − KCB )u + (Cq AFy − KCAF y )y + K y& . (3.11-34)
Это уравнение для реализации не годится, так как в случае его
использования пришлось бы осуществлять операции дифференцирова-
r
ния вектора y (t ) . В реальных условиях на вектор выхода объекта, как
правило, наложены шумы измерений и другой физической природы. Эти
шумы характеризуются широким спектром, и дифференцирование су-
щественно увеличивает шумовую составляющую в выходном сигнале.
r
Для того, чтобы не решать задачу измерения y& , введем новую пе-
r r r
ременную ξ = q − ky , тогда
r r r
q = ξ + ky . (3.11-35)
Проведем соответствующую замену в (3.11-34) и в результате получим
первое уравнение наблюдателя:
189
r& r r r
ξ = L qξ + (C q B − KCB )u + (L q K + C q AFy − KCAF y )y . (3.11-36)
Теперь из уравнений (3.11-30) и (3.11-35) имеем:
r r r r r r
xˆ = Fy y + Fq qˆ = Fy y + Fqξ + Fq Ky ,
или
r r r
xˆ + (Fy + Fq K )y + Fqξ . (3.11-37)
Это - второе уравнение наблюдателя. Таким образом, получено уравне-
r r
ние оценки x̂ вектора x с помощью наблюдателя пониженного порядка.

3.11.3. Наблюдатель Люенбергера минимального порядка


Рассмотрим ещё один подход к формированию наблюдателя. Так
же, как в п.3.11.2 сформируем матрицы Cq , C p и введём вектор
r r
q(t ) = Cq x(t ) . (3.11-38)
r
Оценку вектора q (t ) будем искать как решение уравнения
)r& )r r r
q ( t ) = L q (t ) + G y y (t ) + G u u ( t ) ,
q
(3.11-39)
где L , G и G - некоторые, пока неизвестные
q y u
r матрицы.
Как и прежде, ошибкой оценки вектора q будем считать разность
r r )r
Δ q (t ) = q (t ) − q (t ) . (3.11-40)
В соответствии с уравнением объекта и выражением (3.11-38) запишем:
r r r
q& (t ) = Cq Ax (t ) + Cq Bu (t ) . (3.11-41)
r
Найдём дифференциальное уравнение для ошибки Δq(t ) :
r& r r r r r
Δ q ( t ) = C q Ax ( t ) + C q B u ( t ) − L q q ( t ) − G y y ( t ) − G u u ( t ) . (3.11-42)
r
Добавим и вычтем в правой части последнего равенства L q и с учётом
q

(3.11-38) получим:
r& r r r
Δ q (t ) = L Δ q (t ) + (Cq B − G u )u(t ) + (Cq A − G y C − L q Cq )x (t ) .
q
(3.11-43)
Положим
G u = Cq B (3.11-44)
и потребуем выполнения равенства

190
Cq A − G y C − L qCq = 0 . (3.11-45)
Тогда получим уравнение для ошибки наблюдателя
r& r
Δ q ( t ) = L q Δ q (t ) . (3.11-46)

Если назначить матрицу L так, чтобы её собственные числа лежали в


q

левой полуплоскости достаточно далеко от мнимой оси, то ошибка на-


блюдателя, имеющая изначально место при ненулевых начальных ус-
ловиях, будет с соответствующей скоростью стремиться к нулю. Так же
быстро вектор
r
)r y
⎡ ⎤
x (t ) = C p−1 ⎢ r ⎥ (3.11-47)
q
⎣ ⎦
r
будет стремиться к вектору x (t ) . Вытекающее из (3.11-45) уравнение
C q A −L q C q = G y C (3.11-48)
называется матричным уравнением Люенбергера.
Теперь учтём, что задача построения наблюдателя, то есть нахож-
)r r
дения оценки x вектора состояния x возникла из-за необходимости
реализовать управление
r r r
u ( t ) = Lx ( t ) + k v v ( t ) . (3.11-49)
Сама по себе оценка вектора состояния часто не нужна. Поэтому попы-
∧r
r оценку Lx линейной комбинации координат вектора со-
таемся найти
стояния Lx . Будем искать эту оценку в виде
r ∧ )r r
Lx (t ) = χq(t ) + ηy (t ) . (3.11-50)
)r r
Так как с течением времени q стремится к q , то с учётом (3.11-38) и
уравнения выхода объекта получим
∧r r r
Lx (t ) = χCq x (t ) + ηCx (t ) , (3.11-51)
откуда следует
L = χC q + ηC . (3.11-52)
Таким образом, необходимо решить следующую систему матричных
уравнений:
Cq A − L qCq = G y C ;
(3.11-53)
χC q + ηC = L .

191
Эта система всегда имеет решение, если, во-первых, собственные чис-
ла матриц L и A не совпадают друг с другом и, во-вторых, размер-
q
r
ность вектора q (размерность матрицы наблюдателя L )
q

s ≥ nu (ν − 1) , (3.11-54)
где nu - размер вектора управления; ν - индекс наблюдаемости. Это та-
кое число, для которого матрица
⎡ C ⎤
⎢ ⎥
~ ⎢ CA ⎥
N= (3.11-55)
⎢ L ⎥
⎢ ν −1 ⎥
⎣CA ⎦
имеет ранг, равный n .
Таким образом, может быть сформулирован следующий итоговый
алгоритм.
1. Найти индекс наблюдаемости ν и размерность наблюдателя s .
2. Задать желаемую динамику наблюдателя и записать матрицу его
динамики L в виде матрицы, сопровождающей свой характери-
q

стический полином.
3. Вычислить матрицы C q , G , χ , η согласно (3.11-53), а также мат-
y

рицу G согласно (3.11-44).


u

4. Реализовать алгоритмы регулятора, включая наблюдатель Люен-


бергера минимального порядка:
)r& )r r r
q (t ) = L q (t ) + G y y (t ) + G u u (t ) ;
q

(3.11-56)
r )r r r
u (t ) = χq(t ) + ηy (t ) + k v v (t ).

192
3.12. Синтез реализуемого управления, обеспечивающий
заданные динамические и статические свойства систе-
мы управления
3.12.1. Динамические свойства системы с обратной связью и на-
блюдателем полного порядка

Предполагается, что известны уравнения управляемого и наблю-


даемого объекта:
r r rr
⎧⎪ x& (t ) = Ax (t ) + b u (t );
⎨r r (3.12-1)
⎪⎩y (t ) = Cx (t ).
Кроме того, проведён синтез управления и получены матрица L и ко-
эффициент k для равенства
v

r r r
u ( t ) = Lx (t ) + k v v (t ) , (3.12-2)
обеспечивающего желаемые собственные числа замкнутой системы
λз1, λз2 , ... λзn , или нули характеристического полинома замкнутой систе-
мы
ϕ AC (λ ) = λn + γ 1λn −1 + ... + γ n −1λ + γ n . (3.12-3)
Предполагается также, что имеется наблюдатель
)r& )r r r
x (t ) = ( A − KC )x (t ) + Bu(t ) + Ky (t ) , (3.12-4)
спроектированный таким образом, что его характеристический полином
ϕ L (λ ) имеет коэффициенты β 1, β 2 , ... β n , соответствующие некоторой
выбранной совокупности собственных чисел λ1 , λ2 , ..., λn .
N N N

Учтём, что при формировании управления фактически можно восполь-


r )r
зоваться не самим вектором состояния x , а лишь его оценкой x , то есть
r )r r
u ( t ) = Lx (t ) + k v v (t ) . (3.12-5)
Таким образом, рассматривается функциональная схема полной
системы (объект, формирователь управления и наблюдатель), пред-
ставленная на рис. 3.18

193
r r r
v (t )
формирователь u (t ) объект y (t )
)r управления
x
наблюдатель

регулятор

Рис. 3.18. Функциональная схема полной


системы
Запишем уравнения этой системы, то есть, совместно уравнения
объекта с управлением и наблюдателя
r r r r) r
⎧⎪ x& (t ) = Ax (t ) + b Lx(t ) + Bk v v (t );
⎨ )r& )r )r r r (3.12-6)
⎪⎩ x (t ) = ( A − KC )x(t ) + BLx (t ) + Bk v v (t ) + KCx (t ).
С использованием блочных матриц получим
r r
⎡ x& (t )⎤ ⎡ A BL ⎤ ⎡ x (t )⎤ ⎡Bk v ⎤ r
⎢ )r& ⎥ = ⎢ ⎥ ⎢ )r ⎥ + ⎢ v ⎥v (t ) . (3.12-7)
⎣ x (t )⎦ ⎣KC A − KC + BL ⎦ ⎣ x (t )⎦ ⎣Bk ⎦
Поведение этой системы зависит от собственных чисел матрицы дина-
мики полной системы
⎡ A BL ⎤
X =⎢ . (3.12-8)
⎣KC A − KC + BL ⎥⎦
Надо попытаться для X найти некоторую подобную матрицу, такую,
чтобы можно было легко определить её собственные числа. Перейдём к
подобной матрице с помощью преобразования
Xf = Fh −1X hFh . (3.12-9)
Матрицу Fh выберем следующей:

⎡E 0n ⎤
Fe = ⎢ n , (3.12-10)
⎣E n − E n ⎥⎦
где индекс n указывает на размеры соответствующих нулевой и еди-
−1
ничных матриц. Легко убедиться, что Fh = Fh . В результате получим:
⎡E 0 ⎤⎡ A BL ⎤ ⎡E 0 ⎤ ⎡ A + BL − BL ⎤
Xf = ⎢ n ⎥ ⎢KC A − KC + BL ⎥ ⎢E − E ⎥ = ⎢
n
⎥ .
E
⎣ n − E n ⎦⎣ ⎦⎣ n n⎦ ⎣ 0 A − KC ⎦

194
Характеристический полином матрицы X не зависит от базиса и опре-
деляется следующим образом:
ϕ X (λ ) = det[λE 2 n − X ] = λE n − ( A + BL ) ⋅ λE n − ( A − KC ) .
Отсюда следует

ϕX (λ ) = ϕ AC (λ )ϕ L (λ ) . (3.12-11)
Таким образом, полная система, в которой управление вычисляется в
функции оценки вектора состояния, имеет 2n собственных чисел:
λз1, λз2 , ... λзn , λN1, λN2 , ... λNn . Собственные числа замкнутой системы со-
хранили те собственные числа, были заданы при синтезе управления.
Отметим, что в полной системе передаточная функция от ко-
r r
мандного сигнала v до выходного сигнала y тождественно равна пере-
даточной функции в идеализированной системе без наблюдателя. Это
действительно так, потому что по определению передаточная функция
связывает изображения соответствующих переменных при нулевых на-
r
чальных условиях. При нулевых начальных условиях выход объекта y и
)r
выход наблюдателя y тождественно равны.

3.12.2. Динамические свойства системы с обратной связью управ-


лением и наблюдателем минимального порядка
В случае использования наблюдателя минимального порядка в
соответствии с (3.11-56) и (3.11-44) уравнения регулятора имеют вид
)r& )r r r
q(t ) = L q(t ) + G y y (t ) + Cq Bu (t );
q

r )r r r
u (t ) = χq(t ) + ηy (t ) + k v v (t ).
С учётом управления запишем совместно уравнения объекта и наблю-
дателя:
r& r r )r r
x (t ) = Ax (t ) + BηCx (t ) + Bχq(t ) + Bk v v (t );
)r& )r )r (3.12-12)
r r r
q(t ) = G Cx (t ) + Cq BηCx (t ) + L q(t ) + Cq Bχq(t ) + Cq Bk v v (t ).
y q

Отсюда матрица динамики полной системы имеет вид:


⎡ A + B ηC Bχ ⎤
X =⎢ y ⎥. (3.12-13)
⎣G C + C q B η C L q
+ C q B χ ⎦
Перейдём к подобной матрице с помощью преобразования (3.12-9), где

195
⎡E n 0 ⎤
Fe = Fe −1 = ⎢ . (3.12-14)
⎣Cq − E s ⎥⎦
В результате, учитывая (3.11-52) и (3.11-48), получим:
⎡ A + BL − Bχ ⎤
Xf = ⎢ ⎥. (3.12-14)
⎣ 0 L q ⎦

Отсюда следуют те же выводы, что и полученные выше для системы с


наблюдателем полного порядка.

3.12.3. Результирующий алгоритм синтеза для системы с одним


входом и одним выходом
1. Для матрицы объекта A вычислить характеристический полином
ϕ A (λ ) и зафиксировать его коэффициенты α1, α 2 , ..., α n .
2. В соответствии с требованиями к динамике замкнутой системы задать
желаемые значения собственных чисел λ 1, λ 2 , ... λ n , вычислить
з з з

n
ϕ AC (λ ) = ∏ (λ + λ3 ) ,
i =1

то есть найти коэффициенты желаемого характеристического поли-


нома γ 1, γ 2 , ..., γ n .
3. Рассчитать матрицу обратной связи в базисе УКП:
LU = [l u 1 l u 2 ⋅ ⋅ ⋅ l u n ], где l u j = α n +1− j − γ n +1− j .
4. Задать желаемые собственные числа наблюдателя λ1 , λ2 , ..., λn и
N N N

вычислить коэффициенты характеристического полинома наблюда-


теля: β 1, β 2 , ... β n .
5. Рассчитать матрицу обратной связи наблюдателя в базисе ИКП:
⎡ kI1 ⎤
⎢k ⎥
⎢ I2 ⎥
K I = ⎢k I 3 ⎥ , где kI j = β n +1− j − α n +1− j .
⎢ ⎥
⎢ M ⎥
⎢⎣ k In ⎥⎦
6. Рассчитать матрицу перехода от исходного базиса к базису УКП
U h = UUU−1 , матрицу выхода в этом базисе CU = CU h и, при наличии

196
требования обеспечить единичную статику, вычислить коэффициент
γn
по командному сигналу k =
v
.
CU 1
7. Рассчитать матрицу перехода от базиса [u ] (УКП) к базису [i ] (ИКП)
I U= NI−1 ⋅ NU и обратную ей матрицу.
r
8. Рассчитать вектор b в базисе ИКП, используя переход от базиса УКП
r r
bI = I U bU .
−1

9. Рассчитать матрицу обратной связи L в базисе ИКП, используя пере-


ход от базиса [u ] к базису [i ] : LI = LU IU .
10. Записать уравнение наблюдателя в базисе ИКП:

( )
)r& r r) r r v
xI (t ) = AI − K ICI + bI LI xI (t ) + K I y (t ) + bI k v (t ) .
11. Записать уравнение для формирования управления:
)r
u(t ) = LI xI (t ) + k v v (t ) .
Уравнения, полученные в пунктах 10 и 11 – это уравнения регуля-
тора. Следует подчеркнуть, что в них используется вектор оценки со-
стояния объекта, записанный не в исходном базисе, а в базисе иденти-
фикационного канонического представления.

3.12.4. Итоговые примеры полного синтеза систем управления


3.12.4.1. Система со скалярными входом и выходом и наблюда-
телем полного порядка
Задан объект, представленный структурной схемой на рис. 3.19.
u x2 x1

Рис. 3.19. Структурная схема объекта


Требуется синтезировать реализуемое управление, обеспечивающее
единичную статику по командному сигналу, а также динамику основного
контура системы и наблюдателя в соответствии с желаемыми собствен-
ными числами
λ1з,2 = −5 ± j 5; λ1N = λN2 = −10.
Ниже приведены промежуточные результаты расчёта.

Матрица управляемости объекта и ей обратная в исходном базисе:

197
⎡0 1 ⎤ ⎡1 1⎤
U=⎢ ⎥; U −1 = ⎢ ⎥.
⎣ 1 − 1⎦ ⎣1 0 ⎦
Матрица управляемости объекта и ей обратная в базисе УКП:
⎡0 1 ⎤ ⎡3 1⎤
UU = ⎢ ⎥; UU−1 = ⎢ ⎥ .
⎣ 1 − 3⎦ ⎣ 1 0⎦
Коэффициенты характеристического полинома объекта, желаемой сис-
темы и наблюдателя:
r ⎡3⎤ r ⎡10 ⎤ r ⎡ 20 ⎤
α = ⎢ ⎥; .γ = ⎢ ⎥; β =⎢ .
⎣2⎦ 50
⎣ ⎦ 100⎥
⎣ ⎦
Матрица обратной связи в базисе УКП:
LU = [− 48 − 7].

Матрица наблюдателя:

⎡98⎤
KI = ⎢ ⎥ .
⎣17 ⎦
Матрица перехода от исходного базиса к базису УКП:
⎡ 1 0⎤
UH = ⎢ ⎥.
⎣2 1⎦
Матрица выхода в базисе УКП:
CU = [1 0] .

Коэффициент по командному сигналу k = 50 .


v

Матрица наблюдаемости базисе УКП, обратная ей и та же матрица в ба-


зисе ИКП:
⎡ 1 0⎤ ⎡0 1 ⎤
NU = NU−1 = ⎢ ⎥, NI = ⎢ ⎥.
⎣0 1⎦ ⎣ 1 − 3 ⎦
Матрица перехода от базиса ИКП к базису УКП:
⎡0 1 ⎤
UI = ⎢ ⎥ .
⎣ 1 − 3 ⎦
Вектор передачи управления в базисе ИКП:
r ⎡1⎤
bI = ⎢ ⎥ .
⎣ − 3⎦
198
Матрица обратной связи в базисе ИКП:
LI = [− 7 − 27] .
Матрица динамики наблюдателя в базисе ИКП:

⎡0 − 100 ⎤
L I = AI − K ICI = ⎢ ⎥ .
⎣1 − 20 ⎦
Результирующие уравнения регулятора:
) )
x&1 = −100 x 2 + u + 98 y ;
) ) )
x& 2 = x1 − 20 x 2 − 3u + 17 y ;
) )
u = −7 x1 − 27 x 2 + 50 v .
В этих уравнениях индекс i при координатах вектора оценки состояния
опущен.

3.12.4.2. Система со скалярными входом и выходом и наблюда-


телем пониженного порядка
Для объекта, заданного на рис.3.19, построить наблюдатель пони-
женного порядка. Учесть, что управление объектом строится на основе
собственных чисел замкнутой системы λ1,2 = −5 ± 5 j .
з

Для этого объекта


⎡− 2 1 ⎤ ⎡0⎤
A=⎢
0 − 1⎥ ; B = ⎢1⎥ ; C = [1 0],
⎣ ⎦ ⎣ ⎦
собственные числа объекта -
λ1 = −1, λ2 = −2 .
Порядок объекта n = 2 , размерность выхода ny = 1, следователь-
но, размерность наблюдателя пониженного порядка nq = 1.
Зададимся собственным числом наблюдателя λ1 = −10 (оно
Н

должно располагаться на комплексной плоскости левее собственных чи-


сел замкнутой системы).
Так как y = x1 , то примем q = x 2 . Тогда

⎡ y ⎤ ⎡ 1 0⎤ ⎡ x1 ⎤
⎢q ⎥ = ⎢0 1⎥ ⎢ x ⎥ .
⎣ ⎦ ⎣ ⎦⎣ 2 ⎦
Таким образом, выбрана матрица
Cq = [0 1] .

199
Ей соответствует невырожденная квадратная матрица
⎡ 1 0⎤
C p = C p−1 = ⎢ ⎥.
⎣0 1⎦
Соответственно получаем
⎡1⎤ ⎡0⎤
Fy = ⎢ ⎥ ; Fq = ⎢ ⎥ .
⎣0⎦ ⎣1⎦
Теперь в соответствии с (3.11-33) определим L q:
⎡− 2 1 ⎤ ⎡0⎤ ⎡− 2 1 ⎤ ⎡0⎤
L q = [0 1] ⋅ ⎢ ⎥ ⎢ ⎥ − K [1 0 ]⎢ ⎥ ⎢ ⎥ = −1 − K .
⎣0 − 1⎦ ⎣1⎦ ⎣ 0 − 1⎦ ⎣1⎦
Поскольку назначено λН = −10 , то
− 1 − К = −10 и К = 9.
Таким образом, L q = −10 , и первое уравнение наблюдателя принимает
вид:
ξ& = −10ξ − 72y + u .
r
Запишем оценку для x :
r ⎡ 1⎤ ⎡0⎤ ⎡ xˆ ⎤
xˆ (t ) = ⎢ ⎥ y (t ) + ⎢ ⎥ξ = ⎢ 1 ⎥ .
⎣− 9⎦ ⎣1⎦ ⎣ xˆ 2 ⎦
Отсюда
xˆ 2 = 9 y + ξ .
Замкнем систему (сформируем управление). В п.3.12.4.1 была рас-
считана матрица обратной связи
LU = [− 48 − 7].
Переведем её в исходный базис:
L = LUU e−1 = LUUUU e−1 = [− 34 − 7] .
Таким образом, управление принимает вид
u = −34 y − 7 x 2 + 50v .
Структурная схема полной схемы с регулятором и с наблюдателем по-
ниженного порядка представлена на рис. 3.20.

200
v u x1 = y
50 объект

72 9
)
x2

10
x̂ 2
7

34

Рис. 3.20. Структурная схема полной


системы для примера 3.12-2

3.12.4.3. Система со скалярными входом и выходом и наблюда-


телем пониженного порядка
Структурная схема объекта представлена на рис. 3.21.
u x3 x2 x1 y1

x4 y2

Рис. 3.21. Структурная схема объекта

Ему соответствуют матрицы


⎡0 1 00⎤ ⎡0⎤
⎢0 1 1 0⎥ ⎢0⎥
⎥; B = ⎢ ⎥; C = ⎡
1 0 0 0⎤
A=⎢ ⎢0 0 0 1⎥ .
⎢0 0 −1 0 ⎥ ⎢1⎥ ⎣ ⎦
⎢ ⎥ ⎢ ⎥
⎣0 0 1 − 2⎦ ⎣0⎦
Требуется рассчитать управление и построить наблюдатель минималь-
ного порядка.
Объект имеет собственные числа

201
λ1 = 0; λ2 = +1; λ3 = −1; λ4 = −2
и характеристический полином
ϕ A (λ ) = λ4 + 2λ3 − λ2 − 2λ .
Найдём матрицу управляемости:
⎡0 0 1 0⎤
⎢0 1 0 1⎥
U = [B AB A B A B ] = ⎢
2 3 ⎥.
⎢1 − 1 1 − 1⎥
⎢ ⎥
⎣0 1 − 3 7 ⎦
Её определитель det U = −6 , то есть отличен от нуля. Это означает, что
объект управляем. Рассчитаем закон управления (матрицу обратной
связи), обеспечивающий следующие желаемые собственные числа
замкнутой системы:
λ1з = λз2 = λз3 = λз4 = −1,
которым соответствует характеристический полином
ϕ Ac (λ ) = λ4 + 4λ3 + 6λ2 + 4λ + 1.
Таким образом, имея коэффициенты характеристических полиномов
объекта и желаемой замкнутой системы
⎡2⎤ ⎡4 ⎤
r ⎢ − 1⎥ r ⎢6 ⎥
α = ⎢ ⎥; γ =⎢ ⎥,
⎢ − 2⎥ ⎢4 ⎥
⎢0⎥ ⎢ ⎥
⎣ ⎦ ⎣ 1⎦
можно в соответствии с (3.9-18) рассчитать матрицу обратной связи в
базисе УКП:
LU = [− 1 − 6 − 7 − 2] .
Чтобы найти эту матрицу в исходном базисе, нужно знать матрицу U H
перехода от исходного базиса к базису УКП. Так как столбцы этой мат-
рицы являются координатными столбцами векторов базиса [u ] (УКП)
r r r
u1 , u2 , ... , un в исходном базисе [h] , то, используя (3.8-6), можно запи-
сать:

202
⎡0⎤ ⎡0⎤
r r ⎢0⎥ r r r ⎢1⎥
u h 4 = bh = ⎢ ⎥ ; u h 3 = AH u h 4 + α 1bh = ⎢ ⎥ ;
⎢1⎥ ⎢1⎥
⎢ ⎥ ⎢ ⎥
⎣0⎦ ⎣1⎦

⎡1⎤ ⎡2⎤
r r r ⎢2⎥ r r r ⎢0⎥
uh 2 = AH uh 3 + α 2 bh = ⎢ ⎥ ; uh1 = AH uh 2 + α 3 bh = ⎢ ⎥ .
⎢ − 2⎥ ⎢0⎥
⎢ ⎥ ⎢ ⎥
⎣ − 1⎦ ⎣0⎦
Таким образом, получаем:
⎡1 − 1 0 1 ⎤
⎡2 1 0 0⎤ ⎢ 2 6 6⎥
⎢0 2 1 0⎥ ⎢0 1 1 −1 ⎥
UH =⎢ ⎥ и UH = ⎢
−1 3 3 .
⎢0 − 2 1 1⎥ 0 1 1 2 ⎥
⎢ 3 3⎥
⎢ ⎥ ⎢0
⎣0 − 1 1 0⎦ 1 1 − 4 ⎥
⎣ 3 3⎦
В соответствии с (3.9-12)

L ≡ LH = LUU H−1 = [− 1 − 29 − 2 − 1 ].
2 6 6
В соответствии с (3.6-8)
⎡2 1 0 0 ⎤
CU = CU H = ⎢ ⎥.
⎣0 − 1 1 0 ⎦
Используя (3.8-22) запишем передаточные функции:
1 1
Wu y 1 ( p ) = ; Wu y 2 ( p ) = ;
p( p + 1)( p − 1) ( p + 1)( p + 2)

p+2 v p( p − 1)
Wv y 1 ( p ) = k v ; W ( p ) = k .
( p + 1) 4 ( p + 1) 4
v y2

В замкнутой системе будет обеспечена единичная статика по координа-


те y 1 , если задать
1
kv = .
2
~
Теперь перейдём к синтезу наблюдателя. Построим матрицу N :

203
⎡1 0 0 0⎤
⎢ 0 0 1⎥
~ ⎡ C ⎤ ⎢0 ⎥.
N=⎢ ⎥=
⎣CA⎦ ⎢0 1 0 0⎥
⎢ ⎥
⎣0 0 1 − 2⎦
Ранг этой матрицы равен четырём, то есть, порядку объекта. Так как
старшая степень блока CA , входящего в неё, равна единице, то индекс
наблюдаемости ν = 2 и порядок наблюдателя в соответствии с (3.11-54)
s = 1. Это означает, что в данном случае может быть построен наблюда-
тель первого порядка. Зададим единственное собственное число на-
блюдателя λ1 = −4 . Отсюда сразу определяется матрица наблюдателя
N

L q = −4 .
Раскроем матричное уравнение Люенбергера (3.11-48), имея вви-
ду, что в данном случае матрица Cq имеет размер [ 4 × 1] . Для этого за-
пишем подробно каждое слагаемое:
⎡0 1 0
0⎤
⎢0 1 1 0⎥
Cq A = [c q1 c q 2 cq 3 c q 4 ]⎢ ⎥=
⎢0 0 −1 0 ⎥
⎢0 0 1 − 2⎥⎦

= [0 c q1 + c q 2 cq2 − cq3 + cq 4 − 2c q 4 ];

L qCq = [− 4c q1 − 4c q 2 − 4c q 3 − 4c q 4 ];

⎡ 1 0 0 0⎤
G y C = [g y 1 g y 2 ]⎢ ⎥ = [g y 1 0 0 g y 2 ].
⎣0 0 0 1⎦
С учётом этих выражений матричное уравнение Люенбергера можно
представить в виде системы скалярных уравнений:
4c q1 = g y 1;

c q1 + 5c q 2 = 0;

c q 2 + 3c q 3 + c q 4 = 0;

2c q 4 = g y 2 .
Аналогично поступим со вторым матричным уравнением системы (3.11-
53), учитывая вытекающие из этого уравнения размерности матриц χ и
η:
204
χCq = [χc q1 χc q 2 χc q 3 χc q 4 ];

⎡ 1 0 0 0⎤
ηC = [η1 η2 ]⎢ ⎥ = [η1 0 0 η 2 ]
⎣0 0 0 1⎦
и
χcq1 + η1 = l1 ;

χcq 2 = l 2 ;

χcq 3 = l 3 ;

χcq 4 + η2 = l 4 .
Таким образом, получено восемь уравнений при наличии девяти неиз-
вестных c q1 , c q 2 , c q 3 , c q 4 , g y 1 , g y 2 , η1 , η 2 , χ . Примем χ = 1. После этого
легко находятся остальные неизвестные:
145 29 65 ⎤
Cq = ⎡⎢ − −2 ⎥ ;
⎣ 6 6 6⎦
74 290 65 ⎤
η = ⎡⎢− − 11⎤⎥ ; G y = ⎡⎢ .
⎣ 3 ⎦ ⎣ 3 3 ⎥⎦
В соответствии с (3.11-44) вычисляем
G u = Cq B = −2 .
В результате можем записать уравнения регулятора совместно на-
блюдателем Люенбергера минимального (первого) порядка:
)r& )r 290 65
q(t ) = −4q(t ) − 2u(t ) + y 1 (t ) + y 2 (t );
3 3
1 r) 74
u (t ) = v (t ) + q (t ) − y 1 (t ) − 11y 2 (t ).
2 3
Этим уравнениям соответствует структурная схема системы управле-
ния, приведённая на рис. 3.22.

205
y1
v u
ОБЪЕКТ

y2
2
65
3

290
4
3

11

74
3

Рис. 3.22. Структурная схема системы


управления.

3.12.4.4. Многомерная система с разделением каналов и наблю-


дателем минимального порядка
Задан объект, представленный структурной схемой на рис. 3.23.
u1 x1 x3 y1
2

u2 x2 x4
y2

Рис. 3.23. Структурная схема объекта

Объекту соответствуют матрицы


⎡0 0 0 0⎤ ⎡1 0⎤
⎢0 0 0 0⎥ ⎢0 1⎥ 0 0 1 0⎤
A=⎢ ⎥; B = ⎢ ⎥; C = ⎡
⎢1 1 0 0⎥ ⎢0 0⎥ ⎢0 0 0 1⎥ .
⎣ ⎦
⎢0 1 1 0⎥⎦ ⎢0 ⎥
0⎦
⎣ ⎣
206
Расчёт матриц управляемости и наблюдаемости определяет объект как
полностью управляемый и наблюдаемый.
I. Синтез управления в соответствии с п.3.10.
1. Расчёт чисел m i :
C1 A 0 B = [0 0]; C1 A1B = [1 1];

C 2 A 0 B = [0 0]; C 2 A 1B = [0 1].
Отсюда следует m1 = m 2 = 2 .
2. Вычисление матриц F∗ , B∗ .
При m1 = m 2 = 2

⎡ 0 0 0 0⎤ ⎡ 1 1⎤
F∗ = −CA 2 = ⎢ ;
⎥ ∗ B = CAB = ⎢0 1⎥ .
⎣ − 1 − 1 0 0 ⎦ ⎣ ⎦
−1
3. Расчёт B∗ .

⎡1 − 1⎤
B∗−1 = ⎢ ⎥.
⎣0 1 ⎦
Поскольку эта матрица существует, задача разделения каналов имеет
решение.
4. Вычисление матриц A, B .
∨ ∨

⎡1 − 1⎤ ⎡1 1 0 0⎤
⎢0 1 ⎥ ⎢− 1 − 1 0 0⎥
B = BB∗ =
−1
⎢ ⎥ ; A = A + B F∗ = ⎢ ⎥.

⎢0 0 ⎥ ∨ ∨
⎢1 1 0 0⎥
⎢0 0 ⎥ ⎢0 1 1 0⎥⎦
⎣ ⎦ ⎣
В соответствии с (3.10-13) этим матрицам отвечают уравнения
x& 1 = x 1 + x 2 + q1 − q 2 ;

x& 2 = − x 1 − x 2 + q 2 ;

x& 3 = x1 + x 2 ;

x& 4 = x 2 + x 3 .
Соответственно этим уравнениям
x 3( 2 ) = q1 ;

x 4( 2 ) = q 2 ,

207
то есть действительно, исходная система разбита на две независимые
подсистемы, состоящие из последовательно включённых интеграторов.
5. Построение матрицы F e .
В данном случае
⎡1 1 0 − 1⎤

[r
Fe = A b1
∨ ∨
r
b1

r
A b2
∨ ∨
r

] ⎢− 1
b2 = ⎢
⎢1
0 0 1⎥
0 0 0⎥
⎥.
⎢0 0 1 0 ⎥⎦

Новому базису соответствуют матрицы
⎡0 1 0 0⎤ ⎡0 0⎤
⎢0 0 0 0⎥ ⎢1 0⎥ 1 0 0 0⎤
Af = ⎢ ⎥ ; Bf = ⎢ ⎥ ; Cf = ⎡
⎢0 0 0 1⎥ ⎢0 0⎥ ⎢0 0 1 0⎥ .
⎣ ⎦
⎢0 0 0 0⎥⎦ ⎢0 1⎥⎦
⎣ ⎣
6. Расчёт матрицы обратной связи промежуточной системы в базисе
[f ] .
Зададим желаемые собственные числа для первого канала
λ11,2 = −1± j1
и для второго канала
λ21,2 = −5 ± j 5 .
Им соответствуют характеристические полиномы
ϕ1(λ ) = λ2 + 2λ + 2;
ϕ 2 (λ ) = λ2 + 10λ + 50.
Получаем строки матрицы Lf :
l f 1 = [− 2 − 2]; l f 2 = [− 50 − 10]
и саму матрицу
⎡− 2 − 2 0 0 ⎤
Lf = ⎢ ⎥.
⎣ 0 0 − 50 − 10 ⎦
Пункты 7 и 8 итогового алгоритма расчёта управления для данного
случая не нужны, так как в рассматриваемом примере сумма порядков
подсистем m1 + m2 равна порядку объекта, и матрица A00 отсутствует.
9. Расчёт матрицы при командном сигнале.
Потребуем выполнения равенства

208
Wv 1y 1 (0) = Wv 2 y 2 (0) = 1.
Тогда
k1v = 2; k 2v = 50
∨ ∨

и
⎡2 0 ⎤
kv = ⎢ ⎥.

⎣0 50 ⎦
10. Расчёт матрицы обратной связи промежуточной системы в исход-
ном базисе.
⎡0 0 1 0⎤
⎡− 2 − 2 0 0 ⎤ ⎢1 1 0 0⎥
L∨ = Lf Fe = ⎢
−1
⎢ ⎥=

0 − 50 − 10⎦ ⎢0 0 0 1⎥
⎣0
⎢0 1 1 0⎥⎦

⎡− 2 − 2 − 2 0 ⎤
=⎢ ⎥.
⎣ 0 − 10 − 10 − 50 ⎦
11. Расчёт результирующей матрицы обратной связи.
⎡− 1 9 8 50 ⎤
L = B∗−1 (F∗ + L ) = ⎢ ⎥.

⎣ − 1 − 11 − 10 − 50 ⎦
12. Расчёт матрицы передаточных коэффициентов по вектору ко-
мандных сигналов
⎡2 − 50⎤
k v = B∗−1 k v = ⎢ ⎥.

⎣0 50 ⎦
Таким образом, получено управление, использующее координаты
вектора состояния объекта:
u1 = − x1 + 9 x 2 + 8 x 3 + 50 x 4 + 2v 1 − 50v 2 ;

u 2 = − x1 − 11x 2 − 10 x 3 − 50 x 4 + 50v 2 .
II. Синтез наблюдателя в соответствии с п.3.11.3.
1. Расчёт индекса наблюдаемости.
~
Строим матрицу N :

209
⎡0 0 1 0⎤
⎢ 0 0 1⎥
~ ⎡ C ⎤ ⎢0 ⎥.
N = ⎢ 2−1 ⎥ =
⎣CA ⎦ ⎢1 1 0 0⎥
⎢0 1 1 0⎥⎦

Эта матрица имеет 4 линейно независимые строки, её детерминант от-
~
личен от нуля, значит rank (N ) = 4 = n . Следовательно, индекс наблю-
даемости объекта ν = 2 и размерность наблюдателя s = 2 .
2. Задание динамики наблюдателя.
Зададим собственные числа λ1,2 = −10 . Соответственно матрица ди-
N

намики наблюдателя
⎡− 10 0 ⎤
Lq =⎢ ⎥.
⎣ 0 − 10 ⎦
3. Решение системы матричных уравнений (3,11-53).
Матрица Cq имеет размерность [2 × 4] , матрицы G , γ , η - [2 × 2] .
y

Следовательно, система скалярных уравнений, соответствующая


системе матричных уравнений (3,11-53), содержит 16 уравнений и 20
неизвестных. Таким образом, мы имеем право произвольно задать 4
«лишних» неизвестных. Зададим матрицу χ единичной, то есть

⎡ 1 0⎤
χ =⎢ ⎥.
⎣0 1⎦
С учётом этого из первого матричного
уравнения (3.11-53) получим следующую систему уравнений:
1) cq13 + 10c q11 = 0; 5) c q 23 + 10cq 21 = 0;

2)c q13 + cq14 + 10cq12 = 0; 6) c q 23 + c q 24 + 10cq 22 = 0;

3)c q14 + 10cq13 = g11 ; 7) c q 24 + 10cq 23 = g 21 ;

4)10cq14 = g12 ; 8) 10c q 24 = g 22 .


Второе матричное уравнение (3.11-53) преобразуется в систему скаляр-
ных уравнений
9) cq11 = −1; 13) cq 21 = −1;

10) cq12 = 9; 14) cq 22 = −11;

11) cq13 + η11 = 8; 15) cq 23 + η21 = −10;

210
12) cq14 + η12 = 50; 16) cq 24 + η22 = −50.
Совместное решение последних шестнадцати скалярных уравнений по-
зволяет найти все элементы искомых матриц:
⎡− 1 9 10 − 100 ⎤ ⎡ 0 − 1000 ⎤ ⎡ − 2 150 ⎤
Cq = ⎢ ⎥ ; G y
= ⎢ ⎥ ; η = ⎢ ⎥ .
⎣− 1 − 11 10 100 ⎦ ⎣200 + 1000 ⎦ ⎣− 20 − 150 ⎦
Используя (3.11-44), вычислим матрицу
⎡− 1 9 ⎤
G u = Cq B = ⎢ ⎥ .
⎣− 1 − 11⎦
4. В соответствии с полученными результатами записать уравнения
регулятора, включая наблюдатель:
) )
q&1(t ) = −10q1(t ) − 1000 y 2 (t ) − u1(t ) + 9u2 (t );
) )
q& 2 (t ) = −10q2 (t ) + 200 y 1(t ) + 1000 y 2 (t ) − u1(t ) − 11u2 (t );
)
u1(t ) = q1(t ) − 2y 1(t ) + 150 y 2 (t ) + 2v 1(t ) − 50v 2 (t );
)
u2 (t ) = q2 (t ) − 20 y 1(t ) − 150 y 2 (t ) + 50v 2 (t ).
Результирующая структурная схема замкнутой системы представ-
лена на рис. 3.24.

211
150 -1000
10

-2 ∑ -9

-50

v1 u1 y1
2
ОБЪЕКТ
50
v2 u2 y2
-150

-20 -11

10
∑ 200

1000

Рис. 3.24. Структурная схема замкнутой системы

На рис. 3.25 показана итоговая структурная схема системы управ-


ления с использованием передаточных функций. Как и отмечалось вы-
ше, передаточные функции, связывающие соответствующие координаты
вектора входа и вектора выхода системы не зависят от наличия наблю-
дателя. Из рисунка хорошо видно, что результирующая система имеет
полностью развязанные каналы, по каждому из каналов обеспечены
единичная статика и заданные при синтезе собственные числа ( полюсы
передаточных функций).

212
v1 y1
2
p 2 + 2p + 2

v2 y2
50
p 2 + 10 p + 50

Рис. 3.25. Итоговая структурная схема


системы управления

213
СПИСОК ЛИТЕРАТУРЫ

1.Андреев Ю.Н. Управление конечномерными линейными объек-


тами. –М.: Наука, 1976. –424 с.
2.Бесекерский В.А., Попов Е.П. Теория систем автоматического ре-
гулирования. –М.: Наука, 1982. –304 с., ил.
3. Воронов А.А. Устойчивость, управляемость, наблюдаемость М.:Наука,
1979.-335с.,ил.
4.Деруссо П., Рой Р., Клоуз С. Пространство состояний в теории
управления. –М.: Наука, 1970. –620 с., ил.
5.Ерофеев А.А. Теория автоматического управления: учебник для
вузов. -СПб.: Политехника, 1998. -295 с.: ил.
6.Квакернаак Х., Сиван Р. Линейные оптимальные системы управ-
ления. –М.: Мир, 1977. –650 с., ил.
7.Красовский А.А., Поспелов Г.С. Основы автоматики и техниче-
ской кибернетики, М.-Л.. Госэнергоиздат, 1962, 600 с. с черт.
8.Острём К., Виттенмарк Б. Системы управления с ЭВМ: Пер с
англ. –М.: Мир, 1987. –480 с., ил.
9.Попов Е.П. Теория линейных систем автоматического регулиро-
вания и управления. –М.: Наука, 1978. –256 с., ил.
10.Попов Е.П. Теория нелинейных систем автоматического регули-
рования и управления. –М.: Наука, 1979. –256 с., ил.
11.Сборник задач по теории автоматического регулирования и
управления: Под ред. В.А.Бесекерского. 5-е изд., перераб. И доп.-М.:
Наука, 1978 с.-510с.,ил.
12.Синтез дискретных регуляторов при помощи
ЭВМ/В.В.Григорьев, В.Н.Дроздов, В.В.Лаврентьев, А.В.Ушаков–Л.: Ма-
шиностроение, Ленингр. отд-ние, 1983. –245 с..
13.Современная теория управления. / Под ред. Леондеса К.Т. –М.:
Наука, 1970. –512 с., ил.
14.Теория автоматического управления. Часть I/ Под ред. Нетуши-
ла А.В. –М.: Высшая школа, 1968. –424 с., ил.
15.Теория автоматического управления. Часть II/ Под ред. Нету-
шила А.В. –М.: Высшая школа, 1972. –432 с., ил.
16.Теория автоматического управления. Часть I/ Под ред. Вороно-
ва А.А. –М.: Высшая школа, 1977. –303 с., ил.
17.Теория автоматического управления. Часть II/ Под ред. Вороно-
ва А.А. –М.: Высшая школа, 1977. –288 с., ил.
18.Ту, Юлиус Т. Цифровые и импульсные системы автоматическо-
го управления. Пер. С англ. М., Машиностроение, 1964. 18. Топчеев Б.И.,
19.Ту Ю.Т. Современная теория управления. . –М.: Машинострое-
ние, 1965. –704 с.
20.Циплаков А.П. Задачник по теории автоматического регулиро-
вания. М.: Машиностроение,1977 С.-592 с., ил.

214
21.Цыпкин Я.З. Основы теории автоматических систем. –М.: Наука,
1977. –560 с., ил.

215
ОГЛАВЛЕНИЕ

1. ВВЕДЕНИЕ В ТЕОРИЮ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ .......................5

2. МЕТОДЫ АНАЛИЗА НЕПРЕРЫВНЫХ СИСТЕМ.............................................20

2.1. ПОНЯТИЕ ПРОСТРАНСТВА СОСТОЯНИЙ ....................................................................20


2.2. ЛИНЕАРИЗАЦИЯ ИСХОДНЫХ УРАВНЕНИЙ ..................................................................22
2.3. ЛИНЕЙНЫЕ СИСТЕМЫ, ЗАДАННЫЕ ОБЫКНОВЕННЫМИ ДИФФЕРЕНЦИАЛЬНЫМИ
УРАВНЕНИЯМИ В НОРМАЛЬНОЙ ФОРМЕ КОШИ.......................................................................32
2.3.1. ОДНОРОДНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ .................................................32
2.3.2. РЕШЕНИЕ НЕОДНОРОДНЫХ ВЕКТОРНО-МАТРИЧНЫХ ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ .........................................................................................................................36
2.4. НЕКОТОРЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ.............................................................37
2.4.1. СОБСТВЕННЫЕ ЧИСЛА, ХАРАКТЕРИСТИЧЕСКИЙ ПОЛИНОМ, ПРИСОЕДИНЕННАЯ
МАТРИЦА ..................................................................................................................37
2.4.2. СОБСТВЕННЫЕ ЗНАЧЕНИЯ И СОБСТВЕННЫЕ ВЕКТОРЫ ТРАНСПОНИРОВАННОЙ
МАТРИЦЫ .................................................................................................................41
2.4.3. ОПРЕДЕЛЕНИЕ ФУНКЦИИ ОТ МАТРИЦЫ ЧЕРЕЗ ЕЁ ЛЕВЫЕ И ПРАВЫЕ СОБСТВЕННЫЕ
ВЕКТОРЫ ..................................................................................................................44
2.5. СВОЙСТВА ДВИЖЕНИЙ ЛИНЕЙНЫХ СИСТЕМ ..............................................................49
2.5.1. МАТРИЧНАЯ ВЕСОВАЯ И ПЕРЕХОДНАЯ ФУНКЦИИ ...................................................49
2.5.2. МОДАЛЬНАЯ (СПЕКТРАЛЬНАЯ) ИНТЕРПРЕТАЦИЯ РЕШЕНИЯ ВЕКТОРНО-МАТРИЧНЫХ
ДИФФЕРЕНЦИАЛЬНЫХ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ УРАВНЕНИЙ ...................................54
2.6. МОДЕЛИ СТАЦИОНАРНЫХ ЛИНЕЙНЫХ СИСТЕМ В КОМПЛЕКСНОЙ ПЛОСКОСТИ
НА ОСНОВЕ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА ..................................................................56
2.6.1. МАТРИЦА ПЕРЕДАТОЧНЫХ ФУНКЦИЙ ....................................................................56
2.6.2. ОСНОВНЫЕ СВОЙСТВА ПЕРЕДАТОЧНЫХ ФУНКЦИЙ .................................................62
2.7. КОМПЛЕКСНЫЙ ПЕРЕДАТОЧНЫЙ КОЭФФИЦИЕНТ ......................................................65
2.7.1. СПОСОБЫ ОПРЕДЕЛЕНИЯ ПОНЯТИЯ «КОМПЛЕКСНЫЙ ПЕРЕДАТОЧНЫЙ
КОЭФФИЦИЕНТ» ........................................................................................................65
2.7.2. РЕАКЦИЯ ДИНАМИЧЕСКИХ ЗВЕНЬЕВ НА ГАРМОНИЧЕСКИЕ ВОЗДЕЙСТВИЯ .................66
2.7.3. ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ .............................................................................68
2.8. ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ОБЪЕКТОВ И СИСТЕМ УПРАВЛЕНИЯ ........................71
2.8.1. СОГЛАШЕНИЕ ОБ ОБОЗНАЧЕНИЯХ ........................................................................71
2.8.2. СТРУКТУРНЫЕ СХЕМЫ И ГРАФЫ СТАЦИОНАРНЫХ СИСТЕМ ......................................73
2.9. УСТОЙЧИВОСТЬ СИСТЕМ .........................................................................................86
2.9.1. АСИМПТОТИЧЕСКИЕ СВОЙСТВА СОБСТВЕННОГО ДВИЖЕНИЯ И ВЕСОВОЙ МАТРИЦЫ
ЛИНЕЙНОЙ СИСТЕМЫ ................................................................................................86
2.9.2. НЕОБХОДИМОЕ УСЛОВИЕ УСТОЙЧИВОСТИ ............................................................89
2.9.3. КРИТЕРИЙ УСТОЙЧИВОСТИ ГУРВИЦА....................................................................90
2.9.4. ЧАСТОТНЫЙ КРИТЕРИЙ УСТОЙЧИВОСТИ (КРИТЕРИЙ НАЙКВИСТА) ..........................94
2.10. КАЧЕСТВО ПРОЦЕССОВ УПРАВЛЕНИЯ ....................................................................105
2.10.1. ОСНОВНЫЕ ПОКАЗАТЕЛИ КАЧЕСТВА ...................................................................105
2.10.2. ОШИБКИ СИСТЕМЫ РЕГУЛИРОВАНИЯ В УСТАНОВИВШИХСЯ РЕЖИМАХ. СТАТИЧЕСКИЕ
И АСТАТИЧЕСКИЕ СИСТЕМЫ .....................................................................................108
2.10.3. ТОЧНОСТЬ СИСТЕМ ПРИ ОТРАБОТКЕ ГАРМОНИЧЕСКИХ СИГНАЛОВ ........................113

216
2.10.4. СВЯЗЬ МЕЖДУ ЛОГАРИФМИЧЕСКИМИ АМПЛИТУДНО-ЧАСТОТНЫМИ
ХАРАКТЕРИСТИКАМИ И КАЧЕСТВОМ ПЕРЕХОДНЫХ ПРОЦЕССОВ В САУ..................................115
2.10.5. СООТНОШЕНИЕ МАСШТАБОВ ВО ВРЕМЕННОЙ И ЧАСТОТНОЙ ОБЛАСТЯХ ................117
2.11. ИНТЕГРАЛЬНЫЕ КРИТЕРИИ КАЧЕСТВА С ПОЗИЦИЙ ОБЩНОСТИ ЗАДАЧ
ОПТИМАЛЬНОГО И МОДАЛЬНОГО СИНТЕЗА ...............................................................120

3. СИНТЕЗ ЛИНЕЙНЫХ НЕПРЕРЫВНЫХ СИСТЕМ .........................................125

3.1. ВЫБОР КОРРЕКТИРУЮЩИХ ЗВЕНЬЕВ. МЕТОД ЖЕЛАЕМЫХ ЛЧХ ..............................125


3.2. УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ СИСТЕМ ..........................................128
3.3. НАБЛЮДАЕМОСТЬ ЛИНЕЙНЫХ СТАЦИОНАРНЫХ СИСТЕМ. .......................................132
3.4. ЗАМЕНА БАЗИСА В ЛИНЕЙНОМ КОНЕЧНОМЕРНОМ ПРОСТРАНСТВЕ ...........................137
3.5. ЛИНЕЙНЫЕ ОПЕРАТОРЫ И МАТРИЦЫ ЛИНЕЙНЫХ ОПЕРАТОРОВ...............................140
3.6. ЗАМЕНА БАЗИСА В ПРОСТРАНСТВЕ СОСТОЯНИЙ ДИНАМИЧЕСКОЙ СИСТЕМЫ ...........145
3.7. ВЫЧИСЛЕНИЕ МАТРИЦЫ ПРЕОБРАЗОВАНИЯ БАЗИСА В ПРОСТРАНСТВЕ СОСТОЯНИЙ
ДИНАМИЧЕСКОЙ СИСТЕМЫ С ПОМОЩЬЮ МАТРИЦ УПРАВЛЯЕМОСТИ И НАБЛЮДАЕМОСТИ ......148
3.8. КАНОНИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ СИСТЕМ .............................................................150
3.8.1. УПРАВЛЯЕМОЕ КАНОНИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СИСТЕМЫ СО СКАЛЯРНЫМ
ВХОДОМ..................................................................................................................150
3.8.2. ПЕРЕДАТОЧНАЯ ФУНКЦИЯ И СТРУКТУРНАЯ СХЕМА ДЛЯ СИСТЕМЫ В УКП ..............155
3.8.3. ИДЕНТИФИКАЦИОННОЕ КАНОНИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ СИСТЕМЫ С ОДНИМ
(СКАЛЯРНЫМ) ВЫХОДОМ..........................................................................................156
3.8.4. ПЕРЕДАТОЧНАЯ ФУНКЦИЯ И СТРУКТУРА ДЛЯ СИСТЕМЫ В ИКП .............................157
3.9. ОБРАТНАЯ СВЯЗЬ ПО СОСТОЯНИЮ, ОБЕСПЕЧИВАЮЩАЯ ЗАДАННОЕ (ЖЕЛАЕМОЕ)
РАСПОЛОЖЕНИЕ СОБСТВЕННЫХ ЧИСЕЛ В ЗАМКНУТОЙ СИСТЕМЕ С ОДНИМ
(СКАЛЯРНЫМ) ВХОДОМ ...........................................................................................159
3.10. СИНТЕЗ УПРАВЛЕНИЯ В МНОГОМЕРНОЙ СИСТЕМЕ. ЗАДАЧА РАЗДЕЛЕНИЯ КАНАЛОВ .163
3.10.1. РАЗДЕЛЕНИЕ ИСХОДНОГО ОБЪЕКТА НА ПОДСИСТЕМЫ ИНТЕГРАТОРОВ..................163
ПРЕОБРАЗОВАНИЕ БАЗИСА В ПРОСТРАНСТВЕ R ...............................................167
n
3.10.2.
3.10.3. ФОРМИРОВАНИЕ УПРАВЛЕНИЯ ...........................................................................174
3.10.4. ИТОГОВЫЙ АЛГОРИТМ .......................................................................................177
3.11. ОСНОВЫ ПОСТРОЕНИЯ ИДЕНТИФИКАТОРОВ СОСТОЯНИЯ (НАБЛЮДАТЕЛЕЙ)............180
3.11.1. НАБЛЮДАТЕЛЬ ЛЮЕНБЕРГЕРА ПОЛНОГО ПОРЯДКА ..............................................180
3.11.2. НАБЛЮДАТЕЛЬ ПОНИЖЕННОГО ПОРЯДКА ............................................................186
3.11.3. НАБЛЮДАТЕЛЬ ЛЮЕНБЕРГЕРА МИНИМАЛЬНОГО ПОРЯДКА....................................190
3.12. СИНТЕЗ РЕАЛИЗУЕМОГО УПРАВЛЕНИЯ, ОБЕСПЕЧИВАЮЩИЙ ЗАДАННЫЕ ДИНАМИЧЕСКИЕ
И СТАТИЧЕСКИЕ СВОЙСТВА СИСТЕМЫ УПРАВЛЕНИЯ .................................................193
3.12.1. ДИНАМИЧЕСКИЕ СВОЙСТВА СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ И НАБЛЮДАТЕЛЕМ
ПОЛНОГО ПОРЯДКА .................................................................................................193
3.12.2. ДИНАМИЧЕСКИЕ СВОЙСТВА СИСТЕМЫ С ОБРАТНОЙ СВЯЗЬЮ УПРАВЛЕНИЕМ И
НАБЛЮДАТЕЛЕМ МИНИМАЛЬНОГО ПОРЯДКА ..............................................................195
3.12.3. РЕЗУЛЬТИРУЮЩИЙ АЛГОРИТМ СИНТЕЗА ДЛЯ СИСТЕМЫ С ОДНИМ ВХОДОМ
И ОДНИМ ВЫХОДОМ .................................................................................................196
3.12.4. ИТОГОВЫЕ ПРИМЕРЫ ПОЛНОГО СИНТЕЗА СИСТЕМ УПРАВЛЕНИЯ ..........................197

СПИСОК ЛИТЕРАТУРЫ................................................................................................214

ОГЛАВЛЕНИЕ................................................................................................................216

217