Вы находитесь на странице: 1из 208

А. Ю.

ОЩЕПКОВ

СИСТЕМЫ
АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ:
ТЕОРИЯ, ПРИМЕНЕНИЕ,
МОДЕЛИРОВАНИЕ В MATLAB

УЧЕБНОЕ ПОСОБИЕ

Издание второе,
исправленное и дополненное

САНКТПЕТЕРБУРГ•МОСКВА•КРАСНОДАР
2013
ББК 22.181я73
О 97
Ощепков А. Ю.
О 97 Системы автоматического управления: теория,
применение, моделирование в MATLAB: Учебное по&
собие. — 2&е изд., испр. и доп. — СПб.: Издательство
«Лань», 2013. — 208 с.: ил. — (Учебники для вузов.
Специальная литература).
ISBN 9785811414710
Пособие написано на основе лекций, читаемых автором на
протяжении ряда лет на физическом факультете Пермского уни&
верситета по дисциплинам «Теория автоматического управления»
и «Проектирование цифровых систем управления». В нем систе&
матически изложены основы современной теории управления
физическими системами и техническими устройствами. Рассмот&
рены основы математического моделирования систем управле&
ния, свойства систем управления с обратной связью и основные
методы анализа устойчивости непрерывных и дискретных систем,
описаны методы традиционной теории оптимального управления,
а также современные адаптивные и робастные алгоритмы управ&
ления. В качестве программного продукта, сопровождающего
лекции, использован пакет MATLAB.
Рекомендовано для студентов технических и классических
университетов.

ББК 22.181я73
Рецензенты:
П. В. ТРУСОВ — доктор физико&математических наук, профес&
сор, зав. кафедрой «Математическое моделирование систем и
процессов» Пермского государственного технического универ&
ситета; В. Н. АШИХМИН — кандидат технических наук, до&
цент кафедры «Математическое моделирование систем и про&
цессов» Пермского государственного технического университета;
А. Ф. ПШЕНИЧНИКОВ — доктор физико&математических наук,
профессор, зав. лабораторией динамики дисперсных систем Ин&
ститута механики сплошных сред УрО РАН.

Обложка
Е. А. ВЛАСОВА
Охраняется законом РФ об авторском праве.
Воспроизведение всей книги или любой ее части
запрещается без письменного разрешения издателя.
Любые попытки нарушения закона
будут преследоваться в судебном порядке.
© Издательство «Лань», 2013
© А. Ю. Ощепков, 2013
© Издательство «Лань»,
художественное оформление, 2013
All science is either physics
or stamp collecting.
Ernest Rutherford

ВВЕДЕНИЕ

«Feedback and its big brother, control theory, are such


important concepts that it is odd that they usually find no
formal place in the education of physicists», — пишет в сво

ей работе профессор университета Саймона Фразера (Simon


Fraser University, Canada) Джон Беххоефер*. На русском
языке фраза кратко звучит примерно так: «Странно, что
теория систем с обратной связью и ее старшая сестра —
теория управления — не входят в обязательное образова

ние физиков». О необходимости применения кибернети

ческих методов при проведении физических исследований


говорит и профессор А. Л. Фрадков** (Институт проблем
машиноведения РАН, Санкт
Петербург). Почему же в со

временном мире физики должны изучать и применять те

орию управления и, в частности, теорию систем с обрат

ной связью?
Рассмотрим прежде всего пример, понятный не толь

ко физикам. Представьте себе, уважаемый читатель: вы


увидели грациознейшее создание природы — лошадь, при

чем не важно, какой породы: арабской, орловской, клей

десдальской или любой другой. Вы захотели подробнее


исследовать свойства находящегося перед вами объекта.
Как это сделать? Любой продвинутый юзер на вашем месте
немедленно открыл бы с помощью своего мобильника

* Bechhoefer, J. Feedback for physicists: A tutorial essay on control //


Reviews of Modern Physics. — 2005. — V. 77. — P. 783–836.
** Фрадков, А. Л. О применении кибернетических методов в физике //
Успехи физических наук. — 2005. — Т. 175. — № 2. — С. 113–138.
4 А. Ю. ОЩЕПКОВ

ресурсы Internet, набрав ключевое слово «лошадь», вы


шел на сайт ЛОШАДИ.ru, познакомился бы с классифи
кацией объектов исследования, узнав при этом, что ло
шадь подругому именуют конем, самку лошади называ
ют кобылой, самца называют жеребцом, а в определенных
случаях — увы — мерином... Но вы уже вышли из возра
ста юного компьютерщика, обладаете навыками экспери
ментатора. Вы подходите к лошади, гладите ее по холке,
треплете гриву, ласково щелкаете по носу, увидев взмах
хвостом, с удовлетворением убеждаетесь в справедливо
сти одного из многочисленных законов природы, откры
тых знаменитой группой К. Пруткова: «Щелкни кобылу
в нос — она махнет хвостом». Наконец, набравшись сме
лости, вы садитесь на лошадь верхом, берете в руки по
вод... но стоп!
Стоп, читатель. Перед нами качественно новая реаль
ность! Всадник на коне — совсем не то, что исследователь
около него, пусть и с ноутбуком под мышкой. Конь для
всадника — уже не объект изучения, а объект управле
ния, повод в руке всадника — управляющее устройство,
взгляд всадника — датчик направления движения, руки
всадника реализуют обратную связь, заставляя объект
управления двигаться в нужном всаднику направлении с
заданной скоростью (можно сказать, по алгоритму, име
ющемуся в голове всадника). Все вместе называется си
стемой управления с обратной связью. Согласитесь, что
возможности системы с наличием обратной связи намно
го превосходят щелканье по носу объекта изучения, хотя
бы и с исследовательскими целями. Таким образом, си
стема с обратной связью представляет собой новую сущ
ность, достойную изучения.
В данном примере мы попутно познакомились с основ
ными понятиями теории управления. Но откладывать
книгу со словами: «А что, теорию управления я знаю!» —
еще рановато, поскольку рассмотренная нами система не
является системой автоматического управления, так как
в ней участвует человек.
Рассмотрим другой пример. Пусть вместо студента
исследователя мы имеем коллектив ученых, а в качестве
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 5

объекта управления вместо лошади — вещество в виде до)


статочно горячей плазмы. Цель коллектива ученых —
поддерживать плазму в таком состоянии, чтобы в ней не)
прерывно протекала реакция синтеза ядер, причем с за)
данной скоростью (управляемый термоядерный синтез).
Коллектив ученых не может физически «оседлать» плаз)
му. Задача коллектива теперь состоит в том, чтобы на ос)
новании глубоких знаний об объекте и с помощью приме)
нения теории управления создать (сконструировать) уст)
ройство, которое обеспечивало бы устойчивое управление
термоядерной реакцией автоматически, т. е. без участия
человека. Разумеется, в реакторе должно присутствовать
множество автономных автоматических регуляторов, но
тем не менее весь термоядерный реактор можно рассмат)
ривать как пример современной системы автоматическо)
го управления с обратной связью, которую невозможно со)
здать, не зная физики и теории управления одновременно.
Так что же такое «теория автоматического управле)
ния»? В узком смысле — это теоретическое обоснование и
разработка алгоритмов, на основании которых должно
работать устройство управления. Действительно, устрой)
ство автоматического управления должно на основании
входящих сигналов количественно обработать получен)
ную информацию и выработать сигналы управления по
определенному алгоритму или программе. Информаци)
онный сигнал не связан с физической природой объекта
управления. Разрабатываемый алгоритм может предназ)
начаться для управления объектами любой природы:
социальными, финансово)экономическими, химически)
ми, биологическими, физико)техническими. Поэтому си)
стему управления рассматривают как абстрактную мате)
матическую модель, называемую кибернетическим бло)
ком, а теорию автоматического управления — как один
из разделов кибернетики наряду с теорией информации,
системным анализом, теорией вычислительных машин,
робототехникой и другими дисциплинами кибернетичес)
кой науки.
Существует много учебников по теории управления,
в которых излагается решение формализованных задач
6 А. Ю. ОЩЕПКОВ

управления на основе строго доказываемых математиче


ских теорем. Однако для того, чтобы сконструировать со
временную систему управления объектом, имеющим слож
ную физическую природу, нужно знать не только матема
тическое обоснование того или иного алгоритма. Нужно
хорошо понимать физические особенности управляемого
процесса, уметь построить адекватную математическую
модель, которую можно запрограммировать и с помощью
компьютерного моделирования отладить с целью оптими
зации алгоритма и его последующей аппаратной реализа
ции. В настоящее время под аппаратной реализацией по
нимается разработка автономного цифрового устройства,
осуществляющего процесс управления объектом с помо
щью высокотехнологичных исполнительных устройств.
Настоящее пособие написано в виде курса лекций.
В лекциях приведены основы математического моделиро
вания и рассмотрены формы представления математичес
ких моделей систем управления в пространстве состояний
и в виде передаточных функций. Излагаются основные
свойства систем управления с обратной связью и элемен
ты теории устойчивости, необходимые для их анализа.
Приведены алгоритмы построения оптимального управ
ления в гамильтоновой формулировке для нескольких
конкретных задач, рассмотрены современные адаптивные
и робастные алгоритмы. Словом, в лекциях изложены ос
новные традиционные методы теории управления, а так
же новые методы, которые применяются в современных
системах управления. Для компьютерного моделирования
и исследования свойств систем управления используется
программный пакет MATLAB.
Несмотря на элементарность излагаемого материала,
с точки зрения современной математической теории уп
равления предполагается, что читатель обладает сведения
ми по математическому анализу, линейной алгебре, тео
рии функций комплексной переменной, вариационному
исчислению, системному анализу в объеме, даваемом на
физическом факультете университета.
Базовые знания, которые даются в лекциях, позволя
ют ориентироваться в современной теории систем управ
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 7

ления с обратной связью и ее применении в физических


системах и технических устройствах. Более глубокие зна/
ния по тому или иному методу можно получить из лите/
ратуры, перечисленной в библиографическом списке.
В книге [7] имеется обширный перечень монографий и
учебных пособий по современной теории управления на
русском и английском языках (464 источника). Ссылки на
оригинальные работы, монографии и сайты разработчи/
ков, которые упоминаются по ходу изложения в данных
лекциях, даются в постраничных сносках.
В первой лекции рассказ идет в основном об истории
развития техники автоматических регуляторов. Изло/
жены принципы работы регуляторов прямого действия,
простых аналоговых регуляторов по отклонению. Затем
объясняется структура современных цифровых систем уп/
равления и соответственно намечаются требования к ал/
горитмам, на основании которых работают современные
системы автоматического управления (САУ).
Лекции 2–5 посвящены проблемам построения мате/
матических моделей систем управления, что является в
настоящее время очень важным при конструировании
САУ. Рассматриваются основные формы представления
математических моделей линейных стационарных систем:
пространство состояний и сигнальные графы (лекция 3),
и передаточные функции и структурные схемы (лекция 4)
и способы перехода от одной формы к другой. В лекции 5
описаны конкретные примеры построения математичес/
ких моделей.
В лекциях 6 и 7 рассмотрены общие свойства систем
управления с обратной связью, алгоритмы работы и ме/
тоды настройки стандартных ПИД/регуляторов, широ/
ко применяемых в современных автоматических устрой/
ствах.
Лекции 8 и 9 посвящены изложению теории устойчи/
вости. Приведены теоремы устойчивости Ляпунова, рас/
смотрены основные методы анализа и критерии устойчи/
вости линейных стационарных систем.
В лекции 10 кратко описываются дискретные систе/
мы управления и их устойчивость.
8 А. Ю. ОЩЕПКОВ

В лекциях 11–13 изложены основы теории оптималь


ного управления в современной формулировке. Дана клас
сификация задач оптимального управления, рассмотрены
необходимые условия оптимальности, принцип максиму
ма Понтрягина и метод динамического программирования
Беллмана.
В лекциях 14 и 15 излагаются основные принципы ра
боты современных робастных и адаптивных систем управ
ления. Исследуется робастность систем управления с обрат
ной связью, описывается алгоритм скоростного градиента
для непрерывных систем, приводится пример адаптивно
го алгоритма с эталонной моделью для объекта первого
порядка с параметрической неопределенностью.
В заключительной, 16й лекции приводятся алгорит
мы работы робастных и адаптивных регуляторов для диск
ретных систем. В качестве примера робастного алгоритма
описывается известный градиентный метод. Рассмотрены
новые быстрые алгоритмы для систем 1го и 2го порядков
и адаптивное управление объектом 1го порядка на основе
быстрого алгоритма с идентификацией параметров мето
дами линейной регрессии.
О применении программного пакета MATLAB для мо
делирования систем управления рассказывается в отдель
ных приложениях. В приложении 1 дан перечень основ
ных функций пакета, применяемых при моделировании
и исследовании свойств систем управления, приведен при
мер построения переходной характеристики системы и
анализа качества работы регуляторов. В приложении 2
приведены возможности пакета Simulink для моделиро
вания линейных систем, которые проиллюстрированы
примером настройки коэффициентов ПИДрегулятора при
известных параметрах объекта управления. В приложе
нии 3 описываются компьютерные модели адаптивных
систем управления.
В лекциях и приложениях имеются упражнения, вы
полнение которых способствует закреплению и более глу
бокому усвоению изученного материала.
Мы вступили окончательно
в эру автоматики.
Р. Беллман

ЛЕКЦИЯ 1

ОТ КЛЕПСИДРЫ ДО «ТЕРМОДАТА»

1.1.
СТРУКТУРА СИСТЕМ
АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
Центральной составляющей системы автоматического уп#
равления является объект управления. Перечислим не#
сколько примеров физических (в широком смысле этого
слова) систем или процессов, которые могут рассматри#
ваться в качестве объектов управления:
· температура воздуха в комнате;
· скорость транспортного средства;
· курс корабля;
· орбита искусственного спутника Земли;
· рука робота#манипулятора;
· качество аудио# или видеосигнала;
· скорость химической или ядерной реакции;
· диссоциация отдельных молекул;
· прибыль фирмы;
· количество народонаселения.
Второй необходимой составляющей при формулиров#
ке задачи управления является понятие цели управления.
Объект может находиться в состоянии, которое по каким#
либо причинам нас не удовлетворяет. Цель управления со#
стоит в том, чтобы перевести объект в нужное состояние.
Суть процесса управления показана на рисунке 1.1. Оче#
видно, что при отсутствии одной из составляющих (объек#
та или цели управления) постановка задачи управления бес#
смысленна. Очень часто приходится учитывать условия

Рис. 1.1
Процесс управления
10 А. Ю. ОЩЕПКОВ

протекания процесса управления: ограниченность управ


ляющих воздействий, критерии качества, стоимость зат
рат на управление и т. п., которые являются дополнитель
ными условиями.
Упражнение 1.1.
Сформулируйте возможные цели управления для при
веденных выше примеров объектов управления.
Итак, дадим следующее определение.
Определение 1.1. Управление — это целенаправленное
воздействие на объект, приводящее к его переходу в нуж
ное (заданное) состояние.
В процессе управления может участвовать человек. На
пример, поддерживать комфортную температуру воздуха
в комнате можно с помощью периодического подбрасыва
ния дров в камин. Мы имеем в данном случае систему уп
равления со всеми составляющими: температура воздуха и
обстановки в комнате (объект управления), камин (испол
нительное устройство), обитатель помещения (задатчик не
обходимых условий, датчик состояния объекта и испол
нитель задающих воздействий одновременно). Интересно,
что дрова, наружную температуру, состояние дверных и
оконных уплотнений и т. д. мы не вводим в состав систе
мы управления — это все окружающая среда, с одной сто
роны, являющаяся поставщиком энергии, а с другой —
оказывающая возмущающие воздействия. Однако в рабо
те рассмотренной системы управления участвует человек,
поэтому она не является автоматической.
Определение 1.2. Система автоматического управле
ния — это система, процесс управления в которой (функ
ционирование системы) осуществляется автоматически,
т. е. без участия человека.
Примечание. Если в системе управления часть функ
ций выполняется автоматически, а часть функций — че
ловеком (оператором), то такую систему принято называть
автоматизированной системой [8].
Приведенные выше примеры, определения и понятия
достаточно ясно указывают, что система автоматического
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 11

управления (САУ) должна иметь структуру, изображен+


ную на рисунке 1.2. Работает эта САУ следующим обра+
зом. Физический сигнал о состоянии объекта по каналу
обратной связи поступает на измерительное устрой
ство (ИзУ), которое выдает информационный сигнал на
устройство сравнения с входным значением (заданный уро+
вень сигнала, задатчик, уставка — это синонимы для оп+
ределения нужного значения выхода системы). Сигнал
рассогласования E (Error) поступает в устройство управ
ления (УУ), которое по заложенному в нем алгоритму об+
рабатывает информацию и вырабатывает сигнал управ
ления u, который поступает на вход исполнительного уст+
ройства (ИсУ). Исполнительное устройство воспринимает
маломощный сигнал управления и вырабатывает управ
ляющее воздействие U, открывая определенным образом
каналы передачи энергии (электрическая энергия, топ+
ливо, сжатый воздух и т. п.) от окружения к объекту. Суть
функционирования системы, таким образом, состоит в
том, что необходимое воздействие на объект, переводящее
его в заданное состояние (указывается на входе системы),
определяется автоматически на основании обработки уст+
ройством управления результатов измерения выходных
сигналов объекта.
Отдельные элементы системы, изображенной на ри+
сунке 1.2, могут отсутствовать или объединяться, но
принципиальным для схемы САУ является наличие об+
ратной связи.
Определение 1.3. Системы автоматического управле+
ния с обратной связью называются замкнутыми систе
мами, а системы без обратной связи — разомкнутыми.
Разомкнутые системы применяются в основном в тех
случаях, когда выходные сигналы трудно измеримы или
вообще отсутствуют. В этом случае сигналы управления
заранее программируются в УУ, а в ходе работы системы
передаются исполнительному устройству. Управление в
разомкнутых системах принято называть программным,
или П+управлением, в отличие от синтеза управления в
системах с обратной связью (С+управление).
12 А. Ю. ОЩЕПКОВ

Рис. 1.2
Структура системы автоматического управления:
E — сигнал рассогласования (расстройка или невязка); u — сигнал управления;
U — управляющее (энергетическое) воздействие.

Упражнение 1.2.
Изобразите структуру разомкнутой системы управления.
Приведите примеры замкнутых и разомкнутых САУ.

В завершение краткой классификации систем автома-


тического управления приведем три пока нестрогих опре-
деления. Управляющее устройство работает по алгорит-
му, содержащему параметры, настроенные на некоторое
определенное внешнее воздействие. Если алгоритм с за
данными параметрами достигает цели управления при
изменяющихся внешних воздействиях, он называется ро
бастным (или грубым) алгоритмом, а диапазон изменения
внешних воздействий, в котором алгоритм остается рабо-
тоспособным, — областью робастности. Если в алгоритме
заложена корректировка параметров для наиболее точ
ного управления в условиях изменения внешних воздей
ствий, то он называется адаптивным. Наконец, если
внешние воздействия изначально неизвестны, а алгоритм
настраивается на достижение цели управления в ходе сво
ей работы, он называется самонастраивающимся.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 13

1.2.
РЕГУЛЯТОРЫ ПРЯМОГО ДЕЙСТВИЯ
Подводя черту под очередным этапом технического
развития человечества, в середине прошлого века амери-
канский ученый Ричард Беллман* писал: «Следует признать
тот факт, что мы вступили окончательно в эру автомати-
ки». Эта фраза подчеркивает, что существование цивили-
зованного общества сейчас немыслимо без использования
автоматических устройств. Однако идея автоматическо-
го регулирования и первые регуляторы появились гораз-
до раньше. Рассмотрим на нескольких примерах историю
развития техники автоматического регулирования.
В качестве одного из самых ранних автоматических
устройств обычно упоминается регулятор для водяных
часов (клепсидры), появившийся более 2 тыс. лет назад в
Древнем Египте. Задача регулятора (цель управления) со-
стоит в том, чтобы поддерживать постоянный уровень
воды в баке (объект управления) для сохранения скоро-
сти вытекания струи из сливного отверстия. Для решения
задачи был применен поплавковый клапан: в бак поме-
щался поплавок с прикрепленным к нему дозирующим
органом, например иглой. При повышении уровня жид-
кости в баке поплавок перемещается, а при достижении
заданного уровня игла перекрывает входное отверстие,
через которое жидкость подается из внешнего резервуа-
ра. Таким образом, система будет работать полностью в
автоматическом режиме, пока не исчерпается вода в ре-
зервуаре (энергетические ресурсы внешней среды). Оче-
видно, что поплавковые регуляторы успешно применяют-
ся до сих пор в бытовых и технических устройствах, на-
пример в карбюраторах двигателей внутреннего сгорания.
Далее сравним структуру рассмотренной системы ав-
томатического управления со схемой рисунка 1.2. Объект
управления и цель управления мы уже указали. (Отметим,
что речь идет только о поплавковом регуляторе как устрой-
стве, поддерживающем уровень жидкости; если говорить

* Беллман, Р. Процессы регулирования с адаптацией. — М. : Наука,


1964. — 360 с.
14 А. Ю. ОЩЕПКОВ

о водяных часах, то их цель — правильное измерение вре%


мени, а цель работы карбюратора — точная дозировка топ%
ливо%воздушной смеси, но, согласитесь, это уже пробле%
мы не поплавкового регулятора, а более широких и слож%
ных систем, частью которых он является.) Поплавок в
данном случае определяет уровень жидкости, а следова%
тельно, является измерительным устройством. Если до%
зирующее устройство (в данном случае — игла), которое
является исполнительным устройством, совмещено с из%
мерительным, то устройство управления в этом случае ста%
новится ненужным. Регуляторы такого типа называются
регуляторами прямого действия.
Другим интересным примером регулятора прямого
действия является печь с автоматической регулировкой
температуры, изобретенная голландским мастером Кор%
нелиусом Дреббелем в 1620 г. Устройство печи изображе%
но на рисунке 1.3.
Объектом управления здесь является внутренний от%
сек печи (инкубатор), температуру в котором нужно под%
держивать на заданном уровне, это — цель управления.
Источником энергии служит горящий каменный уголь.
Интенсивность горения обеспечивается степенью откры%
тия демпфирующего клапана, перекрывающего вытяжное
отверстие в верхней части печи: при полностью закрытом
клапане горение прекращается, при полностью откры%
том — происходит самое интенсивное горение и обеспечи%
вается максимально возможная температура в инкубато%
ре. Для автоматического регулирования положения кла%

Рис. 1.3
Печь с автоматической
регулировкой температуры
(К. Дреббель, 1620)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 15

пана создана цепь обратной связи: в инкубатор помещает*


ся сосуд со спиртом, который расширяется или сжимает*
ся в зависимости от температуры в инкубаторе; спирт че*
рез трубку действует на ртуть в сосуде, ртуть выталкивает
находящийся в ней поплавок, поплавок через систему ры*
чагов с регулируемой длиной плеча действует на клапан.
Упражнение 1.3.
Изобразите схематически структуру печи К. Дреббеля
и укажите ее основные элементы в конструкции печи.
Поясните, как происходит изменение температурной ус*
тавки (требуемого значения температуры в инкубаторе).
Современные исследования печи К. Дреббеля показа*
ли, что с ее помощью температура поддерживается с точ*
ностью до 0,6°C.
Другими классическими примерами регуляторов пря*
мого действия являются центробежные регуляторы И. Пол*
зунова (1766) и Дж. Уатта (1784), управляющие частотой
вращения валов паровых двигателей. С их конструкцией
читатель знаком из курса общей физики.
Рассмотренные примеры показывают, что в регулято*
рах прямого действия, исторически являющихся первы*
ми автоматическими устройствами, требуемое значение
выходного сигнала задается настройкой механических
элементов в цепи обратной связи. Устройство управления
в этих регуляторах отсутствует, можно сказать, что его роль
выполнили инженерная мысль и творческая смекалка кон*
структора на стадии проектирования систем управления.
Появление в жизни человеческого общества электри*
ческой энергии совершило техническую революцию во
многих областях, в том числе в разработке и сфере приме*
нения автоматических регуляторов.

1.3.
РЕГУЛЯТОРЫ ПО ОТКЛОНЕНИЮ
Электрический сигнал является универсальным. Его
легко измерить, преобразовать и подать на вход исполни*
тельного устройства. Рассмотрим устройство и принци*
пы работы аналоговых регуляторов, предшественников
16 А. Ю. ОЩЕПКОВ

современных цифровых систем управления. В качестве


измерительного устройства в таких регуляторах служит
датчик, преобразующий любую физическую величину
(температуру, давление, частоту вращения, расход жид
кости или газа и т. д.) в электрический сигнал*. Выход
ной сигнал измерительного устройства поступает на ин
версный вход устройства сравнения, на положительный
вход которого подается требуемое значение электричес
кого сигнала (уставка). Величина уставки задается, напри
мер, изменением положения ручки потенциометра. Что
бы правильно определить эту величину, необходимо знать
коэффициент преобразования измерительного устройства
(в более общем случае, когда выходной сигнал датчика
нелинейно зависит от измеряемой физической величины,
необходимо знать номинальную статическую характери
стику (НСХ) этого датчика).
Сигнал рассогласования E (отклонение измеренного
сигнала от требуемого значения) подается в устройство
управления на обработку. На рисунке 1.4 приведена схе
ма аналогового устройства управления, в котором проис
ходит усиление сигнала Е в K раз. Сигнал управления u,
поступающий на вход исполнительного устройства, в этом
случае оказывается пропорциональным отклонению вы
ходного сигнала системы от требуемого значения, поэтому
регуляторы с таким устройством управления называют про
порциональными, или Прегулято
рами (не путать с Пуправлением!).
Установка требуемого значения ко
эффициента K осуществляется под
строечным элементом — перемен
ным резистором.
Рис. 1.4
Для повышения точности регу
Схема устройства лирования в устройство управления
управления
аналогового дополнительно к усилителю включа
Прегулятора ют цепь интегрирования и/или диф
ференцирования. Такие регуляторы
* Левшина, Е. С. Электрические измерения физических величин.
Измерительные преобразователи / Е. С. Левшина, П. В. Новицкий. —
Л. : Энергоатомиздат, 1983. — 320 с.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 17

Рис. 1.5
Схема устройства управления
аналогового ПИД'регулятора

сокращенно называют ПИДрегуляторы. Схема устрой'


ства управления аналогового ПИД'регулятора с усилива'
ющим, интегрирующим и дифференцирующим звеньями
приведена на рисунке 1.5. Такой регулятор имеет три на'
строечных параметра: коэффициент K, время интегриро'
вания TИ и время дифференцирования TД. Параметры
можно изменять с помощью подстроечных элементов, ука'
занных на рисунке 1.5.
ПИД'регуляторы называются в настоящее время стан
дартными регуляторами по отклонению. Их настройка
заключается в подборе трех параметров и вводе их значе'
ний в управляющее устройство с помощью изменения
номиналов подстроечных элементов соответствующих зве'
ньев. Более 60 лет назад Зиглер и Никольс предложили
методику настройки ПИД'регуляторов по эксперимен'
тальным данным, которая используется до сих пор. В на'
стоящее время существует множество методов настройки
стандартных регуляторов, в том числе с использованием
18 А. Ю. ОЩЕПКОВ

компьютерного моделирования. Мы рассмотрим некото


рые из них в последующих лекциях.
Отметим, что приемлемое качество регулирования до
стигается не при какихто конкретных значениях настроеч
ных коэффициентов, а в широком диапазоне их значений,
поэтому ПИДрегулятор представляет собой пример уни
версального робастного регулятора, используемого в си
стемах управления с обратной связью, что объясняет боль
шую их популярность в технике.

1.4.
СОВРЕМЕННЫЕ
ЦИФРОВЫЕ СИСТЕМЫ
АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
Современные системы управления содержат микро
контроллеры, в которые записывается алгоритм работы
устройства управления. Рассмотрим состав современных
цифровых САУ на примере системы автоматического уп
равления температурой промышленных объектов с исполь
зованием прибора «Термодат», выпускаемого приборострои
тельным предприятием «Системы контроля» (г. Пермь)*.
Функциональная схема такой системы приведена на рисун
ке 1.6. В простейшем случае цель работы системы состоит
в поддержании температуры объекта на заданном уров
не (выше температуры окружающей среды). В качестве
объекта могут выступать отдельное помещение, оборудо
ванное электрическим обогревателем, муфельная печь,
химический реактор с электроподогревом и т. д.
В рассматриваемом примере температура объекта из
меряется с помощью термометра сопротивления (ТС), из
готовленного на основе платинового или медного резис
тивного элемента, электрическое сопротивление которо
го изменяется в зависимости от температуры известным
образом. Эта зависимость называется нормированной ста
тической характеристикой (НСХ) первичного преобразо
вателя. ТС подключается к входу электронного цифро
вого регулятора «Термодат», значение сопротивления

* http://www.termodat.ru
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 19

Рис. 1.6
Система автоматического
управления температурой
с использованием цифрового
регулятора «Термодат»:
АЦП — аналого-цифровой преобразователь; ЦП — центральный процессор; ТС —
термометр сопротивления.

преобразуется в электрическое напряжение и через ана-


лого-цифровой преобразователь подается на вход цент-
рального процессора (ЦП). В одноканальном регуляторе
«Термодат-10» в качестве АЦП используется дельта-сиг-
ма преобразователь, а в качестве ЦП — микроконтроллер
PH8951RC Philips с характеристиками: 8 разрядов, про-
граммируемая память 32 Кбайт, рабочая тактовая частота
11 МГц.
В память процессора в табличном виде вводится НСХ
первичного преобразователя, с которым будет работать
данный прибор. Перед пуском системы управления на кон-
кретном объекте оператор с помощью кнопок на панели
вносит в память прибора требуемое значение температу-
ры (уставки), и регулятор готов к работе. Возможностей
процессора достаточно как для осуществления работы при-
бора по программе ПИД-регулятора с коэффициентами,
устанавливаемыми вручную оператором, так и для выпол-
нения сложных алгоритмов с функцией самонастройки.
После обработки результатов измерений процессор на
основе заложенного в нем алгоритма выдает сигналы уп-
равления на транзисторный выходной ключ по закону ши-
ротно-импульсного модулирования (ШИМ). Транзистор-
ный ключ, в свою очередь, управляет внешним силовым
тиристорным блоком, коммутирующим цепи питания од-
20 А. Ю. ОЩЕПКОВ

нофазного или трехфазного тока на полезную нагрузку —


нагревательный элемент, расположенный на объекте.
Упражнение 1.4.
Укажите основные элементы структуры системы ав&
томатического управления температурой с регулято&
ром «Термодат».
Как видим, современные системы автоматического уп&
равления содержат все элементы, указанные на схеме ри&
сунка 1.2. Отличительной особенностью систем с цифровым
устройством управления является то, что микроконтрол&
лер требует определенного времени на обработку сигнала,
следовательно, в течение промежутка времени, пока идет
обработка, выходной сигнал не изменяется, а затем из&
меняется скачком до нового значения. Поэтому цифровое
устройство управления называют дискретным, промежу&
ток времени между последовательными выдачами сигна&
лов управления — шагом, или периодом дискретизации,
а систему управления с цифровым устройством также на&
зывают дискретной. Однако при этом нужно различать два
случая: дискретное управление непрерывными объекта&
ми (рассмотренный выше пример) и управление дискрет&
ными объектами (пример дискретного объекта — шаговый
двигатель).
Минимальный период дискретизации устройства уп&
равления определяется быстродействием процессора и
сложностью заложенной в нем программы. Некоторые
современные алгоритмы управления требуют специально&
го подбора периода дискретизации, который, разумеется,
не меньше минимального периода, а кратен ему. Мини&
мальный период дискретизации не должен превышать
естественных характерных времен протекания процес&
сов в объекте управления. Отсюда вытекают требования
к быстродействию микроконтроллеров, применяемых
для регулирования. Собственные времена изменения тем&
пературы массивных тел составляют десятки секунд, а
иногда достигают нескольких часов (например, в систе&
мах отопления зданий). Дискретность микропроцессор&
ных регуляторов при этом незаметна, они работают как
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 21

непрерывные. Если контроллер управляет, например,


двигателем автомобиля, то тактовая частота процессора
не должна быть меньше частоты вращения вала двигателя:
3000...6000 об/мин = 50...100 Гц. Обработка и управление
звуковыми сигналами в акустическом диапазоне требу7
ют частот в десятки тысяч герц, частота видеосигналов
составляет сотни мегагерц, что предъявляет соответству7
ющие требования к микроконтроллерам.
Сложность объектов управления и алгоритмов, исполь7
зуемых в современных системах автоматического управ7
ления, делает необходимым этап компьютерного модели7
рования при конструировании систем управления. Это
моделирование должно быть весьма разносторонним: мо7
делирование динамических процессов в объекте управле7
ния (разработка математической модели объекта), моде7
лирование и отладка алгоритмов управления, эмуляция
микропроцессора в компьютере, наконец, генерация ма7
шинного кода для прошивки микропроцессоров. Для вы7
полнения указанных целей в настоящее время имеется
много программных продуктов.
Для моделирования процессов управления очень хо7
рошо подходит программный пакет MATLAB (MATrix
LABoratory)*, разработанный фирмой The Math Works, Inc.,
ставший фактически международным стандартом учебно7
го программного обеспечения, в том числе в области тео7
рии управления. Стоит заметить, что свежие версии этого
продукта далеко превосходят рамки обычного учебного про7
граммного обеспечения, позволяют работать с измери7
тельными и управляющими устройствами через компью7
терные порты и генерировать код для цифровых сигналь7
ных процессоров (Digital Signal Processor — DSP). В данном
курсе лекций для учебных целей используется студенческая
версия MATLAB. Основные сведения, необходимые для
применения пакета MATLAB для исследования систем
автоматического управления, приведены в приложениях.
В некоторых российских вузах для преподавания
курса «Теория систем автоматического регулирования»

* http://matlab.exponenta.ru
22 А. Ю. ОЩЕПКОВ

используется программный пакет VisSim*, разработан


ный фирмой Visual Solutions. Этот пакет имеет мощ
ный интерфейс для визуализации моделируемых про
цессов, широкий набор инструментов для оценки качества,
устойчивости, синтеза, коррекции, оптимизации, лине
аризации, отладки систем в контуре моделирования и для
программирования цифровых сигнальных процессоров.
Для решения серьезных инженерных задач по моде
лированию динамических процессов в различных объек
тах (теплообмен, электромагнетизм, линейная и нелиней
ная прочность, гидрогазодинамика) предназначена систе
ма конечноэлементных расчетов ANSYS**, разработанная
фирмой ANSYS, Inc. Систему можно использовать при
моделировании сложных систем управления соответству
ющими процессами.
Фирма National Instruments разработала специальную
платформу, позволяющую объединять и настраивать раз
личные измерительные приборы, автоматизировать ру
тинные операции, основой платформы является среда гра
фического программирования LabVIEW***. Программиро
вание на LabVIEW сводится к настройке лицевой панели
и блоксхемы виртуального прибора, функциональность
и внешний вид которого определяются пользователем.
При помощи LabVIEW можно вести измерения, анализи
ровать сигналы и управлять исполнительными механиз
мами в режиме реального времени.
Перечисленные примеры обеспечивают понимание того,
что системы автоматического управления находят широчай
шее применение, теория автоматического управления не
прерывно развивается, с одной стороны, вслед за развитием
современных технологий, с другой стороны, помогает их
непрерывному совершенствованию. Освоение знаний в
области теории автоматического управления и разработ
ка новых передовых технологий и алгоритмов управле
ния очень актуальны и имеют большую перспективу.

* http://www.vissim.nm.ru
** http://www.ansys.msk.ru
*** http://www.labview.ru
Подобно тому, как дар слова обогащает нас
мнениями других, так язык математических знаков
служит средством еще более совершенным,
более точным и ясным, чтобы один
передавал другому понятия, которые он приобрел,
истину, которую он постигнул, и зависимость
между всеми частями, которую он открыл.
Н. И. Лобачевский

ЛЕКЦИЯ 2

МАТЕМАТИЧЕСКАЯ ФОРМУЛИРОВКА
ЗАДАЧ УПРАВЛЕНИЯ
2.1.
ОБЩИЕ СВОЙСТВА
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
Для того чтобы разработать и отладить алгоритм управ
ления, в настоящее время нет необходимости в проведе
нии длительных и дорогостоящих экспериментов. На по
мощь приходит математическое моделирование, которое
оформилось в самостоятельную научную дисциплину в
связи с широким применением компьютеров. Что такое
математическая модель? Приведем общее определение:
Определение 2.1. Математическая модель — это сово
купность математических объектов и отношений между
ними, которые отображают объекты и отношения некото
рой области реального мира (предметной области).
Описав с помощью математических терминов поведе
ние объекта управления, составных частей измерительно
го и исполнительного устройств и добавив в схему числен
ный алгоритм, мы получим математическую модель (ММ)
системы управления. Создав адекватную математическую
модель, конструктор получает в руки универсальный, гиб
кий и недорогой инструмент, с помощью которого можно
проводить все необходимые «опыты»*.

* Самарский, А. А. Математическое моделирование: Идеи. Методы.


Примеры / А. А. Самарский, А. П. Михайлов. — М. : ФИЗМАТЛИТ,
2002. — 320 с.
24 А. Ю. ОЩЕПКОВ

Отметим, что при разработке системы управления на


этапе построения ее математической модели нет необхо"
димости учитывать все тонкие детали строения объекта,
так как основным критерием правильности модели в дан"
ном случае является достижение цели регулирования ре"
альной системы, поэтому модель объекта может быть при"
ближенной. Поясним эту мысль более подробно.
Математическое моделирование тесно связано с при"
кладной математикой и с общей теорией систем, но не со"
впадает с ними, поскольку теория систем, как и другие
разделы математики, имеет дело лишь с математически"
ми объектами. Предмет математического моделирования
шире и включает, кроме исследования математических
объектов, формализацию постановки практической зада"
чи и интерпретацию полученных практических резуль"
татов. Иными словами, началом и концом процесса ма"
тематического моделирования является окружающая
действительность. Это особенно справедливо по отноше"
нию к моделированию систем управления.
Последовательность действий при постановке задач
математического моделирования (методика математиче"
ского моделирования) приведена на рисунке 2.1. Снача"
ла мы должны четко определить состав системы, опре"
делить, что подается на вход (входы) объекта и что по"
лучится на выходе (выходах), установить цель работы
системы. Все это осуществляется пока в описательных тер"
минах (словами). Следующий этап является самым важ"
ным: мы должны определить, каким законам или, может
быть, частным соотношениям подчиняются объект и
другие элементы системы управления, и записать их в
виде математических (формальных) зависимостей меж"
ду некоторыми числовыми величинами. Числовые вели"
чины, связанные с системой, делятся на переменные и
параметры.

Определение 2.2. Параметры — это величины, кото"


рые можно считать постоянными в промежутке времени
рассмотрения системы. Остальные числовые величины
являются переменными.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 25

Рис. 2.1
Методика математического моделирования

Значения переменных и параметров определяют коли*


чественную информацию о системе. Оставшаяся информа*
ция, качественная, определяет структуру системы. Выбор
параметров определяется видом законов (универсальных
26 А. Ю. ОЩЕПКОВ

зависимостей), которые применяются для описания си


стемы. Итак, на данном этапе, собственно, и строится ма
тематическая модель: определяется структура системы и
соответственно выбираются параметры и переменные,
описывающие состояние объекта. Возможно, что получен
ная модель окажется слишком сложной для дальнейшей
работы с ней. Тогда сложную задачу нужно разбить на не
сколько более простых подзадач или, как говорят, прове
сти декомпозицию.
Далее мы должны формализовать цель работы систе
мы, учесть существующие ограничения и также форма
лизовать их. Получив математическую формулировку за
дачи, мы должны эту задачу решить. Решение может быть
получено аналитически или с помощью компьютерного
моделирования. Итогом решения является алгоритм ра
боты системы. Но это не окончание процесса моделирова
ния! Наличие математического решения не означает, что
реальная система будет работать так, как предполагал раз
работчик. Задача моделирования системы управления бу
дет полностью решенной, если предложенный алгоритм
заработает практически, в противном случае нужно вер
нуться к началу, проанализировать ошибки и исправить
их (рис. 2.1).
Практика применения методов построения математи
ческих моделей к реальным объектам дала возможность
выработать несколько простых полезных советов, кото
рые можно назвать «заповедями» математического моде
лирования [3]. Приведем их.
1. Не решай сложную задачу, не решив простую (прин
цип простоты).
2. Без ошибки нет модели, а потому негрубые модели —
плохие (принцип А. А. Андронова).
3. Можно пренебрегать чем угодно, нужно только точ
но знать, как это повлияет на результат (принцип Э. Хе
мингуэя).
4. Чем проще модель, тем реже она обманет (принцип
надежности).
5. Точность результатов не может быть выше точности
исходных данных; точности результатов промежуточных
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 27

вычислений должны быть согласованы (принцип А. Н. Кры*


лова).
6. Цель расчетов — не числа, а понимание. Прежде чем
решать задачу, подумай, что делать с ее решением (зако*
ны Р. Хемминга).
Упражнение 2.1.
Попробуйте построить математическую модель печи
К. Дреббеля.
2.2.
МАТЕМАТИЧЕСКАЯ ФОРМУЛИРОВКА
ЗАДАЧ УПРАВЛЕНИЯ ПОВОРОТОМ
ВАЛА ЭЛЕКТРОДВИГАТЕЛЯ
Рассмотрим задачу управления поворотом вала элект*
родвигателя постоянного тока, управляемого по цепи воз*
буждения (статора) при постоянном токе в обмотке под*
вижного сердечника (якоря). К валу двигателя прикреп*
лена полезная нагрузка, например плечо руки робота. Вал
вместе с нагрузкой нужно повернуть на определенный
угол. Стоит заметить, что двигатели постоянного тока об*
ладают такими качествами, как возможность регулиро*
вания скорости вращения в широком диапазоне, высокий
вращающий момент, компактность, хорошие нагрузочные
характеристики, поэтому они широко применяются в ро*
ботах*манипуляторах, лентопротяжных механизмах, ди*
сководах, в машиностроении и исполнительных устрой*
ствах следящих систем.
Вернемся к построению математической модели (см.
схему рис. 2.1). Объект управления — электродвигатель,
запитываемый от цепи постоянного тока. К валу двигате*
ля прикреплена нагрузка. Вход объекта — приложенное
напряжение, выход — угол поворота вала. Цель управле*
ния — удобно сформулировать после составления матема*
тической модели объекта. Переходим к этапу построения
математической модели объекта, затем выберем цель и
только потом составим ММ системы управления в целом.
В простейшем случае статор можно представить в
виде электрической цепи, содержащей сопротивление R
(активное сопротивление обмотки) и индуктивность L,
28 А. Ю. ОЩЕПКОВ

Рис. 2.2
Простейшая модель электродвигателя,
управляемого по цепи статора

межвитковыми емкостями пренебрегаем. Протекающий


по обмотке статора ток i создает в зазоре двигателя маг"
нитный поток F, который взаимодействует с постоянным
током якоря и вызывает крутящий момент М, что приво"
дит к вращению якоря и жестко скрепленного с ним вала
с нагрузкой (рис. 2.2).
Будем считать, что магнитный поток F прямо про"
порционален току i в статоре, а механический момент M,
в свою очередь, пропорционален магнитному потоку:
F(t) = k1i(t), M(t) = k1F(t) = k1k2i(t) º Ki(t). (2.1)
Пренебрегая трением и силой сопротивления окружа"
ющей среды, для угла поворота вала j запишем уравне"
ние движения:
1111122 2 3 122 2 451223 (2.2)
где J — момент инерции вала с нагрузкой.
Ток в статоре подчиняется закону Кирхгофа:
12132
4 1 52132 2 6132 . (2.3)
13
Подставляя выражение (2.2) в (2.3), получим уравне"
ние для j:
12111
1132 2 42 111132 3 561323 (2.4)
которое и представляет собой математическую модель
объекта. Параметрами объекта являются четыре кон"
станты: L, R, J и K. Переменная u(t) — вход объекта,
переменная j(t) — выход. Отметим, что состояние объек"
та описывается тремя величинами, поскольку уравнение
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 29

движения имеет третий порядок. Таким образом, выход(


ная переменная не описывает полное состояние объекта.
Для задания состояния объекта в качестве независи(
мых переменных состояния {x1, x2, x3} выберем три вели(
чины: угол поворота, угловую скорость и угловое ускоре(
ние, соответственно: x1 = j, 11 1 21 3 12 1 2
114 Эти переменные
называются фазовыми переменными. Выходную перемен(
ную обозначим буквой y. Теперь уравнение (2.4) можно
записать в виде системы трех дифференциальных уравне(
ний первого порядка:
111 1 12 4
112 1 13 4
113 1 2 2 13 3 3 45 (2.5)
5 56
К системе (2.5) нужно добавить уравнение выхода
y = x 1. (2.6)
Получили математическую модель в виде системы ли(
нейных дифференциальных уравнений с постоянными
коэффициентами (линейная стационарная система). Фор(
ма представления математической модели в виде (2.5),
которая получается, когда в качестве переменных состоя(
ния выбирают фазовые переменные, называется формой
Коши. Существуют другие формы представления матема(
тических моделей для линейных систем, которые будут
подробно рассмотрены в следующем разделе (лекция 3).
Заметим, что вектор состояния задается тремя пере(
менными, а выход системы представляет собой одну вели(
чину, т. е. не совпадает с вектором состояния.
Определение 2.3. Если управление системой осуществ(
ляется с учетом полного вектора состояния, оно называ(
ется управлением по состоянию, в противном случае уп(
равление называется управлением по выходу.
Для построения математической модели системы уп(
равления в целом необходимо выбрать и формализовать
цель работы системы. Если мы можем измерить выход(
ную величину y (в рассматриваемом случае должен иметься
30 А. Ю. ОЩЕПКОВ

датчик угла поворота вала), то мы можем замкнуть объект


обратной связью. Целью тогда может служить достижение
определенного положения вала и удерживание его в этом
положении, что формально можно записать в виде
y ® yуст, 0 £ t £ ¥. (2.7)
Значение yуст должно быть подано на вход системы с
обратной связью. В качестве устройства управления мож-
но использовать стандартный ПИД-регулятор, математи-
ческая модель которого содержит три параметра: K, TИ,
TД (см. рис. 1.5). Формулы, описывающие алгоритм рабо-
ты ПИД-регулятора, будут рассмотрены в следующих лек-
циях, пока их конкретный вид не очень важен.
Итак, математическая модель системы автоматиче-
ского управления поворотом вала электродвигателя го-
това (рис. 2.3). Модель можно очень просто запрограмми-
ровать в пакете Simulink среды MATLAB и с помощью
компьютерного моделирования определить значения пара-
метров ПИД-регулятора, при которых система имеет за-
данные динамические и точностные характеристики. Про-
цесс оптимизации работы регуляторов в цепи обратной
связи будет подробно рассмотрен в лекции 7. Остается вве-
сти найденные параметры в реальный регулятор и убедить-
ся в работоспособности реального двигателя, управляемо-
го данным регулятором.
Если все хорошо, процесс моделирования можно счи-
тать завершенным. В противном случае следует вернуть-

Рис. 2.3
Математическая модель системы управления
электродвигателем с обратной связью
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 31

ся к процессу построения модели системы и понять, что


не было учтено в модели объекта и составных частей си.
стемы, исправить модель и снова применить результаты
моделирования к реальной системе. В нашем случае, на.
пример, не учтены времена срабатывания измерительно.
го и исполнительного устройств. Если их промоделиро.
вать звеньями первого порядка, повысится порядок си.
стемы, т. е. изменится ее структура.
Система управления электродвигателем может быть и
разомкнутой, устройство управления в таком случае дол.
жно вырабатывать управление по заранее определенной
зависимости u(t). Целью по.прежнему остается поворот
вала двигателя в течение заданного промежутка времени
0 £ t £ T, но при этом накладываются условия оптималь
ности. Например, если мы имеем производственный цех с
большим количеством электродвигателей, многократно
повторяющих операции поворотов, то весьма разумно по.
требовать, чтобы эти операции осуществлялись с мини
мальными энергозатратами. Формализуем это требование
для нашей модели.
Энергия, подводимая к двигателю, затрачивается на
рассеяние в активном сопротивлении ER и накапливается
в индуктивности EL:
E(t) = ER(t) + EL(t). (2.8)
Составные части полной энергии Е, затраченной в те.
чение времени работы системы, имеют вид
1 1
62 1 2 3 51 374475 63 1 3 3 5374 45 47 13651 31 4 2 51 32478 (2.9)
2 2
47
Зависимость тока i от времени определяется видом за.
висимости u(t), следовательно, полная энергия является
функционалом от управляющего воздействия. Требование
оптимальности заключается в минимизации этого функ.
ционала:
JO(u) = ER + EL ® min, (2.10)
который в данном случае называется критерием качества.
Систему (2.5) нужно решить с учетом требования (2.10) и
32 А. Ю. ОЩЕПКОВ

найденную в результате решения зависимость u(t) запрог


раммировать в устройство управления. Методы решения
таких оптимальных задач без ограничений на управля
ющие воздействия будут рассмотрены в лекциях 11 и 12.
Наконец, учтем и формализуем ограничения, накла
дываемые на управляющее воздействие. Электрическое
напряжение, подаваемое на двигатель, не может быть
больше напряжения источника питания U. Поэтому пер
вое естественное ограничение может быть записано в виде
неравенства
0 £ u(t) £ U. (2.11)
Далее, если электродвижущая сила, возникающая в
обмотке при изменении тока, превысит напряжение про
боя UПР, то двигатель выйдет из строя, что нежелательно.
Поэтому нужно наложить следующее ограничение:

3 12 1 412 3 (2.12)
15
О решении задач оптимального управления при огра
ничениях на управляющие воздействия будет рассказано
в лекции 13.
Итак, мы прошли все этапы схемы, приведенной на
рисунке 2.1, и приблизились к окончанию процесса ма
тематического моделирования. Анализируя последнюю
задачу, мы можем отметить, что ограничение (2.12) ма
тематически гораздо сложнее ограничения (2.11). Может
быть, его не стоит учитывать? Ответить на этот вопрос
можно в ходе самого процесса моделирования: предва
рительно решить задачу без ограничения (2.12) и прове
рить (в модели), нарушается или нет это неравенство.
Можно поступить еще проще, вспомнив принцип про
стоты и принцип надежности. Нужно решить задачу,
положив L = 0, при этом понизится порядок системы,
а условие (2.12) отомрет само собой. Если алгоритм, най
денный на основе упрощенной модели, окажется работо
способным, дальнейшие усложнения не понадобятся.
Воет ветер дальних странствий,
Раздается жуткий свист —
Это вышел в Подпространство
Структуральнейший лингвист.
Аркадий и Борис Стругацкие

ЛЕКЦИЯ 3

ФОРМЫ ПРЕДСТАВЛЕНИЯ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ.
ПРОСТРАНСТВО СОСТОЯНИЙ

Рассмотрим более подробно формы представления мате"


матических моделей линейных стационарных систем. Та"
ких форм представления (можно даже сказать — нагляд"
ного изображения) существует много. Мы рассмотрим две
основные формы: форму в виде дифференциальных урав"
нений (пространство состояний) и алгебраическую форму
(передаточные функции в комплексном пространстве).

3.1.
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ
RLCЦЕПИ
Начнем с примера. Пусть имеется простейшая RLC"цепь,
изображенная на рисунке 3.1 (колебательный контур). По"
строим ее математическую модель. В первую очередь не"
обходимо определить переменные, описывающие состоя"
ние системы. Кроме того, необходимо определить, какие
переменные являются входными, а какие — выходны"
ми. Переменные состояния выберем из следующих сооб"
ражений: поскольку энергия E, запасенная в RLC"цепи,
выражается через напряжение на конденсаторе vc(t) и че"
рез ток в индуктивности iL(t):
3 1 234152421 2 234155611 6 то в ка"
честве переменных состояния
{x 1, x 2} выбираем эти вели"
чины:
x1 = vc(t), x2 = iL(t). (3.1) Рис. 3.1
RLC"цепь
34 А. Ю. ОЩЕПКОВ

Входной переменной будем считать ток источника u(t),


в качестве выходной переменной рассмотрим напряжение
на резисторе vR. Используя закон Кирхгофа для токов, за&
пишем дифференциальное уравнение первого порядка,
определяющее скорость изменения напряжения на кон&
денсаторе:
341
51 1 6 1 7182 2 52 3 (3.2)
38
Закон Кирхгофа для напряжений, примененный к пра&
вому контуру, дает уравнение, определяющее скорость
изменения тока через индуктивность:
341
1 1 2541 3 62 1 (3.3)
37
Выход системы определяется линейным алгебраичес&
ким уравнением vR = RiL(t).
Уравнения (3.2) и (3.3) мы можем переписать в виде
системы двух дифференциальных уравнений относитель&
но переменных состояния x1 и x2:
121
1 2 1 22 3 1 33445
14 5 5
121 2
1 2 232 3 (3.4)
14 5 2 5 1

Тогда выходной сигнал будет равен


y(t) = vR(t) = Rx2. (3.5)
Используя уравнения (3.4) и (3.5), а также началь&
ные условия [x1(t0), x2(t0)], мы сможем определить бу&
дущее поведение системы и выходную переменную.
Итак, мы получили математическую модель RLC&цепи
в виде линейных дифференциальных уравнений перво&
го порядка с постоянными коэффициентами. Такие си&
стемы называются линейными стационарными систе
мами (ЛСС). По&английски: Linear TimeInvariant (LTI)
Systems.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 35

3.2.
ПРОСТРАНСТВО СОСТОЯНИЙ
Переменные состояния, описывающие систему, не яв%
ляются единственными, всегда можно выбрать другую
комбинацию переменных. Например, для системы второ%
го порядка, такой как RLC%цепь, в качестве переменных
состояния можно выбрать любые две линейно независи%
мые комбинации x1(t) и x2(t). Для RLC%цепи мы могли бы
принять за переменные состояния два напряжения: vc(t) и
vL(t), где vL — напряжение на индуктивности. Тогда но%
вые переменные состояния, 121 и 121 3 будут связаны со ста%
рыми переменными x1 и x2 соотношениями:
221 1 31 1 223 (3.6)
321 1 42 1 41 2 562 1 33 2 532 4 (3.7)

Упражнение 3.1.
Постройте математическую модель RLC%цепи в пере%
менных 4121 5 131 67
В реальной системе всегда можно образовать несколь%
ко наборов переменных состояния, которые адекватно
описывают ее динамику. При составлении модели электро%
двигателя (2.5) мы выбирали в качестве переменных со%
стояния выходную величину (угол поворота вала) и ее
производные (угловую скорость и угловое ускорение).
При этом получили систему дифференциальных уравне%
ний в форме Коши, которая часто используется при мате%
матическом исследовании поведения системы. Однако сей%
час стоит заметить, что модель в форме Коши не всегда
удобно использовать в системах управления с обратной
связью по состоянию. В электродвигателе можно измерить
тахометром угловую скорость вращения вала, но прибор
для измерения углового ускорения является экзотикой.
Зато легко измерить ток в обмотке статора, который и нуж%
но использовать в качестве одной из переменных состоя%
ния. Так часто и поступают при проектировании систем
управления: на практике в качестве переменных состоя
ния часто выбирают такие физические переменные, ко
торые могут быть легко измерены.
36 А. Ю. ОЩЕПКОВ

Упражнение 3.2.
Постройте математическую модель электродвигателя
(см. рис. 2.2) в переменных 11 1 21 2 x2 = i, x3 = j.

Переменные состояния характеризуют динамику си$


стемы. Инженера в первую очередь интересуют физичес$
кие системы, в которых переменными являются напряже$
ния, токи, скорости, перемещения, давления, температу$
ры и другие аналогичные физические величины. Однако
понятие состояния применимо к анализу не только физи$
ческих, но и биологических, социальных и экономичес$
ких систем. Для этих систем понятие состояния не огра$
ничивается рамками представлений об энергии и подхо$
дит к переменным состояния в более широком смысле,
трактуя их как переменные любой природы, описываю
щие будущее поведение системы.
В общем случае состояние линейной динамической
системы задается набором переменных состояния {x1(t),
x2(t), ..., xn(t)}, а изменение переменных состояния опи$
сывается линейными дифференциальными уравнениями
первого порядка. Система уравнений имеет вид
311 1 411 31 2 412 32 2 333 2 411 31 2 51161 2 333 2 51262 4
312 1 42131 2 422 32 2 333 2 421 31 2 52161 2 333 2 52262 4
333
31 1 1 41131 2 412 32 2 333 2 411 31 2 51161 2 333 2 51262 5 (3.8)

где {u1(t), u2(t), ..., um(t)} — компоненты вектора управля$


ющих воздействий 1 (входной сигнал). Здесь и далее бук$
вами с чертой вверху будем обозначать векторы веществен$
ного пространства, что символически можно записать
2 1 31 1 где n — размерность пространства.
В матричной форме уравнения (3.8) примут вид
1 31 2 1 411 412 333 411 2 1 31 2
5 333 512 2 161 2
1 3 3 4 34 422 333 421 4 3 32 4 31 11
12 3 2 4 5 3 21 4 6 3 4 7 333 333 333 4 6 3333 4 3
3333 4 3 333 333 333 333 4 3333 4 3 4 3 4
3 31 4 3411 4 3 4 3
8 511 333 512 94 8362 94
8 9 8 412 333 411 9 8 31 9
(3.9)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 37

Введем обозначения для матриц и векторов:

1 31 2 1 411 412 333 411 2


33 4 34 422 333 421 4
2 21
1 5 3 44 253 44
333
3 4 3 333 333 333 333 4
3 31 4 3411 412 333 411 47
6 7 6
1511 333 512 2 161 2
3 5 3 333 4
333 333 4 4 5 8 3333 4 3
3 4 3 4
63511 333 512 74 6362 74

Теперь систему (3.9) можно записать в компактном


виде:
1 1 1 21 2 341
(3.10)
12
Матрица A является квадратной матрицей n ´ n, она
определяет свободную динамику объекта, т. е. его поведе5
ние при 1 1 12 а матрица B имеет размерность n ´ m и оп5
ределяет вклад каждого из входов в динамику системы.
В общем случае выходные сигналы {y1(t), y2(t), ..., yp(t)}
связаны с переменными состояния уравнением выхода

1 51 2 1 411 412 333 411 2 1 61 2


7 333 712 2 181 2
3 5 4 3 421 422 333 421 4 3 62 4 1 11
3 2453 4 6 3 4 7 3 333 333 333 4 6 3333 4 4
3333 4 3 333 333 333 333 4 3333 4 3 4 3 4
3 5 3 4 34 31 4 3 4 3
8 731 333 732 94 3882 49
8 9 8 4 32 333 4 31 9 8 61 9

или в компактной форме:


1 1 23 2 451 (3.11)
В современной теории управления модель (3.10), (3.11)
называют моделью в пространстве состояний (State
space). В MATLAB эта модель называется ABCDмоделью.
Для модели (3.4), (3.5), например, матрицы A, B, C, D име5
ют вид

4 2 31 5 1
1 7 3 2 8 4 2 5 3 3 8 2 3 3 4 8 24 (3.12)
186 6 7 1 2
691 4 33 4 7
96 2
7
38 А. Ю. ОЩЕПКОВ

Если система управления имеет один вход (m = 1) и


один выход (p = 1) — singleinputsingleoutput, она назы
вается SISOсистемой. Если у системы несколько входов и
несколько выходов — multipleinputmultipleoutput, она
называется MIMOсистемой. Мы будем рассматривать в
основном SISOсистемы.

3.3.
СИГНАЛЬНЫЕ ГРАФЫ
Модель системы в переменных состояния можно пред
ставить графически в виде сигнального графа. Сигналь
ный граф для системы (3.4), (3.5) имеет вид, приведен
ный на рисунке 3.2.
Сигнальный граф — это совокупность направленных
отрезков (ветвей), начинающихся и оканчивающихся в
узлах графа. На рисунке 3.2 ветви изображены отрезка
ми или дугами с нанесенными на них направлениями, а
узлы — кружочками. Ветвь, входящая в узел, означает
входящий сигнал, а выходящая ветвь — исходящий сиг
нал. При движении по ветви сигнал претерпевает изме
нения: умножается на константу, интегрируется или
дифференцируется. Символ операции указывается око
ло соответствующей ветви. Так, во второй слева узел на
рисунке 3.2 входит величина U, умноженная на 1/C, и ве
личина x2, умноженная на –1/C; оба сигнала складыва
ются в узле и интегрируются на выходе из узла (символ
интегрирования 1/s), в результате получаем величину x1.
Упражнение 3.3.
Изобразите сигнальный граф для RLCцепи в перемен
ных 4121 5 131 67

Рис. 3.2
Сигнальный граф для RLCцепи
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 39

Использование сигнальных графов является удобным


наглядным методом записи системы алгебраических урав-
нений, который позволяет показывать взаимосвязь меж-
ду переменными. Можно решить и обратную задачу: зная
взаимосвязь между переменными, изобразить модель си-
стемы в виде сигнального графа и на основании этой моде-
ли записать уравнения состояния. Это тривиально сделать
для алгебраических уравнений. Для дифференциальных
уравнений просто нужно иметь в виду, что на входе любо-
го интегратора, который имеется в графе, всегда должна
стоять производная величины, получающейся в резуль-
тате операции интегрирования. Поэтому, анализируя,
например, граф на рисунке 3.2, мы видим, что в узел пе-
ред первым интегратором приходит сумма 2 1324 1 2 31 5
4 4
которую нужно приравнять производной 111 2 в результате
получается первое уравнение системы (3.4). Анализируя
узел перед вторым интегратором, получаем второе урав-
нение этой системы.

3.4.
УПРАВЛЯЕМОСТЬ
И НАБЛЮДАЕМОСТЬ СИСТЕМ
Управляемость. Говорят, что система, описываемая
матрицами A и B, является управляемой, если существу-
ет такое неограниченное управление 11 которое может
перевести систему из произвольного начального состоя-
ния 1123 в любое другое заданное состояние 11123 Для си-
стемы с одним входом и одним выходом вводится понятие
матрицы управляемости Рс, которая выражается как
12 2 234341 3 33341 1234 (3.13)
и имеет размерность n ´ n. Если определитель матрицы
управляемости отличен от нуля, то система является уп-
равляемой.
Ответить на вопрос, является ли система управляемой,
можно и другим способом. Для этого надо изобразить граф
системы в переменных состояния и определить, имеются
ли пути от управляющего сигнала u к каждой из перемен-
40 А. Ю. ОЩЕПКОВ

ных состояния. Если такие пути существуют, то система


может быть управляемой, т. е. этот признак не является
достаточным.
Наблюдаемость системы связана со способностью оце%
нивать переменные состояния по результатам измерения
выходного сигнала. Говорят, что система является наблю
даемой, если каждая переменная состояния вносит свой
вклад в выходной сигнал системы. Система является на%
блюдаемой тогда и только тогда, когда существует такое
конечное время T, что начальное состояние 1123 может
быть определено в результате наблюдения выходной пере%
менной y(t), t Î T, при заданном управлении u(t). Здесь вво%
дят понятие матрицы наблюдаемости размерности n ´ n:

21 3
412 5
364 52 (3.14)
41 5
4 1 11 5
74 12 85
Система наблюдаема, если определитель матрицы Q
отличен от нуля.
Функции MATLAB, которые применяются для иссле%
дования систем на управляемость и наблюдаемость, при%
ведены в приложении 1.
Упражнение 3.4.
Система описывается уравнениями
111 1 211 2 23
11 2 1 3 11 2 12 3 24 3 1 11 2 12 5
Проведите анализ системы на управляемость и наблю%
даемость с помощью построения сигнального графа и
MATLAB. Прокомментируйте полученный результат.
Есть только миг между
прошлым и будущим.
Л. Дербенев

ЛЕКЦИЯ 4

ФОРМЫ ПРЕДСТАВЛЕНИЯ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ.
ПЕРЕДАТОЧНЫЕ ФУНКЦИИ
4.1.
ОПРЕДЕЛЕНИЕ ПЕРЕДАТОЧНЫХ ФУНКЦИЙ
По своему смыслу передаточная функция (ПФ) — это
функция, связывающая один входной и один выходной
сигналы СУ. Она является формой записи системы урав/
нений движения, решенной относительно требуемой вы/
ходной переменной. В подавляющем большинстве случа/
ев ПФ записывается не для функций времени x(t), а для
их преобразований Лапласа X(s), т. е. ПФ связывает в этом
варианте не сигналы, а их изображения, поскольку эта
связь алгебраическая, а не интегральная.
Найдем передаточную функцию для нашего примера
RLC/цепи. Это можно сделать, подвергнув преобразованию
Лапласа непосредственно систему (3.4), (3.5), однако по/
яснения удобно вести, перейдя к одному дифференциаль/
ному уравнению второго порядка.
Обозначим x(t) = x2(t) и продифференцируем второе
уравнение в (3.4) по времени. Получим уравнение

11 1 1 21 1 1 2 2 1 32
2 (4.1)
4 45 45
эквивалентное системе (3.4), (3.5).
Сначала найдем решение неоднородного уравнения (4.1)
при однородных начальных условиях 1123 1 24 11 123 1 2
(это важно для определения ПФ!) с помощью преобразо/
1
вания Лапласа: 3 213 3 4 42235 2 12624 Отметим, что величина
1
s определена в комплексном пространстве (комплексная
частота). В физике часто используется преобразование с
42 А. Ю. ОЩЕПКОВ

вещественной частотой — преобразование Фурье. Одна


ко в теории управления преобразование Лапласа имеет
преимущество, поскольку в нем явно присутствуют на
чальные условия, поэтому здесь применяют преобразова
ние с комплексной частотой.
Преобразования Лапласа от первой и второй производ
ных 11 1 213 12 1 2
11 соответственно равны:
1
31 415 3 4 41 4255 2 12 62 3 17415 2 44256
2
1
(4.2)
33 415 3 4 4
114255 2 12 62 3 13 7415 2 14425 2 141 4257
2

Поэтому, подвергая (4.1) преобразованию Лапласа и


учитывая однородность начальных условий, получим

12 5 56 2
3 1 2 3 2 3324 4 2 4 3245
1
56
(4.3)
Отметим, что уравнение
21 1 1 2 1 2 2 3 (4.4)
3 34
является характеристическим уравнением системы (3.4),
(3.5), а сам полином
2 3 34 1 31 2 1 3 2 2 (4.5)
4 45
называется характеристическим полиномом, который
играет важную роль в исследовании СУ с помощью пере
даточных функций.
Поскольку преобразование Лапласа выходного сигна
ла y(t) имеет вид Y(s) = R × X(s), то, умножив (4.3) на R, с
учетом (4.5), получим 2 1324 132 1 1 5 1323 Отсюда получа
67
ем связь между изображениями управляющего воздействия
(входа) U(s) и наблюдаемой величиной (выходом) Y(s):
1 1 23
4 253 1 6 253 2 7 2536 2534 (4.6)
8 253
где
1 2 23 1
4 35 4 1 1 5 (4.7)
6 354 2351 2 135 2 6
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 43

В соответствии с вышеизложенным G(s) и является


передаточной функцией рассматриваемой системы.
Определение 4.1. Передаточная функция системы
(Transfer function) — это отношение преобразования Лап2
ласа выходной переменной к преобразованию Лапласа
входной переменной при нулевых начальных условиях:

1 122
3 122 1 3
4 1 22
Передаточная функция имеет размерность, которая
определяется отношением размерности величины выхода
к размерности входной величины. В рассмотренном при2
мере [G] = Ом.
1122
В общем случае 3 122 1 3 где в знаменателе находит2
4 1 22
ся характеристический полином степени n (порядок си
стемы), а в числителе — полином p(s) степени n – 1 или
более низкой:
3 41 2 31 114111 2 333 2 32
5 445 3 1 2 6 1 4 2 1 13 (4.8)
4 2 62 1142 11 2 333 2 62

Определение 4.2. Корни характеристического полино2


ма q(s) называются полюсами, а корни полинома p(s) —
нулями передаточной функции.

Чтобы найти полное решение уравнения (4.1), найдем


решение однородного уравнения (u 1 0) при ненулевых
начальных условиях: 1213 1 11 4 11 213 1 111 5 Учитывая (4.2),
получаем
1223
4 2 23 1 4 1223 1 252 2 6371 2 571 1 4 5 1 54 6 1 3 6 (4.9)
8 2 23 9
Полное решение запишется в виде суммы решений (4.6)
и (4.9):
1122 3122
4 1 22 1 2 5 1223 (4.10)
6 122 6 122
44 А. Ю. ОЩЕПКОВ

4.2.
ПЕРЕХОДНЫЕ ХАРАКТЕРИСТИКИ
СИСТЕМ УПРАВЛЕНИЯ
Однородность начальных условий, требуемая при оп
ределении передаточной функции, означает физически,
что система в момент времени t = 0 находится в состоянии
покоя (равновесия). В этот момент на вход системы пода
ется какойто сигнал. Этот сигнал может оставаться по
стоянным (ступенчатое входное воздействие) или перемен
ным, например импульсным или периодическим.
Если на систему оказать постоянное воздействие, то
она перейдет с течением времени в новое состояние покоя
(релаксирует к новому состоянию). Если оказывается им
пульсное воздействие, система выходит из равновесия,
а затем возвращается в исходное состояние. В любом слу
чае переходный процесс будет представлять собой некото
рую функцию времени.
Единичная ступенчатая функция описывается выра
жением
2 12 1 1 13
4516 3 4
642 1 5 17 (4.11)

Единичная импульсная функция (дельтафункция


Дирака) описывается как
12
4122 5 1 31224 6 412212 5 35 (4.12)
12 32
Преобразования Лапласа этих функций имеют вид
1213 1 1 4 (4.13)
1
d(s) = 1. (4.14)
Определение 4.3. Реакция системы на ступенчатое воз
действие называется переходной функцией (переходной
характеристикой). Реакция системы на импульсное воздей
ствие называется весовой функцией (характеристикой).

На рисунке 4.1 приведена для примера переходная ха


рактеристика для RLCцепи при следующих значениях
параметров:
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 45

R = 20 Ом, L = 10 Гн, C = 40 мкФ,


212 1 1 13
2415 3 4
661 782 1 5 19
График построен с помощью применения функций
MATLAB (см. Приложение 1). Отметим, что выход систе8
мы в установившемся режиме 21 3 123 2415 может быть
1 21
найден с помощью преобразования Лапласа выходной пе8
ременной по известному правилу:
31 3 234 3516 4 234 24 5267 (4.15)
121 2 21

Упражнение 4.1.
Определите аналитически величину установившегося
выходного сигнала RLC8цепи при указанных на рисун8
ке 4.1 значениях параметров. Прокомментируйте по8
лученный результат.

Рис. 4.1
Переходная характеристика RLC8цепи

Рис. 4.2
Структурная схема RLC8цепи
46 А. Ю. ОЩЕПКОВ

4.3.
СТРУКТУРНЫЕ СХЕМЫ
Зная передаточную функцию, мы можем изобразить
причинно"следственную связь между переменными в на"
глядной схематической форме в виде структурной схемы.
Структурные схемы состоят из блоков направленного дей"
ствия, каждому из которых соответствует определенная
передаточная функция.
На рисунке 4.2 изображена структурная схема RLC"цепи.
Если структурная схема состоит из нескольких блоков, то
полная передаточная функция системы может быть запи"
сана в виде произведения передаточных функций этих бло"
ков. Данное правило проиллюстрировано на рисунке 4.3.

Рис. 4.3
Преобразование структурной схемы

Другие правила работы со структурными схемами бу"


дут рассмотрены по ходу изложения. Заметим только, что
анализ систем путем преобразования структурных схем
дает гораздо лучшее представление о роли каждого эле"
мента, чем это было бы при рассмотрении уравнений.

4.4.
СВЯЗЬ МЕЖДУ
ПЕРЕДАТОЧНЫМИ ФУНКЦИЯМИ
И УРАВНЕНИЯМИ СОСТОЯНИЯ
Модель системы в виде передаточных функций можно
представить в виде дифференциальных уравнений состоя"
ния и наоборот. Рассмотрим, каким образом осуществля"
ется переход от одной формы представления математиче"
ской модели к другой форме для систем с одним входом и
одним выходом (SISO).
Пусть задана передаточная функция системы вида (4.8).
Она позволяет элементарно перейти к системе диф"
ференциальных уравнений в форме Коши (в фазовом
пространстве) или к канонической диагональной фор"
ме. Проиллюстрируем этот переход на примере системы
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 47

третьего порядка, чтобы не загромождать обозначений.


ПФ имеет вид
1 21 1 1 2 1 13
3 526 2 4 1 1 2 7 (4.16)
2 1 41 2 1 422 1 43
Поскольку в знаменателе стоит характеристический
полином, мы можем сразу записать соответствующее ему
дифференциальное уравнение:
111 11 1 22 11 1 23 1 2 34
1 1 21 1 (4.17)
Обозначим x1 = x и, действуя, как и ранее в п. 2.2, по>
лучаем цепочку уравнений:
111 1 12 5
112 1 13 5
113 1 224 11 2 2112 2 22 13 3 36 (4.18)

Это и есть система уравнений состояния в форме Коши.


В числителе функции (4.16) согласно определению ПФ
стоит преобразование Лапласа от выходной переменной.
Следовательно, мы можем сразу записать уравнение вы>
хода:
y(t) = b2x3 + b1x2 + b0x1. (4.19)
Разложим теперь функцию (4.16) на элементарные
дроби, используя метод неопределенных множителей.
При отсутствии кратных полюсов можем записать
12 1 1
2 435 1 2 3 2 1 6 (4.20)
3 3 32 3 3 33 3 3 31
Введем три переменных {x1, x2, x3}, каждая из кото>
рых соответствует полюсу ПФ с соответствующим индек>
сом. Система дифференциальных уравнений для этих пе>
ременных сразу записывается в виде
111 4 42 112
2 5 34
1 12 4 6 2 7 314 6 35467
4 (4.21)
3 4 3 4
83 4 4 13 94 83194
Уравнение выхода имеет вид
1425 3 131 32 33 2 4 46 (4.22)
48 А. Ю. ОЩЕПКОВ

Физический смысл переменных состояния в моде


ли (4.21), (4.22) является весьма туманным. При наличии
кратных полюсов (корней характеристического полино
ма) матрица A примет не диагональную, а блокдиагональ
ную (жорданову) форму.
Если требуется перейти от передаточной функции к
модели переменных состояния, имеющих определенный
физический смысл, то поступают следующим образом.
Дробь (4.16) разбивают на сомножители, являющиеся со
ставными блоками структурной схемы системы управления,
при этом выходами блоков должны служить выбранные
физические величины. По виду выражений этих блоков и
с помощью структурной схемы составляется сигнальный
граф системы, на основании которого и записываются
дифференциальные уравнения пространства состояний.
Подробно с методами построения сигнальных графов для
сложных систем можно познакомиться в [4, п. 3.4].
Покажем теперь, как найти передаточную функцию,
если известны уравнения состояния для SISOсистемы.
Положим матрицу D равной нулю и запишем уравнения
ABCDмодели в виде
1 1 1 21 2 321
13
4 1 412 (4.23)

Матрицы и векторы в (4.23), например, для системы


3го порядка имеют следующую структуру:

43 5 43 3 3 5 43 5
1 8 3 1 2 8 3 3 3 1 3 8 63 7 1 4 8 13 3 322 (4.24)
6 7 6 7
6 7 6 7 6 7
963
7 693 3 3
7 963
7
Преобразуя уравнения (4.23) по Лапласу при нулевых
начальных условиях 1123 1 24 получим
12112 1 12112 2 23 1123 4 112 1 321124 (4.25)
Первое равенство в (4.25) запишем в виде
11 1 1 22 2112 2 33 1123 (4.26)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 49

где I — единичная матрица размера n ´ n. Умножим ра$


венство (4.26) слева на матрицу
F(s) = (sI – A)–1, (4.27)
которая, как известно, является преобразованием Лапла$
са от фундаментальной матрицы системы F(t) = exp(At).
В результате получим
1122 1 112223 1223 (4.28)
Подставив выражение (4.30) во второе равенство в (4.25),
найдем выражение для выхода:
Y(s) = CF(s)BU(s). (4.29)
Сравнивая это выражение с определением 4.1 переда$
точной функции G(s), находим ее вид:
G(s) = CF(s)B. (4.30)
Если учесть структуру матриц в (4.26), то легко уви$
деть, что свертка матриц в (4.30) действительно представ$
ляет собой скаляр.
Упражнение 4.2.
Найдите с помощью формул (4.27), (4.30) передаточ$
ную функцию для системы (3.12). Убедитесь, что G(s)
имеет вид, приведенный в (4.7).
Таким образом, мы убедились, что возможен переход
от модели пространства состояний к модели в форме пере$
даточных функций и обратно. Алгоритмы перехода за$
программированы в MATLAB в функциях ss( ) и tf( ). При$
менение этих функций описано в приложении 1.
Простейшие управляющие системы —
линейные системы.
Н. Винер

ЛЕКЦИЯ 5

ПРИМЕРЫ ПОСТРОЕНИЯ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
ЛИНЕЙНЫХ СТАЦИОНАРНЫХ
СИСТЕМ
5.1.
МОДЕЛЬ ДВИГАТЕЛЯ ПОСТОЯННОГО ТОКА
Рассмотрим различные формы представления математи
ческих моделей на примере системы управления поворо
том вала двигателя постоянного тока.
На рисунке 5.1 представлена модель электродвигателя,
более полная по сравнению с рассмотренной выше в п. 2.2
упрощенной моделью. Величины, относящиеся к элементам
и переменным цепи статора, имеют индекс f (field), элемен
ты и переменные в цепи якоря
имеют индекс a (armature).
Крутящие моменты будем обо
значать буквой T (torque).
Если отсутствует насыщение,
то магнитный поток в воздуш
ном зазоре пропорционален
току возмущения:
F(t) = Kfif. (5.1)
Пренебрегая нелинейны
ми эффектами, такими как
гистерезис и падение напря
жения на щетках, будем счи
тать, что момент, развивае
мый двигателем, линейно за
висит от F и тока якоря:
Рис. 5.1
Модель двигателя Tm = K1F(t)ia(t) =
постоянного тока = K1Kf if(t)ia(t). (5.2)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 51

В случае, когда управление происходит по двум вхо'


дам, модель двигателя оказывается нелинейной. Для того
чтобы двигатель можно было считать линейным элемен'
том, один из токов должен быть постоянным. Если задан
ток якоря (ia = const), мы имеем двигатель, управляемый
по цепи возбуждения. Если фиксирован ток в обмотке
статора (if = const) или магнитное поле в зазоре создается
постоянными магнитами, мы имеем двигатель, управляе'
мый по цепи якоря. Рассмотрим оба случая.

5.2.
ДВИГАТЕЛЬ, УПРАВЛЯЕМЫЙ
ПО ЦЕПИ ВОЗБУЖДЕНИЯ
Модель в пространстве состояний для этого случая у нас
описана ранее в п. 2.2. Поэтому рассмотрим модель в форме
передаточных функций. Входом является напряжение на
клеммах статора vf (t), в s'пространстве входом будет пре'
образование Лапласа этой величины — Vf (s). Преобразова'
ние Лапласа выходной переменной (j(t)) обозначим как Q(s).
Структурная схема двигателя, управляемого по цепи
возбуждения, приведена на рисунке 5.2. Задача состоит в
том, чтобы найти выражение для G(s).
Соотношения между переменными нужно записать в
алгебраической форме в s'пространстве и разрешить их,
чтобы связать между собой вход и выход. Составляем це'
почку уравнений. Преобразуя (5.2) по Лапласу, получим
Tm(s) = (K1KfIa)If(s) º KmIf(s), (5.3)
где Ia — постоянный ток якоря, а Km носит название по'
стоянной электродвигателя. Входная переменная связа'
на с током в статоре уравнением (преобразование Лапласа
уравнения Кирхгофа (2.2)):
Vf(s) = (Rf + Lf s)If(s). (5.4)
Далее, развиваемый двига'
телем момент Tm создает полез'
ный момент на нагрузке (load) и
компенсирует возмущающий мо' Рис. 5.2
Структурная схема
мент (disturbance): электродвигателя
52 А. Ю. ОЩЕПКОВ

Tm(s) = TL(s) + Td(s). (5.5)


Возмущающим моментом во многих случаях можно
пренебречь, однако если двигатель управляет, например,
антенной локатора, то нельзя не учитывать влияние по&
рывов ветра на антенну, которые и создают внешнее воз&
мущение. Угол поворота определяется моментом TL в соо&
тветствии с уравнением вращательного движения при на&
личии трения. Преобразование Лапласа этого уравнения
имеет вид
TL(s) = Js2Q(s) + bsQ(s). (5.6)

Записаны все необходимые соотношения. Примем


Td = 0, тогда в левую часть соотношения (5.3) можно под&
ставить правую часть (5.6), а ток If выразить из (5.4). В ре&
зультате получается равенство
31 142
4154 1 622142 3 72 3
81 4 1 91
из которого находится искомое выражение для передаточ&
ной функции:

1142 31
5 142 2 2 3 (5.7)
62 142 4174 3 82192 4 3
2 2

Структурную схему системы с передаточной функци&


ей (5.7) можно разбить на ряд блоков со своими переда&
точными функциями, так что выход одного блока являет&
ся входом другого, а полная передаточная функция — их
произведением. Такой вид структурной схемы приведен
на рисунке 5.3.

Рис. 5.3
Структурная схема двигателя,
управляемого по цепи возбуждения
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 53

Как видим, структурная схема очень удобна для анали(


за. Явно видны электрическая часть устройства и механи(
ческая часть, указано даже влияние возмущения, отсут(
ствующее в формуле (5.7). Эту схему легко запрограмми(
ровать в пакете Simulink, чтобы численными методами
исследовать поведение системы при различных значениях
ее параметров и при различных внешних воздействиях.
В рассматриваемой модели двигателя мы можем вы(
делить два времени выхода на режим:
21
11 2 и 11 2 2 (5.8)
31 3
— характерное время электрической цепи статора и ха(
рактерное время механической вращающейся части со(
ответственно. Используя обозначения (5.8), мы можем
записать передаточную функцию (5.7) в стандартном
виде:
1 4
5 2 63 1 2 14
623 3 6 4 13232 6 4 13 783

Таким образом, для двигателя мы получили линейную


модель 3(го порядка, которая состоит из двух блоков пер(
вого порядка с передаточными функциями вида

21 233 1 1 (5.9)
2 23 3 13
и блока интегрирования (интегратора) с передаточной
функцией 1/s.

5.3.
ДВИГАТЕЛЬ, УПРАВЛЯЕМЫЙ
ПО ЦЕПИ ЯКОРЯ
Построим математическую модель двигателя, управ(
ляемого по цепи якоря. Начнем с модели в пространстве
состояний. Входным воздействием теперь является напря(
жение на якоре u2(t) = va(t) (см. рис. 5.1). Если ток в об(
мотке статора if зафиксирован (или используется постоян(
ный магнит), то момент tm(t), развиваемый двигателем,
определится как
54 А. Ю. ОЩЕПКОВ

tm(t) = (K1Kf if) = Kmia(t). (5.10)

Уравнение Кирхгофа для цепи якоря запишется в


виде
34 152
61 152 1 71 1 2 81 41 152 2 62 1523 (5.11)
35

где vb(t) — противоЭДС (electromotive force), возникающая


на щетках, пропорциональная скорости вращения:
vb(t) = Kbw(t). (5.12)
Уравнения вращательного движения с учетом коэф/
фициента трения (viscosity) Kv запишем в виде

41152
6 2 7182 152 3 73 11523
45
41 152 2 11524 (5.13)

Интересно отметить, что в установившемся режиме ра/


боты двигателя мощность, подводимая к якорю vbia = Kbwia,
равна мощности, сообщаемой валу tmw = Kmwia, откуда сле/
дует, что Km = Kb.
Уравнения (5.11)–(5.13) дают систему уравнений для
величин ia, w, j, которые, очевидно, и являются перемен/
ными состояния:

671 8 5
1 2 1 71 2 2 3 4 1 41 2934
69
1
1
1
63 1 53 7 2 54 34
69 1
65
1 35 (5.14)
69

Выходной переменной является угол поворота вала,


поэтому уравнение выхода имеет вид
y = j. (5.15)
Уравнения (5.14), (5.15) можно записать в виде ABCD/
модели:
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 55

3 5 61 52
6 7 5 1 47 32 4
71
381 4 6 1 7 381 4 6 71 7
9 6 8 7 9 6 53 5
5 4 1 7
6 8 7 6 1 7
41 3
45
9
6 7 6 7 6 7 6 7
6 7 6 1 2 1 7 6 7 6 1 7

321 4
3 7 11 1 22 8 5 9 6
112 8 41 3545 (5.16)
5 6
5 6
Отметим, что рассмотренная нами модель использует&
ся в пакете MATLAB в качестве демонстрационного при&
мера, описывающего работу MATLAB по моделированию
систем управления в пространстве состояний.
Подвергнув уравнения (5.14), (5.15) преобразованию
Лапласа, легко получить передаточную функцию, кото&
рая в данном случае имеет вид

3162 51
7 162 4 4 3 (5.17)
82 162 6 1196 5 53 21
2 6 5 2 2 5 54 51 2

Такой же результат можно получить путем примене&


ния формул перехода (4.29), (4.32).
Упражнение 5.1.
Найдите с помощью формул (4.27), (4.30) передаточную
функцию для системы (5.16). Убедитесь, что G(s) име&
ет вид, приведенный в (5.17).
Структурная схема двигателя, управляемого по цепи
якоря, приведена на рисунке 5.4. Из схемы видно, что в
этом случае в двигателе возникает естественная обратная

Рис. 5.4
Структурная схема двигателя, управляемого по цепи якоря
56 А. Ю. ОЩЕПКОВ

связь, которой не было в случае управления по цепи воз


буждения. Кроме того, в структурной схеме учтено внеш
нее воздействие Td, отсутствующее в выражении для пе
редаточной функции.
Упражнение 5.2.
Задайте следующие параметры двигателя: R = 2 Ом,
L = 0,5 Гн, J = 0,02 Н×м, Km = Kb = 0,015 Н×м/А, Kv =
= 0,2 Н×м/с. Исследуйте работу двигателя в MATLAB:
составьте ABCDмодель и найдите передаточную функ
цию двигателя; промоделируйте структурную схему
рисунка 5.4 в Simulink и исследуйте переходную ха
рактеристику системы.
Где начало того конца,
которым оканчивается начало?
К. Прутков

ЛЕКЦИЯ 6

СИСТЕМЫ УПРАВЛЕНИЯ
С ОБРАТНОЙ СВЯЗЬЮ

6.1.
СВОЙСТВА ОБРАТНОЙ СВЯЗИ

На рисунке 6.1 приведена структурная схема замкнутой


системы управления, изображенной на рисунке 1.2.
Для анализа свойств систем с обратной связью и ис#
следования их особенностей по сравнению с разомкнуты#
ми системами пока не будем заострять внимание на алго#
ритмах работы регулятора и положим GC = GW = 1. ПФ
объекта обозначим просто G(s), а ПФ измерительного уст#
ройства — H(s) — это теперь передаточная функция цепи
обратной связи.
Структурная схема системы управления с обратной
связью приведена на рисунке 6.2, на рисунке 6.3 — схема
разомкнутой системы, т. е. объекта, на вход которого по#
дается воздействие R. Заметим, что передаточная функ#
ция G преобразует входной сигнал в выходной сигнал, а
передаточная функция Н совершает обратное преобразова#
ние: превращает измеренный сигнал выхода в величину,
имеющую размерность входного сигнала, поэтому можно
сделать вывод, что произведение этих функций
G(s) × H(s) º GH(s) (6.1)
есть величина безразмерная.
Найдем передаточную функцию системы с обратной
связью T(s). Из рисунка 6.2 следует, что величина ошибки
E(s) равна разности между входным сигналом R(s) и изме#
ренным преобразованным выходным сигналом H(s)Y(s):
E(s) = R(s) – H(s)Y(s). (6.2)
58 А. Ю. ОЩЕПКОВ

Рис. 6.1
Структурная схема замкнутой системы управления:
GO(s) — передаточная функция объекта; GM(s) — передаточная функ
ция измерительного устройства; GC(s) — передаточная функция устрой
ства управления (регулятора); GW(s) — передаточная функция исполни
тельного устройства.

Рис. 6.2 Рис. 6.3


Система управления Разомкнутая система
с обратной связью управления

Выход Y(s) определяется произведением G(s)E(s), по


этому
Y(s) = G(s)[R(s) – H(s)Y(s)];
G(s)R(s) = Y(s)[1 + GH(s)].
Искомое выражение для передаточной функции си
стемы T(s) = Y(s)/R(s) имеет вид
1 122
3 122 1 3 (6.3)
4 2 14 122
Из (6.3) видно, что разомкнутой системе соответствует
H(s) = 0. При H(s) = 1 (выход объекта подается на его вход
с противоположным знаком) замкнутую систему называ
ют системой с единичной отрицательной обратной связью.
Если передаточная функция объекта имеет стандарт
ный вид (4.8):
2334
4 3 34 2 1 5
3 3 51 1131 11 3 666 3 52
то замыкание объекта цепью обратной связи с ПФ H(s)
даст систему с передаточной функцией
2334
4 3 34 2 5 (6.4)
31 3 51 1131 11 3 555 3 52 3 23346 334
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 59

Мы видим, что полином в знаменателе функции T(s)


отличается от полинома в знаменателе G(s), а это означа-
ет, что динамика системы с обратной связью отличается
от динамики свободного объекта (разомкнутой системы).
Изменяя вид ПФ H(s), можно менять переходную харак-
теристику системы.
Сравним поведение разомкнутой и замкнутой систем.
Предположим, что мы каким-то образом определили па-
раметры объекта и рассчитали воздействие так, чтобы
обеспечить требуемый выходной сигнал. После подачи
рассчитанного воздействия на вход объекта его выход бу-
дет оставаться на нужном уровне, пока не изменятся па-
раметры объекта. Для наглядности можно привести при-
мер моторной лодки, которой нужно двигаться поперек
течения реки. Если моторист, определив опытным путем
положение руля и тягу двигателя для требуемого курса,
решит отдохнуть, зафиксировав руль и газ, мы получим
разомкнутую систему. Лодка будет двигаться по заданно-
му курсу, пока не достигнет участка реки с другой скоро-
стью течения, после чего курс лодки изменится.
Таким образом, разомкнутая система чувствительна
к изменению параметров. Чувствительность замкнутой
системы к изменению параметров объекта меньше, чем в
разомкнутой системе. Покажем это. Если произведение G
и Н велико для всех значений комплексной величины
s (комплексной частоты), то из (6.3) следует

1 223 1 1 3 2234 45 223 1 14


5 223 (6.5)

т. е. в этом случае выход системы вообще не зависит от


вида передаточной функции объекта, а следовательно, и
от ее изменения. Нужно, однако, иметь в виду, что боль-
шой коэффициент усиления в цепи обратной связи, как
это будет видно в дальнейшем, может привести к неустой-
чивой работе системы управления.
Дадим количественную оценку эффекту снижения чув-
ствительности системы к изменению параметров (эффек-
ту загрубления). Определим чувствительность системы
как отношение процентного изменения передаточной
60 А. Ю. ОЩЕПКОВ

функции системы к процентному изменению передаточ


ной функции объекта:
11 12231 122
32 4 (6.6)
14 12234 122
В пределе малых изменений формула (6.6) приобрета
ет вид
11 11 11 2
321 2 2 3 2 (6.7)
12 1 2 12 1

Определение 6.1. Чувствительность системы — это от


ношение изменения ее передаточной функции к изменени
ям передаточной функции объекта управления при усло
вии их малости.

Для разомкнутой системы чувствительность, по опре


делению, равна 1. Для замкнутой системы из формул (6.3),
(6.7) получаем

321 2 11 3 2 2 2 3 2 2 2 3
12 1 52 4 24 61 2 452 4 24 6 2 4 2 556 4 556 (6.8)
Чувствительность замкнутой системы действительно
меньше единицы и стремится к нулю с ростом произведе
ния GH.
Идея обратной связи широко применяется в настоя
щее время для стабилизации работы усилителей. Впервые
мысль об ее использовании пришла в голову сотруднику
фирмы «Белл лабораториз» корпорации AT&T Гарольду
С. Блэку более 80 лет назад. В то время главной задачей,
над которой работала фирма, было улучшение качества
телефонной связи и используемых при этом усилителей
сигналов. Блэку было поручено заняться линеаризацией
и стабилизацией усилителей, устанавливаемых в тракте
голосовых сообщений на расстояния в тысячи миль. По
слушаем удивительные и поучительные воспоминания
самого Г. С. Блэка [4, п. 1.3]:
«Было утро вторника 2 августа 1927 г., когда во время
переправы на пароме через Гудзон по дороге на работу
мне внезапно в голову пришла мысль об использовании в
усилителе отрицательной обратной связи. Более 50 лет я
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 61

размышлял, как и почему возникла эта идея, но даже и


теперь я не могу сказать, как все произошло. Я знаю толь0
ко то, что после нескольких лет работы над проблемой я
неожиданно понял, что если подать сигнал с выхода уси0
лителя на его вход, причем в обратной фазе, и воспрепят0
ствовать самовозбуждению усилителя (свисту, как мы поз0
же назвали этот эффект), то я получу именно то, что хо0
тел — способ устранения искажения выходного сигнала.
Я раскрыл утреннюю газету „НьюЙорк таймс“ и на по0
лях набросал соответствующую схему, дополнив ее фор0
мулой для коэффициента усиления с учетом обратной свя0
зи. Я подписался под этой схемой, а 20 минут спустя, ког0
да я прибыл в лабораторию на Уэст0стрит, 463, ее также
заверил своей подписью ныне покойный Эрл К. Блессинг».
Итак, основное преимущество систем с обратной свя0
зью состоит в их способности снижать чувствительность к
изменению параметров или внешних воздействий. Но у
обратной связи есть и издержки:
· очевидное уменьшение коэффициента усиления (сле0
дует из формулы (6.3));
· возможная потеря устойчивости (методы анализа
устойчивости рассмотрим в дальнейших лекциях);
· увеличение числа элементов и сложности системы.
Для устранения отмеченных недостатков в современ0
ных системах используют стандартные робастные ПИД0
регуляторы. Мы рассмотрим алгоритмы их работы и мето0
ды настройки, но прежде необходимо познакомиться с тем,
как определяется качество работы систем управления.

6.2.
ПОКАЗАТЕЛИ КАЧЕСТВА
Показатели качества регулирования определяются
обычно по переходной характеристике системы (см. Оп0
ределение 4.3). Типичный ее вид при единичном ступен0
чатом воздействии приведен на рисунке 6.4. На графике
нанесены наименования основных параметров кривой, ко0
торые характеризуют работу системы управления. По сво0
ему смыслу эти параметры (показатели качества) делятся
на динамические и точностные [8].
62 А. Ю. ОЩЕПКОВ

Определение 6.2. Динамические показатели качества


описывают работу системы управления до выхода в уста
новившийся режим; точностные показатели качества
описывают работу системы в установившемся режиме.

Перечень характеристик приведен в таблице 6.1.


Упражнение 6.1.
Дайте определения основным параметрам переходной
характеристики, указанным в таблице 6.1.

Рис. 6.4
Реакция системы управления на ступенчатое воздействие

1 2 3 4 5 6 2 7 89
7
1234567826359
7 2 2 59 7 62
56359 39
7 2 2 59
 759 263 759
12345678289
87 56 6 6 6 6  784 39 6
123456489 4486 6 6 7  784 39 6
32323 2 !8" %&'())6  6  784 39 6
7 36#8$2 96235
286
* 2 + 26# 786 ,)-6 123 . 7 9
7 6

1234569
87 !37 56 /0 -16 7  784 39 6
 6

29
87 ! !385956 3 $86 / )-'46  6 . 7 9
7 6
'')'6
1
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 63

Если система выходит на режим без колебаний (пере*


демпфированная система), то перерегулирование отсут*
ствует, время максимума TP смысла не имеет, а в качестве
времени нарастания Tr1 рассматривается интервал, в те*
чение которого переходная характеристика изменяется от
10 до 90% ее значения.
Цель управления обычно состоит в том, чтобы устано*
вившаяся ошибка ess лежала внутри коридора (зоны) d,
назначаемой конструктором после согласования с буду*
щим потребителем проектируемой системы управления.
Очень часто накладываются требования быстродействия
(уменьшение времени установления TS) и уменьшения ве*
личины перерегулирования (заброса регулятора). Интуи*
тивно ясно, что два этих требования взаимно противоре*
чивы, поэтому конструктору приходится прибегать к ком*
промиссу. Если, например, большой заброс регулятора
может вызвать катастрофические последствия для объек*
та управления, в первую очередь уменьшают заброс, а если
время выхода определяется технологией управляемого
процесса, то необходимо обеспечить требуемую длитель*
ность этого времени и т. д. Перерегулирование обычно
определяют как отношение разности заброса регулятора
и установившегося значения к установившемуся значе*
нию (в процентах) — в этом случае говорят об относитель

ном перерегулировании:
21 2 31
31 4 512234 (6.9)
31
В качестве примера найдем показатели качества для
системы второго порядка. Передаточная функция T(s) в
этом случае может быть представлена в удобном для ана*
лиза виде:
2111
3 2 43 2 1 4 (6.10)
4 3 1411 4 3 111
где K — масштабный коэффициент (при анализе переход*
ной характеристики он может быть положен равным еди*
нице); wn имеет размерность частоты (как и переменная s);
а z — безразмерный параметр (декремент). Обозначе*
ния (6.10) удобны тем, что полюса ПФ имеют вид
64 А. Ю. ОЩЕПКОВ

2231 1 2341 5 41 31 2 23 (6.11)

поэтому величина безразмерного декремента z непосред


ственно позволяет судить о характере поведения системы:
· выход в установившийся режим без колебаний —
при z > 1;
· критический режим (z = 1);
· закритический режим (затухающие колебания) —
при z < 1.
Поскольку выход системы Y связан со входом R соот
ношением Y(s) = T(s)R(s), то для единичного ступенчатого
воздействия, описываемого выражением (4.13): R(s) = 1/s,
мы получим
111
2 233 2 4 (6.12)
323 3 1411 3 3 111 3
1

Подвергнув (6.12) обратному преобразованию Лапласа,


находим явный вид переходной функции y(t) при 0< z < 1
(в колебательном режиме):

3324 4 2 1 2 4 12312 56733 2 1 21 2 5 89

5 24 (6.13)
1
2 1 21
Эту функцию легко проанализировать аналитически и
найти показатели качества работы системы. Формулы, по
которым можно рассчитать основные показатели каче
ства для системы второго порядка, приведены в таблице 6.2.
Упражнение 6.2.
Получите расчетные формулы, приведенные в табли
це 6.2.
1 2 3 4 5 6 2 7 89
7
1234546789
25 47 7
476 4
284

1234564789
4 476 1
7 6
2 3 4

123456
973
56566 6 6 6  6
42

9
336  3 7
32323 
27
36 5 8 9  6  9  341  341
6
7

1
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 65

Поскольку для систем более высокого порядка анали)


тический рачет показателей качества весьма громоздок,
то в этом случае помощь оказывает компьютерное моде)
лирование систем управления в пакете MATLAB.

6.3.
ОЦЕНКИ КАЧЕСТВА
Современная теория управления предполагает, что
разработчик способен количественно определить требуе)
мое качество системы в виде интегральной (по времени) оцен)
ки. Эта численная оценка должна учитывать те стороны про)
цесса управления, которые наиболее важны. Речь идет, по
сути, об оптимизации регулятора численными методами.
Дадим следующее простое определение оценки качества [4].
Определение 6.3. Оценка качества — это численный
показатель качества системы, который выбирается так,
чтобы подчеркнуть наиболее важное требование, предъяв)
ляемое к системе.
Если параметры системы выбираются из требования
минимальности оценки качества, то система управления
будет оптимальной по отношению к тем требованиям, ко)
торые учитывает оценка.
В общем случае интеграл, оценивающий качество си)
стемы, имеет вид
1
2 1 2 32435456 3545 7354556855 (6.14)
1
где y — выходной сигнал; e — ошибка; r — воздействие
(затраты на управление). Вид функции f и время интегри)
рования T определяются требованиями, предъявляемы)
ми к системе.
Наиболее употребительные оценки качества, миними)
зирующие ошибку, приведены в таблице 6.3.
Наилучшей считается оценка ИВМО [4].
Для передаточной функции вида
221
31 344 3 (6.15)
41 4 51 1141 11 4 555 4 514 4 52
66 А. Ю. ОЩЕПКОВ

1 2 3 4 5 6 2 7 89
7
1234256789
75 68 746228 5728


123456789
39 7 67379
 9 19 1    9



123456789
39
89
 9 19 1    9


1    9
123456789
39  4422
5
9
89 19

 9


1    9
123456789
39  4422
5
9 7 67379 19

 9


1 1 2 3 4 5 6 2 7 89
7
123456789
96 94 44 93 12 9699

96 43 44 1 24 32 9635  95 4!967

#  "44 93
#$
3 41 42 43 44 45 46

12 32 32 32 32 12 1 2
42 32 32 32 12 1561 2 14 2
72 32 32 12 15891 2 451914 2 17 2
62 32 12 4511 2 75614 2 45817 2 16 2
92 12 45
1 2 95 14 2 95917 2 75616 2 19 2
1
были определены значения коэффициентов bk, k = 0, 1, ...,
q – 1, которые минимизируют оценку ИВМО. Эти коэф%
фициенты приведены в таблице 6.4 для q = 1, ..., 5.
Таким образом, оптимальная (по критерию ИВМО)
передаточная функция, например, для системы 3%го по%
рядка имеет вид
111
212345 738 2 9 (6.16)
31 3
11 36 3 6
161 3 3 111
Отметим, что в любом случае система порядка q, опти%
мизированная по критерию ИВМО, обладает нулевой уста%
новившейся ошибкой, а ее передаточная функция имеет
q полюсов и не содержит нулей.
Во всем мне хочется дойти
до самой сути.
Б. Л. Пастернак

ЛЕКЦИЯ 7

СТАНДАРТНЫЕ РЕГУЛЯТОРЫ
С ОБРАТНОЙ СВЯЗЬЮ
7.1.
МАТЕМАТИЧЕСКИЕ МОДЕЛИ
ПИДРЕГУЛЯТОРОВ
Рассмотрим системы управления с единичной отрицатель
ной обратной связью, содержащие управляющие устрой
ства (блоки регулирования). Многолетняя практика ав
томатизации показала, что подавляющее большинство
задач синтеза одноканального управления может быть ре
шено с помощью регуляторов по отклонению, учитываю
щих текущее значение ошибки (отклонения выходной ве
личины от заданного значения), первую производную
ошибки и интеграл от ошибки за время регулирования*.
В настоящее время пропорциональноинтегральнодиффе
ренциальный закон и его частные случаи считаются стан
дартными линейными законами регулирования, наиболее
часто используемыми в промышленных регуляторах.
Регулятор, в котором реализован пропорционально
интегральнодифференциальный закон (ПИДрегулятор),
представляет собой пример универсального робастного ре
гулятора, используемого в системах управления с обрат
ной связью. Схема аналогового устройства, в котором реа
лизован ПИДалгоритм, приведена выше на рисунке 1.5,
пример математической модели с таким устройством уп
равления приведен на рисунке 2.3. Регулятор имеет три
настроечных параметра: K, TИ, TД. Проанализируем ра
боту систем управления, содержащих ПИДрегуляторы,
с точки зрения общей теории систем с обратной связью.

* Власенко, В. А. Динамическая настройка стандартных регуляторов /


В. А. Власенко, О. К. Мансурова. — СПб. : СПбГИТМО (ТУ), 2002. — 52 с.
68 А. Ю. ОЩЕПКОВ

Для анализа удобно ввести следующие три параметра:


4 1 1 43 42 1 4 3 43 1 4 2 5 1 (7.1)
52
— пропорциональный, интегральный и дифференциаль%
ный коэффициенты соответственно. Отметим, что эти ко%
эффициенты — положительные числа определенной раз%
мерности.
Управляющее воздействие u(t), которое вырабатывает
ПИД%регулятор на рисунке 1.5, описывается выражением
1
56213
7213 1 82 6213 2 83 4 623353 2 84 4 (7.2)
1
51
где e(t) = yуст – y(t) — сигнал ошибки, поступающий на
вход регулятора (масштабный множитель включен в про%
порциональный коэффициент).
Структурная схема системы управления с ПИД%регу%
лятором приведена на рисунке 7.1.
На рисунке 7.1 GOB(s) — передаточная функция объек%
та управления, GPID(s) — ПФ регулятора, которая в соот%
ветствии с (7.2) имеет вид
41 4 5 1 1 4 3 5 1 41
6 312 253 2 43 1 1 42 5 2 2 4 (7.3)
5 5
GP(s) — ПФ фильтра, установленного на входе системы
по задающему воздействию (предшествующий фильтр
[4, п. 12.6]). Наличие такого определенным образом по%
добранного фильтра позволяет улучшить качество рабо%
ты регулятора.

Рис. 7.1
Структурная схема системы управления
с ПИД%регулятором и предшествующим фильтром
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 69

7.2.
ОСОБЕННОСТИ РАБОТЫ
СТАНДАРТНЫХ РЕГУЛЯТОРОВ
Начнем исследование работы регуляторов с простей)
шего случая, когда
KI = KD = 0 , u(t) = KPe(t), GPID(s) = KP, (7.4)
а предшествующий фильтр отсутствует. Регулятор в этом
случае носит название пропорционального, или Прегу
лятора.
Передаточная функция системы управления с П)регу)
лятором согласно рисунку 7.1 и формулам (7.4) имеет вид
41 523 162
7 1 62 1 3 (7.5)
4 2 41 523 162
Отклик системы на единичное ступенчатое воздействие
R(s) = 1(s) = 1/s (см. формулу (4.13)) определится как
3412 152 3
6 152 1 7 1528 152 1 2 4 (7.6)
3 3 3412 152 5
Значение выходной величины в установившемся ре)
жиме y¥ в соответствии с формулой (4.15) равно
61 723 213
81 3 456 8243 4 456 59 253 4 7 (7.7)
421 5 21 8 5 61 723 213
При единичном значении входной переменной yуст = 1
мы имеем установившуюся ошибку (см. рис. 6.4)
51 623 456 7
744 2 8123 3 81 2 7 3 2 8 (7.8)
7 4 51 623 456 7 4 51 623 456
не равную нулю, кроме случая KP ® ¥.
Определение 7.1. Регуляторы с ненулевой установив)
шейся ошибкой называют статическими, регуляторы, у
которых установившаяся ошибка равна нулю, называют
астатическими.
П)регулятор при конечных значениях пропорциональ)
ного коэффициента является статическим; цели регули)
рования (2.7) он не достигает.
70 А. Ю. ОЩЕПКОВ

Чтобы понять смысл работы Прегулятора, рассмот


рим для примера задачу стабилизации температуры
объекта, который можно считать точечным, т. е. не учи
тывать процессы теплопроводности внутри него (тело,
имеющее малые размеры или высокую теплопроводность).
Единственная переменная состояния — средняя темпера
тура Q, измеряемая одним датчиком. Управляющее воз
действие — мощность q(t), выводимая на нагреватель;
температура среды снаружи объекта QН; теплообмен про
исходит по закону Фурье; коэффициент теплообмена k;
теплоемкость тела CO; начальная температура QO. Задача
заключается в том, чтобы достичь заданной температуры
QУСТ и удерживать ее в течение всего времени работы ре
гулятора (задача терминального управления [8]).
Уравнение, описывающее поведение температуры
объекта, имеет вид
1 2 3351 3 1 6 4 4 5567 1586 2 1 5 1 9
2 1 (7.9)
1 1 1 234

Если ввести обезразмеренную величину x — отклоне


ние температуры от заданного значения, измеренное в еди
ницах уставки:
1 2 1123
13 4 (7.10)
1123
то уравнение (7.10) можно записать в виде

31 1 4 3 2 4 3 42 1 4 3 55667 3586 2 31 4 87 3123 2 87 (7.11)


51 51 51
где введены обозначения
41 1 2 1234 5 566
32 4 7 73 4 1 7 8566 4 8 (7.12)
9 1 234 91 234
Выходной переменной в рассматриваемой математи
ческой модели является переменная состояния x, т. е.
уравнение выхода имеет простой вид:
y = x; (7.13)
цель регулирования можно представить аналогично (2.7):
y ® 0, 0 £ t £ ¥. (7.14)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 71

Прежде чем исследовать работу П%регулятора, проана%


лизируем полученную математическую модель (7.11)–(7.14).
Уравнение (7.11) при отсутствии управляющего воздей%
ствия имеет решение:
1 2
4 3 141 1 53 2 4 6 21 5 53 3 (7.15)

Из (7.15) следует, что требуемое состояние системы


x = 0 не является равновесным при u(t) = 0 из%за наличия
в правой части уравнения (7.11) величины Fd. Указан%
ную величину можно интерпретировать как постоянное
внешнее воздействие (внешнее возмущение). Физиче%
ский смысл этой ситуации состоит в том, что тело, имею%
щее начальную температуру QУСТ, которая выше темпе%
ратуры QH, отдает тепло окружающей среде, и его тем%
пература релаксирует к температуре окружения QH с
характерным временем to. И наоборот, если температура
тела в начальный момент времени удовлетворяет условию
равновесия x(0) = Fd < 0, а в этот момент включается по%
стоянное управляющее воздействие (на нагреватель выво%
дится постоянная мощность):
u(t) = –Fd, (7.16)
то система переходит в требуемое состояние x = 0 с тем же
характерным временем to.
Таким образом, управляющее воздействие вида (7.16)
компенсирует внешнее воздействие и обеспечивает до%
стижение цели регулирования в течение характерного%
(собственного) времени релаксации системы. Если бы ве%
личина Fd была известна, можно было бы синтезировать
разомкнутую систему управления, изображенную на ри%
сунке 7.2. Однако разомкнутая система, как было отмече%
но в п. 6.1, очень чувствительна к изменению величины
внешнего воздействия.
Кроме того, внешнее воздействие не измеряется и в
замкнутой системе управления. Управляющее устройство
получает от измерительного устройства информацию не о
внешнем воздействии, а о выходном сигнале (точнее, уст%
ройство получает информацию о сигнале ошибки), и по
72 А. Ю. ОЩЕПКОВ

Рис. 7.2
Разомкнутая схема управления
для компенсации внешнего воздействия

Рис. 7.3
Схема управления для компенсации
внешнего воздействия с П"регулятором

этой информации алгоритм управляющего устройства дол"


жен автоматически перейти в режим (7.16). Другими сло"
вами, алгоритм регулирования, с помощью которого до"
стигается цель управления, должен вырабатывать воз"
действие, удовлетворяющее обязательному условию (для
линейных регуляторов):
u(t) ® –Fd, t ® ¥. (7.17)
Переход регулятора в режим (7.17) должен происхо"
дить автоматически, в этом и состоит смысл работы регу"
ляторов.
Вернемся к П"алгоритму для рассматриваемого при"
мера. В данном случае e(t) = 0 – x(t) = –x(t), поэтому
u(t) = –KPx(t). (7.18)
Можно построить структурную схему рассматривае"
мой системы во временно´й области (анализ схемы, содер"
жащей передаточные функции в комплексном простран"
стве, затруднен из"за наличия внешнего возмущения). Вид
схемы изображен на рисунке 7.3. Эту схему можно реали"
зовать в Simulink и провести исследование работы систе"
мы с помощью компьютерного моделирования.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 73

В нашем случае исследование легко провести анали'


тически. Подставив (7.13), (7.18) в (7.11), получим урав'
нение для выходной величины:
51 1 1 21 1 61 3 5 2 1 72 4 5253 2 53 3 56 (7.19)
44 44
Решение этого уравнения имеет вид, аналогичный (7.15):

1 2
31
4 5 42 3 4 53 6 4 6 4 53 1
42 42
(7.20)

однако переходный процесс теперь происходит в течение


времени
11
12 1 (7.21)
2 3 32
которое меньше собственного времени объекта.
Таким образом, пропорциональный регулятор, во'пер'
вых, ускоряет протекание переходных процессов, во'вто'
рых, установившееся значение выходной величины

41 3 2 51 3 1 4 51 (7.22)
22 1 5 63
приближается к нулю, т. е. к требуемому значению, с ро'
стом коэффициента KP. Отметим, что формулы (7.22) и (7.8)
совпадают при единичном воздействии, поскольку для
объекта первого порядка G(0) = 1.
Для устранения статической ошибки в цепь регулято'
ра вводится интегрирующее звено, которое накапливает
ошибку и изменяет управляющее воздействие, приближая
его к требуемому значению (7.17). Пропорционально'ин'
тегральный регулятор (ПИрегулятор) имеет передаточ'
ную функцию
3
421 152 1 32 2 1 3 (7.23)
5
поэтому ПФ системы с обратной связью в этом случае при'
нимает вид
561 734 152 1 62 734 152
8 152 2 3 (7.24)
514 1 61 734 1522 1 62 734 152
Отметим, что введение интегрирующего звена повыша'
ет порядок системы на единицу.
74 А. Ю. ОЩЕПКОВ

Для величины выхода в


установившемся режиме по
лучаем

345 6617 3 345 27 627 4 2 3


1 12 2 11 2
83 945 617
3 3 28 (7.25)
83 945 617
следовательно, установившая
ся ошибка равна нулю.
Рис. 7.4 На рисунке 7.4 приведены
Переходные процессы графики переходных процес
в разомкнутой системе
с компенсацией внешнего сов в системе (7.11) при ра
воздействия и в замкнутой зомкнутой схеме регулирова
системе с Прегулятром
и ПИрегулятором ния, при работе Прегулято
ра и ПИрегулятора.
Упражнение 7.1.
Проанализируйте аналитически и с помощью компью
терного моделирования в MATLAB работу ПИрегуля
тора для системы (7.11) и покажите, что управляю
щее воздействие удовлетворяет условию (7.17).
Добавление дифференцирующего звена в регулятор не
изменяет собственных времен, порядка системы и устано
вившейся ошибки по сравнению с ПИрегулятором. Смысл
работы этого звена состоит в уменьшении управляющего
воздействия при слишком быстром изменении выхода,
т. е. дифференцирующее звено делает процесс регулиро
вания более плавным, вместе с тем расширяются возмож
ности настройки регулятора.

7.3.
МЕТОДЫ НАСТРОЙКИ
ПИДРЕГУЛЯТОРОВ
Существуют аналитические и экспериментальные ме
тоды настройки ПИДрегуляторов. В настоящее время
экспериментальный метод чаще всего разделяется на два
этапа: экспериментально определяются параметры объекта
управления, т. е. его передаточная функция, а настройка
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 75

коэффициентов регулятора проводится с помощью ком,


пьютерного моделирования. Здесь мы рассмотрим анали,
тический метод, использующий критерий ИВМО. Экспе,
риментальный метод Зиглера — Никольса рассмотрен в
приложении 2 с привлечением для моделирования регу,
ляторов с целью повышения точности настройки коэффи,
циентов блока NCD Outport пакета Simulink. Разумеется,
способы настройки не ограничиваются этими двумя мето,
дами, количество методов настройки непрерывно увели,
чивается. Однако указанные два метода являются наибо,
лее характерными, поэтому, рассмотрев их, легко понять
суть остальных.
Аналитический способ настройки ПИД,регулятора
предполагает подбор трех коэффициентов, минимизирую,
щих оценку ИВМО, при которой система обладает хоро,
шей, в смысле показателей качества, реакцией на ступен,
чатый сигнал. Передаточная функция объекта управле,
ния считается известной. Процедура синтеза для объекта
второго порядка включает в себя следующие этапы:
1) по заданному времени установления определить па,
раметр wn замкнутой системы;
2) используя найденное значение wn и соответствую,
щее выражение для характеристического полинома из
таблицы 6.4, определить три коэффициента передаточной
функции T1(s);
3) определить предшествующий фильтр GP(s) так, что,
бы передаточная функция T(s) не имела нулей, как этого
требует выражение (6.16).
Применение способа рассмотрим на конкретном при,
мере [4; пример 12.8].
Пример. Синтезировать регулятор температуры объек,
1
та, имеющего передаточную функцию GOB (s) 1 ,
(s 2 1)2
так, чтобы время установления (по критерию 2%) было
менее 0,5 с, а система была оптимальной по критерию
ИВМО.
Если замкнуть объект регулирования единичной обрат,
ной связью (положить GPID = GP = 1) и подать ступенчатый
входной сигнал, то по виду переходной характеристики
76 А. Ю. ОЩЕПКОВ

можно определить, что установившаяся ошибка состав


ляет примерно 50%, а время установления — более 3 с.
Подставив заданное выражение для ПФ объекта и для
ПФ ПИДрегулятора (7.3) в формулу для T1 (см. рис. 7.1),
получаем
41 5 1 1 4 2 5 1 4 3
62 455 2 6 (7.26)
53 1 41 1 41 551 1 42 1 42 55 1 43
По таблице 6.4 определяем, что знаменатель (7.26) для
минимальной оценки ИВМО должен иметь вид
21 1 345621 22 1 2436221 2 1 211 7 (7.27)
Отсюда получаем три условия для определения трех
коэффициентов. Осталось определить параметр wn, т. е.
выполнить первый этап процедуры.
Значение wn может быть определено неоднозначно,
поскольку требование к времени выхода наложено в виде
неравенства. Будем считать, что время выхода для систе
мы 3го порядка приближенно описывается выражением
для 31 1 1 2 полученным для систем 2го порядка. Из это
232
го выражения следует, что для z 1го порядка время выхо
да будет менее 0,5 с, если wn больше 8. Поступим, как пред
лагает первоисточник: «выберем wn = 10».
Приравнивая знаменатель (7.26) к выражению (7.27)
при w n = 10, находим значения коэффициентов K1 =
= 214, K2 = 1000, K3 = 15,5. Теперь выражение (7.26)
примет вид
245411 1 1261 1 2777
22 819 2
(7.28)
13 1 2 5411 1 1241 1 2777
Реакция системы с данной передаточной функцией
имеет перерегулирование около 32%, время установле
ния — 0,2 с.
Система, оптимальная по критерию ИВМО, должна
иметь ПФ вида (6.16), т. е. не должна иметь нулей. Функ
ция (7.28) этому требованию не удовлетворяет. Таким об
разом, минимизировать критерий ИВМО для ПИДре
гулятора без использования предшествующего фильтра
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 77

невозможно. Из выражения для T(s) (рис. 7.1) следует, что


ПФ фильтра должна иметь вид
6777 2345
2 1 8 39 1 1
(7.29)
654531 2 1633 2 6777 31 2 6 4 3 2 2345
Окончательно для ПФ замкнутой системы получаем
выражение

1 5 26 1 3444 7 (7.30)
21 2 389
22 2 23
2 2 3444

Показатели качества системы с ПФ (7.30), т. е. с най5


денными коэффициентами ПИД5регулятора и характери5
стиками сглаживающего предшествующего фильтра, сле5
дующие:
· относительное перерегулирование — 1,9%;
· время установления — 0,45 с;
· установившаяся ошибка — 0,0%.
Можно считать, что синтез дал прекрасные результаты.
Упражнение 7.2.
Найдите с помощью компьютерного моделирования в
Simulink показатели качества для объекта управления,
рассмотренного в примере, при его замыкании еди5
ничной обратной связью, а также для систем (7.28)
и (7.30). Убедитесь, что показатели имеют значения,
приведенные в тексте.
Посмотрите: вот он без страховки идет,
Чуть левее наклон — упадет, пропадет,
Чуть правее наклон — все равно не спасти...
В. С. Высоцкий

ЛЕКЦИЯ 8

УСТОЙЧИВОСТЬ
СИСТЕМ УПРАВЛЕНИЯ.
ТЕОРЕМЫ УСТОЙЧИВОСТИ
ДЛЯ НЕПРЕРЫВНЫХ СИСТЕМ
8.1.
ПОНЯТИЕ УСТОЙЧИВОСТИ

Рассматривая в предыдущих лекциях количественные


показатели и оценки качества работы систем управления,
мы имели в виду, что они имеют конечное значение. Это
возможно только для устойчивых систем. Для неустойчи(
вых систем такие показатели, как время выхода, устано(
вившаяся ошибка, а также все оптимальные оценки ста(
новятся бессмысленными, поскольку они обращаются в
бесконечность. Неустойчивые системы управления нера(
ботоспособны, поэтому требование к устойчивости — это
первое требование, выполнение которого должно прове(
ряться при разработке автоматических систем управле(
ния. К рассмотрению способов анализа устойчивости си(
стем мы и приступаем.
На самом деле понятие устойчивости относится не
только к системам управления, а к динамическим систе(
мам вообще. Чтобы лучше понять смысл терминов и опре(
делений, которые здесь будут даны, приведем три приме(
ра. Обычный маятник в поле силы тяжести при отсутствии
трения является устойчивой системой: при малом толчке
он выходит из состояния равновесия и раскачивается, не
увеличивая амплитуду. Если маятник находится в вязкой
среде или велико трение в точке подвеса, маятник будет
раскачиваться с уменьшающейся амплитудой и вернет(
ся в состояние равновесия — это пример асимптотиче%
ски устойчивой системы. Перевернутый маятник поки(
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 79

нет положение равновесия и будет уходить все дальше от


него при сколь угодно малом внешнем воздействии — это
неустойчивая система. Заметим, что перевернутый маят3
ник можно стабилизировать путем быстрых осцилляций
точки подвеса (маятник Капицы), и это яркий пример
того, что с помощью внешних управляющих воздействий
можно создать устойчивую систему для изначально неус3
тойчивого объекта.
Можно дать следующее простое определение устойчи3
вости [5]: устойчивая система — это динамическая систе
ма, обладающая ограниченной реакцией на ограниченный
входной сигнал. Однако это качественное определение. Для
анализа необходимы количественные оценки (критерии).
Кроме того, различают две концепции устойчивости [8]:
· устойчивость по выходу, или техническую устойчи3
вость;
· устойчивость по состоянию, или математическую устой3
чивость.
Рассмотрим понятие математической устойчивости,
а затем укажем на ее связь с технической устойчивостью.
Пусть все переменные состояния исследуемой системы
управления доступны измерению, так что выходной вектор
совпадает с вектором состояния 1 1 2 (управление по состоя3
нию), а управляющее воздействие является известной функ3
цией времени и переменных состояния: 1 1 1 122 334 Тогда
математическую модель можно представить в виде систе3
мы обыкновенных дифференциальных уравнений:

1 41 2 1 21 435 416 42 67776 41 8 2 1 41 433 8 2 1 413 2


3 4 3 4 3 4 43 8 4 3 4 4
5 3 42 4 5 3 22 435 416 42 67776 41 8 4 5 3 2 3 4 5 3 23 4 6 (8.1)
53 3777 4 3777 4 3777 4 3777 4
3 41 4 3 2 435 4 6 4 67776 4 8 4 3 4 43 8 4 3 4 4
6 7 61 1 2 1 7 6 1 3 7 6 13 7
где fk, k = 1, 2, ..., n — набор некоторых, вообще говоря,
нелинейных функций, которые будем полагать веществен3
ными непрерывными функциями своих аргументов. Ис3
следования устойчивости динамической системы теперь
сводятся к исследованию устойчивости решения системы
дифференциальных уравнений [1].
80 А. Ю. ОЩЕПКОВ

Многие фундаментальные результаты теории устойчи


вости были получены великим русским математиком
Александром Михайловичем Ляпуновым (1857–1918) в его
докторской диссертации «Общая задача об устойчивости
движения» (1892). Для формулировки основных результа
тов запишем систему (8.1) в краткой векторной форме:
21 132 1 4133 223 2 2 51 3
x(t0) = x0
(черта сверху в обозначениях векторов опущена), которую
также будем называть «система (8.1)».
Пространство Rn является евклидовым линейным про
странством, в котором определено скалярное произведе
ние векторов x и y*:
2 31 3
43 5 1
344 35 6 641 4 42 4 7774 41 8 7 4 5 1 42 32 6 8 4 9 397 (8.2)
2
777
4 5 2 11
4 31 5


Здесь введено удобное обозначение для скалярного про
изведения, предложенное Полем Адриеном Морисом Ди
раком для работы с векторами состояний в квантовой
механике**. Однако в рассматриваемом нами случае ком
поненты векторов считаются вещественными числами,
в отличие от квантовой механики, поэтому справедливо
равенство áx | yñ = áy | xñ. Норма (длина) вектора в простран
стве Rn определится как 1 1 1 1 2 1 1 13 2

8.2.
МАТЕМАТИЧЕСКАЯ УСТОЙЧИВОСТЬ.
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
В теории устойчивости Ляпунова исследуется на устой
чивость какоенибудь одно решение. Пусть z(t, t0, z0) —
решение задачи (8.1), продолжимое вправо до бесконеч
ности, т. е. z(t) существует на интервале [t0, ¥) и лежит

* Постников, М. М. Лекции по геометрии. Семестр I. Аналитиче


ская геометрия. — М. : Наука, 1979. — 336 с.
** Дирак, П. А. М. Принципы квантовой механики. — 2е изд. — М. :
Наука, 1979. — 480 с.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 81

внутри шара радиуса H в евклидовом пространстве Rn.


Следуя Ляпунову, назовем его невозмущенным решени
ем, а решение x(t, t0, x0) той же задачи с начальными
условиями x0, несколько отличающимися от z0, назовем
возмущенным.
Определение 8.1. Решение z(t, t0, z0) задачи (8.1) на5
зывается устойчивым по Ляпунову, если для любого
e (0 < e < H) существует d = d(e, t0) такое, что все решения
x(t, t0, x0) задачи (8.1) бесконечно продолжимы вправо,
как только | x0 – y0 | £ d(e, t0), и для этих решений справед5
ливо неравенство
| x(t, t0, x0) – z(t, t0, z0) | £ e, t0 £ t £ ¥.

Для одномерного пространства определение устойчи5


вости легко интерпретировать геометрически: график за5
висимости x(t) отклоняется от z(t) не более чем на e на всем
интервале времени.
Подчеркнем, что определение 8.1 дано для устойчи5
вости одного определенного решения, а не всех решений
задачи.
Исследование устойчивости любого решения z(t) век5
торного уравнения (8.1) можно свести к исследованию ус5
тойчивости тривиального (нулевого) решения некоторого
другого уравнения. Функция y(t) = x(t) – z(t) удовлетворя5
ет уравнению
11 122 1 3123 1 2 42 3 312342 1 5 123 123
5 12342 1 45 (8.3)
Из свойства функции g следует, что тривиальное ре5
шение y º 0 является решением однородного уравнения
11 1 12 Поэтому важно (и достаточно) рассмотреть опреде5
ление устойчивости тривиального решения.

Определение 8.2. Тривиальное решение x(t) º 0 урав5


нения (8.3) называется устойчивым по Ляпунову, если
для любого e > 0 найдется d(e, t0) такое, что неравенство
| x(t, t0, x 0) | £ e выполнено при всех t ³ t0, как только
| x0 | £ d(e, t0).
82 А. Ю. ОЩЕПКОВ

Рис. 8.1 Рис. 8.2


График Фазовая траектория
устойчивого решения устойчивого решения

Рис. 8.3 Рис. 8.4


График Фазовая траектория
неустойчивого решения неустойчивого решения

Примеры устойчивого решения и фазовой траектории


для устойчивого решения приведены на рисунках 8.1 и 8.2.
Решение, не являющееся устойчивым, называют не&
устойчивым.
Определение 8.3. Тривиальное решение x(t) º 0 назы&
вается неустойчивым по Ляпунову, если для некоторого
e > 0 и любого d > 0 найдутся решения x(t, t0, x0) и момент
времени t1 > t0 такие, что | x(t, t0, x0) | > e, хотя | x0 | £ d.
Примеры неустойчивого решения и фазовой траекто&
рии для неустойчивого решения приведены на рисун&
ках 8.3 и 8.4.
Согласно определению устойчивости 8.2 возмущенное
решение может оставаться внутри трубки сечения 2e.
Если величина e превышает допустимую ошибку регули&
рования, то требование устойчивости системы является
недостаточным. Применяют понятие асимптотической
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 83

устойчивости, усиливающее понятие устойчивости по Ля%


пунову.

Определение 8.4. Тривиальное решение x(t) º 0 уравне%


ния (8.1) называется асимптотически устойчивым, если:
1) оно устойчиво по Ляпунову;
2) для всякого t0 существует D = D(t0) > 0 такое, что
x(t, t0, x0) ® 0, t ® ¥ при | x0 | £ D.

Решение, график которого приведен на рисунке 8.1, в


соответствии с определением 8.4 является асимптотиче%
ски устойчивым.
Если выполняется только условие 2 из определения
8.4, то говорят, что тривиальное решение является при
тягивающим (или аттрактором).
Частным случаем асимптотической устойчивости яв%
ляется экспоненциальная устойчивость.
Определение 8.5. Говорят, что тривиальное решение
уравнения (8.1) экспоненциально устойчиво, если всякое
решение x(t, t0, x0) этого уравнения удовлетворяет оценке

| x(t, t0, x0) | £ B| x0 |exp(–a(t – t0)),


B > 0, a > 0, t ³ t0, x0 < H.
Отметим, что для линейных уравнений 11 1 2 1321132
экспоненциальная устойчивость эквивалентна асимптоти%
ческой устойчивости.
При исследовании устойчивости по выходу (техниче%
ская устойчивость) используются другие термины. Соот%
ветствие определений математической устойчивости и тех%
нической устойчивости приведено в таблице 8.1.
1 2 3 4 5 6 2 7 89
7

1234523674892
83 76 83 4674892
83 76 83

12345678934
2 78
89
98 123456785 47
8934
2 78

1234567873264
42 5328 12345678934
2 78
934
2 78

123456785934
2 78 123456785934
2 78
1
84 А. Ю. ОЩЕПКОВ

8.3.
ТЕОРЕМЫ УСТОЙЧИВОСТИ
Для линейных уравнений устойчивость одного реше
ния влечет устойчивость любого другого решения, и мож
но говорить, что некоторая линейная система устойчива
(или неустойчива). Справедлива следующая теорема [1, § 1]:
Теорема 8.1. Для устойчивости решения z(t, t0, z0)
линейной системы 11 122 1 3 1221122 2 4122 при любом
z0 и любой правой части f (t), где A(t) и f(t) — не
прерывные функции, необходимо и достаточно,
чтобы тривиальное решение x(t) º 0 однородной
системы 11 1 2 1321132 было устойчивым.
Таким образом, устойчивость линейной системы оп
ределяется свойствами матрицы A(t). В частности, для
устойчивости линейных стационарных систем достаточ
но, чтобы вещественные части всех корней характеристи
ческого уравнения были отрицательны. В MATLAB име
ются две функции: poly(A) определяет характеристический
полином матрицы A, roots(p) находит корни полинома p.
Применение этих функций решает вопрос об исследова
нии на устойчивость ЛСС. Кроме того, существуют крите
рии, на основании которых можно судить об устойчиво
сти линейной стационарной системы, не решая ее харак
теристического уравнения. Их мы рассмотрим позже.
Универсальным методом исследования устойчивости
различных классов систем является второй метод Ляпу
нова*. В качестве инструмента исследования в этом ме
тоде используются некоторые специально подобранные
функции, называемые функциями Ляпунова.
Вещественную непрерывно дифференцируемую функ
цию V(t, x), удовлетворяющую условию V(t, 0) º 0, назы
вают функцией Ляпунова. Поскольку вектор x удовлет
воряет уравнению (8.1), то полная производная функции
Ляпунова по времени имеет вид
11 122 33 2 11 3 4 11 4 4122 33 5 5 (8.4)
12 13
* Ляпунов, А. М. Общая задача об устойчивости движения. — М. ;
Л. : Гостехиздат, 1950. — 472 с.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 85

Из выражения (8.4) следует, что для вычисления 11


фактического решения x(t) не требуется.
Кроме функции V, ниже будут использоваться скаляр3
ные непрерывные неубывающие функции w k(u) (u ³ 0,
k = 1, 2, ...) такие, что wk(0) = 0 и wk(u) > 0 при u > 0.
Теорема 8.2 (первая теорема Ляпунова). Пусть
существует функция Ляпунова V(t, x), такая что
w1(| x |) < V(t, x), (8.5)
1
1 1 12 (8.6)
Тогда тривиальное решение уравнения (8.1) устой
чиво по Ляпунову.
Функция V в этом случае называется определенно
положительной (свойство (8.5)) со знакоотрицательной
производной (8.6). Напомним, что свойства функции Ля3
пунова исследуются на классе решений уравнения (8.1),
так что ее полная производная определяется по форму3
ле (8.4). Доказательство теоремы приведено в [1, § 2].
Теорема 8.3 (вторая теорема Ляпунова). Пусть
существует функция Ляпунова V(t, x), такая что
w1(| x |) £ V(t, x) £ w2(| x |), (8.7)
11 223 34 1 231 25 3 546 (8.8)
Тогда тривиальное решение уравнения (8.1) асимп
тотически устойчиво.
Доказательство теоремы приведено в [1, § 2].
Упражнение 8.1.
Исследуйте с помощью теорем Ляпунова устойчивость
тривиального решения следующих уравнений:

а) 11 1 221 2 32 3 11 4 21 1 1 3 2 2 22 4 3 1 512 3 6512 3 6722 8


б) 11 1 212 1 2 21 1 211 2 3 1 11 21 3
в) 11 1 222 2 11 3 21 1 11 2 21 3 3 1 112 3 22 4

Как выбирается вид функции Ляпунова при исследо3


вании устойчивости систем, рассмотрим на конкретном
примере.
86 А. Ю. ОЩЕПКОВ

8.4.
УСТОЙЧИВОСТЬ ВРАЩЕНИЯ
ТВЕРДОГО ТЕЛА
Уравнение вращательного движения твердого тела в
подвижной системе координат имеет вид*
12 1 1 1 1 1
1 1 1 2 3 4 21 1 1 3 5 31 (8.9)
1 1
1 1 — момент импульса тела; 1 — угловая скорость;
где
1 — момент внешних сил; 1 — тензор инерции. Обозна&
чив главные моменты инерции1как I1, I2, I3, запишем урав&
нения свободного вращения 11 1 23 в проекциях на коор&
динатные оси собственной системы (начало координат
находится в центре инерции, координатные оси 1, 2, 3
направлены по главным осям инерции):
1 2 4 1 3 1 51 1 6
111 1 2 3 2 3
1
1 1 2 4 1 3 1 51 1 6
2 2 3 1 3 1
1 2 4 1 3 1 51 1 7
13 1 (8.10)
3 1 2 1 2

— уравнения Эйлера. Отметим, что система (8.10) имеет


два интеграла движения: полную энергию E и абсолют&
ную величину момента М, т. е. величины

1 1 2 4 22221 3 21 211 3 23 213 56


1
1 1 221221 3 211 211 3 231 213
1

не изменяются с течением времени. Для дальнейшего ана&


лиза удобно немного переопределить сохраняющиеся ве&
личины и выбрать их следующим образом:
12 1 12 1 32221 3 31 211 3 33 213 4
11 1 4 1 4 32 12 1 31 531 4 32 6211 3 33 533 4 32 6213 7 (8.11)
Непосредственной подстановкой в (8.10) можно убе&
диться, что выполняются равенства
111 1 34 112 1 35 (8.12)

* Ландау, Л. Д. Механика / Л. Д. Ландау, Е. М. Лифшиц. — М. : Нау&


ка, 1973. — 208 с.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 87

Исследуем устойчивость вращения тела вокруг первой


оси, т. е. устойчивость следующего решения нелинейной
системы (8.10)
W1 = W0, W2 = 0, W3 = 0. (8.13)
Решение (8.13) не является тривиальным, поэтому тео6
ремы устойчивости неприменимы. Поступим так, как ре6
комендовано выше (см. (8.3)). Введем новые переменные
x 1 = W 1 – W 0, x 2 = W 2 , x 3 = W 3 . (8.14)
Теперь нам нужно исследовать устойчивость тривиаль6
ного решения x = 0, но для другой системы:
11 211 1 5 12 2 13 6 22 23 7
12 21 2 1 513 2 11 6 23 521 3 44 67
13 21 3 1 5 11 2 12 622 521 3 44 68 (8.15)
Выдающийся русский ученый Николай Гурьевич Че6
таев (1902–1959) показал*, что функцию Ляпунова мож6
но искать в виде связки интегралов
11 2 221 3 121 3 1 2 456789 (8.16)
1
В силу равенств (8.12) мы имеем 11 2 1 при любом l,
т. е. выполнено условие (8.6) теоремы 8.2. Если теперь
удастся найти l, при котором функция (8.16) будет опре6
деленно6положительна, решение будет устойчивым, в про6
тивном случае — неустойчивым.
Рассмотрим движение асимметрического или симмет6
рического волчка, вытянутого вдоль первой оси, вокруг ко6
торой он вращается:
I1 < I2 £ I3. (8.17)
Положив l = –1, с помощью формул (8.11), (8.14) и
(8.16) получим
112 2 522 6321 3 13243 7 3 21 311 3 24 341 81 3
3 21 621 1 22 7311 3 24 624 1 22 7341 9 (8.18)
Видим, что функция V–1 является определенно6поло6
жительной, поэтому вращение вокруг оси с наименьшим
моментом инерции устойчиво.
* Четаев, Н. Г. Устойчивость движения. — 46е изд. — М. : Наука,
1990. — 175 с.
88 А. Ю. ОЩЕПКОВ

Если рассмотреть вращение сплюснутого волчка


I1 > I2 ³ I3 (8.19)
вокруг оси с наибольшим моментом инерции, то в каче!
стве функции Ляпунова можно взять

112 2 522 6321 1 13233 7 1 21 311 1 24 341 81 1


1 21 622 4 21 7311 1 24 622 4 24 7 341 9 (8.20)

Функция V+1 также является определенно!положи!


тельной, и вращение вокруг оси с наибольшим моментом
инерции тоже устойчиво.
При вращении вокруг средней оси (I3 > I1 > I2) не су!
ществует l, при котором функция (8.16) определенно!по!
ложительна, поэтому вращение вокруг средней оси не!
устойчиво, вектор угловой скорости будет изменять свое
положение в пространстве.
Полученные результаты можно применить для иссле!
дования движения реальных объектов, например при изу!
чении угловых движений космических аппаратов (КА).
Обработка радиоастрономических наблюдений показала,
что первый искусственный спутник Земли имел устойчи!
вое вращение, а спутник «Эксплорер!1» оказался неустой!
чивым и совершал переходы из одного крайнего положе!
ния в другое каждые 90 мин.

Историческая справка
Первый спутник Земли (СССР, 4 октября 1957 г.) представлял со!
бой хромированный шар диаметром 58 см и весом 83,6 кг. На его
поверхности были закреплены четыре антенны, непрерывно пере!
дававшие с двух бортовых передатчиков простейшие сигналы. Эти
слабые позывные смогли принять множество радиолюбителей во
всем мире. На околоземной ор!
бите спутник просуществовал
всего 92 дня. За это время он
успел облететь Землю 1400 раз,
пройдя около 60 млн «космиче!
ских» километров.
«Эксплорер!1» (Explorer!1, «Ис!
следователь») был первым кос!
мическим аппаратом Соединен!
ных Штатов. Это был спутник
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 89

цилиндрической формы, весив%


ший 13,6 кг. «Эксплорер%1» был
запущен при помощи четырех%
ступенчатой ракеты «Юпитер%С»
(модифицированная баллисти%
ческая ракета армии США Red%
stone) и вышел на околоземную
орбиту 31 января 1958 г. На «Эк%
сплорер%1» были установлены
приборы для измерения внут%
ренней и внешней температур,
регистрации микрометеоритных
столкновений, был проведен эк%
сперимент по измерению плотно%
сти электронов и ионов в космо%
се (Дж. А. Ван Аллен). Был
открыт пояс вокруг Земли из
высокоэнергетичных электро%
нов и ионов, захваченных земной магнитосферой (пояс Ван Алле%
на). «Эксплорер%1» прекратил радиопередачи 28 февраля 1958 г.,
однако находился на орбите еще до марта 1970 г.

На самом деле реальные КА являются упругими, а не


твердыми телами. Теоретическое изучение полученных
экспериментальных результатов привело к выводу о том,
что учет упругих сил меняет устойчивость вращения тела
вокруг неподвижной точки*. Тщательное исследование
вопроса об устойчивости вращения упругого тела вокруг
неподвижной точки показывает, что, как и для твердого
тела, вращение вокруг средней оси — неустойчивое. Вра%
щение же вокруг малой оси при учете упругих сил стано%
вится неустойчивым. Рассмотренный пример говорит о
том, что к разработке математических моделей систем
управления нужно подходить очень тщательно, особенно
при исследовании систем на устойчивость.

* Ликинз, П. Угловые движения КА и управление. Личная оценка


ранних разработок // Аэрокосмическая техника. — 1986. — № 12.
Человек раздвоен снизу, а не сверху —
для того, что две опоры надежнее одной.
К. Прутков

ЛЕКЦИЯ 9

УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ
СТАЦИОНАРНЫХ СИСТЕМ

9.1.
МЕТОДЫ АНАЛИЗА
УСТОЙЧИВОСТИ ЛСС

Устойчивые, асимптотически устойчивые и неустойчи


вые линейные стационарные системы можно различить
по виду переходных характеристик. Графиком переход
ной характеристики асимптотически (экспоненциально)
устойчивой ЛСС будет колебательная или монотонно из
меняющаяся кривая, огибающая которой по экспоненте
стремится к определенному значению. Графиком переход
ной характеристики устойчивой системы будет кривая,
амплитуда изменения которой находится в полосе конеч
ного размера. Неустойчивая система имеет переходную
характеристику, амплитуда которой неограниченно воз
растает с течением времени.
Рассмотрим систему управления со структурной схе
мой, изображенной на рисунке 9.1. Ее переходные харак
теристики при b2 = 4, b1= 2, b0 =1 изображены на рисун
ке 9.2 для трех различных значений коэффициента уси
ления K. Из вида графиков следует, что при коэффициенте
K = 1 система асимптотически устойчива, при K = 7 —
устойчива (технический термин — нейтрально устойчи
ва), при K = 10 система неустойчива.
Таким образом, зная вид переходной характеристи
ки, мы можем сделать вывод об устойчивости системы.

Рис. 9.1
Структурная схема
Прегулятора для
объекта 3го
порядка
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 91

Рис. 9.2
Переходные характеристики асимптотически
устойчивой (K = 1), устойчивой (K = 7)
и неустойчивой (K = 10) систем управления
1 2 3 4 5 6 2 7 89
7
123456789
329
6 3496 36
123456789
5 9
57 722 ´ 7 7
439
57 7
7 5
5 73893778537 178577 # 27$%$77
7!"73897
1 5
5 7233775337
123456789
5 9
577 39

2 7 7 7
439
57
7 /0127'7
1 &53'3(7) &7 7-7) &7
1 
&7*3 59
37 7*3 59
7 /0317'7
1 5
5 7+5,3 4 37 17.7+5,3 4 7 /0347'7

1234567 2 7 7 7
7 54 9 9
57
-77 3297 /0787'7
1 
&7 2 ' 7' & '3637
1
Если мы решим характеристическое уравнение, то устой'
чивость или неустойчивость системы определится по виду
корней характеристического уравнения. Однако существу'
ют методы анализа устойчивости линейных стационарных
92 А. Ю. ОЩЕПКОВ

систем, позволяющие судить об устойчивости или не


устойчивости системы с данными параметрами или даже
в некоторых областях изменения параметров, не решая
характеристического уравнения и не строя переходных
характеристик.
Методы анализа устойчивости ЛСС можно разделить
на две группы: анализ устойчивости систем дифференци
альных уравнений (анализ во временно´м домене) и ана
лиз в частотной области с использованием комплексной
частоты s или действительной частоты w. Методы с исполь
зованием действительной частоты можно применять ана
литически, а также реализовать экспериментально (в этом
их большое преимущество).
Основные методы анализа устойчивости приведены в
таблице 9.1. Рассмотрим некоторые из этих методов.

9.2.
АНАЛИЗ УСТОЙЧИВОСТИ
ВО ВРЕМЕННО´ Й ОБЛАСТИ
В соответствии с теоремой 8.1 для исследования устой
чивости линейной стационарной системы вида (3.10) до
статочно исследовать устойчивость тривиального решения
системы
21 1 121323 2 2 41 4 (9.1)
Напомним, что общее решение этой системы имеет вид*
3
4 21 21 1 4 5
6152 3 7 714 5 8411 2 8 9 21 5 5 23 6 24 6 666 6 23 3
6 (9.2)
7
1 33 9 4 33
12 1 4 27 8
1

Здесь li — действительное или комплексное число,


являющееся одним из собственных значений матрицы A,
т. е. корнем характеристического уравнения матрицы A
det(lI – A) = 0, (9.3)
кратности ri; 2 1 — собственный вектор матрицы A, соот
ветствующий собственному значению li; константы Ciq
определяются начальными условиями.
* Эльсгольц, Л. Э. Дифференциальные уравнения и вариационное
исчисление. — 5е изд. — М. : Эдиториал УРСС, 2002. — 320 с.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 93

Пусть корень lj имеет вид


lj = Relj + iImlj, i2 = –1. (9.4)
Если этот корень не вырожден (rj = 1), в сумме (9.2)
будет присутствовать слагаемое, содержащее экспоненту
42 12 1 13 2 434 1 13 5 которое увеличивается до бесконечности
при t ® ¥, если Relj > 0, стремится к нулю при Relj < 0
или изменяется в конечных пределах, если Relj = 0. Если
rj > 1, то в сумме (9.2) будут присутствовать слагаемые,
содержащие произведение экспоненты на степенные функ;
ции: 34 2 52 12 1 13 2 534 1 13 5 m = 1, 2, ..., rj – 1. Эти слагаемые
стремятся к нулю только при Relj < 0, при Relj ³ 0 они
расходятся. В результате анализа решения (9.2) доказа;
на теорема:
Теорема 9.1. Для устойчивости тривиального ре
шения уравнения (9.1) необходимо и достаточно,
чтобы все собственные значения lj матрицы A
удовлетворяли условию Reli £ 0, причем собствен
ные значения lj такие, что Relj = 0, имеют rj = 1.
Для асимптотической устойчивости уравнения
(9.1) необходимо и достаточно, чтобы Reli < 0.
Таким образом, устойчиво;
сть (асимптотическая устойчи;
вость или неустойчивость) урав;
нения (9.1) определяется распо;
ложением относительно мнимой
оси корней характеристическо;
го уравнения (9.3) матрицы A
(рис. 9.3).
Раскрывая определитель,
можно привести уравнение (9.3)
к виду
Pn(l) = 0, Рис. 9.3
Области устойчивости
где
Pn(l) =a0 + a1l + ... + anln, an = 1. (9.5)
Определение 9.1. Многочлен (9.5) называется устойчи
вым многочленом (многочленом Гурвица), если все его
94 А. Ю. ОЩЕПКОВ

корни lj имеют отрицательную вещественную часть, т. е.


Relj < 0. Матрицу A в этом случае тоже называют устой
чивой, или гурвицевой.
Необходимое условие устойчивости любого многочле(
на было сформулировано Александром Стодолой в виде
теоремы.
Теорема 9.2 (А. Стодола). Все коэффициенты устой
чивого многочлена положительны.
Действительно, пусть 2 11 3 45 1 1 26 1 1 j = (1, ..., r), lk =
= –gk, k = (1, ..., l), 2r + l = n — корни устойчивого много(
члена Pn(l), т. е. aj > 0, gk > 0. Раскладывая Pn(l) на мно(
жители, имеем
1 2
63344 3 8 34 24 14 434 2 4 24 48 34 2 4 5 4 3
4 31 5 31
1 2
3 8 342 1 25 4 4 1 524 1 624 48 34 1 7 5 45
4 31 5 31

Таким образом, Pn(l) представлен в виде произведе(


ния многочленов с положительными коэффициентами,
поэтому все его коэффициенты положительны.
Положительность коэффициентов является необходи(
мым условием устойчивости, т. е. многочлен, имеющий хотя
бы один отрицательный коэффициент, является неустой(
чивым. Но это простое условие, к сожалению, не является
достаточным для устойчивости многочлена. Другими сло(
вами, существуют многочлены с положительными коэффи(
циентами, которые неустойчивы. Например, многочлен
P3(z) = 30 + 4z + z2 + z3 имеет корни z1 = –3, z2, 3 = 1 ± 3i.
Необходимый и достаточный признак устойчивости был
сформулирован в конце XIX в. А. Гурвицем и Э. Дж. Рау(
сом независимо друг от друга. Составим из коэффициен(
тов многочлена (9.5) матрицу:
2 31 32 2 2 666 2 3
43 34 31 32 666 2 5
3
1 21 64 56 (9.6)
41 1 1 1 1 1 5
43 341 14 341 13 341 15 666 31 58
7 41 11
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 95

Если в этой матрице встречается коэффициент a с ин'


дексом больше n, он полагается равным нулю.
Определение 9.2. Матрица (9.6) называется матрицей
Гурвица.
Критерий Рауса — Гурвица. Для того чтобы многочлен
Pn(l) с a0 > 0 и an ¹ 0 был устойчивым, необходимо и до'
статочно, чтобы были положительны все главные диаго'
нальные миноры его матрицы Гурвица 1 21 1
21 22
21 3 215 23 3 5 21 3 21 21 116
24 23
Критерий Льенара — Шипара. Для того чтобы много'
член с положительными коэффициентами был устойчи'
вым, необходимо и достаточно выполнение одного из двух
условий: 1) D1 >0, D3 >0, ...; 2) D2 >0, D4 >0, ...
Таким образом, если при анализе устойчивости мно'
гочлена заранее известно, что его коэффициенты положи'
тельны, т. е. выполнены условия теоремы 9.2, то приме'
няют критерий Льенара — Шипара, при этом достаточно
проверить в два раза меньше условий, чем в критерии Рау'
са — Гурвица.
Доказательства этих критериев можно найти в книге
Б. П. Демидовича*.
Для примера рассмотрим устойчивость системы управ'
ления валом электродвигателя, математическая модель
которой записана в виде дифференциальных уравнений в
фазовом пространстве (2.5). Синтезируем ПД'регулятор:
2 1 2 33 2 31 31 1 2 341 2 31 42 3 3 4 43 31 4 45 (9.7)
Подстановка (9.7) в (2.5) приводит к системе (9.1) с
матрицей A:
1 1 2 1 2
153 1 1 2 43 (9.8)
3 4
3 7 2 6 3 7 21 6 3 7 4 4
38 56 56 5 94

* Демидович, Б. П. Лекции по математической теории устойчиво'


сти. — М. : Наука, 1967. — 472 с.
96 А. Ю. ОЩЕПКОВ

Характеристическое уравнение матрицы (9.8) имеет вид


3 1 21 2 4
345 5 2 1 21 6 7 26 (9.9)
5 6
5 2 8 3 21 8 3 1 9 4 6
5
56 56 5 6
Многочлен P3(l), соответствующий (9.9), имеет вид
22 516 2 33 3 341 3 31 11 3 12 7
4 5
33 2 45 7 34 2 1 7 31 2 6 8 (9.10)
78 78 7
1 22 23 3 2
Составляем матрицу Гурвица: 1 11 5 3 2 24 22 45
3 4
33 3 24
6 7
Поскольку согласно (9.10) все коэффициенты исследу*
емого многочлена положительны, достаточно воспользо*
ваться критерием Льенара — Шипара, который в нашем
случае сводится к одному неравенству
11 12
13 2 2 1113 3 12 4 24 (9.11)
1 13

Используя выражения (9.10) для коэффициентов мно*


гочлена, запишем неравенство (9.11) в виде
K × L < KD × R. (9.12)
Это и есть условие устойчивости ПД*регулятора, уп*
равляющего поворотом вала электродвигателя. Самостоя*
тельно прокомментируйте полученный результат.
Упражнение 9.1.
Рассмотрим задачу об автоматической стабилизации
курса корабля. Корабль, двигающийся с постоянной
скоростью, испытывает вращательное движение вокруг
вертикальной оси (изменяет курс), если положение
руля отклоняется от осевой линии. Простейшая мо*
дель этого движения описывается уравнением
11 2 211 3 341
11
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 97

где j — угол уклонения корабля от курса;


y — угол отклонения руля от оси судна; I —
момент инерции корабля относительно вер(
тикальной оси, проходящей через центр
корабля; h — коэффициент жидкостного
трения; k — коэффициент эффективности
руля (рис. 9.4). Пусть автоматический регу(
лятор положения руля (авторулевой) рабо(
тает на основе ПД(алгоритма, так что урав(
нение авторулевого имеет вид
1 11 2 1 3 456 4 761 1 Рис. 9.4
Модель
корабля:
Здесь x — измеренное значение угла ук(
1 — курс корабля;
лонения; a и b — пропорциональный и диф( 2 — ось корабля;
ференциальный коэффициенты (парамет( 3 — центр инер(
ции; 4 — руль.
ры авторулевого, которые могут подбирать(
ся); T — постоянная времени авторулевого. В уравнении
авторулевого учтено, что измерение угла уклонения j не
происходит мгновенно, а описывается уравнением 121 3 2 4 51
где t — постоянная времени измерителя.
1. Опишите структуру автоматической системы управ(
ления курсом корабля. Составьте структурную схему зам(
кнутой системы управления.
2. Пусть в некоторых единицах измерения параметры
системы имеют следующие значения: I = 1000, h = 0,01,
k = 1, T = 100, t = 0,1. В пространстве параметров (a, b)
найдите ту область, в которой замкнутая система управ(
ления асимптотически устойчива.
3. Постройте Simulink(модель системы управления и
проверьте результаты аналитического определения обла(
сти устойчивости.

9.3.
ЧАСТОТНЫЕ КРИТЕРИИ
УСТОЙЧИВОСТИ
Применение критерия Рауса — Гурвица к реальным
системам автоматического регулирования приводит к
сложным вычислениям и не позволяет выявить влия(
ние отдельных параметров на устойчивость системы.
98 А. Ю. ОЩЕПКОВ

Более удобными в приложе


ниях оказываются частотные
критерии А. В. Михайлова и
Г. Найквиста.
Рассмотрим многочлен
(9.5). Положим l = iw (i2 = –1)
и построим годограф Михай
лова (амплитудно фазовую
характеристику) Pn(iw) этого
многочлена, разложив его на
множители:
Рис. 9.5 z = Pn(iw) =
Годограф для одного
устойчивого корня = an(iw – l1)...( iw – ln).
Геометрически iw – lk есть вектор в комплексной пло
скости z, началом которого служит точка lk — корень мно
гочлена Pn(l), а концом — точка l = iw (рис. 9.5).
Так как Pn(iw) — комплексное число, то
234 21 5316 2 234 41 3 234531 4 51 6 3 777 3 234531 4 51 67 (9.13)
Если корень lk лежит в левой полуплоскости (Relk < 0),
то при изменении w от –¥ до +¥ вектор iw – lk вращается в
положительном направлении (против хода часовой стрел
ки) и приращение аргумента равно 1 2 12 1 2 3 1 :
3 3
5 123421 4 6 1 5 123 2 76
1243 (9.14)

Если же корень ll лежит в правой полуплоскости, то


вектор (iw – ll) вращается по ходу часовой стрелки и
5 123421 4 61 5 123 2 476
1243

Из соотношений (9.13) и (9.14) вытекает следующая


теорема.
Теорема 9.3. Многочлен Pn(l), не имеющий чисто
мнимых корней, является устойчивым тогда и
только тогда, когда
5 123 21 4315 123 2 166
1243 (9.15)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 99

Для упрощения условия (9.15) отделим действитель'


ную и мнимую части Pn(iw). Имеем
21 7318 2 42 3 4331 3 41 73181 3 999 3 41 73181 2
2 742 4 41 11 3 44 14 3 9998 3 37431 4 45 15 3 46 16 3 99989
Отсюда видно, что Re Pn(iw) есть четная функция от w,
а Im Pn(iw) — нечетная. Поэтому годограф многочлена
Pn(iw) состоит из двух частей, симметричных относитель'
но действительной оси, первая из которых соответствует
изменению w от –¥ до 0, а вторая — от 0 до +¥. В результа'
те получаем следующее утверждение.
Критерий Михайлова. Для устойчивости многочлена
Pn(l), не имеющего чисто мнимых корней, необходимо и
достаточно, чтобы
5 234 21 5316 123 4
12 1 2 17 (9.16)
8
На рисунке 9.6 приведены различные годографы Ми'
хайлова для n = 2, ..., 6 [1]. Чем ближе годограф подходит
к началу координат, тем меньше запас устойчивости. Если
годограф проходит через начало координат, то система
находится на границе области устойчивости. Таким обра'
зом, критические значения параметров aкр и частоты wкр
линейной стационарной системы с характеристическим
уравнением (9.2) находят из условий
Re Pn(iwкр, aкр) =
= Im Pn(iwкр, aкр) = 0.
Чтобы подчеркнуть зави'
симость многочлена (9.2) от
параметров a = (a0, ..., an), он
обозначен через Pn(l, a).
Интересно отметить, что
годограф Pn(iw) можно опреде'
лить экспериментально, по'
давая на вход линейной ста'
ционарной системы сигнал
r(t) = eiwt (частоты w и ампли' Рис. 9.6
туды 1). В установившемся Годографы Михайлова
для устойчивых систем
режиме на выходе получится при n = 2, 3, 4, 5, 6
100 А. Ю. ОЩЕПКОВ

Рис. 9.7
Физический смысл годографа Михайлова

сигнал x¥(t) = Aei(wt – j), где амплитуда A = | Pn(iw) |–1, а сдвиг


фазы j = arg(Pn(iw)) (рис. 9.7), поэтому годограф Михайлова
называют амплитудно"фазовой характеристикой.
В методе Найквиста геометрически исследуется распо"
ложение полюсов передаточной функции на s"плоскости.
Поскольку полюсы передаточной функции G совпадают с
корнями многочлена P (G = 1/P), критерии Михайлова и
Найквиста практически совпадают, поэтому нередко ча"
стотный критерий устойчивости называют критерием
Михайлова — Найквиста.
В качестве примера найдем критическое значение ко"
эффициента K, при котором система с П"регулятором, изоб"
раженная на рисунке 9.1, теряет устойчивость. Передаточ"
ная функция системы в соответствии с (6.4) имеет вид
121
3 5 46 1 7
42 2 23 43 2 244 2 21 54 2 1 6
Запишем годограф Михайлова: P3(iw) = b0(1 + K) + ib1w –
– b2w2 – iw3.
Составляем два условия для определения критических
параметров:
Re P3(iwкр, Kкр) = b0(1 + K) – b2w2 = 0; (9.17а)
Im P3(iwкр, Kкр) = b1w – w . 3
(9.17б)

Из уравнения (9.17б) определяем 1123 2 14 5 подставляя


это выражение в (9.17а), получаем значение критическо"
го коэффициента усиления
1112
234 1 2 26 (9.18)
15
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 101

Подставив значения коэффициентов bk, для которых


построены переходные характеристики исследуемой си.
3 14
стемы на рисунке 9.2, в (9.18), получаем 112 2 5 3 5 2 67
Из графиков, приведенных на рисунке 9.2, следует, что при
K < Kкр система асимптотически устойчива, при K = Kкр —
устойчива, при K > Kкр — неустойчива.
Программы, численно реализующие критерии Рау.
са — Гурвица и Михайлова, приведены в книге В. Е. Бо.
лонкина и П. И. Чинаева*.

9.4.
УСТОЙЧИВОСТЬ СИСТЕМ
С НЕОПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ
Приведенные в теоремах этого параграфа условия устой.
чивости получены в предположении, что все коэффициенты
системы 11 1 111 т. е. все элементы постоянной матрицы B
априори известны точно. Однако указанное предположе.
ние не всегда выполняется. В реальной ситуации зачастую
бывает известна лишь некоторая область U, которой при.
надлежит матрица B. Ясно, что если устойчивость имеет ме.
сто при любой матрице B из области U, то реальная система
также будет устойчива. Систему, которая устойчива не при
каких.то конкретных значениях параметров матрицы, а в
интервале этих значений, можно назвать робастно устойчи.
вой системой. Оказывается, что в некоторых ситуациях об
устойчивости всех систем при произвольных матрицах B Î U
можно судить по их отдельным представителям.
Пусть Pn(l) — характеристический многочлен матри.
цы B, а W — множество всех таких многочленов, соответ.
ствующих всем матрицам B Î U. Произвольный многочлен
Pn(l) Î W запишем в виде
Pn(l) = ln + b1ln – 1 + b2ln – 2 + ... +bn. (9.19)
Предположим, что известны границы изменения коэф.
фициентов bi, i = 1, ..., n, когда многочлен Pn(l) пробегает

* Болонкин, В. Е. Анализ и синтез автоматического управления на


ЭВМ / В. Е. Болонкин, П. И. Чинаев // Алгоритмы и программы. — М. :
Радио и связь, 1986.
102 А. Ю. ОЩЕПКОВ

1 2 3 4 5 6 2 7 89
7
11212131431 112121314313151
45
3161789
1 3161
8789
1 3161789
1 3161
8789
1
12 1 7 2 7 1 7 2 7
32 2 7 1 7 2 7 1 7
42 2 7 1 7 1 7 2 7
52 1 7 2 7 2 7 1 7
1
множество W. Иначе говоря, предположим, что известны
числа ai, bi (i = 1, ..., n), такие что
22 3 123 52 4 42 3 156 52 4
31 14 31 14
52 1 722 4 42 84 9 5 22 6 42 4 2 3
4 4 1 (9.20)

Оказывается, что для проверки устойчивости всего


бесконечного множества многочленов W достаточно убе#
диться в устойчивости только четырех многочленов:
311 5267 312 5267 313 5267 314 5267
312 526 3 21 4 412 21 11 4 422 2 1 12 4 888 4 412 8
Выбор коэффициентов многочленов 321 происходит в
соответствии с таблицей 9.2.
Теорема 9.4 (В. Л. Харитонов*). Для того чтобы
любой многочлен Pn(l) вида (9.19) с коэффициен
тами, удовлетворяющими условиям (9.20), был
устойчивым, необходимо и достаточно, чтобы все
четыре многочлена 211 5167 212 5167 213 5167 214 516 были
устойчивыми.
Для примера установим необходимые и достаточные
условия асимптотической устойчивости множества ска#
лярных систем 3#го порядка:
111 11425 1 32 11 425 1 33 1425 2 6
1 425 1 31 1 (9.21)
с коэффициентами, удовлетворяющими условиям
0 < ai £bi £ bi, i = 1, 2, 3. (9.22)
* Харитонов, В. Л. Об асимптотической устойчивости положения
равновесия системы линейных дифференциальных уравнений // Диф#
ференциальные уравнения. — 1978. — Т. 14. — № 11.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 103

Характеристический многочлен уравнения (9.21) име'


ет вид l3 + b1l2 + b2l + b3 = 0.
Построим многочлены 131 5167 132 5167 133 5167 134 5168 По'
скольку n = 3, в первом многочлене i = 1 при j = 1 (i = n – 2j),
поэтому в соответствии с таблицей 9.2 111 1 212 Выбирая
аналогично все остальные коэффициенты, получаем че'
тыре многочлена:
121 516 2 12 3 4113 3 53 1 3 52 7 123 516 2 12 3 5113 3 43 1 3 42 7
122 516 2 1 2 3 5113 3 53 1 3 42 7 124 516 2 1 2 3 4113 3 43 1 3 52 8
(9.23)
Воспользовавшись критерием Льенара — Шипара, за'
пишем условия устойчивости многочленов (9.23). Они
имеют вид
0 < b3 < a1b2, 0 < a3 < b1a2,
0 < a3 < b1b2, 0 < b3 < a1a2. (9.24)

Поскольку a3 < b3 и a1a2 меньше любого из произведе'


ний a1b2, b1a2 и b1b2, все условия (9.24) будут выполнять'
ся одновременно, если окажется выполненным лишь одно
неравенство
0 < b3 < a1a2. (9.25)

Таким образом, все уравнения из множества (9.21) с


коэффициентами, удовлетворяющими условию (9.22),
устойчивы, если выполнены неравенства (9.25), т. е. наи'
большее значение коэффициента b3 меньше произведения
наименьших значений b1 и b2.
Ни пустоты, ни тьмы нам не дано:
Есть всюду свет, предвечный и безликий...
И. А. Бунин

Л Е К Ц И Я 10

ДИСКРЕТНЫЕ СИСТЕМЫ
И ИХ УСТОЙЧИВОСТЬ
10.1.
СТРУКТУРА ЦИФРОВЫХ
СИСТЕМ УПРАВЛЕНИЯ

В современных системах управления роль управляющего


устройства все чаще играет цифровой регулятор, работаю$
щий под управлением микропроцессора. Регулятор может
быть создан на базе обычного настольного компьютера или
реализован в специально разработанном автономном кон$
троллере с менее мощным микропроцессором («бортовой
вариант» компьютера). Цифровое устройство управления
назовем обобщенно цифровым компьютером, а систему,
использующую цифровой компьютер, — цифровой систе$
мой управления. Структура такой системы изображена на
рисунке 10.1.

Рис. 10.1
Структура цифровой системы управления:
АЦП — аналого$цифровой преобразователь; ЦАП — цифроаналоговый преобра$
зователь.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 105

В цифровой системе управления непрерывными объ)


ектами должен присутствовать аналого)цифровой пре)
образователь (АЦП), преобразующий непрерывный (ана)
логовый) сигнал в цифровую форму для последующей
компьютерной обработки, и цифроаналоговый преобра)
зователь (ЦАП), который преобразует цифровой выход)
ной сигнал компьютера в непрерывную форму. Прежде
чем рассматривать математические модели дискретных
регуляторов, построим математические модели АЦП и
ЦАП.
Будем считать, что все числа (результаты измерений и
сигналы управления в цифровой форме) вводятся в ком)
пьютер и выводятся из него с одним и тем же фиксирован)
ным промежутком времени Т.
Определение 10.1. Фиксированный промежуток време)
ни между последовательными измерениями и выводами
сигнала называется периодом квантования (синонимы:
период дискретизации, интервал квантования, шаг диск)
ретизации).
Математическая модель АЦП представлена на ри)
сунке 10.2 в виде квантователя (Sampler). Квантователь
можно рассматривать как ключ, который замыкается
каждые T секунд и превращает величину входного сиг)
нала r(t = kT), k = 0, 1, 2, ... в отсчет 11123 23 Отсчет (чис)
ловое значение), вообще говоря, не совпадает с измеряе)
мой величиной вследствие конечного количества двоич)
ных разрядов машинного регистра АЦП. Возникает
ошибка кантования уровня сигнала, или ошибка оциф)
ровки. Современные устройства имеют высокую раз)
рядность, поэтому с разумной степенью точности ошиб)
кой оцифровки сигнала можно пренебречь. На рисун)
ке 10.2 представлена математическая модель АЦП в виде
идеального квантователя: ключ замыкается на бесконеч)
но малый отрезок времени, и выполняется равенство
1 123 2 1 11123 23
Выходной сигнал идеального квантователя можно пред)
ставить в виде амплитудно)модулированной импульсной
последовательности:
106 А. Ю. ОЩЕПКОВ

1
21233 2 5 2 214 3323 414 34 (10.1)
1 21

Определение 10.2. Функции, имеющие вид амплитуд


номодулированных импульсных последовательностей,
т. е. определенные в дискретные моменты времени, раз
деленные фиксированным периодом, называются решет
чатыми функциями.

Математическую модель ЦАП, т. е. устройства, пре


образующего дискретный выходной сигнал компьютера
11 122 в непрерывный сигнал u(t), можно представить в
виде фиксатора (экстраполятора нулевого порядка —
Zeroorder holder). Экстраполятор воспринимает значе
ние 11 123 2 и сохраняет его на своем выходе в течение всего
периода квантования. Математическая модель ЦАП изоб
ражена на рисунке 10.3. Работу экстраполятора можно
описать формулой
1122 1 11 134 23 34 2 2 2 13 3 4245 (10.2)

Рис. 10.2
Математическая модель АЦП в виде идеального квантователя

Рис. 10.3
Математическая модель ЦАП в виде фиксатора
(экстраполятора нулевого порядка)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 107

10.2.
ЦИФРОВОЙ ПИ
РЕГУЛЯТОР
Рассмотрим в качестве примера алгоритм работы циф'
рового ПИ'регулятора в задаче стабилизации температу'
ры объекта (непрерывная модель (7.2), (7.12)). Запишем
уравнение для непрерывного регулятора с учетом обозна'
чений (7.1):

31 1 4 3 2 4 3 42 1 4 3 55667 3586 2 31 4 87 3123 2 89


51 51 51
1
3314 1 224314 2 2 4 4334535 (10.3)
61 2
Компьютер «не видит» производных и интегралов.
Цифровой способ обработки информации предусматрива'
ет использование только арифметических операций и по'
зволяет легко реализовывать алгебраические алгоритмы
управления и сводящиеся к ним рекуррентные процеду'
ры, которые представляют собой решения разностных
уравнений. Попытаемся записать уравнения (10.3) в раз'
ностной форме. Предположим, что период квантования T
много меньше собственного времени задачи t0. В этом слу'
чае производную в момент измерения kT можно предста'
вить в виде конечной разности*:
54 4112 2 233 3 3 4123 3
1 4 (10.4)
51 1 123 3
а величину интеграла записать по формуле прямоуголь'
ников в виде суммы:
12 1

4 425365 1 3 42 32 3 2 24 (10.5)
1 311

Введем обозначение: f (kT) º fk. Тогда уравнение дви'


жения с учетом (10.4) запишется в разностной форме:
41 11 2 41 1
1 41 3 1 4 51 1 1 4 62 2 (10.6)
7 53 53 53

* Самарский, А. А. Введение в численные методы. — 3'е изд. — СПб. :


Лань, 2005. — 288 с.
108 А. Ю. ОЩЕПКОВ

где управляющее воздействие uk имеет вид


1 11
41 2 15 36 1 5 3 47 61 1 5 3
62 4 (10.7)
8 32 9 32 223

Отметим, что алгоритм (10.7) является нерекуррент!


ным и требует вычисления больших сумм. Чтобы найти ре!
куррентный алгоритм дискретного ПИ!регулятора, запи!
шем выражение для управляющего воздействия в (k + 1)!й
момент времени:
1 11
41 21 3 15 46 1 2 3 57 61 21 1 5 3
62 1 5 332 61 4
8 32 9 32 2 33

Вычитая из последнего равенства равенство (10.7), по!


лучаем рекуррентный алгоритм

31 11 4 31 1 451 5 4 26 1 1 2 37 51 113 (10.8)


8 22 9
который легко программируется и широко применяется
в реальных цифровых системах управления. Отметим, что
при достижении цели управления (x = 0) из (10.8) следу!
ет, что
uk + 1 = uk при xk = 0, xk + 1 = 0, (10.9)

т. е. алгоритм дискретного ПИ!регулятора автоматически


выходит на компенсацию внешнего воздействия (с точно!
стью до ошибки квантования уровня сигнала), как и для
непрерывного случая, в соответствии с (7.18).
Подстановка выражения (10.7) в (10.6) при Fd = 0 дает
разностное уравнение для замкнутой системы:
xk + 1 = f (k; xk, xk – 1, ..., x0), (10.10)
где
1 11
4 2 3
1 7 3 58 1 1 5 58 1 7 3 6 64 6 7 5 3 3
9 9 1  62 4
 3 32   3 32 223

Системы типа (10.10) называются дискретными си


стемами. Таким образом, применение современных циф!
ровых методов управления приводит к необходимости рас!
смотрения свойств дискретных систем, в первую очередь
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 109

к исследованию их устойчивости. При управлении непре'


рывными объектами немаловажной также является зада'
ча построения дискретной модели, эквивалентной исход'
ной непрерывной. Обе эти задачи будут рассмотрены ниже.
Здесь в заключение заметим, что дискретными свой'
ствами в системе управления может обладать не только
устройство управления. Дискретным может быть испол'
нительное устройство, например шаговый двигатель.
Многие фирмы, специализирующиеся на выпуске средств
измерений физических величин, в настоящее время про'
изводят датчики с цифровым выходом, так что дополни'
тельного АЦП при применении таких датчиков не требу'
ется. Наконец, сам объект управления может иметь диск'
ретную природу. Например, финансовая система любого
российского предприятия имеет естественную квантовую
единицу — рубль. Можно привести интересный пример
из биологии: перемещение тела за счет изменения фор'
мы (локомоторные движения; так плавают, например,
микроорганизмы в воде). Математические модели этих пе'
ремещений можно описать в виде последовательности ло'
комоторных циклов*, так что уравнения движения будут
представлены в виде дифференциальных форм Пфаффа.
Периодом квантования в данном случае будет время про'
хождения цикла. Таким образом, понятие дискретной си'
стемы не только возникает в цифровых системах управ'
ления, но и является более общим понятием, т. е. мате'
матическими моделями многих динамических систем в
физике, биологии, экономике являются системы разно'
стных уравнений.
Казалось бы, с точки зрения квантовой механики, опи'
сывающей движение микроскопических частиц (электро'
нов, протонов, фотонов) на микроскопических расстоя'
ниях (менее 1–10 Ангстрем), на вопрос: «Существуют ли
дискретные системы?» следует ответить: «Существуют
только дискретные системы». Однако это поспешный и
не совсем правильный ответ. Дело в том, что частица,
* Кислухин, Н. М. Синтез локомоторного управления в задаче пла'
вания / Н. М. Кислухин, М. А. Марценюк // Вестник Пермского уни'
верситета. — 2005. — Вып. 4. — С. 52–61.
110 А. Ю. ОЩЕПКОВ

совершающая финитное движение, действительно имеет


дискретный спектр энергетических состояний (для неогра&
ниченного — инфинитного — движения спектр непрерыв&
ный). Однако математическая модель квантового объекта
описывается системой дифференциальных уравнений (ко&
нечной или бесконечной) для непрерывных параметров.
Роль этих параметров могут играть коэффициенты разло&
жения волновой функции в заданном базисе для случая
чистых состояний или компоненты матрицы плотности
для смешанных состояний*. Управление квантовыми систе&
мами может осуществляться непрерывно или импульсно**.
Поэтому системы управления квантовыми объектами,
как и классическими, могут описываться как непрерыв&
ными, так и дискретными математическими моделями.

10.3.
ДИСКРЕТНЫЕ МОДЕЛИ
НЕПРЕРЫВНЫХ СИСТЕМ
Рассмотрим более подробно задачу построения диск!
ретных моделей непрерывных систем, т. е. алгоритмы
преобразования моделей систем, заданных в виде диффе&
ренциальных уравнений, к разностным уравнениям.
Пусть математическая модель непрерывной стацио&
нарной системы в пространстве состояний имеет вид

1 2132 1 12132 2 24 1323 5 132 1 32132 2 44 1324


(10.11)
13
Требуется получить эквивалентную систему разно&
стных уравнений
112 2 23 3 13123 2 24 1234 5 123 3 3 13123 2 414 1234
k = 0, 1, ... (10.12)
Эквивалентность систем понимается в том смысле, что
при соответствующих начальных условиях их реакции
на одно и то же входное воздействие совпадают. Более

* Блум, К. Теория матрицы плотности и ее приложения. — М. : Мир,


1983. — 248 с.
** Бутковский, А. Г. Управление квантово&механическими процесса&
ми / А. Г. Бутковский, Ю. И. Самойленко. — М. : Наука, 1984. — 256 с.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 111

подробно это означает, что при 2 112 1 2 331 45 где tk = kT, вы%
полнено 2 112 1 2 331 4 — решения уравнений (10.11) и (10.12)
совпадают при tk = kT.
Рассмотрим задачу вычисления матриц P, Q, C¢, D¢
в (10.12) по заданным матрицам A, B, C, D в (10.11), исхо%
дя из сформулированного выше требования эквивалент%
ности указанных систем по отношению к входному про%
цессу u(t).
Решение системы (10.11), соответствующее начально%
му условию 1221 3 1 11 4 выражается формулой Коши:
1
2213 3 3 121 1 11 3 21 4 5 3 121 123 2422352 (10.13)
11

(черта в обозначении векторов здесь и ниже временно опу%


щена). В показателе экспоненты в (10.13) стоит матрица,
выражение eAt называется матричной экспонентой. Исполь%
зуя формулу (10.13), проинтегрируем уравнение (10.11) на
интервале [tk, tk + 1], полагая на нем u(t) = u(tk) при x0 = x(tk).
Получим
2131
4221 31 3 6 51 22131 4 21 3 4221 3 3 8 51 22131 453 2625375 6
21

6 513 4221 3 3 18
21
2131
2
51 22131 453 75 7 26221 34

Для вычисления интеграла введем новую переменную


2111 3
q º tk + 1 – t. Тогда t = tk + 1 – q и 5 4 122111 233 53 4 5 413 535 По%
21 4
лагая матрицу A невырожденной (det A ¹ 0), получим, что
1
42 4 2 151 3 121 3411 2 23 45 где In — единичная матрица n ´ n.
Следовательно,
x(tk + 1) = eATx(tk) + A–1(eAT – In)Bu(tk), det A ¹ 0. (10.14)
Согласно уравнению выхода в (10.11) y(tk) = Cx(tk) +
+ Du(tk). Сопоставим найденным для моментов tk значе%
ниям непрерывного процесса значения переменных диск%
ретной модели: x[k] º x(tk), u[k] º u(tk), y[k] º y(tk). Сравни%
вая уравнение (10.12) с полученным выражением (10.14),
находим, что матрицы P, Q, C¢, D¢ определяются равен%
ствами
P = eAT, Q = A–1(P – In)B, C¢ = C, D¢ = D. (10.15)
112 А. Ю. ОЩЕПКОВ

Полученные формулы перехода от непрерывных си


стем к их дискретным аналогам показывают, что необхо
димо располагать достаточно эффективными алгоритма
ми вычисления матричной экспоненты eAt. Если матрица
A имеет диагональный вид (в базисе собственных векто
ров), то матричная экспонента записывается точно в соот
ветствии с правилом:
2 11 3 444 3 3 23 112 3 444 3 3
43 1 444 3 5 4 5
3 3 12 2 444 3 5
164
2
5 5 312 6 4 4 (10.16)
4 444 444 444 444 5 4 444 444 444 444 5
43 3 444 11 58 4 5
7 74 3 3 444 3 112 85

В других случаях нужно использовать приближенные


методы, которые основаны на различных аппроксимаци
ях бесконечного ряда для разложения экспоненты вы
ражениями, содержащими конечное число слагаемых.
Наиболее очевидной является аппроксимация Тейлора
порядка k, согласно которой ряд Тейлора приближенно
заменяется конечной суммой:
1
31141 31141 3 1 14 2
411 3 23 4 11 4 4 555 4 5 23 4 6 5 (10.17)
1 16 2 22
26
Например, при k = 1 получаем линейное приближение
eAT » In + At, (10.18)
которое будем называть аппроксимацией Эйлера.
Аппроксимация (10.18) не является наилучшей. Во
многих отношениях более предпочтительна общая аппрок
симация Паде. При такой аппроксимации экспонента еx
212 1 12
представляется рациональной функцией 3 1 3 с чис
412 112
лителем Fmn степени m и знаменателем Gmn степени n, опре
деляемыми формулами
1 121 3 34
112 2 24 4 3 5 25 21 5 555
21 5 2436 21 5 2421 5 2 3 3416
121 3 345551 6 3
555 5 21 7
21 5 2421 5 2 3 3455522 5 341 6
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 113

2 222 3 34
112 224 4 3 3 25 21 5 555
21 5 2436 21 5 2421 5 2 3 3416
222 3 345551 6 3
555 5 23342 22 5 (10.19)
21 5 2421 5 2 3 3455521 5 342 6
Соответственно для матричного аргумента x = At за&
пишем
111 5 234 2113334
21 21134
(10.20)
где Fmn(At), Gmn(At) — матричные многочлены вида (10.19).
В дальнейшем (10.20) будем называть аппроксимацией
Паде (m, n).
Приведем некоторые частные случаи (10.20). Прежде
всего отметим, что аппроксимация Тейлора (10.17) явля&
ется частным случаем (10.20) при n = 0. Следовательно,
формула метода Эйлера (10.18) совпадает с аппроксима&
цией Паде (1,0). Аппроксимация Паде (0,1) имеет вид
eAT » (In – At)–1 (10.21)
и в дальнейшем будет называться неявным методом Эй
лера.
Аппроксимация Паде (1,1) соответствует методу Та
стина и определяется формулой
eAT » (In + At/2) (In – At/2)–1, (10.22)
формула Паде (2,2) дает выражение
eAT » (12In + 6At + (At)2) (12In – 6At + (At)2)–1. (10.23)
Одним из преимуществ аппроксимаций Паде являет&
ся их более высокая точность, чем соответствующих (при
k = max(m, n)) аппроксимаций Тейлора. Ошибка аппрок&
симации (10.17) имеет порядок малости O(tk), а ошибка
«диагональных» аппроксимаций (10.20) (m, n) при m = n —
порядок малости O(t2m + 1). Другим достоинством форму&
лы Паде при n ¹ 0 является сохранение свойства устойчи&
вости непрерывной системы при переходе к дискретной
модели. Недостатком неявных методов является необ&
ходимость обращения матрицы Gmn(At) и связанная с
этим проблема ее вырожденности. Заметим, что при
t ® 0 Gmn(At) ® In, следовательно, выбор достаточно ма&
лого t гарантирует detGmn(At) ¹ 0.
114 А. Ю. ОЩЕПКОВ

10.4.
ПЕРЕДАТОЧНЫЕ ФУНКЦИИ
ДИСКРЕТНЫХ СИСТЕМ
Математические модели дискретных систем можно
представить в виде передаточных функций, аналогично
непрерывным системам. Для этого используется не пре(
образование Лапласа, а z(преобразование. Рассмотрим его.
Поскольку выходной сигнал идеального квантовате(
ля r*(t) представляет собой последовательность импуль(
сов с амплитудами r*(kT), то его можно описать выраже(
нием 1
2 1 334 2 5 2 314 4333 4 14 45 (10.24)
1 22

где предполагается, что сигнал r(t) существует для t > 0.


Преобразовав (10.24) по Лапласу, получим
1
435 1 4656 3 4 5 413 57 2123 7
1 32

Это выражение представляет собой бесконечный ряд


по степеням члена esT. Введем переменную
z = esT, (10.25)
которая осуществляет конформное отображение с s(плос(
кости на z(плоскость. Тогда мы можем определить новое
преобразование, называемое z(преобразованием:
1
2 33 4456 3 2 33 1 4456 3 4 3 415 5621 7 (10.26)
1 32

В качестве примера найдем z(преобразование единич(


ной ступенчатой функции 1(t), описываемой выражени(
ем (4.11): 1 1
2 234356 3 4 3414 5521 3 4 521 7 (10.27)
1 31 1 31

так как 1(kT) = 1 для всех k ³ 0. Этот ряд можно предста(


вить в замкнутой форме, используя выражение для сум(
мы членов геометрический прогрессии:

1213 2 1 2 1 4 (10.28)
1 1 1 11 1 1 1
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 115

В общем случае мы будем определять zпреобразова


ние функции f (t) как
1
2 2 33445 3 5 364 3 4 3317 4621 6 (10.29)
1 31

Пример. Преобразование экспоненты.


Получим z-преобразование функции f (t) = e–at для t ³ 0.
Имеем
1 1
5 26 2 12 3 3 7 485 3 4 6 2134 823 3 4 48614 5 23 6 (10.30)
3 31 3 31

Этот ряд можно представить в форме, аналогичной


(10.28):
4 233 2 1 2 3 4
(10.31)
1 1 23512 3 11 3 1 5 112
Можно показать, что
Z{e–atf (t)} = F(eaTz). (10.32)
Поскольку непрерывной функции времени f (t) соот-
ветствует преобразование Лапласа L{f (t)} = F(s) и z-преоб-
разование Z{f (t)} = F(z), то мы можем находить z-преоб-
разования от образов функций времени в s-пространстве.
Например, поскольку преобразование Лапласа экспонен-
ты e–at имеет вид 324 112 3 2 1 4 то для передаточной функ-
531
ции 1 223 1 1 мы можем найти z-преобразование, ис-
223
пользуя (10.31):
4 132 2 5 34 1624 2 3 5
3 1 7 112 (10.33)
Подвергая z-преобразованию составные части уравне-
ния выхода непрерывной системы Y(s) = G(s)R(s), получим
уравнение выхода для дискретной системы:
Y(z) = G(z)R(z). (10.34)
Таким образом, математиче-
скую модель дискретной системы
управления можно представить в Рис. 10.4
Структурная схема
виде структурной схемы с переда- дискретной системы
точными функциями (рис. 10.4). управления
116 А. Ю. ОЩЕПКОВ

Для дискретной системы первого порядка переходная ха


рактеристика опишется следующей формулой в zпро
странстве:
4 233 2 3 3 3 2 31 4 (10.35)
3 1 5 112 3 1 5 23 1 5 112 323 1 53

10.5.
УСТОЙЧИВОСТЬ
ДИСКРЕТНЫХ СИСТЕМ
Приведем основные сведения об устойчивости диск
ретных систем. Рассмотрим математическую модель
дискретной системы (10.10) в простейшей форме:
xk + 1 = f (k, xk), xk Î Rn, f (k, 0) º 0. (10.36)
Решение уравнения (10.36) с начальным условием
211 1 21 обозначим через x(k, k0, x0).
Определение 10.3. Решение xk º 0 уравнения (10.36)
называется равномерно устойчивым, если для всякого
e > 0 найдется d(e) > 0 такое, что из неравенства 2 211 2 1 2334
следует | xk | £ e при всех k ³ k0. Решение xk º 0 называется
равномерно асимптотически устойчивым, если оно рав
номерно устойчиво и для любого g > 0 найдутся целое чис
ло N(g) > 0 и число Н1 > 0 такие, что | x(k, k0, x0) | £ g при
k £ k0 + N(g) и | x0 | £ H1.
Остальные определения устойчивости для разностно
го уравнения (10.36) аналогичны соответствующим оп
ределениям для дифференциального уравнения (8.1).
Для исследования устойчивости решения xk º 0 уравне
ния (10.36) можно также использовать второй метод Ля
пунова. Приведем без доказательства некоторые утверж
дения.
Теорема 10.1. Для равномерной устойчивости ре
шения xk º 0 уравнения (10.36) необходимо и до
статочно, чтобы существовала функция V(k, x),
удовлетворяющая условиям
w1(| x |) £ V(k, x) £ w2(| x |),
V(k + 1, f (k, x)) – V(k, x) £ 0.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 117

Теорема 10.2. Пусть существует функция V(k, x),


такая что
w1(| x |) £ V(k, x) £ w2(| x |),
V(k + 1, f (k, xk)) – V(k, xk) £ –w3(| xk |).
Тогда решение xk º 0 равномерно асимптотически
устойчиво.
На разностные уравнения вида (10.36) естественным
образом переносятся и другие теоремы устойчивости для
непрерывных систем.
Рассмотрим случай линейного стационарного разно
стного уравнения:
32 12 2 432 3 31 2 31 3 3 3 51 . (10.37)
Легко вывести условие устойчивости уравнения (10.37)
для системы первого порядка xk +1 = pxk. В этом случае
справедливо равенство
xk + 1 = pk + 1x0. (10.38)
Очевидно, что «система» (10.38) будет устойчивой,
если модуль числа p меньше единицы: | p | < 1. С помощью
выражений (10.15), (10.16) легко понять, что это условие
должно выполняться в случае устойчивых систем для собC
ственных чисел li(Р) (i = 1, 2, ..., n) матрицы Р. ДействиC
тельно, справедлива следующая теорема:
Теорема 10.3. Если |li(P)| < 1 для всех i, то реше
ние xk º 0 уравнения (10.36) равномерно асимпто
тически устойчиво. Если же |lk(P)| £ 1 и все соб
ственные значения lk , для которых |lk(P)| = 1, не
вырождены, то решение xk º 0 равномерно устой
чиво. Во всех других случаях решение xk º 0 неустой
чиво.
В мире не происходит ничего,
в чем не был бы виден смысл
какогонибудь максимума или минимума.
Л. Эйлер

Л Е К Ц И Я 11

РАЗОМКНУТЫЕ СИСТЕМЫ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

11.1.
ПОСТАНОВКА И КЛАССИФИКАЦИЯ ЗАДАЧ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Рассмотрим разомкнутую систему управления, структур


ная схема которой изображена на рисунке 11.1. Управле
ние в таких системах определяется заранее на основе тре
бования критерия качества на определенном промежутке
времени и подается на вход объекта в соответствии с рас
считанными значениями (Пуправление). Выходной век
тор не отслеживается. Разумеется, такая система управ
ления может применяться, если есть уверенность в адек
ватности математической модели, применявшейся при
расчетах, и параметры объекта не изменяются на указан
ном промежутке времени или изменяются так, как предпо
лагалось в модели. Несмотря на все недостатки разомкну
тых систем, упоминавшиеся выше, такие системы, называ
емые системами оптимального управления, достаточно
широко применяются на практике, особенно в тех случа
ях, когда выходные переменные трудно измерить, напри
мер при управлении космическими аппаратами, ядерны
ми реакторами и т. д.
Если выходная величина доступна измерению, то со
временные алгоритмы оптимального управления позволя
ют построить замкнутую систему управления. Ниже мы

Рис. 11.1
Структурная схема
разомкнутой системы
оптимального
управления
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 119

рассмотрим несколько примеров такого синтеза управле&


ния (С&управление). Здесь пока сосредоточим внимание на
разомкнутых системах.
Что означает понятие оптимальности в теории управ&
ления? Слово «оптимальный» происходит от латинского
optimus, что значит — «наилучший», «совершенный». Про&
цитируем фразу, с которой начинается замечательный учеб&
ник по оптимальному управлению для студентов математи&
ческих специальностей*: «Людям свойственно стремление
к лучшему, и если им приходится выбирать из нескольких
возможностей, то желание найти среди них оптимальную
представляется вполне естественным». Отсюда следует, что
понятие оптимального управления является антропоцен&
тристским понятием, поскольку требования к движению
системы выдвигает человек — разработчик системы управ&
ления. Этим понятие оптимальности в теории управления
отличается от понятия оптимальности, с которым встре&
чаются исследователи естественных физических систем.
При изучении неживой природы установлено, что весь
мир движется по оптимальным траекториям (геодезиче&
ским линиям). В физике требования к этим траекториям
формулируются в виде вариационных принципов, напри&
мер в виде принципа наименьшего действия в классиче&
ской механике. Решение задачи минимизации функцио&
нала действия приводит к уравнениям движения в форме
Лагранжа или Гамильтона в зависимости от выбора пере&
менных состояния. Однако вариационные принципы для
естественных физических систем придуманы не челове&
ком, а кем&то другим.
В физике существуют законы сохранения величин,
являющихся интегралами уравнений движения, причем
каждый закон сохранения следует из инвариантности этих
уравнений по отношению к какому&либо преобразованию
(симметрии системы)**. Система управления, как разом&

* Алексеев, В. М. Оптимальное управление / В. М. Алексеев, В. М. Ти&


хомиров, С. В. Фомин. — М. : Наука, 1979. — 432 с.
** Это утверждение сформулировано в виде теоремы и доказано жен&
щиной&математиком Эмми Нётер. Кратко теорема формулируется так:
«Всякая симметрия в мире порождает закон сохранения».
120 А. Ю. ОЩЕПКОВ

кнутая, так и замкнутая, является открытой системой и


требует постоянного энергетического обмена с окружаю#
щей средой. Здесь можно говорить не о сохранении ка#
кой#то величины, а о достижении ею какого#либо опре#
деленного значения при помощи заданного управления
[6]. Если энергетические ресурсы ограничены, то это при#
ходится учитывать при конструировании системы уп#
равления.
Ранее (см. Лекции 6 и 7) мы уже встречались с опти#
мизацией систем управления с обратной связью. Требова#
ния оптимальности там накладывались в виде требований
минимизации ошибки управления — какой#то из оценок
качества, перечисленных в таблице 6.3. Точнее сказать,
речь шла даже не о минимизации ошибки, а о попадании
выходной величины в заданный интервал, т. е. об опреде#
ленной точности работы автоматического регулятора. Оп#
тимизация осуществлялась преимущественно численны#
ми методами путем подбора коэффициентов, параметри#
зующих функционал. Сейчас рассмотрим общий случай,
когда критерий качества записывается в виде функцио#
нала, содержащего как переменные состояния, описыва#
ющие траекторию движения, так и управляющие воздей#
ствия, и методы решения этих задач. Отметим, что тер#
мин «качество» теперь не всегда означает «точность»,
а является более общим понятием. Требования к точно#
сти управления зачастую «спрятаны», и достаточно глу#
боко, в форме записи критерия качества.
Составим математические модели оптимальных систем
управления без учета ограничений на управляющие воз
действия. Математическую модель движения объекта
представим в виде системы обыкновенных дифференци#
альных уравнений, как в (8.1). Кратко эту систему запи#
шем в виде [1]
31 243 1 5244 32434 634 3 2 71 4 6 2 72 5
3241 3 1 31 6 (11.1)
В зависимости от способа задания минимизируемого
функционала принято различать задачи Лагранжа, Май#
ера и Больца.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 121

В задаче Лагранжа критерий качества J0 имеет вид


1
51 1 3 61 243 72443 84943 7 2
2 3 8 2
3 3 (11.2)
41
где F0 — заданная скалярная функция; Т — момент окон,
чания движения. Момент Т может либо быть заранее за,
дан, либо определяться конкретной траекторией движе,
ния. В последнем случае Т можно рассматривать как до,
полнительный параметр оптимизации.
В задаче Майера критерий качества J зависит от траек,
тории системы только в момент Т окончания движения:
J0 = j0(T, x(T)). (11.3)
Наконец, в задаче Больца требуется минимизировать
функционал J смешанного вида:
1
31 1 4 41 223 52243 6472 2 31 213 521 445 (11.4)
21

Эти задачи имеют различные алгоритмы решений. Сто,


ит отметить, что приведенное деление задач управления
по виду минимизируемого функционала весьма условно.
Так, задача Больца (а тем самым, конечно, и задача Лаг,
ранжа) легко сводится к задаче Майера. Для этого введем
еще одну скалярную переменную xn + 1(t), определяемую
соотношением
21 1 11 334 2 42 335 23345 545 3 3 32 5 21 11 332 4 2 26 (11.5)
1
Тогда 42 12 31 4 2 3 51 335 4334564736 Поэтому функционал (11.4)
31
можно записать следующим образом в форме (11.3):
J0 = xn + 1(T) + j0(T, x(T)). (11.6)
Таким образом, для объекта управления (11.1), (11.5)
получена задача Майера с критерием качества (11.6), эк,
вивалентная исходной задаче (11.1), (11.4). Однако зада,
ча Майера будет решаться не для того объекта, для кото,
рого решалась задача Больца, а для другого.
В некоторых специфических случаях задачи имеют спе,
циальные названия. Если в функционале (11.2) функция
122 А. Ю. ОЩЕПКОВ

F0(t, x, u) = 1 (J0 = T, t0 = 0), то задача, состоящая в мини


мизации времени управления, называется задачей быст
родействия: T ® min.
В ряде случаев целью управления является стабили
зация заданного программного движения, т. е. удержа
ние истинной траектории движения в некоторой окрест
ности желаемой траектории. В этом случае функции F0 и
j0 в функционале (11.4) должны характеризовать откло
нение реальной траектории от программной.
Довольно часто в задаче Больца используют квадра
тичные функционалы, имеющие вид
31 1 2 451 6 7 52 7 451 63 4
1
4 5 52 4526 7 53 526 7 45263 4 26526 7 54 526 7 652636728 (11.7)
21

где Ni (i = 1, 2, 3) — неотрицательно определенные квадрат


ные матрицы (áx | Ni | xñ ³ 0) соответствующих размерностей.
Последнее слагаемое в (11.7), характеризующее затраты
на управление, возникает весьма естественным образом в
ряде задач.
11.2.
ВАРИАЦИОННЫЙ МЕТОД
ДЛЯ СКАЛЯРНОГО СЛУЧАЯ
Для того чтобы понять современную формулировку
условий оптимальности и алгоритмы синтеза оптималь
ного управления, рассмотрим решение классической ва
риационной задачи для скалярного случая в том виде, в
котором оно приведено в классической книге Р. Беллма
на (см. сноску в п. 1.2).
Единственную переменную состояния обозначим, как
обычно, буквой x, а скалярное управляющее воздействие —
буквой y. Уравнение (11.1) запишется в виде
11 1 2213 343 1214 1 11 5 (11.8)
Критерий качества запишем в виде (11.2) (задача Лаг
ранжа) 1
2 233 44 1 3 5 533 4667 2 789
(11.9)
1
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 123

Итак, нужно найти такое управление 11 1 11 122 — опти#


мальное управление, которое бы привело к движению
объекта по оптимальной траектории 11 1223 так что
1 1212 31 3 1 4567 (11.10)
Отметим, что в математике вместо понятий миниму#
ма функционала (min) и максимума (max) используют#
ся более строгие понятия точной нижней грани числа и
точной верхней грани — inf и sup соответственно. Мы
будем использовать min и max как более физически по#
нятные.
Рассмотрим малые отклонения решения задачи (11.8),
(11.9) от оптимального решения:
1 1 11 2 341223 3 1 31 2 351223 3 6 43 (11.11)
где x(t), h(t) — произвольные функции времени, удовлет#
воряющие единственному условию
x(0) = 0 (11.12)
в силу заданности траектории в начальный момент вре#
мени (11.8).
Подставим (11.11) в критерий качества (11.9) и раз#
ложим функцию g в ряд Тейлора в линейном по e при#
ближении:
1 1
4 233 24 1 6 5 531 2 343 21 2 35667 14 2313 21 4 2 3 6 54531 2 5521 6677 (11.13)
1 1
Здесь нижними индексами обозначены частные про#
изводные по соответствующим переменным.
Из (11.8) аналогично получим
221 1 232 4 31 21 2 11 3 1 213321 1 5311 34 (11.14)
Для оптимальной траектории 112 1 2112 2 32 3 и 1 122 33 1
1 1 1212 31 32 поэтому из (11.13), (11.14) получим
12 2 1321 3 4311 1 (11.15)
1

5 21431 2 3421 356 4 14 (11.16)


1
124 А. Ю. ОЩЕПКОВ

Произвольную функцию h можно выразить с помо


щью (11.15) и подставить в (11.16):

32 4 3421
1
1 2
8
3521 5 431
6 531 9 67 7 12

(11.17)
1

Проинтегрируем слагаемое, содержащее 11 1 по частям:

12
1 1
321 1
2 321 3
621 4 321 45 5 1 621 6 1 4 7 8 452
1 1 1
45 9 621

Значение функции в правой части равенства на ниж


нем пределе равно нулю в силу условия (11.12). Потребу
ем выполнения дополнительного условия:
431
1 12 (11.18)
531
112

тогда выражение (11.17) примет вид


1
1 6 3 421 4 5 531 6 4 2 727367 8 14
 9 431 5 67 521 5
 21
21

1 
Поскольку функция x произвольна, выражение в квад
ратных скобках под знаком интеграла должно быть тожде
ственно равно нулю. Это условие можно представить в виде

5 2 311 3 4 321 411 1 311 421 1


(11.19)
56 57 411 68 411

В вариационном исчислении уравнение (11.19) назы


вается уравнением Эйлера (не путать с уравнениями вра
щательного движения в собственной системе коорди
нат (8.10), также впервые записанными Л. Эйлером!). Зна
ки тильды над переменными в (11.19) можно опустить.
В результате доказано утверждение о том, что реше
ние задачи Лагранжа (11.8), (11.9) сводится к решению
системы дифференциальных уравнений:
11 1 2112 332 (11.20)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 125

5 2 31 3 32 41 1 31 42
56 57 41 64 41
1 (11.21)
8
41
5213 1 51 4 1 15 (11.22)
61 2 13

Математически система уравнений (11.20)–(11.22)


формулирует необходимые условия оптимальности в за&
даче Лагранжа для скалярной переменной. Отметим, что
первое граничное условие в (11.22) ставится в начале дви&
жения, а второе условие — в конце движения. Такие за&
дачи называются двухточечными.

11.3.
ГАМИЛЬТОНОВА ФОРМУЛИРОВКА
УСЛОВИЯ ОПТИМАЛЬНОСТИ

Чтобы записать необходимые условия оптимальности


для системы n&го порядка, вспомним гамильтонову фор&
мулировку уравнений движения в классической механи&
ке. Известно, что полную энергию механической систе&
мы можно выразить через обобщенные координаты qk и
импульсы pk (k = 1, 2, ..., n), которые называются кано&
нически сопряженными переменными. Полную энергию
1 1 1 1 223 3 в этом случае называют функцией Гамильто&
на. Уравнения движения принимают вид уравнений Га&
мильтона:

21 2 11 1 31 2 3 11 2 (11.23)
13 12
Если переменные состояния 1 в математической мо&
дели объекта 11 122 1 3 123 112234 1222 считать «координатами»,
то можно ввести вспомогательные сопряженные перемен&
ные — «импульсы»:
2 11 324 3
4 1 324 5
2
1324 6 4 5
4 1 5
4 1 324 5
7 1 8
126 А. Ю. ОЩЕПКОВ

и записать функцию
3 1 3 243 52443 6 2443 22444 1
1
1 7 2 2 244 3 72 243 52443 6 2444 45 2244 5 7 243 52443 6 2444 6 6 (11.24)
2 11

Тогда уравнение (11.1) примет вид 21 2 11 1 а для век"


13
тора 1 можно записать уравнение

21 3 4 12 5 421 1 (11.25)
11
Для уравнения (11.25) нужно конкретизировать гра"
ничные условия.
Рассмотрим задачу Майера:
31 243 1 5244 32434634 3 2 71 4 6 2 72 4 3241 3 1 31 5
J(u) = j(x(T)) ® min. (11.26)
Оказывается, необходимые условия оптимальности
для задачи (11.26) могут быть сформулированы в виде сле"
дующей теоремы [1]:
Теорема 11.1. Пусть u0(t) — оптимальное Пуп
равление в задаче (11.26), а x 0(t) — соответ
ствующая ему траектория 11 1 223 1 3224 11 223441 22334
x0(t0) = x0. Тогда
14 2 41 234 21 233411 233432333 4 14
11 121 223333
1

31 5 3 5 55 (11.27)
Здесь y(t) Î Rn есть решение задачи Коши
11 223 2 331 224 11 223441 2234 122334
125 3 2 341 211 25 335 (11.28)

Верхняя черта в обозначении векторов здесь и далее


опущена. Данная теорема утверждает, что решение за"
дачи Майера сводится к решению системы дифференци"
альных уравнений (11.1), (11.28) при условии (11.27), оз"
начающем стационарность (по управлению) гамильтони"
ана Н.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 127

11.4.
ПОСТРОЕНИЕ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Применим теорему 11.1 к решению задачи Больца как
наиболее общей из вышеперечисленных.
Рассмотрим задачу
11 223 1 3224 12234434 21 2 2 2 54 1221 3 1 11 4 (11.29)
1
3 243 1 5 5 224 622344223372 2 32621 33 4 5678 (11.30)
21

Здесь t0 и T — заданные моменты времени; x0 Î Rn —


заданный вектор начального положения системы. Правый
конец траектории x(Т) свободен (задача со свободным пра=
вым концом). Необходимые условия оптимальности в за=
даче (11.29), (11.30) можно получить с помощью теоре=
мы 11.1, воспользовавшись описанным в п. 11.1 способом
сведения задачи Больца к задаче Майера. В соответствии
с этим способом задача (11.29), (11.30) эквивалентна за=
даче

211 11 334 2 4 335 23345533445 21 11 332 4 2 25


21 334 2 6335 23345533445 2332 4 2 22 5
21 11 37 4 1 33237 44 4 6789 (11.31)

Необходимые условия оптимальности в задаче (11.31)


сформулированы в теореме 11.1. В рассматриваемом слу=
чае вследствие соотношений (11.24), (11.31) функция Н
имеет вид
H = áy(t) | f (t, x, u)ñ + yn + 1(t) × F(t, x, u). (11.32)
Уравнение для вектора y(t) Î Rn сохраняет прежний
вид (11.25), а скалярная функция yn + 1(t), как следует
из (11.28), (11.31) и (11.32), удовлетворяет соотношениям
21 1 11 223 3 453 4 541 11 3 56 2 1 11 25 3 3 417
Значит, yn + 1(t) º –1. Поэтому
H(t, x, u, y) = – F(t, x, u) + áy(t) | f (t, x, u)ñ.
128 А. Ю. ОЩЕПКОВ

Таким образом, совокупность необходимых условий


оптимальности в задаче (11.29), (11.30), которым удовлет"
воряют оптимальная траектория x0(t), выражается соот"
ношениями

11 1 223 1 3224 11 223441 22334 21 2 2 2 54 11 221 3 1 11 , (11.33)

11 223 2 3 4 31 224 11 223441 2233 5 1223 5 6 51 224 11 223441 22334


126 3 2 371 211 26 334 (11.34)

áfu (t, x0(t), u0(t)) | y(t)ñ – Fu (t, x0(t), u0(t)) = 0. (11.35)

Упражнение 11.1.
Покажите, что в скалярном случае для задачи Лаг"
ранжа условия (11.33)–(11.35) эквивалентны систе"
ме (11.20)–(11.22).

Если решение задачи оптимального управления (11.29),


(11.30) существует и единственно, то оно полностью опре"
деляется соотношениями (11.33), (11.34).
Построение оптимального управления состоит из сле"
дующих шагов:
1. Решают уравнение (11.35) (не дифференциальное)
относительно u0 и определяют функцию u0 = u0(t, y, x).
2. Подставляют найденное выражение u0 в уравне"
ния (11.33), (11.34). В результате получается двухто"
чечная краевая задача относительно неизвестных x0(t)
и y(t).
3. Решают полученную краевую задачу и определяют
функции времени x0(t) и y(t). Подставляя найденные
функции x0(t), y(t) в формулу, определяющую оптималь"
ное управление, получают программное оптимальное уп
равление u0(t).
Описанная выше последовательность действий при
построении оптимального управления (алгоритм) изобра"
жена на рисунке 11.2.
Реализация изложенного метода в конкретных слу"
чаях сопряжена с многочисленными трудностями, связан"
ными, в частности, с необходимостью решать краевую
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 129

Рис. 11.2
Построение оптимального управления

задачу (11.33), (11.34), большой размерностью систем, их


нелинейностью и т. д.
Вместе с тем в некоторых важных случаях описанный
метод может быть эффективно осуществлен. Один из та9
ких случаев — управление линейной системой с квадра9
тичным функционалом, который будет рассмотрен в сле9
дующей лекции.
Взирая на высоких людей
и на высокие предметы,
придерживай картуз свой за козырек.
К. Прутков

Л Е К Ц И Я 12

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
ЛИНЕЙНЫМИ СИСТЕМАМИ
12.1.
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
ЛИНЕЙНЫМИ СИСТЕМАМИ
С КВАДРАТИЧНЫМ ФУНКЦИОНАЛОМ
Линейноквадратичная задача, ниже для краткости на
зываемая ЛКзадачей, состоит в минимизации квадратич
ного функционала типа (11.7):
3 546 1 2 451 6 7 12 7 451 63 4
1
4 5 52 4526 7 13 526 7 45263 4 25526 7 14 526 7 55263662 (12.1)
21

на траекториях линейной системы


31 243 1 12433243 2 224352434 4 3 541 46 64 3 3 71 4 5 3 72 7
3241 3 1 31 8 (12.2)
Моменты времени t0 и T, а также начальное положе
ние x0 заданы. Предполагается, что матрицы A(t), B(t),
N2(t), N3(t) соответствующих размерностей имеют кусоч
нонепрерывные элементы, причем
N1(t) ³ 0, N2(t) ³ 0, N3(t) > 0. (12.3)
Напомним, что матрица N ³ 0, если áx | N | xñ ³ 0 для
любого вектора x Î Rn, и N > 0, если áx | N | xñ = 0, для лю
бого x Î Rn, x ¹ 0.
Для определения оптимального управления в ЛКза
даче (12.1), (12.2) используем установленные в п. 11.3 не
обходимые условия оптимальности (11.33–11.35). В рас
сматриваемом случае они заданы уравнениями (12.2) и
соотношениями
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 131

1526 35276 45276 15277 2 343527 8 11 527 8 35275 3 44527 8 12 527 8 45275 6
6 41527 8 925273527 6 3527452756
3 71 2 12 527 2 32 1 5271527 6 11 52735276 2 8 2 8 56
1 3
73
1557 2 311435576
71 2 3 1 5271527 3 112 5274527 2 3
(12.4)
74
Знак тильды над матрицей означает операцию транс,
понирования.
Построение оптимального управления. Для определе,
ния оптимального управления с помощью необходимых
условий (12.2), (12.4) применим описанный в п. 11.3 ме,
тод, алгоритм которого представлен на рисунке 11.2.
1. Из уравнения (12.4) следует, что оптимальное управ,
ление u0 определяется формулой

12 2 1 1311 4252
1 42534256 (12.5)
7
2. Подставим выражение (12.5) в (12.2), (12.4). В ре,
зультате получится краевая задача для оптимальной траек,
тории x0(t) и вектора сопряженных переменных y(t):

11 1 627 2 162711 627 3 2 22 62746273


4
11 627 2 113
41 627 2 11 2 6274627 3 43 6271 6273
4 1
463 7 2 1432 11 63 73
2 627 2 2627312 62722 6278 (12.6)
2 5

3. Для решения краевой задачи (12.6) будем искать


функцию y(t) в виде линейной зависимости от x0(t):
y(t) = –2P(t)x0(t), (12.7)
где симметричная матрица Р(t) подлежит определению.
Продифференцируем обе части равенства (12.7) по t:
11 213 2 34511 21321 213 4 1213 211 21367
132 А. Ю. ОЩЕПКОВ

Заменим здесь производные 11 и 11 1 в соответствии с


равенствами (12.6), а затем подставим вместо y(t) выра
жение (12.7). Получим

111 4152415 3 12 4152 415 4


1 2

4 116341522 415 3 3415141522 415 3 3 341543 415241578


2
1
1 5161516 1 15162516 2 15163 5161516 1 4 51672 516 3 38
412 516 1 2 1 2 3

P(T)x0(T) = N1x0(T).

Последние равенства будут выполнены для любого век


тора x0(t), если
1 3141314 1 13142 314 2 1314 3 3143314 1 4 314 3 56 (12.8)
12 314 1 2 1 2
P(T) = N1.
Уравнение (12.8), служащее для определения матри
цы P(t), называется матричным уравнением Риккати. Оно
играет важную роль в теории ЛКзадач управления.
После того как матрица P(t) определена, оптимальное
управление в силу равенств (12.5) и (12.7) выражается
формулой
1 42534253 4256
12 425 2 113112 (12.9)
2

Кроме того, минимальное значение критерия каче


ства (12.1), соответствующее управлению (12.9), опреде
ляется соотношением
min J(u) = J(u0) = áx0 | P(t) | x0ñ. (12.10)
Таким образом, построение матрицы P(t) позволяет
полностью решить задачу управления (12.1), (12.2).
Отметим, что управление (12.9) получено в виде Суп
равления, т. е. в виде функции времени и фазовых коор
динат. В самом деле, обозначая реализованное значение
оптимальной траектории x0(t) через x, получим, что опти
мальное управление системой, находящейся в состоянии
x в момент t, имеет вид
1 42624267
12 425 36 2 14 426 35 4 426 2 53111 (12.11)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 133

Рис. 12.1
Структурная
схема замкнутой
системы
оптимального
управления

Таким образом, если все компоненты выходного век(


тора x доступны измерениям, можно синтезировать си(
стему управления с обратной связью, как это показано на
рисунке 12.1. Коэффициент K при этом должен меняться
в зависимости от времени по закону, описанному в (12.11).

12.2.
ЛИНЕЙНОКВАДРАТИЧНАЯ ЗАДАЧА
ДЛЯ СКАЛЯРНОГО СЛУЧАЯ
Исследуем решение ЛК(задачи в скалярном случае для
стационарной системы:
11 223 1 31223 2 452234 1 3 2 3 64 1213 1 11 4 (12.12)
1
3 546 1 5362 51 6 2 4 552 62 526 2 5442 526672 3 789

21

Величину B1, входящую в уравнения (12.6), обозначим


через 1/r:
1 1
33 1 2 2 3 4 4 1 12 5 (12.13)
12 4 2
Отметим, что коэффициент b в уравнении (12.12) опи(
сывает эффективность управления, а множитель N3 в кри(
терии качества характеризует стоимость управления. Па(
раметр r, таким образом, равен отношению «цена/каче(
ство».
Уравнение (12.8) для скалярной функции P(t) теперь
примет вид
11 324 1 231 2 141 324 3 2 1 1 3245 1 35 4 1 326 (12.14)
6
Уравнение для оптимальной траектории с учетом (12.7)
запишется в виде
11 324 1 33 2 2 4 3244 13245 1314 1 11 5 (12.15)
5
134 А. Ю. ОЩЕПКОВ

а оптимальное управление u0(t), в соответствии с (12.5),


(12.7), выразится формулой

21 334 1 2 1 4 33453345 (12.16)


62
Уравнение (12.14) интегрируется методом разделения
переменных, после чего может быть найдена оптималь%
ная траектория с использованием формулы Коши
1
1 2
2314 3 21 567 631 4 2 5
4 35465 7 8
7 1
86 97
а затем определено оптимальное управление по форму%
ле (12.16).
Приведем формулу, выражающую зависимость P(t),
а остальные результаты изобразим графически ввиду гро%
моздкости аналитических выражений. Зависимость P(t)
имеет вид
1 12 3 52 4 14 12 4 526132
4 132 7 5 8 3 3
13 4 14 6132
6132 7 456 17513 4 6 228 (12.17)
Здесь введены обозначения
3 4 11 5 213 12 3 42 4 223 12 1 1 2 34 (12.18)
На рисунке 12.2 изображены оптимальные траектории
x(t) для следующих фиксированных значений величин:
a = –1, N1 = 0, N2 = 1,
T = 1, x(0) = 1 (12.19)
— при нескольких различных
значениях параметра r, указан%
ных на графиках. Из графиков
следует, что при больших зна%
чениях параметра r выход си%
стемы под действием управ%
ления меняется слабо, т. е.
Рис. 12.2 управление малоэффективно.
Переходные процессы в
системе оптимального Применять управление с r > 1,
управления очевидно, не имеет смысла.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 135

Рис. 12.3 Рис. 12.4


Решения уравнения (12.14) Оптимальное управление
в задаче (12.12)

Из выражений (12.17) и (12.18) следует, что при боль+


ших значениях параметра b (малые r) на временах
0 £ t £ T – 3b/2 (12.20)
функция a(t) близка к нулю, следовательно, функция
P(t) остается постоянной величиной, приближенно рав+
ной r × (a + b). Последнее означает, что на интервале вре+
мени (12.20) коэффициент усиления в замкнутой систе+
ме управления, схема которой изображена на рисунке
12.1, практически остается постоянным, т. е. оптималь+
ное управление синтезируется по схеме П+регулятора,
и лишь перед окончанием движения происходит резкое
изменение коэффициента обратной связи. Это хорошо
видно на рисунке 12.3, где приведены графики функ+
ции P(t).
На рисунке 12.4 изображены графики оптимального
управления при различных значениях параметра r. Вид+
но, что при уменьшении r (уменьшение стоимости или уве+
личение эффективности управления) оптимальное управ+
ление стремится к дельта+функции, т. е. принимает им+
пульсный характер.
Упражнение 12.1.
Постройте графики переходных процессов в системе
оптимального управления, приведенные на рисун+
ке 12.2, с помощью MATLAB.
136 А. Ю. ОЩЕПКОВ

12.3.
УПРАВЛЕНИЕ НА НЕОГРАНИЧЕННОМ
ИНТЕРВАЛЕ ВРЕМЕНИ
Ранее при рассмотрении стандартных регуляторов с
обратной связью (см. лекцию 7) мы формулировали цель
управления в виде
x ® 0, 0 £ t £ ¥,
где величина x представляла собой отклонение выхода от
заданного значения (уставки). Оптимизационные требова'
ния заключались в выборе времени выхода на режим и
максимального перерегулирования. Время работы регу'
лятора не ограничивалось, т. е. речь шла об управлении
на неограниченном интервале времени. Требования к уп'
равляющему воздействию не накладывались. Интересно
рассмотреть эту задачу с точки зрения общей теории оп'
тимального управления, с учетом требований к управля'
ющему воздействию.
Нельзя просто совершить предельный переход T ® ¥
в результатах, полученных для ограниченного интервала
движения (например, в формуле (12.17)). Здесь нужно
поступить по'другому, а именно: необходимо сформули'
ровать задачу сразу для неограниченного интервала вре'
мени. Для этого математическую модель представим в
стандартном виде (11.1), а управление будем искать в клас'
се функций, зависящих от времени t и текущих коорди'
нат x(t), т. е. в форме С'управления вида
u = u(t, x(t)). (12.21)
Итак, задача формулируется следующим образом:
31 142 1 5143 31423623 3 2 71 3 6 2 72 4 (12.22)
x(t0) = x0.
1
2 213 2 4 31 244 52434 1244 53364 3 5678
1
(12.23)
1

Задачу (12.22), (12.23) можно решить с помощью па'


раметризации зависимости (12.21). Например, если эту
зависимость выбрать в виде пропорционального закона
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 137

u = –Kx, то выражение для u можно подставить в урав'


нение (12.22), найти зависимость x(t) и все подставить
в (12.23). Вычислив интеграл в (12.23) (если это возмож'
но), мы получим зависимость J = J(K). Оптимальное зна'
чение коэффициента K определится из решения уравне'
ния dJ/dK = 0.
Решение задачи (12.22), (12.23) в общем случае слож'
но, однако в некоторых случаях его можно найти. Отме'
тим, что полученное решение должно быть проанализи'
ровано на устойчивость. Более того, задачи устойчивости
и управления объединяют и получают задачу в следую'
щей постановке: найти управление u(t, x), которое ми
нимизирует функционал (12.23) и одновременно превра
щает систему (12.22) в устойчивую. Вспомним маятник
Капицы, о котором упоминалось в лекции 8, или предста'
вим ракету, взлетающую вертикально, движущийся по
заданному курсу реактивный самолет — все эти объекты
являются устойчивыми исключительно благодаря управ'
лению.
Сформулированная выше задача называется задачей
оптимальной стабилизации. Рассмотрим ее на примере
ЛК'задачи. Запишем аналог задачи (12.1), (12.2) для не'
ограниченного интервала времени при N1 = 0.
31 243 1 12433243 2 224352434
4 3 14 3 4 61 4 5 4 62 3213 1 31 5 (12.24)
1
42 2435 6 11 435 6 24353 4
4 415 5 7 6 789
(12.25)
3
4 21435 6 12 435 6 14353535 1

матрицы N2(t), N3(t) непрерывно положительно опреде'


лены:
áx | N2(t) | xñ ³ Cáx | xñ, áx | N3(t) | xñ ³ Cáx | xñ, C > 0.
Оказывается, что оптимальное управление u0 и матри'
ца P(t) для задачи (12.24), (12.25) удовлетворяют соотно'
шениям
1 426342635 2 3 25
12 425 36 2 113112 (12.26)
138 А. Ю. ОЩЕПКОВ

2 415 2 21 4151415 2 14152415 1


1
6 141534154311 4153 1 4151415 2 4 415 3 78 (12.27)
2

Уравнение (12.27) теперь решается на бесконечном


промежутке времени. Если существует решение P(t) урав!
нения (12.27), такое что
áx | P(t) | xñ ³ aáx | xñ, || P(t) || < C, C > 0, a > 0, (12.28)
то система (12.24) при оптимальном управлении (12.26)
экспоненциально устойчива (см. [1, гл. VII]). Двойными
вертикальными чертами в (12.28) обозначена норма мат!
рицы, равная корню квадратному из суммы квадратов ее
элементов. Нелинейное дифференциальное матричное
уравнение (12.27) может быть решено с помощью проце!
дуры последовательных приближений.
Ситуация упрощается в стационарном случае. Если
матрицы A, B, N2 и N3 в (12.24), (12.25) не зависят от вре!
мени, то матрица P в силу бесконечного верхнего предела
в интеграле критерия качества (12.25) тоже не должна за!
висеть от времени. Поэтому для стационарной линейно
квадратичной задачи оптимальное управление на неогра!
ниченном интервале времени имеет вид
1 35
12 425 36 2 12 4 36 2 1131123 (12.29)
где постоянная симметричная матрица P > 0 является ре!
шением уравнения
1 2 21 1 2341132
12 1 2 4 3 45 (12.30)
3 2

которое называется алгебраическим уравнением Рикка


ти. Для скалярного случая необходимо выбирать положи!
тельный корень квадратного уравнения, к которому сво!
дится уравнение (12.30).
Упражнение 12.2.
Процесс изменения температуры Q(t) воздуха в ком!
нате опишем математической моделью в виде уравне!
ния (7.10):
1 2 3321 3 1 3 4 4 253
2 1 1 1
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 139

(обозначения величин в соответствии с п. 7.2). С помо$


щью этой модели рассмотрите следующие задачи оп
тимального управления температурой воздуха в ком
нате.
1. Пусть требуется нагреть комнату до температуры
QУСТ за заданное время Т при минимальных расходах
на управление и при заданной начальной температуре
Q(0) = QO < QУСТ. Найдите управление, минимизируя
функционал
1
2 63 7 1 2 3 6461 7 5 4 234 71 6 7 3 1 647548 a > 0.
5

Средствами MATLAB исследуйте работу рассчитанно$


го оптимального регулятора для комнаты объемом
60 м3 при различных значениях остальных парамет$
ров, соответствующих условиям уральской зимы.
2. Постройте управление, стабилизирующее темпера$
туру в комнате на заданном уровне QУСТ, используя П$
регулятор q(t) = –K × (Q(t) – QУСТ). Коэффициент K най$
дите путем решения уравнения для математической
модели системы с обратной связью и последующей
минимизации функционала
1
1 62 7 2 8 83 4 65637 6 5234 71 7 2 1 637943

5
Исследуйте работу регулятора для комнаты с помощью
моделирования в Simulink с исходными данными, как
в задании 1.
3. Решите задачу пункта 2, используя алгебраическое
уравнение Риккати (12.30). Сравните полученные ре$
зультаты.
Наши ноги и челюсти быстры,
Но почему же, вожак, дай ответ,
Мы затравленно рвемся на выстрел
И не пробуем — через запрет?
В. С. Высоцкий

Л Е К Ц И Я 13

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
ПРИ ОГРАНИЧЕНИЯХ
НА УПРАВЛЯЮЩИЕ ВОЗДЕЙСТВИЯ
13.1.
ПРИНЦИП МАКСИМУМА
ПОНТРЯГИНА
13.1.1.
ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА

Необходимые условия оптимальности, приведенные в раз"


деле 11.3, сформулированы для случая, когда на управ"
ляющее воздействие не накладывается никаких ограни"
чений, поэтому его можно варьировать произвольным об"
разом, достигая выхода на оптимальную траекторию. Если
вектор управляющих воздействий u(t) принадлежит неко"
торому замкнутому ограниченному множеству U (u(t) Î U),
то его нельзя варьировать произвольным образом на гра"
нице множества, следовательно, методы, изложенные
выше, неприменимы. Наличие ограничения требует мо"
дификации условия (11.27) теоремы 11.1. Отметим, что
здесь мы рассматриваем ограничения типа приведенного
в лекции 2 простейшего примера (2.11).
Необходимые условия оптимальности, учитывающие
ограничения на управление, называют принципом мак&
симума Понтрягина*. Сформулируем его для задачи Боль"
ца. Рассмотрим задачу управления:
31 243 1 5244 32434624335
3 2 71 4 6 2 72 4 41 3 4 3 84 3241 3 1 31 6 (13.1)

* Понтрягин, Л. С. Принцип максимума в оптимальном управле"


нии. — М. : Наука, 1989. — 60 с.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 141

1
3 243 1 5 5 224 622344223372 2 32621 33 4 5674 (13.2)
21
u(t) Î U. (13.3)
Справедлива следующая теорема.
Теорема 13.1 (принцип максимума Понтрягина).
Пусть u0(t) — оптимальное управление в зада
че (13.1)–(13.3), а x0(t) — оптимальная траекто
рия. Тогда существует такой вектор y(t) Î Rn,
удовлетворяющий уравнениям
11 223 2 331 224 11 223441 2234 22334
21 4 2 4 54 25 3 2 351 211 25 334 (13.4)
что справедливо условие максимума
234 3 546 51 547616 5477 2 3 546 51 547611 5476 54776 (13.5)
112
где гамильтониан Н определяется равенством
H(t, x(t), u, y(t)) =
= –F(t, x(t), u) + áy(t) | f (t, x(t), u)ñ. (13.6)

Как видим, из условий оптимальности (11.33)–(11.35)


два условия сохраняются, а выражение (11.35), полу8
чающееся из условия стационарности гамильтониана
11 2 12 заменяется на условие максимума (13.5). Отме8
12
тим, что максимум функции H(t, x0(t), u, y(t)) в левой
части условия (13.5) вычисляется по параметру u(t) Î U
при фиксированных значениях остальных аргументов t,
x0(t), y(t).
Построение оптимального управления при ограниче8
ниях проводится так же, как в задаче без ограничений,

Рис. 13.1
Построение оптимального управления
с использованием принципа максимума
142 А. Ю. ОЩЕПКОВ

с той лишь разницей, что управление определяется благо!


даря использованию соотношения (13.5). Последователь!
ность действий при построении оптимального управления
изображена на рисунке 13.1.

13.1.2.
ПРИМЕР: ПОВОРОТ ВАЛА ЭЛЕКТРОДВИГАТЕЛЯ
НА МАКСИМАЛЬНЫЙ УГОЛ
Рассмотрим применение принципа максимума на при!
мере задачи о повороте вала электродвигателя на макси!
мальный угол. Математическую модель двигателя пред!
ставим в форме (2.4):
12111 11132 3 561323
1132 2 42 1 (13.7)
где v(t) — управляющее напряжение, прикладываемое к
цепи статора. Двигатель считается реверсивным, поэтому
на напряжение накладываются ограничения
–Vmax £ v(t) £ Vmax. (13.8)
Упростим математическую модель объекта, считая
индуктивность обмотки статора L = 0. В начальный мо!
мент вал двигателя неподвижен, угол поворота равен
нулю. Модель (13.7), (13.8) теперь можно представить в
форме уравнений в фазовом пространстве:
111 1 12 3 112 1 23 11 456 1 12 456 1 53 (13.9)
| u | £ b, (13.10)

где 24 1 26 25 1 21 6 3 1 1 46 5 1 1 6123 7 Требуется выбрать


78 78
управление так, чтобы в заданный момент времени Т ско!
рость вращения была равна нулю, а угол поворота при этом
был максимальным
x2(T) = 0, x1(T) ® max. (13.11)
При отсутствии ограничений поставленная задача име!
ла бы мало смысла, поскольку, прикладывая бесконечно
большое напряжение, мы могли бы получить бесконечно
большой угол поворота. Очевидно, что прикладывая на!
пряжение Vmax, мы тоже будем достигать максимально
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 143

возможного угла поворота вала. Однако в момент времени


T вал должен остановиться, т. е. когда)то нужно прило)
жить отрицательное напряжение, чтобы начать тормозить
вал. Может быть, вследствие симметрии задачи из)за от)
сутствия трения половину времени T мы должны разго)
нять вал, прикладывая напряжение Vmax (управление b
в (13.9)), а вторую половину времени останавливать его
напряжением –Vmax, чтобы получить максимально воз)
можный угол поворота? Проверим эту гениальную догад)
ку с помощью принципа максимума.
Условие (13.11) отличается от (13.2) при F = 0 (задача
Майера) тем, что функция от переменных состояния в мо)
мент окончания движения принимает не минимальное,
а максимальное значение. В этом случае применяют ме
тод штрафных функций.
Введем функционал
21 334 1 242 35 4 3 1 411 35 4 4 5678 (13.12)
1
Здесь k ? 1 называется коэффициентом штрафа. Мож)
но доказать, что при k ® ¥ оптимальное управление в за)
даче (13.9), (13.12) должно стремиться к оптимальному
управлению в задаче (13.11).
Для задачи (13.9), (13.12) на основании теоремы 13.1
(F = 0) получаем

1 2 3122 4 3233 31 1 2 5 11 2 43 31 54 6 2 17 (13.13)


121
31 1 4 5 23 4 5324 31 54 6 4 5561 54 64 789 3 4 789 3 11

261 313 12 313 12

Из равенств (13.13) следует, что оптимальное управле)


ние имеет вид
y1(t) º 1, y2(t) º C – t, u0(t) = bsigny2(t),
3 22 1 1 3 1 22
411 334 4 5
7622 2 1 3 1 55 (13.14)

Здесь t — момент переключения, для которого y2(t) = 0;


он будет определен ниже. Из уравнений (13.9) для x2(t) и
x1(t) при управлении (13.14) получим
144 А. Ю. ОЩЕПКОВ

3 122 3 1 2 1 22
31 425 4 5
7 11 2 6 122 2 1 2 1 46 (13.15)

1
1 21 3 4 2 1 2 33
4 1
32 516 5 6 1
4 1231 7 2 1 7 231 3 3 2 1 2 47
8 1
Для нахождения момента переключения t использу!
ем краевое условие y2(T) = –kx2(T). Отсюда следует, что
y2(T) = C – T = – k(2bt – bT), C = T – k(2bt – bT).
Поскольку y2(t) = 0, имеем
T – k(2bt – bT) – t = 0.
Таким образом, для определения момента переключе!
ния получаем формулу
t = T(1 + bk)(1 + 2bk)–1. (13.16)
Из равенства (13.16) видно, что t ® T/2 при k ® ¥. Да!
лее, так как x2(T) = bT(1 + 2bk)–1, то x2(T) ® 0 при k ® ¥.
Следовательно, оптимальное управление 211 233 найдено и
при достаточно большом k близко к оптимальному управ!
лению u0(t) в задаче (13.9), которое равно
2 12 1 1 2 1 3342
41 526 3 4
6512 334 1 2 1 37 (13.17)

Наша догадка полностью подтвердилась.


Построим фазовые траектории для системы (13.9) при
управлении (13.17) — оптимальные фазовые траекто
рии — для различных значений параметров b и Т.
Выражая время t как параметр из выражений (13.15)
для 0 £ t £ T/2, получаем участок фазовой траектории:
22 1 2 211 3 4 2 3 2 1 5 (13.18)
14 1
В момент t = T/2 происходят переключение управле!
ния и переход на другую траекторию, которая определя!
ется аналогично (13.18) и имеет вид
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 145

1
32 1 12 2 2 311 3 2 3 4 3 24 (13.19)
5 11 1
Запишем значения для x1, x2 в (13.15) в момент време&
ни t = T/2, когда происходит переключение:
1
32 1 12 3 31 1 12 4 (13.20)
5 1
Выражения (13.20) пред&
ставляют собой координаты
точки переключения на фазо&
вой плоскости.
На рисунке 13.2 изобра&
жены оптимальные траекто&
рии в задаче о повороте вала
электродвигателя на макси& Рис. 13.2
мальный угол при T = 4 и не& Оптимальные траектории в
скольких различных значе& задачах (13.9)–(13.11) при
Т = 4 и различных b
ниях параметра b. Фазовые
траектории, являющиеся удобным графическим сред&
ством представления решений оптимальных задач, часто
применяются для анализа.
Принцип максимума Понтрягина находит широкое
применение при исследовании различных технических
систем управления. В книге [1] приведены следующие кон&
кретные примеры применения принципа максимума:
· оптимальная компоновка ядерного реактора (миними&
зация расхода ядерного горючего);
· управление линейной и билинейной механической си&
стемой (перевод системы из произвольной точки фазо&
вого пространства в нулевую — остановка в заданном
месте или «успокоение» — за минимальное время);
· задача о плоском переходе космического аппарата с
одной круговой орбиты на другую (минимизация рас&
хода топлива);
· управление экологическими системами (различные
постановки).
Все задачи решаются по алгоритму, приведенному на
рисунке 13.1. Читатель может, при необходимости, само&
стоятельно разобраться в деталях решения.
146 А. Ю. ОЩЕПКОВ

13.2.
МЕТОД ДИНАМИЧЕСКОГО
ПРОГРАММИРОВАНИЯ

13.2.1.
УРАВНЕНИЕ БЕЛЛМАНА

Принцип максимума позволяет построить оптималь


ное Пуправление при наличии ограничений. Метод ди
намического программирования дает возможность синте
зировать Суправление. Можно сказать, что принцип мак
симума выделяет отдельную оптимальную траекторию,
тогда как метод динамического программирования основан
на изучении всего множества
оптимальных траекторий.
На рисунке 13.3 условно
изображена траектория x0 ®
® x(T), полученная с помо
щью применения оптимально
го управления u на всем проме
жутке времени t0 £ t £ T. Пусть
с помощью управления u в мо
Рис. 13.3
Оптимальная траектория мент времени t = s достигнуто
и принцип динамического состояние xs. Если теперь ис
программирования
пользовать xs в качестве ново
го начального состояния и построить оптимальное управ
ление по тому же критерию, как для u, на отрезке s £ t £ T,
то какое состояние мы получим в момент времени T?
«Мы получим состояние x(T), причем независимо от
положения точки s», — утверждает принцип динамиче
ского программирования*. Сформулируем его.
Принцип динамического программирования: опти
мальное управление обладает тем свойством, что для
любого начального состояния и использованного началь
ного управления последующее оптимальное управление
совпадает с исходным оптимальным управлением отно
сительно состояния, получающегося в результате при
менения начального управления.

* Беллман, Р. Динамическое программирование. — М. : ИЛ, 1960.


СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 147

Данный принцип показывает, что мы можем находить


последующее оптимальное управление, зная состояние
системы в каждый момент времени. Но в таком случае мы
получаем С2управление! Это управление строится с по2
мощью решения специального уравнения (уравнения
Беллмана) для специально вводимой функции (функции
Беллмана).
Получим для примера уравнение Беллмана для зада2
чи управления на конечном интервале времени (задача
Больца) следующей системой:
11 122 1 3123 11223 423 t0 £ t £ T, x(t0) = x0, u Î U, (13.21)
1
5 223 2 32621 33 4 6 7 244 62434 2384 5 5678 (13.22)
213
41

Введем скалярную функцию V(s, x), называемую фун


кцией Беллмана, которая равна инфимуму (точной ниж2
ней грани) функционала (13.22), но на интервале s £ t £ T
по всем управлениям, для которых существует решение
поставленной задачи:
1
2 3
6 153 72 4 456 751711 22 6 8 133 71323 2293 8 7 (13.23)
21 3214
79 5 8

Возьмем теперь два момента времени s и t такие, что


t0 £ s £ t £ T (рис. 13.3). Из определения функции Беллма2
на и принципа динамического программирования легко
получить выражение

41 5
5 143 62 6 456 8 7 123 61223 1282 7 5 113 61122 9 3 (13.24)
11 2223
84
4 3 231
9
которое является, по сути, уравнением для функции V.
Заметим, что из (13.23) следует V(T, x) = j(x(T)). Перепи2
шем уравнение (13.24) в виде
41 5
345 9 5 126 61226 1272 6 8 116 61122 7 8 146 62
8 78 (13.25)
11 2223
4 3 2 31 9
4

148 А. Ю. ОЩЕПКОВ

Уравнение (13.25) можно упростить, переходя к пре


делу
t ® s – 0. (13.26)
Предполагая функцию V непрерывно дифференцируе
мой, в случае (13.26) можем записать
1 112 21133 2 1 132 23 3 11 132 231 1 2 332 (13.27)
где
11 122 33
11 122 33 2 3 411 122 33 13 4 4152 326355 (13.28)
12
Интеграл в (13.25) в случае (13.26) примет вид
1

5 2132 413325363 2 2112 4253 3 11 4 134 (13.29)


1
Подставив (13.27)–(13.29) в (13.25) и разделив обе ча
сти этого равенства на t – s, в пределе t ® s + 0 получим
уравнение Беллмана:
123 28 51 415 26 4 5 52 415 26 7 6 415 25 36 4 7 415 25 366 39 7 85 (13.30)
314
t0 £ t £ T, V(T, x) = j(x).
Отметим, что точная нижняя грань в уравнении (13.30)
вычисляется по векторному параметру u Î U Ì Rm.
Основные этапы построения Суправления на основе
метода динамического программирования приведены на
рисунке 13.4. Подчеркнем еще раз, что после подстанов
ки выражения u(t, x, V) в уравнение (13.30) оно становит
ся нелинейным уравнением в частных производных для
скалярной функции V(t, x). С помощью принципа макси
мума решение задачи управления сводится к решению
системы обыкновенных дифференциальных уравнений,

Рис. 13.4
Построение оптимального управления
с использованием метода динамического программирования
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 149

что иногда является более простым по сравнению с реше)


нием уравнения в частных производных.
Упражнение 13.1.
Постройте структурную схему замкнутой системы оп)
тимального управления на основе метода динамиче)
ского программирования.
Метод динамического программирования и принцип
максимума направлены на решение одной и той же зада)
чи — построение оптимального управления при ограни)
чениях на управляющие воздействия. Было бы странно,
если бы в одинаковых условиях они давали различные
результаты. На самом деле, оба эти подхода дают, конеч)
но, одинаковые результаты и тесно связаны методически.
Так, из метода динамического программирования может
быть выведен принцип максимума, а для линейно)квад)
ратичной задачи, например, функция Беллмана находит)
ся как V(t, x) = áx | P(t) | xñ, где P(t) — решение матричного
уравнения Риккати.

13.2.2.
ПРИМЕР: ЗАДАЧА ОБ УСПОКОЕНИИ
ТВЕРДОГО ТЕЛА

Рассмотрим задачу о наискорейшем успокоении твер)


дого тела, совершающего вращательное движение вокруг
центра масс. Составим математическую модель объекта
управления. Уравнения (8.9) в собственной системе коор)
динат примут вид
1 2 4 1 3 1 51 1 4 2 6
1111 2 3 2 3 1

111 2 4 1 3 1 51 1 4 2 6
2 2 3 1 3 1 2
1 2 4 1 3 1 51 1 4 2 7
13 1 (13.31)
3 1 2 1 2 3

Если речь идет о движении космического аппарата, то


предполагается, что моменты сил K1, K2, K3 создаются с
помощью соответствующих двигателей. Абсолютная ве)
личина полного момента ограничена
151 1 111 1 161 2 1234 7 (13.32)
150 А. Ю. ОЩЕПКОВ

Вводя обозначения IjWj = xj, Kj = 1, 2, 3, Kmax = b, за


пишем (13.31), (13.32) в виде
411 1 12 5
213 2 21 22 3 336
11 12
41 1 1 5
211 2 2 3 2322 3 31 6
12 13
413 1 11 5
21 2 2 21 23 3 32 7 (13.33)
1311
121 1 111 1 131 2 24 (13.34)
В начальный момент времени t0 = 0 вектор момента
1 1
имеет заданное значение 1 1234 причем 1 123 1 24 1 Обозна
чим через T > 0 первый момент времени, когда 1 12 2 1 33
т. е. величина момента уменьшилась до заданного значе
ния (произошло успокоение движения). Управление тре
буется выбрать так, чтобы время успокоения T было ми
нимальным.
Используем метод динамического программирования.
Поскольку в задаче быстродействия j = 0, F = 1, то в соот
ветствии с определением функции Беллмана (13.23) здесь
она имеет смысл минимального времени успокоения. По
скольку уравнения движения (13.33) и ограничения на
управление (13.34) не зависят явно от времени, функция V
также не будет содержать времени: V = V(x1, x2, x3). Урав
нение Беллмана примет вид

3 64 4 431 1 32 5 43 1 3 5
678 79 51 52 8 23 5
8 64 7 49 2 3 5352 8 21 5
8
11 22 21 653 3
1 2 3 651 3332

4 3 1 3 5 
8 64 7 49 3 1 51 53 8 22 5
 8 3  9

652 31 33 
1 1
4 455  9
5  6 (13.35)

Необходимо найти вектор управления, при котором


достигается инфимум скалярного произведения
11 2 2 3 11 2 2 3 11 2 2 4 111 2 214 1
2 5 35
141 1 142 2 143 3 15
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 151

1
Очевидно, что вектор 1 должен быть по модулю равен
b и иметь направление, противоположное вектору гради*
11
ента 1 :
12
1 1 1 1
3 4 54 121 6 2 4 211 4 28 12 39 7 28 12 39 7 82 12 93 5 (13.36)
11 211
152
151
153
1
Здесь введен вектор 1 1 421 5 22 5 23 67 Подставляя управ*
ление (13.36) в (13.35), получаем нелинейное уравнение
для функции V:
2 42 1 2 5 3 2 42 1 2 5 3
4 5 311 6 43 5 7 1 2 52 51 8 6 43 5 7 3 1 5351 8 6
453 9 21 22
452 2
9 3 1 2

4 3 2 4 22 1 23 5 3
6 5 52 53 8 36
451 79 22 23
(13.37)

Вследствие сферической симметрии задачи будем искать


решение уравнения (13.37) в виде
1
1 42 5 1 2 242 56 2 1 321 3 311 3 331 6 (13.38)
4
где w(r) — скалярная функция. Подстановка (13.38) в (13.37)
приводит к уравнению для w(r):
1112 2
2 34 113 2 2 54 (13.39)
12
которое имеет решение w(r) = r – R. В результате находим
1 1
оптимальное управление 1 и время успокоения 1 12 2
1 1 1
2 1 23 3 1 2 4 31 4 1 1 31 2 5 45 (13.40)
1 3
Выражения (13.40) показывают, что вектор оптималь*
ного управления максимален по величине, а его направ*
ление противоположно направлению вектора углового
момента.
Рассмотренные выше простые примеры являются
лишь первым шагом на пути к конструированию совре*
менных замкнутых или разомкнутых многоканальных
систем управления. Интересно сравнить алгоритмы управ*
ления, реализованные в технических устройствах, напри*
мер в многозвенной механической руке робота*манипуля*
тора, и в живых организмах. Вот что пишет по этому по*
152 А. Ю. ОЩЕПКОВ

воду основатель кибернетической науки Норберт Винер*,


рассматривая произвольные действия человека с точки
зрения теории систем с обратной связью: «Допустим те$
перь, что я поднимаю карандаш. Чтобы это сделать, я дол$
жен привести в движение определенные мышцы. Одна$
ко никто, за исключением специалистов$анатомов, не
знает, какие это мышцы... Нами осознается лишь конеч$
ная цель — поднять карандаш. Когда мы решили это сде$
лать, наше движение совершается так, что, грубо говоря,
степень, в которой карандаш еще не взят, на каждом эта$
пе уменьшается. Все движение мы выполняем почти бес$
сознательно». Добавим, что эти «почти бессознательные»
(рефлекторные) движения происходят по оптимальным
траекториям. В качестве других замечательных рефлек$
сов, присущих животным и человеку, Н. Винер называет
рефлекс ходьбы и чесательный рефлекс, причем в этих
случаях оказываются задействованными несколько уров$
ней обратных связей.
Чтобы робот рефлекторно, т. е. «не задумываясь», при$
чем плавно и красиво выполнял команду «поднять каран$
даш», разработчикам необходимо тщательно подумать о
его программно$аппаратном обеспечении, схемотехничес$
ких решениях и механических частях исполнительных
устройств.

* Винер, Н. Кибернетика, или Управление и связь в животном и ма$


шине. — М. : Наука, 1983. — 344 с.
Прочь влияния извне,
Привыкайте к новизне!
В. С. Высоцкий

Л Е К Ц И Я 14

УПРАВЛЕНИЕ В УСЛОВИЯХ
НЕОПРЕДЕЛЕННОСТИ.
РОБАСТНОСТЬ СИСТЕМ
С ОБРАТНОЙ СВЯЗЬЮ
14.1.
НЕОПРЕДЕЛЕННОСТИ
ОБЪЕКТОВ УПРАВЛЕНИЯ
Традиционные методы теоретического анализа и синтеза
систем управления, рассмотренные выше, основаны на
предположении, что математическая модель объекта яв&
ляется известной и абсолютно точно описывает его пове&
дение. Однако для современных подходов к постановке и
решению задач управления характерен более критичный
взгляд на точность математических моделей, имеющих&
ся в распоряжении разработчика. Дело в том, что, как
уже говорилось в лекции 2, любая модель представляет
собой идеализированное (т. е. упрощенное) описание ре&
ального объекта. Кроме того, некоторые характеристи&
ки объекта могут быть заранее неизвестными или значи&
тельно изменяться в процессе его функционирования.
При этом говорят о неопределенности математической
модели объекта (или просто — о неопределенном объек+
те, понимая под этим неопределенность его математиче&
ской модели [5]). Математическую модель, на основании
которой разрабатываются алгоритмы управления, назы&
вают номинальной.
В условиях существенной неопределенности тради&
ционные методы теории управления оказываются не&
применимыми или дают плохие результаты. Поэтому
для объектов с неопределенными (т. е. с неточно извест&
ными) математическими моделями необходимо приме&
нение специальных методов анализа и синтеза систем уп&
равления.
154 А. Ю. ОЩЕПКОВ

Рассмотрим основные типы неопределенностей мате


матических моделей на примере модели двигателя посто
янного тока (лекция 5).
1. Параметрическая неопределенность означает, что
неизвестными являются постоянные параметры матема
тической модели. Значения параметров, использованные
при синтезе алгоритма управления, называют номиналь
ными. Во многих практических случаях реальные значе
ния параметров могут существенно отличаться от приня
тых номинальных.
В модели двигателя, в принципе, все параметры (L, R,
b, J) определены с какойто погрешностью. Особо нужно
отметить величину момента инерции, которая может быть
разной для различных нагрузок. Если мы хотим, чтобы
система управления двигателя работала в широком диа
пазоне нагрузок Jmin £ J £ Jmax, мы должны создавать ал
горитм для параметрически неопределенной модели.
2. Сигнальная неопределенность означает, что мате
матическая модель содержит неизвестные функции вре
мени. Как правило, такие функции представляют собой
математическую форму описания нестационарных (пере
менных во времени) параметров объекта или внешних воз
мущений, действующих на объект.
Примером внешних возмущений может служить мо
мент Td, являющийся случайной функцией времени. Кро
ме того, при работе двигателя происходит разогрев, в ре
зультате чего активное сопротивление обмоток R изменя
ется с течением времени по неизвестному закону R(t) —
это сигнальная неопределенность.
3. Функциональная неопределенность означает, что
математическая модель объекта содержит неизвестные
функции координат состояния, регулируемых перемен
ных или сигналов управления.
Во многих случаях, например при управлении венти
ляторами или валами гребных установок судов, внешний
момент является сложной, причем неизвестной функци
ей частоты вращения вала: Td = Td(w). Учет данной зави
симости даст нам систему с функциональной неопределен
ностью.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 155

4. Структурная неопределенность означает, что струк


тура математической модели является неточно известной.
Как правило, структурная неопределенность выражается в
том, что динамический порядок (степень) реального объек
та выше порядка его математической модели. При этом го
ворят о наличии немоделируемой (паразитной) динамики.
Двигатель, управляемый по цепи возбуждения, явля
ется в соответствии с выражением для передаточной функ
ции (5.7) объектом третьего порядка. Однако при постро
ении этой модели не было учтено время срабатывания ис
полнительного устройства t, передающего управляющее
напряжение в цепь возбуждения. Если учесть это время,
входную цепь двигателя нужно изобразить в виде, ука
занном на рисунке 14.1.
Порядок системы при этом увеличивается на едини
1
цу. Блок с передаточной функцией описывает пара
11 2 1
зитную динамику.
Наконец, отметим, что по отношению к этапу синтеза
управления неопределенности делятся на априорные нео
пределенности и текущие вариации математической моде
ли. Априорная (т. е. изначальная) неопределенность суще
ствует уже на этапе синтеза системы. Она может быть обус
ловлена отсутствием точной информации о свойствах объекта
управления и условиях его функционирования, отсутстви
ем точного математического описания объекта, технологи
ческим разбросом характеристик системы управления при
ее изготовлении и т. п. Текущие вариации математической
модели представляют собой непредсказуемые изменения
математической модели объекта в ходе его рабочего функ
ционирования. Причинами таких вариаций могут быть: из
менения свойств нагрузки (например, уменьшение или

Рис. 14.1
Входная цепь двигателя, управляемого по цепи статора,
с учетом времени срабатывания исполнительного устройства
(паразитной динамики)
156 А. Ю. ОЩЕПКОВ

увеличение приведенного момента инерции), изменение


характеристик объекта управления (нагрев обмоток двига"
теля, уменьшение массы топлива в баках ракет или само"
лета), изменение условий функционирования объекта (из"
менение режимов его работы или свойств внешней среды).
Можно задать естественный вопрос: «Если нельзя ис"
пользовать традиционные методы теории управления, то
как управлять неопределенными объектами?» Ответ на
этот вопрос дает современная теория адаптивных и робаст"
ных систем, которая изучает методы управления неопре"
деленными объектами [2; 5]. Рассмотрим ее применитель"
но к линейным SISO"системам.

14.2.
ПОНЯТИЕ ГРУБОСТИ
И РОБАСТНОСТИ СИСТЕМ УПРАВЛЕНИЯ
Задача исследования систем с неопределенностями
может быть сформулирована следующим образом. Пусть
система с номинальной математической моделью облада"
ет некоторыми желаемыми свойствами (например, опре"
деленным типом устойчивости, заданными показателями
точности или заданными показателями динамического
качества и т. п.). Сохранятся ли эти свойства при изме"
нениях (вариациях или возмущениях) математической
модели? Проблема сохранения некоторого свойства си"
стемы при изменениях ее математической модели изуча"
ется теорией грубости свойства систем управления. Да"
дим следующее определение.
Определение 14.1. Если некоторое свойство системы со"
храняется хотя бы при малых (в определенном смысле) ва"
риациях ее математической модели, то данное свойство на"
зывается грубым по отношению к выделенному классу ва"
риаций. В противном случае свойство называется негрубым.
Термин «грубая система» был введен в научный оборот
А. А. Андроновым*, изучавшим топологические свойства

* Андронов, А. А. Грубые системы / А. А. Андронов, Л. С. Понтрягин //


ДАН СССР. — 1937. — Т. XIV. — № 5. — С. 247–250.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 157

динамических систем, через 45 лет после исследований


устойчивости систем А. М. Ляпуновым. Для теории дина+
мических систем с целенаправленно изменяемыми вне+
шними воздействиями (т. е. для задач теории управления)
характерна более широкая трактовка понятия грубости
как сохранения некоторых свойств (и не обязательно —
только топологической структуры траекторий) динами+
ческой системы при малых изменениях ее математической
модели. Так как фундаментальным свойством любой ди+
намической системы является устойчивость, то прежде
всего интересуются грубостью свойств устойчивости (хотя
можно изучать грубость свойств переходных процессов,
грубость точностных свойств, грубость частотных харак+
теристик и т. п.).
В последнее время в литературе часто вместо терми+
на «грубость» используется термин робастность (от англ.
robust — крепкий, сильный). Обычно, говоря о робаст+
ности, предполагают знание количественных оценок до+
пустимых вариаций математической модели. В этом смыс+
ле «грубость» может трактоваться как «локальная робаст+
ность». Термины «грубый» и «робастный» используются
также по отношению к алгоритмам управления и замк+
нутым системам. При этом для корректного использова+
ния этих терминов необходимо оговаривать класс номи+
нальных моделей систем управления, класс допустимых
вариаций и указывать свойство системы, которое сохра+
няется при данных вариациях. Однако во многих специ+
альных разделах современной теории управления тер+
мин «робастный» используется в специальном, более уз+
ком смысле без каких+либо дополнительных оговорок и
условий.
Робастные (грубые) системы — это системы управле+
ния, обеспечивающие приемлемое (в смысле некоторого
критерия) качество при наличии параметрических, сиг+
нальных, функциональных или структурных неопреде+
ленностей объекта управления. При этом, как правило, в
ходе рабочего функционирования системы коэффициен
ты регулятора не подстраиваются, а малая чувствитель+
ность (т. е. грубость или робастность) к различного рода
158 А. Ю. ОЩЕПКОВ

вариациям математической модели объекта достигается


за счет специальным образом выбранной структуры регу$
лятора (алгоритм управления).
Таким образом, робастные системы относятся к клас$
су ненастраивающихся систем управления, а их малая
чувствительность к различного рода вариациям матема$
тической модели объекта обеспечивается на этапе синтеза
алгоритма управления.

14.3.
РОБАСТНОСТЬ СИСТЕМ УПРАВЛЕНИЯ
С ОБРАТНОЙ СВЯЗЬЮ
В лекции 6 мы ввели понятие чувствительности систе$
мы с обратной связью как величины, обусловливающей
изменение выходного сигнала системы при изменении ее
параметров. Фактически мы рассмотрели робастность точ$
ностных свойств систем управления с обратной связью в
условиях параметрической неопределенности. Определим
робастность (грубость) свойства устойчивости таких си$
стем и их робастность по отношению к структурным воз$
мущениям для случая отрицательной обратной связи с
положительным коэффициентом усиления в блоке управ$
ления (П$регулятор).
Рассмотрим простейшую систему управления для ска$
лярной переменной x вида
11 1 21 3 21 (14.1)
здесь q — постоянный параметр, истинное значение кото$
рого неизвестно. Цель управления: x ® 0, 0 £ t £ ¥ (задача
асимптотической стабилизации — см. (7.15)). Для выра$
ботки алгоритма управления предположим, что значение
параметра — номинальное значение равно x. Очевидно, что
для номинальной модели задача будет решена с помощью
управления
u = –xx – kx, (14.2)
где k > 0 — коэффициент обратной связи. Действительно,
подставив (14.2) в (14.1) при q = x, получим
11 1 2211 (14.3)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 159

Уравнение (14.3) является номинальной моделью зам!


кнутой системы, поскольку оно получено при номиналь!
ном значении параметра. Тривиальное решение этого урав!
нения экспоненциально устойчиво. Сохранится ли дан!
ное свойство при отклонении номинального значения от
истинного? Подставляя (14.2) в (14.1) при условии q ¹ x,
получаем
12 1 221 3 41 11 (14.4)
где величина 11 2 1 3 4 носит название параметрического
возмущения (или параметрической ошибки). Модель
(14.4) называется параметрически возмущенной моде!
лью. Очевидно, что возмущенная модель экспоненциаль!
но устойчива, если 11 2 11 Таким образом, свойство экс!
поненциальной устойчивости является грубым по отно!
шению к параметрическим возмущениям, так как оно
сохраняется хотя бы при малых отклонениях истинных
параметров объекта от принятых номинальных значений.
Область робастности регулятора (14.2) определяется нера!
венством 11 2 1 3 12
Рассмотрим теперь случай структурных возмущений,
вызванных наличием паразитной динамики, на примере
линейного объекта второго порядка, управляемого по вы!
ходу. Пусть номинальная модель объекта описывается
передаточной функцией:
111
32 243 2 4 (14.5)
41 3 1411 4 3 111
Охватим объект отрицательной обратной связью, вве!
дем коэффициент усиления K и учтем время срабатыва!
ния исполнительного устройства t. Структурная схема
возмущенной модели замкнутой системы изображена на

Рис. 14.2
Структурная схема модели с паразитной динамикой
160 А. Ю. ОЩЕПКОВ

рисунке 14.2. Номинальная модель замкнутой системы


получается при t = 0, а ранее (см. Лекцию 9) было показа$
но, что она экспоненциально устойчива.
Рассмотрим вопрос об экспоненциальной устойчиво$
сти модели, изображенной на рисунке 14.2, хотя бы при
малых значениях постоянной времени t. Передаточная
функция замкнутой системы, в соответствии с (6.3), име$
ет вид
2111
3 3 44 2 2 5 (14.6)
34 4 36 4 156441 4 35 4 16411 4 4 111 36 4 2 4

где введен безразмерный параметр a = twn.


Характеристический многочлен, соответствующий
передаточной функции (14.6), имеет вид
2 314 2 311 4 35 4 256412 4 35 4 26471 1 4 721 35 4 3 46 (14.7)
Поскольку все коэффициенты этого многочлена поло$
жительны, для исследования устойчивости достаточно
использовать критерий Льенара — Шипара, который в
данном случае приводит к неравенству
(1 + 2az)(a + 2z) > a2(1 + K). (14.8)
С помощью (14.8) можно определить точное значение
параметра a, при котором система теряет устойчивость
(найти область робастности П$регулятора). Здесь прин$
ципиально исследовать случай малых значений a = 1.
Пренебрегая членами второй степени в (14.8), получим
неравенство (1+ 4z2)a + 2z > 0, которое выполняется при
любом z. Таким образом, мы показали, что возмущенная
система сохраняет свойство экспоненциальной устойчи$
вости при малых временах t. В [5, п. 2.1] с помощью функ$
ций Ляпунова исследованы произвольные линейные ста$
ционарные системы с вектором обратных связей и показа$
но, что свойство экспоненциальной устойчивости является
грубым по отношению к паразитной динамике для класса
линейных стационарных систем.
На рассмотренных примерах мы показали, что систе$
мы с обратной связью, содержащие регуляторы по от$
клонению выхода от заданной величины (SISO$системы),
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 161

являются робастными системами. На практике это означа)


ет, что если регулятор обеспечивает экспоненциальную
устойчивость с номинальной (упрощенной, идеализиро)
ванной) моделью, то этот же регулятор обеспечит экспо)
ненциальную устойчивость и для реальной системы при
небольших отклонениях ее параметров или структуры от
номинальных. Это позволяет при синтезе управления ис)
пользовать приближенные значения параметров и пренеб)
регать малыми постоянными времени.
Робастные алгоритмы обобщаются на многоканаль)
ные системы (MIMO) в виде робастного модального уп)
равления с помощью теории обобщенного модального управ
ления*. Теория обобщенного модального управления
объектами с параметрическими неопределенностями
рассматривается в главе 3 книги [5]. Другим обобщени)
ем является метод скоростного градиента. Рассмотрим его
подробнее.

14.4.
МЕТОД СКОРОСТНОГО ГРАДИЕНТА
Метод предназначен для решения задач управления
непрерывными по времени системами, в которых цель
управления задана при помощи целевой функции [2; 6]:
123 2 434156 15 3 76 (14.9)
1 12
где Q(x(t), t) — гладкая целевая функция. Выбор вида це)
левой функции достаточно произволен. Опишем построе)
ние алгоритмов скоростного градиента для непрерывной
нестационарной системы вида (11.1) при цели управления,
заданной соотношением (14.9).
Для построения алгоритма вычисляется скалярная
функция 11 1 2122 32 43 — скорость изменения величины
Qt = Q(x(t), t) в силу уравнения объекта (11.1):
12 112 33
2112 42 33 3 4 56 12 1 12 33 4 5112 42 3375
13

* Ушаков, А. В. Обобщенное модальное управление // Известия ву)


зов. Приборостроение. — 2000. — Т. 43. — № 3. — С. 8–16.
162 А. Ю. ОЩЕПКОВ

Затем находится градиент функции w(x, u, t) по вход


ным (управляющим) переменным:
12132 12 43 15 132 43
21 3132 12 43 4 4
11 13
Наконец, задается алгоритм изменения u(t) дифферен
циальным уравнением:
21 1 234 5132 12 432
1 (14.10)
24
где 1 2 11 3 1 — симметрическая положительно определен
ная матрица, например G = diag{g1, ..., gm}, gI > 0. Алго
ритм (14.10) естественно назвать алгоритмом скоростно
го градиента (АСГ), поскольку в нем изменение u(t) проис
ходит пропорционально градиенту скорости изменения Qt.
Происхождение алгоритма (14.10) можно объяснить
следующим образом. Для достижения цели управле
ния (14.9) желательно изменять u(t) в направлении умень
шения Q(x(t), t). Поскольку Q(x(t), t) не зависит от u(t),
найти такое направление затруднительно. Поэтому мож
но пытаться уменьшить 11 1 стремясь к выполнению нера
венства 11 1 12 означающего, в свою очередь, уменьшение
Q(x(t), t). Функция 11 1 2122 32 43 уже явно зависит от u,
что позволяет написать алгоритм (14.10).
В качестве примера рассмотрим применение алгорит
ма скоростного градиента для линейной стационарной си
стемы
41 1 54 2 671 8 1 942 4 3
1 1 7 3
2 1 8 3
3 3 (14.11)
Пусть требуется приблизить вектор выхода 1 к жела
емой функции времени 11 2234 т. е. решить задачу слеже
ния (если величина 11 — уставка — не зависит от време
ни, задача называется задачей стабилизации). Выберем в
качестве целевой функции квадрат модуля отклонения
выходного вектора от желаемого значения:
1 324 35 1 2 2 4 3 41 335 6 4 3 41 33547 (14.12)
8
Скорость изменения функции (14.12), в соответствии
с системой (14.11), будет равна
1213 23 34 2 3 4 4 41 234 5 561 5 572 4 411 23466 (14.13)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 163

Скоростной градиент и алгоритм скоростного гради#


ента, полученные с помощью функции (14.13), примут вид
1 22 23 13 34 3 41 4 51 4 26 5 6 23443
1 (14.14)
1
12 1 23 4 31 4 41 4 25 2 5 26334
1 (14.15)
16
В скалярном случае для задачи стабилизации, когда
y*(t) = yуст = const, интегрирование (14.15) приводит к ин
тегральному закону управления:
1
2 1 23 6 4516517 4516 1 6 2 6123 7 3 1 3 4 7 4 8 5 48
4
Таким образом, алгоритм скоростного градиента яв#
ляется обобщением робастного интегрального закона ре#
гулирования. Аналогичным образом строится и обобщение
другого классического закона регулирования — пропорци#
онального. Это так называемый алгоритм скоростного гра
диента(АСГ) в конечной форме:
1 223 1 11 2 3 451 6232234 1 2234 234 (14.16)
где u0 — некоторое начальное (опорное) значение управ#
ления (обычно берется u0 = 0). АСГ в различных формах
применяется в настоящее время для управления свойства#
ми сложных физических систем [6], таких как:
· нелинейные системы с динамическим хаосом;
· распределенные системы;
· маятник Капицы;
· химические реакции с фазовым переходом;
· квантово#механические системы (диссоциация моле#
кул, спиновая динамика) и др.
Ветер есть дыхание природы.
К. Прутков

Л Е К Ц И Я 15

АДАПТИВНЫЕ
СИСТЕМЫ УПРАВЛЕНИЯ

15.1.
СТРУКТУРА АДАПТИВНЫХ
СИСТЕМ УПРАВЛЕНИЯ
Адаптивные (самонастраивающиеся) системы — это си
стемы управления, обеспечивающие компенсацию пара
метрических, сигнальных, функциональных или струк
турных неопределенностей объекта управления за счет
автоматической подстройки регулятора в ходе рабоче
го функционирования системы. Другими словами, адап
тивные системы восполняют нехватку априорной инфор
мации об объекте управления в ходе работы системы.
На рисунке 15.1а приведена обобщенная структурная
схема замкнутой неадаптивной системы управления. «Ре
гулятором» здесь назван весь управляющий комплекс:
устройство измерения, блок сравнения, управляющее уст
ройство, содержащее алгоритм управления, и исполни
тельное устройство, оказывающее управляющее воздей
ствие на объект управления (ОУ). Вход системы g может
быть константой (задача стабилизации) или заданной
а б

Рис. 15.1
Схема:
а — неадаптивной замкнутой системы;
б — адаптивной замкнутой системы.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 165

функцией времени g = g(t) (задача слежения). Выходной


сигнал системы y подается на регулятор по каналу сиг
нальной обратной связи (ОС).
Структурная схема замкнутой адаптивной системы уп1
равления приведена на рисунке 15.1б. Отличительной чер1
той адаптивных (самонастраивающихся) систем являет1
ся наличие дополнительной обратной связи, образованной
цепью, содержащей блок настройки параметров регуля1
тора. Эта обратная связь получила название параметри
ческой, в отличие от сигнальной обратной связи, образо1
ванной непосредственно регулятором. Блок настройки
предназначен для корректировки математической моде1
ли в ходе функционирования системы.

15.2.
КЛАССИФИКАЦИЯ АДАПТИВНЫХ
СИСТЕМ УПРАВЛЕНИЯ
По принципу действия алгоритма блока настройки
адаптивные системы разделяют на два типа:
· идентификационные адаптивные системы (систе
мы с косвенной адаптацией);
· безыдентификационные адаптивные системы (си
стемы с прямой адаптацией).
Структурная схема идентификационной адаптивной
системы приведена на рисунке 15.2. Принцип построения
идентификационных адаптивных систем (или систем с
косвенной адаптацией) основан на использовании про1
цедур идентификации объекта, т. е. на получении оце1
нок его параметров или динамических характеристик*

Рис. 15.2
Система идентифика1
ционного адаптивного
управления

* Александров, А. Г. Оптимальные и адаптивные системы. — М. :


Высш. шк., 1989. — 263 с.
166 А. Ю. ОЩЕПКОВ

по результатам измерений выходного сигнала и управля


ющих воздействий. Полученные оценки используются
далее для расчета коэффициентов регулятора. Таким об
разом, в своей структуре идентификационные адаптивные
системы содержат: блок (алгоритм) идентификации, вы
рабатывающий оценки неизвестных параметров объекта
управления q, блок расчета параметров регулятора k и
собственно настраиваемый регулятор. Очевидно, что при
стремлении оценок параметров объекта к истинным свой
ства замкнутой системы будут приближаться к желаемым.
Идентификационные адаптивные системы относятся
к наиболее простому по реализации типу адаптивных си
стем. Несмотря на простоту основной идеи, системы с кос
венной адаптацией обладают рядом недостатков. Вопер
вых, описанная выше стратегия требует дополнительного
времени на изучение объекта, что приводит к задержке
при выработке правильного управления. Вовторых, цели
функционирования настраиваемого регулятора и блока
оценки параметров оказываются, по существу, различны
ми. Цель функционирования регулятора — обеспечение
желаемого поведения регулируемой переменной y, в то
время как цель блока идентификации — получение оце
нок параметров объекта управления. В этом смысле цепь
настройки параметров является разомкнутой по главной
цели управления: блок настройки параметров не отсле
живает качество выходного сигнала и не связывает ошиб
ку выхода с возможными неточностями идентификации
параметров.
Более совершенной, хотя и более сложной в реализа
ции, является стратегия, состоящая в настройке пара
метров регулятора из условия минимизации ошибки уп
равления. При этом и настраиваемый регулятор, и блок
(алгоритм) его настройки объединяются единой целью
функционирования. На таком принципе основаны безы
дентификационные адаптивные системы (или системы с
прямой адаптацией). Выделяют два вида систем с прямой
адаптацией:
· системы с эталонной моделью;
· системы экстремального регулирования.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 167

В системах с эталонной моделью (рис. 15.3) цель уп


равления задается с помощью эталонного (модельного)
значения регулируемой переменной yМ(t). Для выработ
ки эталонного значения регулируемой переменной yМ(t),
как правило, используется специальный динамический
блок — эталонная модель (отсюда второе название эталон
ной переменной — модельная переменная). Наиболее ча
сто эталонная модель (ЭМ) реализуется в виде линейной си
стемы, формирующей желаемый отклик на задающее воз
действие g(t). Настраиваемый регулятор строится таким
образом, чтобы при соответствии его коэффициентов пара
метрам объекта управления его замкнутая система вела себя
точно так же, как эталонная модель. Тогда информацию о
параметрических рассогласованиях в системе будет не
сти ошибка слежения за эталонной моделью e = y – yM.
При этом в качестве цели работы алгоритма адаптации 
(или алгоритма настройки коэффициентов регулятора)
естественно принять минимизацию ошибки e. Таким об
разом, происходит объединение самого регулятора и ал
горитма его адаптации единой целью — минимизацией
ошибки слежения за эталонной моделью. Отметим, что,
в отличие от идентификационного подхода, в данном слу
чае не требуется проведения процедуры оценки неизвест
ных параметров объекта, а коэффициенты регулятора на
страиваются непосредственно из условия выполнения
главной цели управления.

Рис. 15.3
Система адаптивного управления с эталонной моделью
168 А. Ю. ОЩЕПКОВ

Рис. 15.4
Система экстремального регулирования

Адаптивные системы с эталонной моделью впервые


были предложены более сорока лет назад*. В настоящее
время адаптивные системы с эталонной моделью представ
ляют собой хорошо разработанный класс адаптивных си
стем, получивших наиболее широкое распространение в
практических реализациях и широко представленных в
научной литературе**.
Альтернативный подход к построению безыдентифи
кационных адаптивных систем состоит в том, чтобы
сформировать некоторый критерий качества Q = Q(y(t)),
значение которого достигает минимума (максимума) при
соответствии коэффициентов регулятора параметрам
объекта управления. Тогда настройку параметров объек
та управления можно вести из условия минимизации (мак
симизации) значения критерия качества. Самонастраива
ющиеся системы, основанные на таком принципе, полу
чили название систем экстремального регулирования***.
Их структура представлена на рисунке 15.4.
Здесь в качестве примера работы систем с прямой адапта
цией рассмотрим систему управления с эталонной моделью
для непрерывного объекта первого порядка. В следующей
лекции опишем идентификационный адаптивный алго
ритм для дискретных систем.
* Osburn, P. V. New development in the design of adaptive control
system / P. V. Osburn, H. P. Whitaker, A. Kezer // Paper 61–39. Inst.
Aerospace Sc. 29th Annual Meeting. N. Y. — 1961.
**
Мирошник, И. В. Нелинейное и адаптивное управление сложны
ми динамическими системами / И. В. Мирошник, В. О. Никифоров,
А. Л. Фрадков. — СПб. : Наука, 2000. — 549 с.
*** Растригин, Л. А. Системы экстремального регулирования. — М. :
Наука, 1974.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 169

15.3.
АДАПТИВНОЕ УПРАВЛЕНИЕ
С ЭТАЛОННОЙ МОДЕЛЬЮ
ОБЪЕКТОМ 1ГО ПОРЯДКА
Рассмотрим скалярный объект, описываемый уравне(
нием, подобным (14.1):
11 1 21 3 21 (15.1)
где x — регулируемая переменная; u — сигнал управле(
ния; q — постоянный параметр, который неизвестен. Ро(
бастный регулятор достигает цели управления с приемле(
мой точностью при неизменных коэффициентах регули(
рования. Теперь попытаемся одновременно определить
значение неизвестного параметра в ходе работы регулято(
ра и достичь цели управления с наибольшей точностью.
Вход системы (задающее воздействие) описывается фун(
кцией времени g(t). Мы хотим, чтобы выход системы при(
ближался к входному сигналу так же, как для эталонной
модели
21 1 1 2321 4 331 (15.2)
где сигнал xМ носит название эталонного выхода, а поло(
жительная постоянная l определяет желаемые динами
ческие свойства замкнутой системы. Очевидно, что мо(
дель (15.2) можно переписать в виде передаточной функции:

21 233 1 1 4 2334
53 2 1
где Т = 1/l — постоянная времени апериодического звена
первого порядка. Введение эталонной модели позволяет
формализовать постановку задачи, потребовав выполне(
ния целевого условия:
1234 3425 3 31 4255 4 6 (15.3)
2 12

для любых задающих воздействий g(t). Другими словами,


необходимо синтезировать управление u, обеспечивающее
нулевое установившееся значение ошибки слежения за
эталонной моделью:
e = x – x M. (15.4)
Алгоритм адаптивного управления удобно представить
в виде двух блоков:
170 А. Ю. ОЩЕПКОВ

· настраиваемого регулятора
u = –lx – xx + lg; (15.5)
· алгоритма адаптации
11 2 3142 134 (15.6)
Структура алгоритма адаптации t(e, x) будет опреде
лена ниже. В уравнениях (15.5), (15.6) x — настраиваемый
параметр регулятора, генерируемый алгоритмом адапта
ции из условия минимизации ошибки слежения e. Особо
отметим, что порядок замкнутой системы повысился за
счет включения в ее структуру динамического блока —
алгоритма адаптации (15.6). Поэтому при исследовании
устойчивости замкнутой системы необходимо расширить
вектор состояния, добавив новую координату — парамет
рическую ошибку: 11 2 1 3 4 .
Чтобы определить вид алгоритма адаптации, перейдем
к координатам e, 11 1 Подставляя (15.5) в (15.1), вычитая
из полученного уравнения (15.2) и принимая во внимание,
1
что 12 2 11 3 41 2 3411 получим следующую модель замкнутой
системы в координатах e и 11 (т. е. модель ошибки):
12 2 341 5 61 11 (15.7)
1
12 2 34152 134 (15.8)
Для выбора структуры алгоритма адаптации t(e, x) ис
пользуем функцию Ляпунова вида

1 314 21 5 3 2 11 4 2 21 1 4 (15.9)
1 15
где g — произвольный положительный коэффициент. То
гда производная функции (15.9) в силу уравнений (15.7),
(15.8) после элементарных преобразований принимает вид
11 314 22 5 3 4511 6 21 2 2 4 2 27
2 314 256 (15.10)
8
Очевидно, что при выборе t(e, x) = gex после сокраще
ния одинаковых слагаемых получаем
11 213 22 4 3 4511 6 56 (15.11)
Из последнего неравенства следует устойчивость по Ля
пунову состояния равновесия 112 21 3 3 142 43 (в силу теоре
мы 8.2) и выполнения (в силу уравнения (15.7)) равенства
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 171

123 3415 4 6
1 12

(сходимость по переменной e), что означает выполнение


целевого условия (15.3).
Другими словами, алгоритм адаптивного управления
(рис. 15.5)
u = –lx – xx+ lg,
11 2 341 (15.12)
обеспечивает асимптотическое слежение за эталонной мо:
делью для параметрически неопределенного объекта (15.1).
Коэффициент g в формуле (15.12) определяет скорость
настройки параметра x и носит название коэффициента
адаптации. В структуре алгоритма адаптации (15.12)
присутствуют функции времени e(t) и x(t), которые назы:
вают сигналом ошибки слежения (e(t)) и регрессором (x(t)).
В приложении 3 описывается построение S:модели систе:
мы адаптивного управления с эталонной моделью и приве:
дены примеры ее работы.

Рис. 15.5
Структурная схема системы адаптивного управления
с эталонной моделью объектом первого порядка

Упражнение 15.1.
Постройте с помощью Simulink компьютерную модель
системы адаптивного управления, соответствующую
структурной схеме рисунка 15.5. Исследуйте работу
системы для g(t) = 5sint, q = –2, l = 10 при разных зна:
чениях коэффициента адаптации g.
172 А. Ю. ОЩЕПКОВ

Постройте графики величин e(t), u(t), x(t), xM(t) для


g = 10, 5, 0,1, 0,01; сделайте вывод о роли коэффици
ента адаптации.

Адаптивный алгоритм (15.12) автоматически опреде


ляет значение неопределенного параметра q, следователь
но, является робастным алгоритмом по отношению к па
раметрическим возмущениям. Однако адаптивные систе
мы обладают высокой чувствительностью к структурным
и сигнальным возмущениям. Если объект подвергается
воздействию внешнего возмущения Fd(t), как в случае за
дачи стабилизации температуры (7.12)
21 1 22 3 3 3 41 1523 (15.13)
то можно показать [5], что параметрическая ошибка 11
будет неограниченно расти при малых значениях ошибки
слежения e, что недопустимо. Поэтому для управления
параметрически неопределенным объектом в условиях
внешних возмущений применяются другие, специальные
алгоритмы, компенсирующие внешние возмущения*.
Другим развивающимся в настоящее время подхо
дом к синтезу систем управления в условиях неконтро
лируемых возмущений является разделение системы
управления на подсистему с медленным движением и с
быстрым движением. Это достигается искусственным
введением в систему управления малого параметра в ре
зультате применения большого коэффициента усиления
в законе обратной связи. Такой метод получил название
синтеза систем управления с разнотемповыми процес
сами**.
Можно использовать более простые идентификацион
ные алгоритмы (см. рис. 15.2), определяющие значения
параметров и величину внешнего возмущения в ходе фун
кционирования системы. Пример такого алгоритма рас
смотрим в следующей лекции.

* Никифоров, В. О. Адаптивное и робастное управление с компенса


цией возмущений. — СПб. : Наука, 2003. — 282 с.
** Юркевич, В. Д. Синтез нелинейных нестационарных систем управ
ления с разнотемповыми процессами. — СПб. : Наука, 2000. — 288 с.
Есть только свет,
что тьма не победит!
И. А. Бунин

Л Е К Ц И Я 16

РОБАСТНЫЕ И АДАПТИВНЫЕ
АЛГОРИТМЫ УПРАВЛЕНИЯ
ДИСКРЕТНЫМИ СИСТЕМАМИ
16.1.
ГРАДИЕНТНЫЙ МЕТОД
Как уже говорилось в лекции 10, в настоящее время все
бо´льшую роль играет синтез управления дискретными
системами. Рассмотрим некоторые современные подходы
к решению этой проблемы. Математическую модель ди+
скретной системы управления представим в виде
xk + 1 = fk (xk, uk), (16.1)
где k = 0, 1, 2, ... — номер стадии функционирования ди+
скретной системы или номер очередного момента измере+
ния и подачи управления tk; xk Î Rn — вектор переменных
состояния (фазовых переменных); uk Î Rm — вектор вхо+
дов (управлений), соответствующих моменту tk.
Рассмотрим градиентный метод [6], который предназ+
начен для построения управления моделью (16.1) в слу+
чае, когда цель управления задана при помощи некото+
рой гладкой неотрицательной целевой функции Q = Q(x)
в виде
Q(xk + 1) £ D, при k > k*, (16.2)
где D > 0 — заданное значение порога точности задачи.
В качестве целевой функции, аналогично непрерывному
случаю (14.12), может быть выбрана функция дискретно+
го аргумента:
2 331 11 4 2 1 3 31 11 4 32 5 31 11 4 32 56 (16.3)
7
Выразим очередное состояние объекта из (16.1) и под+
ставим в (16.2). Тогда получим приведенную целевую
174 А. Ю. ОЩЕПКОВ

функцию (точнее, семейство функций Qk(u), зависящих от


номера шага), непосредственно зависящую от управления:
Qk(u) = Q(fk(xk, u)). (16.4)
Градиентный метод основан на изменении вектора uk
в направлении, противоположном направлению градиен*
та (вектора из частных производных) от функции Qk по
управляющим переменным:
uk +1 = uk – gkÑuQk(uk), (16.5)
1
1 2
где 42 5 6 3 23332 3 7 — вектор градиента; gk ³ 0 — ко*
9 321 323 8
эффициент шага по управлению. Идея метода хорошо из*
вестна в теории оптимизации: при малом gk поправка
Duk = uk + 1 – uk приводит к уменьшению значения функ*
ции Qk(u). В более изощренном выборе нет необходимо*
сти, поскольку на следующем шаге управления целевая
функция изменится в силу динамики системы. Однако
простая форма алгоритма не означает простоты условий
его применимости. Условия, гарантирующие достиже*
ние цели управления (16.2) в системе (16.1) с алгорит*
мом (16.5), определяются дополнительно*. В число этих
условий входят выпуклость функции Qk(u) по u, существо*
вание общего решения u = u* системы целевых неравенств
Qk(u) < D и выбор коэффициента шага gk с зоной нечувстви*
тельности:
если Qk(uk) £ D, то gk = 0. (16.6)
Условие (16.6) означает, что при достижении цели регу*
лирования вектор управления компенсирует внешние воз*
действие, не изменяясь по величине, аналогично алгорит*
му ПИ*регулятора (10.9).
Очевидно, что ПИ*алгоритм для дискретных систем
является частным случаем градиентного метода так же,
как в непрерывном случае интегральный закон регулиро*
вания является частным случаем алгоритма скоростного

* Фомин, В. Н. Адаптивное управление динамическими объектами /


В. Н. Фомин, А. Л. Фрадков, В. А. Якубович. — М. : Наука, 1981.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 175

градиента (14.15). Рассмотрим подробнее связь между ПИ*


регулятором и градиентным методом для линейного объек*
та первого порядка. Пусть разностное уравнение движе*
ния имеет вид, аналогичный (10.6). В общем случае его
можно представить в следующей форме:
xk + 1 = Axk + Buk + F, (16.7)
где A, B и F — некоторые константы. Рекуррентный ПИ*
алгоритм, полученный путем дискретизации непрерывной
системы, определяется выражением (10.8), которое запи*
шем в виде
31 11 4 31 5 4 26 1 1 2 37 51 11 1 451 3 (16.8)
8 22 9
Найдем алгоритм управления, который получается на
основе градиентного метода с целевой функцией вида (16.3).
Поскольку выражение (16.8) получено для задачи стаби*
лизации при x* = 0, то целевая функция в рассматривае*
мом случае принимает простой вид:
2 331 12 4 2 2 31 121 5 (16.9)
1
Подставим (16.7) в (16.9) и найдем частную производ*
ную полученной функции по переменной u
221 233
3 2 451 1 631 1 7 3 4 6 3 651 11 4 (16.10)
23
Подстановка (16.10) в формулу (16.5) приводит к за*
кону управления
uk + 1 = uk – gk × B × xk + 1, (16.11)
с учетом условия (16.6), имеющего в данном случае вид:
2 1
если 21 12 2 3 , то gk = 0.
1
Мы получили, что применение градиентного метода
привело к алгоритму (16.11), похожему на алгоритм (16.8),
но без слагаемого, содержащего xk (значение переменной
состояния на предыдущем шаге). Кроме того, ПИ*алго*
ритм не предусматривает выполнения условия типа (16.6).
При приближении к цели управления эти отличия стано*
вятся несущественными.
176 А. Ю. ОЩЕПКОВ

Сравнительный анализ законов управления (16.8)


и (16.11) позволяет предложить для произвольного объек"
та первого порядка (16.7) следующий робастный алгоритм:
21 11 2 21 3 41 31 113
54
8 6 45 31 112 6 73
41 2 9
8 45 31 112
76 (16.12)

Алгоритм (16.12) нужно исследовать на устойчивость.


Упражнение 16.1.
Исследуйте систему управления (16.7) с алгоритмом
управления (16.12) на устойчивость. Найдите допу"
стимые значения коэффициента G.
Ответ: 2 3 1 1 1 2 если A > 1. В остальных случаях
G > 0. 2

16.2.
БЫСТРЫЕ АЛГОРИТМЫ
ДЛЯ ОБЪЕКТОВ 1ГО И 2ГО ПОРЯДКОВ
Рассмотрим дискретную систему 1"го порядка, номи"
нальная модель которой имеет вид (16.7)
xk + 1 = Axk + Buk + F, k = 1, 2, ..., 11 1 11 1 2 12 (16.13)
В отсутствии управления (uk º 0) объект является асим"
птотически устойчивым при | A | < 1. В этом случае предель"
ное значение дискретной переменной состояния, обуслов"
ленное наличием внешнего воздействия C, будет равно
123 31 3 2 4 (16.14)
1 12 54 4

Упражнение 16.2.
Найдите предельное значение переменной xk для диск"
ретной модели непрерывной системы (10.6) при uk = 0.
Сравните полученный результат с непрерывным слу"
чаем.

Выберем цель регулирования в виде (16.2) с целевой


функцией (16.9). При D ® 0 цель регулирования (16.2)–
(16.9) можно записать в простой форме:
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 177

xk + 1 ® 0, при k > k*. (16.15)


Если параметры номинальной модели соответствуют
реальной системе, цель регулирования (16.15) может быть
достигнута за один шаг с помощью управляющего воздей8
ствия*
21 1 2 1 2 341 3 5 34 (16.16а)
6
Подстановка (16.16а) в (16.13) даст xk + 1 = 0, поэтому
для дальнейших шагов получим
31 11 2 3 2 2 uk + 2 = uk + 1, k = 1, 2, ... (16.16б)
4
Алгоритм управления (16.16) назовем быстрым алго
ритмом (fast algorithm). Если возможности управления
ограничены и управляющее воздействие, рассчитанное по
формуле (16.16а), превосходит максимально возможное
значение Umax, на вход объекта управления должна пода8
ваться величина Umax с соответствующим знаком, что обес8
печит движение системы в нужном направлении, анало8
гично градиентному методу.
Рассмотрим теперь систему управления, математиче8
ская модель которой имеет вид дифференциального урав8
нения 28го порядка:
1
14 1 2 2 12 2 2 3 3 4 4455 2 63 , (16.17)
151 15
где X — отклонение регулируемой величины от заданно8
го значения (в безразмерных единицах); F0 — внешнее
воздействие; u(t) — управляющее воздействие; K — мас8
штабный множитель. Величина e > 0 представляет собой
безразмерный параметр, эффективно учитывающий инер8
ционные свойства объекта либо наличие дополнительно8
го динамического звена в системе управления объектом
18го порядка. Величины X(0) и 1 1 123 предполагаются не
равными нулю. Цель регулирования
1 122 1 34 t ® ¥.
1122 1 34 1 (16.18)

* Кунцевич, В. М. Адаптивное управление: алгоритмы, системы, при8


менение. — Киев : Вища шк., 1988. — 64 с.
178 А. Ю. ОЩЕПКОВ

Перепишем уравнение (16.17) в фазовом пространстве


состояний:
1 11 4
1 1 2

1 1 2 1 3 1 2 1 3 1 4 1 52 3 3546 4 5 67
1 (16.19)
2
5 1 5 2 5 3

Величину X1 = X будем называть координатой, а X2 —


скоростью.
Чтобы синтезировать быстрый алгоритм для объекта с
инерцией*, аналогичный (16.16), проведем дискретизацию
системы с периодом квантования Dt, аппроксимируя мат*
ричную экспоненту по методу Эйлера. Получим дискрет*
ную систему, эквивалентную непрерывной:
11 32 1 14 2 11 324 1 1 3 12 3245
4
12 32 1 14 2 56 3 11 324 1 31 5 64 3 12 324 1 3 3 4 324 1 56 (16.20)

где Xi(k) º Xi(k × Dt), k = 0, 1, 2, ... и введены удобные для


последующей работы обозначения:

2 3 11 3 4 3 2 3 2 3 11 5 33 4 3 11 5 51 4 (16.21)
6 11 6 6
Цель регулирования (16.18) для дискретного случая
запишется в виде
X1(k) = 0, X2(k) = 0, k ³ k*. (16.22)
Быстрым алгоритмом, как и в предыдущем случае,
назовем алгоритм, достигающий цели (16.22) при наи*
меньшем количестве шагов.
Будем считать, что измерению доступен полный век*
тор состояния {X1, X2} (управление по состоянию). По*
скольку управляющее воздействие входит только в одно
из двух выражений системы (16.20), мы не можем подо*
брать его таким, чтобы цель (16.22) была достигнута за
один шаг, как это было для системы 1*го порядка. Проведя

* Ощепков, А. Ю. Универсальные быстрые алгоритмы управления


для объектов с инерцией / А. Ю. Ощепков, К. А. Исаков // Приборы
и системы. Управление, контроль, диагностика. — 2009. — № 3. —
С. 10–16.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 179

измерения выходного вектора системы на k&м шаге, можно


потребовать выполнения условия X2(k + 1) = 0, означаю&
щего уменьшение скорости до требуемого нулевого значе&
ния. Из этого условия получим

2 334 2 3 1 3 2 32 3 14 4 41 334 5 1 42 3345 (16.23)


5 5 5
Последовательное применение данного алгоритма за
два шага переводит систему в стационарное состояние:
X1(n + 1) = X1(n), X2(n + 1) = 0, n > k + 1.
Цель регулирования (16.22) не достигается.
Попробуем теперь выбрать управляющее воздействие
из условия X2(k + 1) = –bX1(k):
1
2 334 3 4 1 4 2 32 4 24 5 41 334 6 2 42 334 4 42 3345 (16.24)
5 5 5 5
Подстановка выдвинутого условия в первое равен&
ство системы (16.20) дает: X1(k + 2) = X1(k + 1) – X1(k),
X2(k + 2) ¹ 0. Таким образом, система не останавливается
в результате однократного применения управления (16.23),
однако координата изменяется в сторону уменьшения, т. е.
в требуемом направлении, как это происходит при приме&
нении описанного ранее градиентного метода. Если будем
чередовать на последовательных шагах управления (16.23)
и (16.24), то, начав с k = 0, получим цепочку значений уп&
равляющих воздействий и выходных величин:
1. 12 415 1 121 6 13 415 1 131 7
2 415 2 3 1 3 3 43 3 15 4 321 5 1 331 6
4 4 4
1 2 1
2. 12 425 1 12 2 13 6 13 425 1 17
3
1 1
2 213 2 3 3 31 2134
4 4
3. 11 324 1 11 3145 12 324 1 23 11 3146
2 314 2 3 1 3 2 32 3 14 4 31 314 5 1 32 3145
4 4 4
4. 11 345 1 67 12 345 1 68
2 123 1 2 1 4
3
180 А. Ю. ОЩЕПКОВ

Далее выполняются условия


21 334 1 56 22 334 1 57 4 334 1 2 1 6 n ³ 3. (16.25)
5
Таким образом, чередование алгоритмов (16.23) и (16.24)
переводит дискретную систему (16.20) из любого началь$
ного состояния в заданное состояние за 4 шага регулиро$
вания.
Формулы для алгоритмов (16.23) и (16.24) отличают$
1
ся только слагаемым 1 2234 поэтому окончательно
3 1
быстрый алгоритм для систем с инерцией, управляемых
по состоянию, может быть описан одним выражением:

3 314 4 5 2 5 2 32 5 34 6 41 314 7 3 42 314 7


5 5 5
2 8
7 13524 5 22 42 3145 1 4 65 25 15 777
1 (16.26)
1 5
Если параметры системы, входящие в алгоритмы (16.16)
или (16.26), не известны или могут изменяться в ходе ра$
боты системы управления, необходимо их идентифици$
ровать. Ниже рассмотрим способ идентификации пара$
метров на основе методов линейной регрессии для систе$
мы 1$го порядка.

16.3.
ИДЕНТИФИКАЦИОННОЕ АДАПТИВНОЕ
УПРАВЛЕНИЕ ОБЪЕКТОМ 1+ГО ПОРЯДКА
НА ОСНОВЕ МЕТОДОВ
ЛИНЕЙНОЙ РЕГРЕССИИ

Неизвестные параметры системы (16.13) можно най$


ти, применив в течение нескольких шагов любой устой$
чивый робастный алгоритм (предполагается, что парамет$
ры системы в течение этих шагов не изменяются). В ре$
зультате мы получим идентификационный адаптивный
алгоритм управления на основе быстрого алгоритма. Рас$
смотрим его подробнее.
Будем использовать П$регулятор на первых трех ша$
гах управления: uk = –KPxk, k = 0, 1, 2. В результате, в со$
ответствии с (16.13), получим три выражения:
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 181

x1 = Ax0 + Bu0 + F,
x2 = Ax1 + Bu1 + F,
x3 = Ax2 + Bu2 + F. (16.27)
Здесь значения входов объекта uk и измеряемых выхо/
дов xk, k = 0, 1, 2, 3 — являются известными величинами,
а три параметра A, B, F составляют вектор неизвестных
параметров, подлежащих идентификации*.
Введем векторы | x ñ, | Y ñ и матрицу G3 по правилам:
2 11 3 2 1 3 2 21 3 2 22 32 1 3
1 6 4 13 5 7 4 4 5 5 5 6 4 23 55 64 6 4 21 31 1 55 (16.28)
4 5 4 5 44 55 4 5
41 5 4 7 5 42 33 1 59
8 49 8 9 8 24 9 8 3
тогда систему уравнений (16.27) можно записать в виде
G3 × | x ñ = | Y ñ. (16.29)
Вектор неизвестных параметров определится после
решения (16.29):
3 23 4 1211 5 3 2 34 (16.30)
Определив параметры A, B, F, можем синтезировать
быстрый алгоритм (16.16) при k = 3. С целью фильтрации
возможных ошибок измерений алгоритм идентифика/
ции позволяет использовать n начальных шагов, где n ³ 3.
В этом случае вместо системы трех уравнений (16.29) мы
получим следующую систему:
2 22 3 2 21 31 23
42 5 4 2 32 2 5
3 2
41 6 4 78 9 4 5 85 4 5 8 9 4 55 41 9 4 56 (16.31)
41 5 4 1 1 15
42 5 42 5

1
112 3112 2
Система (16.31) содержит число уравнений, превосхо/
дящее количество неизвестных, т. е. является несовмест/
ной. Для решения используется метод наименьших квад/
ратов или другие методы линейного регрессионного анали/
за. Полученный вектор будет называться псевдорешением
системы (16.31).

* Льюнг, Л. Идентификация систем. Теория для пользователя. — М. :


Наука, 1991. — 432 с.
182 А. Ю. ОЩЕПКОВ

Заметим, что произведение матрицы Gn из (16.31) на


транспонированную матрицу 1 1 даст квадратную сим
1
метричную матрицу размерности 3´3, для которой мож
но найти обратную матрицу. Умножив обе части систе
1 и проведя операцию обращения квад
мы (16.31) на 1 1
ратной матрицы, найдем вектор | x ñ:
2 23 4 321 2 4 11 5 21 5 2 3 35
1 1 1 (16.32)
Вычисления по формуле (16.32) легко провести в
MATLAB. Следует, однако, иметь в виду, что при до
стижении цели регулирования (16.15) первый столбец
матрицы Gn будет состоять из нулей, поэтому расчеты по
формуле (16.32) становятся невозможными. С другой сто
роны, достижение цели регулирования говорит о правиль
ной идентификации параметров объекта, следовательно,
их не нужно рассчитывать, а следует брать их предыду
щие значения. Аналогично (16.2) нужно назначить зна
чение порога точности задачи D > 0, а целевую функцию
определить как сумму квадратов переменных состояния
на всех n шагах этапа идентификации
1
41 2 3 5211 3 3 (16.33)
3 22

Полностью работа идентификационной адаптивной


системы управления на основе быстрого алгоритма долж
на быть описана следующим образом:
21 11 31 11
41 11 2 35 4 61 11 3 7 2 5 2 2 72 3 (16.34)
81 11 81 11
Здесь Ak + 1, Bk + 1, Fk + 1 — значения параметров систе
мы на (k + 1)м шаге, определенные по алгоритму:
· если Qn > D, то Ak + 1 = x1, Bk + 1 = x2, Fk + 1 = x3, вектор
| x ñ определяется по формуле (16.32);
· если Qn £ D, то
Ak + 1 = Ak, Bk + 1 = Bk, Fk + 1 = Fk. (16.35)

Упражнение 16.3.
Составьте структурную схему замкнутой системы уп
равления с алгоритмом (16.24), (16.25).
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 183

Построение Sмодели системы идентификационного


адаптивного управления системой 1го порядка и резуль
таты ее работы приведены в приложении 3.
Экспериментальные исследования* и результаты чис
ленного моделирования в MATLAB** показали возмож
ность реализации рассмотренного алгоритма управления,
его эффективность и преимущества по сравнению с опти
мально настроенными стандартными регуляторами. Зада
ча управления сложными системами, например распреде
ленным полем температуры в твердых телах, может быть
сведена к синтезу управления по независимым каналам
на основе математических моделей (16.13), если исполь
зовать декомпозицию объекта с помощью спектрального
метода***. Этот подход также успешно подтвержден рабо
той реальных систем управления****.

* Ощепков, А. Ю. Экспериментальные исследования адаптивного ре


гулятора для системы первого порядка / А. Ю. Ощепков, М. В. Серге
ев // Вестник Пермского университета. Сер. «Физика». — 2000. —
Вып. 6. — С. 78–80.
** Ощепков, А. Ю. Исследование свойств цифрового регулятора с
функцией самонастройки в среде MATLAB / А. Ю. Ощепков, В. В. Ки
рюшов // Вестник Пермского университета. Сер. «Информационные
системы и технологии». — 2005. — С. 37–42.
*** Martsenyuk, M. A. Precision control of thermal field in solid sample /
M. A. Martsenyuk, A. Yu. Oschepkov // Physics and Control 2005 : Proc.
Intern. Conf., Aug. 24–26. — St. Petersburg, 2005. — P. 750–753.
**** Ощепков, А. Ю. Термоградиентная стабилизация температурных
полей в твердых телах / А. Ю. Ощепков, М. А. Марценюк, В. В. Кирю
шов // Вестник Пермского университета. Сер. «Физика». — 2011. —
Вып. 2 (17). — С. 52–64.
Вот повести моей конец...
В. А. Жуковский

ЗАКЛЮЧЕНИЕ

Если, уважаемый читатель, вы внимательно прочитали эту


книгу и вам удалось решить все упражнения, значит, вы
освоили самые простые методы традиционной и современ
ной теории управления, а также познакомились с элемен
тами моделирования и конструирования систем автомати
ческого управления (назовем их обобщенно кибернетиче
скими методами). Если вы проштудировали литературу,
приведенную в библиографическом списке, и просмотре
ли хотя бы несколько источников, указанных в постра
ничных сносках, то наверняка почувствовали интерес к
этой области науки, и у вас возник естественный вопрос:
«Где можно применить полученные знания?»
Перечислим для примера научные работы, проводи
мые на физическом факультете Пермского университета
и в других его подразделениях, посвященные исследова
нию свойств физических систем с применением обратных
связей. Исследования проводятся по научным направле
ниям, таким как: магнитный резонанс и спектроскопия,
гидродинамика жидкостей и газов, конвекция и теплооб
мен, гидромеханика невесомости, физика магнитных жид
костей, которые давно и успешно развиваются в универ
ситете. Научные школы по радиоспектроскопии и теоре
тической гидродинамике получили в 1996 г. официальный
статус ведущих научных школ России.
В настоящее время проводятся теоретические иссле
дования и компьютерное моделирование процессов управ
ления квантовыми системами, а именно: исследуются
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 185

управление динамикой мультиспиновых систем на осно(


ве обобщенных уравнений Блоха с помощью полей Раби и
способы подавления декогеренции. Областью применения
результатов этих работ является разработка способов за(
писи и хранения информации на квантовом уровне.
Специалисты по прикладной и теоретической гидро(
динамике используют активное управление с обратной
связью в задачах стабилизации механического равнове(
сия жидкости и надкритических конвективных режимов
при неравномерном нагреве жидкости в поле силы тяже(
сти. В качестве управляющего воздействия обычно выби(
рается изменение взаимной ориентации продольного гра(
диента температуры и вектора ускорения свободного па(
дения. Результаты исследований могут быть применены
для управления процессами тепломассопереноса в раз(
личных технологических установках и для решения воп(
росов безопасного функционирования теплообменных
систем.
В лабораториях университета и ОКБ «Маяк» при Пер(
мском университете проводятся исследования по синтезу
прецизионного управления температурными полями в
твердых телах в условиях внешних возмущений. При этом
используются высокоточные миниатюрные абсолютные и
дифференциальные датчики температуры и локализован(
ные нагревательные элементы. Осуществляется разра(
ботка контроллеров, реализующих идентификационные
адаптивные и робастные алгоритмы управления в много(
канальных системах. Основная область применения ре(
зультатов — это стабилизация формы поверхности эле(
ментов крупногабаритных оптических конструкций, в том
числе космического применения, а также прецизионная
термостабилизация оборудования при лабораторных из(
мерениях геометрических размеров на уровне нескольких
нанометров.
На приборостроительном предприятии «Системы кон(
троля», ведущими специалистами которого являются вы(
пускники физического факультета ПГУ, освоено серий(
ное производство приборов регулирования технологиче(
ских процессов марки «Термодат». Алгоритмы работы
186 А. Ю. ОЩЕПКОВ

этих цифровых приборов непрерывно совершенствуются,


в них учитываются самые новые методы теории управления.
Ученые университета проводят исследования по управ$
лению не только непрерывными, но и дискретными объек$
тами. Исследования явления коагуляции частиц в маг$
нитных жидкостях возбудили интерес к изучению меха$
низмов передвижения в жидкости живых организмов.
В настоящее время к области исследования дискретных
систем управления относится разработка теории управле$
ния биомеханическими системами, уравнения движения
которых заданы в виде дифференциальных форм Пфаф$
фа. Проводится компьютерное моделирование движения
плавающих тел в виде локомоторных циклов и процессов
адаптивного управления перемещениями тел в средах с
переменной структурой.
Новые работы по магнитному компьютерному ви´де$
нию, распознаванию образов и разработка способов нави$
гации в магнитном поле источника$ориентира, проводи$
мые в университете, также предполагают использование
обратных связей.
Приведенные примеры показывают, что кибернетиче$
ские методы все шире и шире применяются в физических
исследованиях. Интерес к этой области научных исследо$
ваний велик не только в России, но и во всем мире. Речь
идет даже о зарождении новой отрасли науки — кибер
нетической физики. Создано Международное общество
по физике и управлению (The International Physics And
Control Society — IPACS), основной целью которого явля$
ется расширение взаимодействия между исследователя$
ми, работающими в области, относящейся к физике и тео$
рии управления.
Очевидно, что современные специалисты, имеющие
физическое образование, должны быть знакомы с кибер$
нетическими методами исследования и уметь разрабаты$
вать современные системы автоматического управления.
Надеюсь, что данная книга внесет свой скромный вклад в
развитие процесса овладения физиками знаниями совре$
менных методов теории управления и в подготовку бу$
дущих специалистов в области кибернетической физики.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 187

В заключение выражаю благодарность руководителям


научных работ, проводимых на физическом факультете
Пермского государственного университета за проявлен0
ный интерес, внимание к работе и оказанные консульта0
ции, а также сотрудникам кафедры систем управления и
информатики Санкт0Петербургского государственного
университета информационных технологий, механики и
оптики и лаборатории «Управление сложными система0
ми» Института проблем машиноведения РАН (г. С.0Петер0
бург) за предоставление материалов, учебных пособий и
монографий, излагающих современные методы теории
управления. Особую благодарность выражаю президенту
IPACS, профессору Александру Львовичу Фрадкову, без
поддержки которого вряд ли появилась бы эта книга.
Кафедра компьютерных
систем и телекоммуникаций
Пермского государственного
национального исследовательского
университета,
доц. А. Ю. Ощепков,
1 июня 2012 г.
ПРИЛОЖЕНИЕ 1

ИСПОЛЬЗОВАНИЕ ФУНКЦИЙ MATLAB


ДЛЯ АНАЛИЗА СВОЙСТВ
ЛИНЕЙНЫХ СИСТЕМ

Система технических расчетов MATLABÒ c пакетом имита


ционного моделирования SimulinkÒ, разрабатываемая фирмой
MathWorks, непрерывно развивается. Модели систем управле
ния, приведенные в данном пособии, составлены с помощью вер
сий MATLAB 6.5 и Simulink 4. После получения навыков моде
лирования в этих версиях переход к использованию более высо
ких версий не составит большого труда. Кроме того, будет легко
понять и использовать моделирование в пакете SciLab, создан
ном разработчиками ОС Linux.

П1.1.
ФУНКЦИИ MATLAB ДЛЯ СОЗДАНИЯ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
СИСТЕМ УПРАВЛЕНИЯ
В данном приложении рассказывается, как с помощью
MATLAB создавать математические модели систем управления
в пространстве состояний и определять передаточные функции
систем, исследовать основные свойства систем (устойчивость,
наблюдаемость, управляемость), а также находить переходные
характеристики систем управления. Небольшие программы, ко
торые необходимы для моделирования, в MATLAB принято на
зывать скриптами. Скрипт — это определенная последователь
ность команд, набранных в командном окне (Command Window),
разделенных точками с запятой. Ввод последней команды без
точки с запятой приводит к выполнению всей программы.
Скрипт, выполненный в Command Window, повторно не ре
дактируется. Для редактирования и отладки программ их ре
комендуется оформлять в виде mфайлов*. Мфайлы могут быть

* Кетков, Ю. Л. MATLAB 6.x: программирование численных мето


дов / Ю. Л. Кетков, А. Ю. Кетков, М. М. Шульц. — СПб. : БХВПетер
бург, 2004. — 672 с.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 189

1 2 3 4 5 6 2 7 89
97
12345627 829
47 4   5 7

7 111 1 2345673189
676 491
7 111 1 23456731931
7 111 1 23456731931
7 111 1 234567319931
1
набраны в любом текстовом редакторе и затем скопированы в
командное окно. Однако лучшим вариантом является использо,
вание собственного редактора MATLAB. Редактор запускается
из основного окна MATLAB последовательными действиями
File ® New ® Mfile или нажатием специальной клавиши на
линейке управления основного окна MATLAB.
Очистка командного окна осуществляется командой clc,
очистка рабочего пространства (Workspace), созданного при
выполнении программ, производится командой clear.
Для определения модели в пространстве состояний и после,
дующего анализа во временно´й области необходимо согласно
ABCD,модели (3.10), (3.11) задать четыре матрицы (табл. П1.1).
Первое число в размерности матриц — количество строк, вто,
рое — количество столбцов.
Для систем с одним входом и одним выходом (SISO) p = m = 1.
При работе с матрицами в MATLAB нужно помнить, что эле,
менты строки разделяются между собой пробелами, а строки
отделяются друг от друга точками с запятой.
В MATLAB модель в пространстве состояний задается функ,
цией ss( ). Аргументами являются четыре матрицы. Построим,
например, математическую модель RLC,цепи, изображенной на
рисунке 3.1, при значениях параметров: R = 51 Ом, L = 100 мГн,
C = 20 мкФ. Ниже приведен скрипт для построения ABCD,мо,
дели и результат его выполнения:

Скрипт ПС1
% Математическая модель RLCцепи
% в пространстве состояний (State Space)
R = 51; L = 100e3; Ce = 20e6;
A = [0 1/Ce; 1/L R/L];
B = [1/Ce; 0]; C = [0 R]; D = 0;
su_ss = ss(A,B,C,D)

a=
x1 x2
x1 0 5e+004
x2 10 510
190 А. Ю. ОЩЕПКОВ

b=
u1
x1 5e+004
x2 0

c=
x1 x2
y1 0 51

d=
u1
y1 0
Continuoustime model.

Для задания передаточной функции объекта (ПФ) в соответ#


ствии с формулой (4.8) необходимо знать полином p(s), стоящий
в числителе ПФ, и полином q(s) — знаменатель ПФ. Полино
мы в MATLAB представляются в виде векторовстрок, со
стоящих из коэффициентов в убывающем порядке степеней.
Например, полином p(s) = s3 + 3s2 – 5 определится командой
p = [1 3 0 –5].
Передаточная функция в MATLAB описывается функци#
ей tf( ). Аргументы — полиномы числителя (numerator) и
знаменателя (denominator). Передаточная функция RLC#цепи
при вышеуказанных значениях параметров находится с помо#
щью MATLAB следующим образом:
Скрипт ПС2
% Передаточная функция (Transfer Function) RLC
цепи
R = 51; L = 100e3; Ce = 20e6;
pn = R; pd = [L*Ce R*Ce 1];
su_tf = tf(pn, pd)

Transfer function:
51
—————————————
2e006 s^2 + 0.00102 s + 1
Эти же функции (ss и tf) позволяют переходить от переда#
точной функции к эквивалентной модели в пространстве состоя#
ний и наоборот, т. е. реализуют алгоритмы, описанные в п. 4.4.
Если переменная su_ss описывает модель в пространстве состоя#
ний, в соответствии со скриптом ПС1, то в результате выполне#
ния команды

sys_tf = tf(su_ss)
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 191

переменная sys_tf примет выражение для передаточной функ)


ции из скрипта ПС2. Команда
sys_ss = ss(su_tf)
осуществляет переход от модели ПС2 к модели ПС1, т. е. sys_ss
и su_ss будут иметь одинаковый смысл моделей в пространстве
состояний, хотя переменные состояния в них могут отличаться
из)за неоднозначности выбора этих переменных.
Передаточная функция объекта, математическая модель
которого состоит из двух последовательно соединенных ПФ (см.
рис. 4.2), находится с помощью функции series(sys1,sys2), где
sys1 представляет ПФ G1(s), а sys2 — G2(s).
Если известны ПФ разомкнутой системы G(s) и обратной
связи H(s), с помощью MATLAB легко найти ПФ замкнутой си)
стемы. Для этого используется функция feedback(sysg,sysh),
где sysg и sysh — передаточные функции G(s) и H(s) соответ)
ственно, они должны быть определены заранее.

П1.2.
ИССЛЕДОВАНИЕ СВОЙСТВ
СИСТЕМ УПРАВЛЕНИЯ
Задав математическую модель СУ в MATLAB, можно далее
исследовать ее свойства и изучать поведение системы с течени)
ем времени.
Построение переходных характеристик. Важнейшей харак)
теристикой линейной системы является ее отклик на единич)
ное ступенчатое воздействие (переходная характеристика). Пе)
реходная характеристика системы, заданной переменной sys,
вычисляется в MATLAB с помощью функции step( ):

y = step(sys); % формирование зависимости


выходного сигнала
% от времени в виде массива plot(y), grid
% построение графика переходной характеристи
ки
% с нанесением сетки
xlabel(‘Время (с)’) % подпись оси x
ylabel(‘Выход системы’) % подпись оси y

Если необходимо вычислить переходную характеристику


системы sys за определенный интервал времени с определенным
шагом, необходимо использовать следующие команды:

t = [0:0.005:3]; [y,t] = step(sys,t);


plot(t,y),grid
192 А. Ю. ОЩЕПКОВ

xlabel(‘Время (с)’)
ylabel(‘Выход системы’)
Данный скрипт построит график переходной характери
стики в первые 3 с c шагом 0,005 с.
Реакция системы на импульсное воздействие (весовая функ
ция) определяется с помощью функции impulse( ). Примене
ние этой функции полностью аналогично функции step( ).
Если воздействие является произвольной функцией време
ни (например, линейное, квадратичное, синусоидальное и т. д.),
то для исследования отклика системы используют функцию
lsim( ). Обязательными аргументами этой функции являются
переменные, описывающие систему и воздействие.
Пример применения функции lsim( ) описывает следующий
скрипт:
t = [0:0.0001:0.02];
u = 2*t; % формирование массива воздействия
[y,T] = lsim(sys,u,t); % формирование функции
отклика
plot(T,y), grid

Здесь Т — вектор времени моделирования.


Управляемость и наблюдаемость систем. Для проверки
свойств управляемости и наблюдаемости необходимо найти мат
рицу управляемости Pc (3.13) и матрицу наблюдаемости Q (3.14).
Если известны матрицы A, B и C, то матрицы Pc и Q определя
ются с помощью функций ctrb( ) и obsv( ) соответственно:
Pc = ctrb(A,B);
Q = obsv(A,C).
Для того чтобы найти определители этих матриц, нужно
использовать функцию det( ), аргументом которой является
соответствующая матрица. Система управляема, если опреде
литель матрицы Pc отличен от нуля. Система наблюдаема, если
определитель матрицы Q отличен от нуля.
Встречаются случаи, когда созданная математическая мо
дель системы не является полностью управляемой, но ее можно
привести к управляемой системе. Для этого необходимо найти
передаточную функцию системы и сократить в ее числителе и
знаменателе одинаковые сомножители. Затем найти по этой
передаточной функции новую, модифицированную систему в
переменных состояния. Функция tf( ) автоматически сокраща
ет одинаковые множители в передаточной функции при ее по
лучении, поэтому для получения модифицированной системы
в переменных состояния необходимо получить передаточную
функцию системы и применить к ней функцию ss( ).
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 193

П1.3.
АНАЛИЗ УСТОЙЧИВОСТИ
СИСТЕМ УПРАВЛЕНИЯ
В соответствии с теоремой 9.1 для асимптотической устой&
чивости линейной системы необходимо и достаточно, чтобы кор&
ни характеристического уравнения матрицы A (они же полюсы
передаточной функции) были отрицательными.
В MATLAB вычисление собственных значений матрицы A
осуществляется при помощи функции eig(A). Нахождение ха&
рактеристического полинома, соответствующего матрице A, осу&
ществляется с помощью функции poly(A), а корни характери&
стического уравнения находятся с помощью функции roots(),
аргументом является характеристический полином.
Если система в MATLAB задана передаточной функцией
sys_tf, то следует использовать функцию pole(sys_tf), которая
формирует вектор&столбец полюсов системы. Проанализировав
их, можно сделать выводы об устойчивости системы.
Введение цепи обратной связи изменяет свойства объекта.
Неустойчивую разомкнутую систему можно превратить в устой&
чивую и даже добиться выполнения некоторых желаемых свойств,
определенным образом подобрав матрицу обратной связи.
Для системы с одним входом и одним выходом матрицу
коэффициентов обратной связи по состоянию K = [k1, k2, ..., kn],
с помощью которой формируется управляющий сигнал u = –Kx,
можно определить с помощью формулы Аккермана. Если задан
желаемый характеристический полином замкнутой системы
(т. е. известны ее полюсы)
q(s) = sn + a1sn – 1 + ... + an,
то матрица коэффициентов обратной связи по состоянию опре&
деляется выражением
1 2 23 3 444 1521112 6378 (П1.1)
где q(A) = A + a1 n + ... + an – 1A + anI, Pc — матрица управ&
An – 1
ляемости; I — единичная матрица.
Перечень функций, применяемых для построения матема&
тических моделей систем управления и их анализа, приведен в
таблице П1.2.
1 2 3 4 5 6 2 7 89
7
123456789

8 33682345668

12345467489
546 9 923 838 49 8 79

 8
2 95
9
83
9
9 9999
12345467489243458 992 92 6
 8


968467999
484679 9
1
194 А. Ю. ОЩЕПКОВ

1 2 3 4 3 5 6 7 8 9 7
5
1

123456789

8 33682345668

12345467489
546 9 923 838 49 8 79
8 2 9 48 9243458  9
92434
4799
12345467489243458 992 9
8 48 9
5469 923 838 49 8 7
92434
4799
12345467489243458 995 9
 8 2 645 846  9 45496  9 2
4
92434
4
999 9
12345467489243458 9984
9
9 38 9 7 9&9!9243458 79
!"#$%&'8 79 "48 9'9!9243458 79
79429 38 9 79
&
8 #67489 8 449479
839
9
!
8 $ 589 234546846 9
839
9

()*
8 1234546748938438492 6
9

839
9
))(8 $ 589 392 6
9(9
$ 5892 69243458  99
()*8
9
12345467489
83923 674
892 9
$"
 8 48
9
83
9
99 9

)"+
,8 12345467489
839654
892 9
48
9
83
9
99,9
% 3
34892434 59384389
(8
84
9 9 549
 9

-(.*8 % 3
3489 4 9984
9 9 549

 9

*-.8 #6748934984
99  5 49 
548 49.
7 67&4479499
1
ПРИЛОЖЕНИЕ 2

МОДЕЛИРОВАНИЕ И НАСТРОЙКА
ПИДРЕГУЛЯТОРОВ
В ПАКЕТЕ SIMULINK

П2.1.
ПОСТРОЕНИЕ SМОДЕЛИ
ПИДРЕГУЛЯТОРА
ДЛЯ НЕПРЕРЫВНЫХ СИСТЕМ
Построение моделей средствами Simulink (Sмоделей)* ос
новано на использовании технологии draganddrop (перета
щить и бросить). В качестве «кирпичиков» для построения ис
пользуются блоки, хранящиеся в библиотеках Simulink. Та
ким образом, пакет Simulink, обеспечивая пользователю доступ
ко всем основным возможностям системы MATLAB, является
в то же время самостоятельным ее компонентом, для работы с
которым нет необходимости иметь навыки в использовании
других инструментов, входящих в состав системы. Несомнен
но, что лучший способ изучить работу Simulink — это работа в
Simulink.
Основные блоки пакета Simulink, которые должны быть ис
пользованы при построении Sмодели ПИДрегулятора для не
прерывных систем, приведены в таблице П2.1. Для создания
Sмодели необходимо открыть окно построения моделей Simu
link и построить модель, перенося в окно необходимые блоки.
Перед построением модели ПИДрегулятора нужно опре
делить, в какой форме удобнее представить объект управле
ния: в пространстве состояний или в виде передаточной функ
ции, затем поместить соответствующую диаграмму в окно мо
делей. Дважды кликнув на диаграмму в окне, нужно открыть
ее маскирующую иконку и задать свойства объекта (ввести
элементы матриц A, B, C, D для пространства состояний или
коэффициенты полинома числителя и знаменателя переда
точной функции). Выход объекта следует подключить к про
смотрщику сигналов из библиотеки получателей сигналов
(Sinks).

* Дэбни, Дж. Simulink 4. Секреты мастерства : пер. с англ. / Дж. Дэб


ни, Т. Л. Харман. — М. : БИНОМ, 2003. — 403 с.
196 А. Ю. ОЩЕПКОВ

1 2 3 4 5 6 2 7 89
7
123456789
7 5
5 5
5 23  

 5 !"# 5
45 35
345678292

4   " # #%#&
12 962 4 4  !2
2 "$2 '%(&2
456782 1
*6 65 4+
)2 2,-.  !2 " # 01% $2&12
/2 "$2 3( 2
1

42 54  2  !2 "1(&$2 " $#% #2


1
7 -
6+
62 2,-.  !2 "1(&$2 #&'2
/2
1

7- 4 2 :%#;2
82 97492  !2 <'&1% 2
#" $2
1
>4?662
972 :%#;2
=2 2.4  !2 <'&1% @% 2
 -2 #" $2
- 7662 1
BC4?56
62
4D " # &1E%
A2 94542
42  !2 "$2 #E&2
9 662 1
G 69  4
962 9 " # H #&I1%
F2 72
42  !2 "$2 #"12
9 662 1
K74.24

D/2
J2
 6 492 M2 N2 M2
676 "(!$&#2 <#'"1#2
LC2  62
-
9762 1
G5. 4 2
1O2 9LC454942  !2  !$2 ("'&2
972
1
1
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 197

Рис. П2.1
S9модель ПИД9регулятора

Далее на рабочем поле окна модели необходимо расставить


все составные части структурной схемы системы управления
(см. рис. 7.1): входной сигнал (источник сигналов выбирается
из библиотеки источников (Sources)); предшествующий фильтр,
заданный в виде передаточной функции; блок сравнения (сум9
матор сигналов с соответствующими знаками входов); элемен9
ты ПИД9регулятора. На заключительном этапе необходимо со9
единить выходы и входы соответствующих блоков модели и зам9
кнуть цепь обратной связи.
Вариант S9модели ПИД9регулятора без предшествующего
фильтра приведен на рисунке П2.1.
Параметры конкретного блока модели можно задавать в
численном виде непосредственно на его иконке, которая откры9
вается двойным кликом мыши на изображение диаграммы, или
указывать значения переменных в командном окне MATLAB.
Например, в приведенной S9модели регулятора значения про9
порционального, интегрального и дифференциального коэффи9
циентов можно обозначить как KP, Ki и Kd в соответствующих
блоках Gain, а их значения задать в Command Window, предва9
рительно объявив их глобальными переменными:

(П2.1)
>> global Kp Ki Kd
>> Kp = 1; Ki = 0.1; Kd = 0.2.

После создания модели ее нужно запустить командой Run


и посмотреть выходной сигнал, изменив при необходимости
свойства окна просмотра. Длительность моделирования уста9
навливается в следующей последовательности: Simulation ®
Simulation Parameters ® Stop Time.
198 А. Ю. ОЩЕПКОВ

П2.2.
МЕТОДЫ НАСТРОЙКИ ПИДРЕГУЛЯТОРОВ
С ПОМОЩЬЮ SIMULINK

Рассмотрим настройку регулятора, предполагающую под


бор трех коэффициентов: KP, Ki, Kd, — параметры объекта
управления считаются известными. В лекции 7 был рассмот
рен аналитический метод настройки регулятора по критерию
ИВМО для объектов 2го порядка, предполагающий использо
вание предшествующего фильт
ра. С помощью модели, приве
денной на рисунке П2.1, легко
проверить правильность прове
денных расчетов (упражнение
7.2), поместив между входом си
стемы и сумматором сигналов пе
редаточную функцию предшеству
ющего фильтра. Здесь рассмотрим
Рис. П2.2 экспериментальные методы, при
Рабочее окно блока NCD менимые для любых объектов.
Outport с открытым окном Под «экспериментом» будем пони
редактора ограничений
(Constraint Editor) мать проведение компьютерного
моделирования в Simulink.
Метод Зиглера — Никольса. Более 60 лет назад Зиглер
(J. G. Ziegler) и Никольс (N. B. Nichols) предложили методику
настройки ПИДрегуляторов по экспериментальным данным*,
которая используется до сих пор, поскольку является простой
и эффективной.
Настройка трех коэффициентов KP, Ki, Kd проводится в сле
дующей последовательности:
· коэффициенты Ki и Kd устанавливаются равными нулю, а
коэффициент KP увеличивается до тех пор, пока система не
потеряет устойчивость;
· предельное значение KP обозначается как KU, а период ав
токолебаний при этом значении — как PU;
· задаются следующие значения коэффициентов регулятора:
151 251
53 1 3 52 1 3 54 1 1 51 31 4 (П2.2)
5 531 67
При использовании модели рисунка П2.2 период PU оп
ределяется по графику синусоидальных колебаний в окне
просмотрщика (Scope). Колебания соответствуют устойчивому

* Ziegler, J. G., Optimal Settings for Automatic Controllers / J. G. Zieg


ler, N. B. Nichols // Trans. ASME. — 1942. — V. 64. — Р. 759–762.
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 199

режиму работы системы (см. график на рис. 9.2 при K = 7), воз*
никающему между асимптотически устойчивым режимом и
неустойчивым режимом. После вычислений коэффициентов по
формулам (П2.2) следует подставить их в модель и посмотреть
переходную характеристику системы с целью проверки пра*
вильности настройки регулятора.
Использование пакета NCD. В Simulink имеется специаль*
ный пакет для настройки нелинейных (в том числе, разумеет*
ся, и для линейных) систем управления Nonlinear Control
Design (NCD), реализующий метод динамической оптимизации.
Диаграмма этого блока (табл. П2.1, п. 9) устанавливается на
выходе системы вместо блока Scope или параллельно ему, по*
скольку блок NCD имеет свой просмотрщик (графический ин*
терфейс), в окне которого можно установить требуемые харак*
теристики системы и указать параметры, которые следует оп*
тимизировать (см. рис. П2.2).
Список настраиваемых коэффициентов должен быть приве*
ден (через пробел) в строке настраиваемых параметров блока
NCD (последовательность действий: Optimization ® Parameters ®
Tunable Variables). Перед запуском блока требуется задать в
Command Window основного меню MATLAB начальные значе
ния коэффициентов, как это показано в (П2.1). После запуска
(кнопка Start) блок NCD будет подбирать значения коэффициен*
тов KP, Ki, Kd так, чтобы переходная характеристика (см. рис. 6.4)
лежала в указанных границах.
При работе с блоком NCD требуемые значения характе*
ристик (constraint) могут устанавливаться тремя способами:
1) выделение линии нажатием левой клавиши мыши и пе*
ретаскивание (грубая установка);
2) выделение линии щелчком левой клавиши мыши и уста*
новление ее координат в меню Edit ® Edit constraint (точная
установка);
3) использование установок в меню Options ® Step response.
Очевидно, что в блоке NCD могут быть заданы важнейшие
показатели качества: перерегулирование, время установления
и установившаяся ошибка (см. табл. 6.1). Настройка коэффици*
ентов с использованием блока NCD является наиболее точной.
Однако при работе с блоком NCD следует соблюдать определен*
ную осторожность, поскольку алгоритм его работы не обладает
абсолютной устойчивостью по отношению к начальным значе*
ниям настраиваемых параметров. В качестве начальных значе*
ний коэффициентов регулятора рекомендуется выбирать зна*
чения, найденные по методике Зиглера — Никольса.
ПРИЛОЖЕНИЕ 3

МОДЕЛИРОВАНИЕ
АДАПТИВНЫХ СИСТЕМ УПРАВЛЕНИЯ

П3.1.
ПОСТРОЕНИЕ SМОДЕЛИ
АДАПТИВНОЙ СИСТЕМЫ УПРАВЛЕНИЯ
С ЭТАЛОННОЙ МОДЕЛЬЮ
ДЛЯ НЕПРЕРЫВНОГО ОБЪЕКТА
Построим средствами Simulink адаптивную систему управ
ления с эталонной моделью для непрерывного объекта, алгоритм
работы которой описывается выражениями (15.12), а структур
ная схема приведена на рисунке 15.5. В соответствии со струк
турной схемой мы должны промоделировать поведение самого
объекта управления и эталонной модели. Для этого используем
два блока State Space.
Алгоритм управления (15.12) предполагает использование
трех величин, являющихся функциями времени: задающего
сигнала g, выхода объекта x и ошибки e. Настраиваемый па
раметр x должен определяться внутри блока путем интегри
рования произведения ошибки и выхода. Для моделирования
блока управления используем блок Subsystem библиотеки
Port&Subsystems в Simulink.
Блок поместим на рабочее поле, откроем его, кликнув мы
шью, и перенесем в него дополнительно два входных блока In1
библиотеки Port&Subsystems. Первый вход будет соответство
вать ошибке e, второй — выходу объекта x, а третий — задаю
щему сигналу g. Выход блока является сигналом управления
для объекта. Поэтому внешнее соединение блока управления в
модели системы должно быть таким, как на рисунке П3.1.
Внутренний вид блока управления показан на рисунке П3.2.
Параметр эталонной модели l обозначен буквой L, параметр ре
гулятора g — буквой K. В блоке State Space1 (рис. П3.1) промо
делировано поведение объекта (уравнение (15.1)), в блоке State
Space — поведение эталонной модели (уравнение (15.2)).
На рисунке П3.3 приведен пример работы адаптивной сис
темы с эталонной моделью, изображенной на рисунке 15.5 со
следующими параметрами: g(t) = 2,5sin2t, q = –1, l = 1, g = 1.
Обратим внимание, что в верхнем окне просмотрщика изобра
жены сразу два графика: переходные характеристики эталон
ной модели (1) и объекта (2). Это сделано с помощью блока
Mux (библиотека Signal Routing в Simulink).
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 201

Рис. П3.1
Sмодель адаптивной системы управления с эталонной моделью

Рис. П3.2
Sмодель блока управления (блок Subsystem)

Рис. П3.3
Пример работы
адаптивной
системы
Верхний график — пе
реходные характери
стики эталонной моде
ли (1) и объекта (2).
Нижний график — по
ведение ошибки.
202 А. Ю. ОЩЕПКОВ

Из графиков следует, что максимальная ошибка не превы$


шает 30%, а спустя 6 с после работы системы объект входит в
установившийся режим, т. е. следует за эталонной моделью.
Максимальную ошибку и время выхода на режим можно изме$
нять, меняя значение коэффициента адаптации g.

П3.2.
ПОСТРОЕНИЕ S
МОДЕЛИ
ИДЕНТИФИКАЦИОННОЙ АДАПТИВНОЙ
СИСТЕМЫ УПРАВЛЕНИЯ
ДЛЯ ДИСКРЕТНОГО ОБЪЕКТА
Рассмотрим теперь модель адаптивной системы управления
дискретным объектом с применением идентификационного
адаптивного управления на основе быстрого алгоритма. Алго$
ритм описывается выражениями (16.34), (16.35).
Первая сложность при моделировании связана с тем, что для
определения вектора неопределенных параметров | x ñ по алго$
ритму (16.32) на начальном этапе функционирования системы
с применением робастного ПИ$регулятора необходимо сформи$
ровать вектор | Y ñ, определить матрицу Gn, состоящую из ком$
понент векторов | X ñ и | U ñ, и лишь потом переключиться на адап$
тивный алгоритм. Начальный этап должен состоять из n ³ 3
шагов. Переключение предлагается осуществить с помощью
блока Multiport Switch (библиотека Signal Routing).
Полная S$модель адаптивной системы изображена на рисун$
ке П3.4. Начальный алгоритм моделируется стандартным бло$
ком дискретного ПИ$регулятора с ограничениями на управляю$
щее воздействие. Модель адаптивного регулятора, обозначенная

Рис. П3.4
S$модель адаптивной системы управления с применением идентифи$
кационного адаптивного управления на основе быстрого алгоритма
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 203

на рисунке П3.4 как Adapt_N, создана на базе блока Subsystem.


Шаг дискретизации, который здесь обозначим Ts, должен быть
одинаковым для дискретного объекта, ПИ1регулятора и блока
адаптивного управления.
Блок переключения Multiport Switch1 в модели работает
следующим образом: если на управляющий вход подается ве1
личина не более единицы, на выход блока выводится сигнал с
«прямого» входа (в нашем случае — от ПИ1регулятора), если на
управляющий вход подать сигнал, превышающий 1, на выход
блока будет выводиться сигнал с другого входа (от блока адап1
тивного регулятора). Момент переключения определяется бло1
ком Step (в модели обозначен Begin), который в течение первых
n шагов выводит «0», а затем «1».
Рассмотрим работу модели адаптивного регулятора Adapt_N,
представленную на рисунке П3.5. В соответствии с общей схемой
идентификационного адаптивного управления (см. рис. 10.3) в
блок управления должны подаваться входной и выходной сигна1
лы объекта, поэтому блок Adapt_N имеет два входа. Сигналы по1
ступают на блоки Vektor |Y) и Vektor |U), созданные на базе бло1
ков Subsystem (библиотека Port&Subsystems). Блок Vektor |U)
формирует вектор | U ñ, блок Vektor |Y) — векторы | X ñ и | Y ñ.

Рис. П3.5
S1модель адаптивного регулятора на основе быстрого алгоритма

Рис. П3.6
S1модель блока вычислений адаптивного регулятора Calc
204 А. Ю. ОЩЕПКОВ

Рис. П3.7
Пример работы идентификационного адаптивного дискретного
регулятора для дискретного объекта

Векторы поступают на вход блока Calc (рис. П3.6), осуще


ствляющего расчет параметров адаптивного регулятора: коэффи
циента K и компенсирующего воздействия V. Векторы | U ñ, | X ñ
и | 1 ñ формируют прямоугольную матрицу, которая подается на
вход «A» «решателя» QR Solver. Вектор | Y ñ подается на вход
«B» «решателя», поскольку является в соответствии с (16.31)
правой частью несовместной системы линейных уравнений.
Блок возвращает компоненты вектора | x ñ, т. е. находит псевдо
решение системы (16.31). Расположение блока QR Solver в Simu
link: DSP Blockset ® Math Function ® Matrices and Linear
Algebra ® Linear System Solvers ® QR Solver.
По найденным значениям компонент вектора | x ñ с помощью
формул (16.34), (16.18) определяются параметры K и V, которые
передаются в блок определения управляющего воздействия U_Out.
В этом блоке учтено ограничение на управление и реализована
процедура (16.35), для чего на один из входов блока подается зна
чение порога точности задачи D, обозначенное в модели как Eps.
На рисунке П3.7 приведен пример работы адаптивного ре
гулятора для объекта 1го порядка:
xk + 1 = Axk + Buk + Fd; x0 = –1
со следующими параметрами:
· объект: A = 0,9; B = 1; Fd = –1;
· регулятор: Kp = 1; Ki = 0,5; Ts = 0,1; n = 4; D = 0,0001; 0 £ u £ 2.
Видим, что цель регулирования достигается после четвер
того шага управления и сохраняется на всех остальных шагах.
ЛИТЕРАТУРА

1. Афанасьев, В. Н. Математическая теория конструирования


систем управления / В. Н. Афанасьев, В. Б. Колмановский,
В. Р. Носов. — М. : Высш. шк., 1998. — 574 с.
2. Андриевский, Б. Р. Избранные главы теории автоматического
управления с примерами на языке MATLAB / Б. Р. Андриев$
ский, А. Л. Фрадков. — СПб. : Наука, 1999. — 467 с.
3. Андриевский, Б. Р. Элементы математического моделирования
в программных средах MATLAB 5 и Scilab / Б. Р. Андриевский,
А. Л. Фрадков. — СПб. : Наука, 2001. — 286 с.
4. Дорф, Р. Современные системы управления : пер. с англ. /
Р. Дорф, Р. Бишоп. — М. : Лаборатория базовых знаний.
2002. — 800 с.
5. Никифоров, В. О. Управление в условиях неопределенности:
чувствительность, адаптация, робастность / В. О. Никифоров,
А. В. Ушаков. — СПб. : СПб ГИТМО (ТУ), 2002. — 232 с.
6. Фрадков, А. Л. Кибернетическая физика: принципы и приме$
ры. — СПб. : Наука, 2003. — 208 с.
7. Леонов, Г. А. Введение в теорию управления. — СПб. : Изд$во
СПб. ун$та, 2004. — 218 с.
8. Мирошник, И. В. Теория автоматического управления. Линей$
ные системы. — СПб. : Питер, 2005. — 306 с.
СОДЕРЖАНИЕ

Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Лекция 1. От клепсидры до «Термодата» . . . . . . . . . . . . . . . . . . . . . 9
1.1. Структура систем автоматического управления . . . . . . . 9
1.2. Регуляторы прямого действия . . . . . . . . . . . . . . . . . . . . . 13
1.3. Регуляторы по отклонению . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4. Современные цифровые системы
автоматического управления . . . . . . . . . . . . . . . . . . . . . . 18
Лекция 2. Математическая формулировка задач управления . . . . 23
2.1. Общие свойства математических моделей . . . . . . . . . . . . 23
2.2. Математическая формулировка задач
управления поворотом вала электродвигателя . . . . . . . . 27
Лекция 3. Формы представления математических моделей.
Пространство состояний . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1. Математическая модель RLC$цепи . . . . . . . . . . . . . . . . . . 33
3.2. Пространство состояний . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3. Сигнальные графы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.4. Управляемость и наблюдаемость систем . . . . . . . . . . . . . 39
Лекция 4. Формы представления математических моделей.
Передаточные функции . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.1. Определение передаточных функций . . . . . . . . . . . . . . . . 41
4.2. Переходные характеристики систем управления . . . . . . 44
4.3. Структурные схемы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.4. Связь между передаточными функциями
и уравнениями состояния . . . . . . . . . . . . . . . . . . . . . . . . . 46
Лекция 5. Примеры построения математических моделей
линейных стационарных систем . . . . . . . . . . . . . . . . . . . 50
5.1. Модель двигателя постоянного тока . . . . . . . . . . . . . . . . 50
5.2. Двигатель, управляемый по цепи возбуждения . . . . . . . 51
5.3. Двигатель, управляемый по цепи якоря . . . . . . . . . . . . . 53
Лекция 6. Системы управления с обратной связью . . . . . . . . . . . . . 57
6.1. Свойства обратной связи . . . . . . . . . . . . . . . . . . . . . . . . . . 57
6.2. Показатели качества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.3. Оценки качества . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Лекция 7. Стандартные регуляторы с обратной связью . . . . . . . . . 67
7.1. Математические модели ПИД$регуляторов . . . . . . . . . . . 67
7.2. Особенности работы стандартных регуляторов . . . . . . . . 69
7.3. Методы настройки ПИД$регуляторов . . . . . . . . . . . . . . . 74
СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ 207

Лекция 8. Устойчивость систем управления.


Теоремы устойчивости для непрерывных систем . . . . 78
8.1. Понятие устойчивости . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.2. Математическая устойчивость. Основные определения . . 80
8.3. Теоремы устойчивости . . . . . . . . . . . . . . . . . . . . . . . . . . 84
8.4. Устойчивость вращения твердого тела . . . . . . . . . . . . . . 86
Лекция 9. Устойчивость линейных стационарных систем . . . . . . 90
9.1. Методы анализа устойчивости ЛСС . . . . . . . . . . . . . . . . 90
9.2. Анализ устойчивости во временно´й области . . . . . . . . . 92
9.3. Частотные критерии устойчивости . . . . . . . . . . . . . . . . 97
9.4. Устойчивость систем
с неопределенными параметрами . . . . . . . . . . . . . . . . . . 101
Лекция 10. Дискретные системы и их устойчивость . . . . . . . . . . . . 104
10.1. Структура цифровых систем управления . . . . . . . . . . . 104
10.2. Цифровой ПИ;регулятор . . . . . . . . . . . . . . . . . . . . . . . . . 107
10.3. Дискретные модели непрерывных систем . . . . . . . . . . . 110
10.4. Передаточные функции дискретных систем . . . . . . . . . 114
10.5. Устойчивость дискретных систем . . . . . . . . . . . . . . . . . 116
Лекция 11. Разомкнутые системы оптимального управления . . . . 118
11.1. Постановка и классификация задач
оптимального управления . . . . . . . . . . . . . . . . . . . . . . . . 118
11.2. Вариационный метод для скалярного случая . . . . . . . . 122
11.3. Гамильтонова формулировка
условия оптимальности . . . . . . . . . . . . . . . . . . . . . . . . . . 125
11.4. Построение оптимального управления . . . . . . . . . . . . . 127
Лекция 12. Оптимальное управление линейными системами . . . . 130
12.1. Оптимальное управление линейными системами
с квадратичным функционалом . . . . . . . . . . . . . . . . . . . 130
12.2. Линейно;квадратичная задача
для скалярного случая . . . . . . . . . . . . . . . . . . . . . . . . . . 133
12.3. Управление на неограниченном
интервале времени . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
Лекция 13. Оптимальное управление
при ограничениях на управляющие воздействия . . . . 140
13.1. Принцип максимума Понтрягина . . . . . . . . . . . . . . . . . 140
13.1.1. Формулировка принципа максимума . . . . . . . . 140
13.1.2. Пример: поворот вала
электродвигателя на максимальный угол . . . . 142
13.2. Метод динамического программирования . . . . . . . . . . . 146
13.2.1. Уравнение Беллмана . . . . . . . . . . . . . . . . . . . . . . 146
13.2.2. Пример: задача об успокоении твердого тела . . . . 149
Лекция 14. Управление в условиях неопределенности.
Робастность систем с обратной связью . . . . . . . . . . . . . 153
14.1. Неопределенности объектов управления . . . . . . . . . . . . 153
14.2. Понятие грубости и робастности систем управления . . . . . 156
14.3. Робастность систем управления с обратной связью . . . 158
14.4. Метод скоростного градиента . . . . . . . . . . . . . . . . . . . . . 161
Лекция 15. Адаптивные системы управления . . . . . . . . . . . . . . . . . 164
15.1. Структура адаптивных систем управления . . . . . . . . . . 164
15.2. Классификация адаптивных систем управления . . . . . 165
15.3. Адаптивное управление
с эталонной моделью объектом 1;го порядка . . . . . . . . . 169
208 А. Ю. ОЩЕПКОВ

Лекция 16. Робастные и адаптивные алгоритмы


управления дискретными системами . . . . . . . . . . . . . . 173
16.1. Градиентный метод . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
16.2. Быстрые алгоритмы для объектов
1го и 2го порядков . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
16.3. Идентификационное адаптивное
управление объектом 1го порядка
на основе методов линейной регрессии . . . . . . . . . . . . . 180
Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
Приложение 1. Использование функций MATLAB
для анализа свойств линейных систем . . . . . . . . . . . . . 188
Приложение 2. Моделирование и настройка
ПИД$регуляторов в пакете Simulink . . . . . . . . . . . . . . . 195
Приложение 3. Моделирование адаптивных
систем управления . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

Зав. редакцией физикоматематической


литературы О. Ю. Краснокутская
ЛР № 065466 от 21.10.97
Гигиенический сертификат 78.01.07.953.П.007216.04.10
от 21.04.2010 г., выдан ЦГСЭН в СПб
Издательство «ЛАНЬ»
lan@lanbook.ru; www.lanbook.com
192029, СанктПетербург, Общественный пер., 5.
Тел./факс: (812) 4122935, 4120597, 4129272.
Бесплатный звонок по России: 88007004071

ГДЕ КУПИТЬ
по России и зарубежью
«ЛАНЬТРЕЙД». 192029, СанктПетербург, ул. Крупской, 13
тел.: (812) 4128578, 4121445, 4128582; тел./факс: (812) 4125493
email: trade@lanbook.ru; ICQ: 446869967
www.lanpbl.spb.ru/price.htm
в Москве и в Московской области
«ЛАНЬПРЕСС». 109263, Москва, 7я ул. Текстильщиков, д. 6/19
тел.: (499) 1786585; email: lanpress@lanbook.ru
в Краснодаре и в Краснодарском крае
«ЛАНЬЮГ». 350072, Краснодар, ул. Жлобы, д. 1/1
тел.: (861) 2741035; email: lankrd98@mail.ru
ДЛЯ РОЗНИЧНЫХ ПОКУПАТЕЛЕЙ:
интернетмагазины:
Издательство «Лань»: http://www.lanbook.com
«Сова»: http://www.symplex.ru; «Ozon.ru»: http://www.ozon.ru
«Библион»: http://www.biblion.ru
Подписано в печать 18.02.13.
Бумага офсетная. Гарнитура Школьная. Формат 84´108 1/32.
Печать офсетная. Усл. п. л. 10,92. Тираж 1000 экз.
Заказ № .
Отпечатано в полном соответствии
с качеством предоставленных диапозитивов
в ОАО «Издательскополиграфическое предприятие «Правда Севера».
163002, г. Архангельск, пр. Новгородский, д. 32.
Тел./факс (8182) 641454; www.ippps.ru