Вы находитесь на странице: 1из 273

В . И .

У т к и н

СКОЛЬЗЯЩИЕ
РЕЖИМЫ
И ИХ ПРИМЕНЕНИЯ
В СИСТЕМАХ
С ПЕРЕМЕННОЙ
СТРУКТУРОЙ
ТЕОРЕТИЧЕСКИЕ
ОСНОВЫ
ТЕХНИЧЕСКОЙ
КИБЕРНЕТИКИ

ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1974
В. И. УТКИН

СКОЛЬЗЯЩИЕ РЕЖИМЫ
И ИХ ПРИМЕНЕНИЯ
В СИСТЕМАХ
С ПЕРЕМЕННОЙ СТРУКТУРОЙ

ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1974
1 fl-G . ПУЬДЙЧм— j
НАУЧИО-Т5ХНИ'4КСЙАй J
7 V
ГЦ ^ й б л и о т е к л JL
9 9 * а
У 84 ^*-4.
УДК 62-50 i S - H W Z '

Скользящие режимы п их применения в системах с пере­


менной структурой. В. И. У т к и н , Издательство «Наука»,
Главная редакция физико-математической литературы, М., 1974,
272 стр.

Содержание книги составляют проблемы, связанные с иссле­


дованием систем с разрывными управляющими воздействиями.
Разработан формальный аппарат, позволяющий выписывать урав­
нения движения специальных видов движения — скользящих
режимов, характеризуемых бесконечной частотой переключения
функции управления. Такие режимы обладают рядом привлека­
тельных свойств с точки зрения построения систем автоматичес­
кого управления. Приводятся методы построения высококачест­
венных систем управления стационарными и нестационарными,
объектами, решаются задачи оптимизации статических и динам//-]
ческих объектов, идентификации объектов, уравнения которЕГх
разложимы в конечномерные функциональные ряды.
Книга рассчитана на научных работников и инженеров,
занятых исследованием и проектированием систем управления
Илл. 19. Библ. 115 назв.

Вадим Иванович У тк и н
СКОЛЬЗЯЩИЕ РЕЖИМЫ II ИХ ПРИМЕНЕНИЯ
В СИСТЕМАХ С ПЕРЕМЕННОЙ СТРУКТУРОЙ
(Серия: «Теоретические основы технической кибернетики»)
М., 1974 г., 272 стр. с илл.
Редактор А. А. Могилевский
Техи. редактор В . Н. Кондакова
Корректоры 3. В. Автонеева, II.Б.Румянцева
Сдано в набор 19/XI 1973 г. Подписано к печати 19/11 1974 г.
Бумага 84Xl08Vu- Физ. печ. л. 8,5 Условн. печ. л. 14,28 Уч.-изд. л. 14(17
Тираж 4890 экз. Т-02975. Цена книги 1 р. 20 к. Заказ № 3178
Издательство «Наука»
Главная редакция физико-математической литературы
117071, Москва, В-71, Ленинский проспект, 15
2-я типография издательства «Наука».
Москва, Шубинский пер., 10

© Издательство «Наука», 1974

30501—035
У
053 (01)-74 178-74
ОГЛАВЛЕНИЕ

П р ед и сл ови е.................................................................................... 8
Глава I. В в е д е н и е ...................................................... . Г1
§ 1. Скользящие режимы в системах с пе­
ременной ст р у к т у р ой ................. 13
§ 2. Условия возникновения и математи­
ческое описание скользящихрежимов 22
§ 3. Доопределение А. Ф. Филиппова . . 26
§ 4. Другие доопределения..................... 27
§ 5. Предельные переходы для обоснования
уравнений скольж ения..................... 30
§ 6. Проблемы теории скользящих режимов
в системах с разрывнымиуправлениями 37

Р а з д е л I. Некоторые вопросы теории скользящих ре-


ж и м о в ............................................................ 41
Глава II. Уравнения скользящих режимов в разрыв­
ных си стем а х............................................. 42
§ 1. Постановка задачи. Метод эквивален­
тного управления........................... 42
§ 2. Системы, линейные по управлению . . 46
§ 3. Нелинейные системы со скалярным уп­
равлением .................................................. 59
§ 4. Системы, нелинейные по управлению 68
§ 5. Вырожденные случаи в векторных зада­
чах ............................................................... 73
§ 6. Физический смысл эквивалентного уп­
равления ...............• .............................. 80
Глава III. Условия существования скользящего ре­
жима ................................................................... 84
§ 1. Постановка задачи, определение сколь-'
зящего режима и необходимые условия
его существования.................................. 84
§ 2. Применение второго метода Ляпунова
для определения области скользящего
режима ................................................... 89
§ 3. Определение области скольжения с
помощью квадратичных форм . . . . 96
§ 4.. Системы с иерархией управлений . 110
Глава IV. Обсуждение проблемы с п н т е з а ................ ИЗ
§ 1. Постановка з а д а ч и ................................... ИЗ
§ 2. Инвариантность уравнений сколь­
жения к линейному! преобразованию
поверхностей разрыва .......................... 115
•6 ОГЛАВЛЕНИЕ

§ 3. Метод диагонализации........................ 117


§ 4. Метод синтеза на основе квадратич­
ных ф о р м .................................................. 121
§ 5. Метод иерархии управлений............... 124

Раздел II. Скалярные задачи управления.................... 128


Глава V. Управление свободным движением стацио­
нарных о б ъ е к т о в .............................................. 132
§ 1. Уравнения движения и постановка
з а д а ч и ....................................................... 132
§ 2. Условия существования плоскости
скольж ения............................................... 135
§ 3. Условия устойчивости скользящих
движений................................................... 140
Глава VI. Устойчивость в системах управления ли­
нейными стационарными объектами . . . 149
§ 1. Постановка з а д а ч и ................................ 149
§ 2. Необходимые условия попадания . . . 151
§ 3. Достаточные условия попадания в си­
стемах произвольного порядка . . . 155
Глава VII. Управление свободным движением ли­
нейных нестационарных объектов . . . . 159
§ 1. Уравнения движения и условия су­
ществования плоскости скольжения 159
§ 2. Условпя устой чи вости........................ 161
Глава V III. Управление вынужденным движением ли­
нейных о б ъ е к т о в ........................................ 164
§ 1. Комбинированные системы управления. 165
§ 2. Описание метода построения системы
управленпя без измерения возмущений 168
§ 3. Синтез в пространстве координаты
ошибки п ее производны х................... 172
§ 4. Обобщение для систем произвольного
в и д а .................... 174

Р а з д е л III. Векторные задачи у п р а в л е н и я .................... 180


Глава IX . Управление свободным движением линей­
ных о б ъ е к т о в ................................................... 183
§ 1. Условия существования многообра­
зия скольжения для объектов с посто­
янными параметрами............................ 183
§ 2. Условия устойчивости скользящих
дви ж ен ий.................................................. 189
§ 3. Устойчивость в системах с многооб­
разием скольж ени я................................ 202
§ 4. Метод иерархии управлений . . . . 210
§ 5. Управление нестационарными объек­
тами ............................................................ 215
Глава X . Управление вынужденным движением объ­
ектов ...................................................................... 217
§ 1, Комбинированны? с и ст е м ы ................. 217
О М авлег Ше ?

§ 2. Системы без измерения внешних воздей­


ствий .......................................................... 220
Глава X I. Инвариантные системы управления . . . . 227
§ 1. Постановка задачи и условие инва­
риантности скользящих движений . . . 227
§ 2. Инвариантность к внешним возмуще­
ниям ........................................................... 228
§ 3. Инвариантность к изменяющимся па­
раметрам о б ъ е к т а ................................... 230
§ 4. Селективная инвариантность...............231
Глава X II. Применение скользящих режимов в зада­
чах оптимизации.............................................. 231
§ 1. Постановка задачи и принцип постро­
ения системы оптимизации............. 231
§ 2. Одномерная оптимизация с постоян­
ной скоростью п о и с к а .................... 233
§ 3. Одномерная оптимизация с перемен­
ной скоростью п о и с к а .................... 240
§ 4. Оптимизация многомерногообъекта 243
§ 5. Оптимизация при наличии ограниче­
ний на входные параметры................... 245
§ 6. Обсуждение метода оптимизации . . 250
Глава X III. Идентификация динамических объектов . . 253
§ 1. Постановка задачи и уравнения моде­
ли с переменной структурой . . . . 253
§ 2. Процедура настройки параметров мо­
дели ............................................................ 259
§ 3. Примеры выбора линейных операто­
ров ............................................................. 261
Л итература............................................................................... 265
ПРЕДИСЛОВИЕ

Эта книга посвящена методам исследования скользя­


щих режимов, которые могут возникать в разрывных
динамических системах, т. е. системах, описываемых
дифференциальными уравнениями с разрывными правы­
ми частями, и применению этого вида движения для
решения широкого круга задач автоматического управ­
ления.
Интерес к такого рода исследованиям может быть обус­
ловлен двумя причинами. Во-первых, для разрывных
систем, вообще говоря, неприменимы классические тео­
ремы о существовании и единственности решения, и по­
этому возникает необходимость в разработке аппарата,
который позволил бы описать их поведение. Если говорить
более конкретно, то специфика в поведении систем, у кото­
рых правая часть дифференциального уравнения явля­
ется кусочно-непрерывной функцией ее координат,
заключается в том, что на некотором конечном ин­
тервале времени число точек разрыва может не ока­
заться конечным. Задача состоит в описании таких
движений, которые принято называть скользящими режи­
мами. Вторая причина связана с теми богатыми возмож­
ностями, которые появляются в системах автоматического
управления за счет преднамеренного введения в них этого
вида движений. По-видимому, наиболее полно эти воз­
можности были продемонстрированы в системах с пере­
менной структурой. (Методы построения различных ти­
пов систем этого класса систематически изложены в мо­
нографии С. В. Емельянова, В. И. Уткина, В. А. Тарана,
Н. Е. Костылевой, А. М. Шубладзе, В. Б. Езерова,
Е. Н. Дубровского «Теория систем с переменной струк­
турой».)
В настоящей книге автор поставил цель показать, ка­
ким образом математический аппарат исследования сколь­
зящих режимов может быть построен на основе предель­
ных переходов. Сущность идеи предельных переходов
ПРЕДИСЛОВИЕ 9

состоит в следующем: идеальная разрывная система аппрок­


симируется некоторой реальной системой, поведение ко­
торой всюду однозначно определено, а под скользящим
режимом понимается предельное движение, которое по­
лучается при стремлении уравнений реальной системы
к уравнениям идеальной. Под этим углом зрения разби­
раются различные случаи разрывных систем, в простран­
стве координат которых существуют одна или несколько
поверхностей разрыва. Все вопросы, связанные с условия­
ми существования скользящего режима, которым уделя­
лось сравнительно мало внимания в литературе, решаются
исходя из концепции А. М. Ляпунова об устойчивости.
С помощью методов исследования скользящих режимов,
которые составляют раздел I, далее в разделах II и III
последовательно решаются наиболее важные задачи,
обычно рассматриваемые в теории автоматического управ­
ления. Решение этих задач предполагает создание в систе­
ме движений в скользящем режиме, и из непосредствен­
ного анализа условий их возникновения следует, что
синтез функции управления в каждом случае должен быть
осуществлен в классе систем с переменной структурой.
Приведенные в разделах II и III методы синтеза в значи­
тельной мере являются развитием результатов, которые
изложены в упомянутой выше монографии. В то же время
в этих разделах рассматривается ряд новых постановок
задач (например, главы X II, X III и в значительной мере
глава X I), а «старые» задачи изучаются в более общей
постановке (основное внимание в монографии уделяется
системам со скалярным управлением с поверхностью раз­
рыва в пространстве координаты ошибки и ее производ­
ных, в то время как в разделе II вектор состояния состоит
из произвольных координат, а в разделе III управление
является вектором).
Представленный в книге материал основан главным
образом на исследованиях, выполненных в лаборатории
систем с переменной структурой Института проблем уп­
равления. Исключение составляет лишь приведенный во
введении краткий обзор работ, касающихся математиче­
ского описания скользящих режимов.
Решающим обстоятельством, которое повлияло пе
только на написание этой книги, но и на всю профессио­
нальную деятельность автора, явилось многолетнее твор­
10 ПРЕДИСЛОВИЕ

ческое общение со Станиславом Васильевичем Емельяно­


вым. Трудно переоценить огромное влияние С. В. Емель­
янова на формирование коллектива энтузиастов, вместе
с которым он создавал теорию систем с переменной струк^
турой и к которому автор считает за честь себя при ­
числить.
Автор считает своим приятным долгом поблагодарить
академика В. Н. Петрова за неизменную поддержку и
внимание в течение всего периода работы в Институте.
Слова искренней признательности хочется высказать в ад­
рес профессора М. А. Айзермана, который открыл для
автора круг проблем, связанных с математическим описа­
нием скользящих режимов, и помог провести исследова­
ния, нашедшие отражение в главах II и III. Автор благо­
дарен члену-корреспонденту АН СССР Г. С. Поспелову
и кандидату физ.-матем. наук И. Ф. Шахнову за те кри­
тические замечания, которые они сделали, просмотрев
рукопись. Автор выражает особую признательность
Л. Р. Говоровой — нашей неизменной помощнице в под­
готовке к печати работ по системам с переменной струк­
турой.
Автор
ГЛАВА I
ВВЕДЕНИЕ

Среди различных принципов управления, позволяю­


щих в том или ином смысле наилучшим образом управлять
объектом регулирования, последнее время внимание спе­
циалистов все чаще привлекают системы, в которых уп­
равляющие воздействия являются разрывными функция­
ми ее координат и внешних воздействий. Как известно,
именно в таких системах зачастую удается получить мак­
симальный эффект от использования средств автоматики,
в том числе и оптимальность.
Исследование таких систем в большинстве случаев осу­
ществляется на основе развитого в работах А. А. Андро­
нова и его школы метода фазового пространства [2]. Фа­
зовые представления движения предполагают, что состоя­
ние системы характеризуется положением изображающей
точки в пространстве, по осям которого отложены коор­
динаты системы. По виду траекторий изображающей точ­
ки, называемых фазовыми, можно судить о свойствах
рассматриваемой динамической системы, и, более того,
выбирая соответствующим образом управляющие воздей­
ствия, можно так деформировать фазовые траектории, что­
бы наделить желаемыми свойствами протекающие в си­
стеме процессы.
Задача синтеза в системах с разрывными управляющи­
ми воздействиями обычно сводится к выбору поверхно­
стей в фазовом пространстве, на которых функции управ­
ления претерпевают разрывы. При выполнении опреде­
ленных соотношений, о которых речь пойдет ниже, в
таких системах может возникнуть специфический вид дви­
жений — так называемый скользящий режим. Скользя­
щий режим, например, может возникнуть, если в окре­
стности поверхности, на которой функция управления
претерпевает разрывы, фазовые траектории направлены
12 ВВЕДЕНИЕ [ГЛ. I

навстречу друг другу (рис. 1). Очевидно, что после попада­


ния на поверхность разрыва изображающая точка не может
в течение любого даже сколь угодно малого, но конеч­
ного интервала времени двигаться по любой из траекто­
рий, примыкающих к этой поверхности. Действительно,
при любом смещении всегда возникает движение, воз­
вращающее изображающую точку на поверхность разрыва.
Таким образом, в рассматри­
ваемой системе изображающая
точка может двигаться лишь
вдоль поверхности разрыва; это
движение принято называть
скользящим режимом. Здесь
уместно обратить внимание на
то, что мы описали идеальную
модель скользящего режима.
В реальных системах устрой­
ства, осуществляющие скачко­
образное изменение функции
управления на поверхности раз­
рыва, всегда обладают малыми
неидеальностямп (типа запаздывание, гистерезис и т. д.).
При возникновении описанной выше ситуации наличие
неидеальностей приведет к тому, что переключения уп­
равляющего воздействия будут происходить с конечной
частотой, а изображающая точка будет совершать ко­
лебания в некоторой конечной окрестности поверхности
разрыва.
Скользящие режимы обладают рядом привлекатель­
ных свойств, благодаря которым они давно уже приме­
няются при решении различных задач автоматического
управления. Впервые этот вид движения преднамеренно
вводился в систему, по-видимому, при построении вибра­
ционных регуляторов, изобретенных в начале нынешнего
столетия. Исполнительный орган в регуляторах такого
типа в зависимости от знака рассогласования между
желаемым и истинным значениями регулируемой вели­
чины может занимать лишь одно из двух возможных край­
них положений. В интересной работе [21], посвященной
применению методов теории колебаний для исследования
вибрационных регуляторов, приводится краткий обзор
и анализ первых публикаций в этой области. Несколько
§ 1] скользящ ие Режимы в системах 13

позднее вибрационные регуляторы нашли широкое при­


менение в практике регулирования напряжения авиа­
ционных, автомобильных и тракторных генераторов [72].
Как показали дальнейшие исследования, в ряде слу­
чаев именно во время движения в скользящем режиме ре­
ализуется оптимальное управление, доставляющее минимум
функционалу, который характеризует качество управляе­
мого процесса [24, 71].
Наиболее полно возможности скользящих движений
были выявлены и использованы в работах по теории си­
стем с переменной структурой, которые начали прово­
диться в Институте проблем управления около пятнад­
цати лет назад по инициативе С. В. Емельянова. В на­
стоящее время теория систем с переменной структурой
сформировалась в самостоятельное научное направление
в общей теории нелинейных систем.
Для того чтобы проиллюстрировать целесообразность
использования скользящих режимов при решении самых
разнообразных задач управления, поясним с помощью
^-простейших примеров основные идеи построения систем
7 с переменной структурой.

§ 1. Скользящие режимы в системах


с переменной структурой

Высокие динамические показатели систем с перемен­


ной структурой удается получить на основе следующего
подхода. Предполагается, что система состоит из несколь­
ких непрерывных подсистем, называемых в дальнейшем
структурами, причем каждая из них может оказаться и
неприемлемой с точки зрения качества процесса управ­
ления, например, неустойчивой. Задача синтеза управ­
ляющего устройства состоит в выборе параметров этих
структур и такой последовательности их изменения, чтобы
_ в системе удалось сохранить полезные свойства имею­
щихся структур, а в ряде случаев получить эффекты, не
присущие любой из них. В моменты изменения структуры
правые части дифференциальных уравнений, описываю­
щих движение системы, претерпевают разрывы на неко­
торых поверхностях в пространстве координат системы.
Поэтому и в системах с переменной структурой возмож­
но возникновение скользящих движений. Именно предна-
14 ВВЕДЕНИЕ 1ГЛ. 1

меренное введение в систему скользящего режима и ле­


жит в основе большого висла алгоритмов управления
в этом классе систем. Приведем простейшие примеры ис­
пользования скользящих режимов, которые сейчас уже
могут показаться тривиальными, но в свое время они под­
твердили разумность подхода, связанного с изменением
структуры в процессе управления, и стимулировали даль­
нейшие исследования в этом направлении. Наряду с при­
мерами, иллюстрирующими решение той или иной задачи
управления, будут указаны также публикации, в которых
эти задачи рассмотрены в более общей постановке.
Первый пример связан с задачей об устойчивости в си­
стеме управления объектом с постоянными параметрами,
движение которой описывается уравнениями

( 1. 1)

где х2 — координаты системы, ах, а2 — постоянные па­


раметры, и — функция управления. Составим управление
в виде воздействия по координате хх:
и = — Ч'а^, ( 1. 2)
и предусмотрим две линейные структуры в этой систе
ме, которые соответствуют двум значениям а или — а
(а = const) коэффициента воздействия \Р. Пусть в урав­
нении ( 1. 1) коэффициент а2 является отрицательным, а
коэффициент а подобран таким образом, что характери­
стическое уравнение системы ( 1. 1), ( 1.2) при "У = а имеет
комплексные корни, а при Y = —а — действительные.
Фазовые портреты обеих структур представлены на
рис. 2 , а, 6, и, очевидно, каждая из них является неустой­
чивой. Убедимся теперь, что асимптотическая устойчи­
вость может быть достигнута в результате изменения струк­
туры (заметим, что в рамках одной линейной структуры
для стабилизации необходимо в управление добавить воз­
действие по хг — производной от координаты а^). Будем
изменять структуру системы на прямых
хх = 0, s = с#! + х2 = 0 (с > 0, с — const). (1.3)
Коэффициент с выберем таким образом, чтобы прямая
s = 0 находилась между осью хх и асимптотой гиперболи-
§ 1] СКОЛЬЗЯЩИЕ РЕЖИМЫ В СИСТЕМАХ 15

ческих траекторий, соответствующих структуре = — а


(рис. 2, б). На рис. 2, в приведен фазовый портрет системы

для случая, когда закон изменения структуры имеет вид


( а при а кз^О ,
'¥ = { (1.4)
(—а при х^^О . v
Как следует из рассмотрения фазового портрета, изо­
бражающая точка из любого начального положения всег­
да попадает на прямую переключения s = 0. В окрест­
ности этой прямой траектории обеих структур направле­
ны навстречу друг другу, поэтому дальнейшее движение
будет происходить в режиме переключений или в сколь­
IB ВВЕДЕНИЕ [ГЛ. I

зящем режиме вдоль прямой s = 0. Вопрос о том, какими


уравнениями описывается движение в скользящем режиме,
требует специального обсуждения, которое проведено во
введении ниже, а пока воспользуемся следующими эври­
стическими соображениями. Так как во время скользя­
щего режима изображающая точка не может покинуть лю­
бую сколь угодно малую окрестность прямой переклю­
чения, то при таком движении равна нулю величина сху +
+ х2. Имея в виду, что величина хг равна получаем

+ схх = 0. (1.5)

Полученное соотношение является дифференциальным


уравнением первого порядка, которое и принимается в ка­
честве уравнения скольжения. Решение этого уравнения
при с ]> 0 является устойчивым и, следовательно, система
с переменной структурой (1.1) — (1.4) также устойчива
при произвольных начальных условиях. Существенно, что
устойчивость достигнута в результате использования
двух «неприемлемых» структур и преднамеренного вве­
дения в систему скользящего режима. Эта идея син­
теза для управляемых объектов произвольного порядка
с постоянными параметрами получила свое дальнейшее
развитие в работах [8 , 10—16, 20, 25—27, 35—38, 46—
48, 52, 53, 57, 58, 86, 106] *).
Большое внимание в теории систем с переменной струк­
турой было уделено задачам управления нестационарными
объектами. Отдельно рассматривались два случая: в пер­
вом из них предполагалось, что нестационарность обус­
ловлена изменением характеристик объекта в широком
диапазоне, и во втором — наличием приложенных к объ­
екту внешних возмущений. Начало этим исследованиям
положила работа [39], в которой было показано, что если
функция управления формируется из регулируемой ве­
личины и ее производных, то движение в скользящем ре­
жиме не зависит от параметров объекта и внешних возму­

*) Отличительная особенность работ [10—12, 27, 46, 47, 86]


заключается в том, что правые части уравнений рассматриваемых
в них систем претерпевают разрывы второго рода. Поэтому в [46, 47,
86] движение исследуется с применением введенных в [1] условий
скачков, а в [10—12, 27] — иа основе так называемого метода разде­
ления движений.
§ 1] СКОЛЬЗЯЩИЕ РЕЖИМЫ В СИСТЕМАХ 17

щений и определяется только коэффициентами уравнения


плоскости переключения. Этот факт и используется при
построении управляющего устройства, которое обеспечи­
вает, начиная с некоторого момента времени, движение
в скользящем режиме с желаемыми динамическими свой­
ствами.
Поясним идею синтеза на примере системы (1.1) в слу­
чае, если параметры объекта меняются во времени. Пред­
положим, что коэффициенты ах и аг меняются во времени,
причем эти коэффициенты недоступны для измерения и
известен лишь диапазон их изменения. Тогда параметры
а и с в (1.3) и (1.4) следует выбрать таким образом, чтобы
при любых значениях коэффициентов ах и а2 прямая пере­
ключения оказалась ориентированной так, как это ука­
зано на рис. 2, б. В этом случае, несмотря на то, что при
изменении ах и а2 фазовые траектории будут деформиро­
ваться, в окрестности прямой переключения s = О
(рис. 2 , в) они по-прежнему направлены навстречу друг
другу, и в системе всегда возникает движение в скользя­
щем режиме, описываемое уравнением (1.5). Так как ре­
шение уравнения (1.5) определяется лишь параметром с,
который можно выбирать по своему усмотрению, то воз­
никающее в системе скользящее движение не зависит от
изменения свойств объекта. Более подробный анализ опи­
санного здесь подхода к построению систем с изменяющи­
мися параметрами на основе принципа переменности
структуры и его обобщения для объектов произвольного
порядка можно найти в работах [17, 18, 20, 40, 41, 43, 56,
62, 81].
Приведем теперь примеры, иллюстрирующие возмож­
ности использования скользящих режимов для случаев,
когда нестационарность уравнений объекта обусловлена
внешними воздействиями — задающими и возмущающи­
ми. Задача управления состоит в том, чтобы обеспечить не­
зависимость движения от внешних возмущений и воспро­
изводимость регулируемой величиной задающего воз­
действия.
Сначала рассмотрим задачу о воспроизводимости на
простейшем примере первого порядка, представленном на
рис. 3, а. В этой системе также предусмотрим две линей-
ные структуры за счет того, I[вШдёй-t
ствия ¥ по регулируемой велйЙАКЯ !фЛояШ
18 ВВЕДЕНИЕ [ГЛ. X

два значения:

(1.6)

где х — величина ошибки, равная g (t) — ср, g (t) — за­


дающее воздействие. Если в пачальпый момент g ср, как
это показано на рис. 3, б, то согласно ( 1. 6) в системе будет
иметь место положительная обратная связь и координата

п t
а1
Рис. 3.

Ф, равная ф0еа', «догонит» задающее воздействие. После


изменения знака ошибки обратная связь станет отрица­
тельной и ошибка вновь станет положительной (рис. 3, б).
В результате в системе возникнет скользящий режим, во
время которого координата ф воспроизводит задающее
воздействие *).
Задачу о компенсации влияния внешнего возмущения
рассмотрим на примере системы второго порядка, в кото­
рой объект и исполнительное устройство являются ин­
тегрирующими звеньями (рис. 4, а). К объекту приложено
недоступное для измерения внешнее возмущение / (г).
Управление составим в виде суммы воздействий по регу­
лируемой величине х, которую нужно свести к нулю

*) Разумеется, воспроизводимость будет иметь место, если


|g |<С I ф I- Здесь же отметим, что в случае, когда ср и g в началь­
ный момент времени имеют разные знаки и величина g не меняет
знака, то скользящий режим в системе не возникает, так как регу­
лируемая координата ф также ие может сменить знак. Для того
чтобы обеспечить воспроизводимость при произвольных начальных
условиях, достаточно к управлению и добавить линейное во дей­
ствие по координате ощибки —кх (к > 0 ) .
§ 1] скользящ ий ГЁШЙМЫ В СИСТЕМАХ 19

в результате управления, и по выходной величине ис­


полнительного устройства у. Введем обозначения х — хг

исполнительное
устройство объект
га;
-И& / /
-V s

-V

и х2 = и запишем уравнения движения объекта и


системы:

У = Щ + /,
= х%, (1.7)
±г= -Ч Г ^ -У х г -Ч Г у ! - } .

Предполагая, что возмущение / (() принадлежит классу


функций
| ///| < £ (В — const),
20 ВВЕДЕНИЕ [ГЛ. I

выберем следующий закон изменения структуры системы:


а при ays > 0,
— а при ays < 0
В при ys ^> 0,
— В при ys < 0,

где s = сау + х2, а, с — const, с 0.


Как уже отмечалось выше, в случае, если внешнее воз­
мущение отсутствует (/ (t) = 0), коэффициент а можно
подобрать таким образом, чтобы на всей прямой s = 0
существовал скользящий режим (фазовый портрет такой
системы для любого значения равного В или —В, бу­
дет иметь вид, представленный на рис. 2, в). Если же
/ (t) ^ 0 , то особые точки фазовых портретов каждой из
четырех линейных структур сместятся из начала коорди­
нат, причем величины и знаки смещения определяются ко­
эффициентами а, В п возмущением / ( t). На рис. 4, б, в
представлены отдельно правая и левая полуплоскости
фазового портрета системы (1.7) для области |х2 | / (t),
в которой согласно (1.7) знаки у и / совпадают. Как сле­
дует из рассмотрения фазового портрета, особые точки
смещаются таким образом, что фазовые траектории в
окрестности прямой переключения s = 0 направлены на­
встречу друг другу и в системе всегда возникает скользя­
щий режим*). Движение в скользящем режиме описывает­
ся однородным дифференциальным уравнением (1.5), реше­
ние которого устойчиво. Таким образом, в результате
изменения структуры удается парировать внешнее воз­
мущение, которое недоступно для измерения, и сделать
величину ошибки после окончания процесса управления
равной нулю. Все вопросы, связанные с достижением вос­
производимости регулируемой величиной задающего воз­
действия и независимости от внешних возмущений для
систем произвольного порядка с постоянными и перемен-

*) Строго говоря, кривые на рис. 4, б, в не являются фазовыми


траекториями, так как дифференциальные уравнения системы из-
за наличия возмущения являются нестационарными. Каждую из
этих кривых следует рассматривать как геометрическое место точек,
для которых в каждый фиксированный момент времени касательная
к кривой совпадает с направлением вектора фазовой скорости.
§и СКОЛЬЗЯЩИЕ РЕЖИМЫ В СИСТЕМАХ 21

иыми параметрами рассмотрены в работах [30, 31, 42, 44,


59—61, 67, 82, 83, 85, 87, 88, 9 6 - 9 9 , ИЗ].
Итак, при решении различных задач синтеза в классе
систем с переменной структурой весьма эффективным ока­
залось использование скользящих режимов. Идея синтеза
в большинстве случаев сводилась к созданию в системах
скользящих движений, не зависящих ни от характеристик
управляемого объекта, ни от приложенных к нему возму­
щений. Существенно, что для формирования скалярной
функции управления не требовалась информация об этих
параметрах и возмущениях, но возникла необходимость
в использовании помимо координаты ошибки ее произ­
водных, число которых определялось порядком системы.
В соответствии с этим движение системы рассматривалось
в пространстве координаты ошибки и ее производных.
С практической точки зрения применение такого под­
хода может натолкнуться на существенные технические
трудности, связанные с получением производных высо­
к и х порядков. Как известно, реальные дифференцирую­
щие устройства обладают собственными инерционностями,
и поэтому рассмотрение движения системы в простран­
стве координаты ошибки и ее производных может ока­
заться недопустимой идеализацией. Анализ поведения
систем с переменной структурой с учетом инерционностей
был проведен в работах [49—51, 93] и, кроме того, были
предложены методы уменьшения влияния неидеальностей
за счет создания скользящих режимов в самих дифферен­
цирующих устройствах [54, 55, 94].
Приведенные здесь примеры указывают на принци­
пиальную возможность решения наиболее часто встре­
чающихся задач управления за счет использования свойств
скользящих режимов. В то же время этими задачами да­
леко не исчерпывается вся совокупность проблем, успеш­
но решенных на основе преднамеренного введения в
систему скользящих движений. В ряде публикаций отра­
жены методы построения систем, в которых принцип пе­
ременности структуры позволил обеспечить необходимые
по техническим условиям ограничения на координаты объ­
екта [4], реализовать оптимальную фильтрацию при изме­
нении непредвиденным образом вероятностных характе­
ристик входных сигналов [45], улучшить качество управ­
ления за счет адаптации во время скользящего режима
22 ВВЕДЕНИЕ [ГЛ, 1

184], решить задали миогосвязанного регулирования [83]


осуществить идентификацию управляемого объекта [68],
построить системы, осуществляющие поиск экстремума
[ 66], и др. Систематическому изложению результатов
исследований по теории систем с переменной структурой
посвящены монографии [34, 45]. В этих же монографиях,
а также в статье [5] приводятся достаточно полные обзоры
работ по системам с переменной структурой.

§ 2. Условия возникновения и математическое


описание скользящих режимов

Рассмотренные в § 1 примеры систем с переменной


структурой носили частный характер, так как изучались
лишь системы второго порядка с управляющим воздей­
ствием, составленным из координаты ошибки и ее про­
изводной. Тем не менее с помощью этих примеров удалось
выяснить, насколько целесообразным является предна­
меренное введение в систему движений в скользящем ре­
жиме, и первые результаты оказались достаточно обна­
деживающими. В связи с этим возникает интерес рассмот­
реть возможности использования скользящих режимов
в системах более общего вида.
Отметим те основные особенности, которые могут воз­
никнуть в таких системах и которые не имели место в при­
веденных выше примерах. Во-первых, повышение порядка
дифференциальных уравнений системы, как это обычно
бывает при использовании метода фазового пространства,
приводит к существенному возрастанию аналитических
трудностей, связанных с изучением поведения системы.
Во-вторых, во многих случаях имеется возможность для
измерения помимо координаты ошибки каких-либо физи­
ческих координат системы, которые; несмотря на отсут­
ствие производных от ошибки, характеризуют состояние
системы. Этой особенностью целесообразно воспользо­
ваться при формировании функции управления. И, нако­
нец, третья особенность, которая зачастую присуща си­
стемам автоматического управления, заключается в том,
что управляющие воздействия могут быть приложены
к различным точкам объекта, т. е. управление является
векторной величиной.
§ г] УСЛОВИЯ ВОЗНИКНОВЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ 23

Итак, более общая постановка задачи об использовании


скользящих режимов относится к системам, в которых
функция управления формируется с использованием
каких-либо координат системы, не являющихся, вообще
говоря, ошибкой и ее производными, а сама функция уп­
равления может быть как скалярной, так и векторной ве­
личиной. Отметим, что в работах [6, 7, 63, 66, 83, 100—
102, 110— 112, 114] рассмотрены вопросы, связанные с
этими задачами.
Прежде всего необходимо уточнить формальные мате­
матические вопросы, которые возникнут при изучении
указанной совокупности задач. Для этой цели обратимся
к динамической системе общего вида с разрывным скаляр­
ным управлением, описываемой уравнениями

£ = / (х, t, и), ( 1. 8)

где х и / — гс-мерные векторы-столбцы, и — скалярная


функция, которая претерпевает разрывы на поверх-
' ности s (х) = 0 :

fn+ (х, t) при s (х) 0,


U |u~ {х, t) при s (х) < 0,

и+ (х, £), и~ (х, t), s {х) — некоторые непрерывные функ­


ции, и+ =)= и~. Так как мы планируем построить систему
таким образом, чтобы в ней возник скользящий режим, то
необходимо найти в аналитической форме условия, при
которых на поверхности s — 0 возникает такой вид движе­
ния. Ранее при изучении систем второго порядка вопрос
решался исходя из геометрических соображений, согласно
которым в окрестности поверхности разрыва фазовые
траектории должны быть направлены навстречу друг
другу.
Скользящий режим имеет смысл вводить в систему
лишь в том случае, когда этот вид движения обладает
желаемыми динамическими свойствами с точки зрения пре­
дъявляемых к процессу управления требований. Это озна­
чает, что мы должны уметь записывать уравнения, описы­
вающие движение в скользящем режиме. В системах второ­
го порядка, у которых поверхность разрыва была задана
В пространстве координаты ощибди ц ре производной,
24 ВВЕДЕНИЕ [ГЛ. I

уравнение поверхности являлось одновременно и уравне­


нием скольжения. К сожалению, в случаях, когда уравне­
ние поверхности разрыва задается в пространстве произ­
вольных координат, из него, вообще говоря, не удается
однозначно получить уравнения скользящего режима.
(Здесь же напомним, что и для систем второго порядка в
§ 1 уравнения скользящего режима были получены не стро­
го, а с помощью эвристических соображений.)
Таким образом, к обсуждению вопроса о целесообраз­
ности использования скользящих режимов для решения
различных задач управления можно приступить лишь
после того, как будут решены задачи об условиях возник­
новения скользящего режима и его математическом опи­
сании.
Необходимо отметить, что скользящие движения были
обстоятельно исследованы для конкретных случаев си­
стем регулирования в работах [80, 32], появившихся в д о --
военный период. Работа Г. Н. Никольского [80], по-ви­
димому, является первой публикацией по этому вопросу.
В работе [32] рассмотрена задача построения кривых пе­
реходных процессов при возникновении скользящих ре--
жимов для случая, когда в системе используется серво­
механизм постоянной скорости, а переключающее устрой­
ство обладает зоной нечувствительности.
Более детальные исследования для общих случаев стали
возможны в связи с развитием методов теории колебаний.
На основе фазовых представлений движения условия воз­
никновения скользящих режимов в системах со скаляр­
ным управлением применительно к линейному случаю
были получены в [29]. Эти условия оказалось возможным
использовать и для систем общего вида, описываемых
уравнениями (1.8). Скользящий режим в системе (1.8) воз­
никает, если на поверхности s {х) = 0 могут быть ука­
заны области ненулевой меры, где проекции векторов
/ + = / {х, t, u+ ) и / - = / (х , t, и~) на нормаль имеют разные
знаки и направлены навстречу друг другу (рис. 5). В ана­
литической форме условия возникновения скользящего
режима, полученные в [29], запишем в более удобном для
дальнейшего изложения вида, который был предло­
жен в [9]:
lim s <С 0, Гил s 0. (1.9)
8—
»--]-0 8—
►—‘0
§ 2] УСЛОВИЙ ВОЗНИКНОВЕНИЯ СКОЛЬЗЯЩИХ РЁЖИМОВ 25

Условия (1.9) выделяют область скольжения на по­


верхности разрыва. Принято считать, что после попадания
в эту область изображающая точка движется по поверх­
ности разрыва в пределах указанной области до момента
достижения ее границ. Такое дви­
жение будем называть идеальным
скольжением.
Обсудим теперь вопрос о ма­
тематическом описании скользя­
щих движений. С формальной точ- f
ки зрения уравнения с разрывной
правой частью не удовлетворяют
классическим теоремам о суще­
ствовании и единственности реше­
поверхность'
ния и, кроме того, правая часть разрыва
на границе разрыва чаще всего
Рис. 5.
вообще не определена. Одним из
возможных подходов к решению
этой задачи является аксиоматический подход, который
предполагает доопределение уравнений скольжения. Есте­
ственно, что при этом возникает элемент неоднозначности,
и с инженерной точки зрения необходимо выбрать такие
доопределения, которые позволяют правильно описывать
движения, протекающие в реальных системах.
В работах А. А. Андронова [2, 3], посвященных ис­
следованию нелинейных динамических систем, указыва­
лось, что неопределенность в поведении системы будет
устранена, если в уравнениях движения учесть малые
неидеальности (запаздывание, инерционности, гистерезис
и т. д.) и рассматривать так называемое реальное сколь­
жение, происходящее в некоторой малой окрестности по­
верхности разрыва. Идеальное скольжение следует рас­
сматривать как предельное движение, получаемое при
стремлении всех неидеальностей к нулю.
В большом числе работ, посвященных исследованию
разрывных систем, различным авторам удалось получить
математическое описание процессов скольжения, причем
в одних случаях эти уравнения постулировались, в дру­
гих — обосновывались предельными переходами. Поста­
новка такой задачи во всех случаях сводится к нахождению
некоторой системы дифференциальных уравнений с неп­
рерывными правыми частями, которые, несмотря на раз­
26 /ЁВЁДЁНЙЁ [ГЛ. 1

рывность функции управления в исходной системе, опи­


сывают движение в скользящем режиме. Далее в §§ 3, 4
применительно к системам с разрывным скалярным уп­
равлением мы приведем разливные способы доопределе­
ния, позволяющие формально выписать уравнения сколь­
жения с указанием границ их применимости. Затем в § 5
будут разобраны частные случаи предельных переходов,
связанные с введением в систему конкретных видов не-
идеальностей, которые могут служить обоснованием того
или иного формального доопределения уравнений сколь­
жения.

§ 3. Доопределение А. Ф. Филиппова

Наиболее распространенным в литературе в настоящее


время является доопределение разрывных уравнений
(1.8), предложенное А. Ф. Филипповым [103]. Согласно
этому доопределению в каждой точке поверхности разрыва
вектор фазовой скорости, определяющий решение, при­
надлежит минимальному выпуклому замкнутому множе­
ству, содержащему все значения / (х), когда х пробегает
всю б-окрестность рассматриваемой точки (при стремлении
б к нулю), кроме, быть может, множества нулевой меры.
Возможность отбрасывать множество нулевой меры поз­
воляет определить вектор фазовой скорости и для сколь­
зящих движений. Действительно, хотя в точках на поверх­
ности разрыва вектор для системы ( 1.8) неопределен, эти
точки в n-мерной окрестности составляют множество ну­
левой меры и могут быть исключены из рассмотрения *).
Применительно к доопределению идеального скольже­
ния в скалярном случае (т. е. в системах со скалярным
управлением) метод Филиппова приводит к следующему
результату: чтобы определить вектор фазовой скорости
/° в скользящем режиме, надо в каждой точке области
скольжения построить векторы фазовых скоростей соот­
ветственно «верхней» и «нижней» системы и соединить их
концы. Таким образом строится минимальное выпуклое
дополнение, о котором идет речь в доопределении Филип­
пова. В связи с тем, что по определению идеальное сколь­
*) В частности, такое доопределение используется в работе [107]
для исследования устойчивости систем, описываемых дифференци­
альными уравнениями с разрывной правой частью.
5 4] ДРУГИЕ ДООПРЕДЕЛЕНИЯ 27

жение происходит по поверхности разрыва, вектор фа­


зовой скорости этого движения лежит в касательной пло­
скости к поверхности, и поэтому для его нахождения надо
провести касательную к
поверхности разрыва до
пересечения с прямой, со­ вектор f~8mo4HeC
единяющей концы векто­
ров / + и f ~ (рис. 6). вектор f ° -
Так определенное «по фазоВая скорость В
скользящем режиме
Филиппову» уравнение
идеального скольжения касательная
плоскость
для системы ( 1.8) имеет вид
x = f { х , t) , Поверхность
разрыва
/° = ц/+ + ( 1 - ц ) Г
(0 < ц < 1), Рис. 6.

где ц — параметр, зависящий от взаимного расположения


■и величин векторов-столбцов /+, f ~ и вектора-строки
grad s — градиента функции s (х ) *). Вычисляя р из ус­
ловия grad S ' f = 0 , находим уравнение
grads-/" ,+ _ grad s-/+
grad s-(/- — /'г) ' grads-(/~ — /т) ' ’ (1-Ю)

описывающее движение в скользящем режиме при допол­


нительном предположении, что начальные условия для
уравнения ( 1. 10) выбираются на поверхности разрыва,
т. е. s ( х (0)) = 0. С помощью уравнений (1.10) Филиппов
предложил доопределять движение в скользящем режиме.

§ 4. Другие доопределения

Рассмотрим теперь различные способы доопределения,


которые были опубликованы до появления работы Филип­
пова и которые применительно к линейным системам с
*) Этому уравнению можно дать достаточно простую физиче­
скую интерпретацию. Если предположить, что в окрестности поверх-^
ности разрыва происходят переключения с достаточно высокой
частотой, причем Дtx — время движения, соответствующее фазовой
скорости / +, а Дt2 — фазовой скорости / _, то, обозначая через р
величину Дtxl (Aij -f- Дг2), получим, что вектор р равен средней
скорости такого движения.
28 ВВЕДЕНИЕ [ГЛ. 1

релейным управлением позволяют полупить уравнения


движения в скользящем режиме.
В работах [65, 89] изучались релейные системы второго
порядка, описываемые уравнениями -
J.Ti = + ^12^2!
[.T j = ^21^1 “ Ь ®22*^2 “ Ь ^1

( М при S ]> О,
1— М при s < 0, s = схг + х2>
где х-у, х, — координаты состояния, ац (£, 7 = 1, 2), с, М —
const. Для получения уравнения скольжения вдоль пря­
мой s = 0 предлагается исключить из исходной системы
второе уравнение, решить уравнение s = 0 относительно
х 2 и подставить полученное значение в первое уравнение
Xj " (^11 ^12^) х1' ^
Авторы обратили внимание на то, что в скользящем режи­
ме уравнения движения линеаризуются *).
В работе [29] приведено обобщение предложенного в
[65, 89] метода получения уравнений скольжения для
линейных систем произвольного порядка, у которых
разрывное управление входит лишь в одно из уравнений
движения
х = А х -(- Ъи, (1.11)
где х — вектор состояния с компонентами хх, . . ., х п,
А — квадратная матрица с постоянными элементами
аи (*> / = 1, • • ., п), b — вектор с постоянными элемента­
ми bi = 0 (г = 1, . . ., п — 1), Ъп =f= О,
1 при s^> О
и
1 при s < [ 0,
71
S = 2 ciXb ci — COnst, Сп = 1.
i=l
*) Отметим, что явление линеаризации элемента с разрывной
характеристикой впервые было детально исследовано в работе
[69], в которой режим переключений этого элемента создавался ис­
кусственно за счет введения на его вход высокочастотного сигнала
рт постороннего источника.
§ 4] ДРУГИЕ ДООПРЕДЕЛЕНИЯ 29

И в этом случае последнее уравнение в (1.11) исключается


из рассмотрения, а в первые (п — 1) уравнения подстав­
ляется решение уравнения s = 0 относительно х п\
П—1
&i = 2 («й — c ia h i)x i (i = 1, . . ., re — 1). (1.12)
3=1

Полученная в результате этой процедуры линейная си­


стема ( 1. 12) и принимается в качестве уравнений сколь­
жения .
В работе [78] указывается последовательность дей­
ствий, которая дает возможность записать уравнения
скольжения для случая, когда помимо Ъп могут быть от­
личны от нуля и остальные элементы вектора Ъ. Согласно
приведенному в этой работе методу координаты и и s
системы ( 1. 11) рассматриваются как входное и выходное
воздействия, а переходная функция этой системы ср (t — т)
считается известной. Тогда реакция системы на произволь­
ное входное воздействие и (t) будет иметь вид
i
s (t) — s0 (t) + jj ф (t — t) и (x) dx, (1.13)
о
где s 0 (t) — функция времени, зависящая от начальных
условий, s 0 (0) = 0. В качестве уравнений скольжения
автор предлагает принять уравиения, которые получатся
в результате подстановки решения интегрального уравне­
ния

s0(£) + ^ ф (t — т) и (т) dx = 0
о
относительно и (t) в исходную систему ( 1. 11).
Отметим еще один метод получения уравнений сколь­
жения, основанный на замене элемента с разрывной ха­
рактеристикой линейным звеном с бесконечным коэффи­
циентом усиления [105]. Согласно этому методу в качестве
уравнений скольжения следует принять предельные урав­
нения, которые получаются в результате подстановки
в исходную систему ( 1. 11) вместо управления и линейной
функции ks (к = const) с последующим стремлением ко­
эффициента к к бесконечности.
30 ВВЕДЕНИЕ [ГЛ. I

В этом параграфе мы ограничились липгь описанием


формальных процедур получения уравнений скольжения,
умышленно оставляя в стороне вопрос об их сопоставле­
нии. К этому вопросу мы вернемся в разделе I, в котором,
исходя из физических соображений, с помогдыо предель­
ных переходов будет показано, что в разрывных системах
с линейным вхождением управления (а система ( 1. 11)
является таковой) уравнения скольжения при любом
способе доопределения должны совпадать.

§ 5. Предельные переходы для обоснования


уравнений скольжения

Все приведенные выше методы получения уравнений


скольжения носили аксиоматический характер, и для
того чтобы убедиться в правомерности использования
этих уравнений для исследования реальных систем управ­
ления, необходимо проделать предельные переходы, о ко­
торых шла речь в § 2. Для устранения неоднозначности
поведения системы па границе разрыва следует учесть
различные неидеальности, которые всегда в ней присут­
ствуют и которые приводят к возникновению реального
скользящего режима. Уравнения идеального скольжения
могут быть получены при стремлении неидеальиостей
к нулю.
Далее мы порознь рассмотрим три конкретных вида не-
идеальностей и покажем, что при введении каждой из них в
систему ( 1.8) с последующим стремлением к нулю предель­
ные уравнения совпадают с уравнениями, к которым при­
водит доопределение Филиппова. По-видимому, это об­
стоятельство является одной из причин широкого исполь­
зования доопределения Филиппова для исследования
систем автоматического управления с j разрывными
управляющими воздействиями.
Здесь оговоримся, что все дальнейшие рассуждения
будут носить качественный характер. Идея предельных
переходов состоит в определении средней скорости движе­
ния изображающей точки в окрестности некоторой точки
на границе разрыва и в осуществлении предельного пере­
хода, который предполагает стремление этой окрестности
к нулю. В достаточно малой окрестности рассматриваемой
дочки векторы фазовой скорости и градиента к поверхно­
5 5] п ред ел ьн ы е Пе р е х о д ы Si

сти разрыва будем считать постоянными. В этом и будет


заключаться элемент нестрогости последующих рассуж­
дений.
а) Неидеальность типа гистерезис. Предположим, что
переключающее устройство, которое осуществляет скач­
кообразное изменение величины управления, обладает
гистерезисом. Тогда функция и в уравнении (1.8) будет
иметь вид
_ (и+ (х, t) при s (х ) > Д,
U “ <
(и~ (х, t) при s (х) <С — А (А — const),
а в области |s (х) | А функция и сохраняет то значение,
которое она имела, когда величина |s | в последний раз
была равной А.
По-прежнему будем считать, что в идеальной системе
(при А = 0) выполняются условия скользящего режима
(1.9), т. е. в окрестности поверхности разрыва s (х) = 0
фазовые траектории направлены навстречу друг другу.
Наличие гистерезиса при­
водит к тому, что после
попадания на поверхность
s=0
разрыва изображающая
точка уже не будет дви­
гаться точно вдоль поверх­
ности,' а будет совершать
колебания в ее окрестно­
сти шириной 2А (рис. 7). Для определения средней ско­
рости, соответствующей этому движению, найдем пред­
варительно перемещение изображающей точки Ах на двух
соседних интервалах — на первом из них и равно и~, а
на втором ц+:
Да: = f~Atx + /+Дг2, (1.14)
_ где Afx и At2 — продолжительности этих интервалов. Ве­
личины Atx и At2 находятся из соотношений
2А 2А
A tx Af2 = (1.15)
grads-/- ’ grads-/+
Из уравнений (1.14), (1.15) определяем среднюю скорость
_ grad s ■/~ ,+ grad s-f+
Г. (1.16)
— grads •(/“ — /+) ‘ grads-(f~ — Г)
32 ВВЕДЕНИИ [ГЛ. I

Непосредственно из сопоставления ( 1. 10) и (1.16) следует,


что вычисленный таким образом вектор фазовой скорости
совпадает с вектором фазовой скорости, полученным с по­
мощью доопределения Филиппова.
б) Неидеалыюсть типа запаздывание. Предположим,
что переключающее устройство осуществляет скачкооб­
разное изменение функции управления не в моменты изме­
нения знака величины s, а с некоторым запаздыванием во
времени, равным т. В такой системе изображающая точка,
двигаясь, например, из об-
Z " ласти s < ; 0 , попадает на
f ~ r S \ f +At, поверхность разрыва s = 0
1/ Ах _ 5 s>0 (точка 1 на рис. 8) и из-за
s*0 -
— 7^ ч
rf~At,
s<0 наличия запаздывания
продолжает двигаться вре-
р 8 мя т по траектории, со­
ответствующей функции
управления и, равной и~
(или / = f~). В момент времени т (точка 2) происходит
переключение управления с и~ на и +, и изображающая
точка в течение интервала времени Д£х со скоростью / +
движется к поверхности разрыва s = 0 (точка 3), а пе­
реключение с и + на и~ происходит спустя время т (в точ­
ке 4). Затем вновь возникает движение с фазовой ско­
ростью / - , которое через время At2приводит к попаданию на
поверхность разрыва (в точке 5). Для определения средней
скорости вычислим величину перемещения Ах (вектор
1—5 на рис. 8) и интервалы Д£х и Дt2:
Ах — / х f+Atj -f- /+х -j- / At2
grad s-f~ grads-/+
АП = — X, A U — —
grad s•p grads-/-
Полученные значения позволяют найти среднюю скорость'
уО __ Да;
2Т + Ati + Ata’
уо _____ grad s-f- grad s-/+
(1.17)
grad s-(f — / +) г - grad s ■{}- — /+)

Как следует из сопоставления (1.10) и (1.17), и в этом слу­


чае получаем то же уравнение, к которому приводит ме­
тод Филиппова.
§ 6] ПРЕДЕЛЬНЫЕ ПЕРЕХОДЫ 33

Необходимо отметить, что в обоих рассмотренных слу­


чаях неидеальностей результаты, совпадающие с методом
Филиппова, были получены, по сути дела, без предельного
перехода, который предполагает стремление к нулю ши­
рины гистерезисной петли 2Д в первом случае и запазды­
вания т — во втором. Однако такой предельный переход
неявным образом содержится в предположении о посто­
янстве векторов / +, f~ и grad s, так как это условие спра­
ведливо лишь в пределе, когда отклонения от рассматри­
ваемой точки стремятся к нулю *). С аккуратно проделан­
ными предельными переходами для неидеальностей типа
гистерезис и запаздывание можно ознакомиться в работах
[108, 109].
в) Динамические неидеальности. Во многих случаях
реальный скользящий режим в некоторой конечной окре­
стности поверхности разрыва даже при идеальном пере­
ключающем устройстве может возникнуть из-за того, что
в идеальной модели ( 1.8) не учтены собственные малые
^.инерционностиисполнительных, измерительных устройств,
устройств для преобразования информации и, кроме
того, зачастую при исследовании реальных систем объект
управления аппроксимируют моделью более низкого'по­
рядка. Хотя эти неидеальности и не искажают стати­
ческих характеристик системы и обладают малыми соб­
ственными постоянными времени (т. е. их собственные
движения оказываются гораздо более быстрыми, чем дви­
жения в идеальной модели), они начинают проявляться при
возникновении скользящего режима, который характе­
ризуется высокой частотой переключения управляющего
воздействия.
Предположим для простоты, что поверхность разры­
ва в системе ( 1.8) является линейной, а управление ре­
лейным:
s = сх, (1.18)
где с — вектор-строка размерности 1 X в с постоянными
элементами, и + = М , иг = — М (М — const). Пусть
также будут линейными неучтенные в идеальной модели
( 1.8) инерционные звенья, и эти звенья находятся в кана­
лах измерения компонент вектора х, необходимых для
*) Разумеется, при выполнении достаточно общих требований»
накладываемых на функции / +, /~ и s.

2 В. И. Уткин
34 ВВЕДЕНИЕ tra . i

формирования поверхности разрыва. Это означает, что вся


система в целом содержит некоторую дополнительную
динамическую подсистему, состояние которой характе­
ризуется некоторым выходным вектором состояния у,
например, размерности т) с вектором х на входе:
xij = A y + Н х, (1.19)
где А и Н — постоянные матрицы размерности т X т и
т X п, собственные числа матрицы А имеют отрицатель­
ные действительные части, т — достаточно малая поло­
жительная величина, характеризующая «темп движения»
дополнительной динамической подсистемы. Из-за наличия
неидеальностей в каналах измерения вместо вектора х для
формирования функции управления (1.18) будет исполь­
зоваться некоторый гс-мерный вектор х*, составленный из
всех или из части компонент вектора у:
х * = Лу, (1.20)'
Л — постоянная матрица размерности п X т,
и соответственно уравнение поверхности разрыва вместо
(1.18) будет иметь вид
s* = 0 , s* = сх*. ( 1-21)
Мы рассматриваем здесь неидеальиости лишь динамиче­
ского типа, и следовательно, в статическом режиме век­
тор а: должен измеряться без искажений. Из (1.19) — (1-21)
получаем условие равенства векторов х и х* в статическом
режиме, которому должны удовлетворять матрицы И, Л"
и Л:
— ЛА~гН = Е, Е — единичная матрица (1-22)
(матрица И -1 существует, так как матрица А не имеет ну­
левых корней). Таким образом, поведение системы опи­
сывается уравнениями (1.19) — ( 1.22) вместе с уравнением
1 при s* 0,
х = а + Ъи, и'1 (1.23)
— 1 при s*<^ 0 ,
1 1
гдеа = у ( / + + /~), & = у ( / + — / _ ). Векторы а и Ь, так
же как и при изучении систем с гистерезисом и запазды­
ванием, будем считать постоянными.
§ 5] ПРЕДЕЛЬНЫЕ ПЕРЕХОДЫ 35

В случае, если динамические неидеальности в системе


отсутствуют, т. е. т = 0 и s* — сх, из условия (1.9) и
уравнения
s* = са + cbu*

можно выписать условия возникновения скользящего ре­


жима в идеальной системе ( 1.8) или эквивалентной ей си­
стеме (1.23):
сЪ ■< 0, |сЪ | | са |. (1-24)

Введение динамических неидеальностей в систему (т. е. в


(1.19) величина т отлична от нуля) устраняет неоднознач­
ность в поведении системы на границе разрыва s* = О,
так как в этом случае величина s* становится непрерыв­
ной и скользящий режим возникнуть не может. Покажем
теперь, что при выполнении условий (1.24) и стремлении
т к нулю предельные уравнения для системы, в которой
учтены динамические неидеальности, совпадают с урав­
нениями, полученными в результате применения доопре­
деления Филиппова к идеальной системе. Это утвержде­
ние будет обосновываться с помощью метода гармониче­
ского баланса (разумеется, в рамках присущих этому
методу гипотез).
Будем считать и* и s* входным и выходным воздей­
ствиями в системе и запишем уравнения движения относи­
тельно этих координат в изображениях по Лапласу,
исключив из (1.19) — (1-21), (1.23) промежуточные пе­
ременные

s* (р) — cR (тр — Л) 1 Н -jr + Н А . и* (р) + Н х (0) + ху{0)],


(1.25)

где х (0), у (0) — начальные условия. В соответствии


с процедурой метода гармонического баланса решение
уравнения (1.25) относительно s* будем искать в виде

s* = Я„ + sin <*>£,

где Л„, Яц о — const, а в функции и* = sign s* будем


учитывать только постоянную составляющую Но и первую

2*
36 ВВЕДЕНИЕ СГЛ. I

гармонику Uj sin соt разложения в ряд Фурье:

Uo = arcsin , (1-26)

^ = 4-/*-(£•)■•
Подставляя изображения s* и и* в (1.25), получим тож­
(1'21)"
дество, из которого и находятся искомые коэффициенты
Я.0, ^ или и0, щ. После разложения на элементарные дро­
би и приравнивания с учетом условия ( 1.22) к нулю коэф­
фициента перед дробью i/p2 определяем постоянную со­
ставляющую функции управления

(1.28)

а из (1.26) — (1.28) — амплитуду первой гармоники


4 п са
и1 — cos (1.29)
К Т~сЪ
(обратим внимание, что постоянная составляющая функ­
ции и* = sign s* не может быть больше единицы, что и
имеет место согласно (1.24) и (1.28)). Наконец, для нахож­
дения частоты воспользуемся уравнением баланса фаз
первых гармоник входного и выходного сигналов

arg с R (xjaE — Л)_1# -у^ - = Чг /от,


или
arg сВ (jwE — A y 1НЪ = ±кл, к = 0,1,2,... (1.30)

где© = т со - Предположим, что в дробно-рациональной


функции cR (хрЕ — А)~гНЪ степень знаменателя по меньшей
мере на два превосходит степень числителя. Тогда урав­
нение (1.30) всегда имеет не зависящее от х решение отно­
сительно со, которое обозначим через со0, и соответственно
частота первой гармоники © находится из условия *)

©= ^ . (1.31)

*) Устойчивость этих гармонических колебаний может быть


обоснована с помощью критерия устойчивости предельных циклов,
разработанного в методе гармонического баланса.
§ в] ПРОБЛЕМЫ ТЕОРИИ СКОЛЬЗЯЩИХ РЕЖИМОВ 37

Таким образом, при наличии динамических неидеально-


стей согласно (1.28), (1.29), (1.31) поведение системы
(1.23) приближенно описывается уравнением

х = а- ь^ + Ъ( - ^ с05 — ^ ь ) 51П— *- t1-32)


По мере уменьшения величины т, характеризующей до­
полнительную динамическую подсистему, частота периоди­
ческой составляющей будет увеличиваться и, как это сле­
дует из (1.32), ее влияние на двшкение в системе будет
уменьшаться. Это означает, что в пределе при стремлении
т к нулю решение системы (1.32) будет совпадать с реше­
нием следующей предельной системы:

х = а— (1.33)

Подставляя в (1.33) вместо а, Ь, с соответственно их зна­


чения 7 2 (/+ + /~), У2 (/+ — / “ ), grad s, после преобразо­
ваний получаем
_ g ra d s-/ ,+ _ grad s - f +
(1.34)
grad s •(/- — /+)1 grad s •(/" — /+) '
Как следует из сопоставления (1.10) и (1.34) и в случае
введения в систему динамических неидеальностей с после­
дующим стремлением их к нулю, предельные уравнения
также совпадают с доопределением Филиппова.

§ 6. Проблемы теории скользящих режимов


в системах с разрывными управлениями
Итак, во введении мы выяснили, что, с одной стороны,
применение скользящих режимов сулит довольно большие
возможности для построения систем автоматического уп­
равления и, с другой стороны, для исследования дове­
дения разрывных систем требуется создание специального
математического аппарата, так как для них неприемлемы
методы классической теории дифференциальных уравне­
ний. С математической точки зрения поведение системы на
границе разрыва можно доопределить, однако при иссле­
довании реальных систем такой подход не может быть при­
нят безоговорочно, так как любое доопределение нуж­
дается в обосновании с помощью физических соображений.
33 ВВЕДЕНИЕ [ГЛ. 1

По нашему мнению, именно в сочетании доопределения


и его обоснования с помощью предельных переходов, а не
в доопределении, как таковом, лежит центр тяжести проб­
лемы описания поведения разрывных систем. Благодаря"
предельным переходам удается сиять элементы произвола
в доопределении и сопоставить различные способы до­
определения.
В то же время в большинстве случаев предельные пе­
реходы осуществлялись лишь для конкретных видов не-
идеальностей — гистерезиса, запаздывания [2, 23, 78,
108, 109] или же, как это сделано в § 5, для динамических
неидеальностей. В связи с этим остается открытым вопрос
о поведении системы при неидеальиостях произвольной
природы и соответственно вопрос о границах применимо­
сти того или иного доопределения уравнений скольжения.
В отличие от рассмотренных ранее скалярных случаев
в разрывных системах могут возникать и векторные слу--
чаи, когда управление является векторной величиной
и каждая его компонента претерпевает разрывы на соот­
ветствующей поверхности. В таких системах может ока­
заться, что изображающая точка после попадания на пере­
сечение поверхностей разрыва при любом достаточно ма­
лом отклонении вновь возвращается на это многообразие.
(Например, если на каждой из поверхностей разрыва вы­
полняются условия возникновения скользящего режима
(1.9), предназначенные для скалярного случая.) Это оз­
начает, что дальнейшее движение будет происходить вдоль
пересечения поверхностей разрыва и такое движение так­
же будем называть идеальным скольжением. Возможность
появления этого более сложного вида скользящего режи­
ма порождает совокупность и более общих по сравнению
со скалярным случаем постановок задач. Во-первых,
необходимо в аналитической форме получить условия воз­
никновения скользящего режима уже не по одной поверх­
ности разрыва, а по пересечению нескольких поверхно­
стей. Вторая задача связана с созданием формальных
методов, или доопределений, позволяющих выписать урав­
нения скольжения вдоль многообразия пересечения. И, на­
конец, третья задача состоит в обосновании этих доопре­
делений с помощью предельных переходов, которые не
были бы связаны с введением конкретных видов неиде-
альнбстёй.'Очёвидно, что третья задача включает'в себя
§ б] ЙРОЁЛЁМЫ ТЁОРЙЙ СКОЛЬЗЯЩЙХ РЕЖИМОВ 39

сформулированную в этом параграфе задачу о поведении


системы со скалярным управлением при неидеальностях
произвольной природы.
Следующий далее раздел I и посвящен математическому
аппарату исследования разрывных систем как со скаляр­
ным, так и векторным управлением, создание которого и
предполагает решение перечисленных задач.
В разделе I приводится формальный прием получения
уравнений скольжения как в скалярном, так и в векторном
случаях и выделяется класс систем, для которых право­
мерность этого приема подтверждается с помощью введе­
ния неидеальностей произвольной природы и последую­
щего предельного перехода. Выявляются случаи, когда
уравнения скольжения не могут быть выписаны однознач­
но, и устанавливаются причины появления неоднознач­
ности. Задача о возникновении скользящего режима для
векторных случаев решается на основе второго метода
Ляпунова. Рассмотренные в разделе I методы исследования
^разрывных систем могут быть использованы для изуче­
ния свойств скользящих режимов, а затем и для построе­
ния систем управления, в которых желаемые динамиче­
ские показатели удается получить за счет преднамерен­
ного создания этого вида движения. Возможные подходы
к синтезу систем такого типа обсуждаются в разделе I.
Как уже отмечалось в § 2, задача синтеза может со­
стоять в определении величины управления как функции
произвольных физических координат системы (а не только
координаты ошибки и ее производных, как это имело место
в большинстве случаев использования свойств скользя­
щих режимов), а сама функция управления может быть не
только скалярной, но и векторной величиной. Методы ре­
шения наиболее часто встречающихся на практике задач
управления на основе создания скользящих движений
классе систем с переменной структурой подробно изу­
чаются в разделах II и III.
Раздел II посвящен различным задачам построения
систем, в которых объект является линейным, а управле­
ние — скалярной величиной. Порознь рассматриваются
случаи, когда параметры объекта постоянны и меняются
во времени, а также случаи, когда осуществляется управ­
ление свободным и вынужденным (при наличии возмуще­
ний) движением объекта.
40 ВВЕДЕНИЕ [ГЛ. t

В разделе III приводятся обобщения для систем с век­


торным управлением. Задачи высококачественного уп­
равления, так же как и в скалярном случае, решаются
в классе систем с переменной структурой, а методы син­
теза основываются на создании скользящих движений по
пересечению поверхностей разрыва. В разделе III приво­
дятся условия, при которых скользящие движения обла­
дают свойством инвариантности по отношению к внеш­
ним возмущениям и изменяющимся характеристикам объ­
екта. На основе скользящих режимов решаются также
различные задачи статической оптимизации и идентифи­
кации динамических объектов.
РАЗДЕЛ I
НЕКОТОРЫЕ ВОПРОСЫ ТЕОРИИ
СКОЛЬЗЯЩИХ РЕЖИМОВ

В этом разделе будут рассмотрены динамические си­


стемы, описываемые дифференциальными уравнениями
с разрывной правой частью. Разрывность уравнений дви­
жения обусловлена наличием скалярного или векторного
параметра, называемого в дальнейшем управлением, ком­
поненты которого претерпевают разрывы на некоторых
поверхностях, заданных в пространстве координат систе­
мы. Уравнения движения таких систем обычно задают
движение вне поверхностей разрыва и не определены иа
самих поверхностях. Как уже отмечалось во введении,
в таких системах может возникнуть скользящий режим,
характеризуемый тем, что во время этого движения тра­
ектория изображающей точки не может покинуть любую
сколь угодно малую окрестность какой-либо поверхности
или пересечения нескольких поверхностей. В главе II на
основе физических соображений будут выделены случаи,
когда уравнения вне поверхностей разрыва позволяют
однозначно выписать уравнения движения вдоль пересе­
чения поверхностей скользящего режима, и рассмотрены
различные ситуации, когда такая однозначность не имеет
места.
В главе III на основе определения устойчивости Ля­
пунова дается определение скользящего режима и получе­
ны условия его возникновения для различных векторных
случаев. Необходимость такого исследования обусловле­
на тем, что в векторном случае условия возникновения
скользящего режима не являются столь очевидными, как
это имело место в скалярном случае (напомним, что в ска­
лярном случае эти условия имели наглядную геометри­
ческую интерпретацию и предполагали направление фа­
зовых траекторий в окрестности поверхности разрыва
навстречу друг другу).
На основе описанных в главах II и III методов иссле­
дования разрывных систем в главе IV будет проведено
42 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

обсуждение проблемы синтеза систем автоматического


управления с желаемыми динамическими свойствами на
основе преднамеренного введения в систему скользя­
щих движений.

глава и
УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ
В РАЗРЫВНЫХ СИСТЕМАХ

§ 1. Постановка задачи. Метод эквивалентного


управления

Рассмотрим векторный случай разрывной динамиче­


ской системы, описываемой уравнениями
х — f (х, t, и). (2.1
В уравнении (2.1) х и / — «-мерные векторы-столбцы с
компонентами соответственно хг, . . ., х п и f lt . .
Xi — координаты системы, / г — непрерывные функции по
всем аргументам, и — пг-мериый вектор-столбец, называе­
мый в дальнейшем управлением, каждая компонента ко­
торого U; претерпевает разрывы на поверхности st (х) = 0:

_ ju t ( Х, t) при S| (х) О,
1 (х, t) при st (х) < 0 (£ = 1, - . тп),

где и?" (х, £), и г (х , t), (х) — некоторые непрерывные


функции (ut+ =f= u f ) *).
Заданные таким образом уравнения движения опре­
деляют поведение системы вне границ разрыва и, вообще
говоря, оставляют открытым вопрос о том, что происхо­
дит, когда изображающая точка попадает на эти границы.
Может оказаться, что при начальных условиях, лежащих
на пересечении поверхностей разрыва, дальнейшая тра­
ектория на некотором конечном интервале времени не по-

*) Все дальнейшие рассуждения можно применить и для не


стационарных поверхностей разрыва, уравнения которых s2 (х, t) —
= 0 явно зависят от времени. Этот случай сводится к рассматривае­
мым здесь и далее случаям за счет введения новой координаты
9!S$ d.Tn+i
х„ +1 = f и добавления к системе (2 . 1 ) уравнения —j -— = 1 ,
§ 1] ПОСТАНОВКА ЗАДАЧИ 43

кидает любую сколь угодно малую окрестность этого пе­


ресечения. В частности, для скалярного случая такое дви­
жение, названное ранее идеальным скольжением, возни­
кает, когда траектории системы в окрестности поверхно­
сти разрыва направлены навстречу друг другу (рис. 5).
Задача состоит в том, чтобы разумно доопределить
уравнения идеального скольжения по уравнениям, задан­
ным вне поверхностей разрыва и уравнениям самих по­
верхностей. С формальной точки зрения возможны любые
доопределения, позволяющие описать движение в скользя­
щем режиме. (Во введении приводится краткий обзор и
анализ некоторых из таких возможных доопределений.)
В дальнейшем для доопределения уравнений идеаль­
ного скольжения мы будем использовать формальный
прием, который назовем методом эквивалентного управле­
ния. Сущность этого метода состоит в следующем: произ­
водные по времени от функций s; (я), определенные в силу
системы ( 2. 1), приравниваются нулю, и полученная таким
образом система уравнений решается относительно ком­
понент вектора управления; решение этой системы, на­
зываемое эквивалентным управлением, подставляется в
исходную систему (2 . 1) и полученные в результате такой
процедуры уравнения применяются в качестве уравнений
идеального скольжения.
При решении вопроса о том, какой из всевозможных
методов доопределения уравнений идеального скольже­
ния более естественно принять *), представляется разум­
ным следующий путь рассуждений. Сам факт неопреде­
ленности уравнений возник только потому, что в исходных
уравнениях, в частности в уравнениях (2. 1), мы пренебрег­
ли различного рода малыми неидеальностями, которые от­
личают реальные системы от ее идеального описания.
В связи с этим надо ввести в рассмотрение различные ма­
лые неидеальности (типа запаздывание, гистерезис, ма­
лые инерционности и т. д.), выписать уравнения, отли­
чающиеся от исходных уравнений (2 .1) учетом этих не-
идеальностей, и устремить затем неидеальности к нулю.
При учете таких неидеальностей возникает вполне опре­
деляемое уравнениями движение вблизи поверхности раз­
*) Как мы увидим ниже, в частности, метод Филиппова и ме­
тод эквивалентного управления могут привести к различным урав­
нениям скольжения.
и УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ £гл. it

рыва («реальное скольжение»), которое в пределе, при


стягивании неидеальностей к нулю, должно перейти в
«идеальное скольжение». Если бы оказалось, что при раз­
ных неидеальностях или в зависимости от способа перехода
к пределу появляются разные предельные уравнения, то
было бы естественно считать, что задача доопределения
уравнений идеального скольжения по уравнениям, опи­
сывающим систему вне поверхностей разрыва, не имеет
единственного решения. Но если такой предельный пере­
ход может быть сделан независимо от вида неидеальиости,
т. е. может быть показано, что при любых неидеальностях
определенного класса получаются одинаковые предельные
уравнения, естественно считать, что полученные так
уравнения и являются искомыми.
С точки зрения приведенных рассуждений способ
доопределения Филиппова был обоснован лишь для ска­
лярного случая и лишь с помощью предельных перехо­
дов для частных случаев неидеальностей *)Л Эти же
неидеальиости использовались в работах [23, 78] для обо­
снования предлагаемых авторами иных способов доопре­
деления уравнений скольжения. В связи с этим остается
открытым вопрос о правомерности той или иной процеду­
ры доопределения уравнений идеального скольжения
(в том числе и процедуры Филиппова) даже в скалярном
случае для других видов неидеальностей.
Что касается векторного случая, то автору неизвест­
ны работы, в которых предлагались бы процедуры, поз­
воляющие в явной форме выписать уравнения скольже­
ния по пересечению поверхностей разрыва **).
*) В одном из них предполагалось наличие гистерезисной петли,
во втором — малого запаздывания, в третьем — малых инерцион­
ностей и реализовалось стремление их к нулю (см. главу I).
**) Метод Филиппова был разработан им применительно к ска­
лярному случаю. В [104] было высказано замечание о том, что ана­
логичным образом можно решать задачу и в векторном случае,
однако в векторном случае метод Филиппова не был подтвержден
какими-либо предельными переходами даже для частных видов
неидеальностей. Здесь же уместно отметить, что процедуры, анало­
гичные методу эквивалентного управления, без обоснования с по­
мощью предельных переходов использовались для векторного слу­
чая в системах с переменной структурой в работах [ 1 0 0 , 110 ], для
скалярного случая — в работе [90], а в работе [23] приводится ее
обоснование для частного случая разрывной системы со скаляр­
ным управлением.
§ 1] ПОСТАНОВКА ЗАДАЧИ 45

В следующем далее § 2 сначала рассматривается век­


торный случай разрывной системы с линейным вхожде­
нием управления. Показано, что независимо от вида
введенных в исходную систему иеидеальностей и способа
перехода к пределу предельные уравнения всегда опре­
деляются однозначно, и эти уравнения совпадают с урав­
нениями, полученными в результате формального приме­
нения метода эквивалентного управления.
Затем в § 3 рассматривается скалярный случай нелиней­
ной по управлению системы и показывается, что в зависи­
мости от вида иеидеальностей предельные уравнения могут
отличаться друг от друга. Выделяется класс неидеально-
стей, для которого возможна искусственная линеариза­
ция систем по управлению, и следовательно, становится
правомерным применение метода эквивалентного управ­
ления для получения уравнения скольжения. Обсуж­
даются вопросы грубости различных предельных пере­
ходов по отношению к малым параметрам, характеризую­
щим всегда присутствующие в системе неучтенные малые
запаздывания, инерционности и т. д.
Затем в главе II рассматриваются векторные случаи
разрывных систем общего вида с нелинейным вхож­
дением управления. В таких системах даже для фик­
сированного вида иеидеальностей могут иметь место
различные предельные уравнения в зависимости
от того, каким образом осуществляется предельный
переход.
В § 4 приводятся класс нелинейных систем и класс
иеидеальностей, для которых, так же как и в скаляр­
ном случае, возможна искусственная линеаризация,
что и позволяет однозначно получить уравнения сколь­
жения.
В § 5 разбираются вырожденные случаи линейных
по векторному управлению систем, в которых экви­
валентное управление не находится однозначно. В за­
висимости от характера вырождения уравнения скольже­
ния могут быть определены как однозначно, так и неодно­
значно, либо скользящий режим в системе вообще не
может возникнуть.
В заключение (§ 6) поясняется физический смысл эк­
вивалентного управления, с помощью которого опреде­
ляются уравнения скольжения.
46 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [1*Л. II

§ 2. Системы, линейные по управлению

Рассмотрим частный случай системы (2.1), когда век­


торное управление входит в него линейно, т. е. система
описывается уравнением

х = / (х, t) + В (х , t) ы, (2.2)
где х и / — 7г-мерные векторы-столбцы, В (х , t) — матри­
ца размерности п X т, и — ттг-мерньш вектор управле­
ния, каждая компонента которого претерпевает разрывы
на своей поверхности, заданной уравнением s t (х) = 0 *):

lilt (X, t) При S( (х) > О,


(2.3)
\щ (х , t) при s; (х) -< 0 .
Предполагается, что функция / (х, t), а также функция
В (х, t) и вне поверхностей разрыва удовлетворяют ус­
ловию Липшица. В системах такого рода могут возникать
скользящие движения,! которые в отличие от скалярного
случая лежат не на одной поверхности разрыва, а на их
пересечении. Оставляя пока в стороне вопрос о том, при
каких условиях такое движение возникает, формально
применим описанный в § 1 настоящей главы метод экви­
валентного управления для составления уравнений сколь­
зящего движения в этом векторном случае. С этой целью
введем в рассмотрение m-мерный вектор s = (sj, . . sm).
В соответствии с методом находится пЭ1(в из уравнения
s = 0, которое в силу системы (2.2) имеет вид
Gf + GBugHa — 0, (2.4)
где G — матрица размерности т X п, строки которой яв­
ляются векторами-градиентами функций s-,. (х). Предпо­
лагая, что detGB =f= 0 для любых х и t, находим
ыэкв = - (GB)-'Gf. (2.5)
В результате подстановки нэкв в исходную систему (2.3)
получаем уравнение
х — f — В (G B y'G f, (2.6)
*) Класс допустимых функций si(x) будет указан ниже при
изучении уравнений скольжения по пересечению поверхностей
разрыва.
| 2] СИСТЕМЫ, ЛИНЕЙНЫЕ ПО УПРАВЛЕНИЮ 47

которое при начальных условиях s (х (0)) = 0 и прини­


мается в качестве уравнения идеального скольжения.
Существенно, что в силу самого метода s (х) = 0 и при
выбранных начальных условиях все траектории системы
(2 .6) будут лежать на многообразии пересечения всех по­
верхностей разрыва размерности п — т. В соответствии
с этим вместо системы уравнений скольжения (2 .6) п-го
порядка можно записать систему уравнений скольжения
(п — т)-то порядка. Опишем процедуру получения такой
системы. Так как в скользящем режиме величина s тож­
дественно равна нулю, из системы тп алгебраических урав­
нений s = 0 выразим какие-либо пг координат через
остальные п — тп координат. Согласно теореме о неявной
функции такие координаты, например xn_m+1, . . ., х п,
всегда найдутся, если ранг матрицы G, составленной из
градиентов функций s, (х), равен тп. Это условие выпол­
няется, так как для рассматриваемой системы delGB ф 0.
Подставим в первые п — тп уравнений системы (2.6) вы­
численные таким образом координаты xn_,rt+1, . . ., х„,
а остальные тп уравнений отбросим. В результате получим
систему (п — т )-г о порядка, которая и будет описывать
движение в скользящем режиме.
Для того чтобы обосновать справедливость получен­
ных уравнений скольжения, необходимо в соответствии с
приведенной в § 1 схемой рассуждений организовать над­
лежащий предельный переход, который предполагает
введение в систему неидеальностей с последующим стрем­
лением этих неидеальностей к нулю. Наличие неидеально­
стей в управлении независимо от их природы приведет
к тому, что в системе возникнет так называемый реальный
скользящий режим, во время которого в отличие от
идеального скольжения фазовые траектории принадежат
некоторой конечной A-окрестности многообразия s (х) =
= 0 , т. е.
Г ТП

И *) К А. N = у 2*?- (2.7)
1=1

Будем считать, что г (s, х) — расстояние от любой точки


из окрестности (2.7) до многообразия s (х) = 0 оценивает­
ся неравенством
г (S, х) < ; Р А, (2.7а)
48 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

где Р — некоторое положительное число *). В этом слу­


чае движение системы будет описываться уравнением,
отличным от исходного уравнения (2 .2):

х = / (ж, t) + В (ж, t) й (ж, t), (2.8)'

где функция управления й уже включает неидеальности


любого рода и о ней известно лишь, что она обеспечивает
выполнение условия (2.7). Кроме того, предполагается,
что решение системы (2 .8) существует (например, функция
В (ж, t) й удовлетворяет условию Липшица, либо кусоч­
но-непрерывна и ограничена). Последнее предположение
естественно, так как неидеальности, которые обычно су­
ществуют в реальных системах, не выводят нас за пределы
этой гипотезы. Приведенное здесь уравнение (2.8) вместе
с неравенством (2.7) задает множество динамических си­
стем, так как может оказаться, что для целого класса уп­
равлений и фазовые траектории принадлежат Д-окрестно-
сти многообразия s (х) = 0. Доказательство того факта,
что при стремлении Д к нулю решение всех этих систем
стремится к одному и тому же пределу, и означало бы ре­
шение поставленной задачи.
Т е о р е м а . Если
1) на интервале [0, Т] какое-либо решение ж (t) системы
(2.8) таково, что фазовая траектория лежит в А-окрест-
ности многообразия s (х) = 0 , т. е. справедливо неравен­
ство (2.7),
2) для правой части уравнения ( 2.6), полученного с по­
мощью метода эквивалентного управления
х * = / (ж*, t)—В (х*, t) [G (ж*) В (ж*,- f)]-1G (ж*) / (ж*,г)**),
(2.9)
существует постоянная Липшица L,
3) частные производные функции В (х, t) [G (х)-В (x,t)\~l
по всем аргументам существуют и ограничены в лю­
бой ограниченной области,

*) Такое Р существует, например, если все градиенты от функ­


ций Si (х) по норме ограничены снизу какой-либо постоянной поло­
жительной величиной.
**) Для того чтобы различать решения систем (2.8) и (2.9), вектор
состояния в (2.9) обозначен через % *,
§ 2] СИСТЕМЫ, ЛИНЕЙНЫЕ ПО УПРАВЛЕНИЮ 49

4) для функции / (х , t) + В (х , t) и, которая входит в


правую часть уравнения (2 .8), описывающего реальное сколъ-
жение, существуют такие положительные числа М и N ,
что
\\f(x , t) + В (х, t)u (x , < )| | < М + W|*|, (2.10)
то для любой пары решений уравнений (2.8) и (2.9) с на­
чальными условиями
И 0 )-* * (0 )| | < Р Д (2.11)
существует такое положительное число Н, что
Iх (t) — х* ( t ) I яд для ге[ 0, Г] . (2.12)
Д л я доказательства теоремы следует оценить по норме разность
решений уравнений, описывающих движение в идеальном и реальном
скользящем режиме. Для реального скользящего режима величина
s уже не равна нулю, как это предполагалось при использовании
метода эквивалентного управления. Поэтому управление и, опре­
деленное в силу системы (2 .8 ), будет отличаться от и0КВ:
и = — (GB)-JG/ + (GB)-1 s,
и соответственно уравнение реального скользящего режима, полу­
ченное в результате подстановки и в (2 .8 ),
х = / (х , t) — В (х, t) [G (х) В (х , t)]_1G (ж) f (х, t) -|-
- f B ( x , t ) [ G (ж) В (ж, f) ] -1 s (2.13)
также отличается от уравнения (2.6) или (2.9) дополнительным чле­
ном В (ж, t) [G (ж) В (ж, Z)]- 1s. Разумеется, уравнение (2.13) содер
жпт все учитываемые неидеальности — от них зависит величина S.
Уравнение (2.13) описывает реальные скользящие движения с уче­
том неконкретизированных неидеальностей, и при стремлении Д
к нулю его решение будет описывать идеальное скольжение. (При
этом следует иметь в виду, что стремление Д к нулю, вообще говоря,
вовсе не означает стремления к нулю величины s.)
Прежде чем переходить к сравнению решений уравнений (2.6)
и (2.13), запишем эквивалентные им интегральные уравнения
/
ж* (f) = ж* (0) + у / (г* , Т) _ в (х*, т) [G (ж') В (ж*, т ) ] ' 1 X

X G (x*)/ (ж*, Т)МТ, (2 .6 а)


t
х (t) = ж (0) + J { / (ж, Т) — В (ж, г) [G (ж) В (ж, y)]-'G (ж) / (ж, Т)} dy +
о
t
+ 5 В (*. г) [С (.г-) В (ж, т ) ] - 1 i dy. (2.13а)
о
50 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ 1ГЛ. II

Проинтегрировав последнее слагаемое в (2.13а) по частям, оценим


по норме разницу решений (2.13а) и (2.6а) с учетом условий теоремы:
I
И * ) - * • ( » ) ! < Р А + $ £ [ * - * , 1*г +

+ р ( * . Т) [G (*)В (* ,Т )Г > * +
t
+ 5 | £ * ( * . Т) \G (*) В (х, t )]- i I - 1|^IIЙТ. (2. 14)

Решение уравнения (2.13а) или эквивалентного ему уравнения


(2.8) ограничено на конечном интервале времени [0, Т]. Это следует
из того, что при выполнении условия (2 . 10 ) решение уравнения (2 .8 )
удовлетворяет неравенству
Т
II* (0 И<II* (0)II + Л/Т + ^ N\\x\\dt.
о
Согласно лемме Веллмана — Гронуолла [28] из этого неравенства
и следует ограниченность решения уравнения (2.8), или (2.13а):
II* (0 К ( I * (0) II+ МТ) eNT (f е [0, Г]).
Тогда в силу ограниченности решения х (i), а также пн. 1) — 3)
теоремы неравенство (2.14) может быть представлено в виде
t
II* (0 - X* (t) К Sb + L X - **| dTl (2.15)
о
где S — положительная величина, зависящая от вида функций,
входящих в правые части уравнений (2.8) и (2.13), от начальных
условий, времени Т и постоянной Р. Применяя лемму Веллмана —
Гронуолла к нер\венству (2.15), но [учим
1И 0 - * * (* ) К #д ( * е [ 0 ,Г ]),
где Я = SeLT, что и доказывает теорему.

Утверждение теоремы означает, что при достаточно


близких начальных условиях в системах (2.8) и (2.9) бу­
дут также близки и решения этих систем. Так как урав­
нение (2.9) описывает идеальное скольжение по пересе­
чению поверхностей разрыва, а уравнение (2 .8) реальный
скользящий режим в окрестности этого пересечения (т. е.
§ 2] СИСТЕМЫ, ЛИНЕЙНЫЕ по управлению 51

s (х * (0)) = 0 и s (х (0)) Д), то величина ||х (0) —


— х* (0) | является, по сути дела, расстоянием от точки
х (0) до какой-либо точки, лежащей на многообразии
s = 0. В силу предположения (2.7а) о функциях st (х)
'для любой точки х ( 0) можно всегда найти такую точку
х* (0) на многообразии s = 0 , что будет справедливым
условие (2.11). Таким образом, согласно (2.12) для лю­
бого решения уравнения ( 2 .8), описывающего неидеальное
скольжение, существует отличающееся от него на вели­
чину порядка А решение уравнения (2.9), описывающего
идеальное скольжение, и на любом конечном интервале
времени
lima; (£) = ж* (i). (2.16)
д-*о
Полученный результат означает, что независимо от
t природы иеидеальностей, породивших реальный сколь­
зящий режим в окрестности пересечения поверхностей
разрыва, и независимо от способа стремления этой окре-
'Стности к пулю решение уравнения неидеального сколь­
жения (2.8) стремится к решению уравнения (2.9), полу­
ченного в результате формального применения метода
эквивалентного управления *). Этот факт согласно при­
веденным в § 1 рассуждениям и может служить обоснова­
нием правомерности использования метода для получе­
ния уравнений идеального скольжения. Мы ограничи­
лись рассмотрением лишь конечного интервала времени.
Трудности, связанные с осуществлением предельного

*) Проведенным выкладкам может быть дана следующая физи­


ческая интерпретация. Реальные скользящие режимы характери­
зуются конечной частотой переключения компонент вектора управ­
ления. Векторы фазовых скоростей каждой из непрерывных систем,
вообще говоря, не лежат на многообразии пересечения поверхностей
разрыва. Поэтому, для того чтобы при уменьшении Д изображаю­
щ ая точка оставалась в окрестности (2.7), частота переключений
должна возрастать. Исследуемое в теореме уравнение (2.13) описы­
вает реальный фильтр, реакция которого на внешние возмущения,
начиная с некоторой частоты, уменьшается с ростом частоты (этим
возмущением служит слагаемое В (GB)~1s в (2.13), благодаря чему
это уравнение и отличается от уравнения идеального скольжения
(2.9)). Поэтому при предельном переходе влияние дополнительных
членов, возникающих из-за учета иеидеальностей, уменьшается
и на предельное движение, т. е. на идеальное скольжение они не
влияют.
52 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

перехода для бесконечного интервала времени, определяют­


ся не спецификой нашей задачи, а вытекают из общих
свойств решений обыкновенных дифференциальных урав­
нений.
Остановимся подробнее на различных ситуациях, ко­
торые могут возникнуть при попытке обобщить рассмот­
ренный здесь предельный переход на бесконечный интер­
вал времени. При исследовании систем автоматического
управления нас обычно интересует поведение системы на
бесконечном интервале времени, но такая задача, разу­
меется, может возникнуть лишь тогда, когда рассматри­
ваемое движение устойчиво. Пусть для некоторой обла­
сти начальных условий любое решение уравнения (2.9),
полученного с помощью описанного выше формального при­
ема, асимптотически устойчиво относительно, например,
некоторого положения равновесия х х и для него суще­
ствует мажорирующая экспонента. В этом случае решение,
системы ( 2.8) с начальными условиями ( 2. 11) будет асим­
птотически приближаться к некоторой окрестности точ­
ки Хсо, размер которой пропорционален Д, причем сходи­
мость будет также носить экспоненциальный характер.
Доказательство этого утверждения основывается на том, что
любое решение системы (2.9) из некоторой области начальных ус­
ловий мажорируется экспонентой:

О **(<))-*« (2.17)

где А, у. — положительные постоянные величины, А 1. Для лю­


бого момента времени Т согласно (2.12) справедлива оценка

II* (Л — *оо К II-** (Л — * „1 + ЯД- (2.18)

1
Выберем Т равным -^-1п 2/1, тогда в момент времени Т имеем

Из последних двух неравенств с учетом того, что ||х* (0) — ||^


< || z (0 ) — ||+ РД, следует

О* ( Г ) - * » К
§ S] СИСТЕМЫ, ЛИНЕЙНЫЕ ПО УПРАВЛЕНИЮ 53

Тогда если начальные условия в системе (2.8) таковы, что

Р +2Я
||(х (0) — ^ гг,—1 А, ( 2 . 20)

где ~2 ~ < £ < 1 , £ — const, то


||*(7’) - * ee||<l-||*(0)-*eo|.

Если в момент времени Т неравенство (2.20) оказалось справед­


ливым, то с помощью аналогичных рассуждений, опять же сравни­
вая решения уравнений (2.8) и (2.9), при начальных условиях,
отстоящих друг от друга не более чем на Р Д, можно показать, что

|*(2T ) _ * oJ < ii* | * ( 0) - * o J .

Соответственно на к-м шаге (если в начале всех предыдущих шагов


в моменты 0, Т, . . ., (к — 1) Т оказалось выполненным условие
I (2 .20 )) имеем
||х (кТ) — ||< I .г (0 ) — ||.

Полученное соотношение означает, что решение системы (2.8) асим-


Р +2Н
птотически приближается к области ||х — ^ |К ^ ^ ~ Д, причем
сходимость носит экспоненциальный характер. Решения, начинаю­
щиеся в этой области, как это следует из (2.19) и (2.20), в момент
времени Т в ней же и заканчиваются. Оценим норму отклонения для
такого решения, имея в виду, что неравенство (2.18) справедливо
на всем интервале [0, Т]:
1*(0 —*ооII< II®* W - * Л + яд<||х* (0) - * в и + я д <
< ( 1 1 * (0 )- * Л + РДМ + Я Д < ( 4 г ~ Г “ д + р д ) л + ЯА-

Так как на конце рассматриваемого интервала решение по-прежне-


Р + 2Я
му принадлежит области ||х — ||^ ' g\ _ ~i— Ai то после первого
попадания в нее в некоторый момент времени г0 решение системы
(2 .8 ) на бесконечном интервале времени оценивается неравенством
IIх (0 — *оо I K ДА для to < t < ОО,
где
Р +2Н
R= Р } А + Я.
гг, —1
Таким образом, доказана экспоненциальная сходимость реше­
ния системы (2 .8 ) к малой окрестности положения равновесия систе­
мы (2.9), определяемой параметром Д, который характеризует ве­
личину различных неидеальностей системы.
54 УРАВНЕНИЯ СКОЛЬЗЯЩИХ. РЕЖИМОВ СГЛ. П

Из этих фактов следует, что для такого типа систем ре­


шения уравнений (2.8) и (2.9), начиная с некоторого мо­
мента времени, будут близки уже на бесконечном интер­
вале времени.
Рассмотрим теперь важный частный случай экспонен­
циальной устойчивости решения, полученного с помощью
метода эквивалентного управления уравнения, который
возникает в линейной системе с постоянными параметра
ми. Движение такой системы описывается уравнением
х = Ах Ви + g (t),
где А и В — постоянные матрицы размерности п X п и
п X т, g (t) — вектор-столбец, зависящий только от вре­
мени и характеризующий внешние воздействия, пг-мерное
управление и меняется в соответствии с (2.3), а поверх­
ности разрыва st = 0 являются плоскостями, т. е. т-м ер-
ный вектор s представим в виде
s — Сх,
где С — постоянная матрица размерности т X п и
det СВ =j= 0. Для определения уравнений скольжения
по пересечению поверхностей s t — 0 (i = 1, . . ., т) со­
гласно процедуре метода эквивалентного управления нуж­
но решить уравнение s = САх + СВи + Cg (t) = 0 от­
носительно управления
Щкъ = — (С В )-1 (САх + Cg (t))
и подставить полученное значение в исходное уравнение

= \Е - В (СВГ'С) Ах* + (Е - В (СВГ'С] g(t).

Это уравнение при начальных условиях Сх (0) = 0 и


является уравнением идеального скольжения *).
В неидеальном скользящем режиме реальное управле-_
ние и , обеспечивающее согласно (2.7) движение в Д-ок-
рестности пересечения s = 0 , может быть выражено через
величину з, которая уже не приравнивается к нулю, как
это формально делается в методе эквивалентного уп­

*) Здесь, так же как и в (2.9), вектор состояния обозначен че­


рез х*, чтобы отличить решение уравнения идеального скольжения
от уравнения реального скольжения.
СИСТЕМЫ, ЛИНЕЙНЫЕ ПО УПРАВЛЕНИЮ 55

равления:
и = - {С В )-'С {А х + g) + {СВ)~Ч.
Соответственно уравнение реального скольжения имеет
вид

-%L = [E — B {СВу'С] А х + [ Е - В {СВУЮ] g + Б {СВ)~Ч.


at

Покажем теперь, что если любое решение уравнения иде­


ального скольжения асимптотически устойчиво, то оно
будет отличаться от решения уравнения реального сколь­
жения на величину порядка А на бесконечном интервале
времени, начиная с момента возникновения скользящего
режима. Если ср (£) — фундаментальная нормированная
матрица решений уравнения идеального скольжения при
g (t) = 0 (т. е. ср (0) = Е), то общее решение этого урав­
нения имеет вид
t
„ х* (£) = ср (*) х* (0) — J ф (* — х) [Е — В [С В уЧ ] g (х) dx.
О
Запишем решение уравнения реального скольжения
i
х (£) = ф (t) х (0) — ^ ф (t — т) [Е — В (СВУЮ] g (т) dx 4-
о

+ ^ {t - x ) B { C B ) - ^ d x .
о
, Проинтегрировав последнее слагаемое по частям, оце
ним по норме разницу этих двух решений:
1х (*) — х* (<) ||< ||ср(i) 11х (0) — х* (0) ||+
~ + II IIII{СВ)~Х||Is {t) I + 15 1|I {С В у1 ф (0 ||«(0) II+
t
d
dTcp(*-T)S(C zH ||M |dT.

Так как во время реального скольжения справедливо не­


равенство ||«||<;Д, начальные условия х (0) и х (0)
всегда можно подобрать в соответствии с (2.7) и в силу
асимптотической устойчивости уравнения идеального
56 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

1
скольжения функции ||ср (t) || и dx ог­

раничены на бесконечном интервале времени, то всегда


существует такое положительное число N , что

!*(*) — ®*(0 | < ^ д

lima: (t) = х" (t) для 0 < !£ < ^ оо.


Д->0
Обратим внимание на то, что таким свойством «близости»
в общем случае системы обладают лишь на любом конеч­
ном интервале времени, в случае экспоненциальной устой­
чивости — начиная с некоторого момента времени, а для
асимптотически устойчивой линейной системы с постоянны­
ми коэффициентами — с момента возникновения сколь­
зящего режима.
Необходимо отметить, что требование экспоненциаль­
ной сходимости решения системы (2.9) не носит формальный
характер, а является существенным. Может оказаться, что
для решения этой системы не существует мажорирующей
экспоненты, хотя оно и асимптотически приближается к
некоторой точке равновесия, а решение системы ( 2.8) или
эквивалентной ей системы (2.13), которая отличается от
(2.9) слагаемым В (GB)~lGs, будет стремиться к бесконеч­
ности *).
В этом и остальных случаях, например, если решение
уравнения (2.9) неустойчиво (Ншл; = оо) или устойчиво,
(—
*■00
но не асимптотически, как бы близки ни были выбраны
траектории двух рассматриваемых систем (2.8) и (2.9)
вначале, они останутся близкими на конечном интервале
времени, но в конце концов могут разойтись. Так как «ин-
1
*) Например, для уравнения первого порядка i = — - у х реше-
Н
ние х = с — (с — const) асимптотически устойчиво, но не имеет ма­

жорирующей экспоненты, а для уравнения ± — — — 1 { 8 , отли­


чающегося постоянным слагаемым б в правой части, решение
1 1
х = с - у -J- ~2 ~ оt стремится к бесконечности.
§2] СИСТЕМЫ, ЛИНЕЙНЫЕ ПО УПРАВЛЕНИЮ 57

тервал близости» неограниченно расширяется при стрем­


лении А к нулю и так как во всех наблюдаемых про­
цессах А отлично от нуля (хотя и очень мало), то прихо­
диться либо согласиться с уравнениями (2 .6) как с «пра­
вильными», либо вообще отказаться от написания уравне­
ний скольжения, так как таких уравнений, верных на
бесконечном интервале, не существует (как и вообще урав­
нений, верно описывающих любые неустойчивые физиче­
ские процессы).
Покажем теперь, каким образом к рассматриваемой
задаче может быть применена схема Филиппова, и дока­
жем, что в линейном по управлению случае результаты,
к которым приводит эта схема, совпадают с уравнением
(2 .6), полученным методом эквивалентного управления,
а значит и с результатом проделанного выше предельного
перехода.
Следуя идее метода Филиппова, составим уравнение
минимального выпуклого множества, натянутого на век­
торы всех фазовых скоростей, описывающих движение
вблизи какой-либо точки, лежащей на пересечении по­
верхностей разрыва:
2m

2‘т
п
где р4 pi = l j — параметры, определяющие точки
i= l
на выпуклом множестве, а и1 — всевозможные векторы
управления в разных областях фазового пространства,
примыкающих к изучаемой точке.
Вектор фазовой скорости скользящего движения при­
надлежит этому множеству и лежит на пересечении каса-
-тельных плоскостей к поверхностям разрыва, проведенных
в рассматриваемой точке. Направление этого вектора опре­
деляется поэтому условием
Gf = 0
58 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

Разрешая это равенство относительно вектора



2 = 2 PiUl
1=1

(предполагая, как и ранее, что det GB =j= 0) и под­


ставляя z в выражение, определяющее вектор /°, получим
уравнение скользящего движения, в точности совпадаю­
щее с уравнением (2 .6).
Таким образом, применительно к рассмотренному слу­
чаю линейного вхождения управления метод эквивалент­
ного управления дает стандартный способ получения ре­
зультата, к которому приводит идея рассуждений Фи­
липпова, а проделанный выше предельный переход дает
обоснование правомерности получения уравнений сколь­
зящего движения в векторном случае с помощью таких
рассуждений *).
З а м е ч а н и е . Разумеется, описанный метод можно
применить и для случая, если скользящий режим проис­
ходит по пересечению не всех то, а лишь те — к поверх­
ностей (0 < к те — 1), например, — 0 (i = 1, . . .
. . . , т е — к). В этом случае управления ит- к+1, . . ., ит яв­
ляются непрерывными функциями, удовлетворяющими
всем сформулированным в § 2 условиям, и для определе­
ния уравнений такого скользящего движения нужно, ре­
шив систему уравнений
Si = 0 (i = 1, . . ., те — к),
п ай ти н;Экв (£ = 1, . . . . те — к) п подставить полученные
значения вместо соответствующих иг (i = 1, . . ., те — к)
в исходную систему. Естественно, что такое движение будет
зависеть от ит- к+1, . . ., ит — остальных компонент век­
тора управления.

*) Примером рассмотренной в атом параграфе задачи может


служить описанная в работе [64] система, в которой реализуется
градиентная процедура решения задачи линейного программиро­
вания, а градиент минимизируемой функции претерпевает разрывы
на нескольких поверхностях в пространстве входных параметров.
Применяя метод эквивалентного управления, можно получить урав­
нение скользящих движений в таких системах и обосновать сделан­
ное в работе утверждение о том, что минимизируемая функция бу­
дет убывать не только вне поверхностей разрыва, но и при движе­
нии по их пересечению в скользящем режиме.
3] НЕЛИНЕЙНЫЕ СИСТЕМЫ 59

§ 3. Нелинейные системы со скалярным управлением


Рассмотрим теперь случай, который характеризуется
тем, что управление и — скаляр, но входит в правую часть
уравнения уже нелинейным образом, т. е.
х = / (х, t, и). ( 2 .21)
Управление претерпевает разрывы на некоторой поверх­
ности:
ц+ (*, t) при s (х ) > О,
и~ (х , t) при s (х) < 0 . ' '
Применяя к этому уравнению метод эквивалентного уп­
равления, можно было бы получить некоторое дифферен­
циальное уравнение, действующее вдоль поверхности раз­
рыва, которое, как и ранее, можно рассматриватькак урав­
нение идеального скольжения. Покажем, что, вообще
говоря, это уравнение не совпадает с уравнением, которое
получается в результате применения процедуры Филип­
пова. Этот факт легко устанавливается из геометрических
соображений. Согласно методу эквивалентного управле­
ния величина итв должна удовлетворять условию
s = grad s -f (х, t, Щ1<в) = 0 . (2.23)
Построим теперь годограф / {х, t, и) для какого-либо фик­
сированного вектора х, принадлежащего поверхности раз­
рыва, и фиксированного момента t, считая и за скалярный
параметр (рис. 9, а). Значение и = ишв выделяет точку
на этом годографе, н поэтому конец вектора / (х, t, ивкв)
лежит на нем. Но, с другой стороны, из (2.23) следует, что
этот вектор лежит в плоскости, касающейся поверхности
разрыва в рассматриваемой точке х. Следовательно, для
того чтобы определить вектор фазовой скорости сколь-
-вящего движения по логике метода эквивалентного уп­
равления, надо из точки х провести прямую к точке, где
касательная плоскость пересекает годограф (рис. 9, б).
В силу же метода Филиппова для построения вектора
фазовой скорости надо найти точку пересечения этой же
касательной плоскости с прямой, соединяющей концы
векторов f + = f ( x , t , u +) и f~ = f (х, t, и~). Концы этих
векторов сами принадлежат построенному выше годогра­
фу, и соединяющая их прямая является для него хордой
60 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

(рис. 9, б). Так как годограф является пространственной


кривой, то векторы /°, определенный методом Филиппова,
и / (ж, t, щкв), найденный с помощью метода эквивалент­
ного управления, вообще говоря, не только не равны, но

даже и не коллинеарны. Они заведомо совпадают лишь


в том случае, когда указанным годографом служит пря­
мая (такая ситуация имеет место при линейном вхожде­
нии управления).
Из изложенного следует, что если исключить из рас­
смотрения такие маловероятные протекания годографа,
когда годограф не является прямой, но случайно пере-
екает касательную плоскость в той же топке, что и пря­
§ 3J НЕЛИНЕЙНЫЕ СИСТЕМЫ 61

мая, соединяющая концы векторов / + и f~ (пунктирная


линия на рис. 9, в), то линейное вхождение управления и
является единственным случаем, при котором метод эк­
вивалентного управления и процедура Филиппова при­
водят к совпадающим результатам. Для нелинейных по
управлению систем вопрос о правомерности того или ино­
го доопределения вновь должен решаться с помощью пре­
дельных переходов, связанных с введением неидеально-
стей. Во введении было показано, что для трех видов
иеидеальностей (гистерезис, запаздывание и малые инер­
ционности) и в этом нелинейном случае предельные урав­
нения совпадают с уравнениями, полученными из доопре­
деления Филиппова.
Рассмотрим теперь предельный переход иного рода и
покажем, что он приводит к уравнениям метода эквива­
лентного управления. Этот предельный переход связан с
Iзаменой разрывной функции управления на непрерывную
трехзвенную характеристику с линейной средней зоной,
вне которой разрывная и непрерывная функции совпа­
дают. В пределе величина средней зоны равна нулю, а
коэффициент наклона характеристики — бесконечности.
Такой предельный переход является, по сути дела, пред­
ложенным в [105] приемом получения уравнения сколь­
жения путем замены разрывного управления линейным
с неограниченным коэффициентом усиления.
В работах [75, 105] рассматривались уравнения, ли­
нейные не только по и, но и по всем х. В этом случае урав­
нения, которые получаются в результате замены и на ks
с последующим стремлением к к бесконечности, могут
быть легко выписаны. Для уравнения общего вида приме­
нение рассуждений по такой же схеме осложнено. Однако
в случае, когда функция иакв имеет ограниченные про­
изводные по всем аргументам, результат такого предель­
ного перехода может быть ползшей следующим образом.
Представим, как и ранее, s в виде
s = grad s-f (ж, t, и) (2.24)
и напомним, что s = 0 при и = иакв, т. е.
grad s-f (х , t, u3KB) = 0 .
Перепишем уравнение (2.24) в виде
@” — 0 (ц — Wa^a)t (2.25)
G2 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

Относительно функции
grad s-f
0 (X, t, и) — и — иЭКВ

предполагается, что |0 (х , t, и) | 0О О, 0О = const *J.


Будем считать, что и+ )> и~. Тогда из самого факта суще­
ствования скользящего режима (согласно которому в ок­
рестности поверхности s (х) = О траектории направлены
навстречу друг другу, т. е. s (и+) < 0 и s (и~) < 0) сле­
дует, что величина s убывает при изменении и от и + до
и~ , обращаясь в нуль при и = цвкв, а функция 0 (х, t, и)
согласно (2.25) положительна и 0 (х, t, и) > 0О.
В соответствии с намеченной схемой рассуждений для
нахождения уравнений движения в окрестности поверх­
ности s (х) — 0 в уравнении (2.25) следует заменить уп­
равление и на ks или, что то же, s на и/к:
тй + Ви = 0ыэкв, где х = 1/к. (2.26)
При стремлении к к бесконечности, т. е. т — к нулю,
решение уравнения (2.26) и (£) на конечном интервале вре­
мени [0 , Т ] стремится к нэкв в следующем смысле: для
любой пары положительных чисел Д£ < Т и е существует
такое 6 , что при 0 < ; т 6 имеет место неравенство
| и — цэкв |^ е при любом t (А£, Т].
Для доказательства этого утверждения рассмотрим'решенне урав­
нения хй -}- 0 н = 0 ыЭКВ) считая 0 некоторой функцией времени:
!

и = и (0) е
—"Г 50мdY
0 +

^в(т) dy t -i- ^ 0(Х) dX


+ Y « 0 ^ 0 (т)«экВе 0 =

i --i-JlM * i -i-jjo(X)dX
-fJ»MdT+e 0 [ u SKBde °
= И (0) e 0 о
*) Этим условием исключается из рассмотрения лишь случай,
когда годограф либо касается касательной плоскости, либо подхо­
дит к пей сколь угодно близко вне непосредственной окрестности
точки пересечения.
§3] НЕЛИНЕЙНЫЕ СИСТЕМЫ 63

После интегрирования второго слагаемого по частям получаем

<
О(y) d r
ц = ц(0)е 0 + “ экв - “ экв (°) е 0

-т !г (г) dr 1
du„
i - S . o(X) dX
dr-
dy

В силу сделанных предположений о всех функциях, входящих


du„..
в исходную систему, величина dy ограничена на любом конеч­
ном интервале времени [О, Т] некоторым числом М , функция 0
ограничена снизу положительпым числом Р0, поэтому

1“ - “ ЭКВI <^ 1
экв 1“ ^
(°) е - “Э КВ'-'I-
“ экв (°)1е
-■И о
0(y) dY
, Мх

> до
В результате получаем, что для любого сколь угодно малого Дt
lim и — иакв при A t^t^T .
т-*0

Это означает, что замена управления и на ks и стрем­


ление затем к к бесконечности эквивалентно замене уп­
равления и на u3KD, т. е. приводит к тем же результатам,
что и метод эквивалентного управления.
Таким образом, приведенные во введении и проделан­
ный здесь предельные переходы для систем, нелинейных
по управлению, приводят к различным результатам,
в первом случае — к уравнениям, получаемым из проце­
дуры Филиппова, во втором — из метода эквивалентного
^правления. Это показывает, что в нелинейных по управ­
лению системах уравнения вне поверхности разрыва, во­
обще говоря, не позволяют выписать однозначно уравне­
ния скольжения вдоль поверхности. В связи с этим
возникает задача выделения класса неидеальностей, для
которого такая однозначность имеет место.
Для решения этой задачи запишем уравнения (2.21),
(2.22), задающие движения исследуемой системы вне
64 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

поверхностей разрыва, в следующем виде:


х = / + + ц* ( / - — /+ ), (2.27)
где / + и / - — непрерывные функции, а и* — некоторое-
новое управление *), также претерпевающее разрывы па
поверхности s (х) — 0 :

(2.28)

При введении в систему (2.21) неидеальиостей вместо


управления и следует поставить некоторое управление й,
которое обеспечивает движение в Д-окрестности поверх­
ности s (х) = 0. Вообще говоря, для любой функции й
из этого класса может и не найтись такой функции гТ*,
что системы (2.21) при и = й и (2.27) при и* — и* будут
эквивалентны.
Однако, если неидеальности таковы, что функция
й может принимать лишь два значения и+ или
и~, то такая функция и* всегда найдется. Это означает,
что для таких неидеальиостей вместо системы ( 2. 21),
(2.22) можно рассматривать систему (2.27), (2.28), в ко­
торую новое управление входит линейно. В результате
такой искусственной линеаризации получаем систему,
для которой, как это было доказано в § 2 , можно восполь­
зоваться методом эквивалентного управления. Примене­
ние этого метода к системе (2.27) приводит к уравнениям
скольжения, совпадающим с уравнениями ( 1. 10), выпи­
санными с помощью процедуры Филиппова.
Описанный здесь способ искусственной линеаризации
для неидеальиостей указанного типа не является един­
ственным. Однако нетрудно убедиться, что любой из
этих способов всегда приводит к одним и тем же уравне­
ниям скольжения. Общий вид линейной по управление,
системы имеет вид
х — f (х , t) + b (х , t) и*.
В этом уравнении и* уже не равно 0 или 1, а является

*) Управление и* играет роль параметра р. в процедуре Фи­


липпова, описанной во введении.
5 з] НЕЛИНЕЙНЫЕ СИСТЕМЫ G5

разрывной функцией
и*+ (х, t) при s (х) О,
Ц*~ (х , f) при s (х) О,
где гг*+ и и* ~ — произвольные непрерывные функции,
удовлетворяющие сформулированным в § 2 условиям.
Для того чтобы записанная таким образом система была
эквивалентна исходной (2.21), должны выполняться со­
отношения
/° + Ьи*+ = / {х, а+ ), /° + Ъи*~ = / (х, гг“ ),
или
о_ / (ж, Ц-) Ц* * — / (■?, tQ ц*- , _ / (ж, и*) — / (а;, ц~)
1 ” --- *_

Подставляя полученные значения /° и Ъ в линейную по


[и* систему общего вида и применяя к ней метод эквива­
лентного управления, независимо от вида функций м*+
и ц*- всегда получим уравнение скольжения, совпадающее
^'уравнением (1.10), к которому приводит метод Филип­
пова.
Итак, если природа неидеальностей такова, что
управление й может принимать при реальном скольже­
нии лишь одно из двух возможных значений *) и+ (х , f)
или и~ {х, t), то в качестве уравнений скольжения сле­
дует принять уравнения, полученные методом Филип­
пова или же после предварительной линеаризации за счет
введения нового управления и* методом эквивалентного
управления.
Обратим внимание на принципиальное различие урав­
нений скользящего движения, которые получаются в слу­
чае, когда в исходную систему управление входит линей­
но, от того случая, когда уравнение к такому виду искус-
г ственно приводится. В первом («естественном») случае
4уравнение скольжения (1.6), записанное для скалярного
I управления (т = 1), не зависит от значенй и+ и и~
и в этом смысле полностью определяется непрерывными
функциями, которые входят в исходное уравнение дви-

*) Неидеальности типа гистерезис, запаздывание и неучтен­


ные инерционности являются частными случаями этого класса не­
идеальностей.

3 в. и. Уткин
66 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. 11

жеиия. Во втором («искусственном») случае уравнение


скользящего движения (1.10) существенно зависит от и+
и и- , т. е. от вида разрывной функции, и поэтому ничего
не меняя в уравнениях, а меняя лишь величину разрыва^
можно влиять на движение в скользящем режиме. Этот
факт можно наглядно интерпретировать, если восполь­
зоваться введенным выше (рис. 9, а) годографом. Действи­
тельно, в «естественном» случае, когда система линейна

по управлению х = / (х, t) + b (х, t) и, годографом слу­


жит прямая, и она полностью определяется векторами
Ъ(х, t) и / (х, t) (рис. 10, а). Значения и+ и и~ определяют
лишь точки, которые нужно взять на годографе. Поэтому
прямая, соединяющая согласно методу Филиппова концы
векторов / + и всегда одна и та же, не зависит от в+
и и~ (рис. 10, а) и при изменении и+ и и~ (например,
с и\, и[ на и%, Иг) вектор фазовой скорости скользящего
движения /° не меняется. В «искусственном» случае век­
торы / + и — / + (аналогичные / и b для «естественного»
случая) уже зависят от и+ и и~, поэтому годографом яв­
ляется пространственная кривая и от конкретного выбора
и+ и и~ зависит протекание прямой, соединяющей концы
векторов / + и / - , а, следовательно, и /° —- вектора фазовой
скорости в скользящем режиме (рис. 10, б).
Из приведенных рассуждений следует еще одно су­
щественное различие разрывных систем с линейным и не-
§ 3] НЕЛИНЕЙНЫЕ СИСТЕМЫ 67

линейным вхождением скалярного управления, которое


в допредельном движении из-за наличия неидеальностей
может принимать одно из двух возможных значений:
п+ (х , t) или и~ (х , t). Для линейного случая существует
некоторая непрерывная функция управления (равная ггэкв),
которая, будучи подставленной в исходное уравнение,
приводит к тому же движению, что и разрывное управ­
ление в скользящем режиме. Для нелинейного случая,
вообще говоря, не существует никакого непрерывного
управления, с помощью которого удалось бы получить
движение, совпадающее с движением в скользящем ре­
жиме. Этот факт следует из того, что для непрерывного
управления все векторы фазовой скорости лежат на го­
дографе / (х , t, и) (рис. 10, б), а в нелинейном случае
вектор фазовой скорости в скользящем режиме этому
годографу не принадлежит.
Для неидеальностей произвольного вида представ­
ляется целесообразным рассмотреть различные предель­
ные переходы с точки зрения грубости по отношению
к малым параметрам, характеризующим неучтенные
малые запаздывания, инерционности и т. д., которые
всегда имеют место в реальных системах. В общем случае
реального скользящего режима в некоторой малой окрест­
ности поверхности разрыва е управление и может при­
нимать отличные от и+ (х , t) и и~ (х , t) значения, что и
является причиной различных предельных результатов
при стремлении е к нулю. Наличие в любых реальных
системах малых, но конечных инерционностей, запазды­
ваний, случайных возмущений приводит к тому, что изо­
бражающая точка будет совершать колебания вокруг
поверхности переключения с малой и тоже конечной ам­
плитудой А. При стремлении области е к нулю эти коле­
бания сохранятся, а управление гг «все чаще и чаще»
_будет принимать значение гг+ или гг~, так как й может
быть отлично от этих значений лишь в области е. Согласно
приведенным ранее рассуждениям уравнение такого дви­
жения будет отличаться от уравнения (1.10), полученного
методом Филиппова, на бесконечно малую порядка А *).

*) В случае, когда малый параметр является запаздыванием,


этот факт может быть доказан с помощью рассуждений, приведен­
ных в н. 2 § 5 главы !.

3*
68 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

Высказанные здесь эвристические соображения означают,


что при нелинейном вхождении скалярного управления
и произвольном виде неидеальностей свойством грубости,
по-видимому, будут обладать лишь те предельные пере­
ходы, которые приводят к уравнениям, получаемым мето~
дом Филиппова либо после предварительной линеари­
зации — методом эквивалентного управления. В связи
с этим представляется целесообразным использовать
именно эти процедуры для получения уравнений идеаль­
ного скольжения.

§ 4. Системы, нелинейные по управлению

Рассмотрим общий случай разрывной системы с век­


торным управлением, описываемой уравнениями
х = f (х, t, и), (2.29)
где ж и / — n-мерные векторы, и — то-мерное управление,'
каждая компонента которого претерпевает разрывы на
своей поверхности, заданной уравнением st (х) = 0:

Hi (ж, t) при Si (X) )> 0,


щ (х, t) =
щ (ж, t) при s; (ж) < [ 0 (i = 1,..., т)
(2.30)
Предположим, что на некотором интервале времени в та­
кой системе возникает идеальное скольжение по пересе­
чению поверхностей разрыва, т. е. траектория изобража­
ющей точки на этом интервале принадлежит любой сколь
угодно малой окрестности пересечения. Задача по-преж­
нему состоит в том, чтобы разумно доопределить урав­
нения скольжения по уравнениям, заданным вне поверх­
ностей разрыва и по уравнениям самих поверхностей.
Рассуждения метода эквивалентного управления могут
быть формально применены и для этого векторного слу­
чая, однако он был обоснован с помощью предельного
перехода лишь для систем с линейным вхождением вектор­
ного управления.
Рассмотрение векторного случая общего вида (2.29),
(2.30) начнем с разбора примера, который показывает, что
в подобного рода системах понятие скользящего режима
неоднозначно в том смысле, что уравнения этого движе­
§ 4] СИСТЕМЫ, НЕЛИНЕЙНЫЕ ПО УПРАВЛЕНИЮ 69

ния не могут быть получены единственным образом из


предельного перехода, возникающего при стремлении
неидеальностей к нулю. В качестве такого примера рас­
смотрим динамическую систему, описываемую уравне­
ниями *)
' X 1 = Ml,

' 3^2 = М2,


.*3 = и ги г

+1 при Xi < 0,
-1 при х% 0,

+ 1 при х г < 0,
-1 при х2 0.
Предположим, что оба релейных элемента, реализу­
ющих управления иг и и2, обладают одинаковыми гисте­
резисными петлями. При реальном скользящем движении
вдоль поверхностей разрыва хг = 0 и хг = 0 с учетом
гистерезиса управления % и и2 являются периодическими
функциями с нулевой средней составляющей, а их про­
изведение — также периодическая функция, но она уже
может иметь среднюю составляющую, отличную от нуля.
Эта средняя составляющая может принять любое зна­
чение А от — 1 до + 1 в зависимости от фазового соотно­
шения между и и2 в момент начала скользящего ре­
жима. Если теперь одновременно уменьшать гистерезис­
ные петли к нулю, то частота реального скользящего
режима будет неограниченно возрастать, а предельное
движение будет зависеть лишь от средних значений уп­
равлений, т. е. будет описываться уравнениями
{®i = 0,
х2 = О,
х 3 = А.

В силу неопределенности А заведомо неопределенным


будет и скользящее движение.

*) Пример составлен Д. Б. Изосимовым.


70 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. Ц

Х отя могут быть сомнения в грубости этого примера,


все же он указывает на возможность неоднозначности
в нелинейном случае. Необходимость серьезно считаться
с такой неоднозначностью выясняется из попытки непо­
средственно применить к системе (2.29) рассуждения Фи“
лшгаова *). Согласно описанной в [103] процедуре нужно
выписать уравнение минимального выпуклого множест­
ва, натятутого на векторы фазовых скоростей в окрест­
ности рассматриваемой точки, лежащей на пересечении
поверхностей разрыва:

2'т

всевозможные векторы управления в окрестности рассмат­


риваемой точки. Согласно Филиппову вектор скользя­
щего движения должен принадлежать этому множеству
и лежать иа пересечении плоскостей, касательных к по­
верхностям разрыва, т. е. удовлетворять условию

г=1

(строки матрицы G, как и ранее, составляют градиенты


функций S; (х)). Поэтому для определения этого вектора
получаем систему из т уравнений (по числу поверхно­
стей разрыва) относительно 2т неизвестных коэффициен-
чт
тов при наличии лишь одной связки — !• Ясно,
i=l
что, вообще говоря, эта задача не имеет однозначного
решения, в то время как в линейном случае, рассмотрен­
ном в § 2, задача решалась однозначно, так как в силу
линейности в качестве искомого параметра можно было

*) Разумеется, Филиппов в своей работе [103] рассуждения на


системы столь общего вида не распространил.
S 4] СИСТЕМЫ, НЕЛИНЕЙНЫЕ ПО УПРАВЛЕНИЮ 71

рассматривать /n-мерныи вектор

* = у,
I
t=l
Приведенный пример и эти общие соображения пока­
зывают, что задача определения уравнения скользящего
движения для системы (2.29) может не иметь однозначного
решения и что нужно ввести дополнительные ограниче­
ния для того, чтобы задача могла быть решена одно­
значно.
Предположим теперь, что правая часть уравнения
(2.29) представима в виде *)
ТП
/ (х, f , и) = 2 Р (я, t, щ), (2.31)
г=1

где / ‘ — n-мерные векторы. В этом случае уравнение


(2.29) вне поверхностей разрыва может быть представлено
в виде
± = f+ + F u * , (2.32)
ТП
где / + — вектор 2 Р(xi Р Щ1), F — матрица
г= 1

II/1 (*, Р щ ) — f1 (х, t, ut), •■., Г (ж, t, и „) — Г (®. t, и+


т) I,
а компоненты вектора и* = (% , . . п^) равны
. _ (0 при > О,
*** jl при Si < 0 (г = 1, . . пг).
Таким образом, при выполнении условия (2.31) ис­
ходная система (2.29) может быть сведена к системе (2.32),
_уже линейной по новому управлению и*. Как показано
в § 2, для получения уравнений скольжения в таких си­
стемах можно воспользоваться методом эквивалентного
управления. (Разумеется, при выполнении приведенных
ранее достаточно общих предположений о виде функций

*) Необходимым и достаточным условием представимости пра­


вой части уравнения (2.29) в виде (2.31) является равенство нулю
при i ф / вторых смешанных производных д2}1дщ duj.
72 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. и

f + , F и Si.) Однако вопрос о том, будут ли эти уравнения


верно описывать скольжение в исходной системе (2.29),
зависит от того, окажутся ли системы (2.29) и (2.32)
тождественными и при наличии неидеальностей, которые
вводились в систему при обосновании этого метода. Если'"
природа неидеальностей такова, что управление может
принимать лишь одно из двух возможных значений
и+ (х , t) или и~ (х, t) *), то, рассуждая, как и в § 3
при исследовании нелинейных относительно скалярного
управления систем, можно обосновать эквивалентность
систем (2.29) и (2.32). Для такого класса неидеально-
стей применение метода эквивалентного управления к
системе (2.32) позволяет найти уравнения скольжения
для системы (2.29). В соответствии с формальной схемой
этого метода нужно определить величину s {s — по-преж­
нему m-мерный вектор с компонентами slt . . . sm)
в силу системы (2.32), приравнять s к нулю и найти
эквивалентное управление u 3Kb > получаемое в результате"
решения этого уравнения относительно и*:

и;кв = ~ {G F )-'G f+ , (2.33)


где G — матрица размерности т X п, строки которой
являются градиентами функций $г (я), и предполагается,
что det GF =j= 0. Уравнение скользящего движения на­
ходится в результате подстановки нэкв в систему (2.32):
х = [Е - F (G F )-1 <?]/+, s (х (0)) = 0. (2.34)

Так как во время скользящего режима s = 0, то в соот­


ветствии с примененным к системе (2.6) приемом этим
тождеством можно воспользоваться для того, чтобы ис­
ключить т координат и выписать уравнение скользящего
режима (п — т )-г о порядка относительно п — т осталь­
ных координат.
В тех случаях, когда условие (2.31) не выполнено,
а неидеальности в системах имеют произвольный характер,
вопрос об однозначности скользящего движения остается
открытым. По-видимому, могут быть указаны системы,
для которых характер скользящего движения зависит

*) Примером такой неидеальности могут служить запаздыва­


ние, гистерезис, неучтенные малые инерционности.
§ 5) ВЫРОЖДЕННЫЕ СЛУЧАИ В ВЕКТОРНЫХ ЗАДАЧАХ 73

от способа стремления к нулю малых неидеальностей;


с другой стороны, по-видимому, класс систем, для ко­
торых понятие скользящий режим имеет однозначный
смысл, не охватывается полностью системами, удовлет­
воряющими условию (2.31) с неидеальностями указанного
выше типа. В связи с этим возникает задача о расширении
условий, при выполнении которых в системах вида (2.29)
уравнения скользящего режима определялись бы одно­
значно с помощью предельных переходов *). Мы огра­
ничиваемся здесь лишь постановкой этой общей задачи.

5. Вырожденные случаи в векторных задачах

До сих пор всегда делалось предположение о том, что


основное уравнение s = 0 является невырожденным и
из него однозначно находится эквивалентное управление.
(Для рассмотренной в § 4 системы это предположение
означало, что det GF 0.) Вырожденные случаи возни­
кают при нарушении этого условия. Особенности сколь­
зящих движений, появляющиеся вследствие различного
рода вырождений, нам будет удобнее описать для случая
стационарной системы, линейной не только по управле­
нию, но и по фазовым координатам. Уравнение такой
системы имеет вид

х = А х + Ви, s = Сх, (2.35)

где Л, В, С — постоянные матрицы размерности соот­


ветственно п X п, п X тп, т X п, а m-мерное управ­
ление и изменяетсяв соответствии с (2.30). Вопрос о том,
в какой мере приводимые далее рассуждения применимы
для нестационарных систем, нелинейных по х , будет
обсуждаться в конце этого параграфа.
Условия существования эквивалентного управления
для системы (2.35) или, что то же, существования решения

*) Для случаев же, когда предельные переходы не дают одно­


значных результатов, вопрос о единственности тесно связан с во­
просом о грубости такой системы. Может оказаться, что среди раз­
личных предельных движений условия грубости выделяют един­
ственное грубое движение. Тогда естественно считать, что именно
это движение будет реализоваться в реальной системе, и принять
его в качестве идеального скользящего движения.
74 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. II

системы уравнений
а = САх + СВи = 0 (2.36)
относительно и определяются соотношением рангов мат=_
рицы СВ и присоединенной матрицы D , которая полу­
чается добавлением к матрице СВ столбца САх. Эквива­
лентное управление, а, следовательно, и уравнение сколь­
зящего движения находится однозначно, если det СВ ф
=j= 0. В вырожденных случаях, т. е. когда det СВ — 0 *),
система (2.36) совместна лишь при совпадении гСв и
Го — рангов матриц СВ и D соответственно. Обратим
внимание на то, что в вырожденных случаях ранг мат­
рицы D зависит от фазового вектора, который лежит
на пересечении поверхностей разрыва, так как рассмат­
риваются скользящие режимы на этом пересечении. Мо­
жет оказаться, что на некоторых множествах, принадле­
жащих многообразию пересечения и имеющих нулевую,
меру, ранг матрицы D будет понижаться. Исключим пока
из рассмотрения специальные случаи, когда фазовая тра­
ектория проходит через эти особые множества. Тогда
для вырождения общего вида (т. е. при гСв <С т) могут
возникнуть следующие три случая:
Случай 1°. Несмотря на вырождение, скользящий
режим вдоль пересечения поверхностей разрыва одно­
значно определяется уравнениями, заданными вне этих
поверхностей. Уравнения скольжения находятся с по­
мощью метода эквивалентного управления.
Случай 2°. Благодаря вырождению возникает неодно­
значность скользящих движений, т. е. несмотря на то,

*) В реальных системах появление вырожденных случаев обус~


ловлено чаще всего тем, что хотя бы одна из матриц С или В имеет
немаксимальный ранг. Примером вырождения матрицы С служит
система, в которой несколько компонент управления претерпевают
разрывы на одной и той же плоскости одновременно. Если же более
чем одно управление приложено к одним и тем же входам системы,
то соответствующие этим управлениям столбцы матрицы В будут
коллинеарны, п следовательно, эта матрица окажется вырожденной.
К вырождению приводит также и сочетание этих двух случаев. Ра­
зумеется, могут иметь место и случаи, когда вырождение обусловлено
взаимным расположением векторов-строк матрицы С и векторов-
столбцов матрицы В в п-ыерпом пространстве параметров. Напри­
мер, если в скалярном случае (при т = 1) векторы с и b ортогональ­
ны. то ранг произведения сЪ равен нулю.
§ 5] ВЫРОЖДЕННЫЕ СЛУЧАИ В ВЕКТОРНЫХ ЗАДАЧАХ 75

что вне поверхностей разрыва уравнения определены од­


нозначно, уравнения скольжения вдоль их пересечения
не определяются однозначно *) из-за того, что некоторые
компоненты вектора управления могут быть произволь­
ными функциями.
Случай 3°. Вырождение приводит к тому, что ни при
каких управлениях фазовая траектория не может лежать
в пересечении поверхностей разрыва.
Первые два случая возникают, если ранги матриц СВ
и D совпадают (т. е. гсв = До) и система (2.36) совместна.
Выберем в этом случае т — гсв компонент вектора и
произвольно, найдем из уравнения (2.36) остальные гсв
компонент этого вектора и тем самым определим эквива­
лентное управление. После подстановки его в исходное
уравнение (2.35) получим уравнение скольжения. Разу­
меется, может случиться, что компоненты вектора и,
которые были выбраны произвольно, при этом сократятся.
Тогда, несмотря на наличие вырождения, скользящее
движение определяется однозначно, т. е. имеет место
случай 1°. Если же полученное уравнение скольжения
зависит от произвольно выбранных т — гсв компонент
управления, то в системе имеет место случай 2°. Случай
3° возникает, когда ранг присоединенной матрицы D
больше ранга матрицы СВ (rD гсв), т. е. система (2.36)
несовместна, поэтому не существует эквивалентного уп­
равления, и скользящий режим в такой системе невоз­
можен. Для обоснования сделанных выводов можно вос­
пользоваться схемой рассуждений, с помощью которой
в § 2 обосновывался метод эквивалентного управления.
В соответствии с этими рассуждениями в уравнение
(2.35) вместо вектора и нужно подставить вектор управ­
ления й, в котором учтены все неидеальности (опять же
без конкретизации их вида) и которое приводит к реаль­
ному скользящему режиму в окрестности ||s||<IA.
Вектор s, определенный в силу такой системы, s = САх +
+ СВй, следует рассмотреть как систему уравнений от­
носительно управления и. Так как полученное равенство
всегда имеет место, то ранг присоединенной матрицы D *,
полученной добавлением к матрице СВ столбца С А х — s,

*) Возможность появления такого рода неоднозначности, по-


видпмому, впервые отмечена 10. И. Неймарком [79J.
76 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. г г

равен рангу матрицы СВ (rCB — rD,). Для случаев 1° и


2° нужно выбрать произвольно т — гсв компонент
управления, найти из этой системы остальные гсв ком­
понент, подставить их в исходную систему и осуществить"
предельный переход, описанный в § 2. В случае 3° (rD ^>
)> гсв) вычитание из последнего столбца матрицы D век­
тора ё понизит ранг полученной матрицы D * , так как
гп ^ гсв ~ rD*• Поэтому вектор ё должен принимать
вполне определенные значения, зависящие от матриц
А , В, С и вектора х. Опираясь на эти факты и используя
обычные методы линейной алгебры, покажем, что вели­
чина I s I заведомо выходит за пределы малой Д-окрест-
ности пересечения поверхностей разрыва. Проинтегри­
руем уравнение СВй + САх = ё на некотором малом
интервале времени At, имея в виду, что в реальном сколь­
зящем режиме функция й является интегрируемой:
д/
СВ ^ й dt + CAxQAt -\- о (At) = s (Д<) — s (0).
о
Здесь х 0 — значение вектора х в начальный момент вре­
мени, о (Дг) — бесконечно малая второго порядка. Обо-
д(
значим йср == — ^ й dt и вычислим норму приращения
о
величины s на этом интервале времени:
||s (At) — s (0) I = I СВйср + САх о О (At) ||At
(О (At) — бесконечно малая первого порядка).
Ранг матрицы СВ по условию меньше ранга матрицы
D , которая получается добавлением к матрице СВ столб­
ца С А ха. Это означает, что вектор С А х0 не является ли­
нейной комбинацией столбцов матрицы СВ, и поэтому
для правой части полученного уравнения при достаточно
малом At справедлива оценка
m in I СВйср + САх0 -f О (At) ||At > %At,

“ ср
где х — некоторая положительная величина. Очевидно,
что эта же оценка справедлива и для левой части уран-
§ S] ВЫРОЖДЕННЫЕ СЛУЧАИ В ВЕКТОРНЫХ ЗАДАЧАХ

нения||s (At) — s (0) ||> к At, т. е. величина ||s | за время


At получит конечное приращение. Это означает, что
скользящее движение становится невозможным, если
понимать его как предельное движение в Д-окрестности
многообразия s = 0 при стремлении А к нулю.
Рассмотрим подробнее, к какому из указанных трех
случаев могут привести различные виды вырождения.
Случай 1°. Для того чтобы показать возможность воз­
никновения однозначного скользящего движения в слу­
чае, когда матрица СВ вырождена, обратимся к системе,
в которой вырождены обе матрицы С и £ и ранги их оди­
наковы, т. е. гс = гв < [ т. Так как гв < [ т, то вектор
Ви в системе (2.35) представим в виде В'и', где В' — мат­
рица размерности п х гв , и' — 7в-мерный вектор и
гв' = г в- Переписывая в соответствии с этим обозначением
уравнение (2.36),
САх + СВ'и' = 0, (2.37)
и предполагая, что гсв , = гв , в соответствии с методом
эквивалентного управления однозначно находим идяв
из этого уравнения. Подставляя в исходное уравнение
(2.35) В'и вместо Ви и ЦдКВ вместо и — решение урав­
нения (2.37) — получаем уравнение, которое однозначно
определяет скользящее движение. Этот случай часто
встречается на практике, например в системах с пере­
менной структурой, в которых управление формируется
в виде суммы воздействий по различным координатам си­
стемы (т. е. вырождена матрица В), а коэффициенты
воздействий претерпевают разрывы на одной и той же
плоскости (т. е. матрица С также вырождена) [100, 110—
112].
Случай 2°. Если вырождается только матрица С (т. е.
гс < [ т, гв — т) и при этом справедливо соотношение
гсв = гс , то скользящее движение по пересечению поверх­
ностей разрыва определяется неоднозначно *).

*) В этом случав столбцы матрицы СВ, так же как и


столбец САх, являются линейными комбинациями базисных
векторов-столбцов матрицы С, н та к к а к гсв = гс , то добавление к
матрице СВ столбца САх не увеличивает ранга этой матрицы, а это
означает, что гс в = rD и система (2.36) имеет бесчисленное мно­
жество решений.
УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. U

В качестве примера, иллюстрирующего возможность


появления неоднозначности такого рода, рассмотрим си­
стему с двумерным управлением

х = А х + й1» ! + Ъ2и2, (2.38)

где Ь1 и Ь2 — линейно независимые векторы, а скалярные


управления щ и щ являются релейными и претерпевают
разрывы на одной и той же плоскости (т. о. т = 2, гв —

Предположим, что элементы, реализующие управ­


ления их и м2, обладают гистерезисными петлями
соответственно с шириной Д! и 4 3 и при этом Д2,
а I lh I ^ I и2 |. Тогда реальный скользящий режим
будет происходить в А^окрестности плоскости разрыва,
управление их будет переключаться с конечной частотой,
а управление и2 сохранит одно из двух возможных зна­
чений, которое оно имело в момент начала скользящего
режима. При переходе к пределу, когда Aj и Д2 стремятся
к нулю, но остается справедливым соотношение Aj
Д2, такая неоднозначность сохранится *), а это и
означает, что в нашем примере за счет вырождения мат­
рицы С не удается однозначно получить уравнение сколь­
зящего режима.
Случай 3°. В системе, у которой вырождена только
матрица В и при этом гсв = гв < т, гс = т, скользящий
режим по пересечению границ разрыва невозможен **).
К такому же выводу приведет нас попытка применить
схему рассуждений Филиппова к только что рассмотрен­
ном примеру (2.36), если предположить, что векторы b1
и Ъ2 коллинеарны, т. е. гв — 1 и каждое из управлений

*) Воспользовавшись схемой рассуждений, с помощью которой


в главе I проводился анализ систем с гистерезисом, легко убедиться
в том, что и при Ах > Д2 предельное движение будет также опреде­
ляться неоднозначно.
**) Столбцы матрицы СВ образуют пространство размерностью
гв < т, в то время как вектор С Ах принадлежит т-мерному
пространству, натянутому на т базисных векторов-столбцов мат­
рицы С. Поэтому если вектор х не лежит иа особом множестве,
о котором шла речь в начале настоящего параграфа, то rD > гСв и
система (2.36) несовместна.
§ 5] ВЫРОЖДЕННЫЕ СЛУЧАИ В ВЕКТОРНЫХ ЗАДАЧАХ 79

претерпевает разрывы на различных поверхностях. Так


как все четыре возможных вектора фазовой скорости
в окрестности любой точки на нересечении плоскостей
разрыва лежат па одной прямой, то минимальное выпук­
лое множество, натянутое на эти векторы, является од­
номерным многообразием. Это многообразие, вообще
говоря, не имеет общих точек с (п — 2)-мерным много­
образием пересечения плоскостей разрыва, т. е. дви­
жение в скользящем режиме но этому пересечению не­
возможно.
Таким образом, если уравнение s = О, из которого
находится эквивалентное управление, окажется вырож­
денным, то уравнение системы, заданное вне поверхностей
разрыва, может определять скользящее движение вдоль
этих границ как однозначно, так и неоднозначно и, кро­
ме того, вырождение может привести к тому, что движение
в скользящем режиме вообще невозможно. Эти выводы
были получены при предположении, что система стацио­
нарна и линейна по и и по х. Однако все результаты могут
быть перенесены на случай нестационарной системы вида
(2.32), линейной лишь по и. Для того чтобы в этой более
общей задаче выделить случаи 1°, 2° и 3° соответственно,
надо чтобы были выполнены те же самые условия, о ко­
торых выше шла речь, но только при формулировке этих
условий вместо элементов А х, В ж С линейных урав­
нений (2.35) должны входить соответственно элементы
/ + , F и G системы (2.32).
Кроме того, применительно к общей нестационар­
ной задаче, когда линейность имеет место лишь
по управлению, нужно иметь в виду следующее
обстоятельство. В линейной по и и по а: системе (2.36) ха­
рактер вырождения и вопрос о совместности уравнения
s = 0 относительно и определялся постоянными матри­
цами А , В и С, и лишь в случае несовместимости этой
системы исключение могли составлять лежащие на пере­
сечении поверхностей разрыва множества нулевой меры
по отношению к размерности этого пересечения, на ко­
торых совместность могла иметь место. В случае неста­
ционарной системы, нелинейной по х, факторы, заменя­
ющие матрицы А , В и С, сами зависят от х и t, поэтому
характер вырождения может меняться во времени и про­
странстве как при изменении размерности множества
80 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ . II

точек пересечения поверхностей разрыва, так и внутри


его на подмножествах этих точек, которые уже не обяза­
тельно имеют нулевую меру. При выводе уравнений
скользящего движения с помощью метода эквивалент­
ного управления специального рассмотрения заслуживают
точки, лежащие на множествах нулевой меры, на которых
система s = 0 становится совместной, и точки, лежащие
на границе двух или более множеств ненулевой меры с
различным характером вырождения этой системы. Спе­
цифика скользящих движений в этих случаях состоит
в том, что из всех возможных траекторий могут иметь
место лишь траектории, в первом случае принадлежащие
множеству нулевой меры, а во втором случае — не на­
правленные в сторону множеств, в которых система s = 0
несовместна.

§ 6. Физический смысл эквивалентного управления

При изучении скользящих режимов это движение


рассматривалось как некоторая идеализация — пред­
полагалось, что управление меняется с бесконечно боль­
шой частотой, а вектор фазовой скорости направлен точно
вдоль поверхности разрыва. На практике же из-за раз­
личного рода неидеальностей изображающая точка совер­
шает колебания относительно поверхности разрыва с ко­
нечной частотой и, следовательно, частота переключения
управления также конечна. К таким неидеальностям
можно отнести зону нечувствительности, гистерезис, за­
паздывание в переключающих устройствах, различные
инерционности, присущие объекту в неучтенные при со­
ставлении модели и т. д. В результате во время не идеа­
лизированного, а реального скользящего движения все
компоненты функции управления также изменяются
с конечной частотой, поочередно принимая значения и?
и щ . Эти колебания содержат высокочастотную и мед­
ленно меняющуюся составляющие. Поэтому имеет смысл
говорить о среднем значении управления в процессе ре­
ального скользящего движения (обозначим его иср). Это
мср можно замерить, например, подводя истинное управ­
ление на вход фильтра, постоянная времени которого
весьма мала по отношению к медленно меняющейся со­
§ 6] ФИЗИЧЕСКИЙ СМЫСЛ ЭКВИВАЛЕНТНОГО УПРАВЛЕНИЯ 81

ставляющей, но достаточная для фильтрации высокочас­


тотной *).
Идеальный скользящий режим рассматривался как
.предельное движение при стремлении к нулю всех неидеаль-
ностей, о которых говорилось выше. Описанный ранее
метод эквивалентного управления, по сути дела, является
формальной процедурой, позволяющей непосредственно,
без предельного перехода получить уравнение скользя­
щего движения. При этом вводится в рассмотрение экви­
валентное управление пэ1!в. Покажем теперь, что uai(B,
используемое в методе эквивалентного управления для
получения уравнений скользящего движения, совпадает
со средним значением управления пср, которое физически
может быть получено на выходе описанного здесь фильтра,
если идеальное скольжение рассматривать как предель­
ный случай реального скользящего режима.
Дальнейшие рассуждения будут проводиться приме­
нительно к линейной по управлению системе, для кото­
рой и обосновывался метод эквивалентного управления
х = / (х, t) В (х , () и, (2.39)

где х и / — n-мерные векторы, В (х , t) — матрица раз­


мерности п X т, а компоненты т-мерного управления
и претерпевают разрывы на поверхностях s; (х) = О
согласно (2.3). Будем также считать, что для функций /,
5 , st, lit и щ справедливы достаточно общие предполо­
жения, сделанные в § 2.
Предположим, что в системе (2.39) возник реальный
скользящий режим, т. е. из-за каких-либо неидеальностей
управление не будет изменяться в соответствии с (2.3),
а является некоторой функцией й, о которой лишь из­
вестно, что она обеспечивает движение изображающей
точки в конечной Д-окрестности пересечения поверхно­
стей разрыва
1М КД , (2.40)
где вектор s = (sx, . . ., sm).

*) Ниже будет дано уравнение фильтра и уточнен смысл выра­


жения «весьма малая, но достаточная для фильтрации постоянная
времени»,
82 УРАВНЕНИЯ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. IX

Назовем средним управлением иср выходную величину


линейного фильтра *)
tiiop + иср = й, (2.41)
где т — постоянная времени, й — управление, которое
учитывает имеющиеся в системе неидеальности и которое,
будучи подставленное в (2.39), приводит к реальному
скользящему режиму (2.40). Уравнение (2.41) описывает
тп инерционных звеньев, на входы которых подаются
компоненты вектора й, а компоненты вектора иср явля­
ются выходными величинами этих звеньев.
Определяя величину s в силу уравнений реального
скольжения
в = Gf + GBu,
находим из этого уравнения управление и:
й = — {GB)~xGf + {GB)~4.
Здесь, как и ранее, предполагается, что det GB =j= О,
а строки матрицы G являются градиентами функций
S; (х). Напомним, что UjK0 формально находится в ре­
зультате решения уравнения s = 0 относительно управ­
ления и, следовательно, величина й представима в виде
й — Нзкв + (GB)~1 s. (2.42)
Свойства решения уравнения (2.41) с правой частью
(2.42) можно выявить с помощью следующего утвержде­
ния. Пусть на некотором интервале времени [0, Г] в диф­
ференциальном уравнении
xz 4- z = h (<) + Н (t) s

*) В этом параграфе мы ввели понятие кср, воспользовавшись


представлением об усреднении сигнала в линейном фильтре. Такос-
представление дает возможность не конкретизировать учитывае­
мые неидеальности, ограничившись лишь общим условием (2.40).
Если бы мы позволили себе, следуя [108, 109], конкретизировать
учитываемую неидеальность и ввести в рассмотрение гистерезис
или запаздывание, то можно было бы фактически подсчитать иср.
Однако такого рода рассуждения обладали бы двумя дефектами:
во-первых, они не переносились бы непосредственно на векторный
случай и, во-вторых, не ясно, в какой мере полученные выводы сох­
раняются при неидеальностях иного вида.
з в] ФИЗИЧЕСКИЙ СМЫСЛ ЭКВИВАЛЕНТНОГО УПРАВЛЕНИЯ 83

функции I h (г) ||, 1 h (t) |, I Н (t) | , ||Н (t) || ограничены


по модулю некоторым положительным числомМ, |s (t) |
^Д , А 0. В этом уравнении т — const, z, h, s — m-
*мерные векторы, Н (t) — квадратная матрица. Тогда для
любой пары положительных чисел At и е найдется такое
б (е, At, М , z (0)), что если 0 < т ^ б, Д/т ^ б, то ||z —
— h (t) 1 < . е при At ^ t Т.
Для доказательства запишем решение рассматриваемого урав­
нения

- — 1 - — i* —
* ( ' ) = * ( 0)в т + — е т [Л(Т) + Я( Т) * ( ТГ) ] й Т.
о
П осле интегрирования получаем
__ <_
•з (i) = ъ (0) е т h (t) — >

-h(0)e "■ - e ' - ^ h ( y ) e x dT + II (l) — II (0) e z ^ -


О
t ^ у Y

— l_//(T)eT + 4 ‘ / / ^ e" ] ^ r '


0
, -4 - 2МД MД
I * (t) — h (f) |K [|г (0) — h (0) | e T + Mx + — — + Л/Д + — ,

или
Д
IIz (0 — h (0 II^ II2 (0) — h (0) ||e * + M( x + A) + 3 M ~ .

Очевидно, что для любого Дг > 0 lim г (г) = h (t) при Дг ^ г Т,


т->0
д/т—>0
'Что и доказывает приведенное утверждение.

Применяя это утверждение к уравнению (2.41), при


условии, что и определяется в соответствии с (2.42),
устанавливаем, что для конечного интервала времени
[0, Т] величина иср стремится к цэкв в следующем смысле:
для любой пары положительных чисел Дг <( Т и е су­
ществует такое б )> 0, что при 0 <| т 6 и - ^ - ^ б имеет
84 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

место неравенство | « ср — цакв || в при At t ^ Т *).


Аналогичным образом можно доказать, что если си­
стема (2.29) допускает искусственную линеаризацию
типа (2.32), то иср стремится к иэкв. Для определение
среднего значения управления в исходной системе (2.29)
его нужно представить в виде п = и + -{-U u*, где и1-и U—
вектор и диагональная матрица соответственно с эле­
ментами щ и щ — и*, и далее тем же способом доказать,
что мср стремится к и+ -j- Uam<B.
Таким образом, используемое нами понятие «экви­
валентное управление» имеет вполне конкретный физи­
ческий смысл — эта функция равна среднему значению
управления и для ее измерения можно воспользоваться
линейным фильтром первого порядка, если соответству­
ющим образом согласовать постоянную времени фильтра
с шириной области, в которой происходит движение
в реальном режиме.

Г Л А В А ш
УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА

§ 1. Постановка задачи, определение скользящего


режима и необходимые условия его существования

В предыдущей главе рассматривалась задача получе­


ния уравнений, описывающих движение в скользящем
режиме. Перейдем теперь непосредственно к решению
*) Такое определение предельного стремления нср к иакв не яв­
ляется вычурным н естественно следует из физических свойств си­
стемы. Действительно, окрестность поверхности разрыва шириной
Д, в которой совершает колебания изображающая точка, нужно
уменьшать для того, чтобы приблизить реальный скользящий режим
к идеальному. При уменьшении Д должна возрастать частота пе­
реключений управления, так как в противном случае амплитуда-
колебаний изображающей точки заведомо станет больше Д. Для
фильтрации высокочастотной составляющей, определяемой пере­
ключениями в скользящем режиме, величина, обратная частоте
переключений, должна быть намного меньше постоянной времени
т. Но, как только что было установлено, эта величина пропорцио­
нальна Д, отсюда и следует, что отношение Д/т должно стремиться
к нулю. Наконец, постоянную времени т следует также стремить
к нулю, так как линейный фильтр (2.42) не должен искажать мед­
ленную составляющую функции управления, которая и равна иср.
ПОСТАНОВКА ЗАДАЧИ 85

вопроса о том, при каких условиях в разрывной системе


возникает такой вид движения. Этот вопрос будет изу­
чаться применительно к линейной по управлению си-
; стеме (2.2), (2.3) (или аналогичной ей системе (2.32), по­
лученной в результате искусственной линеаризации) и
по-прежнему будет предполагаться, что идеальный сколь­
зящий режим является предельным движением в системе
(2.8) при стремлении к нулю окрестности (2.7), в которой
лежат фазовые траектории реального скользящего ре­
жима. Относительно управления й, входящего в правую
часть уравнения реального скольжения (2.8) и обеспечи­
вающего движение в окрестности (2.7), сделаем еще два
предположения:
йI = щ, если I Si I > До, (3.1)

Д0 — некоторая положительная величина,

min (щ , и$) ^ й ; max (щ , и*), если |«г |<С До- (3.2)


Оба эти предположения касаются вида неидеальностей
и означают, что вне некоторой окрестности поверхностей
разрыва реальное управление й совпадает с идеальным,
определяемым в соответствии с (2.3), а внутри этой окрест­
ности й не превосходит крайних значений, которые может
принимать управление и.
При исследовании разрывных систем с векторным уп­
равлением в главе I под идеальным скользящим режимом
понималось движение, во время которого фазовые траек­
тории принадлежат любой сколь угодно малой окрест­
ности пересечения поверхностей разрыва (или одной
поверхности для скалярного случая). Для выяснения усло­
вий существования скользящего режима необходимо фор­
мализовать это определение с помощью каких-либо ко-
-личественных соотношений. Такая задача формализации
возникает в связи с рассмотрением векторных случаев,
так как для систем со скалярным управлением условия
существования скользящего режима допускали нагляд­
ную геометрическую интерпретацию (рис. 5) — фазовые
траектории в окрестности поверхности разрыва должны
быть направлены навстречу друг другу и, следовательно,
область скольжения составляли точки, в окрестности ко­
торых величины s и s имели разные знаки. Разумеется,
86 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. Ш

я в векторном случае, если на каждой из поверхностей


разрыва выполняются условия существования скользя­
щего режима, будет иметь место скользящий режим и по
пересечению этих поверхностей. В то же время следует-*
выяснить, пе окажется ли слишком узким класс систем,
в котором скользящий режим по пересечению всех поверх­
ностей разрыва возникает из-за того, что на каждой из
них выполняются условия скольжения, полученные для
скалярного случая. По-видимому, чаще всего вряд ли
можно решить вопрос об условиях скольжения на геомет­
рическом языке, исходя лишь из взаимного расположе­
ния векторов фазовых скоростей и градиентов поверхно­
стей разрыва в окрестности их пересечения. Для подтвер­
ждения высказанного здесь сомнения приведем пример
разрывной системы с двумерным управлением, в которой
имеет место скользящий режим по пересечению двух по­
верхностей разрыва, несмотря на его отсутствие вдоль,,
каждой из них.
Пусть в системе ?г-го порядка (2.2) компоненты дву
мерного управления имеют вид
(+ 1 при sj > О,
и1 = signsi, и2 = signs2, sign s; = j ,n
--- 1 ПрИ S; О,

величина sign 0 не определена, а вектор / , матрица В


и матрица градиентов G функций sx (х) и s2 {х) таковы, что

Тогда величины и s2 определяются соотношениями


= —sign sx + 2 sign s2,
s2 = — 2sign Sj — sign s2.
Полученные уравнения позволяют найти проекцию
движения такой системы на плоскость (slt s2) (рис. 11).
Непосредственно из рассмотрения фазового портрета
следует, что скользящий режим на каждой из поверхно­
стей разрыва sx = 0 и s2 = 0 отсутствует. В то же время
траектории изображающей точки таковы, что они попа­
дут в любую сколь угодно малую окрестность начала ко­
ординат плоскости (х1г s2) и дальнейшее движение будет
§ 1] ПОСТАНОВКА ЗАДАЧИ 87

происходить в этой окрестности п— 2-мерного много­


образия поверхностей разрыва в скользящем режиме.
Приведенный пример, кроме того, показывает, что условия
возникновения скользящего режима тесно связаны с ус­
ловиями сходимости проекций фазовых траекторий на под­
пространство (sx, s2) к началу
координат этого подпростран­
ства. В связи с этим пред­
ставляется целесообразным
попытаться дать определение
скольжения в терминах, при­
нятых в теории устойчивости
нелинейных динамических
систем. Переформулируем
известное определение устой­
чивости движения, данное
А. М. Ляпуновым [74], при­
менительно к нашей специфической задаче, связанной с па-
хождением для системы (2.2), (2.3) области скользящего
режима на пересечении поверхностей разрыва. Это
определение дадим, опять же имея в виду, что движе­
ние в рассматриваемой системе является предельным
движением системы (2.8) при стремлении неидеальностей
к нулю, а истинное управление й удовлетворяет соот­
ношениям (3.1), (3.2).
Определение. В пространстве состояний
(« !,..., х п) динамической системы (2.2), (2.3) область S (x,t),
принадлежащая (п — пг)-мерному многообразию пере­
сечения поверхностей разрыва S; ( z ) = 0 ( i = l , ..., т), явля­
ется областью скользящего режима (или скольжения), если:
1. Эта область не содержит целых траекторий ни
одной из примыкающих к этому многообразию 2т непре­
рывных систем.
2. Для любого положительного е найдутся такие по­
ложительные величины Д0 и б, что любое движение системы
(2.8), (3.1), (3.2), начинающееся в и-мерной 5-окрестности
облаете S, может покинуть n-мерную е-окрестность
области S только в е-окрестности ее границ.
Приведенное определение, по сути дела, выделяет
такую, вообще говоря, нестационарную область значений
координат системы, что внутри этой области для траек­
торий, получаемых в результате проектирования траек­
88 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

торий общего 7г-мерного движения на пг-мерное подпро­


странство slt . . ., sm, начало координат этого подпро­
странства является точкой устойчивого равновесия
в «малом». Первое же условие определения говорит о том**
что траектории изображающей точки не могут лежать
в многообразии пересечения поверхностей разрыва, если
каждая из компонент управления принимает какое-то
О + —
одно из двух возможных значении или щ .
Основываясь на таком определении скользящего ре­
жима, сформулируем и докажем необходимое условие его
существования: для существования скользящего режима
в какой-либо точке пересечения поверхностей разрыва
необходимо, чтобы уравнение метода эквивалентного
управления, составленное для системы (2.2), (2.3),
s — Gf + GBu3KB — О
имело решение относительно u0KD (напомним, что G — .
матрица размерности т X п, строками которой являются
градиенты компонент st вектора s) и каждая из компонент
эквивалентного управления удовлетворяла условию
min (ut, щ ) < i/чэкв < max (щ , щ ). (3.3)
Первое условие уже было доказано в § 5 главы I , посвя­
щенном различным вырожденным случаям, которые воз­
никают, если det GB — 0. Примерно по той же схеме
проведем обоснование и второго условия (3.3). Согласно
определению скользящего режима вопрос о его существо­
вании решается с помощью допредельной системы (2.8)
с управлением (3.1), (3.2). Предположим, что хотя бы
одно из условий (3.3) нарушено, но тем не менее скользя­
щий режим в рассматриваемой точке х ь существует. Так
как величина s равна нулю лишь при и — иакв, а реаль­
ное управление й, изменяющееся в соответствии с (3.1),
(3.2), при нашем предположении никогда не равно итз, '
то вектор s будет отличен от нуля:
s = G (/ -f- Ви) 0.
Интегрируя это соотношение на интервале At, получаем
§ 21 ПРИМЕНЕНИЕ ВТОРОГО МЕТОДА ЛЯПУНОВА S9

где G0, /°, В0 — значения матриц G, /, В в начальный


момент времени при л' = х0, а о (А/) — бесконечно малая
второго порядка.
В этом неравенстве осуществляется минимизация по
й из области значений (3.2). Так как подинтегральное
выражение не равно нулю, то найдется такой конеч­
ный интервал времени At, что норма приращения
вектора s на этом интервале будет больше неко­
торой конечной величины, пропорциональной At. Такой
вывод противоречит определению скользящего режима,
согласно которому можно так подобрать допредельную
систему, что ее фазовые траектории будут проходить
в любой сколь угодно малой окрестности многообразия
пересечения. Сам факт появления противоречия указывает
на то, что предположение о возможности существования
скользящего режима при нарушении условий (3.3) яв­
ляется неверным, и следовательно, эти условия являются
необходимыми.

§ 2. Применение второго метода Ляпунова


для определения области скользящего режима

Как мы только что выяснили, задача об определении


области скольжения сводится к специфической задаче
об устойчивости нелинейной системы. Так же, как это
обычно делается в теории устойчивости, попытаемся найти
достаточные условия того, что некоторая область S
в пространстве состояний системы (2.2), (2.3), лежащая
на пересечении поверхностей разрыва, является областью
скольжения в смысле данного в § 1 определения. Необ­
ходимость специального рассмотрения этой задачи обус­
ловлена фактом разрывности правой части идеализиро­
ванной системы (2.2), (2.3) или же фактом, неопределен­
ности реального управления в системе (2.8), записанной
с учетом неидеальностей в некоторой окрестности поверх­
ностей разрыва (3.1), (3 .2).’ Вторая особенность заклю­
чается в том, что устойчивость нужно обеспечить не для
всего движения, а лишь для его проекции на подпро­
странство sl5 . . ., sm и может оказаться, что для одной
области общего пространства хг, . . ., х п эти проекции
обладают свойством устойчивости, а для другой нет.
С учетом указанных особенностей сформулируем теперь
90 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

достаточные условия, позволяющие найти область сколь­


жения, в виде теоремы.
Т е о р е м а . Для того чтобы область S (х, t), лежащая
в пересечении поверхностей разрыва системы (2.2), (2.3),
являлась областью скольжения, достаточно, чтобы для
всех х, принадлежащих этой области, в некоторой области
Q подпространства slt . . ., s m, содержащей начало коор­
динат, существовала такая непрерывно дифференцируе­
мая по всем аргументам функция v (s, х, t), для которой
выполняются следующие условия'.
1. Эта функция является положительно определенной
относительно s,\m. е. v (s, х, t) ~Д> 0 при s =f= 0 и произ­
вольных х и t, v (0, х, t) = 0, и на сфере |s | ^ R для всех
х из рассматриваемой области и любого t справедливы
соотношения
in lu — hR, sup v = H r , i? =jfc 0, (3.4)
|s| =K |s| =R
где hR и H r — некоторые положительные величины, за­
висящие лишь от R.
2. Полная производная от функции v по времени в силу
системы (2.2), (2.3)

v = grads v (Gf + GBu) + gradx v (/ + B u )-\ -^ -,


/ dv dv \ , [ dv dv \
grads v = ( dsi ’ ' ' dsm J ’ S r a x v — y dxi > • • •’ dxn J

отрицательна всюду, кроме поверхностей разрыва, на


которых эта функция не определена, и на всей поверхности
сферы |s ! = R , за исключением точек разрыва, имеет
место соотношение
sup и — — Отд, тпд — const, mR )> 0. (3.5)
[|s|=R

Для функции v верхняя граница ищется для всех х из


рассматриваемой области и любого t, а сама величина
тан является положительной и зависит липгь от R . Если
для функции v выполняется условие (3.5), то в дальней­
шем будем называть ее отрицательно определенной.
Для доказательства теоремы нам потребуется ряд соотноше­
ний, позволяющих вычислить величину и, которая для идеализи­
§ 2] ПРИМЕНЕНИЕ ВТОРОГО МЕТОДА ЛЯПУНОВА 91

рованной системы (2.2), (2.3) может быть представлена в виде


771

V = Go (s, 0+ 2 Gi Uv (3-6)
. г-=1
где G0- G,, . . ., Gm — некоторые непрерывные по всем аргументам
dv
функции, зависящие от /, В, G, grads у, gradK v, gj.
Рассмотрим произвольную точку х0, лежащую на одной или не­
скольких поверхностях разрыва, например, si — 0 (i = 1, . . .
..., к, к <( т), и сфере ||s ||< Д. Хотя функция и в этой точке не опре­
делена, вычислим ее формально, выбирая значения ик+1, . . ., ит в
соответствии с (2.3) и подставляя вместо щ (i = 1, . . ., к) любое
из двух значений ц* или ui :
к т
v (х0) = Со (s, хо, t) + ^ Gi (s- * 0 , t) u f + 2] Gi (s. *o, «) uv (3.7)
i= l i= /c+ i

'где запись up- означает и* или . Заметим, что в соотношении


(3.7) компоненты sv . . ., sj, вектора s равны нулю. В силу непрерыв­
ности всех функций Gi, и\ и иТ и условия (3.5) для функции v (х0)
при любых комбштациях'значений щ (i = 1, . . . . к) справедлива
оценка
v (хо) ^ — mR. (3.8)

Рассмотрим теперь функцию v иа решении допредельной систе­


мы (2.8), с помощью которой было дано определение скользящего
режима. Если траектории этой системы проходят вне Д0-окрестности
поверхностей разрыва, то согласно (3.1) значения и для идеализи­
рованной системы и системы с неидеальностями совпадают. Оче­
видно, что для всех точек сферы ||s || < R, за исключением До-ок­
рестностей поверхностей разрыва согласно условию 2 теоремы,
функция v для допредельной системы не превосходит величину—mR.
Внутри Д„-окрестности пересечения поверхностей s* = 0 (i =
= 1, . . ., к) функция v для системы (2.8), (3.1), (3.2) представима
в виде:
v (х) = го О (До),
к т
vo = Go (s, хо, t) + ^ Gi (s , * 0 ’ “i + 2 Gi (s> rl'0’ ui ’ (3 -9)
i=l i=ft+l

где x0 — ближайшая к рассматриваемой точка на пересечении по­


верхностей s; = 0 (i = 1, . . ., к) (очевидно, что расстояние между
точками х и х0 является величиной порядка Дв), О (Д0) — бесконеч­
92 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА ЕГЛ. III

но малая относительно А0 величина. Величина v (х0) оценивается


неравенством (3.8), причем ее максимальное значение в рассматри­
ваемой точке х0 достигается, если соответствующим образом в за­
висимости от знаков функций Gj выбрать значения и? или а, для
компонент управления щ (i = 1, . . .,к). Максимальное по й, (£ = i
= 1, . . ., к) значение функции v0 совпадает с максимумом по щ (i =
= 1, . . ., к) функции v (г0), так как щ заключено между и? и цГ
и входит в функцию Ь (х0) линейно. Следовательно, г>„ также не пре­
восходит величины — m.Rl и согласно (3.9) для фиксированного R
всегда можно подобрать такое Д0, что на сфере радиуса R функция
v (х) будет неположительной.
Воспользуемся этим свойством допредельной системы и пока­
жем, что при выполнении условий теоремы область S на пере­
сечении поверхностей разрыва будет областью скольжения. В соот­
ветствии с определением такой области нам предстоит убедиться
в том, что для любой е-окрестности начала координат подпростран­
ства Sj, . . ., sm найдутся такие Д0 и 6-окрестность, что любое дви­
жение системы (2.8), (3.1), (3.2), начинающееся в б-окрестности, не
покинет 8-окрестности.
Не нарушающая общности рассуждений, можно в качестве е-
окрестности выбрать шар ||5 || е , лежащий в области ^ , в которой'
справедливы условия теоремы. Из первого условия следует, что ми­
нимальное значение функции v на сфере [| s ||= е равно ht . Выбе­
рем теперь такой шар радиусом 6, что максимальное значение функ­
ции v внутри его равнялось /;Е (а это можно сделать, так как функция
v равна нулю при 5 = 0 , непрерывна и по условию теоремы на любой
е ограничена сверху). Как мы убедились, соответствующим
Й >ром Д0 величину Ь на решениях допредельной системы можно
сделать неположительной на поверхности любой сферы конечного
радиуса. Очевидно, что можио подобрать такое Д0, при котором
v будет неположительной для шарового слоя, заключенного между
сферами ||s ||= 6 и ||s ||= е. Рассмотрим теперь произвольное дви­
жение при таком значении Д0, начинающееся в области ||s ||= 6.
Как только изображающая точка покинет эту область, функ­
ция v окажется невозрастающей, т. е. не будет превосходить вели­
чину ht. Но значение функции и на сфере ||5 ||= е больше или
равно he.. Следовательно, для всех жтраектории изображающей точ­
ки, начинающиеся в 6-окрестности начала координат подпростран­
ства (51,..., 5т ), не могут покинуть e-окрестность. Теорема доказана.
Сформулированные таким образом достаточные усло­
вия позволяют решить вопрос о нахождении области
скольжения с помощью идеализированной системы (2.2),
(2.3), рассматривая ее поведение вне поверхностей разры­
ва, т. е. вне точек, в которых эта система не определена.
Существенно, что при этом не приходится использовать
систему (2.8), (3.1), (3.3), записанную с учетом неидеаль-
ностей, в терминах которой было дано определение обла­
§2] ПРИМЕНЕНИЕ ВТОРОГО МЕТОДА ЛЯПУНОВА 93

сти скользящего режима и которая не определена одно­


значно в некоторой окрестности поверхностей разрыва.
Сделаем теперь несколько кратких замечаний, каса­
ющихся условий теоремы и их проверки. В случае, если
функция v является стационарной, т. е. не зависит явно
от времени, а область S является ограниченной и замкну­
той, то условие (3.4) всегда справедливо. Это следует из
того, что любая непрерывная функция на замкнутом мно­
жестве всегда достигает своей верхней и нижней границы,
и так как функция v обращается в нуль лишь при s = О,
то на сфере ненулевого радиуса нижняя граница поло­
жительна. Условие (3.4) всегда имеет место, если функция v
зависит только от s. Что касается условия (3.5) для функ­
ции Ь, то даже если бы эта функция не зависела от х
и t, могло бы оказаться, что на сфере ||s ||= R величина
mR равна нулю. Причина этого явления лежит в том, что
величина Ь оценивается в открытой области, так как на
сфере I s I = R мы выбрасывали из рассмотрения точки,
принадлежащие поверхностям разрыва. Отметим в связи
с этим, что если функция v будет отрицательно определен­
ной, то lim v ф 0 при стремлении к нулю любой комби­
нации st, но не всех одновременно.
В заключение приведем два примера, которые показы­
вают, что требование непрерывной дифференцируемости
является существенным для решения вопроса о возник­
новении скользящего режима. В обоих примерах функция
v будет кусочно-гладкой положительно определенной от­
носительно s. Полная производная этой функции по вре­
мени будет отрицательной всюду, кроме поверхностей
разрыва, и в то же время в первом случае скользящий
режим на пересечении поверхностей разрыва возникнет,
а во втором — не возникнет.
В качестве первого примера воспользуемся рассмот­
ренной в § 1 системой с двумерным управлением, проек­
ция движения которой на плоскость sl5 s2 описывается
уравнениями
Si = —sign sx + 2 sign s2,
s2 = — 2 sign Sj. — sign s2.
Выберем положительно определенную функцию v в виде
94 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

Производная этой функции по обоим аргументам претер­


певает разрывы при обращении любого из них в нуль.
Величина у , вычисленная в силу уравнений движения,

v = -щ - s1 + -2j~s2 = sign.?! (— sign Si + 2 sign s2) +


+ sign s2 (— 2 sign Sj — sign s2) = — 2
является отрицательной всюду, кроме поверхностей раз­
рыва, где эта функция не определена. Таким образом,
функции у и у имеют разные знаки, а из рассмотрения фа­
зового портрета системы (рис. 11) следует, что система
на самом деле устойчива, т. е. на пересечении поверхно­
стей разрыва возникает скользящий режим. Прежде чем
судить о том, насколько эти два факта связаны между со­
бой, обратимся ко второму примеру системы с разрывным
двумерным управлением, проекция движения которой
на плоскость описывается уравнениями
«1 = —2 sign sx — sign s2,
s2 = — 2sign sx -Г sign s2.
Выберем в качестве функции v положительно опре­
деленную функцию
v = 4 J |+ |s2|.
Производная этой функции
• dv . , dv . н с ■
у= ж 81 + -д ^ 52 = - 7 - 6 sig n Sls2
отрицательна всюду, кроме поверхностей разрыва. Одна­
ко непосредственно из рассмотрения фазового портрета
системы (рис. 12) видно, что, несмотря на различие зна­
ков функций у и и, изображающая точка из любого на­
чального положения попадет на плоскость sx = 0 и по
ней в скользящем режиме уходит от пересечения поверх--
ностей разрыва = 0 и s2 = 0 *). Это означает, что

*) Вектор фазовой скорости при возникновении скользя­


щего режима вдоль поверхности s1 = 0 находится следующим об­
разом. Следуя методу эквивалентного управления, из уравнения
Si = 0 находим величину sign sx и подставляем ее во второе уравне­
ние. В результате получим уравнение скольжения $2 = 2 sign s2,
согласно которому величина sa всегда возрастает по модулю.
S2] ПРИМЕНЕНИЙ ВТОРОГО МЕТОДА ЛЯПУНОВА &5

скользящий режим на этом пересечении не возникает.


В нашем примере фазовые траектории пересекают по­
верхности равного уровня (v = const) снаружи внутрь
везде, кроме «угловых точек», но траектории скользящего
режима «выходят вдоль угловых точек» из этих поверх­
ностей. В первом примере скользящего режима по одной

Рис. 12.

из поверхностей разрыва не возникало, т. е. множество


точек на траекториях, которые находились на «углах»
поверхностей v = const, составляло нулевую меру.
Именно поэтому различие в знаках у функций г; и и по­
зволило сделать вывод об устойчивости начала координат
на плоскости н1? з2. В общем же случае, как показал вто­
рой пример, с помощью одних лишь знаков кусочно­
гладкой функции и ее производной нельзя решить вопрос
о существовании скользящего режима.
Итак, мы рассмотрели общие условия, которым дол­
жна удовлетворять функция, аналогичная функции Ляпу­
нова, с помощью которой можно определить область
скольжения. Существенно, что этот вопрос решается на
основе анализа поведения идеализированной системы вне
поверхностей разрыва, хотя определение самого факта
возникновения скольжения дается с помощью допредель­
ной системы, точно так же, как в главе I метод эквивалент­
ного управления позволял найти уравнения скольжения,
используя лишь уравнения идеализированной системы.
96 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА 1ГЛ. III

Разумеется, описанный здесь метод, как и метод функций


Ляпунова, не дает конкретных рецептов, как составлять
функцию v для той или иной разрывной системы. Поэтому
в последующих параграфах мы рассмотрим те случаи,
когда удается найти функцию v, удовлетворяющую сфор--
мулированным в теореме условиям.

§ 3. Определение области скольжения с помощью


квадратичных форм

По-прежнему рассматривается динамическая система


с разрывными управлениями (2.2), (2.3), а задача состоит
в определении области скольжения на пересечении по­
верхностей разрыва. Запишем уравнения, описывающие
проекцию движения системы на m-мерное пространство,
по осям которого отложены величиныslf . . ., sm, характе­
ризующие расстояния до поверхностей разрыва:
s = G (х) / (я, t) + G (х) В (х , t) и, (3.10)
где G — матрица размерности т X п, строками которой
являются градиенты функций sx (х), . . ., sm (х), векторы
х, f, и и матрица В определяют движение системы в со­
ответствии с (2.2), (2.3).
Вектор управлениям представим в следующей форме *):
и = и0 + U sign s , (3-11)

где и0 = -у- (u+ -j- и~), и + и и~ — векторы-столбцы с элемен­

тами {и\,. . . , Мт)и(1/7, . • ит~), U — m-мерная диагона­

льная матрица с элементами £/* = ; sign s—m-мер-


2t
ный вектор с элементами sign .<?*, функция sign s t опреде­
лена всюду, кроме s t = 0, и равна + 1 при S j ) > 0 и — 1
при ^ < 0. В сответствии с этими обозначениями пере­
пишем систему (3.10):
s = D (х, t) sign s + d (x, t), (3.12)
где матрица D (x, t) и вектор d, (x, t) равны соответственно

*) Такое представление для систем с переменной структурой


со скалярным управлением в [19] было названо квазпрелейным.
ОПРЕДЕЛЕНИЕ ОБЛАСТИ СКОЛЬЖЕНИЯ 97

GBU и GJ + GBu°. В дальнейшем при исследовании во­


проса о возникновении скользящего режима вместо си­
стемы (3.10) мы будем использовать эквивалентную ей
систему (3.12). При этом нужно иметь в виду, что при
замене идеального управления (2.3) на реальное (3.1),
(3.2) в системе (3.11) компоненты вектора sign s в Дц-
окрестности соответствующей поверхности разрыва сле-
и .-и ?
дует заменить на величину — — . Так как эти компоненты
не превосходят по модулю единицы, то для них, так же
как и для компонент вектора и, справедливы условия
(3.1), (3.2). Все предложенные в настоящей главе методы
исследования скользящих движений правомерны для
систем с неидеальностями именно такого типа, поэтому их
можно применить и для системы (3.12).
В этом параграфе выделяются случаи, когда область
скольжения S на пересечении т поверхностей разрыва
можно найти путем составления функции v в виде квадра­
тичной формы относительно slt . . ., sm как с постоянны­
ми, так и с зависящими от т и t коэффициентами.
1. Квадратичные формы с постоянными коэффициен­
тами. Составим функцию v в виде положительно опре­
деленной квадратичной формы

v = , ^ - s T Ws, (3.13)

где W — симметричная матрица с постоянными коэф­


фициентами, которая удовлетворяет критерию Сильве­
стра, Т — символ транспонирования. Так как функция
v не зависит явно от х и t, то для нее выполняется первое
условие теоремы в § 2. Определим производную этой
функции по времени на решении системы (3.12) во всех
точках, за исключением поверхностей разрыва:
v = — sTL sign s -ф- sT l, (3.14)
где L = — WD, l = Wd. Матрица L и вектор l зависят
от x и t. Если бы удалось найти такую область значений
для элементов L и I, для которых функция v является
отрицательно определенной в указанном во втором усло­
вии теоремы смысле, то затем следовало бы найти соот­
ветствующую этим значениям область значений вектора
х или, что то же, область скольжения.

4 В. И. Уткин
98 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

Покажем теперь, что неравенства


111

hk 2 I I + Ih I (3.15)
i=i
i*^/c
являются необходимыми и достаточными условиями того,
что функция Ь с постоянными коэффициентами в L и I
является отрицательно определенной. В (3.15) lhl —
элементы к-й строки матрицы L, lh — к-я компонента
вектора I. Достаточность становится очевидной, если
функцию v представить в виде
тп . т
Ь = — 2 К I[h * + 2 lk i s ig H V i— гк si§n «*)•
k=i i=l
i + lc

При выполнении неравенств (3.15) выражения в


скобках в каждом слагаемом положительны, а следова­
тельно, функция v отрицательна. Верхняя граница функ­
ции v на всей сфере ||s | = R, за исключением поверхно­
стей разрыва, равна

sup v = — т н = — 1s I А1Т,
ММ*
* a i* 1
где Air — минимальное число из всех А 1ц = —
m
— 2 I ^A-i I — 1^а- I (fc = 1,- ■ w), и достигается, если
i=l
limjsrl = ||.sj|, )im s£= 0 (i = 1 , . . . , m, i=j=r), sign sr= sign lr,
sign Si = — sign lTlTi (i — 1, . . ., m, i=j=r). (Напомним, что
верхняя граница здесь не достигается, так как функция v
на поверхностях разрыва s£ = 0 не определена и мы рас­
сматриваем открытую область на сфере.)
Если хотя бы в одном из неравенств (3.15) заменить
знак неравенства на обратный или знак равенства, то
величина Air будет либо отрицательной, либо равной
нулю. Соответственно верхняя граница функции Ь ока­
жется неотрицательной, что и доказывает необходимость
условий (3.15) для отрицательной определенности этой
функции.
§ 3] ОПРЕДЕЛЕНИЕ ОБЛАСТИ СКОЛЬЖЕНИЯ 99

В производной функции v по времени матрица L и


вектор I зависят от х и t. Поэтому для нее условия отри­
цательной определенности выделяют такую, вообще го­
воря, нестационарную область S значений х , для которой
при любом t выполняются неравенства
т
inf у. Ihi (я, W,t)\ —
x e S , ie [ o , со) £

- \ l k( x , W , t ) \ ) > M k> 0 , (3.16)


где Aik — const, к = 1, . . ., m.
Для области S на множестве точек сферы ||s ||= R,
за исключением поверхностей разрыва, верхняя граница
функции v не превосходит величины
sup v = — |[s||Aln (3.17)
1И=я
где Alr — минимальное из всех А1к число, т. е. в области
S выполняется второе условие теоремы в § 2. Это означает,
что область S , для которой выполняются условия (3.16),
будет областью скольжения на пересечении поверхностей
разрыва. Обратим внимание на то, что интересующие нас
точки лежат на многообразии s(- = 0 (i — 1, . . ., т),
поэтому при нахождении области скольжения из условий
(3.16) нужно предварительно выразить какие-либо т
координат вектора х через остальные п — т *) и подста­
вить полученные значения в левые части неравенств
(3.16) . Что касается матрицы W, то ее можно выбирать
произвольно, лишь бы все ее диагональные определители
согласно критерию Сильвестра были положительны.
Приведем пример использования описанного подхода
для определения области скольжения в линейной по х
и и системе с разрывным трехмерным управлением, опи­
сываемой уравнениями
х = А х + Ви
В этом уравнении х — п-мерный вектор, А и В — посто­
янные матрицы размерности п X п и n X 3, каждая из

*) В § 2 главы I отмечалось, что для рассматриваемой разрыв­


ной системы это всегда можно сделать.

4*
ЮО УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

компонент управления имеет вид


щ = sign si (i = 1, 2, 3).

В качестве поверхностей разрыва выберем плоскости,


т. е. вектор s равен
s — Сх,

где С — постоянная матрица размерности 3 X п , и сле­


довательно, для рассматриваемой системы матрица гра­
диентов равна С. В этом случае элементы, определяющие
уравнение (3.12), имеют вид
и0 = О, U = Е, d = САх.

Предположим, что коэффициенты матрицы D , равной СВ,


принимают следующие числовые значения:

( - 2 2 -IX
D=\ 0 - 3 4 .
\ 1 0 - 2 /

Имея в виду симметричность матрицы W н вычисляя мат­


рицу L и вектор I в соответствии с (3.14), запишем для
пашей системы неравенства (3.16), определяющие об­
ласть скольжения:

2шц — п-1з^> |— 2шп -j- 3М’12 | |хоп — 4мц2 "1" 2мц3|-\-


+ | (я> W) |i
— 2\0Yi "l- Зм>22 |2м.’jo — Юо3 I -{- I Wyi — 4 m?22 -j- 2m?23 I “b
+ l№ W0I,
U> 1 3 — 4м;2з -|- 2 xv33 |2гм13 — гм331+ |— 2мц3 + Зм>231-(-
+ \h(x,W )\.

Элементы lx (х, W ) , (х, W ), /3 (.г, W) являются линей­


ными комбинациями координат системы с коэффициентами,
зависящими от матриц САх и W. Записанные неравенства
при численных значениях элементов матрицы W

wlx = 1, wv, = 0, w13 — —0,5,


ю22 = 1, ю23 = 1,5, w33 = 13,5
§ 3] ОПРЕДЕЛЕНИЕ ОБЛАСТИ СКОЛЬЖЕНИЯ 101

имеют вид
№ И 0 | < 0 ,5 , |l2(х, W) |< 0 , 5 ; \1й(х, W)| < 0 , 5 .
(3.18)
Для выбранных знамений wi} можно выписать коэф­
фициенты линейных форм 1г, l2, Z3, которые равны нулю
при х = 0. Очевидно, что в пространстве хг, . . ., х п
найдется область, содержащая начало координат, в ко­
торой неравенства (3.18) справедливы. Так как все диа­
гональные определители матрицы
1 0 —г “
0 1
— 0,5 1,5 1
положительны, то множество точек этой области, лежа­
щих на пересечении поверхностей скольжения, и является
областью скольжения. При нахождении области сколь­
жения мы подобрали коэффициенты матрицы W, при ко­
торых функции v и v оказались соответственно положи­
тельно определенной и отрицательно определенной. Разу­
меется, это решение не является единственным и в связи
с этим представляет интерес рассмотреть задачи, которые
мы лишь сформулируем: из всех возможных постоянных
матриц подобрать такую матрицу W, чтобы область, вну­
три которой заведомо возникал скользящий режим, была
максимальной; здесь же отметим, что все области сколь­
жения, найденные для различных матриц W , также со­
ставят область скольжения и вторая более общая задача
состоит в определении множества таких матриц W и для
каждой из них такого множества х на пересечении по­
верхностей разрыва, что функции v u v будут иметь" раз­
ные знаки и затем в нахождении области скольжения как
_суммы всех таких множеств х. Конечно, эти задачи
можно решать лишь в случае, когда существует хотя бы
одно решение, и теперь мы обсудим вопрос о существо­
вании такого решения, или вопрос о границах примени-
ftгости предлагаемого приема для простейшей разрывной
системы, описываемой в подпространстве бц, . . .,
уравнениями

s = D sign s + d (х, Z), D = const, (3.19)


102 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

Рассмотрим сначала случай, когда d (х , t) — 0. Для


линейных систем с постоянными параметрами разработан
стандартный прием составления функций Ляпунова, ко­
торые позволяют судить об их устройчивости (как мы
выяснили, задача об условиях существования скользя--
щего режима весьма близка по своей сути к проблеме
устойчивости). Этот прием состоит в том, что сначала вы­
бирается знакопостоянная функция v и затем по ней вос­
станавливается функция v. Если функция v имеет знак,
противоположный с и, то система устойчива, если знаки
могут совпадать — неустойчива [9]. К сожалению, такой
подход при исследовании областей скольжения в рассмат­
риваемых нами разрывных системах может оказаться
неприменимым.
В качестве примера, иллюстрирующего этот факт, об­
ратимся к системе

«1 = —sign + 2 sign s2,


s2 = —2 sign sx — sign s2,

для которой в § 1 с помощью фазовой плоскости (рис. 11)


было показано, что на пересечении поверхностей разрыва
Sj = 0 , s2 = 0 скользящий режим всегда существует.
Убедимся теперь, что какова бы ни была постоянная мат-
рица W, производная от квадратичной формы v = — sT Ws
(s — двумерный вектор с компонентами Sj и s2, W — сим­
метричная матрица с элементами W;j, г, / = 1, 2) в силу
уравнений движения v = —sTL sign s не может быть от­
рицательно определенной. Коэффициенты матрицы L ,
равной — WD, должны удовлетворять соотношениям
(3.15), которые для нашего примера имеют вид

wn + 2wl2 |2wn — w121,


^22 2u>12 | w12 + 2w 22 I .

Первое неравенство не может иметь место при wl2 ^


<1 0, так как при wn < ( 0 его левая часть отрицательна,
а при wn 0 левая часть меньше wn , а правая больше
2шп . Аналогично доказывается, что при и>12 > 0 всегда
нарушается второе неравенство. Следовательно, вопрос
§ з] Оп р е д е л е н и е области скольж ени я 1о§

0 существовании скользящего режима в этом частном


случае не может быть решен с помощью функции v в виде
квадратичной формы.
В общем же случае разрывной системы с постоянной
матрицей D вопрос о возможности использования квадра­
тичных форм, столь широко применяемых при исследо­
вании устойчивости линейных систем, сводится к нахож­
дению класса матриц D, для которых существуют такие
матрицы W и L, что L = —D W , матрица W — симмет­
ричная, а в матрице L диагональные элементы превосхо­
дят сумму модулей элементов соответствующей строки.
Приведем два случая систем, когда эта задача может быть
решена.
Пусть в матрице D каждый из диагональных элементов
отрицателен и по модулю превосходит сумму модулей
элементов соответствующей строки, т. е.
^ т
— dkk > 2 I I (ft = 1 .'•■>»»)• (3-20)
i —1
i +k

Тогда матрицу W выберем равной единичной и, оче­


видно, что для матрицы L, равной —Z?, будут выполнены
условия (3.15) (компоненты lh вектора I при d = 0 также
равны нулю). Следовательно, все пересечение поверхно­
стей разрыва является областью скольжения. Заметим, что
этот случай довольно очевидный и легко объясняется
исходя из условий возникновения скользящего режима
для систем со скалярным управлением. В окрестности
к-й поверхности разрыва при выполнении условия (3.20)
величина sk и ее производная, которая для случая
771

1 (х , t) = 0 согласно (3.19) рав a dkk sign sk - f ^ sign sh


i—1

|имеют разные знаки. Это означает, что на каждой из по­


верхностей разрыва возникает скользящий режим и изобра­
жающая точка движется вдоль их пересечения. Если же
в уравнении (3.19) вектор d (х , t) отличен от нуля, то
скользящий режим заведомо будет иметь место не на
всем пересечении поверхностей разрыва, а лишь в об­
ласти S, определяемой условиями (3.16), которые для
104 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

рассматриваемого случая ( W = Е) имеют вид

— dkk > У, |dki J+ sup |dk {z, t) |


.
г=1
xes, <ero,
L
oo)

(& = 1 (3.21)

Предположим теперь, что матрица D является сим­


метричной и для нее существует обратная матрица D~l,
которая также будет симметричной. Выберем для этого
случая симметричную матрицу коэффициентов W в квадра-
тичной форме v = - 2~sTWs, равную—D~1. Тогда матрица L,
определяющая производнук/функции v в виде—sT Lsign, s,
согласно (3.14) равна единичной] матрице, и следовательно,
v будет отрицательно определенной функцией. Это озна­
чает, что если матрица —D симметричная и удовлетворяет
критерию Сильвестра, т. е. квадратичная форма v будет"
положительно определенной *), то на многообразии
пересечения поверхностей разрыва всегда возникает дви­
жение в скользящем режиме. Если же функция v окажется
знакопеременной, то в любой точке этого пересечения
скользящий режим заведомо не возникает. Действитель­
но, в любой окрестности начала координат подпростран­
ства slt . . ., s найдется точка, в которой знаки v и v
совпадут, величина v по модулю будет возрастать и изо­
бражающая точка покинет окрестность пересечения по­
верхностей разрыва. (Этот факт можно обосновать строго,
следуя приведенным для доказательства теоремы § 2
рассуждениям.) Таким образом, если матрица D в (3.19)
симметричная, то выполнение неравенств критерия Силь­
вестра для матрицы —D является достаточным условием
существования скользящего режима. Если исключить
из рассмотрения граничные случаи, когда функция и
не является положительно определенной, а лишь неот­
рицательной, то выполнение этих неравенств является
одновременно и необходимым условием.

*) Мы не приводим здесь доказательства довольно очевидных


утверждений о том, что если матрица — D является симметричной
и удовлетворяет критерию Сильвестра, то обратная матрица так же
обладает этими свойствами.
§ 3] ОПРЕДЕЛЕНИЕ ОБЛАСТИ СКОЛЬЖЕНИЯ 105

В заключение рассмотрим задачу о нахождении области


скольжения для системы (3.18), если матрица —D сим­
метричная и удовлетворяет критерию Сильвестра, а век­
тор d отличен от пуля и зависит от х и t. По-прежнему
выберем функцию v в виде положительно определенной
квадратичной формы - j sTWs, W = —Л-1 , а производная
этой функции в силу системы (3.19) будет равна

v = — sT sign s - f sTl, l ~ Wd (x , t.) = —D~ld (x, t).

Условия (3.16), согласно которым эта функция будет


определенно отрицательной, выделяют область скольже­
ния S:
sup |lk (х, t) | 1 (к — 1 , . . т). (3.22)
xes
fe[o,°o]
Разумеется, эти условия будут лишь достаточными и не
позволяют судить о существовании скольжения вне об­
ласти, выделяемой неравенствами (3.22).
2. Квадратичные формы с коэффициентами, завися­
щими от вектора состояний и времени. При рассмотре­
нии разрывных систем с постоянной матрицей в уравне­
нии (3.19) мы показали, что для симметричной матрицы
вопрос об области скольжения решается на основе под­
хода, разработанного в теории устойчивости линейных
систем с постоянными параметрами. Идея этого подхода
состоит в том, что сначала выбирается отрицательно опре­
деленная функция v и затем по ней восстанавливается
сама функция v. Знак полученной таким образом функции
v, зависящей от параметров системы, и решал вопрос об
устойчивости. Такой способ неприемлем для исследования
устойчивости линейных систем с переменными парамет­
рами, так как функция v должна быть нестационарной.
Ее производная доллша содержать частные производные
по времени, и в этом случае задача восстановления коэф­
фициентов функции v уже не сводится к решению системы
алгебраических уравнений.
Принципиальное отличие разрывных систем состоит
в том, что метод восстановления функции v в виде ква­
дратичной формы по выбранной отрицательно определен­
ной функции v применим независимо от того, является ли
106 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

матрица D постоянной или же зависит от времени t и


вектора состояний х. Это важное свойство (а важность
его очевидна в связи с тем, что даже в стационарной си­
стеме (2.2) матрица D может оказаться переменной, так
как она зависит от х) сформулируем в виде теоремы прн-Т"
менительно к разрывной системы (3.12).
Т е о р е м а . Если для некоторой области S значе­
ний вектора х на пересечении поверхностей разрыва и при
любом t найдутся такие матрицы W (х, t), L (х , t) и век­
тор I (х, t), что L = — WD и l = W d , и при этом выпол­
няются условия:
1) W = W T, все диагональные определители этой мат­
рицы положительны и для них существуют верхняя и
нижняя границы,
2) для элементов матрицы L и вектора I справедливы
условия (3.16),
3) норма полной производной от матрицы W по вре­
мени ограничена некоторым числом М , то рассматри­
ваемая область будет областью скольжения.
Приведем доказательство этой теоремы. Из первого условия
1 т
следует, что для квадратичной формы v = -тр s W (х, г) s выпол­
няется неравенство (3.4) из теоремы о существовании скользящего
режима, приведенной в § 2. Второе условие означает, что функция
1>
0 = — sTL sign s + sTl является отрицательно определенной на
поверхности любой сферы радиуса || s || н ее верхняя грапица сог­
ласно (ЗЛ7) равна
sup г>0 = — |М|Д/Г. (3.23)
||s||=const

Рассмотрим теперь производную от функции и по времени, имея


в виду, что L = — WD и I = Wd\
v = — v0 + sT Ws.
В соответствии с третьим условием и соотношением (3.23) за­
пишем оценку для верхней границы функции vA на сфере радиуса

sup » < — !И д г г -Н М рл/.


]|s]l=const
Так как первое слагаемое пропорционально || s ||, а второе — ||s ||2,
то всегда найдется такая окрестность начала координат $•= О,
внутри которой на любой сфере верхняя граница функции v будет
строго отрицательной. Это означает, что независимо от скорости
изменения матрицы W выполняется п второе условие (3.5) из тео­
ремы в § 2, следовательно, рассматриваемая область S является
областью скольжения.
5 3J ОПРЕДЕЛЕНИЕ ОБЛАСТИ СКОЛЬЖЕНИЯ 107

Основной результат доказанной теоремы заключается


в следующем: если область S является областью
скольжения для фиксированных значений матрицы D
и вектора d из некоторого диапазона и этот факт обос­
новывается с помощью функции v в виде квадратичной
формы, коэффициенты которой зависят от D и d, то об­
ласть S останется областью скольжения и при произволь­
ном изменении элементов D и d в рассматриваемом диапа­
зоне (лишь бы величина | W \\ была ограниченной). Этот
вывод, по сути дела, обосновывает применимость так на­
зываемого «метода замороженных коэффициентов» для
определения области скольжения в разрывных системах
с помощью квадратичных форм.
В связи с этим можно просто переформулировать ре­
зультаты относительно области скольжения в системе
(3.19), если вектор d (х , t) = 0, матрица D является сим­
метричной, но уже зависит от г и г, а не постоянна, как
это предполагалось ранее. Область S значений х, для
которой все диагональные определители матрицы —Z?-1
положительны, имеют верхнюю и нижнюю границы и
величина |]D~11] ограничена, является областью сколь­
жения. В случае, если вектор d (х, t) отличен от нуля,
область скольжения по-прежнему выделяется неравенст­
вами (3.22).
Что касается системы, для которой диагональные эле­
менты в матрице/? являются преобладающими в соответ­
ствии с (3.20), то для нее нет необходимости применять
доказанную здесь теорему, так как матрица W была вы­
брана постоянной и равной единичной (т. е. W — 0).
В связи с этим нужно лишь переписать неравенства (3.21),
выделяющие область скольжения S, с учетом перемен­
ности матрицы D (х, t):
т
inf ( - dkk (х, t) — 2 Idki (x, t) |- |dk (:X, t) I) > 0. (3.24)
i=1
i
Отметим, наконец, еще один подкласс матриц D (х, t),
для которых задача о нахождении области скольжения
может быть решена с помощью квадратичных форм. Вновь
обратимся к системе (3.12) и предположим, что существу­
ет такая диагональная матрица А (ж, t), для которой в
108 УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА 1ГЛ. III

некоторой области S на пересечении поверхностей раз­


рыва выполняются соотношения
inf %i (х , i) )> 0, |^ (x , t)\<^M
fe[o,co)
(M — const, i = 1 , . . . , m), (3.25)
AD = DTA = D r, sup \lk \ < i (fc = l ,...,7 n ) ,
(S[0,=o)
где %i (x , t) — элементы матрицы A (x , t), lk — элементы век-
тора —D~1d (x , i) и квадратичная форма v = ----^■sT {D 'Y 1s
удовлетворяет условиям (3.4). При выполнении этих ус­
ловий область S является областью скольжения.
Это утверждение позволяет найти область скольжения,
если матрица D (х , t) в (3.12) не является симметричной,
но может быть сделана таковой в результате умножения
на диагональную матрицу с положительными элементами.
Для доказательства рассмотрим поведение системы в под­
пространстве, характеризуемом вектором s*, который
связан с исходным вектором s невырожденным преобра­
зованием
s* = А (х , г) s.

Так как в области А справедливо условие inf \ { х , г ) > 0 ,


<е[о,оо)
то из факта существования скользящего режима в этой
области в подпространстве s* следует его существование
и в подпространстве s.
Запишем вместо (3.12) уравнение движения в новом
подпространстве, имея в виду, что sign s = sign s* (так
как %i (х, t) > 0):

s* = D * (x , t) sign s* + A (x, t) d (x, t) + Д (x , t) s.

В этой системе матрица D * (х, t) уже симметричная и ква-


дратичная ф ор м а -----sT (D*) 1s удовлетворяет первому
условию теоремы в § 2, а этот случай мы уже разбирали
и для него осталось лишь доказать, что в области S вы­
полняются условия, аналогичные (3.22):

sup | ^ | < 1 (/с = 1 , . . . , т), (3.26)


(е[о,«>)
5 ai ОПРЕДЕЛЕНИЕ ОБЛАСТИ СКОЛЬЖЕНИЯ 109

где 1'с — элементы вектора I*, который определяется со­


отношением
I* = - (Дй + As) = l — {D*)~1As.
Покажем, что и эти условия следуют из (3.25). Так
как величины )] |]и ||Л ||ограничены, то ||I — L* ||
^у|| s |], где у — некоторое положительное число. Это озна­
чает, что достаточно малой окрестности пересечения по­
верхностей разрыва векторы / и I* близки и, следователь­
но, верхняя оценка компоиент вектора I* также не пре­
восходит единицы. Утверждение доказано.
Рассмотрим в качестве примера применения описанного
метода «искусственной симметризации» систему произ­
вольного порядка с двумерным управлением, движение
которой в подпространстве (s^ s2) описывается уравне­
ниями
s — D (х, t) sign s,

где s — вектор с компонентами и s2, D (х , t) — матрица


размерности 2 x 2 . Предположим, что знаки элементов
d12 (х, t) и d21 (х, t) совпадают и все значения d21 (х, t)
отличны от нуля. Тогда выберем матрицу Л (х, t) с по­
ложительными диагональными элементами в виде
/1 <ь
А (*, 0 = ( о du

Матрица D* (х, t), равная Л (х, t), D (х, t), будет симмет­
ричной:
d-ц di 2
D* (х, t) di2 1
di2 ■j—■cli
d2i
и следовательно, область значений х, где верхняя и ниж­
няя границы функций —dn (х, t) и — (dal (х, t) d22 (х, t) —
— d12 (х, t) d21 (x, t)) строго положительны, а функция
v — -----| -sT (D*)_1s является положительно определенной,
будет областью скольжения. В области, где хотя бы одна
из этих функций поменяет знак, как это уже отмечалось
выше, скользящий режим заведомо отсутствует.
НО УСЛОВИЯ СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА ГГЛ. Ш

§ 4. Системы с иерархией управлений

В этом параграфе мы рассмотрим системы с векторным


разрывным управлением, для которых задача об опреде­
лении области скольжения распадается на отдельные ска-- "
лярные задачи. Один из таких случаев был разобран
в § 3, когда предполагалось, что в матрице D (х , /) диаго­
нальные элементы являются преобладающими (это усло­
вие записано в виде неравенств (3.20), (3.21) или (3.24)).
Для систем с таким свойством скользящий режим всегда
возникает на каждой из поверхностей разрыва.
Рассмотрим теперь иной подход к решению задачи о
скольжении, который также сводится к последовательному
анализу отдельных скалярных случаев, по при этом сколь­
зящий режим не обязательно возникает на каждой из
поверхностей разрыва в отдельности.
Пусть система, для которой нужно определить область
скольжения, по-прежнему описывается уравнениями
(2.2), (2.3). Предположим, что на пересечении каких-
либо к поверхностей разрыва, например s* = 0 (i =
= 1, к, к<^т), возник скользящий режим. Уравнения
такого скользящего движения можно получить с помощью
метода эквивалентного управления. Для этого нужно
из системы уравнений зг = 0 (£ = 1, к) найти щэкв
(i = 1, . . ., к), полагая, что остальные компоненты равны
щ или щ в зависимости от знака величин sk+1, . . ., sm,
и затем подставить полученные значения в исходную
систему. В результате получим уравнения вида

х = } к (х, l) + B h (x, t)u k (к = 0,. . ., т), (3.27)

где } к — гг-мерный вектор, В h — матрица размерности


п X т — к со стол бц а м tiff1, . . ., й™, ик — (т — Ди­
мерный вектор управления с компонентами ик+1, . . ., ит.
В уравнениях (3.27) при к = т вектор ит равен нулю,
если же к = 0, то /° = / , В в = В, и0 = и, и эта система
совпадает с исходной системой (2.2). Запишем для систе­
мы (3.27) условия возникновения скользящего режима на
поверхности sm = 0, считая, что на этой поверхности
претерпевает разрывы компонента щ-+1, а по пересече­
нию к поверхностей s, = 0 (i = 1, . • ., к) скольжение
имеет место. Согласно приведенным во введении уело-
§4] СИСТЕМЫ С ИЕРАРХИЕЙ. УПРАВЛЕНИЙ Ц (

виям скользящий режим на поверхности s/£+1 = 0 су­


ществует, если
lim Sfc+i<C0, lim i fc+1^>0. (3.28)

Величина ss+1 в рассматриваемом случае определяется


соотношением
m
4-н = gL'a>dsm /* -i- 2 gL'adsm ft,y. (3.29)
4
i = -+ l

Потребуем, чтобы неравенства (3.28), записанные


в силу системы (3.27), выполнялись при любых значе­
ниях компонент управления мй+2,. . ., ит. Согласно
(3.29) условия скольжения приобретают вид

grad sm b£+V + i <


m-к
< min [ — gradsm / fc— 2 8radЯ-+1&Г''««.•+;].
y/c+2 j= 2
(3.30)
grad sk+1bl+1u l n >
773 —

> max [ — grad^+i/* — 2 grad Я-+1&ГV + j I •


u k + 2 - - - 'u m J= 2

Знаки min и max в этих неравенствах означают, что


они выполняются независимо от того, какому значению
щ или щ равны компоненты управления ut (i = к + 2,...
. . ., т). Необходимо отметить, что если во время движения
в скользящем режиме по поверхности sk+1 = 0 возникнет
скольжение по поверхности г^м-г (Z > 1), то условия
(3.30) не нарушатся. Действительно, в этом случае в не­
равенство (3.30) вместо и м нужно поставить им окп,
а эта величина согласно необходимому условию возникно­
вения скользящего режима (3.3) заключена между зна­
чениями щ +1 и uk+i, для которых неравенства (3.30)
справедливы.
Если полученные неравенства выполняются для неко­
торой области .S' на пересечении поверхностей s; = 0 для
всех к.
(3.31)
112 У с л о в и я СУЩЕСТВОВАНИЯ СКОЛЬЗЯЩЕГО РЕЖИМА [ГЛ. III

то область S будет областью скольжения. Кроме того,


каждое из неравенств (3.30) выделяет область скольжения
на соответствующей поверхности разрыва.
Соотношения (3.30), (3.31) вводят иерархию управ­
лений, согласно которой управление иг обеспечивает
движение в скользящем режиме по поверхности % = О
независимо от значений н2, . . ., ит, вторая компонента
щ — по пересечению sx = 0 и s2 = 0 независимо от зна­
чений us, . . ., ит и т. д. Существенно, что записанные
таким образом достаточные условия скольжения получены
на основе условий возникновения скользящего режима
для скалярного случая и при этом, если некоторая функ­
ция sh =j= 0 (т. е. скользящего режима на этой поверхности
нет) и изображающая точка попала на поверхность s^i =
= 0 (Z)> 1), то на этой поверхности скользящий режим
может и не возникнуть *). Обратим внимание на то, что
описанный в § 3 метод, основанный на использовании
свойств матрицы D с преобладающей диагональю, пред­
полагал возникновение скользящего режима при попа­
дании изображающей точки на любую из поверхностей
разрыва. В заключение отметим, что система с иерархией
управления совпадает с системой, у которой матрица D
имеет преобладающую диагональ, если матрица GB
в уравнении (3.10) окажется диагональной матрицей Q
с элементами (х, () (i = 1, . . ., т). Для такой системы
условия (3.30) имеют вид

— grads* ■/,
(3.32)
Ч к Щ > ~ grads*-/ {к = 1, . . . ,'т).
При выполнении неравенств (3.32), так же как и в си­
стеме тина (3.20), скользящий режим возникает на каждой
из поверхностей разрыва, а сами неравенства выделя­
ют область скольжения на их пересечении и на каждой
из них.!

*) Для такой ситуации больше оснований считать, что сколь­


зящий режим не возникнет, так как на поверхности sx.+; = 0 пре­
терпевает разрывы управление и(.+(, которое меньше влияет на дви­
жение, чем управление и поэтому знак *',.+г на поверхности
Ч-+г = 0 может ио измениться.
§» ПОСТАНОВКА ЗАДАЧИ 113

ГЛАВА IV
ОБСУЖДЕНИЕ ПРОБЛЕМЫ СИНТЕЗА

§ 1. Постановка задачи
Основной целью настоящего раздела является изуче­
ние формального аппарата исследования скользящих
движений, которые могут возникать в динамических си­
стемах, описываемых дифференциальными уравнениями
с разрывной правой частью. В этой главе, завершающей
раздел I, будут обсуждаться возможные пути использо­
вания свойств скользящих режимов для того, чтобы на­
делить системы автоматического управления желаемыми
динамическими свойствами. Здесь мы изложим лишь
основные подходы к решению задачи синтеза в системах
с разрывными управлениями, и затем уже в последующих
разделах эти подходы будут использованы для решения
конкретных задач управления.
После выбора структуры системы любая задача син­
теза на языке дифференциальных уравнений сводится
к нахождению таких параметров управляющего устрой­
ства, при которых решение дифференциального уравнения
замкнутой системы обладает желаемыми свойствами. Что
касается синтеза разрывных систем, то для них прежде
всего необходимо выяснить, какими свободными парамет­
рами мы располагаем и каким образом эти параметры
влияют на движение системы.
Для изучения этих вопросов вновь обратимся к си­
стеме (2.2), (2.3), в уравнение движения которой вектор­
ное управление входит линейно. Для такой системы урав­
нения скольжения (2.6) по пересечению поверхностей
разрыва Si = 0 (г = 1, . . ., т) были получены в главе II
с помощью метода эквивалентного управления. Это век­
торное уравнение является, по сути дела, уравнением
не л-го, а (п — т )-г о порядка, которое можно получить,
если из алгебраических уравнений s ; = 0 (i = '1, . . .
., т) выразить т каких-либо координат, например
Xn-m+i, • • ■, х п1 через остальные п — т координат, под­
ставить их в первые п — т уравнений системы (2.6),
а остальные т уравнений отбросить *). Помимо понижения
*) В § 2 главы II было показало, что такая процедура всегда
выполнима, если уравпеиие метода эквивалентного управления не
вырождается.
114 ОБСУЖДЕНИЕ ПРОБЛЕМЫ СИНТЕЗА [ГЛ. IV

порядка уравнения движения в скользящем режиме


с точки зрения задачи синтеза наиболее существенным
является факт зависимости уравнений скольжения от
т X п компонент векторов градиентов к т поверхностям
разрыва и независимости от разрывного вектора управ­
ления. Условия же возникновения скользящего режима,
как показали проведенные в главе III исследования, зави­
сят и от положения поверхностей разрыва в пространстве
состояний системы, и от вектора управления. Эти свой­
ства, присущие разрывным системам, позволяют наметить
последовательность синтеза.
Сначала нужно так выбрать поверхности, а, следова­
тельно, и векторы градиентов, составляющие матрицу G
в уравнении скольжения (2.6), чтобы движение в сколь­
зящем режиме удовлетворяло требованиям, предъявляе­
мым к процессу управления. Затем выбираются такие
управления, при которых на всем пересечении поверхно­
стей разрыва выполняются условия существования сколь­
зящего режима, а изображающая точка из любого началь­
ного положения всегда попадает на это пересечение.
Обратим внимание на то, что задача о попадании отлича­
ется от задачи определения области скольжения лишь тем,
что в пространстве slt . . ., sm область скольжения может
быть получена, исходя из условий устойчивости в «ма­
лом», а задача о попадании сводится к задаче об устойчи­
вости «в большом». Если время попадания *) для системы,
построенной в соответствии с намеченной схемой синтеза,
мало по сравнению с длительностью всего процесса управ­
ления, то этот процесс будет в основном определяться дви­
жением в скользящем режиме, которое имеет желаемый
характер.
Такой метод синтеза, по сути дела, означает решение
той или иной задачи управления в классе систем с пере­
менной структурой, в которых впервые были широко ис­
пользованы свойства скользящих режимов [34, 45].
Напомним, что в этом классе предполагается наличие не­
скольких непрерывных систем, называемых структурами,
и задача синтеза сводится к определению как параметров
каждой из них, так и последовательности их изменения.
¥) В дальнейшем для кратности вместо «попадание изобра­
жающей точки из любого начального положения на пересечение
поверхностей разрыва» будем говорить просто «попадание».

У
§ 2] ИНВАРИАНТНОСТЬ УРАВНЕНИЙ СКОЛЬЖЕНИЯ 115

Каждая такая система с лг-мерным управлением состоит


из 2т непрерывных структур, а последовательность их
изменения определяется положением поверхностей раз­
рыва в пространстве координат системы.
Здесь мы не затрагиваем вопроса о выборе поверхно­
стей разрыва, так как правая часть уравнений скольжения
непрерывна и эта задача является обычной задачей син­
теза, рассматриваемой в теории автоматического управ­
ления *).
Основная трудность второго этапа синтеза — выбора
значений wt и щ (£ = 1, . . ., т.) компонент разрывного
управления (2.3) — состоит в том, что для векторного слу­
чая в наших руках нет универсального приема, который
по аналогии со скалярным случаем позволил бы разбить
многообразие пересечения поверхностей разрыва на об­
ласти, где скользящий реяшм возникает, и области, где
это движение отсутствует. В то Hie время в главе III
для различных ситуаций получены достаточные условия,
которые гарантируют возникновение скользящего режима
в определенной области на пересечении поверхностей раз­
рыва. В соответствии с этими условиями после выбора
поверхностей разрыва и предлагается осуществлять вто­
рой этап задачи синтеза. В последующих параграфах
разбираются различные способы выбора вектора управ­
ления, которое обеспечивает выполнение тех или иных
достаточных условий возникновения скользящего режима
на всем пересечении поверхностей разрыва.

§ 2. Инвариантность уравнений скольжения


к линейному преобразованию поверхностей разрыва

Так как условия возникновения скользящего режима


зависят не только от величины разрывного управления,
но и от уравнений поверхностей разрыва, то при выборе
этих поверхностей наиболее существенным является во­
прос о том, единственным ли образом можно получить

*) Как будет показано ниже, эта задача приобретает специ­


фический характер, если на параметры вектора управления нало­
жены ограничения и уравнения поверхностей разрыва не могут быть
выбраны произвольно. Задачи синтеза такого типа будут рассмот­
рены в дальнейшем в разделах II и III.
116 ОБСУЖДЕНИЕ ПРОБЛЕМЫ СИНТЕЗА [гл. iv

желаемые уравнения скольжения. Если окажется, что


одно и то же движение в скользящем режиме может быть
получено различными способами, то тогда из них нужно
выбрать такой, для которого проще реализовать условия
возникновения скользящего режима. Покажем, что такая"
неоднозначность имеет место. Пусть в системе (2.2),
(2.3) возникло движение в скользящем режиме в неко­
торой области многообразия пересечения поверхностей
разрыва S,- (а:) = 0 (г = 1, . . ., т) размерности п — т.
Это движение описывается уравнениями (2.6). Вводом
новые в общем случае нестационарные поверхности
s' (х , t) = 0 (i = 1, . . ., т), пересечение которых совпа­
дает с пересечением поверхностей (х) = 0. Такое сов­
падение будет иметь место, если
s* (х, t) = Q (х , t) s (х), (4.1)

где s* n s — векторы с компонентами s t и s* (г = 1, . . .


. . ., т) соответственно, a Q (х, t) — невырожденная мат­
рица размерности т X т.
Предположим, что компоненты управления претерпе­
вают разрывы на поверхностях s* (х, t) = 0 и в некоторой
области значений х и t на многообразии s* = 0 возник
скользящий режим. Тогда если в рассматриваемой области
величины ||Q I п ||Q- 1 1| ограничены, то уравнение сколь­
жения совпадает с уравнением (2.6). Это означает, что
движение в скользящем режиме инвариантно к линейному
преобразованию поверхностей разрыва. Для обоснования
этого утверждения будем действовать в соответствии
с процедурой метода эквивалентного управления; сначала
вычислим накв из уравнения

s* = Q (х, t) G (/ + Виэкв) -|- Qs = 0.

В этом уравнении G — матрица размерности т X п,-


строками которой являются градиенты функций (а-).
Так как матрица Q (х, t) невырожденная, то величина
иэкв определяется соотношением

ii-экв = -{G B Y ^ G j - {GBy'Qr'Qs. (4.2)

Полученное таким образом ид„в отличается от экви­


валентного управления (2.5), вычисленного для системы
§ 3] МЕТОД ДИАГОНАЛИЗАЦИИ 117

(2.2), (2.3), слагаемым— (GB)~1Q~1Qs. Так как в реальном


скользящем режиме вектор s* является достаточно малой
определяемой неидеалыгостями величиной и del £2=^ О,
-то величина s также мала. Величины ||£2 ||и ||£2“ 1 1| огра­
ничены, поэтому в пределе, когда все неидеальности стре­
мятся к пулю, слагаемое — (GB)~1Q~1Qs будет также стре­
миться к пулю, и следовательно, для получения уравне­
ний идеального скольжения можно в выражении для ит<в
это слагаемое отбросить (к этому выводу можно прийти
с помощью строгих рассуждений, приведенных в главе II
для обоснования метода эквивалентного управления).
Это означает, что величины нэкв для систем с поверхно­
стями разрыва Si (х) — 0 и s* (х , t) = 0 совпадают, по­
этому совпадают и уравнения скольжения этих систем.
Существенно, что хотя уравнения скольжения инвариант­
ны к линейному преобразованию (4.1), сама матрица пре­
образования £2 (х, £) влияет на движение системы в под­
пространстве s* (х, i) в окрестности многообразия пере­
сечения поверхностей разрыва
s* = £2G j + £2GBu + О (s*), (4.3)
где О (s *) — бесконечно малая величина порядка ||s* ||.
Напомним, что вопрос о выделении областей скольже­
ния решается именно на основе анализа этого уравнения.
В результате появляется дополнительная возможность,
которую целесообразно использовать при синтезе систем:
после выбора поверхностей разрыва, исходя из желаемого
характера уравнений скольжения, можно попытаться,
не изменяя эти уравнения, так изменить поверхности
разрыва с помощью линейного преобразования (4.1),
чтобы привести уравнение (4.3) к виду, для которого
применимы какие-либо достаточные условия скольжения,
полученные в главе III. Более детально этот вопрос будет
рассмотрен в последующих параграфах настоящей главы.

§ 3. Метод диагонализации

В соответствии с намеченной схемой синтеза будем


считать, что в системе (2.2), (2.3) поверхности разрыва
S; (х) = 0 (г = 1, . . ., т) выбраны и задача состоит в опре­
делении такого вектора управления, для которого все
118 ОБСУЖДЕНИЕ ПРОБЛЕМЫ СИНТЕЗА t r n . IV

многообразие пересечения поверхностей разрыва является


областью скольжения и изображающая точка из любого
начального положения попадает на это многообразие.
Попытаемся так подобрать функцию управления, что­
бы в уравнении (3.10), описывающем проекцию движения
системы на подпространство slf . . ., sm, матрица GB
перед управлением оказалась диагональной. Тогда дви­
жение в этом нг-мерном подпространстве распадается на
независимые движения первого порядка, т. е. па т ска­
лярных случаев, а для каждого из них можно выполнить
условия возникновения скользящего режима, если для
любых х и t компоненты управления удовлетворяют усло­
виям (3.32). Такой метод обеспечения скользящего режима
на многообразии s = 0, который предполагает выполне­
ние условий скольжения на каждой из поверхностей
st (я) = 0, будем в дальнейшем называть методом диаго-
нализации.
Рассмотрим два варианта реализации этого метода.
Первый вариант предполагает введение нового вектора
управления и*, который получается в результате линей­
ного преобразования исходного вектора и:
и* — Q 1 (х, t) G (х) В (ж, <) и (4.4)

где G (х) и В (х, t) — матрицы, определяемые в соответ­


ствии с (2.2) и (2.4), a Q (х , t) — произвольная диагональ­
ная матрица размерности т X т с элементами qt (х, t)
(i = 1, . . ., т), причем inf |q-t (х, t) |^> 0 для 0 / < оо
и всех х на многообразии s = 0. Компоненты и* (г = 1, . . .
. . ., т) вектора и* претерпевают разрывы на выбранных
поверхностях разрыва:

Ui*(x,t) при Si (х) )> 0,


(4.5)
и\~ (x,t) при S i(x )< 0 .
При такой замене уравнения (2.2) и (3.10) перепишутся
в виде
x ^ f + B i G B ) - 1 Qu\
s = Gf + Qu*.
Предположим, что все функции в этих уравнениях таковы,
что для них применим метод эквивалентного управления.
§3] МЕТОД ДИАГОНАЛИЗАЦИИ 119

Уравнение скольжения в этом случае, получаемое в ре­


зультате решения алгебраической системы s = 0 относи­
тельно и* и подстановки этого значения в систему урав­
нений относительно вектора х, совпадает с уравнением
-скольжения (2.6), записанным для системы (2.2), (2.3).
Это обстоятельство является существенным, так как по­
верхности разрыва st (х ) (г = 1, . . ., т) выбираются
исходя из уравнений (2.6).
Для того чтобы в преобразованной таким образом
системе область скольжения совпала с многообразием
пересечения поверхностен разрыва, достаточно для всех
точек х на этом многообразии выбрать компоненты век­
тора и* в соответствии с (3.32):

<h(х, t) и- + (х, t) < — grad (x )f(x , t),


i ( x , t ) щ~ (x, t) > — grad Si (x) / (x, t) (i = 1 ,. . ,,m).

В исходном управлении
u = (GB)~'Qu*, (4.7)
которое и должно быть реализовано в системе, каждая
компонента претерпевает разрывы на всех поверхностях
разрыва, так как любая из функций u t (х, t) является
линейной комбинацией компонент вектора и* (х, t). Если
неравенства (4.6) выполняются для любых точек про­
странства (хг, . . ., х п), а не только лежащих на много­
образии s (х) = 0, то величины s ; и s; всегда будут иметь
разные знаки, и поэтому неравенства (4.6) будут одновре­
менно и условиями попадания.
Второй вариант метода диагонализации предполагает
линейное преобразование не вектора управления, а век­
тора s в соответствии с (4.1). Компоненты вектора и будут
теперь претерпевать разрывы на новых поверхностях
(г, t) = 0 (г = 1, . . ., яг). Как показано в § 1, для любой
матрицы Q (х , t) уравнения скольжения, которые, по
нашему предположению, уже выбраны, не меняются.
Составим матрицу Q (х, t) таким образом, чтобы в урав­
нении (4.3) матрица перед управлением и, как и в первом
варианте, оказалась диагональной матрицей Q (х, i)
с элементами (х , t):
12 0 ОБСУЖДЕНИЕ ПРОБЛЕМЫ СИНТЕЗА [ГЛ. IV

В этом случае уравнение (4.3), описывающее поведение


системы в окрестности многообразия s = 0, запишется
в виде*)
s* — s° (х , f) -f- Q (x,t) и + О (s*), (4.8)

где s° — вектор с компонентами s? (i = 1, . . ., т), рав­


ный Q (&5)-1б?/. Для такой системы область S на много­
образии s — 0 будет областью скольжения, если для лю­
бой ее точки выполняются аналогичные (3.32) и (4.6)
условия

Яг (х, о “ ? > — s°i (х >*).


qi ( x , t ) u T < i — Si(x,t) (i = 1, . . . , т).
В отличие от первого варианта метода диагонализации
условия попадания не получаются распространением не­
равенств (4.9) на все подпространство s*, . . ., s*, так как
в уравнении (4.8) последним слагаемым можно пренебречь-
лишь в малой окрестности многообразия s* = 0. Запишем
уравнения, описывающие движение системы (2.2) во всем
подпространстве s*, которые получаются в результате
дифференцирования уравнения (4.1)

s* = s° (х , t) + Q (х , t) и + QQ_1s* (х , t). (4.10)


Условия попадания будут выполнены, если в любой
точке пространства (а^, . . ., х п) величины s* и si имеют
разные знаки. Согласно (4.10) для этого достаточно вы­
полнить следующие неравенства:

Яг (х , *) и? < — s° (х , t) — sin (х, t),


Яг {х, t) Щ > — s° (х, t) — Sin (x,t) (i = 1, . . .', m),

где siQ (x, t) — компоненты вектора QQ_1s* (x , t). Ha


пересечении поверхностей разрыва s* = 0 все s^ (x, tj~
равны нулю и условия попадания (4.10), как и следовало
ожидать, совпадают с условиями возникновения сколь­
зящего режима (4.9).

*) Предполагается, что для матрицы Q (х , I ) выполняется


указанное в § 1 требование об ограниченности функций II Q II и
II й -1 II-
§ 4] МЕТОД СИНТЕЗА НА ОСНОВЕ КВАДРАТИЧНЫХ ФОРМ 121

Таким образом, процедура синтеза на основе метода


диагонализации после выбора уравнения скольжения
(или поверхности разрыва) предполагает два возможных
пути, позволяющих обеспечить возникновение скользя­
щего режима, описываемого этим уравнением. Первая
возможность заключается в выборе компонент управле­
ния в виде линейной комбинации функций, каждая из
которых претерпевает разрывы на одной из выбранных
поверхностей, а вторая — в такой замене уже выбранных
поверхностей разрыва новыми, при которой не изменя­
ются уравнения скольжения.

§ 4. Метод синтеза на основе квадратичных форм

Метод, о котором ниже пойдет речь, так же как и ме­


тод диагонализации, предполагает замену либо вектора
управления, либо уже выбранных с точки зрения урав­
нений скольжения поверхностей разрыва. Целью этой
замены является приведение уравнений системы к виду,
для которого можно составить такую положительно опре­
деленную квадратичную форму v и функцию управления,
что производная v на решениях системы будет отрица­
тельно определенной функцией. Существование такой
функции v согласно § 2 главы III и свидетельствует о су­
ществовании скользящего реяшма на пересечении по­
верхностей разрыва.
Итак, рассматривается система (2.2), (2.3) в предпо­
ложении, что поверхности разрывах; (х) = 0 (г = 1, . . .
. . ., тп) уже выбраны. Проекция движения системы на
подпространство (sl5 . . ., sm) описывается системой (3.10).
Введем новый нг-мериый вектор управления и*, ком­
поненты которого изменяются в соответствии с (4.5) и
который связан с вектором и преобразованием
и . = {GB)~'D (х, t) (Z7*)-1» * ,

где U* — диагональная матрица с элементами (ы*+ — щ ')


(г = 1, . . ., иг), D (х, t) — произвольная симметричная
матрица, которая на всем пересечении поверхностей раз­
рыва удовлетворяет сформулированным в § 3 главы ЦП
условиям, т. е. все диагональные определители матрицы
— [D (х , /)]~х положительны и имеют верхнюю и нижнюю
12 2 ОБСУЖДЕНИЕ ПРОБЛЕМЫ СИНТЕЗА IV

границы. В этом случае в уравнениях проекции движения


на подпространство s (3.12) вектор d (х , t) равен Gf +
+ D (£/*)_1и*0, если и*0 = у (и*+ + и*~), и**ши*~ — векторы
с компонентами (г^Д . . . , i +) и (иГ> . . ., Um). В построен­
ной таким образом системе, как доказано в § 3 главы III,
область скольжения выделяется соотношениями (3.22),
которые справедливы как для постоянных, так и для зави­
сящих от а;и t элементов матрицы!) и вектора d. Потребуем,
чтобы в рассматриваемом случае неравенства (3.22) вы­
полнялись на всем пересечении поверхностей разрыва

sup|Zft( z , i ) l < l {к = \ , . . . , т ) , (4.12)


s=0
где lh (к = 1, . . ., тп) — компоненты вектора I, равного
—D~ld. Эти неравенства можно выполнить, если, напри­
мер, вектор и*0 выбрать равным — U* (jD)- 1G/. Тогда
вектор d, а следовательно, и вектор I равны нулю. Если
такая точная компенсация окажется неудобной с точки
зрения реализации, то можно область скольжения не­
ограниченно увеличивать за счет увеличения величины
разрывов компонент управления вектора и* или, что
то же, за счет увеличения элементов матрицы U* и эле­
ментов матрицы D (х , <). В этом случае элементы вектора
I, равного D -1G/ + (t /* )-1 и*0, будут уменьшаться, что
приведет к расширению области значений х, при которых
справедливы неравенства (4.12). Для попадания изобра­
жающей точки достаточно, чтобы неравенства (4.12) были
справедливы не только на многообразии s = 0, но и во
всем пространстве (х1г . . ., х п).
Второй вариант метода синтеза на основе квадратич­
ных форм предполагает замену уже выбранных исходя
из желаемого характера движения в скользящем режиме
поверхностей разрыва в соответствии с преобразованием
(4.1), к которому уравнения скольжения инвариантны.
Для этого случая, когда компоненты вектора претерпе­
вают разрывы на новых поверхностях s* (х, t) = 0 ( i —
= 1, . . ., тп), вместо уравнения (3.12) запишем уравнение,
описывающее проекцию движения на подпространство s*:
в* = £2 (х, t) D (х, t) sign s* -(- Q (x, t) d (x, t) +
+ Я ( * Д ) [ а ( * , o r 1**, (4.13)

l/
5 4] МЕТОД СИНТЕЗА НА ОСНОВЕ КВАДРАТИЧНЫХ ФОРМ 123

где D (X, t) — GBU, d (х , t) = Gf + GBu°, u° = ~ (ut -f- щ ),

U — диагональная матрица с элементами (ut — щ),


Q (х , <) — матрица преобразования вектора s в вектор s*.
Выберем произвольную симметричную матрицу D*(x, t),
которая на всем пересечении поверхностей разрыва
s* (х , t) = 0 удовлетворяет сформулированным в § 3
главы III условиям, т. е. все диагональные определители
матрицы — [D* (х , г)]-1 положительны и имеют верхнюю
и нижнюю границу. Тогда если Q = D*D~X (матрица
D~l существует, так как det GB ф 0 и detC/ Ф 0), то
уравнение (4.13) преобразуется к виду
s' = D* (х , t) sign s* + D * (ж, £) Z>-1 (ж, t) d (a:, i) +
+ [± (D * D -^ )]D (in -4 \ (4.14)

Относительно матрицы Q (x, t) делается предположение,


что величины ||Q | и ||Q- 1 1| ограничены.
При решении вопроса о возникновении скользящего
режима на пересечении поверхностей разрыва можно
в соответствии с рассуждениями предыдущего параграфа
в уравнении (4.14) отбросить последнее слагаемое, так
как на пересечении поверхностей разрыва вектор s *
равен нулю. В системе (4.14) матрица —D * (х , it) является
положительно определенной, поэтому для этой системы,
как показано в § 3 главы III, область скольжения также
выделяется соотношениями (3.22), которые совпадают с
неравенствами (4.12). Условия (4.12) выполняются,
если и0 = — (G 5)-1G/ и вектор I равен нулю. Если же
такую точную компенсацию не удается обеспечить, то
область скольжения, определяемую неравенствами (4.12),
моз&но расширить за счет увеличения элементов матрицы
U, так как это приведет к уменьшению элементов вектора
-d, равного U~r (GB)-1 .
Вопрос о попадании для такого метода синтеза не
может быть решен простым распространением действия
неравенств (4.12) на все пространство s* при любых зна­
чениях х и t. Это следует из того, что для получения усло­
вий скольжения (4.12) из (3.22) мы отбросили последнее
слагаемое в (4.14), а это можно делать лишь для малой
окрестности многообразия s* = 0. Кроме того, при дока­
124 ОБСУЖДЕНИЕ ПРОБЛЕМЫ СИНТЕЗА 1ГЛ. IV

зательстве правомерности применения условий (3.22)


для переменной матрицы D (х , t) (а система (4.14) является
таковой) существенным образом использовался тот факт,
что движение происходит в малой окрестности пересе­
чения поверхностей разрыва и величина s* близка к
нулю.
Здесь мы ограничимся лишь тем, что наметим последо­
вательность действий, направленных на определение об­
ласти попадания, т. е. области, из которой любая траек­
тория изображающей точки попадает на пересечение по­
верхностей разрыва. Сначала в соответствии с описанным
в § 3 главы III методом нужно составить положительно
определенную функцию v и найти ее производную в силу
системы (4.13), уже не предполагая, что s* является до­
статочно малой величиной. Следующий шаг состоит
в определений такой области Г значений s*, для которой
при любых х и t функция v является отрицательно опре­
деленной. Область попадания будет ограничена поверх­
ностью v — с (с — const) с таким максимальным значе­
нием с, при котором эта поверхность целиком принад­
лежит области Г. Задача синтеза будет решенной, если
удастся подобрать такую матрицу D*, что область попа­
дания включает область допустимых начальных условий.
Отметим, что согласно § 3 главы III матрицу —D* можно
искать не только среди симметричных матриц с положи­
тельными диагональными определителями, но и среди
матриц, приводимых к такому виду в результате умно­
жения на произвольную диагональную матрицу с поло­
жительными элементами.

§ 5. Метод иерархии управлении

Этот метод предполагает искусственное создание ’ ие­


рархии управлений, о которой шла речь в § 4 главы III.
Иерархия управлений предполагает выполнение условия
(3.30) на всем пересечении выбранных поверхностей сколь­
жения. Процедура синтеза иа основе такого подхода осу­
ществляется в следующей последовательности. Прежде
всего нужно выбрать, на какой из поверхностей st — О
будет претерпевать разрывы каждая из компонент век­
тора управления. Предположим, что в уравнении (3.29),
записанном для поверхности sx — 0 (т. е. для к — 0)-,
§ 5] МЕТОД ИЕРАРХИИ УПРАВЛЕНИЙ 125

одна из величии grad s1-bi, например, для i = 1*)


по модулю ограничена снизу некоторым положительным
числом. Тогда выберем s± = 0 в качестве поверхности
разрыва для компоненты щ. Уравнение скольжения вдоль
= 0 будет описываться системой (3.27) при к — 1.
Далее из уравнения (3.29) для к = 1 определяем компо­
ненту управления, для которой произведение grad s2 •b\
ограничено по модулю снизу и которая будет претерпевать
разрывы на-поверхностиs2 = 0 (соответственно присвоим
этой компоненте второй номер). Рассматривая таким
образом уравнения (3.29) для различных 1с, определяем
для каждой компоненты управления «свою» поверхность
разрыва и присваиваем номер этой поверхности. Отметим,
что при таком распределении каждое из уравнений s k =
= 0 может быть решено относительно u h, равного u k3l<a,
которое необходимо для получения уравнения скольжения
по этой поверхности. Величины nt- и ии {1с = 1, . . ., т),
обеспечивающие возникновение скользящего режима на
пересечении поверхностей разрыва, нужно выбрать в со­
ответствии с неравенствами (3.30). Начинать нужно с ком­
поненты ит, так как правая часть неравенств (3.30) для
к = пг — 1 не зависит от остальных компонент управ­
ления. Так как величина gra d sm-frm-i отлична от нуля,
то всегда можно подобрать такие функции и щп, при
которых оба неравенства будут выполнены. Затем по той
же схеме выбираются функции Um-i и щп- 1 с учетом того,
что неравенства (3.30) должны выполняться при любых
уже выбранных на предыдущем шаге значениях и*п или
Um- Далее определяются щп - 2 и ит-г с учетом выбранных
значений и ит и т. д. вплоть до г/{~ и гД, соблюдая
па каждом шаге предписанную неравенствами (3.30)
иерархию управлений. Если соотношения (3.30) выпол­
няются на всем пересечении поверхностей разрыва, то
это пересечение будет областью скольжения.
Задачу о попадании решим в той же последователь­
ности, в какой решалась задача о создании скользящего
режима. Пусть на пересечении поверхностей st — 0
(i = 1, . . ., т — 1) возник скользящий режим и изобра-
*) Если i Ф 1, то перенумерз'ем вокторы-столбцы b\ состав­
ляющие матрицу В, и компоненты управления.
126 ОБСУЖДЕНИЕ ПРОБЛЕМЫ СИНТЕЗА [ГЛ. IV

жагощая точка движется в многообразии размерности


п — т + 1. Если для всех точек этого многообразия
соотношения (3.30) для к = т — 1 окажутся справедли­
выми, то величины sm и sm будут иметь разные знаки
и изображающая точка всегда попадет на поверхность-
sm = 0. Именно исходя из этого и следует выбрать
функции Цщ и Um. Следующий шаг состоит в определении
таких функций и Um-i (опять же с учетом уже вы­
бранных ifin и и„), чтобы во всем пересечении поверхностей
Si = 0 (i = 1, . . ., т — 2) выполнялись неравенства
(3.30) для к = т — 2. Тогда при возникновении сколь­
зящего режима на этом пересечении изображающая точка
всегда попадет на поверхность = 0. В такой после­
довательности определяем все ut и иТ, для которых будет
иметь место попадание на соответствующую поверхность.
Компонента управления иг должна обеспечить попадание
изображающей точки из любого начального положения
в п-мерном пространстве (а^, . . ., гг„) на поверхность"
= 0. Так как величины sx и имеют разные знаки во
всем пространстве, в том числе и в окрестности поверх­
ности sx = 0, то на этой поверхности возникает скользя­
щий режим. На траекториях этого скользящего движения
величины s2 и s2 имеют разные знаки, поэтому изобража­
ющая точка, двигаясь по поверхности = 0, попадет
на пересечение поверхностей = 0 hs 2 = 0. В результате,
по крайней мере за т шагов, будет иметь место попадание
на пересечения всех поверхностей разрыва. Полученные
таким образом условия попадания будут отличаться от
условий возникновения скользящего режима па пере­
сечении поверхностей st = 0 (i = 1, . . ., т) лишь тем,
что каждая пара неравенств (3.30) (?с = 0, . . ., т — 1)
должна выполняться не только для точек этого пересе­
чения, но и для точек многообразия большей размерности
(для каждого к это многообразие имеет размерность
п — к). Решением вопроса о попадании (которое в нашем
случае одновременно обеспечивает и возникновение
скользящего режима на многообразии s = 0) и заверша­
ется решение всей задачи синтеза.
В заключение укажем на одно существенное отличие
такого метода синтеза от методов, описанных в §§ 2 и 3.
В методе диагонализации и методе, построенном на ис-
§5] МЕТОД ИЁРАРХЙИ УПРАВЛЕНИЙ Ш

пользовании квадратичных форм, предполагалось за счет


линейного преобразования вектора управления или век­
тора s, определяющего поверхности разрыва, привести
«•уравнения системы к виду, для которого выполняются
1достаточные условия существования областей скольжения.
Матрица преобразования однозначно зависит от коэф­
фициентов уравнения системы, и поэтому для реализации
этих подходов нужно знать параметры управляемого объ­
екта и внешние воздействия. При отсутствии такой инфор­
мации либо при изменении характеристик объекта в ши­
роком диапазоне применение описанных в §§ 2 и 3 методов
может оказаться затруднительным. Метод иерархии управ­
ления основывается на неравенствах (3.30), и если из­
вестны лишь знаки отличных от нуля функций grad sk+1b£+1
(к = 0, . . ., т — 1), то за счет увеличения по модулю
величин Wfc+i и щ:+1 можно обеспечить выполнение этих
.неравенств для любых значений правых частей, лишь
бы они были ограничены. Именно в связи с этим при
решении различных задач синтеза для векторных случаев
в системах управления нестационарными объектами в
разделе III в основном и будет использоваться метод
иерархии управления.

1/
1

РАЗДЕЛИ
СКАЛЯРНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ

В этом разделе будут рассмотрены различные задачи


управления, возникающие в системах со скалярной функ­
цией управления в предполоя{ении, что в уравнения
движения эта функция управления входит линейно.
В общем случае такой системы уравнения движения
имеют вид
х = / (х, t) b (х, t) и, (ИЛ)

где х — ?г-мерный вектор состояния с компонентами


х1, . . х п, / и Ъ — гг-мерные векторы (/*, . . ., f n) и-
(Ь1, . . Ьп), гг — скалярное управление.
Задача состоит в выборе такой функции гг, при кото­
рой система обладала бы желаемыми свойствами. К таким
свойствам можно отнести, например, динамические пока­
затели процесса управления, точность, требуемый харак­
тер зависимости решения от каких-либо входных функций
(в частности, инвариантность к возмущениям и воспро­
изводимость задающих воздействий) и т. д. Решения
для различных случаев этой общей задачи будем искать
в классе систем с переменной структурой, в которых
управление претерпевает разрывы на некоторой поверх­
ности s (х) = 0:

и = |ц + ^ ^ П рИ S ^ > 0> (И Н)
(гг- (х, t) при s (х) 0,

где гг+ и гг- — некоторые непрерывные функции.


Во введении уже обосновывалась целесообразность
использования такого подхода. Приведенные там же при­
меры свидетельствовали о том, что в случае разрывного
управления к обеим непрерывным структурам (при гг,
равном гг+ и гг- ) можно предъявлять существенно менее
жесткие требования, чем в случае, когда задача управ­
ления решается в рамках одной непрерывной системы.
СКАЛЯРНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ 129

Синтез управления в каждой из рассматриваемых далее


задач будет осуществляться по одной и той же схеме, кото­
рая была описана в последней главе раздела I. В соответст­
вии с этой схемойв системе преднамеренно создается движе­
ние в скользящем режиме, которое наделяется желаемыми
свойствами за счет соответствующего выбора поверхности
разрыва. Если поверхность разрыва выбрана, то задача
синтеза сводится к выбору таких непрерывных функций
и+ (ж, t) и и~.(х, t), для которых изображающая точка из
любого начального положения всегда попадает на эту
поверхность и в любой ее точке возникает скользящий
режим. Приведенные во введении условия существования
скользящего режима в скалярном случае (1.9) для системы
(ИЛ), (И .II) имеют вид
grad s-f
[sign (gFads-Ь)] u+ <[ ■
| grads-£>|
grad s-f (II.III)
[sign (grads-fr)] u~ >
| grads-&|
Из этих соотношений и можно определить, к какому
классу должны принадлежать функции и+ (ж, t) и и~ (ж, t).
Например, если правая часть в (II.III) ограничена, то
управление можно выбрать релейным, т. е. равным одному
из двух постоянных значений, если же правая часть зави­
сит от х линейно, то управление по модулю должно быть
линейной возрастающей функцией от | х | и т. д. Задача
синтеза может усложниться, когда существуют какие-
либо ограничения на выбор функций и+ и и~, и поэтому
поверхности разрыва не могут быть выбраны произвольно.
Специального рассмотрения заслуживают задачи управ­
ления нестационарными объектами, для которых функции
/и Ъв уравнении движения (II.I) зависят явно от времени
например, из-за изменения характеристик управляемого
объекта или наличия внешних возмущений и задающих
воздействий. В этих случаях выбор функции и сущест­
венным образом зависит от того, имеется ли в каждый
момент времени информация о значениях этих параметров
и внешних воздействий.
Совокупность всех этих вопросов будет в дальнейшем
досмотрена применительно к линейной по ж и и системе,
описываемой уравнениями
ж = A { t ) x + b (t)u + D (t) F (t), (II.IV )

5 В, И. Уткин
V'
130 СКАЛЯРНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ

где х — п-мерный вектор-столбец состояния, А (t) —


матрица размерности п х п с элементами ац (Z), b (t) —
га-мерный вектор-столбец {Ъг {t), . . Ъп (г)), D (г) — мат­
рица размерности п X I (Z п), F (г) — Z-мерный вектор-
столбец внешних воздействий (Д (Z), . . /, (t)).
Будем в дальнейшем называть динамическую систему
(II.IV ) объектом, элементы матриц A , D и Ь — ее пара­
метрами. В случае, если внешние воздействия отсутствуют
(т. е. F (г) = 0), движение будет называть свободным, а
при наличии этих воздействий — вынужденным.
f'<4; Скалярное управление и будем искать в виде разрыв­
ной функции, а в качестве поверхности разрыва выберем
плоскость
s = стх, (II. У)

где с — постоянный ?г-мерный вектор-столбец (сх, . . .


. . . , с„), с „ = 1 . Предполагая, что на плоскости s = 0 возник
скользящий режим и к системе (ИЛУ) применим метод*
эквивалентного управления, можно получить уравнения
скольжения, которые будут иметь вид
х = [ Е - Ь (стЬ)_1ст ] А х - f [Е - Ъ(с Ч )-1cT]DF.

Эта система описывает скользящий режим вдоль плоско-


п—1
сти s = 0,"и поэтому во время скольжения хп = — 2 СЛ -
t=i
Подставляя вычисленное таким образом значение х п
в первые п — 1 уравнения найденной системы и отбрасы­
вая последнее уравнение, получим систему уравнений
скольжения (п — 1)-го порядка
х1 = A W + D 4 , (И. VI)

где ж1 — (п — 1)-мерный вектор (%, . . ., жп_х), а элемен­


ты матриц А 1 размерности {п — 1) X {п — 1) и D 1 раз­
мерности (п — 1) X I соответственно равны

a\j = CLij — a in cj — bt { с Ч ) - 1 [ c V — c;- (cTa n)]


(i, ] = 1, . . ., n — 1),

d\ = dUj - bt ( c 4 ) ~ W j
(i 1, • • ., ть 1, / = 1, . . ., Z).
СКАЛЯРНЫЕ IЗАДАЧИ УПРАВЛЕНИЯ 131

В этих соотношениях а1 ап я d1, d1 — соот­


ветственно столбцы матриц А и D.
Уравнение скольжения (II.IV ) зависит от вектора с
и его нуяшо выбрать в соответствии е методами синтеза,
разработанными в теории линейных систем. Разумеется,
при рассмотрении любой задачи автоматического управ­
ления необходимо, по крайней мере, обеспечить асимпто­
тическую устойчивость решения системы (II.V I). Если
устойчивость носит экспоненциальный характер, то урав­
нение (II.IV ), полученное с помощью метода эквивалент­
ного управления, будет справедливым на бесконечном
интервале времени (см. § 2 главы II). Затем следует
найти такое разрывное управление, чтобы на плоскости
(II.V ) при выбранном векторе с, начиная с некоторого
момента времени, возникало и не прекращалось движение
в скользящем режиме. В дальнейшем плоскость, в каждой
точке которой возникает скользящий режим, будем назы­
вать плоскостью скольжения. В последующих главах
на основе такого подхода будут рассмотрены задачи управ­
ления свободным и вынужденным движением объекта
с постоянными и меняющимися параметрами.
Помимо изучения общего случая системы со скалярным
управлением (II.IV ) будет уделено внимание важному
с практической точки зрения классу систем, движение
которых описывается уравнениями
= £ »+ ! (i = 1 , . . / , /г — 1 ),
П
(II.V II)
* n = -2 aiXi — U~ F (0.
1=1

где все at — скалярные параметры, которые могут зави­


сеть от времени, a F (t) — скалярное возмущение. Урав­
нения скольжения (II.V I) для такой системы имеют вид *)
£i = xi+1 ( f = l , . \ : , п — 2),
71— 1
(II.VIII)
£ 71 1
- = ■ ^

______________________________________ 1
*) Это уравнение можно получить, если в (п — 1)-е уравнение
п—1<
системы (II.VII) вместо хп подставить — 2 с ^ , воспользовав-
i= lJ
пшсь уравнением плоскости разрыва s = 0.

5
У
132 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ 1ГЛ. у

Как видно из уравнений (II.V III), движение в сколь­


зящем режиме не зависит от параметров объекта и возму­
щения и определяется только вектором с, который и над­
лежит выбрать. Благодаря этому свойству системы такого
типа подробно рассмотрены в различных публикациях,
посвященных системам с переменной структурой (см.,
например, библиографию в монографии [45]). В дальней­
шем (глава XI) будут рассмотрены условия инвариант­
ности к изменению свойств объекта и внешним возмуще­
ниям для систем с переменной структурой общего вида,
а в этом разделе будут выявлены некоторые специфичес­
кие особенности, возникающие при синтезе управления
в системах, описываемых уравнениями (II.V II).

ГЛАВА V
УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ
СТАЦИОНАРНЫХ ОБЪЕКТОВ

§ 1. Уравнения движения и постановка задачи

Уравнение движения линейной системы со скалярным


управлением (II.IV ) для случая, когда объект является
стационарным и внешние воздействия отсутствуют, за­
пишется в виде
х — Ах + Ьи, (5.1)
где коэффициенты матрицы А и вектора b являются по­
стоянными, а управление и претерпевает разрывы на
плоскости (II.V ).
Движение в скользящем режиме по плоскости s = О
в такой системе согласно (II.VI) описывается уравнением
х1 = X V . ( 5 . 2 )

Полагая, что с£ — компоненты вектора с в (II.V ),


или, что то же, плоскость переключения, выбраны, выяс­
ним, при каких условиях эта плоскость окаяштся плос­
костью скольжения. Запишем условия возникновения
скользящего режима (II.III) для рассматриваемого случая
[s:gn (стЬ)\ и+ — |cTb I'1 стАх, |
(5.3)
[sign (стЬ)] иГ )> — ] cTb J'1стА х. )
§ 1] УРАВНЕНИЯ ДВИЖЕНИЯ И ПОСТАНОВКА ЗАДАЧИ 133

Правые части в неравенствах (5.3) являются линейными


функциями компонент вектора х, поэтому всегда можно
подобрать такие монотонно возрастающие по модулю
относительно ||х || функции п+ и и~, что эти неравенства
будут справедливы при любых х. Приведем один из воз­
можных вариантов разрывного управления, обеспечива­
ющего существование плоскости скольжения. Пусть
управление является суммой воздействий по всем коор­
динатам системы, а коэффициенты воздействий претер­
певают разрывы на плоскости s = 0:
П
U = -2г=1 (5-4)
( Щ При XjS 0,
1 Pi при x{s < 0,
где а ;, Р; — постоянные величины.
В такой системе с переменной структурой, состоящей
из 2п линейных структур, несмотря на то, что коэффициен­
ты \Fi претерпевают разрывы не только на плоскости
s = 0, но и на координатных плоскостях, управление и
претерпевает разрывы лишь на плоскости s = 0. Следо­
вательно, функции и+ и и~ являются непрерывными (хотя'
и не непрерывно-дифференцируемыми) и, как нетрудно
убедиться, для системы (5.1) с управлением (5.4) выполня­
ются все условия, при которых применим метод эквива­
лентного управления *).
Выберем коэффициенты а г и р г линейных структур та­
ким образом, чтобы плоскость s — 0 оказалась плоско­
стью скольжения. Из (5.4) следует, что условия возник­
новения скользящего режима (5.3) будут выполнены при
любых х, если
[sign (ст 5)] а.; )> |стЪ|-1 стаг,
[sign (cTb)] Pi < |стЪр 1 ста1 (i = 1, . . . , п),
где а1, . . ., а" — столбцы матрицы А .
*) Строго говоря, здесь мы имели дело с n-мерным векторным
управлением, компоненты которого Ч^, . . ., Ч^ претерпевают раз­
рывы на одной и той же плоскости s = 0. Такой вырожденный слу­
чай рассматривался в § 5 главы II (случай 1°), и для него метод эк­
вивалентного управления позволяет найти управление скольже­
ния однозначно независимо от того, какие неидеальности имеются
в переключающих устройствах, реализующих функции V lt ..., Чг„ ,
134 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. V

Так как при выполнении неравенств (5.5) величины


s и s имеют разные знаки при любых х, т. е. во всем про­
странстве, а не только на плоскости s = 0, то эти нера­
венства одновременно являются условиями-' существова­
ния плоскости скольжения условиямипопадания*).
Следовательно, в такой системе всегда возникает и не
прекратится движение в скользящем режиме, которое
за счет выбора вектора с может быть наделено желаемыми
свойствами.
Описанный метод синтеза показывает принципиальную
возможность решения задачи управления свободным дви­
жением стационарного объекта за счет преднамеренного
введения в систему скользящего режима. В то же время
следует отметить, что этот метод'может оказаться «слиш­
ком избыточным», так как предполагает-использование
воздействий по всем координатам **), что приводит к по­
явлению в системе 2" линейных структур. В последующих
параграфах будут рассмотрены методы синтеза систем
с разрывными управлениями, в которых число линейных
структур, с помощью которых решается задача управле­
ния, удается уменьшить за счет исключения из управле­
ния (5.4) воздействий по части координат вектора х
(т. е. равенства нулю соответствующих 'Fj). В таких си­
стемах плоскости скольжения уже не могут быть выбраны
произвольно. В связи с этим указываются условия суще­
ствования плоскостей скольжения и выделяется класс
управлений, обеспечивающих устойчивое движение по
•плоскости скольжения. Отдельно рассматривается вопрос
о попадании для различных типов систем.

*) В начале координат х = '0 величины s и ь! равны нулю. Од­


нако скользящий режим в этой точке также существует, так как
при любом отклонении от начала координат величины s ж 3 будут
иметь разные знаки и изображающая точка не может покинуть лю­
бую сколь угодно малую окрестность плоскости s = 0.
**) Отметим, что использование воздействий по всем коорди­
натам при отсутствии ограничений на коэффициенты воздействий
позволяет получить желаемые динамические свойства и в классе
линейных систем. Однако, как показано в [45], в системах с раз­
рывными коэффициентами каждая из структур может и не обладать
желаемыми свойствами (например, все они могут быть неустойчи­
выми), а при наличии.ограничений на коэффициенты воздействий
динамические показатели процесса управления в системе с разрыв­
ными коэффициентами всегда’ выше.
i 2] УСЛОВИЯ СУЩЕСТВОВАНИЯ ПЛОСКОСТИ СКОЛЬЖЕНИЯ 135

§ 2. Условия существования плоскости скольжения

Рассмотрим систему со скалярным управлением, опи­


сываемую уравнением (5.1). Составим функцию управ­
ления в виде суммы воздействий по каким-либо к (к <^п)
координатам системы *) с коэффициентами, претерпева­
ющими разрывы на плоскости s = О (II.V ), и некоторого
небольшого по величине релейного воздействия
к
U= - 2 - «*, (5-6)
i=l

а, при x ts > О,
Pi при x ts < 0 (£ = 1, . . . ,к),
60 при s>0,
— б0 при s<^0,

а ь рг — постоянные коэффициенты, б0 — любое сколь


угодно малое, но отличное от нуля число, совпадающее
по знаку с величиной стЬ.
Прежде чем переходить к выбору параметров функции
управления, при которых плоскость s = 0 окажется
плоскостью скольжения, поясним на примере, с какой
целью в управление введена «релейная добавка» 8и.
Пусть система второго порядка описывается уравнениями

*1 = 32, 1
— и, )

а управление и является воздействием по хх с разрывным


коэффициентом и не содержит компоненты релейного типа
U = —Т » !,
т _ | а при ^ > 0 ,
\ Р при a;xs<^0 (s — схг - f x.z, с — const).

*) Например, по x i , ..., xjj, если же управление осуществляется


по другим к координатам, то можно перенумеровать координаты
системы, поставив их первыми.
136 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ ЕГЛ. у

В случае, если коэффициенты а, (3 и с удовлетворяют не­


равенствам
Р < -с 2< а < о,
фазовый портрет системы будет иметь вид, представленный
на рис. 13. КДк следует из фазового портрета, на всей
прямой s = 0, за исключением лишь начала координат,

фазовые траектории направлены навстречу друг другу


и на этой прямой возникает скользящий режим. В начале
координат условия возникновения скользящего режима
заведомо нарушаются, так как в любой окрестности этой
точки всегда найдутся такие траектории, по которым изо­
бражающая точка «уходит» от прямрй переключения.
Введение же в функцию управления релейного члена
би приводит к тому, что при Ху — — 0 величина s =
= —би имеет знак, противоположный s, и поэтому в си­
стеме е управлением — — би прямая s = О является
прямой скольжения.
Определим теперь условия, при которых плоскость
s = 0 является плоскостью скольжения. При выбранном
законе управления (5.6) найдем величину s в силу системы
(5.1), имея в виду, что для точек плоскости переключения
п—1*

*n = — S
1=1
CiXi
§ 2] УСЛОВИЯ СУЩЕСТВОВАНИЯ ПЛОСКОСТИ СКОЛЬЖЕНИЯ 137

к
з= 2 [ста.1— ci (стап) — (стЪ) xIJ,i]a:i
i=l
п —1
+ 2 (5.7)
l=Jc+l
Из этого соотношения следует, что условия скользя­
щего режима (1.9) будут выполнены в каждой точке пло­
скости переключения, если коэффициенты a t и|рг в функ­
ции управления (5.6) и коэффициенты сг уравнения
плоскости удовлетворяют следующим условиям:
(сЧ ) сц > cTal — Cj (стап),
(сЧ ) ^ < с Ч ' - с{ (с Ч п) (i = 1 , . . . , к),

^ = сЧ п = k+ 1). (5.9)
•i
При выполнении условий (5.8), (5.9) каждое из слага­
емых в первой сумме, а также функция — (стЪ) 8и в (5.7)
имеют знаки, противоположные s, а слагаемые во второй
сумме равны нулю. Полученные соотношения являются
не только, достаточными, но и необходимыми условиями
существования плоскости скольжения. Действительно,
пусть для некоторого i = г одно из условий (5.8), (5.9)
нарушается. Тогда в точке с координатами X i= 0 (г = 1,...
. . ., п — 1, i =f= г) и xr =f= 0 (1 хг | |б0 |), условия
скользящего режима (1.9) будут нарушены.
Таким образом, для управления (5.6) условия (5.8),
(5.9) являются необходимыми и достаточными условиями
существования плоскости скольжения. Существенно, что
в таких системах выбор коэффициентов сг, с помощью
которых обеспечивается желаемый характер движения
в скользящем режиме, не может быть осуществлен про­
извольно, так как эти коэффициенты должны удовлетво­
рять уравнениям (5.9). Исключение составляет лишь слу­
чай, когда к = п — 1, т. е. условия (5.9) отсутствуют,
а неравенства (5.8) всегда можно выполнить за счет соот­
ветствующего выбора коэффициентов а г и Р,-. Если же
ограничены коэффициенты а г и рг, то коэффициенты с,-
могут быть выбраны лишь из диапазона, задаваемого
неравенствами (5.8). Наличие таких дополнительных огра­
138 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. у

ничений (5.8) и (5.9) на выбор коэффициентов уравнения


плоскости переключения и составляет специфику задачи
синтеза систем рассматриваемого типа. Приведем при­
меры, в которых уравнения скольжения выбираются
с учетом ограничений, обусловленных условиями суще­
ствования плоскости скольжения. Рассмотрим случай,
когда свободное движение системы описывается уравне­
ниями (II.V II), в которых п = 3, ах = а2 = а3 = 0, т. е.
£i = х 2,
= х 3, (5.10)
$з = и. ,
Разрывное управление и выбираем в виде
и = — T.-Cj— Su, (5.И )
где
при xxs > 0,
при xxs 0,
6и выбирается в соответствии с (5.6).
Границу разрыва зададим уравнением s = 0, где
s = сххх + с2х2 + х 3 (сх, с2 — const). (5.12)
Поставим задачу обеспечить в такой системе сущест­
вование скользящего движения и наделить это движение
желаемыми динамическими свойствами, используя для
этой цели известные в теории линейных систем способы
оценки процессов с учетом специфических ограничений,
вытекающих из условия существования плоскости сколь­
жения. Например, выберем коэффициенты уравнения
плоскости переключения (5.12) так, чтобы с учетом (5.8),
(5.9) обеспечить максимальную степень устойчивости
скользящих движений.
Имея в виду, что для рассматриваемого случая (5.10)
стЪ = 1, стах = 0, ci (стап) = схс2, стаг = сх, ста3£= с2,

условия (5.8), (5.9) следует записать в следующей форме:


а > — (5.13)
Р < — схс2)
2
С\ ==: Сп» (5.14)
§ 2] УСЛОВИЯ СУЩЕСТВОВАНИЯ ПЛОСКОСТИ СКОЛЬЖЕНИЯ 139

При выполнении (5.13), (5.14) в системе (5.10), (5.11),


(5.12) на всей плоскости s — 0 возникает движение в
скользящем режиме, описываемое согласно (II.V III) ли­
нейными уравнениями
хх = х 2
(5.15)
== — ^2^2
с постоянными, параметрами с1 и с2.
Выберем коэффициенты сх и с2, исходя из оценки «сте­
пень устойчивости».
Характеристическое уравнение для (5.15) имеет вид
р2 + с2р + с± = 0. (5.16)
Имея в виду (5.14), исключим из (5.13) и (5.16) вели­
чину сх:

(5.17)
Р<-cl
и
Р2 + С2р + с2 = 0. (5.18)
Найдем корни характеристического уравнения (5.18)

С2 , уъ
— ±7 с2,
(5.19)
----- тг ± 7 сг.

Из (5.19) очевидно, что чем больше величина с2, тем


быстрее затухает движение в скользящем режиме. Это
оздачает, что коэффициент е2 следует выбрать максималь­
но большим. Но при этом следует помнить о том, что ве­
личина с2 должна удовлетворять (5.17) и при ее увели-
' чении может нарушиться последнее из неравенств (5.17).
Поэтому искомое значение с2, обеспечивающее максималь­
но возможную скорость движения системы в скользящем
—режиме, получаем из (5.17):

c2 = l / - p . (5.20)
В качестве второго примера рассмотрим задачу вы­
бора коэффициентов сг и с2 для той же системы (5.10),
140 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. V

(5.11), (5.12), но уже исходя из другого критерия — инте­


грального. Выберем и с2 из условия минимума инте­
грала
00

/ = ^ (xj (t) + т2х2 (i)) dt (т — const). (5.21)


о
Примем за начало отсчета момент попадания изобра­
жающей точки на плоскость скольжения, а начальные
условия выберем равными хх (0) = 1, х2 (0) = 0. В рас­
сматриваемом случае интегральная оценка (5.21) имеет
вид
/ = (5.22)

Поскольку в скользящем режиме сх = с2, то

I = (5.23)
С2 + Т - С*'
dl п
Очевидно, I — I mini если е.
ЕГ “ т'

Напомним, что величина с2 должна удовлетворять


неравенствам (5.13). Поэтому, если для значения с2, до­
ставляющего минимум выбранному интегральному крите­
рию, неравенства (5.13) выполняются, то это значение
и следует принять за искомое; если минимум / дости­
гается при таком значении с2, что неравенства (5.13)
нарушатся, то в качестве искомого значения с2 следует
принять одно и'з граничных значений (т. е. значений, при
которых одно из неравенств (5.13) обращается в равенство).

§ 3. Условия устойчивости скользящих движений

Так как в системе с переменной структурой (5.1)


с управлением (5.6) коэффициенты уравнения плоскости
скольжения не могут быть выбраны произвольно, то
может оказаться, что в рамках ограничений (5.9) не су­
ществует плоскости скольжения с желаемым характером
движения в скользящем режиме.
§ 3 ] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 141

Выясним, при каких условиях движение в скользя­


щем режиме в рассматриваемой системе будет обладать
наиболее существенным с точки зрения построения си­
стемы автоматического управления свойством — свойст­
вом устойчивости. Пусть в системе (5.1) с управлением
(5.6) плоскость переключения (II.V ) является плоско­
стью скольжения, т. е. выполнены условия (5.8), (5.9).
Введем вместо координаты х п новую координату
П
s = 2 Сгьх ь которая согласно (II.V ) равна нулю на пло-
i= i
скости переключения. Движение системы будем рассмат­
ривать в пространстве х1У . . ., х п_%, s. Для того чтобы
получить уравнение, описывающее это движение, нужно
последнее уравнение в (5.1) заменить уравнением для s,
вычисленным в силу системы (5.1), и затем во всех п
П—1
уравнениях вместо х п подставить величину s — 2
i= l
cix i-

В результете таких преобразований получим систему


уравнений движения
х1 = А х 1 4- ass + Ъи,
п — 1 .
(5.24)
s = 2 [cTfti — ci (стап)] + (стап) s -f- (cTb) и,
i=l
где А — матрица размерности (и — 1) х (п — 1) с эле­
ментами ciij = ац — Cjdin (г, / = 1, . . ., п — 1), а? —
вектор с элементами ain (i = 1, . . ., п — 1), 5 — вектор
с элементами Ь£ (£ = 1, . . ., п — 1).
Уравнения (5.24), эквивалентные исходным уравнениям
(5.1), будут использованы для доказательства сформули­
рованной далее теоремы, на основе которой и решается
_ вопрос об устойчивости движения по плоскости скольже­
ния в системе (5.1).
Т е о р е м а *). Для асимптотической устойчивости
движения системы (5.1) в скользящем режиме по плоскости
s = О (II.V ) необходимо и достаточно, чтобы в характе­
ристическом уравнении системы (5.1) при и, равном
*) Аналогичная теорема для системы типа (II.VII) для случая,
когда F (г) = 0, а управление является лишь воздействием по
координате хх, рассматривалась в работах [25, 53].

/
142 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. V

Иэкв, вычисленном npuL условии s = 0, все корни, кроме


корня стап имели отрицательные действительные части.
Покажем прежде всего, что если в систему (5.1) подставить вме­
сто и величину иэкв, вычисленную при условии s = 0, то в резуль­
тате получим линейную систему с постоянными коэффициентами,
у характеристического уравнения которой одни из корней будет
равен сТап. Согласно методу эквивалентного управления нвкв на­
ходится как решение уравнения s = 0 относительно и. Из (5.24)
находим а0кв при условии s = 0:
ii—i
“экв = 2 IcTal ~ ci (cTa")l xi- (5-25)
i=i
Полученное значение нэкв является линейной функцией х,
поэтому в результате его подстановки в систему (5.1) вместо управ-
ления и получим линейную систему с постоянными коэффициента-
ми. Так как уравнения (5.1) и (5.24) эквивалентны, то для опреде­
ления корней характеристического уравнения этой линейной си­
стемы можно рассматривать систему, которая получится в резуль­
тате подстановки иэкв из (5.25) не в (5.1), а в (5.24):

i 1 = Л1!-1 ass,
(5.26)
S = (стап) s.

Обратим внимание на то, что матрица Л 1 в (5.24) является мат­


рицей, которая согласно (И.VI) и (5.2) определяет уравнения дви­
жения в скользящем режиме. Из этой же системы (5.26) видно, что
последнее уравнение не зависит от х\, и следовательно, один из кор­
ней характеристического уравнения системы (5.1) при и, равном
иэкв, вычисленном в соответствии с (5.25), действительно равен стап-
Остальные корни этого уравнения, очевидно, совпадают с корнями
характеристического уравнения системы
±х — Лхх\

которая согласно (5.2) описывает движение в скользящем режиме.


Следовательно, если все корни характеристического уравнения
системы (5.26), кроме корня стап, имеют отрицательные веществен­
ные части, то движение в скользящем режиме асимптотически устой­
чиво. Достаточность условий теоремы доказана. Необходимость
легко доказывается от противного. Действительно, если характери­
стическое уравнение системы (5.26) или системы, полученной в ре­
зультате подстановки вместо и значения иакв согласно (5.25), помимо
(стап) имеет какой-либо корень с неотрицательной вещественной
частью, то движение в скользящем режиме не может быть асим­
птотически устойчиво.
1 3] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 143

Воспользуемся доказанной теоремой для построения


системы с переменной структурой, в которой плоскость
переключения является плоскостью скольжения, а дви­
жение в скользящем режиме вдоль этой плоскости устой­
чиво. В такой системе, описываемой уравнением (5.1)
с управлением (5.6), должны выполняться условия (5.8),
(5.9) и при и, равном uaKBl все корни характеристического
уравнения, кроме одного, равного стап, должны иметь
отрицательные действительные части. Обратим внимание
на то, что при выполнении условий существования плос­
кости скольжения (5.9) величина uaKB в (5.25) будет
являться линейной комбинацией не всех, а лишь к ком­
понент вектора х :
к
Иэкв = — {стЪ)~х 2 [ста1 — сх (стап)] xv (5.27)
г= 1

Предположим, что для некоторого линейного управ-


Кг!Ч|
ления и = (Y ;=const, 1 ^ п — 1) один из
г—1
корней характеристического уравнения системы (5.1)
является действительным и равен а у остальных дей­
ствительные части отрицательны. Тогда, приравнивая
коэффициенты при соответствующих х ( в эквивалентном
управлении (5.27) к коэффициентам величину (сг ап) —
к Я и добавляя к этим соотношениям условия (5.9), полу­
чим следующую систему уравнений:

ст(а1-|- by{) — Ci% = 0 (i = l , . . . , к),


cTal — c(X = 0 (г == к - f - 1, . . . ,п — !)/• (5.28)
cTan — X = 0 .

Решение этой системы n уравнений относительно п - 1


переменных сх, ■ • сп_х (напомним, что сп = 1) и по­
зволяет найти уравнение плоскости скольжения с устой­
чивым движением. Для выяснения вопроса о существова­
нии решения системы (5.28) обратимся к вспомогательной
системе из п уравнений относительно п переменных сх,
си • • •,
ст М * - ХЕ) = 0, (5.28а)

V
144 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. У

где А * = А + by, у — тг-мерный вектор-строка, первыми


к элементами являются коэффициенты а ос­
тальные п — к элементов равны нулю. Очевидно, что если
существует решение системы (5.28а), у которого сп — 1,
то существует и решение системы (5.28). Так как к явля-'
ется собственным числом матрицы А *, то система (5.28а)
имеет нетривиальное решение. Если в этом решении спф
Ф 0, то найдется также и решение, у которого сп = 1.
Это означает, что решение системы (5.28), вообще говоря,
существует. Таким образом, задача синтеза системы с пе­
ременной структурой с устойчивым движением по плоско­
сти скольжения сводится, во-первых, к нахождению
какого-либо линейного управления, при котором все кор­
ни характеристического уравнения, за исключением, быть
может, одного, имеют отрицательные вещественные части,
во-вторых, к определению коэффициентов плоскости пере­
ключения из системы (5.28) и, в-третьих, к выбору раз­
рывных коэффициентов в управлении (5.6) в соответствии
с неравенствами (5.8) *). Решение первой задачи облег­
чается с увеличением числа к или количества свободных
параметров у£, с помощью которых достигаются требуемые
значения собственных чисел матрицы А *, но при этом
усложняется управляющее устройство системы с пере­
менной структурой, формирующее управления (5.6)
в виде суммы воздействий по к координатам с разрывными
коэффициентами. Для к = п — 1 условие существова­
ния плоскости скольжения (5.8), (5.9) будет содержать
только’ неравенства. Если на коэффициенты а £ и (3£ не
наложено никаких ограничений, то все с, в уравнении
плоскости скольжения могут быть выбраны произвольно,
и поэтому вопрос об устойчивости движения в скользя­
щем режиме, описываемом уравнением (5.1), решается
с помощью разработанных в линейной теории критериев.
Щ Проиллюстрируем описанный метод нахождения управ­
ления, которое обеспечивает существование плоскости
скольжения с устойчивым движением на примерах систем
с переменной структурой третьего и четвертого порядков.
Вновь рассмотрим систему, описываемую уравнениями
(5.10), (5.11), (5.12). Убедимся, что для такой системы

*) Мы исключаем из рассмотрения вырожденный случай,


когда произведение стЬ окажется равным нулю.
§ 3] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 145

всегда можно найти плоскость скольжения, в которой


движение устойчиво. Согласно изложенному выше ме­
тоду при и, равном у#!, найдем корни характеристиче­
ского уравнения системы (5.10)
Р3 = у. (5.29)
Корни уравнения (5.29) соответственно равны

Ч = V~4 > о,

Чз = 3
/ т ( - 4 “ ± J Т 5). R e (Ч з ) < о ,

и при любом у ]> 0 характеристическое уравнение системы


(5.10) имеет только один корень в правой полуплоскости.
Это означает, что в рассматриваемой системе коэффициен­
ты уравнения плоскости скольжения с устойчивым дви­
жением могут быть найдены в соответствии с уравнениями
(5.28), которые в нашем случае имеют вид

ci Vy - У,
С1 3 г- (5.30)
V =

Из (5.30) следует, что сх = у2/», с2 = у1/». (Разумеется,


при этом должны выполняться условия (5.13), т. е. а > —у,
Р< -т .)
Рассмотрим теперь пример системы четвертого поряд­
ка, движение которой описывается уравнениями

Т-г — 'f'i+l (^ — ^ ^))


(5.31)
Ж4 = U.
Пусть управление и является воздействием лишь по
координате (т. е. к = 1):
а при ацяЧО)
4
и = — Тяь ЧГ =
Р при £iS<[0, S= 2 cixU С4 = 1.
г= 1
(5.32)
В соответствии с описанной процедурой найдем при
и — ух± корни характеристического уравнения р 4 = у
146 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. V

системы (5.31), если у ?> 0:

^1,2 = db ^3,4 — + 7 V 'Т•


Очевидно, что в этом случае нельзя выбрать три корня'
с отрицательной действительной частью. В связи с этим
попытаемся обеспечить существование плоскости? сколь­
жения с устойчивым движением, формируя управление
и в виде суммы воздействий по х г и х2:

и = — vF1a;1 — vF2a:2, 1
_ fax при X !S > 0 , [а* при a?2s > 0, (5.33)
1 1 при Sj.s <С 0, 2 — 1 ра при x 2s < 0. ]

Составим теперь для и = ург^ + уая;а характеристическое


уравнение системы (5.31)
Pi — ЪР — Vi = 0. (5.34)

Если ух = гггг, у, = г2 — гх (rlt г2 — const), то урав­


нение (5.34) представимо в виде

(Р — га) (р3 + г2р2 + ?\2р + гх) = 0. (5.35)

При гх ?> 0, г2 ?> 0 и г\ ?> гг все корни уравнения (5.35),


кроме одного (X = г2), имеют отрицательные действитель­
ные части. Это означает, что для нахождения коэффициен­
тов плоскости скольжения с устойчивым движением мож­
но воспользоваться уравнениями (5.28), записанными
применительно к системе (5.31):
Ti — С\Х = о, с1-\-у2. — СгХ = 0, с2 — с3Х = 0. (5.36)
Подставляем в (5.36) значения у2 и X, выраженные
через гх и г2, получаем = гх, с2 = г2, с3 = г2. Коэф­
фициенты а х, рх и а2, Р2 следует выбрать с учетом найден­
ных значений c t в соответствии с (5.8).
Замечание. Описанный выше метод синтеза
основывался на определении такого линейного управле-
и
ния и — 2 7ixi> при котором в характеристическом уравне-
j=i
нии системы п — 1 корень имеет отрицательные действи­
5 3] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 147

тельные части. Процедура синтеза предполагала, что


в собственном векторе ст матрицы Л *, или в решении си­
стемы (5.28а) компонента сп отлична от нуля. В тех слу­
чаях, когда сп = 0 и отличен от нуля один из коэффи­
циентов сд-+1, . . ., сп- 1; для использования этой про­
цедуры нужно перенумеровать координаты вектора х ,
присвоив номер п той из них, которой соответствует от­
личный от нуля коэффициент сг (г = к + 1, . . ., п — 1)
в векторе с. (Естественно, что условия существования
плоскости скольжения (5.8) и (5.9) должны быть записаны
в соответствии с новой нумерацией.)
Покажем теперь, что если в решении системы (5.28а)
все ct (г = к - f 1, . . ., п) равны нулю и отличны от нуля
какие-либо из коэффициентов сг, . . ., с1п то для сущест­
вования плоскости скольжения с устойчивым движением
достаточно в управлении иметь воздействия с разрывными
^коэффициентами не по к, а по к — 1 координате. Пусть
отличным от нуля является коэффициент ск, который
к—1
[можно принять равным единице, т. е. s = xk + 2 cixi (если
[ ' i= l
ck — 0 и отличны от нуля какие-либо из коэффициентов
сг, . . ., Сд-х, то перенумеруем первые к координат вектора
х так, чтобы ск стало отличным от нуля). Запишем анало­
гичные (5.24) уравнения, определяющие поведение систе­
мы в пространстве x lt . . ., хк-и хк+1 , . . ., х п, s:

£г— А х г-{- ass + bu,


П
s = (стак) s + 2 lcT(li — сг (стаА*)] + (стЬ) и. (5.24а)
г=1
1т*А*

Нее элементы в (5.24а) вычисляются по процедуре, ко­


торая позволила найти элементы в (5.24), х х — (п — 1)-
мерный вектор с компонентами хг, . . ., хк- х, хк+1 , . . .
. . ., х п.
к к—г
Так как при и = 2
i= l
Ъхг или и = Tfcs + 2
t= l
(Ti— ciT&) xi
вектор ст и величина А. являются собственным векто­
ром и собственным числом матрицы ^4*, то последнее

, 7
148 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. V

уравнение в (5.24а) имеет вид s — Xs, т. е.


стак + {стЬ)ук = X,
ста{ — с-х{стак) — — (сть) (yi — cfik) (i = 1 , . . ., к — 1), ,
ста{ — q (стак) = 0 (i = к 1 , . . . , п).
Последняя группа равенств означает, что уравнение для
s в (5.24а) при произвольном и можно переписать следую­
щим образом:
к—1
s = (стак) s + 2 [cTai — с{ (aTafc)] хг (стЪ) и.
1—1
Тогда плоскость s = 0 есть плоскость скольжения, т. е.
для любой ее точки выполнены условия (1.9), если
k—1
и = — 2 Ч 'л — б„,
г=1
_|«Ч ПРИ , _ { бо ПРИ s > ° .
г— \pi при a>iS<)0 11 \— 60 при s < 0 ,
а; сГа* — с{ (стак), Р; ^ ста{ — с{ (стак), (стЪ) б0)> 0.
В рассматриваемой системе иЭКВ, вычисленное при условии
k-i
s=0, и и равное т*5 + 2 (Тг — k)xi отличаются сла-
i= l
гаемым y hs. В результате подстановки этих двух линей­
ных управлений в (5.24а) убеждаемся, что полученные
таким образом линейные системы имеют п — 1 одинако­
вый корень, а отличаться будет только один корень, оп-
k
деляющий поведение координаты s. Так как при и = 2 ТЛ
г=1
совпадающие п — 1 корень этих систем имеют отрицатель­
ные действительные части, то согласно приведенной здесь
теореме движение по плоскости скольжения устойчиво.
Таким образом, если в собственном векторе матрицы
Л *, соответствующем корню X, все сг (i = к -(- 1, . . .
. . ., п) равны нулю, существование плоскости скольже­
ния с устойчивым движением можно обеспечить с помо­
щью управления, состоящего из воздействий по к — 1
координате с разрывными коэффициентами.
Ml ПОСТАНОВКА ЗАДАЧИ 149

Г Л А В А VI
УСТОЙЧИВОСТЬ В СИСТЕМАХ УПРАВЛЕНИЯ ЛИНЕЙНЫМИ
СТАЦИОНАРНЫМИ ОБЪЕКТАМИ
л
§vl . Постановка задачи

При рассмотрении систем управления, состоящих из


нескольких линейных структур, основное внимание было
сосредоточено на условиях существования скользящего
режима на всей границе разрыва, т. е. существования
плоскости скольжения, и на условиях устойчивости дви­
жения вдоль этой границы разрыва. Если за счет соот­
ветствующего выбора коэффициентов уравнения плоскости
скольжения удается наделить движение в скользящем
режиме желаемыми свойствами, в том числе и устойчи­
востью, то задача синтеза будет решена до конца, если
^изображающая точка из любого начального положения
всегда попадает на плоскость скольжения. В построенной
таким образом системе, начиная с некоторого момента
времени, всегда начнется и не прекратится движение
скользящем режиме.
В этой главе будет рассмотрен вопрос об устойчивости
систем такого типа в предположении, что в пространстве
координат системы существует плоскость скольжения
с асимптотически устойчивым движением. Очевидно, что
в такой постановке задача об асимптотической устойчи­
вости системы в целом сводится к нахождению условий
попадания *).
Прежде чем перейти к изучению вопроса о попадании
для различных типов систем, структура которых меняется
за счет скачкообразного изменения коэффициентов функ­
ции управления, уточним математическую постановку
задачи. Рассматривается динамическая система (5.1) с уп­
равлением (5.6), в которой плоскость переключения
(II.V) является плоскостью скольжения, т. е. выполня­
ются условия (5.8) и (5.9), и движение в скользящем ре­
жиме, описываемое системой (5.2), асимптотически устой­
чиво. Пусть в начальный момент времени ^изображающая
*) Здесь и в дальнейшем, так же как и ранее, условия попа­
дания изображающей точки на плоскость переключения из произ­
вольного начального положения для краткости будем называть ус­
ловиями попадания.
150 УСТОЙЧИВОСТЬ В СИСТЕМАХ УПРАВЛЕНИЯ [ГЛ. VI

точка не находится на плоскости переключения, т. е.


5 (to) ф о. (6.1)
Задача о попадании сводится к отысканию условий, при,);
выполнении которых всегда найдется такой момент вр&
мени tj, что
s (tj) = 0. (6.2)
Очевидно, что при t в системе будет существовать
движение в скользящем режиме, стягивающееся к началу
координат пространства хг, . . ., х п. Отдельно следует
сказать о случае, когда изображающая точка асимпто­
тически приближается к плоскости переключения, т. е.
lims(£) = 0. (6.3)
f—*00
Убедимся в том, что условие (6.3) позволяет сделать
вывод об асимптотической устойчивости рассматриваемой,
системы.
Движение в скользящем режиме описывается линей­
ными уравнениями с постоянными коэффициентами и по
условию является асимптотически устойчивым, поэтому
устойчивость этого движения будет носить экспоненциаль­
ный характер. Если функция s (t) не превосходит по
модулю некоторой величины Д, то согласно методу экви­
валентного управления решение системы такого типа
будет отличаться по норме от решения уравнения сколь­
зящего режима па бесконечном интервале времени на
величину порядка А. Движение в скользящем режиме
асимптотически устойчиво и в силу условия (6.3) при
достаточно большом t величину Д можно сделать сколь
угодно малой. Это означает, что решение рассматриваемой
системы, у которой изображающая точка асимптотически
приближается к поверхности разрыва, также асимпто­
тически устойчиво. В связи с этим будем считать, что
в случае (6.3) попадание также имеет место, так как из
этого условия, так же как и из условия (6.2), следует
асимптотическая устойчивость системы с переменной
структурой (5.1).
Таким образом, если плоскость скольжения характе­
ризуется асимптотически устойчивым движением в сколь­
зящем режиме, то для асимптотической устойчивости
j 2] НЕОБХОДИМЫЕ УСЛОВИЯ ПОПАДАНИЯ 151

системы следует выбрать такое управление, при котором


выполняется одно из условий (6.2) или (6.3). Ниже будут
рассмотрены условия попадания для различных типов
разрывных систем, состоящих из набора линейных струк­
тур с постоянными параметрами.

§ 2. Необходимые условия попадания


Рассмотрим необходимые условия попадания системы
(5.1), (5.6), состоящей из 2к линейных структур с постоян­
ными коэффициентами, в которой изменение структуры про­
исходит на плоскости s = О (II.V) и координатных плос­
костях Xi = 0 (г = 1, . . ., к).
Задача состоит в определении таких параметров уп­
равления, для которых при начальных условиях (6.1)
выполняется хотя бы одно из условий (6.2) или (6.3).
Так как до момента попадания величина s не меняет
шака, то функция б„ в управлении (5.6) является посто­
янной величиной, равной 60 или — б 0, и в любой момент
времени движение системы описывается одной из 2к ли­
нейных систем дифференциальных уравнений
х = A ix ± 5б0, (6.4)
где матрица Ai (I = 1, 2, . . . , 2k) получается в результате
подстановки управления (5.6) при каких-либо фиксиро­
ванных значениях всех Т г (ос£ или (Зг) в уравнение (5.1)
и приведения подобных. Будем в дальнейшем рассмат­
ривать случаи, когда для любого 60 каждая из плоско­
стей x t = 0 (г = 1, . . ., к) не содержит целых траекторий
находящихся в ее окрестности линейных структур. Так
как на плоскостях x t = 0 [i = 1, . . . , к) управление
и не претерпевает разрывов (несмотря на разрывы коэф­
фициентов *Р;) и эти плоскости не содержат целых траек­
торий, то движение изображающей точки по любой из
плоскостей x t = 0 (г = 1, . . . , & ) в скользящем режиме
или в силу уравнения одной из структур не может
возникнуть. Это означает, что точки, в которых изменя­
ется структура системы на плоскостях x t= 0 (г = 1, . . . , к),
составляют множество нулевой меры и па движение в си­
стеме они пе влияют. Высказанные здесь соображения
означают, что исследование поведения системы до момента
попадания может быть проведено лишь на основе урав­
152 УСТОЙЧИВОСТЬ В [.СИСТЕМАХ [УПРАВЛЕНИЯ £ГЛ. VI

нений (6.4) (например, с помощью метода припасования),


Сформулируем и докажем необходимые условия по­
падания для системы (5.1), если все матрицы A t являются
невырожденными и характеристическое уравнение'- ка$?
дой линейной структуры не имеет кратных корней.
Теорема. Для попадания изображающей точки
на плоскость переключения необходимо, чтобы для каждой
структуры собственные векторы, соответствующие поло­
жительным действительным корням ее характеристи­
ческого уравнения, и точка равновесия х = =F не
принадлежали области определения этой структуры.
Областью определения структуры будем называть та­
кую область в пространстве хх, . . ., х п, в которой дви­
жение системы описывается уравнениями этой структуры.
Докажем теорему методом от противного. Предположим, что
характеристическое уравнение одной из структур (6.4) имеет дей,
ствительный корень X и соответствующий этому корню собственны;-
вектор w с компонентами wi, . . ., wn принадлежит области опреде
ления этой структуры. Так как эта область определяется знаками
координат zi (i = 1, . . ., ft) и функции s = сТх, то сделанное пред­
положение означает, что j
>
sign s = sign cTw, sign Wj = sign (i = l , . . . , / c ) (6.5)

(wi фО (£ = 1 , . . . , k), так как в противном случае одна из поверх­


ностей Х{ — 0 (г = 1, к) содержала бы целые траектории, если
б0 = 0.) Пусть вектор начальных условий совпадает с вектором иДр
+ Aip1660 и ||ш|| бо, тогда движение в системе будет определяться
соотношением
х == wext + АД Ь60. (6.6)

В соответствии с (6.6) найдем функции s и х\ (i = 1, . . ., к):

s = (cTw стА А Ь60) eXi,


®i = ицех( + б0,

rj — элементы вектора ф Афд0. Так как стго п щ (г= 1, . . . , к) от-'


личны от нуля и ||w || 50, то согласно (6.5) и (6.7) при таких
начальных условиях величины ад и s знака не [сменят, т. е. структу­
ра системы останется неизменной на бесконечном интервале вре­
мени и при этом l i m s = o o . Это означает, что попадание в системе,
t—>СХ>
не будет иметь места.
Если же нарушается второе условие теоремы, т. е. точка равно­
весия какой-либо структуры находится в ее области определения,
\2] НЕОБХОДИМЫЕ УСЛОВИЯ ПОПАДАНИЯ 153

ю при начальных услошшх, совпадающих с этой точкой, система


будет находиться в покое и попадание также не будет иметь места.
Таким образом, при нарушении условий теоремы удается найти
начальные условия, при которых не происходит попадания изо­
бражающей точки на плоскость s = 0. Это и доказывает необхо­
димость сформулированных в теореме условий, так как под усло­
виями попадания подразумеваются условия, при выполнении кото­
рых изображающая точка попадает на плоскость переключения из
любого начального положения.
Покажем, что при выполнении сформулированных
здесь необходимых условий попадания в системе либо
произойдет изменение ее структуры, либо изображающая
точка попадет на плоскость скольжения.
Если все корни характеристического уравнения ка­
кой-либо структуры имеют отрицательные действитель­
ные части, то все траектории стягиваются к точке равно­
весия, которая по условию теоремы не лежит в области
определения данной структуры, и поэтому произойдет из­
менение структуры системы *). Если же помимо корней с от­
рицательной действительной частью имеются комплексные
горни с положительной или нулевой вещественной частью,
у) величины x t и s являются функциями знакопеременным
г, следовательно, структура системы изменится. И, на­
конец, если среди корней имеются корни с положитель­
ной действительной частью, но соответствующие им соб­
ственные векторы не лежат в области определения рас­
сматриваемой структуры, то траектории изображающей
точки будут приближаться к этому собственному векто­
ру **) и, следовательно, структура системы также изме­
нится.
Таким образом, если при выполнении необходимых
условий попадание не имеет места, то изображающая
точка будет совершать колебания относительно одной
или нескольких плоскостей x t = 0 (г = 1, . . ., ft), а струк­
тура системы не может оставаться неизменной.
Вопрос о том, являются ли необходимые условия од­
новременно и достаточными, остается открытым. Автору
йеизвестны ни доказательство достаточности, ни примеры,
*) Сделанное ранее предположение о том, что все матрицы A i
являются невырожденным, исключает появление нулевых корней.
**) Исключение составляют лишь случаи, когда действитель­
ная часть комплексных! корней превосходит действительные поло­
жительные корни, но для таких случаев, как мы только что отметили,
структура системы также должна измениться.
154 устойчивость зз систем ах уп гаёл ей и я [ г л . VI

в которых при выполнении необходимых условий попа­


дание не имело бы места.
З а м е ч а н и е . Покажем, что необходимые условия попада­
ния, о которых говорится в сформулированной выше теореме,
ляются одновременно и достаточными для системы второго порядка.
Перепишем уравнения (II.V), (5.1), (5.6) для случая п — 2, к =
£ ~ ЯП.Т'1 -f- IZ12X2 -(- 6llt,
£ 2= aai-Ti -}- яц2X2 + bait ,

Га при xis )> 0,


it = — Y xi, Y =
{
((3 при xis<0 (s = cxi + ха).
Коэффициенты с, а, п р выбраны таким образом, чтобы движение
в скользящем режиме было устойчивым и на прямой s = 0 всегда
существовал скользящий режим *):
(cTb) a )> cTax — ci (cTa~),
(cTb) 3 > cTal — ci (cTa2).

Пусть для каждой из двух линейных структур (при Чг = а жав1


при Y = 3) собственные векторы положительных действительны!
корней характеристического уравнения (если такие корни суще­
ствуют) не лежат в области ее определения. Докажем, что в этом!
случае изображающая точка из любого начального положения всег-‘
да попадает на прямую s = 0. ■*
Не нарушая общности рассуждений, можно рассмотреть лишь
случай s (t0) > 0. При движении системы до момента попадания
величина s положительна и структура системы может меняться лишь
при изменении знака хх. В момент изменения структуры хх = О
и так как s = с1х1 -j- х2 > 0, то в этот момент величина х2 положи­
тельна. Из уравнения £х = ап хх -(- а12х2 — bVx1 следует, что при
хх = 0 скорость £х всегда совпадает по знаку с а12**), и поэтому
структура системы при s > 0 может измениться не более одного раза.
Рассмотрим движение в системе, соответствующее какой-либо
одной фиксированной структуре.

*) Обратим внимание на то, что выписанное здесь условие


скользящего режима в отличие от_, (5.8) имеет вид строгих нера­
венств и в управлении отсутствует релейная компонета 6и, кото­
рая обеспечивала возникновение скользящего режима в начале ко­
ординат, где Y xi = 0 и при би = 0 равна нулю величина s. Если же,
а и В выбраны таким образом, что попадание всегда имеет место, то
необходимость в компоненте 6и отпадает, так как при малых откло­
нениях от прямой переключения в начале координат изображающая
точка либо за конечное время попадет на эту прямую и по ней вер­
нется в начало координат, либо будет приближаться к началу коор­
динат асимптотически.
**) Если а12 = 0, то прямая хх = 0 содержит целую траекторию,
а этот случай мы исключили из рассмотрения.
§3] ДОСТАТОЧНЫЕ УСЛОВИЯ ПОПАДАНИЯ 155

В соответствии с проведенными в этом параграфе рассуждения­


ми при выполнении необходимых условий попадания изображаю­
щая точка либо попадает па прямую переключения, либо покидает
область определения этой структуры и в системе начнется движение,
уписываемое уравнениями второй структуры. И для этого движения
«шже можно утверждать, что изображающая точка либо попадет
на прямую переключения s = О, либо покинет область определения
второй структуры. Как было установлено выше, при s >■ 0 струк­
тура системы второй раз измениться не может, поэтому после пер­
вой смены структуры (если она будет иметь место) изображающая
точка всегда попадет на прямую переключения. Достаточность
условий теоремы о нопадении для системы второго порядка до­
казана.
Отметим, что для систем третьего порядка вида (II.VII) не­
обходимые условия теоремы также являются достаточными. Дока­
зательство этого утверждения приводится в работе [58].

§ 3. Достаточные условия попадания в системах


произвольного порядка
v Рассмотрим теперь вопрос об. устойчивости систем
с переменной структурой произвольного порядка, дви­
жение которых описывается системой дифференциальных
уравнений (5.1) с управлением (5.6)/ ‘по-прежнему считая,
что плоскость переключения (II.V) является плоскостью
скольжения, т. е. справедливы соотношенияТ(5.8), (5.9)
и движение в скользящем режиме устойчиво. Как уже
отмечал ось’’ ранее, вопрос об устойчивости движения та­
кой системы сводится к отысканию условий попадания
изображающей точки в пространстве координат системы
на плоскость s ]> О.'
В настоящем параграфе для систем управления объек­
тами с постоянными параметрами приводятся достаточ­
ные условия попадания, накладываемые на выбор коэф­
фициентов закона управления (5.6), которые окажутся
более си льны м по сравнению с необходимыми условиями
.попадания, найденными в § 2. Эти условия для различ­
ных типов систем с переменной структурой сформулиро­
ваны в следующих теоремах.
Т е о р е м а 1. Если в системе (5.1), (5.6) плоскость
s = 0 является плоскостью скольжения, то неравенство
( 6 . 8)

является достаточным условием попадания.


156 УСТОЙЧИВОСТЬ [В СИСТЕМАХ УПРАВЛЕНИЯ [ГЛ. VI

Для доказательства теоремы рассмотрим первую производную


от функции 5 по времени. После дифференцирования функции s,
замены производных от координат системы их значениями из урав­
нений (5.1) и приведения подобных с учетом того, что xn — s —
71 —‘1 М

— ^ с р ч , получаем /
i=i
к
s = (сТa 1) s + ^ l®7 ®* ~ сг (сТа") — (сГЬ) T j] a-j -|-
i=l
n —1

+ ^ [ ^ — сг (с7®71)] я-Ч— (cT6) 6U. (6.9)


i=fc+l
Пусть в начальный момент времени величина s положительна
(общность рассуждений при атом сохраняется). Из условий суще­
ствования плоскостей скольжения (5.8), (5.9), неравенства (6.8)
и (5.6) следует, что при s > 0 правая часть в (6.9) отрицательна, или,
что то же, функция s убывает. Так как скорость убывания s мень­
ше — (стЬ) 60, то эта величина при некотором гх станет равной пулы
и изображающая точка попадет на плоскость скольжения.

Покажем теперь, что если в управлении (5.6) релей­


ная компонента Su отсутствует (а в таких системах, как
отмечалось в § 2, плоскость скольжения также может су­
ществовать), неравенство (6.8) по-прежнему является до­
статочным условием попадания. При 6„ = 0 и выполне­
нии условий скольжения функция а уже не является
строго отрицательной, а лишь неположительной. Для таких
функций существует предел l im s = R, причем R = const,
t-*ao
либо R = — оо. Случай R 0 означает, что в системе
имеет место попадание, так как при этом выполняется
одно из условий (6.2) или (6.3). Рассмотрим теперь случай
R 0, воспользовавшись уравнениями движения (5.24),
эквивалентными уравнениям (5.1). Так как s стремится
к постоянной величине, то lim s — 0. Имея в виду, что ре*
t—
+СО
шение ураввения s = 0 относительно и при s = 0 равно
иЭКВ, из последнего уравнения системы (5.24) получаем
lim и = Пэкв — (стЬ)-1 (стап) R.
t —*o о

В результате подстановки предельного значения и в пер­


вые (п — 1) уравнения системы (5.24) находим уравнение
§3] ДОСТАТОЧНЫЕ УСЛОВИЯ ПОПАДАНИЯ 157

предельного движения в рассматриваемой системе:

хг = Аххх -f- [as — Ъ(cTb)~x (стап)] R.


этом уравнении матрица А 1 определяет уравнение дви­
жения в скользящем режиме (5.2), которое асимптотиче­
ски устойчиво, поэтому
lim ж1 — — {Ах)~х [а* — I (стЪ)~х (ста")] R.
/—*00
Это означает, что в системе имеется отличная от начала
координат точка устойчивого равновесия, которая не при­
надлежит плоскости переключения (так как lim s = R=f= 0),
t —wo

и поэтому характеристическое уравнение одной из струк-


тур должно иметь нулевой корень. Этот случай мы исклю­
чили из рассмотрения (см. § 2), и следовательно, функ­
ция s не может стремиться ни к какому положительному
\числу и попадание всегда имеет место.
Приведем без доказательства теоремы о достаточных
условиях попадания для двух типов систем вида (II.V II).
Т е о р е м а 2. Если в системе с переменной структу­
рой (II .VII) управление сформировано в соответствии
с (5.6) при к = п — 1 и все сг в уравнении плоскости пере­
ключения (II.V) положительны *), то для попадания изо­
бражающей точки на плоскость s = 0 достаточно, чтобы,
во-первых, в характеристическом уравнении системы при
Y j = ctj (i = 1, . . ., п — 1) и 8U = 0 отсутствовали по­
ложительные действительные корни и, во-вторых, выпол­
нялись условия
а 1 ~> — аь —щ (i = 1 , . . . , п — 1). (6.10)
Условия (6.10) всегда можно выполнить за счет соот­
ветствующего выбора коэффициентов а г и р г, а увеличе­
ние коэффициента а х приводит к выполнению первого
условия теоремы. Доказательство теоремы 2 приведено
-в работе [20].
В теореме 3 речь идет об условиях попадания для си­
стемы с переменной структурой вида (II.V II), в которой

*) Положительность коэффициентов с* является необходимым


условием устойчивости любого решения уравнения скольжения
(II.VIII).
158 УСТОЙЧИВОСТЬ В СИСТЕМАХ УПРАВЛЕНИЯ [ГЛ. VI

управление является воздействием по координате со


скачкообразно изменяющимся коэффициентом. Движе­
ние такой системы описывается уравнениями

-5r = ®i+i (i — 1 , . . ., п — 1),
71
(6.И)
i=1
j а при Z iS ^ O ,
\— а при x xs<^0,
6 12)
( .
_ ( — S0 при s > 0 ,
1 б 0 при s < 0; ,

60 — любое сколь угодно малое положительное число.


Т е о р е м а 3. Если в системе (6.11), (6.12) все ct
положительны (а это является необходимым условием y d
тойчивости решения уравнения движения в скользящем ре­
жиме (II.V III)), то всегда существует такое положитель­
ное число ¥ 0, что при а > То, Р — Т 0 изображающая
точка из любого начального положения попадает на плос--
кость переключения s = 0.
С доказательством теоремы 3 можно ознакомиться в мо­
нографии [45].
Согласно этой теореме попадание (а, следовательно, и
устойчивость) может быть достигнуто за счет увеличения
коэффициента воздействия по координате х г. Такой метод
стабилизации системы можно использовать и для случая,
когда в (5.6) используются воздействия по нескольким ко­
ординатам (т. е. k )> 1).
Уместно отметить, что приведенная теорема носит ка­
чественный характер, так как она не позволяет опреде­
лить величину Т-о, а лишь указывает на факт существования
такого минимального воздействия по координате х ъ при
котором достигается устойчивость. Эта теорема может
служить основанием для того, чтобы отказаться от тех
дополнительных требований к объекту или структуре
управляющего устройства, которые были выдвинуты в тео­
ремах 1 и 2, если эти теребованжя невыполнимы или не­
приемлемы в силу каких-либо специфических особенно­
стей функционирования системы.
§1] УРАВНЕНИЯ ДВИЖЕНИЙ 159

Г Л А В А VII
УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ЛИНЕЙНЫХ
НЕСТАЦИОНАРНЫХ ОБЪЕКТОВ

Применение систем с разрывными управлениями для


объектов с изменяющимися во времени характеристиками
также приводит к тому, что движение в скользящем
режиме зависит от уравнений поверхностей разрыва, и
этой возможностью следует воспользоваться для получе­
ния желаемого|характера протекания процессов управ­
ления. Методы синтеза таких систем могут быть получе­
ны в результате естественного обобщения методов, пред­
назначенных для управления свободным движением ста­
ционарных объектов.

§ 1. Уравнения движения и условия существования


плоскости скольжения

В случае, если объект управления является линейным


и нестационарным, а вневтаие воздействия отсутствуют
(т. е. рассматривается свободное движение), то уравнение
системы управления его движением согласно (II.IV ) имеет
вид
х — A (f) х + b (t) и. (7.1)

По-прежнему будем считать, что функция управления


претерпевает разрывы на плоскости s = стх = О (II.V)] и,
следовательно, движение в скользящем режиме будет
описываться системой уравнений (п — 1) порядка

х1 = А 1х 1, (7.2)

-где параметры матрицы А 1, зависящей от А , ст и Ь, опре­


деляются из соотношений (II.V I). Заметим, что уравне-
ния (II.V I) получены исходя из того, что к рассматривае­
мой системе применим метод эквивалентного управления,
т. е. величина стЪ отлична от нуля.
Предположим, что, несмотря на переменность коэффи­
циентов матрицы А 1, за счет выбора вектора ст решение
системы (7.2) удовлетворяет всем требованиям, предъяв­
ляемым к процессу управления. Попытаемся и в этом
160 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ЛИНЕЙНЫХ ОБЪЕКТОВ [ГЛ. VII

случае найти такое управление и, чтобы выбранная плос­


кость переключения оказалась плоскостью скольжения и
в системе имело место попадание. Эту задачу будем ре­
шать при условии, что параметры объекта недоступны
для измерения, как это часто бывает на практике, и извес­
тен лишь диапазон их изменения

(7.3)

ГДе d ij mini & ij maxi min» шах ПОСТОЯННЫе ВвЛНЧИНЫ.


Будем также считать, что знак отличной от нуля функции
стЪ не меняется и известен, причем inf |стЪ |=£= 0.
Попытаемся обеспечить существование плоскости
скольжения с помощью управления (5.6), которое исполь­
зовалось для управления свободным движением линей­
ных стационарных объектов.
Функция ё, позволяющая на основе (1.9) получить
условия скольжения, для системы (7.1), (5.6) будет иметь
тот же вид (5.7), что, и для системы (5.1) с той лишь разни­
цей, что векторы аг и Ъ в (5.7) изменяются во времени.
Однако условиями существования плоскости скольжения
(5.9) уже не удается воспользоваться для нестационарных
систем. Действительно, параметры объекта, по нашему
предположению, неизвестны, и поэтому условия (5.9),
являющиеся точными равенствами, не могут быть выпол­
нены. Кроме того, даже если бы эти параметры удалось
измерить в процессе управления и затем изменять коэф­
фициенты вектора ст в соответствии с (5.9), функция s
должна была бы содержать производные от сг повремени
и, следовательно, условия (5.8) и (5.9), полученные из
(5.7), оказались бы неправомерными.
В связи с этим для управления нестационарными объек­
тами представляется целесообразным составить такую
функцию управления, при которой условия существова­
ния плоскости скольжения состоят лишь из неравенств.
Такая ситуация, как это следует из (5.8), (5.9), будет
иметь место, если управление (5.6) состоит из суммы воз­
действий по (п — 1)-й координате, т. е. к — п — 1. В этом
случае равенства (5.9) отсутствуют, условия (5.8) следует
записать с учетом переменности коэффициентов элементов

\
J
HI Условия УСТОЙЧИВОСТИ 161
матрицы А (t) и вектора Ъ (t):
(sign сЧ ) а; > sup |с Ч |-1 [ста1 — с{ (стап)],

(sign сЧ ) inf |с Ч I'1 [ста* — с{ (ста”)] (1 = 1 , . . . , га— 1).

(7.4)
Имея в виду, что параметры системы изменяются
в ограниченном диапазоне (7.3), знак функции (стЪ) из­
вестен и inf|cT5| ф 0, условия существования плоскости
скольжения всегда можно выполнить, выбирая в соответ­
ствии с неравенствами (7.4) коэффициенты а г и р< линей­
ных структур системы.

§ 2. Условия устойчивости
Для системы (7.1) так же, как и для стационарных
систем, вопрос об устойчивости будем рассматривать
в предположении, что плоскость переключения является
плоскостью скольжения с устойчивым движением. Тогда
задача сводится к определению условий попадания.
В системе (7.1) с управлением (5.6) при к = га — 1 и
выполнении условий существования плоскости скольже­
ния (7.4) изображающая точка из любого начального
положения попадает на плоскость s = 0, если
sup(cTan) < 0 . (7.5)
t
Доказательство этого утверждения может быть прове­
дено с помощью тех же рассуждений, что и доказательство
теоремы 1 в § 3 главы 6. Очевидно, что при сделанных
предположениях условие (7.5) является условием устой­
чивости системы (7.1).
Рассмотрим теперь задачу о попадании в системе
(7-1), если в управлении (5.6) отсутствует релейная со­
ставляющая 6„.
Поясним, почему в системе с управлением (5.6) нри
к = га — 1 эту составляющую можно исключить. Если
в (5.6) к < га — 1, 6и = 0 и в условиях существования
плоскости скольжения (5.8), (5.9) неравенства (5.8) заме­
нены строгими равенствами, то согласно (5.7) величина
в обращается в нуль на многообразии пересечения

6 В4 И, Уткин
162 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ЛИНЕЙНЫХ ОБЪЕКТОВ [ГЛ. VII

X; = 0 (i = 1, . . к), s = 0. Введение в управление функ­


ции 6„ и было обусловлено необходимостью обеспечить
скользящий режим на этом многообразии. В случае, когда
в такой системе к — п — 1, скользящий режим существу­
ет на всей плоскости, за исключением, быть может, начала
координат. Это означает, что если изображающая точка
всегда попадает на плоскость скольжения, то необходи­
мость введения релейной составляющей 8и в управление
отпадает *). (Напомним, что такие же соображения ис­
пользовались в § 2 главы 6 при изучении вопроса о попа­
дании в системах второго порядка, у которых в управле­
нии также отсутствовала функция 6и.)
Таким образом, плоскость переключения в системе
(7.1) с управлением (5.6) при би = 0 и /с = га — 1 будет
плоскостью скольжения, если условия (7.4) являются
строгими неравенствами и выполняется условие попада­
ния. Докажем, что для такой системы в случае
det А ф 0 неравенство (7.5) также является достаточным
условием попадания. Для этой цели запишем уравнение
(6.9) применительно к нашему случаю:
•г—1
s = (стап) s + 2 № - q (стап) - (стЬ) ТД хь (7.6)
i=l
где все Wi определяются из (5.6).
Пусть в начальный момент времени s 0. Тогда при
выполнении условий (7.4) и (7.5) до момента попадания
величина s является неположительной. Для таких функ­
ций существует lim s = R, причем либо R = const, либо
/—кх
R = — оо. Случай означает, что имеет место попа­
дание, так как при этом выполняется одно из неравенств
(6.2) или (6.3). Если же lim s = . f f > 0 , то lim а = 0, и из
t — *00 t— * 0 0
(7.6) с учетом того, что условия (7.4) имеют вид строгих
неравенств, получаем Н т 1; = 0 (i = l , . . . , r a — 1) и^
/—►
со

*) Если же условия попадания нарушаются, то, как свиде­


тельствует пример второго порядка, фазовый портрет которого
представлен на рис. 13, изображающая точка в скользящем режиме
приближается к началу координат, а затем при сколь угодно ма­
лом отклонении от прямой переключения может уйти в бесконеч­
ность.

I/
J2] УСЛОВИЯ УСТОЙЧИВОСТИ 163

'« —1
следовательно, lim хп = lim Is — 2 СЛ ] = R ф 0, lim и =
t —*СО f — >ОС \ * t~*oo
n—1
= lim 2 = 0. Однако по условию det A =f= 0, и поэто-
г-°° i=i
му в системе (7.1) при и = 0 не может быть положения равно­
весия на оси х п, т. е. случай R О невозможен и попада­
ние всегда имеет место. Если же det А может обращаться
в нуль, то для получения условия попадания нужно усло­
вие (7.5) заменить строгим неравенством. Доказательство
этого утверждения очевидно, так как при s О величина
s в такой системе строго отрицательна.
В заключение приведем без доказательства условия
попадания для системы, движение которой описывается
в пространстве какой-либо координаты и ее производных
уравнениями (II.V II) с изменяющимися в ограниченном
диапазоне коэффициентами аг (t).
Если в системе (II.V II) с управлением (5.6) при к =
= п — 1 плоскость переключения является плоскостью
скольжения, то для попадания изображающей точки на
эту плоскость достаточно, чтобы

О; > inf Я; (*),


t
P i^ — su pец(£) (i = l , . . . , п — 1), (7Л )
i
inf an (t) !> 0.
(

Если же в управлении (5.6) отсутствует релейная со­


ставляющая 6ц, то для получения условий скольжения
условия (7.7) заменить строгими равенствами. Доказа­
тельство этих утверждений приводится в 199].
Для систем тина (II.V II) с переменными параметрами
справедлива теорема 3 из § 3 главы 6. Приведенное в [45]
доказательство этой теоремы целиком сохраняется и для
случая, когда параметры объекта меняются. Согласно ус­
ловиям теоремы всегда найдется такое положительное
число ¥ 0, что при ах > Чг0, р — Ч; 0 будет иметь место
попадание.
Напомним, что наиболее привлекательной с практиче­
ской точки зрения особенностью систем типа (II.V II),

<s*
164 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ [ГЛ VIII

у которых управление формируется из какой-либо коор­


динаты и ее производных, является независимость сколь­
зящих движений, описываемых уравнениями (II.'VIII),
от переменных параметров объекта.

Г Л А В А VIII
УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ
ЛИНЕЙНЫХ ОБЪЕКТОВ

Хорошо известно, что всякая реальная система автома­


тического управления функционирует в условиях воздей­
ствия на нее внешней среды. Это воздействие может про­
являться в виде задающего воздействия, которое должно
быть тем или иным образом отработано системой, а также
в виде возмущающих воздействий самого разнообразного
характера, приложенных к различным точкам системы
управления. Обеспечение нормального функционирова­
ния системы управления часто осложняется тем, что
возмущающие воздействия бывает невозможно из­
мерить.
Однако при проектировании системы управления, как
правило, имеется некоторая априорная информация о воз­
мущающих воздействиях, которая позволяет синтезировать
систему, выполняющую поставленные перед ней задачи
без непосредственного измерения возмущающих воз­
действий.
В этой главе будут рассмотрены задачи управления
объектом, к которому приложены внешние воздействия,
и его движение описывается уравнениями (II.IV ). Если
в пространстве координат системы выбрать некоторую
плоскость (II.V ), на которой управление претерпевает раз­
рывы, то на ней может возникнуть движение в скользя­
щем режиме, описываемое уравнениями (II.V I). Уравнения ^
скольжения, как видно из (II.V I), зависят от внешних
возмущений и от коэффициентов уравнения плоскости
переключения. Если с помощью этих коэффициентов
можно обеспечить желаемый характер зависимости реше­
ния от этих возмущений (например, независимость какой-
либо координаты от возмущений, воспроизводимость ре­
гулируемой величиной задающего воздействия и т. д.),
то задача синтеза, как и ранее, состоит в выборе такого

I/
§ 1] КОМБИНИРОВАННЫЕ СИСТЕМЫ УПРАВЛЕНИЯ 165

управления, при котором плоскость переключения являет­


ся плоскостью скольжения и в системе имеет место попа­
дание изображающей точки на нее из любого начального
положения.
Условия скольжения (II.III) для системы (И .IV )
имеют вид
{сЩ и+ > — стАх + cTDF,
(1
стЬ) и~ ■
— стАх + cTDF.
В случае, когда внешние возмущения / 1; . . ., /, доступны
для измерения, эти условия можно выполнить в классе
так называемых комбинированных систем *), в которых
управление составляется в виде функции компонент
векторов х и F. Действительно, всегда найдутся такие
функции и+ и и~ , монотонно возрастающие по модулю
относительно ||х || и ||F ||, при которых указанные здесь
неравенства окажутся справедливыми.
В § 1 настоящей главы приводятся законы управ­
ления, позволяющие определить параметры построенной
таким образом комбинированной системы при посто­
янных и переменных параметрах объекта. Затем будут
рассмотрены случаи, когда внешние возмущения недо­
ступны для измерения, но тем не менее желаемые свой­
ства системы удается обеспечить за счет использования
скользящих режимов.

§ 1. Комбинированные системы управления

В ряде случаев представляется возможность для изме­


рения внешних воздействий F (t), приложенных к объек­
ту. Очевидно, что если измерение внешних воздействий
допустимо, то эту информацию целесообразно использо­
в а т ь при формировании законов управления. Попыта­
емся это сделать, по-прежнему решая задачу синтеза
закона управления в классе систем с переменной струк­
турой.
Рассмотрим систему управления, движение которой
описывается уравнением (II.IV ), с той лишь разницей,

*) Вопросам применения принципа комбинированного управ­


ления в классе систем с переменной структурой типа (II.VII)
посвящены работы [30], [85], [88].
166 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ [ГЛ. VIII

что матрицы A vi D я вектор Ъ — постоянны, т. е.

х = А х + Ъи + D F, (8.1)

где х, A , b, D , F, и — те же, что и в уравнении (II.IV ).


Пусть изменение структуры системы происходит на
плоскости s = стх = 0, а управление сформировано в виде
функции не только координат системы, но и внешних воз­
действий
и = их + ир, (8.2)

где их — функция управления вида (5.6), которая исполь­


зовалась во всех рассмотренных ранее задачах управле­
ния свободным движением, uF — дополнительное управ­
ление, которое является функцией измеряемых возму­
щений

их = — 2
I (8.3)

= - 2
3=1

В (8.3) каждый из коэффициентов и может при­


нимать два значения, и эти коэффициенты изменяются по
следующим логическим законам:
\
«ч при ЩS > 0,

Pi при X'ts < ( 0 • к),


(8.41
°у при fjS > о,

Ру при fjs < о (7 = 1,- ■ *), ,

а функция 8и та же, что и в (5.6).


Покажем, что выбирая соответствующим образом вели­
чины а г, Рг, а|, Р/, можно выполнить условия существо­
вания скользящего режима в любой точке плоскости
s = 0, т. е. сделать ее плоскостью скольжения. Как уже
отмечалось, условия существования скользящего режима
определяются неравенствами (1.9).

J
§ 1] КОМБИНИРОВАННЫЕ СИСТЕМЫ УПРАВЛЕНИЯ 167

Найдем величину s на плоскости s = 0, т. е. при


71'—1
хп ~ 2 CiXi
i= l
к

а= 2№
г=1
- (стап) - (сЩ Yi) ж, +
п—1
+ 2 lcTai — ci (сТйП)1 — {с Щ ьи +
i= k + i
I
+ 2 {c - T d '- i c n y i i l U . (8.5)
i=l
Из (8.2) — (8.5) получаем следующие необходимые и
достаточные условия существования плоскости сколь­
жения:

{стЪ )щ '^ сга1— ci(cTan),


(cTb)JPi < cTal — ci (cTan) (i = l , . . . , f c ) , ^ ^

-c a. = cTan (i = к -f- 1 , . . n — 1),


ci

( Л | « | > Л ', - 1
(cTb ) p { < c V (i = l , . . . , 1). j K' }

Если динамические свойства управляемого объекта


меняются, т. е. матрицы А и D и вектор Ъявляются функ­
циями времени, то к нужно выбрать равным п — 1. Тогда
группа условий в (8.6) в форме равенств отсутствует, ус­
ловия (8.6), (8.7) следует переписать в виде
sign (стЪ) щ !> sup |стЪ|-1 {ста} — q (стап)],
_ t
sign (cTb) Pj inf |cTb |_1 [cTal— (cTan)] (i = 1 , . . . , n — 1),
t
sign (cTb) a{ > sup |cTb |_1 {cTdl),
t
sign (cTb) р{ < ; inf |cTb I-1 (cT<T) (i = 1 , . . . , 1)
t
(8 .8)
168 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ №л. V llt

и на выбор вектора с никаких ограничений не наложено *).


Следовательно, скользящий режим можно организовать
на любой плоскости.
Вопрос об устойчивости комбинированных систем с пе­
ременной структурой, как и ранее, сводится к задаче о по­
падании изображающей точки на плоскость скольжения.
С помощью рассуждений, которые использовались в главах
VI и V II для случая свободного движения, можно убе­
диться, что неравенства
стап О и sup (стап) ^ 0
(
являются условиями попадания и для комбинированных
систем соответственно с постоянными и переменными
параметрами.

§ 2. Описание метода построения системы управления


без измерения возмущений
Мы рассмотрели вопрос о существовании плоскости
скольжения для систем с измеряемыми внешними воздей­
ствиями. Однако очень часто возмущения измерить не­
посредственно не представляется возможным.
Во введении была показана принципиальная возмож­
ность построения систем управления без измерения внеш­
них воздействий в классе систем с переменной структурой
(рис. 3,а ,б , 4, а, б, в). Воспроизводимость регулируемой
координатой задающего воздействия и независимость от
возмущения обеспечивались за счет скачкообразного из­
менения коэффициента воздействия по выходной коорди­
нате объекта и исполнительного устройства. Эта идея
была широко использована при разработке законов
управления вынужденным движением управляемого объ­
екта. Первоначально она применялась для управления
возмущенным движением объекта, описываемого уравне­
нием относительно ошибки и ее производной, в условиях,
когда возмущающие воздействия изменяются заранее не­
предвиденным образом и недоступны для измерения

*) Как отмечалось в главе VII, для случая к — п — 1 из уп­


равления (8.2) можно исключить релейную составляющую 6и, если
условия для оц и в (8.8) имеют вид строгих неравенств и выпол­
няются условия попадания.
*2] ОПИСАНИЕ МЕТОДА 169

[87, 97, 98]. Мы сначала для этого частного случая опишем


идею построения системы без измерения возмущений,
а затем в § 3 будут получены расчетные соотношения,
позволяющие выбрать параметры управляющего устрой­
ства. Обобщение предлагаемого подхода для систем об­
щего вида (II.IV ) приводится в § 4.
Сущность разработанного в [87, 97, 98] метода удобнее
всего описать с помощью структурной схемы системы
управления, представленной на рис. 14. Здесь О — уп­
равляемый объект, И У ■ — исполнительное устройство,
F — сумма приведенных
ко входу объекта внешних
возмущений *), х ж у —
выходные координаты
объекта и исполнитель­
ного устройства соответ­
ственно, и — управление.
Целью управления яв­
ляется сведение к нулю
координаты х при нали­
чии неконтролируемых
возмущ ений^(t). Для этой
цели нужно так организо­ Рис. 14.
вать управление, чтобы
выходная величина И У равнялась с обратным знаком
сумме приведенных ко входу объекта возмущений. Если
управление и равно функции их, сформированной на
блоке 1 в виде суммы воздействий по координате х и ее
производным с разрывными коэффициентами, то постав­
ленная задача не может быть решена. Действительно,
если предположить, что координата х тождественно
равна нулю, то равно нулю и управление и. Очевидно,
что при нулевом управлении отличное от нуля возмуще­
ние, вообще говоря, выведет систему из желаемого состоя­
ния. Именно поэтому в комбинированных системах с пе­
ременной структурой в управление было введено допол­
нительное воздействие uF, которое парирует влияние
возмущений. В нашем случае F (t) измерить нельзя, од­
*) Для следящей системы задающее воздействие, которое дол­
жно отслеживаться регулируемой величиной, также следует при­
вести ко входу объекта и рассматривать его как возмущающее воз­
действие по отношению к координате ошибки.
170 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ [ГЛ. VIII

нако информация о возмущении может быть получена


с помощью выходной величины исполнительного устрой­
ства, которая, по крайней мере в желаемом режиме,
когда х (t) = 0, равна — F (t). В связи с этим функция
управления в отличие от комбинированных систем фор­
мируется в виде суммы их и некоторой функции uv, состав­
ленной на блоке 2 из воздействий по координате у и ее
производным со скачкообразно меняющимися коэффици­
ентами:
и = их + ич. (8.9)

Функция их в (8,9) выбирается так, чтобы при свободном


движении (т. е. при F = 0) за счет скользящих режимов
координата х стремилась к нулю желаемым образом.
Движение И У описывается уравнениями
т—X
у(т) -J- ^ = U, di — const. (8.10)
i—О
Как только что отмечалось, воздействие uv формируется
в виде
т -1
uv = _ 2 T fy (i), [(8.11)
i=0
где Wi — разрывные коэффициенты, скачкообразно меня­
ющиеся на некоторой границе разрыва s = 0.
С учетом (8.11) движение И У можно описать уравне­
нием
т -1
У (т ) + 2 № + ‘F f) У {1 ) = « х,
г—0
причем, если
f — d, - f В при у (г)0 о , 8 12)
( .
\ —dj — В при y^s<C 0 (.В — const),
то
7П—1 С В при г/^>s Д> 0,
2 = их,
г~0 l— при z/<f>s < [0 .
(8.13)

1 /'
§ 2] ОПИСАНИЕ МЕТОДА 171

Движение в скользящем режиме определяется сред­


ними значениями величинY*, заключенными в пределах *)

- Ж Ч 1 ,Ср < Я .
В желаемом режиме координата х и ее производные
равны нулю, следовательно, функция их в (8.13) равна
нулю и выходная величина исполнительного устройства
удовлетворяет соотношению
т—1
\ у ™ \ < В 2 | y (i)|. (8.14)
7=0

Если функция F (t), равная сумме приведенных ко


входу объекта внешних воздействий, также принадлежит
достаточно широкому классу функций (8.14), то за счет
скользящего режима можно обеспечить такие значения
¥?ср, при которых у (г) = — F (г). Это означает, что вы­
ходная координата исполнительного устройства ком­
пенсирует внешние возмущения, что и решает постав­
ленную задачу. Как мы далее убедимся, требуемые
средние значения коэффициентов Yfcp устанавливаются
автоматически, если структура исполнительного устрой­
ства изменяется в соответствии с (8.12). Заметим, что
ограничению (8.14) удовлетворяет довольно широкий
класс функций, например, полиномы любой конечной
степени (начиная с некоторого момента времени), экспо­
ненциальные, гармонические функции, всевозможные их
произведения и т. д. Наиболее существенная особенность
описанного подхода заключается в том, что для его реали­
зации не возникает необходимости в непосредственном изме­
рении приложенных к объекту внешних возмущающих сил;
требуется информация о состоянии управляемого процес­
са в виде выходных величин х — объекта и у — исполни-
' тельного устройства. Уместно также пояснить эффект
компенсации возмущения в такой системе с физической
точки зрения. Введение в управление разрывного воз­

*) Подробно этот вопрос был рассмотрен в разделе I, здесь


лишь напомним, что величина YV получается на выходе инерци­
онного звена с достаточно малой постоянной времени, на вход ко­
торого подается истинное значение TV.
172 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ [ГЛ. V llt

действия по выходной координате И У означает, что в си­


стеме используется исполнительное устройство с пере­
менной структурой, так как знак его обратной связи
меняется в процессе управления. В случае положитель­
ной обратной связи И У оказывается неустойчивым зве­
ном, причем расходящаяся выходная величина И У «спо­
собна догнать» приведенные ко входу объекта внешние
воздействия. Далее в скользящем режиме автоматически
обеспечивается такая последовательность чередования по­
ложительной и отрицательной местной обратной связи,
при которой выходная величина И У отслеживает, или,
что то же, парирует возмущающее воздействие, обеспечи­
вая тем самым желаемый режим в системе.

§ 3. Синтез в пространстве координаты ошибки


и ее производных

Перейдем теперь к выводу расчетных соотношений,


которые позволят реализовать описанный в § 2 подход
к построению системы с переменной структурой, предназ­
наченной для управления вынужденным движением объек­
та с неконтролируемыми возмущениями *). По-прежнему
будем рассматривать систему, представленную на рис. 14,
с исполнительным устройством, описываемым уравнения­
ми (8.9) — (8.13). Пусть движение объекта описывается
линейным уравнением
«—m—1
2 biXW = у F (t), (8.15)
i= 0

где Ъх — постоянные или переменные параметры,

bmin ^ ^ Ьщах (/ — 0 ,. . ., тп, 5min> bmax const).


dtJ
(8.16)
О функции F (t), характеризующей внешние возмущения,
*) Все дальнейшие преобразования, касающиеся синтеза си­
стемы управления вынужденным движением, будут проделаны
в соответствии со способом рассуждений, о котором для случая ис­
полнительного устройства первого порядка рассказал автору ленин­
градский ученый А. И. Красов. Этот способ позволяет проще, чем
это было сделано в работах [87, 97, 98], решить задачу синтеза.
| 3] СИНТЕЗ В ПРОСТРАНСТВЕ КООРДИНАТЫ ОШИБКИ 1?3

предполагается, что опа удовлетворяет условию (8.14),


и следовательно, найдется такая функция времени 0(<),
для которой справедливы условия
m—1
F {m) = е (/.) 2 ^ (i) (О. 10( <) | < (8-17)
г=0
Перейдем от двух уравнений (8.13) и (8.15) к одному урав­
нению n-го порядка. Для этой цели предварительно пере­
пишем уравнение (8.13) следующим образом:
т —1 m—1
у(т) _ 0 (<) 2 = - 2 (J i + 9 (0) y{i) + »*, (8-18)
i=0 i —О
а уравнение (8.15) продифференцируем т раз:
П—ТП+j—1
yti) = х (п -п 1+3) 2 b*i } (£) a:(i) — F U) (£), (8.19)
г=0
7 = 0 , 1 , . . . , /п,

где &i* (£) — зависящие от £>0, . . ., и их производных


коэффициенты, которые согласно (8.16) являются огра­
ниченными функциями времени. Обозначив через хг, . . .
. . ., х п координату ошибки х и (п — 1) ее производные и
подставив в левую часть уравнения (8.18) значения у® из
(8.19), получим систему тг-го порядка, которая согласно
условию (8.17) не зависит от внешнего воздействия F (£):
Xi = x i+1 (i = 1 , . , п — 1),
п in —1
( 8. 20)
лп= — 2 ai(г) хк+ и* — 2 (-FI' + 0(0) у(1).
г=1 г=0
где a-i (t) — ограниченные функции времени, зависящие
от всех Ь*ц и 0(£). Движение в скользящем режиме для
такой системы по любой плоскости скольжения в соот­
ветствии с (II.V III) зависит только от коэффициентов
уравнения этой плоскости, и поэтому, выбирая их над­
лежащим образом, можно за счет введения скользящего
режима свести ошибку к нулю. Задача создания плоско­
сти скольжения для системы (8.20), по сути дела, совпа­
дает с аналогичной задачей, рассмотренной в § 1, так как
174 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ [ГЛ. VIII

координаты (i = 0, . . т — 1) можно считать из­


меряемыми возмущениями. В соответствии с получен­
ными ранее рекомендациями для построения комбиниро­
ванных систем с переменными параметрами коэффициенты
W? должны изменяться согласно (8.13), а функция их —
согласно (5.6) при к = п — 1. Для системы (8.20) первая
группа условий (8.8) перепишется следующим образом:
ai > sup (с{_!— щ — сп_хс{ -Ь anCi),
i
(3 ;< inf (сх_х — at — с„_хсх anc-) (i = 1 , . . . , n — 1).
г
Для Y i вида (8.13) выполняются условия, аналогичные
второй группе неравенств в (8.8) (так как cTb = 1, cTd' =
= 0 (£) и |б ( 0 1 В). Так же как и для комбинированных
систем, условие попадания может быть позаимствовано из
§ 3 главы V I. Применительно к системе (8.20) это усло­
вие запишется в виде sup (сп_х — ап) 0, и его выполне-
(
ние обеспечивает устойчивость системы при любых началь­
ных условиях, если устойчиво движение в скользящем
режиме *).

§ 4. Обобщение для систем произвольного вида


Распространим описанный подход к построению систем
управления вынужденным движением объекта, для кото­
рого внешние возмущения недоступны для измерения, на
системы общего вида (II.IV ). Рассмотрим случай, когда
скалярным является не только управление, но и возмуще­
ние, и поведение системы описывается уравнениями
х* — А * х * - f b*u + d*f (t), (8.21)
где х* — вектор состояния с координатами хх, . . ., x n- lt
у, а — скалярное управление, / (t) — скалярное возму­
щение, A * , b*, d* — матрица и столбцы соответствую­
щей размерности с постоянными или переменными коэф­
фициентами ац (i , / = 1 , . . ., п), b\, di (i = 1 , . . n).
В системе управления, заданной уравнениями (8.21),

*) Если условия существования плоскости скольжения и по­


падания записать в виде строгих неравенств, то согласно главе III
в управлении (8.3) релейную компоненту Ьи можно исключить.
§ 4] ОБОБЩЕНИЕ ДЛЯ СИСТЕМ ПРОИЗВОЛЬНОГО ВИДА 175

уже нет деления на объект и исполнительное устройство.


Однако с физической точки зрения в любой системе, ре
шающей задачу управления вынужденным движением,
должна быть координата, которая парирует действие
внешних возмущений. Если система справляется со сво­
ей задачей, то в этой координате заложена информация
о величине возмущений. Поэтому в тех случаях, когда
эти возмущения недоступны для измерения, целесооб­
разно использовать при формировании функции управ­
ления координату, которая компенсирует их действие.
Именно этот подход и лежал в основе описанного в § 2
метода управления, а выходная величина исполнитель­
ного устройства являлась той координатой, о которой
здесь идет речь. Выберем в качестве такой координаты
компоненту у вектора х * . Пусть величина у входит в одно из
первых (п — 1) уравнений системы (8.21), например, в к-е
уравнение (в противном случае с помощью величины у
не удалось бы влиять на поведение системы в целом), и
кроме того, это уравнение не зависит от управления, т. е.
71— 1

%к — S a*kixi + КпУ "Ь (8.22)


i=l
Введем новую координату
П— 1

хп — 2 alixi + а1пУ + dV- (8-23)


i=l
Далее поведение системы будем рассматривать в прост­
ранстве хх, . . ., х п и характеризовать ее состояние п-мер-
ным вектором х с этими компонентами. (Очевидно, что при
акп =ф= 0 такое преобразование является невырожденным).
По аналогии с предыдущим случаем управление со­
ставим в виде суммы воздействий по (п — 1)-й координате
системы и по выходной координате исполнительного уст­
ройства, роль которой играет величина у *):
П— 1

и= - 2 Ч Г & -Ч Г уу. • (8.24)


________________ i=l
*) Такое управление аналогично управлению (5.6) при к —
= п — 1. В этом случае, как отмечалось в главе III, при выполне­
нии условия попадания (а оно далее будет выписано), нет необхо­
димости в использовании релейной составляющей бц.

V
176 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ [ГЛ. VIII

Коэффициенты воздействий в (8.4) будем изменять скач­


кообразно на некоторой плоскости, заданной в пространст-
ве ) 3*71•
а; при XiS^>0,
xFi =
Pi при X iS < 0 (i = 1 ,. ■.,7i—1),
(8.25)
В при ys )> О,
X
YV =
— В при j/s<^0,
s = стх, с — вектор с элементами съ . . . , сп\ аь рь В,
Ci — const, сп — 1. Запишем теперь уравнения движения
системы в пространстве хг, . . ., х п, воспользовавшись со­
отношениями

у = 4 - [ х п— 2 аИХi (8.26)
акп ' 1=1
п—1
» = - 2 ^ г + V ( t ) y - ( ¥ V+ Q'(t))y, (8.27)
1=1

где 0* (t) — произвольная функция времени, удовлетво­


ряющая условию
|0*(О 1<Я . (8.28)
Для этой цели к-в уравнение в (8.21) в соответствии с обоз­
начением (8.22) заменим уравнением x k = х п, вместо по­
следнего уравнения запишем уравнение, которое полу­
чится в результате дифференцирования соотношения (8.23)
в силу системы (8.21) и, наконец, вместо у всюду, за ис­
ключением последнего слагаемого в (8.27), подставим его
значение, вычисленное согласно (8.26). В итоге ползшим
следующую систему:
71— 1

х = Ах - ЪS - b ГГ1' + 0* (0] y + d f + ЫГ (t) / + dlf,

(8.29)
где коэффициенты матрицы А и столбцов b, d, d' зави­
сят от коэффициентов исходной системы (8.21), производ­
ных от коэффициентов уравнения (8.22) *) и от функции
*) Отметим, что производные от и / входят лишь в послед­
нее уравнение системы (8.29).
§ 4.1 ОБОБЩЕНИЕ ДЛЯ СИСТЕМ ПРОИЗВОЛЬНОГО ВИДА 177

0* (t). Как и в рассмотренных выше случаях, будем счи­


тать, что все коэффициенты системы (8.29) являются огра­
ниченными функциями времени.
Если окажется, что за счет выбора коэффициентов
движение в скользящем режиме удается наделить желае­
мыми свойствами, то плоскость переключения s = 0 сле­
дует сделать плоскостью скольжения. Покажем, что это
можно сделать в рамках закона управления (8.24), (8,25),
т. е. без измерения возмущения, когда возмущение при­
надлежит классу функций

I / / / 1^ М (М — const), или / = 0 (t) /, (8.30)

где 0 (t) — произвольная функция, удовлетворяющая ус­


ловию
| 0 (*)| < М . (8.31)

Ограничение (8.30) является частным случаем усло­


вия (8.24), когда исполнительное устройство является
звеном первого порядка (т = 1).
Для определения условий существования плоскости
скольжения, как и ранее, нужно вычислить значения
п—1
функции s на плоскости s = 0 (т. е. для х п = — 2 cix i)
' i= l '
в силу системы (8.29)
П—1
а = 2 [сТ«* - ci (ст« я) - (cTb) Т (] а* - (сЧ ) (Т у + 0* («)) У +
i= l
+ (сЧ ) / + (сЧ) 0* (t) / + (сЧ ') f. (8.32)

Так как 0* (t) является произвольной ограниченной


функцией времени, выберем ее следующим образом:
(cTd1) 0 (t) -f- cT d
е*(9 = - (8.33)
7 b

Тогда согласно (8.30), (8.32) (8.33) величина s не зависит


от неконтролируемого возмущения, а координату у мож­
но рассматривать как измеряемое внешнее воздействие и
выбрать коэффициенты функции управления (8.24), (8.25)
в соответствии с разработанным в § 1 методом синтеза
178 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ [ГЛ. VIII

комбинированных систем с переменной структурой. В ре­


зультате получим, что коэффициенты а г, р г (i = 1, . . .
. . п — 1) и В должны удовлетворять условиям ^
sign (стЪ) оц ]> sup |стЪ|-1 [ста1 — q (стап)\,

sign (cTb) ^ < ( inf |cTb |_1 [ста’ — q (cTan)] (i = 1, . . ., n — 1), .

sign (cTb) В sup 0* («).

(8.34)

G учетом (8.31), (8.33) последнее неравенство следует за­


писать в виде
. , т >, □ ^ I ст<Р-1 М 4- 1cTd I /Г1 ос.,
sign (сто) 5 > sup ------- '■
— (8. 35)
г I с ЬI

Неравенства (8.34), (8.35) будут условиями существова­


ния плоскости скольжения. Так как в функции управле­
ния релейная составляющая 6и отсутствует, то в отличие
от рассмотренной в § 1 комбинированной системы усло­
вие попадания имеет вид строгого неравенства

sup (стап) < [ 0.


(
Таким образом, в системах с переменной структурой,
начиная с некоторого момента времени, можно обеспечить
существование скользящего режима и для вынужденного
движения. Наиболее существенная особенность описан­
ного закона управления заключается в том, что для его
реализации нет необходимости в непосредственном изме­
рении приложенных к объекту внешних возмущающих сил.
Конечно, движение в скользящем режиме, вообще говоря,
зависит от возмущающих воздействий, однако его харак­
тер можно изменять с помощью коэффициентов сг в урав­
нении плоскости переключения, на которые не наложено
никаких ограничений.
Реализация описанного здесь закона управления пред­
полагает использование величины х п, которая является
производной по времени от одной из координат системы.
Операция дифференцирования может быть осуществлена
также с цомощыо скользящих режимов, создаваемых в ди-
4] ОБОБЩЕНИЕ ДЛЯ СИСТЕМ ПРОИЗВОЛЬНОГО ВИДА 179

нейных фильтрах с переменной структурой. Один из ме­


тодов построения такого фильтра, который в скользящем
режиме является аналогом форсирующего звена, описан
в работе [33].
В заключение отметим, что применение метода управ­
ления вынужденным движением систем произвольного
вида не ограничивается возмущениями класса (8.30). В мо­
нографии [45] рассматривается один из возможных подхо­
дов, позволяющих создать движение в скользящем режиме
и для неизмеряемых возмущений, принадлежащих классу
(5.14) при пг^>1. Этот подход предполагает введение
в систему динамического звена тп-то порядка, которое ис­
пользуется точно так же, как и исполнительное устройст­
во при синтезе управления для описанной в § 3 системы.
В ряде случаев часть из уравнений исходной системы
можно принять в качестве уравнений такого динамическо­
го звена и необходимость его введения в систему отпадает.
Р А 3 Д Е Л III

ВЕКТОРНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ

Настоящий раздел посвящается принципам построения


и методам синтеза систем с разрывными управлениями
в предположении, что функция управления является век­
торной величиной. Основное внимание будет уделено зада­
чам управления линейными объектами, описываемыми
уравнениями
х = А (£) х + D (f) F (£) + В (*) и, (III.1)

где х — гс-мерный вектор состояния, А (£) — матрица раз­


мерности п х п с элементами ai} (t), D (t) — матрица
размерности п х I с элементами dtj (t), F (t) — /-мерный-
вектор внешних воздействий с элементами / ; (£), i? (£) —
матрица размерности п х т с элементами Ъц (£), и — тп-
мерный вектор управления с компонентами иг.
Как и ранее, порознь будут рассмотрены случаи сво­
бодного (F (t) = 0) и вынужденного (F (£) ф 0) движе­
ния как для стационарных, так и для нестационарных
объектов.
Методы решения различных задач управления по-преж­
нему будут основываться на преднамеренном создании
движения в скользящем режиме, которое в отличие от ска­
лярных случаев будет происходить не на одной, а на пе­
ресечении нескольких поверхностей разрыва.
Излагаемые здесь методы являются дальнейшим разви­
тием намеченных в главе IV подходов и в значительной
степени обобщают результаты раздела II. В то же время
уместно напомнить, что это обобщение не может быть'
осуществлено механически, так как вопрос о возникнове­
нии скользящих движений для векторных, случаев сво­
дится к решению задач об устойчивости нелинейной систе­
мы и не решается столь очевидным способом, который для
скалярных случаев следовал из условий (1.9).
Привлекательная особенность систем с векторным уп­
равлением заключается в том, что мы располагаем боль-
векторны е За д а ч и управлений 181

шими возможностями «влиять» на уравнения скольжения,


так как они зависят от всех компонент векторов градиен­
тов к поверхностям разрыва.
Помимо задач, уже разобранных в разделе II приме­
нительно к скалярному случаю, будут рассмотрены три
новых постановки. Первая из них связана с выявлением
класса систем, в которых скользящие движения инвари­
антны к внешним возмущениям и изменяющимся пара­
метрам объекта (частным случаем таких систем являются
системы, описываемые уравнениями (II. V II)). Решение
второй задачи предполагает построение системы оптими­
зации, в которой осуществляется поиск входных пара­
метров, обеспечивающих экстремальное значение выход­
ной величины. Эта нелинейная задача будет также рас­
смотрена для случаев, когда экстремум должен быть
найден при наличии ограничений на входные параметры.
Кроме того, будет рассмотрена задача об идентификации
динамических объектов с помощью моделей с переменной
структурой.
При формировании функции управления в системе
(III.I) будем в дальнейшем выбирать уравнения поверх­
ностей, на которых претерпевают разрывы компоненты
вектора и, в соответствии с (2.3), линейными, т. е.
Si = ctx = 0 (i = 1, . . ., т ) , (III.II)
где ct — n-мерный вектор-строка с постоянными элемен­
тами су (/ = 1 , . . . , п).
Предполагая, что для рассматриваемой системы при­
меним метод эквивалентного управления, запишем уравне­
ния скольжения по пересечению всех поверхностей раз­
рыва, которое задается уравнением
s = 0 , если s = Сх, (Ш Л И )
где s — та-мерный вектор-столбец с элементами sx, . . .
. . . , s m, С — матрица размерности т Х п , строками которой
•являются векторы сг. Согласно методу эквивалентного
управления нужно решить уравнение s = СА х + CDF +
+ СВи = 0 относительно и и подставить это значение в ис­
ходную систему. Затем в первые п — т уравнений получен­
ной таким образом системы следует подставить значения
координат х п- т+1, . . х п, выраженные через значения
хг, . . ., х п- т в результате решения системы Сх = 0
и остальные т уравнений отбросить.
182 ВЕКТОРНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ

Такая процедура приводит к следующей системе уравне­


ний скольжения (п — пг)-го порядка:
хт = Атхт + DmF, (III .IV)
где хт — вектор-столбец с компонентами х г, . . ., х п^ту>
Ат= Ат- Ап. т {С 'Т 'С - В' {СВ)-' [С (А'т -
- Ап_т (С")~ЛС ) + С" (Ат - Ап-т (С")~1С']1
Dm = D ’ — В' (CB)~lCD,
?1—?)г т

п—m Ат \-Ап-т
1П { Ат : - ^ п - т п

п—m^ В ’
>
?п В"
ГП
D’
П = "-А
т{ D"

С = иС ':

Если скользящий режим, описываемый уравнениями


(III. IV), возникает в любой точке многообразия (Ш Л И ),
то в дальнейшем его будем называть многообразием
скольжения.
Предположим, что в зависимости от цели управления с
помощью пхтп свободных параметров с у можно наделить
движение в скользящем режиме теми или иными свойст­
вами. Тогда попытаемся и для таких систем с векторным уп­
равлением так подобрать компоненты управления, чтобьц
многообразие s = 0, определяемое коэффициентами сц,
оказалось многообразием скольжения, а изображающая
точка попадала на него из любого начального положения.
Обратим внимание на то, что с ростом размерности векто­
ра управления задача синтеза линейной системы (III. IV)
упрощается, так как понижается порядок этой системы и
увеличивается число свободных параметров.
§ 1] УСЛОВИЯ СУЩЕСТВОВАНИЯ 183

ГЛАВА IX
УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ЛИНЕЙНЫХ
ОБЪЕКТОВ

§ 1. Условия существования многообразия


скольжения для объектов с постоянными параметрами

Уравнения системы управления свободным движением


объекта с постоянными параметрами имеют вид
х — А х + Ви. (9.1)
Система (9.1) отличается от (III.I) тем, что матрицы А и
В являются постоянными и отсутствует вектор внешних
воздействий F (<).
Как было показано в разделе I, вопрос о существова­
нии многообразия скольжения сводится к задаче об устой­
чивости проекции движения системы на подпространство
(ах. . . ., sm) «в малом» для всех векторов я, лежащих на
этом многообразии. Уравнения этого движения можно
получить в результате дифференцирования вектора
s = Сх в силу уравнения (9.1) с учетом уравнения s =
— Сх = 0:
s = Н хт + СВи, (9.2)
где хт — (п — та)-мерный вектор-столбец xL, . . х п_т,
Н — матрица размерности т X (п — тп) с элементами кц,

н = С (4 г - Аг-m (С"уЛС') + С" {Ат - А ^ т{С")^С'),

а матрицы А т, А т, А п- т А п-т определяются в соответствии


с (III. IV).
Для определения функции управления, обеспечиваю­
щей существование многообразия скольжения, восполь­
зу ем ся методами синтеза, описанными в главе IV.
Рассмотрим сначала оба варианта метода диагонали-
зации. Первый вариант этого метода согласно (4.7) пред­
полагает выбор вектора управления в следующем виде:
и = {CB)~'Qu*, (9.3)
где и* — m-мерный вектор, каждая компонента которого
щ претерпевает разрывы соответственно на плоскости
Sj (х) — 0, a Q — произвольная диагональная матрица
184 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

с отличными от пуля элементами q-t (i = 1, . . ., гаг). Для


управления (9.3) система (9.2) перепишется в виде
s = Н" (хт)” + Я ' {хт)' + Qur. (9.4^

В (9.4) (хт)' и (х т)" — г- и (га — гаг — г)-мерные векторы-


столбцы с элементами соответственно (хи . . ., хг) я
(гг+1, . . ., х „ - т) (1 < > га— гаг), а матрицы Н' и Я " состоят
из столбцов матрицы Я :

я = |(5
г .—т—г
В соответствии с таким разбиением выберем каждую из
компонент щ в виде суммы воздействий но г координатам
х х, хг с разрывными коэффициентами

и \ = — 2 1¥цхз — К ь (9.5)
5=1

«ii при •EjS-i 0,


при •ZjS* 0 (г = 1 , . . гаг, у = 1 , . . ., г),
при О,
б . = /
“ 6, ПрИ S;<^0,

а и> Ри — постоянные коэффициенты, 8i0 — любые сколь


угодно малые величины, совпадающие по знаку с дг.
При различных сочетаниях значений коэффициентов
позволяют получить 2гт линейных структур, т. е. и в слу­
чае систем с векторным управлением решение ищется
в классе систем с переменной структурой.
Так как матрица Q является диагональной, т. е. st за-
висит только от i-й компоненты вектора и , то условия
возникновения скользящего режима на каждой из плос­
костей можно рассматривать независимо. Очевидно, что
при выполнении соотношений
Qi^ij ij i

ЯФв (г = 1 , . . гаг, / = 1 ,. . ., г)
(9.6)
Н" = 0 или
h{j = 0 (г = 1, . . . , гаг, у = г + 1, . . . , га — гаг)
Ml УСЛОВИЯ СУЩЕСТВОВАНИЙ 185

всегда справедливы условия (1.9) существования сколь­


зящего режима на каждой из плоскостей st = 0 в окрест­
ности переселения s = 0. Это означает, что для системы
£9.1) с управлением (9.3), (9.5) многообразие s = 0 яв­
ляется многообразием скольжения.
Рассмотрим теперь второй вариант метода диагонали-
зации, который предполагает замену уже выбранных
(исходя из желаемого вида уравнений скольжения) плос­
костей разрыва s = 0 новыми плоскостями s* = 0 в соот­
ветствии с линейным преобразованием
s* = Qs, (9.7)
где det Q =jf= 0, s* — пг-мерный вектор с компонентами s*.'
Как было показано в главе IV, уравнения скольже­
ния инвариантны к такому преобразованию поверхностей
разрыва. В связи с этим предполагается подобрать такую
матрицу Q, чтобы проекция движения системы на подпро­
странство (s1? . . ., sm) описывалась уравнениями вида
(9.4). Если Q = Q (С В у 1, то согласно (9.2), (9.7) это ус­
ловие будет выполнено:

5* = Н " (хт)" + S ' (х™)' + Qu, (9.8)

где I t f 'j J P f l = И , Н = Q (СВ)~1Н.


Г п — 771— Г

Так как в (9.8) матрица Q — диагональная, то и в этом


случае для того, чтобы многообразие s* — 0 оказалось
многообразием скольжения, управление и нужно выбрать
в виде (9.5) и выполнить аналогичные (9.6) условия:
Г
щ = — 2 Тух,- — 6ui, (9.9)
J=i

аи при XjS* > 0,


II
£

1 при хр\ < 0 (i = 1 , . . . , пг, ) = 1 , . . . , г),


( s10 при < > 0,
&ui — б при s* < 0,
1 —fyo

(9.10)
186 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМОВЪЕКТОВ [ГЛ. IX

ЧгЩ] i®5h\j,
9iPij < Tf-a (i = 1 , . . ., m., / = 1 , . . r),
(9.10)
H"—0 или
Лу = 0 (i = 1 ,. . ., m, у = г + 1 , . . . , п — тп) /

(в 9.10) htj — элементы матрицы Н ). Обратим внимание


на то, что в силу невырожденности матрицы Q (СВ)~1
в (9.8) уравнения Н " — 0 и Н " = 0, а следовательно,
и условия вида равенств в (9.4) и в (9.10) эквивалентны.
Оба варианта метода диагонализации приводят к одним
и тем же уравнениям скольжения. Во втором случае каж­
дая компонента ut вектора управления и претерпевает
разрывы лишь на одной плоскости si — 0, в то время как
в первом — на всех плоскостях, так как любая компо­
нента ut состоит из суммы функций иг, . . ., ит, которые
имеют точки разрыва на соответствующих плоскостях
st = 0.
Воспользуемся теперь обоими вариантами метода син­
теза, описанными в § 4 главы IV, которые основываются
на построении функции Ляпунова в виде квадратич­
ной формы. Выберем некоторую симметричную постоян­
ную матрицу D , которая удовлетворяет критерию Силь­
вестра.
Первый вариант метода основывается на введении но­
вого управления и*, компоненты которого претерпевают
разрывы на выбранных, исходя из желаемого характера
движения, поверхностях. Это управление связано с
вектором и линейным преобразованием
и = {СВ)~Юи*. (9.11)
Как и при использовании первого варианта метода диа­
гонализации, выберем управление и* в виде (9.5) и запи­
шем его следующим образом:
и* = — и0 — U sign s, (Э Л ^
где и0 — нг-мерный вектор с компонентами
Г
ио = ^ UtL+hLxj (* = 1, — , т),
3=1
U — диагональная матрица размерности т X т с
§ 1] УСЛОВИЯ СУЩЕСТВОВАНИЯ 187

ненулевыми элементами
г

х u t = 2 3 ;^ |^] + 6о, =
3=1

sign s — m-мерный вектор с компонентами sign s*. В систе­


ме с переменной структурой (9.1) с управлением (9.11),
(9.12) уравнение (9.2), описывающее проекцию движения
на подпространство s, имеет вид
s = Н хт — Du° — DU signs. (9.13)
Функцию Ляпунова для этой системы представим в виде
положительно определенной квадратичной формы

v = у sTD~1s.

Производная этой функции по времени определится в со­


ответствии с (9.13)
и = sT (D~1Hxm — и°) — sTU sign s.

Использованное в (9.4) разбиение вектора Нхт на два


слагаемых и представление вектора и* в виде (9.12) поз­
воляют переписать уравнение для v следующим образом:
v = sTD~1H" {хт)” + sTH* (хту —
771 Г

- 2i = l (' 3=1
2 £S r 1Lias i + e«' ) N ’
где Я * = D~lH" — U°, U0 — матрица размерности т х г с
элементами U% - ij-~^ . Имея в виду, что компонентами
вектора (ж”1)' являются координаты ху, . . ., хт, из этого
соотношения получаем условия, при которых функция и
■будет отрицательно определенной:
Н" = О или —О
(i = 1 ,..., m ,j = r - 1-1,... , n — m ),
(9.14)
аи — Рц >|йу| (i = 1 ,..., m, j = 1 ,..., 0 ,
2

где й£/ — элементы матрицы Я * . Так как функции г; и у


имеют разные знаки в окрестности любой точки многообра­
188 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

зия s = 0, то согласно главе III это многообразие являет­


ся многообразием скольжения.
Второй вариант метода, основанного на использова­
нии квадратичных форм, предполагает замену уже выб*
ранных плоскостей разрыва новыми плоскостями в соот­
ветствии с линейным преобразованием (9.7). Выберем
матрицу £2 равной D (СВ)~г, а управление и — в соот­
ветствии с (9.9). В этом случае, следуя той же методике,
с помощью которой было получено уравнение (9.13),
можно записать уравнение, описывающее проекцию дви­
жения на подпространство s* = 0:
s * = D (СВ)~Шхт — Du° - D U sign s*.

Функцию v вновь выберем в виде положительно опреде­


ленной квадратичной формы y s* tD~1s *, тогда ее производ­
ная по времени будет равна
v = sT {СВ)-1 Н" (хт)” + sTH* (хт)' —
т - г
- 2 !(2 т ^ -1 * | | + » « )Ы ' ■
г=1 7=1

где Ш* = {СВ)~1Н' — U0. Условия, при которых многооб­


разие s* = 0 является многообразием скольжения, ана­
логичны условиям (9.14) I f^'t4' .
Н" = 0 или hij = 0
(i = 1 ,..., m ,j = r + 1, — , п — т),
(9.15)
2 ^ > f | (i = 1 ,..., m, j = 1 ,..., r),

где Tiij — элементы матрицы И *. Условия типа неравенств


в (9.14) и (9.15) можно выполнить за счет увеличения ве~»
личин a tj — Р оставляя постоянными суммы a tj + р ; ; ,
которые входят в правые части этих неравенств. Сущест­
венно отметить, что полученные здесь условия, наклады­
ваемые па коэффициенты матрицы С и коэффициенты воз­
действий ац и Р ц, были получены как достаточные.
Нетрудно убедиться, что при фиксированном г и выбранном
способе управления равенство Н" = 0, которое входит
во все группы условий, является одновременно и необ­
5 2] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 189

ходимым условием. Действительно, при нарушении этого


условия, как это следует из (9.2), можно так выбрать ком­
поненты вектора х, лежащего на многообразии s = О,
чтобы {хт ) ' , а, следовательно, и СВи были равны нулю,
а вектор Н хт, равный 1Т'(хт)", был отличен от нуля. Так
как в выбранной таким образом точке величина s также
отлична от нуля, то проходящая через нее фазовая траекто­
рия не лежит в многообразии s — 0, и следовательно,
движение в скользящем режиме невозможно *).
Во всех методах, рассмотренных в настоящем парагра­
фе, поверхности разрыва, а следовательно, и уравнения
скольжения не могут быть выбраны произвольно. Огра­
ничения накладываются условиями существования много­
образия скольжения (9.6), (9.10), (9.14) или (9.15), кото­
рые зависят от коэффициентов уравнений поверхностей
разрыва (III. III). (Исключение составляет лишь случай,
когда г -■ п — т и ограничения типа равенств отсутст­
вуют.) В связи с этим далее мы в § 2 рассмотрим вопрос об
устойчивости движения по многообразию скольжения.
Итак, мы воспользовались всеми предложенными в гла­
ве IV подходами к решению задачи синтеза, за исключе­
нием метода иерархии управления. Как уже отмечалось
в разделе I для реализации этого метода в отличие от уже
рассмотренных не требуется знания точных значений
элементов матрицы СВ. Это обстоятельство оказывается
весьма существенным для построения систем управления
нестационарными объектами. Поэтому далее в § 4 отдель­
но будут рассмотрены специфические особенности приме­
нения этого метода применительно к системам управления
с постоянными параметрами, а затем в § 5 будет приведено
обобщение на объекты с измени гощи мис я параметрами.

§ 2. Условия устойчивости скользящих движений

Выясним, при каких условиях для системы (9.1) дви­


жение по многообразию скольжения (III. III), описывае­
мое уравнениями (III. IV) при F (t) = 0, является устой­
чивым. При решении этого вопроса будем следовать схеме
*) Аналогично можно обосновать необходимость условия
Н " = 0 для существования многообразия скольжения н в случае,
когда производится замена поверхностей разрыва с помощью ка­
кого-либо линейного преобразования.
190 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

рассуждений, которые позволили получить условие устой­


чивости скользящих движений для скалярных случаев
(§ 3 главы V). ^
Запишем уравнения движения системы (9.1) в прост­
ранстве координат хи . . х п_т, sx, . . ., s m, выразив
координаты х п_т+1, . . х п, которые составляют вектор
хп~т, через х^, . . ., х п_т, вг, . . ., sm из уравнений s = Сх:
хп-т = _ (С'^С'х™. (9.16)

Полученное значение вектора хп~т подставим в первые


п — т уравнений системы (9.1) и выражение для ё, вы­
численное в соответствии с (9.2):

± т = [Ат- An-miC'T1 С'} X™ + A n-m iC T 's + В'и,


ё = A ss H xm + СВи,

гдеЛ 8 = C’A l m ( П ~ г + C'An-m (С*)"1. В (9.16) и (9.17)


матрицы С , С", А т, А т, А п- т, А п-т, Н определяются
из соотношений (I II.IV) и (9.2).
Уравнениями (9.17), эквивалентными системе (9.1),
следует воспользоваться для доказательства сформулиро­
ванной далее теоремы, на основании которой и решается
вопрос об устойчивости движения по многообразию
скольжения в системе (9.1).
Т е о р е м а . Для асимптотической устойчивости дви­
жения системы (9.1) в скользящем режиме по многообразию
з = 0 (Ш Л И ) необходимо и достаточно, чтобы в харак­
теристическом уравнении системы (9.1) при и — иЭКВ)
вычисленном при условии s = 0, все корни, кроме корней,
совпадающих с собственными числами матрицы A s, имели
отрицательные действительные части.
Мы не приводим доказательства этой теоремы, так'
как оно полностью совпадает с доказательством аналогич­
ной теоремы, сформулированной и доказанной в § 3
главы V для систем со скалярным управлением.
Воспользуемся приведенной здесь теоремой для постро­
ения системы с переменной структурой, в которой мно­
гообразие пересечения плоскостей разрыва является мно­
гообразием скольжения, а движение в скользящем режи­
ме вдоль этого многообразия устойчиво.
1 2] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 191

Пусть каждая компонента вектора и формируется


в виде суммы воздействий по г компонентами х г, ■ . ., ди­
вектора (ят )' с разрывными коэффициентами, и не будем
пока уточнять, по какому закону осуществляется пере­
ключение этих коэффициентов *). Покажем, что в этом
случае можно обеспечить существование многообразия
скольжения s = 0 размерности п — т о устойчивым дви­
жением, если найдется такое линейное управление и =
= Г (хт )' (Г — постоянная матрица размерности т X г
с элементами у у ), при котором характеристическое уравне­
ние системы (9.1) имеет п — т корней A,lt . . ., кп- т
с отрицательными действительными частями. Остальные
т корней Я„_т+1, . . ., %п могут быть произвольными, бу­
дем лишь предполагать, что если в эту группу входит
какой-либо комплексный корень, то в нее входит и сопря­
женный ему корень.
Итак, при и = Тхтповедение системы (9.1) описывается
уравнением
х = А*х, (9.18)

где А * = А + БГ, у матрицы Г размерности т X п


первые г столбцов совпадают со столбцами матрицы Г,
а остальные равны нулю. Корни А^, . . ., %п являются
собственными числами матрицы А * .
Рассмотрим порознь два случая, когда Хп является
действительным числом и когда А,п_г и — комплексные
сопряженные корни. В первом случае введем в рассмотре­
ние новую координату sm:
sm = стх
и подберем вектор-строку ст с элементами ст1, . . ., стп
таким образом, чтобы поведение координаты sm описыва­
лось уравнением

*) Представляют интерес лишь случаи, когда управление со­


ставлено из воздействий по г координатам и г < п — т. Для слу­
чая, когда г = п — т (очевидно, и для г > п — т) в условиях
существования многообразия скольжения (9.6), (9.10), (9.14) или
(9.15) отсутствуют условия типа равенств, т. е. при любой матрице
С за счет соответствующего выбора осу и Ру эти условия можно вы­
полнить. Это означает, что уравнения скольжения (III. IV) при
F = 0, зависящие от С, вообще говоря, можно наделить любыми
свойствами, в том числе и устойчивостью.
192 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

Для этого вектор ст должен удовлетворять уравнению


сщА ^псто = О-
Так как Хп является действительным собственным числом^
матрицы Л *, то у этого уравнения найдется действитель­
ное нетривиальное решение. Предположим, что стп ф 0.
Тогда, выразив координату х п через sm и координаты
х1? . . ., xn_lt которые составляют вектор х 1, можно полу­
чить уравнения, описывающие поведение системы (9.18)
в пространстве x lt . t xn_lt s:

•Т1 = А-^рР- я3 sm,

где и a™ — матрица размерности (n — 1) X (n — 1)


и (n — 1)-мерный вектор-столбец. Эта система получена
в результате замены последнего уравнения из системы
(9.18) уравнением для sm и исключения из первых (п — 1)
уравнения координаты х п, являющейся линейной комби­
нацией X Xn-i, sm.
Во втором случае, когда Хп- г и %п являются комплекс­
ными сопряженными корнями, введем новые переменные
sm-i и sm:
Sm-i = С!П_уХ, sm = стх,

где n-мерные векторы-строки ст_г и ст удовлетворяют


соотношениям
* * * *
Сщ-1 = Ст _1 Ст , Ст = ] (с т _1 ст ),

а'я-мерные векторы-строки Cm-i и ст являются решениями


уравнений

Сщ—
iA Ъп-iCrri-i = 0, стА Кпст = 0.

Так как и Кп являются сопряженными комплексными
собственными числами матрицы А * , то у этих уравнений
существуют нетривиальные решения, которые также
будут комплексными и сопряженными, и следовательно,
векторы ст _х и ст будут действительными. После диффе­
ренцирования s mи sm_i и соответствующих преобразований
получим систему из двух дифференциальных уравнений
i 2] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 193

относительно этих переменных


1 1
£777-1 — “ g- (^п- 1 “Ь Яп) sm-l 2~ ) (^п- 1 Яп) smi

1 1
£7 71 — ^ J (Я 77— 1 ^ n ) £771—1 “ Ь 1 ту (% n —l “ f" Я п ) ^m ■

Нетрудно убедиться в том, что все коэффициенты этой си­


стемы действительны, а корни ее характеристического
уравнения равны ^n_! и Я„. Векторы Cm-i и с^, как собст­
венные векторы матрицы А *, соответствующие различ­
ным собственным числам, линейно независимы. Это оз­
начает, что линейно независимыми будут также и векторы
и ст, а поэтому из уравнений для sm_x и sm можно вы­
разить какие-либо две координаты, например, х п- г и х п
через координаты х1} . . ., x'n_2, составляющие вектор х2,
и новые координаты sm и sm. Подставляя в первые
уравнения системы (9.18) вычисленные таким образом
значения х п- х и х п и заменив последние два уравнения
дифференциальными уравнениями для sm_x и sm, получим
уравнения, описывающие поведение системы (9.18) в про­
странстве хх, . . ., х „ -3 £,„-!, sm:
'r‘1 —
= А^х1 + я™ 1sm- 1 -j- as s„
1 1
£ t7 7 ~ 1 = ~2~ (^ 7 1 -1 “ f- Я п ) ^ 7 7 7 -1 2~] (^ 7 7 -1 Я п ) £7777

£ 77 » = 2 J (^ 7 7 -1 ^ - n ) £ 7 7 7 -1 “ 1 g - (^ 7 1 -1 “ Ь ^ 7 l ) £ j7 7 7

где a I — матрица размерности (n — 2) X (n — 2), a™ 1 яГ —


(я — 2)-мерные векторы-столбцы. После одного из таких
невырожденных преобразований координат собственные
числа матрицы А х окажутся равными %х, . . Кп- 1: а мат­
рицы А 2 — . . ., %п- 2 -
г Далее в системе дифференциальных уравнений относи­
тельно вектора х 1 (или х2) координату sm (или координаты
и sm) будем считать входным воздействием. В этих си­
стемах произведем замену переменных и получим еще одно
(или два в случае комплексных корней) уравнение, кото­
рое не зависит от оставшихся координат вектора х. Про­
делав соответствующее число таких преобразований, в ко­
торых «будут использованы» все корни Яп_т+1, . . ., Я„

7 В. И. У ткин
194 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

и заменив координаты яп_т+1, . . х п, новыми координа­


тами slt . . ., sm*), полупим уравнения, описывающие по­
ведение системы (9.18) в пространстве координат х х, . . .
. . . , х п- т, Sj, . . ., вт или сокращенно в пространстве (хт, s)\

= А тхт -f- A^s,


(9.19)
s = 4 8s,

где Am, 4 KS, Л8 — матрицы размерности (п — т) X (п —- т),


(п — т) X т, т X т, собственные числа матрицы А\
равны • . ., Яп, & матрицы A s Я^, . • ., Кп—т,
Вектор $ равен Сх, а строки матрицы С размерности т х п
с действительными коэффициентами вычисляются на каж­
дом шаге описанной выше процедуры. На каждом шаге
преобразование координат является невырожденным, по­
этому является невырожденной матрица

п-т | Е °

ч С С"
п-т т
которая переводит вектор х в вектор (х s). Из этого сле­
дует, что det С" Ф 0 и матрица (С")-1 существует.
После того, как мы описали свойства системы (9.18),
выберем плоскости st = 0 (i = 1, . . ., т) в качестве по­
верхностей, на которых претерпевают разрывы компонен­
ты вектора управления и в системе (9.1). Поведение этой
системы в пространстве (хт, s) описывается уравнениями
(9.17). Отметим, что при выбранном векторе s эти уравне­
ния всегда правомерны, так как матрица (С")-1 существу­
ет. Предположим, что на многообразии s = 0 возникнет
скользящий режим. Тогда согласно доказанной в этом па­
раграфе теореме это движение устойчиво, если при и = u3J&,
в характеристическом уравнении системы, кроме т кор­
ней, совпадающих с собственными значениями матрицы A s,

*) Было показано, что на каждом шаге замена какой-либо


одной или двух компонент вектора х новыми координатами из на­
бора . . ., sm всегда возможна. Будем рассматривать случаи,
когда в результате всех шагов оказались исключенными коор­
динаты хп_т+1, . . . . хп.
§ 2] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 195

остальные п — т корней имеют отрицательные действи­


тельные части. Функция иэкв является решением уравне­
ния s = 0 при s = О относительно и *):
и8кв = — {С В у1 Н хт.
Так как системы (9.17) и (9.19) при и — Г (хт)' эквивалент­
ны, то
Al = А „ Г (хт)' = - (СВ)-1Н хт. (9.20)

Из полученных соотношений следует, что и8КВ = Г (хт)',


а при и — Г (хт)' все корни характеристического уравне­
ния, за исключением собственных чисел матрицы А л или
A s, имеют отрицательное действительные части. Это озна­
чает, что движение по многообразию s = 0 в скользящем
режиме, если таковое возникнет в системе (9.1), асимпто­
тически устойчиво.
Убедимся теперь, что если компоненты вектора и яв­
ляются суммой воздействий по г компонентам х г, . . ., х Твек­
тора (я™)', то пересечение плоскостей s* = 0 (i = 1 ,. . ., тп)
можно сделать многообразием скольжения. В § 1 были
рассмотрены различные способы решения этой задачи и во
всех случаях необходимо было выполнить условие Н" = 0.
(Напомним, что вектор Н хт был представлен в виде
Н ' (хт)' + Н" (хт)", (хт)" — вектор с компонентами
2г+1). . ., х п~т.) Из последнего равенства в (9.20), которое
должно выполняться при любых значениях вектора хт,
следует, что условие Н " = 0 имеет место. Что касается
остальных условий существования многообразия сколь­
жения типа неравенств, приведенных в (9.6), (9.10), (9.14)
и (9.15), то их всегда можно выполнить, выбирая соответ­
ствующим образом значения разрывных коэффициентов в
векторе управления.
Таким образом, задача синтеза системы с переменной
структурой с устойчивым движением вдоль многоообразия
скольжения сводится, во-первых, к нахождению линей­
ного управления и = Г (хт )', при котором в характери­
стическом уравнении системы имеется п — т корней
с отрицательными действительными частями, во-вторых,

*) Мы исключаем из рассмотрения вырожденные случаи, когда


матрица СВ окажется вырожденной.


196 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

к вычислению коэффициентов уравнения плоскостей разры­


ва согласно описанной выше пошаговой процедуре, и, нако­
нец, к определению разрывных коэффициентов управле­
ния, компоненты которого составлены из тех же коорди­
нат, что и вектор Г (ят )'.
Проиллюстрируем описанный метод нахождения
управления, который обеспечивает существование многооб­
разия скольжения с устойчивым движением на примере
системы четвертого порядка с двумерным управлением,
описываемой уравнениями

±1 = ® 2» 0 1 0 0 0 0
Х2 = *3. 0 0 1 0 0 0
х3 = Х4 + М2 ,
•, т.е. А =
0 0 0 1 , В = 0 1
Xi = щ , 0 0 0 0 1 0

и -- п = 4, т — 2.

Сначала нужно выбрать такое линейное управление


и = Г (хт ) ' , при котором характеристическое уравнение
системы имеет два корня с отрицательными действитель­
ными частями. Непосредственной проверкой можно убе­
диться, что для — — 14 х1 и щ = — 15 хх (т. е. (хт)' =
= хх) это условие выполнено, так как корни характери­
стического уравнения системы

det |А — рЕ | = 0 или р4 + 15 р + 14 = О

равны
V 19 1 0 /1 9
Я<1 = — 1, %2 = — 2, %3 = — |- 7 ™4 о 7

Следующий шаг состоит в определении уравнений плоско­


стей разрыва. Так как корни Х3 и Я,4 являются комплекс­
ными сопряженными, то сначала нужно найти сх =
= (Си. с12> С13. с1 4) И с2 = (с21, с22, с23, си ) — собственные
векторы матрицы
-1 4 0 0 0
4* = А + ВТ, Г =
-1 5 0 0 0
i 2] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 197

которые являются решениями уравнений


q Л* — X3q — 0 и c*iA* — Я,4с2 = 0.
* *
Так как векторы q и с2 являются сопряженными, то до­
статочно решить одно из этих уравнений, например, отно-
* • .
сительно q , которое для случая с14 = 1 запишется в виде
— 15с13 — 14 = ^3q 4,
* . *
С11 = A3q 2,
с12 = ^Зс13,

С 13 — ^3-

Из последних трех уравнений следует, что


* 3 , .УЧ9 * 02* 5 , •3 V"i9
ci3 = ~ Y + ] — , с 12 — X 2q 3 ------ 2 " + 1 — g—

Сц — ?и3с13— — 18 -j- ] / 19.

(Как и следовало ожидать, полученные значения q 3 и q 4


удовлетворяют и первому уравнению.)
Соответствующие корням К3 и Х4 новые координаты q
и s2 (или sm_x и 5 т ) определяются из соотношений

q — с^х, q = с2х : q = q ~Т с2, q = j (q с2).

Векторы q и с2 являются сопряженными, поэтому уравне­


ния поверхностей разрыва имеют вид
q —— Зба:4 — Ъх2 —
|—Зх3 -1—2.т4,
s2 = — 2 / 1 9 ^ - 3 /1 9 а ;2 - /Т 9 а ;3,
а координаты а:3 и а:4, которые мы заменяем новыми пере­
менными q и q , являются линейными комбинациями а:х,
а:2, q , q :
х й= — + 2ач + За;^ ,

ж4 = ~2~si + 2 y i ^ Sa ^;Г2‘

Для получения уравнений движения относительно коор­


динат а:!, а:2, q , q нужно продифференцировать q и q
198 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

в силу исходной системы, затем полученными уравнения­


ми заменить в ней два последних уравнения и, наконец, во
всех четырех уравнениях заменить х в и x t , выраженные
через xlt х2, sx и s2. После этих преобразований получим
X1 *Г2)

h = ~2~ Si + -^ 2— + 73a;i 2iii “h 3u2,

i2= _ Sl + s2 _ 15 V i 9 x i - / 1 9 u2.

Нетрудно убедиться в том, что при и = Г (я711)' (напомним,


что Г — вектор-столбец с компонентами — 14 и — 15, а
(хт)' — х г) система уравнений относительно sx и s2 не
зависит от и х2, а ее характеристическое уравнение
имеет корни Х3 и Я,4. В полученной системе матрица Н'
(т. е. двумерный вектор-столбец, элементами которого
являются коэффициенты перед хх, равным (хт )' в уравне­
ниях для sx и s2) имеет вид
73
Н ~~ - 1 5 / 1 9 ’
а матрица Н " (двумерный вектор-столбец, состоящий из
коэффициентов перед х2, равным (хт)"), как и должно
следовать из процедуры синтеза, равна нулю. Выберем
компоненты вектора управления в виде воздействия по
координате х1 с коэффициентами, претерпевающими разры­
вы на плоскостях sx = 0 и s2 = 0:
Ui — — Т ц Ж! — S0i sign Si, u2 = ^ai^i - f S02sign s2*),
_ |au при ^ > 0 , _ { aai ПРИ ж15г > ° »
11 " b n при XiS! < 0, 21 l Psi при З д < 0 .
В уравнение для s2 входит только компонента и2, претерпе­
вающая разрывы на плоскости s2 = 0, поэтому для нахож­
дения условий скольжения в этом скалярном случае
*) Необходимость введения малого релейного сигнала обосно­
вывалась в § 1,
8 2] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 199

можно воспользоваться неравенствами (1.9). В окрестно­


сти пересечения = 0 и s2 = 0 скользящий режим всегда
возникнет на плоскости х2, если
а г1 > — 15 и р21 < — 15.

Для определения уравнений движения в скользящем ре­


жиме по плоскости s2 = 0 нужно из уравнения s2 => О
найти эквивалентное управление и2 Э1(В и подставить его
в остальные уравнения. На многообразии sx = 0, s2 => О
получим м2Экв = — i 5x lt и соответственно уравнение для
запишется следующим образом:
= 28^ +
Воспользовавшись условиями (1.9) для этого скалярного
случая, получаем условие возникновения скользящего
режима в любой точке плоскости sx = 0, лежащей на пе­
ресечении sx = 0, s2 = 0:
«и 14, Рц < 14.
Выбирая, например, а Х1 = 15, Рп = — 15, а 21 = 20-
Р21 = — 20, получаем, что на всем пересечении обеих по
верхностей выполняются условия существования скользя­
щего режима, т. е. это пересечение является многообра­
зием скольжения.
Как следует из приведенной в этом параграфе процеду­
ры синтеза, движение в скользящем режиме определяет­
ся корнями ^ = — 1 и %2 = —2, и следовательно, это
движение устойчиво. К такому выводу можно также прий­
ти, если обратиться к первым двум уравнениям системы
дифференциальных уравнений относительно xlt х2, sv s2,
если s2 принять равным нулю (а это условие в скользящем
режиме справедливо). Необходимо отметить, что поведе­
ние координат х 3 и также определяется корнями и
%2, так как во время скользящего режима (т. е. при sx = 0,
s2 = 0) они являются линейными комбинациями х1 и х2.
З а м е ч а н и е . Процедура синтеза предполагала,
что в результате т шагов вместо координат хл_,п+1, . . ., х п
оказалось возможным ввести новые координатах!, . . ., sm.
Однако может оказаться, что координаты хп- т+1, . .., х л
не удастся исключить. Например, на каждом шаге
последний коэффициент в соответствующем собственном
200 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

векторе равен нулю, тогда координата х п не может быть


выражена через какую-либо компоненту вектора s и ос­
тавшиеся неисключенными к этому шагу компоненты
вектора х. Однако, как уже отмечалось ранее, на каждом
шаге какие-либо одну или две координаты вектора х
можно заменить новыми координатами, которые являются
компонентами вектора s. Если в результате т шагов уда­
лось исключить не жп_т+1, . . ., х п, а какие-либо другиет
координат из набора х,.+1, . . х п (т. е. не входящих в со­
став вектора (ж"1)'), то описанный здесь метод синтеза также
применим — нужно перенумеровать координаты хг+1,. . .
. . . , х п, присвоив номера с п — то + 1 по га исключенным
координатам, и переписать полученные ранее условия
существования многообразия скольжения в соответствии
с новой нумерацией.
Рассмотрим теперь случаи, когда приходится вводить
новые координаты из набора slt . . sm вместо каких-
либо компонент х 1, . . ., хТ вектора (хт)'. В таких
случаях исключенные координаты, например, ж,._Г'+1, . . .
. . ., хг*) являются линейными комбинациями только ком­
понент вектора s и оставшихся компонент хг, . . хг~Г'
вектора (хт )'. Действительно, если бы в какую-либо из
этих линейных комбинаций вошла хотя бы одна из коор­
динат хг+1, . . ., х п, то ее можно было бы выразить через
компоненты векторов s и х и исключить из рассмотрения
вместо какой-либо из координат Хг_г<+1, . . ., х г. Это оз­
начает, что линейное управление и — Г (хт )', с помощью
которого находились уравнения плоскостей разрыва,
представимо в виде
и — r ss -j- 1 (xr) ,
где Г, и Г , — некоторые постоянные матрицы, размерно­
сти то X то и тох г — г', (х Т)' — (г — г')-мерныйвектор с
компонентами хг, . . . , хг_Г'.
Запишем аналогичные (9.17) уравнения движения си­
стемы
хт = А тхт + + Б'и,
(9.17а)
s= Н хт + СВи.
*) Очевидно, можно так пронумеровать компоненты x l t . . х г
вектора (хт)', что исключенные г' координат окажутся в нем по­
следними.
§ 2] УСЛОВИЯ УСТОЙЧИВОСТИ СКОЛЬЗЯЩИХ ДВИЖЕНИЙ 201

Вектор хт в (9.17а) состоит из п — т компонент вектора


х, в том числе ху, . . Хг-Т-, в него не входят координаты
хг_г'+1, . . хт, а элементы всех матриц вычисляются по
той же процедуре, что и элементы в уравнениях (9.17).
Так как при и = Г (хт )' или и — r ss -j- Гг (х Т)' пос­
леднее уравнение в (9.17а) совпадает с уравнением для
вектора s в (9.19), то
Al = 4 + CBTS, Нх™ = - СВТт{х*у,

8 — A ss -f- СВ [и — Гг {хг)*\.
Выбирая компоненты вектора и в виде суммы воздейст­
вий по координатам xt , . . ., хт
> с разрывными коэффици­
ентами, с помощью любого из описанного в § 1 приемов,
выбранное многообразие s = 0 можно сделать многообра­
зием скольжения. (Роль матрицы Н ' будет играть матри­
ца СВТГ, а матрица Я " равна нулю.)
Убедимся теперь, что движение в скользящем режиме
вдоль многообразия s = 0 устойчиво. В рассматриваемой
системе мВ1Ш. вычисленное при условии s = 0, и линейное
управление и = Г,5 + Гг (хг)' отличаются слагаемым Га5.
В результате подстановки этих двух линейных управле­
ний в (9.17а) убеждаемся, что характеристические урав­
нения полученных таким образом линейных систем имеют
п — тп одинаковых корней, а отличаться будут m корней,
являющихся собственными числами соответственно мат­
риц A s и А\* Управление и = Г (хт )' выбиралось таким
образом, чтобы совпадающие п — т корней имели отри­
цательные вещественные части, поэтому согласно при­
веденной выше теореме движение по многообразию s = 0
устойчиво.
Таким образом, если, осуществляя процедуру выбора
плоскостей разрыва при переходе от пространства х к
пространству (хт , s), пришлось исключить координаты,
входящие в состав управления Г (хт )г, то для выполне­
ния условий существования многообразия скольжения
с устойчивым движением эти же координаты можно ис­
ключить из вектора управления.
Остался неразобранным лишь случай, когда г' = г и
уравнение относительно вектора s имеет вид
£ = ^4s + СВи.
202 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

Очевидно, что в этом случае многообразие s = 0 будет


целиком состоять из фазовых траекторий исходной систе­
мы, если управление в нем принять равным нулю. В силу
единственности решения такой линейной системы изоб­
ражающая точка из произвольного начального положе­
ния не может попасть на многообразие s = 0 *). Тем не
менее изображающую точку можно «заставить» попасть
и двигаться вдоль него за счет создания скользящего
режима.
Как следует из § 1, вид функции управления, ре­
шающего эту задачу, зависит от размерности матрицы
Н '. В нашем случае Н ' = 0, и поэтому многообразие
s = 0 можно сделать многообразие скольжения, если
каждая компонента вектора и содержит воздействие хотя
бы по одной из координат вектора х с разрывным коэффи­
циентом.

§ 3. Устойчивость в системах с многообразием


скольжения

При исследовании вопроса об устойчивости движения


системы, описываемой уравнением (9.1), будем считать,
что пересечение поверхностей разрыва (Ш Л И ) является
многообразием скольжения и движение в скользящем
режиме устойчиво. Тогда вопрос об устойчивости при
произвольных начальных условиях сводится к опреде­
лению условий попадания изображающей точки на это
многообразие из любого начального положения.
Отметим сначала, что если каждая компонента управ­
ления в (9.1) является суммой воздействий по различным
координатам с кусочно-постоянными коэффициентами,
то для такой системы можно воспользоваться приведен­
ными в£§ 2 главы V I необходимыми условиями попа­
дания.
Согласно этим условиям для каждой структуры собст­
венные векторы, соответствующие положительным дейст­
вительным корням ее характеристического уравнения, не
должны лежать в области определения рассматриваемой
структуры. Доказательство этого утверждения, прове­

*) За исключением, быть может, случаев, когда П т х = 0.


t-+ o o
5 3] УСТОЙЧИВОСТЬ 203

денное для систем со скалярным управлением, сохраняет­


ся и для векторных случаев.
Для того чтобы получить достаточные условия попа­
дания, рассмотрим движение системы в пространстве
3xi • • •j sm.
s — СА х + СВи.
В случае, если применяется первый вариант метода
диагоналиэации, это уравнение согласно (9.3) перепи­
шется в виде
а ■= САх + Q u \ (9.21)
Сформируем управление и* с использованием воздействий
по всем координатам *):

(9-22)
j= i
ау при ^ > 0 ,
Ту =
Ру при XjSi < 0 (i = 1 ,..., m; j = 1 ,..., п).

Имея в виду, что матрица Q является диагональной,


из (9.17) и (9.22) получаем условия, при которых величи­
ны Si и Si во всем пространстве будут иметь разные знаки:

QtaH< (i = 1, ..., m; j = 1 ,..., n) } (9.23)

где ci и a? — соответственно строки и столбцы матриц С


и А . При выполнении условий (9.23) изображающая точ­
ка либо попадает на каждую из плоскостей sit а следова­
тельно, и на их пересечение, либо стремится к ним асимп­
тотически, что означает устойчивость системы.
Второй вариант метода диагонализации приводит к
уравнениям
s* = Вх + Qu, (9.24)

где R — матрица размерности т х п , равная Q (СВУ1 С А ,


с элементами rtj. Для попадания в системе (9.24) нужно
выбрать управление и выполнить условия, аналогичные

*) Так же как и для управления (5.4), в этом случае нет необ­


ходимости вводить в управление релейную составляющую 6и.
204 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

(9.22) и (9.23):
П
Щ = — 2 V1V;> (9.25)
1=1

4
- 1015
при xjSi 0,

1Ри при XjS* < 0 (i = 1 ,..., т; j = 1,,..., n),


*ij) 1
(9.26)
(ZiPti < rij- J
И, наконец, составим управление в виде (9.22) или (9.25)
для систем, в которых задача синтеза решается на основе
использования квадратичных форм. Для первого вари­
анта этого метода вводится новое управление, а для вто­
рого — новые плоскости разрыва в соответствии с ли­
нейными преобразованиями
и = {СB y 1Du',
s* — D (CB)~h,
где D — симметричная матрица, удовлетворяющая кри­
терию Сильвестра. Запишем для этих случаев уравнения
движения в подпространстве s для первого случая, когда
управление выбирается в соответствии с (9.22), и в под­
пространстве s* для второго случая с управлением (9.25)
s = СА х — Du° — DU sign s,
(9.27)
s* = D {CB)~1 CAx - Du° — DU sign s*,
где компоненты вектора гг0 и диагональной матрицы U оп­
ределяются аналогичными (9.12) соотношениями

“ii+ p ii _
2 н
j'= i
n
>x . (i = 1 ,..., т).
J74= 2 - 2 \x)
?=1
Производные от положительно определенной функ-
1 1
ции v, равной sTD~1s в первом случае и s*TZ)_V — во
втором, в силу соответствующей системы из (9.27) имеют
§ 3] УСТОЙЧИВОСТЬ 205

вид
т п .
й = sTR'x
i=l S'=1 '
V
m n
ъ = 8 ~ г я х - 2 ( 2 3 L _ i i L | a;.|)|S; j )
i=i j= i
где R ' и Я' — матрицы размерности т X п с элементами
r[j и r'ij, равные соответственно D~XCA — U° и (СВ)~1х
X СА — U0, U0 — матрица размерности т X п с элементами
U\j = ij . Очевидно, что функция v будет отрица­
тельно определенной не только на многообразиях s = 0
m ras* = 0, как это имело место в системах с управления­
ми (9.5) и (9.9) при выполнении условий (9.14) или (9.15),
а во всем пространстве (хг, . . ., х п), если

gij Pij
— 2----- > Ы
или , (9.28)

”” о — >\гц\, (i = 1 ,.... т; j = 1 ,..., п).

Условия (9.28) являются достаточными условиями устой­


чивости движения в подпространстве s или s*, а следова­
тельно, и условиями попадания.
Рассмотрим условия, при которых попадание будет
иметь место, если компоненты управления формируются
в виде воздействий не по всем, а лишь по г координатам
в соответствии с (9.5) или (9.9). Пусть пересечение поверх­
ностей разрыва по-прежнему является многообразием
скольжения, т. е. в зависимости от метода синтеза выпол­
няются условия (9.6), (9.10), (9.14) или (9.15). Для ре­
шения вопроса о попадании обратимся к уравнению (9.17),
описывающему поведение системы в подпространстве s.
Описанные в § 1 методы, которые позволяют обеспечить
существование многообразия скольжения, основываются
на двух вариантах линейных преобразований. Первый
вариант связан с введением нового управления it>* в соот­
ветствии с некоторым линейным преобразованием и = Ки*,
второй — предполагает введение новых поверхностей раз­
206 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ СГЛ. IX

рыва s* = Qs. После таких замен уравнения движения в под­


пространстве s или s* , по осям которого отложены расстоя­
ния до плоскостей разрыва, запишутся следующим образом:
s = ^ Ss + Н хт + СВКи*
или (9.29)
s' = Q A s Q 'V -f- Q H xm -f- QCBu.
Матрицы линейных преобразований К или й выбирались
таким образом, чтобы матрицы перед управлениями в урав­
нениях (9.29) оказались диагональными или симметрич­
ными и удовлетворяющими критерию Сильвестра.
Если использовался метод диагонализации (т. е. матри­
цы СВ К или QCB являлись диагональными), то при
выполнении условий (9.6) или (9.10) величины st и вг (или
Si и в,) имели разные знаки в окрестности многообразия
s = 0 (mras* = 0), т. е. s = 0 (roras* = 0) оказывалось
многоообразием скольжения. Очевидно, что в случае, ког­
да матрица A s (или подобная ей матрица = Й.4вй -1)
также является диагональной и ее элементы действитель­
ны и отрицательны, величины s; и аг (или Si и в<) будут
иметь разные знаки уже во всем подпространстве s (roras*),
и следовательно, для таких матриц А , (или А ,) попадание
будет иметь место.
Если же используется метод синтеза, основанный на
составлении функции Ляпунова в виде квадратичной
формы, то матрицы К или й подбирались таким образом,
чтобы матрицы СВ К или й СВ оказались равными/) — не­
которой симметричной матрице, удовлетворяющей крите­
рию Сильвестра. Как было показано в § 1, при выпол­
нении условий (9.14) или (9.15) квадратичная форма
v = у sTD -1s (или v = у s*7D~1s*) и ее производная по вре­
мени имели разные знаки в окрестности многообразия
s = 0 (roras* = 0), т. е. оно оказывалось многообразием
скольжения. Нетрудно убедиться в том, что в случае,
когда матрица A s (или Л 8) равна — D , то функция v и
ее производная по времени будут иметь разные знаки
во всем подпространстве s (или s*), т. е. движение в этом
подпространстве устойчиво «в большом» и, следовательно,
для таких матриц Л j (или А]) попадание будет иметь место.
§ 3] УСТОЙЧИВОСТЬ 207

Полученные здесь условия попадания для систем (9.1)


с управлениями вида (9.5), (9.9), которые на первый
взгляд носят слишком частный характер, могут быть
использованы при синтезе устойчивой системы. В § 2 была
описана процедура выбора управления, при котором
пересечение s = 0 является многообразием скольжения и
движение по нему устойчиво. Усилим теперь условия,
накладываемые на матрицу Г. Потребуем теперь, чтобы
в характеристическом уравнении системы (9.1) при и =
= Г (хт)' помимо п — т корней, которые выбираются
исходя из желаемого характера движения в скользящем
режиме, остальные т корней Xn_m+1, . . ., 'кп были дейст­
вительными и отрицательными. При выполнении условий
существования многообразия скольжения эти корни будут
собственными числами матрицы А 3 в (9.17). Тогда синтез
системы с переменной структурой на основе метода диаго-
нализации, в которой имеет место попадание, проведем
следующим образом. Заменим одновременно выбранные
в соответствии с описанной в § 2 процедурой плоскости
разрыва и вектор управления с помощью линейных преоб­
разований
s* = £2s, и = Ки",

где Q _1 = Т, Т — матрица, состоящая из собственных


векторов матрицы .Аз*"), К = (CB)~1TQ, Q — произволь­
ная диагональная матрица с элементами дг (i = 1, . . ., тп).
Как известно, в этом случае матрица Т -ХА ,Т будет равна
А — диагональной матрице с элементами Я„_т+1, . . . , %т.
Следовательно, уравнение движения в подпространстве
s * (аналогичное уравнениям (9.29)) имеет вид
s* = As* + Т~1Н хт + Q u . (9.30)

Выберем компоненты вектора управления и* в соответст­


вии с (9.9), (9.10) при условии, что матрица Ш в (9.8) и
(9.10) равна Т~гН. Тогда из анализа уравнения (9.30)
при s* = 0, которое аналогично уравнению (9.8), с л е з е т ,
что многообразие s* = 0 является многообразием сколь-

*) Так как матрица А 8 имеет действительные и различные соб­


ственные числа • • ., ^7п, то для нее4существует тп линейно
независимых собственных векторов и матрица Т является невырож­
денной.
208 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

женин. Так как в (9.30) матрица Л является диагональ­


ной с отрицательными элементами согласно приведенным
выше рассуждениям, в такой системе будет иметь место
попадание.
Рассмотрим теперь задачу о попадании в системе, для
которой вопрос о существовании многообразия скольже-
ния решался с помощью квадратичной формы - у sTDs. Мат­
рицу D по-прежнему выберем симметричной и удовлетво­
ряющей критерию Сильвестра, но при этом потребуем,
чтобы собственные числа матрицы —D оказались равными
^n-m+i) • • м km- Как и в методе диагонализации, заменим
поверхности разрыва и вектор управления, выбрав мат­
рицы преобразования следующим образом:

Q = TDT~\ К = (СВ)-1TT'd D,

где То — матрица, состоящая из собственных векторов


матрицы —D. Так как Л = Т~гА 3Т, — То А Т~о =■ D *),
то £2ASQ -1 = —D. В результате получим аналогичное
(9.29) уравнение движения в подпространстве s*:

Г = - Ds' + TDT~1H xm + Du\ (9.30а)

Выберем компоненты вектора и_* в соответствии с (9.9),


(9.15) при условии, что матрица Н * равна D - 1ТоТ~1Н' — U0
(или То ЛГ -1/ / ' — U0). И в этом случае, как это следует
из § 1, многообразие s* — 0 будет многообразием сколь­
жения. В силу того, что матрица, стоящая перед вектором
s*, равна —D , в этой системе будет иметь место попадание
на многообразие s * = 0 при произвольных начальных ус­
ловиях.
Существенно, что во всех рассмотренных случаях
условия попадания являются одновременно и условиями
существования многообразия скольжения. Так как, по
сделанному ранее предположению, движение в скользя­
щем режиме устойчиво, то выполнение условий попадания
гарантирует устойчивость движения системы при произ­
вольных начальных условиях.

*) С помощью этого соотношения можно выбрать матрицу D ,


если задаться произвольной унитарной матрицей TD.
§ 3] УСТОЙЧИВОСТЬ 209

В заключение уместно отметить особенности синтеза


системы с устойчивым движением вдоль многообразия
скольжения, в котором выполняются условия попадания.
!- Для построения системы с такими свойствами необходимо
предварительно найти некоторое линейное управление
и = Г(хт )', обеспечивающее устойчивость рассматриваемой
системы, или выполнение условий Ве^г < 0 {г ~ 1, . . ,,п ).
Однако если значения корней . . ., кп-т существен­
ны с точки зрения движения в скользящем режиме,
так как они его полностью определяют, то движение
до момента возникновения скользящего режима на
многообразии s = 0 зависит не только от корней

Как следует из уравнений (9.30) и (9.30а), скорости из­


менения координат st в методе диагонализации и скорость
изменения функции v, когда поведение системы исследует­
ся с помощью квадратичных форм, зависят не только от
корней Ял_т+1, . . ., Кп, но и от величин компонент векто­
ра управления. Поэтому при любых значениях этих кор­
ней, лишь бы они были отрицательны, время попадания
можно уменьшить, если увеличить по модулю управляю­
щие воздействия.
З а м е ч а н и е . Описанный метод синтеза устойчи­
вой системы предполагает определение такого линейного
управления и = Г (ж771)', при котором в характеристиче­
ском уравнении системы помимо п — т корней, выбирае­
мых исходя из желаемого качества движения в скользя­
щем режиме, остальные т корней являются действитель­
ными и отрицательными. Движение в скользящем режиме
при некотором г, меньшем и равном п — т, можно наде­
лить желаемыми свойствами (как следует из приведенных
в § 1 условий существования многообразия скольже­
ния, с увеличением числа г количество связей на коэффи­
циенты матрицы С, определяющей это движение, умень­
шается, а при г = п — т их можно выбирать произ­
вольными).
Однако может оказаться, что с помощью линейного
управления и = Г (хт)' ни при каком г п — т не
удастся сделать оставшиеся т корней отрицательными
действительными. В таких случаях будем подбирать ли­
нейное управление, позволяющее выполнить это условие,
в виде и — I V , если х 1— вектор с компонентами х х, . . ,,жг,
210 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ 1ГЛ. IX

а число I может оказаться как меныпим, так и большим


п — т (но, разумеется, меньшим тг). Так как при и — Гг1
последнее уравнение в (9.17) совпадает с уравнением для
вектора s в (9.19), то его можно переписать следующим
образом: .^
s = ^4sS + СВ (и — IV ).
Выбирая компоненты вектора и в виде суммы воздействий
по координатам xlt . . ., x t с разрывными коэффициентами,
с помощью любого из описанных в § 1 приемов, многооб­
разие s = 0, найденное в соответствии с описанной в § 2
процедурой, можно сделать многообразием скольжения
с устойчивым движением. (Роль матрицы Н ' будет играть
матрица СВТ , а матрица Н " равна нулю.) Так как линей­
ное управление и = I V подобрано таким образом, что
собственные числа матрицы A s отрицательные и действи­
тельные, то приведенные в этом параграфе методы позво­
ляют обеспечить попадание, а следовательно, и устойчи­
вость системы при произвольных начальных условиях.

§ 4. Метод иерархии управлений


Описанный в главах III и IV метод иерархии управле­
ний предполагает выбор компонент управления таким
образом, чтобы скользящий режим на пересечении $г = 0
(i = l , 1 ^ / c ^ m ) возникал независимо от того,
какие значения принимают компоненты нй+1, . . ., ит.
Если это условие выполняется для любого к (1 ^ к ^ т),
то многообразие s = 0 будет многообразием скольжения.
Для систем произвольного вида с векторным управлением
такая ситуация возникает при выполнении соотношений
(3.30), а последовательность синтеза функции управления
изложена в § 5 главы IV. Существенно, что этот метод
предполагает последовательное рассмотрение скалярных
вадач, но скользящий режим, в отличие от методов диаДК*
нализации, не обязательно возникает на каждой из плос­
костей разрыва в отдельности.
Воспользуемся предложенной в разделе I процедурой
метода иерархии управлений для построения системы
управления линейным стационарным объектом (9.1). За­
пишем аналогичные (3.27) уравнения скольжения по
пересечению плоскостей — 0 (i = 1, . . ., /с; 1 ^ к ^ т ).
МЕТОД ИЕРАРХИИ УПРАВЛЕНИЙ 211

Эти уравнения можно получить с помощью той же после­


довательности действий, которые позволили найти урав­
нения скольжения по пересечению всех поверхностей
разрыва (III. IV). Для этого нужно решить систему
Si = 0, s t = 0 (i = 1 ,. . к) относительно и, (i = 1 , . . ., к),
zn_A+1, . . ., х п, подставить полученные значения в пер­
вые п — к уравнений системы (9.1) и отбросить оставшие­
ся к уравнений *). В результате получим следующую
систему уравнений:
хк — Акх* + Вкик, (9.31)

где х к и ик — (/г — к)- и (т — &)-мерные векторы-столбцы


с элементами соответственно (х1г . . ., х п- к) и (ufe+1, . . .
■••I ^77») •
А к = А к — A n - к { С к) 1С к —

— В к { С кВ к + С к В к ) - ' [С к ( А к — А п- к { С к У 1 С к ) +

+ С " к ( А ' к - A n M C l r 1 С к) 1,

В к ~ В т-к — В к {С к В к + С к В к Г 1 (С к В т-к + С к В т^ к ),

п-к | ■^к ; А п_к


п \ н
Ак ; А п„к
*{
п-к к

Tl-fc | В к ; Вт-к

Вк | Вт—к
•{ 1
к т -к

п -к к

Ск — матрица размерности к Х п со строками с* (г = 1 , . . .


. . ., к).

*) Эти операции можно проделать, если перенумеровать ком­


поненты векторов к и п соответствии с правилом, приведенным в
§ 5 главы IV.
212 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ. IX

Если к = т, то В к - В ', В'т_к = 0, Вк = 0, В"т_к = О,


Ск = С , Ск = С" и система (9.31) совпадает с системой
(III. IV) при F = 0.
Выберем каждую компоненту управления в виде сумр
мы воздействий по гг компонентам вектора (а^, , . ., хп)
так, чтобы гг > Гу при i < / и г{ ^ в — i :
Ч
щ =:— 2 — Ьы (i = 1 , ..., т), (9.32)
3=1
где
( СЩ при а ?# > 0, Г би при « 1 > 0 ,
и

aS,

при X jS i< ^ 0 , ш 1 — 6qi при « * < 0 ,


a t] , Piy, б0г — постоянные величины.
Предположим, что на пересечении s t = 0 (i = 1, . . ., к]
1 к < т) возник скользящий режим, описываемый
уравнениями (9.31). Выясним, при каких условиях после
попадания на плоскость ай+1 = 0 в результате движения
по этому пересечению скользящий режим возникает на
пересечении s t — 0 (i = 1, . . ., /с) и $й+1 = 0 . Определе­
ние этих условий является скалярной задачей, которая
сводится к выполнению условий (1.9) для системы (9.31)
на плоскости s h+1 = 0. Уравнение плоскости s b+1 — 0 на
многообразии s t = 0 (1 ^ i ^ к), вдоль которого действу­
ет система (9.31), имеет вид

Sft+i = = 0, (9.33)

где ск+1 — вектор-строка с элементами ck+lti (i = 1, . . .


..., п — к), определяемый из соотношений

ск+1 — ск+1 {Ск) 1 Ск,


С к +1 = {С к + ъ Cfc+O, Ck + 1 — (к + 1)-я строка матрицы
п -к к

Для нахождений условий возникновения скользя­


щего режима на плоскости sft+1 = 0 определим ве­
личину sfe+1 в силу системы (9.31) с управлением (9.32).
При вычислении s h+1 будем считать, что c5m|Tl-fc ф 0
а также будем иметь в виду условия s к+1 = 0 иль
§4] МЕТОД ИЕРАРХИИ УПРАВЛЕНИЙ 213

п—к —1
%п-к — £ 2 ^k+l, 1 И ^ ^ 1•
ск+1, n-k i= l
7-v п—к—1
„к /„k _n-k\ ck+i, i
L = 2 c k+la k — {c k+la k ) 1>--------- +
J=r/C+1+1 4+1, n-k _
г к+1
„к j,k+l\
+ 2 4+A - (cUiT*) Д +l, n-k---(с£«Ы х)Tk+i,; -
7=1 L.
m

- 2 ( 4 +i 4 - № ж; — (ck+l4+16u, fc+l + 2 ck+l4&ui) i


i= fc + 2 i=k+2
(9.34)
где ai (j = 1, . . n — к) и bk (i = к + 1, . . m) —
столбцы матриц А к ж B h размерности n — к x 1. В силу
^условия гг > гj при i < / некоторые из коэффициентов
(i = /с -j- 2, . . т) могут быть равны нулю. Восполь­
зовавшись рассуждениями, с помощью которых из урав­
нения (5.7) были выписаны условия существования плос­
кости скольжения, получим из (9.34) условия, обеспечи­
вающие возникновение скользящего режима в любой
точке плоскости (9.33):
ск а? ск
Ск + ап~к
А
ск+1ак
„к (У — r k+i + 1) •••) П — к — 1), (9.35)
ск
fc+1, 7 °k+1, n-k

к п-к\ к+1, j
( 4 +l 4 +1) d k + lj ^ c k+la k — (с к+1а к )
ск
ск+1, п-к
т
— min 2 (4 +1*4 ) 'Fy,
(9.36)
c k+1, j
fik+lЬк *) Pk+1, j ^ ck+la k — (c k+la k ) —
Л.
'k+1, n-fc
m
— max 2 (4+ i4) (7 = 1 ,..., a-+i),
i=k+2
m
( 4 « 4 +1)бод-+1 > 2 I (4 + i4 ) 60i |. (9.37)
i =k+2
214 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ 11ГЛ. IX

Неравенства (9.36) и (9.37) в полученных условиях


существования плоскости скольжения устанавливают ие­
рархию управлений, о которой шла речь в разделе I и ко­
торая отражена в условиях (3.30). Так же как и дл^
скалярных случаев, величины 60i можно выбрать сколь
угодно малыми, лишь бы для них выполнялись условия
(9.37).
При выполнении условий (9.35) — (9.37) для любого
к (0 к < ; т) *) любое из многообразий пересечения
st = 0 (£ = 1, . . ., /с; 1 т) окажется многообра-
вяем скольжения. Эти условия при rt < п — £ наклады­
вают дополнительные условия на выбор коэффициентов
уравнений поверхностей разрыва. Вопрос об устойчивости
движения по многообразию скольжения при наличии
этих ограничений может быть решен с помощью теоремы,
приведенной в § 2 настоящей главы. Выбор коэффициен­
тов а а , нужно начинать с номера к = т — 1, при к о­
тором в неравенства (9.36) не входят разрывные коэффи­
циенты, а правая часть неравенства (9.37) равна нулю.
Затем из (9.35) — (9.37) при к = т — 2 определяются
a m-i,} 1 Рт-i,] с учетом выбранных значений а т ,-, р т ^ и
т. д. вплоть до коэффициентов аи, Р^, соответствующих
к = 0.
И, наконец, последний вопрос, который следует рас­
смотреть в связи с применением метода иерархии управ­
лений — вопрос о попадании. Идея метода предполагает
рассмотрение на каждом шаге скалярного случая, по­
этому можно воспользоваться достаточными условиями
попадания (6.8), полученными в § 3 главы V I. Пусть
каждое из многообразий st = 0 (£ = 1, . . ., к; 1 к ^ тп)
является многообразием скольжения и на одном'из них
Si = 0 (£ = 1, . . ., к) возникло движение в скользящем
режиме, описываемое уравнениями (9.31). Тогда при вы­
полнении условий скольжения на всей плоскости s k+1 = 0,
(9.33) согласно (6.8) изображающая точка всегда попадет'
на эту плоскость, если

0. (9.38)
ск
cJc+,1ti-Jc
*) При к = 0 все индексы в уравнении (9.31) следует отбросить,
а с® = cv
j 5] УПРАВЛЕНИЕ НЕСТАЦИОНАРНЫМИ ОБЪЕКТАМИ 215

Очевидно, что при выполнении неравенства (9.38) для всех


к (О О к <( т) изображающая точка из любого началь­
ного положения всегда попадает на плоскость sx = О,
8&т.ем, двигаясь по ней в скользящем режиме, достигнет
пересечения = 0 и s2 = 0 и за т шагов окажется на
многообразии скольжения s — 0. Если движение вдоль
этого многообразия устойчиво, то неравенства (9.38) для
0 О к < т являются достаточными условиями устойчи­
вости системы (9.1) с управлением (9.32) при произволь­
ных условиях.

§ 5. Управление нестационарными объектами

Предположим теперь, что управляемый объект являет­


ся нестационарным, т. е. элементы матриц А и В в (9.1)
меняются во времени. Задача управления будет решаться
при условии, что параметры объекта не доступны для
измерения и известен лишь диапазон их изменения

вр min ®р ( 0 ^ е у тах
(i, j = 1 , • • •) Щ Я р m ini е у max ■ const),
(9.39)
b p m in ^ by (0 ^ b y m ax

(i — 1 , • • -j e ; j = 1 , . . ., ТП', b y m in , b y m a x - const.

Приведенные в § 1 настоящей главы методы синтеза


не могут быть использованы при решении этой задачи,
так как для их реализации необходима информация о ко­
эффициентах матрицы СВ, а параметры недоступны
для измерения. Покажем, что если известны лишь знаки
произведений с£+хЬь-+1 (0 к < ; та) и выполняются условия

^ i n f |c £ +xb £ + 1 1=f= 0, (9.40)

то задача управления за счет использования скользящих


режимов может быть решена с помощью метода иерархии
управлений. Выберем функцию управления в виде
71— i

щ= 2 vi V i (i = 1 , . . . , m), (9.41)
3=1
216 УП РАВЛЕНИ Е СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ . IX

где
при ® # > 0 ,
й — 1 Ру при XjSi < 0. ущ .

(В отличие от (9.32) в этом управлении г* = п — i.) Для


управления (9.41) будут отсутствовать условия (9.35), ко­
торые нельзя выполнить при неизвестных параметрах мат­
рицы А . Выполнение неравенств (9.36), если справедливы
условия (9.39) и (9.40), всегда можно обеспечить за счет
выбора коэффициентов и

sign (ск+1Ь*+1) aft+1 з > max sup - 1 - \ck


k+lai -
*4 < I Ck+ A IL

- ( W -°/c+l,
r 1 -
n -k
S (cmbjb'fJ
i=fc+2J
(9.4:
sign (ск+1Ь|+1) Pk+i,j < min in f— -1 — \ck
k+1a[ —
t |c*+1b*+11 L
ck m1
--- S ( « ) ^ з
Ck+1, n-k »=*+2

В разделе II обосновывался тот факт, что если управле­


ние состоит из суммы воздействий по всем координатам,
кроме одной, то при выполнении условий попадания ре­
лейную компоненту в управлении можно отбросить,
а условия существования плоскости скольжения должны
иметь вид строгих неравенств. Далее мы запишем условия
попадания для рассматриваемой системы и будем счи­
тать, что эти условия выполняются. Именно поэтому в
управлении (9.41) отсутствует слагаемое 6мг и соответст­
венно вместо условий (9.36) и (9.35) записаны условия
(9.42). При решении вопроса о попадании, так же как ц,
для систем с постоянными параметрами, можно восполь­
зоваться условиями попадания, полученными в разделе
II для скалярного случая. Эти условия (7.5) примени­
тельно к рассматриваемой системе имеют вид

ск ап~к
ск+1ак
sup <^0 (0 (9.43)
( А+1, п-к
fil КОМБИНИРОВАННЫЕ СИСТЕМЫ 217

Таким образом, в системе (9.1) с изменяющимися па­


раметрами и управлением (9.41) при выполнении соотно­
шений (9.42) и (9.43) всегда начнется и не прекратится
движение в скользящем режиме, описываемое уравнения­
ми (п — пг)-го порядка (III. IV) при F (t) = 0. Сущест­
венно, что условия существования многообразия сколь­
жения (9.42) можно выполнить при любых значениях
коэффициентов матрицы С, от которых зависит это дви­
жение.

Г Л А В А X

УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ

§ 1. Комбинированные системы

Ч. Изучение методов синтеза систем управления вынуж­


денным движением объектов, описываемым уравнением
(III. I), начнем со случая, когда внешние воздействия
(возмущающие или задающие) доступны для измерения.
Полагая, что за счет разрывных управлений вдоль пересе­
чения плоскостей разрыва (III.II) может возникнуть дви­
жение в скользящем режиме с желаемыми свойствами, по­
пытаемся сделать это пересечение многообразием сколь­
жения и обеспечить попадание на него любой фазовой
траектории системы. Для этой цели воспользуемся прин­
ципом комбинированного управления, который предпола­
гает использование в функции управления как координат
системы, так и измеряемых внешних воздействий, а синтез
осуществим на основе метода иерархии управления. Урав­
нение движения по пересечению плоскостей s t = 0 (i = 1 ,. . .
. . ., к', 0 ^ к < ; тп) *), с помощью которого выбираются
параметры функции управления, будет отличаться от
(9,5-1) наличием в правой части вектора внешних воздейст­
вий
хк = А кхк + D kF + Вкик. (10.1)

В (10.1) хк, A h, B h и ик определяются в соответствии с

*) При к — 0 это уравнение совпадает с исходным уравнением


(III. I).
218 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛД

(9.31), а матрица D h находится из соотношения

Dk = Dk — Вк (СкВк + СкВк) 1 (CkDk 4 - CkDk),


Dk | n-k
D —
Dl }* '
Предполагая, что параметры объекта постоянные, со­
ставим функцию управления следующим образом:

щ = щ + u f,

где Ui совпадает с щ в (9.32),


i
= (i = 1 , . . . , тп),
i=i
т , | а 'з при М >0,
13 I Pij при /# < 0 .
Следуя схеме рассуждений, описанной в § 4 главы IX .
для свободного движения, найдем условия существования'
скользящего режима в системе (10.1) с управлением (10.2)
для любой точки плоскости sh+;l = 0, определяемой урав­
нением (9.33). Вычислим величину sft+1 для этого случая:
i
5/i+l = Sfc+1 + 2 f ck+l<^k — ск
к+1Ьк+1Чг,к+1 —
3=1 L
та

- 2 (clnbk)^li\fh ( ю .з )
l=k+2 J

где Sft+i совпадает с правой частью уравнения (9.34),


a dk (j = 1, . . ., 1) — столбцы матрицы D h.
Из уравнения (9.34) были получены соотношения*'
(9.35) — (9.37), обеспечивающие выполнение условий
возникновения скользящего режима (1.9) на плоскости
s h+1 = 0 в пространстве х ъ ..., хп- к для случая свободного
движения. Согласно (9.34) и (10.3) эти условия будут
выполнены и для вынужденного движения, если, во-первых,
справедливы соотношения (9.35) — (9.37) и, во-вторых,
§ 1] КОМБИНИРОВАННЫЕ СИСТЕМЫ 219

выполняются следующие неравенства:


m
(ct+i^k *) °*+i, j с , , А — min 2 Л+Фк) 'Fy,
.54. i=)£+2

(Ck+l^)c+1) Pft+1, j ck+l^k — (10.4)


m
-m a x 2 (7 = 1 , . . . , 1)-
'f't. i=)c+2
i]
При выполнении условий (9.35) — (9.37) и (10.4) для всех
к (0 к < тп) любое из многообразий $г = 0 {i — 1,...
. . к; 1 к т) окажется многообразием скольжения,
в том числе и многообразие пересечения всех поверхностей
разрыва s = 0.
По аналогии с комбинированными системами со ска-
'лярными управлениями (§ 1 главы V III) и в этом вектор­
ном случае неравенства (9.38), приведенные для свобод­
ного движения, являются одновременно условиями попа­
дания и для вынужденного движения.
В случае, если параметры объекта меняются во вре­
мени, составляющую и? в управлении (10.2) следует вы­
брать в соответствии с (9.41), (9.42) и переписать условия
(10.4) с учетом переменности параметров

sign (4 +1&Г1) 4 - n , i > max sup |c£+1b£+1|-i x


*
Zij

x Ic iA - 2 ( W 'H -'l,
L i=fc+2 J
) (10.5)
sign (Ck+1bfc+1) P*+i, j < min inf 14+ibit+1 Г1 X
4 4
m
x [4+14 - 2 (сЪЛ) Щ ( y - i ,. . i).
L i=lc+2 J

Выполнение условий (10.5) вместе с условиями (9.42) для


всех к (0 к < т) обеспечивает существование многооб­
разия скольжения, которое совпадает с пересечением всех
поверхностей разрыва. Неравенство (9.43) для этой
220 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ.Х

системы по-прежнему является условием последовательно­


го попадания изображающей точки на многообразия
(п — 1)-го (Sj = 0), (п — 2)-го (sx = 0, s2 = 0) и т. д.
вплоть до (я — лг)-го порядка (s = 0). —,
л
§ 2. Системы без измерения внешних воздействий

Рассмотрим теперь системы, в которых задача управле­


ния вынужденным движением решается без непосредст­
венного измерения внешних воздействий. Идея решения
такого рода задач уже обсуждалась в главе V III приме­
нительно к системам со скалярным управлением. В таких
системах не удается обеспечить желаемый характер дви­
жения за счет скользящих режимов, используя лишь воз­
действия по отклонениям, и следует найти такую коорди­
нату, которая, с одной стороны, призвана парировать
действие возмущений и, с другой стороны, в ней заложена j
информация о величине этих возмущений. В системах4
управления такой координатой обычно является выходная
величина исполнительного устройства. В § 3 главы V III
был указан вид дифференциальных уравнений системы,
для которого такая координата в системе находится.
Покажем теперь, что аналогичный подход может быть
реализован и в векторном случае, если движение системы
описывается уравнениями следующего вида:
х* = А V + D 'F + ВГи, (10.6)
где х* — л-мерный вектор состояния с элементами (xlt.,.
• ■ •, Х т , уг, . . ., ут, х гт+1, . . ., х п), и и F — п-мерный
и Z-мерный векторы управления и внешних воздействий,
A*, D ’ , В ' — постоянные или' переменные матрицы с эле­
ментами ац (i , j = 1, . . ., п), (1ц (i = 1, . . . , n ; j = 1, . . ., 1).
blj{i = 1 ,. . ., n; / = 1 , . . . , m). Специфическая особенность
системы (10.6) заключается в том, что существует т коор- ^
динат, например хг, . . ., х т, в уравнения которых не
входят компоненты ut вектора и, т. е.

Ъ*ц = 0 (г, / = 1, •• т ). (10.7)


Попытаемся обеспечить в такой системе существование
многообразия скольжения (п — /п)-го порядка без непо­
средственного измерения внешних воздействий / х, . . .,
§ 2] СИСТЕМЫ БЕЗ ИЗМЕРЕНИЯ ВНЕШНИХ ВОЗДЕЙСТВИЙ 221

составляющих вектор F. Вместо координат уи . . ., ут,


составляющих вектор у %введем новые переменные
т т п—2тп
+ 2 &г, тьзУз “ Н 2 а 2т+3Х2.тп+з
3=1 3=1 3=1
тп
+ 2 d«/j (i = 1, . . m) (10.8)
3=1

и далее поведение системы будем изучать в пространстве


% , . . . , х п, а ее состояние характеризовать вектором х
с этими компонентами *). Предположим, что за счет
выбора коэффициентов матрицы С движение в скользя­
щем режиме по пересечению плоскостей (Ш Л И ) в прост­
ранстве хг, . . ., х п удалось наделить желаемыми свойства­
ми, и попытаемся сделать это многообразие многообразием
Скольжения. Для этой цели компоненты вектора и составим
:,з виде суммы воздействий по координатам вектора состоя­
ния а; и по координатам вектора у, которые, как и в ска­
лярном случае, характеризуют внешние воздействия:
и = их -f- (10.9)
где и? = Л™?/, — матрица с элементами

| с$ при siyj > 0,


1 при Siу5< 0, Оу, Pij — const (i, j = 1, . . . , m),
(10.10)
а вектор ux формируется в соответствии с (9.41), так как
такой закон управления необходим в случае переменных
параметров системы.
Запишем теперь уравнения движения системы в прост­
ранстве х1, . . ., хп. Предварительно решим систему урав­
нений (10.8) относительно исключенных из вектора со-
йояния координат y t (i — 1, тп), предполагая, что
det I a* i, тn+j I (i, / *= 1, . . тп) не равен нулю:
у = Н х + D VF, (10.11)
*) Для системы (10.6) всегда выполняется условие 2тп п,
так как в противном случае ранг матрицы В будет меньше тп, а это
вырожденный случай, в котором столбцы матрицы В линейно зави­
симы и размерность управления можно понизить.
222 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [ГЛ.Х

где Н n D y — матрицы размерности т X п и т X I, зави­


сящие от коэффициентов исходной системы. Функцию
иу перепишем в виде
uv = - 0 ( O y - [ Y w- 0 ( « ) ] i r , (Ю .1%
где 0 (t) — матрица, элементами которой являются функ­
ции Qtj (t) (i, / = 1, . . т), и об их выборе будет сказано
ниже. Для получения уравнений движения относительно
х1, . . х п нужно вместо первых т уравнений исходной
системы (10.6) записать уравнения x t = хтН (i = 1, . . т),
вместо уравнений относительно у г, . . ., у т — уравне­
ния, которые получатся в результате дифференцирова­
ния системы (10.8) в силу исходной системы, и, наконец,
вместо компонент вектора у всюду, за исключением послед­
него слагаемого в (10.12), следует подставить их значения
из (10.11). Эта процедура оказывается реализуемой для
систем вида (10.6), (10.7). При нарушении условия (10.7)J
правые части в уравнениях (10.8) оказались бы недиффе-.|
ренцируемыми функциями. В итоге получим систему1
х = А х + Вих — В (Wv — 6) у - BBDVF + D F + DF, (10.13)
где элементы матриц А , В, D , D зависят от коэффициентов
исходной системы, матрицы 0, а также производных от
коэффициентов уравнения (10.8). Будем считать, что все
параметры в системе (10.13) являются ограниченными
функциями времени *).
Действуя далее в соответствии с процедурой метода
иерархии управлений, выберем параметры управляющего
воздействия таким образом, чтобы пересечение границ
разрыва (Ш Л И ) оказалось многообразием скольжения.
Вычислим величину 3ft+1, предполагая, что на пересечении
S( = 0 (i = 1, . . ., к; 0 ^ к т) возник скользящий
режим, который описывается уравнениями
** = V е + Вкихк - Вк № - е к) у - BkBkDyF +
__________ __ + D kF + D kF, (10.14^
*) Этим мы ограничиваем класс рассматриваемых систем и со­
гласно этому ограничению коэффициенты и их-производные в систе­
ме (10.6) должны быть ограниченными функциями. Кроме того, от­
метим, что для ограниченности коэффициентов в решении (10.11)
системы (10.8) должно выполняться условие
inf |(det I ^ m+j|| )| ф 0 («,/' = 1, .. т).
§ 2] СИСТЕМЫ БЕЗ ИЗМЕРЕНИЯ ВНЕШНИХ ВОЗДЕЙСТВИЙ 223

где х к, A k, B h, ихк, D h находятся в соответствии (9.31)


и (9.34), Т-” и 0Й — матрицы размерности (тп — к) X т
с элементами Т у и 0;£ (i = к + 1, . . т; / = 1, . . ., т),
■матрица Dh определяется из аналогичного (9.44) соотноше­
ния
В к = Dk — В к (СкВк CkB k)~r (CkD k CkD k),

|К }к

Величина sfc+1 в силу системы (10.14) имеет вид

Sfc+l = 4+1 + 4+1 + 4 + Ь (10.15)


где 4+i совпадает с правой частью (9.34) при г к = п — к — 1
и би; = 0 (i = к + 1, . . т):
lit’
4 + 1! '■— 2 Г (4+i 4 *) (V^l'+i, з — Ofi+i, i) _h
i= iL
m—Jc
+ 2 ( с 1 Л +1) ( хГ Ъ и - % +и )\ у »
i—2
m m —k
•f
5/i+i: = - 2 { | ~ ( 4 + i 4 +1) Q/.41.3+ 2 ( 4 +i ^ +i)e A+i>il x
3=1 lL i=2
l l I

x ( 2 </<?)} — 2 4+iditj — 2 4 + Д /г
4=1 3=1 i=i
dk и dk (j — i, 1) — столбцы матриц D k и £)fc, —
элементы матрицы Z)u.
Будем в дальнейшем рассматривать векторы у и F как
внешние воздействия для системы (10.13), причем для
измерения доступны лишь компоненты вектора у. Так же
как и при синтезе комбинированных систем, предваритель­
но выполним условия, при которых многообразие s = 0
является многообразием скольжения для свободного дви­
жения (т. е. при у = F == 0). Для систем с переменными
параметрами согласно § 5 главы IX такими условиями
являются неравенства (9.42), которым должны удовлетво­
рять коэффициенты a i;- и (5£j в функции их.
224 УПРАВЛЕНИЕ ВЫНУЖДЕННЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ ЕГЛ.Х

Наложим ограничения на класс допустимых внешних


воздействий Д, . . ., /,:

------ s r - г ;=1-------------- < м * (* = 0 ........m — 1). 1


21
;=119=1
2 dn U \

(10.16)
Очевидно, что при таких ограничениях и ограниченных
по модулю функциях Qh+t, j (£ = 2 , . . ., т — к; j = 1, . . .
. . тп) найдутся такие функции 0 ft+li3-(/ = 1, . . тп),что
слагаемые sf +1 в (10.15) (к = 0, . . ., тп — 1) будут тож­
дественно равны нулю и при этом будут справедливы
оценки
тп— /с

"«+ 2 К'Е,А*Н«,1<‘)|
| 0 » a . i W K “ P --------- - 7 7 - д а -;-------------- • (10-17)

(Здесь, как и ранее, предполагается, что справедливо


условие (9.40).)
Полученные оценки носят рекуррентный характер.
Сначала следует найти верхние границы для функций
&mj (/ = 1, . . ., т) из (10.17) при к = т — 1, которые
определяются только параметрами системы и классом
внешних воздействий (10.16) и не зависят от остальных
элементов матрицы 0 (i). Далее по этим оценкам из (10.17)
при к = т — 2 находятся верхние границы функций
(/ = 1, • • т) и т. д. вплоть до 01;- (/ = 1, . . ., т).
Итак, в выражении для s h+1 функция sf+1, зависящая
от неизмеряемых внешних возмущений, при ограничениях
(10.16) тождественно равна нулю, а все элементы 0 ft+i)y
(i = 1, . . ., т — к] / = 1, . . ., т), матрицы 0, от кото- ч
рых зависят коэффициенты в являются ограничен­
ными функциями времени. Компоненты вектора у, из ко­
торых составлена функция s^+i, мы условились рассматри­
вать как доступные для измерения внешние воздействия.
Для этого случая задача синтеза может быть решена на
основе описанного в предыдущем параграфе метода по­
строения комбинированных систем. В результате приме-
§ 2] СИСТЕМЫ БЕЗ ИЗМЕРЕНИЯ ВНЕШНИХ ВОЗДЕЙСТВИИ 225

нения этого метода приходим к аналогичным (9.48) соот­


ношениям, которые и позволяют выбрать коэффициенты
воздействий по координатам y t:

sign (4 +1Ък+1) 4 '+1, j > max sup 0k+lij— Г


т» , . < L
K+i,j
m—k

- I( c 'k V r 1 | S ( c L l ^ +i) ( П '+1,, - 9/c+i, i)l ,


i= 2 ^

sign (Cft+1bs+1) Pit+i, j < min inf [ 0fc+lii—


да!) .1 L
/г+г, 3
m—k

- 1( 4 V 1) - 1 1 2 (с|+1ь Г ) № i , J - Qk+i, ,)1


i= 2 J
(* = 0, — 1; 7 = 1 , . . . , m).
(10.18)
Полученные соотношения (10.17), (10.18) вместе с нера­
венствами (9.42) позволяют выполнить условия возникно­
вения скользящего режима на всем пересечении поверхно­
стей разрыва для внешних воздействий, принадлежащих
классу (10.16). Предлагаемый здесь алгоритм управ­
ления реализуется без измерения внешних возмущений и
меняющихся параметров объекта. Как и для систем со
скалярным управлением, при решении вопроса о попа­
дании можно воспользоваться полученными для свобод­
ного движения условиями (9.43), которые применительно
к рассматриваемому здесь случаю запишутся в виде

max sup Cjj+1^ * ■< 0. (10.19)


да, wV. 1 ск+1,п-к

•(В (10.19) находится максимум по всем и от кото­


рых зависит вектор-столбец а"- *1.)
В заключение остановимся на характере ограничений
(10.16). Эти ограничения могут оказаться недостаточно
наглядными, поэтому представляется целесообразным
иметь более жесткие ограничения, но на каждую из функ­
ций fj (t). Рассмотрим случай т = I. Покажем, что

8 В. И. Уткин
226 УПРАВЛЕНИЕ СВОБОДНЫМ ДВИЖЕНИЕМ ОБЪЕКТОВ [Гл. X

если inf |det ||d^J| =j= 0 и


i
1/з (t)lfj ( 0 1< B 0 (B0 — const; / = 1 , . . 1), (10.20)
то неравенство (10.16) справедливо. Действительно, обо­
значим z = D VF и оценим дробь

2 (c£-+id!c) fj + 2 )h
3=1________________ l = i _____________
sup
I
2 | 2 dqjf) I
9=1 3=1 1

2 1 /j I (I cft+i 4 i + i °UA i)
< sup ----------- j--------------------=
' 2 K I
9= 1

2 % I*; I
= sup Щ ---------- < M k. (10.21)
' 2 K i
9= 1
Здесь
i
Tkj — 2
i= l
I dii I ' (I c!t+A |+ B01ck+idk |),

eta — элементы обратной матрицы (Dv)~x. Так как все


коэффициенты y hj являются ограниченными функциями
времени, то такие положительные числа М к, при которых
неравенства (10.21) справедливы, всегда найдутся. Таким
образом, для входных воздействий из класса (10.20) огра­
ничение (10.16) выполняется.
Ограничения (10.20) более сильные, чем (10.16). Они
исключают, например, знакопеременные функции, тогда
как неравенство (10.16), вообще говоря, выполняется
при всех fj, не равных нулю одновременно. Например, для
т = I ~ 2 и Д = cos соt, / 2 = sin соt неравенства (10.20)
нарушаются, а (10.16) может и не нарушаться*).
*) Неравенства (10.20) могут нарушаться не только для зна­
копеременных функций. Например, для / = 2 -j- sin coZ2 при боль­
ших t могут нарушаться как (10.20), так и (10.16).
* I] ПОСТАНОВКА ЗАДАЧИ 227

При I ■< т все рассуждения останутся в силе, если


в оценке (10.21) из всех строк матрицы D v выбрать I линей­
но независимых и сохранить в знаменателе соответствую­
щие им слагаемые, а остальные отбросить. Тогда, несмот-
'рн на увеличение левой части в неравенствах (10.21), поло­
жительные числа M h все равно найдутся, и следователь­
но, ограничения (10.16) останутся справедливыми и для
этого случая.

ГЛАВА XI

ИНВАРИАНТНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

§ 1. Постановка задачи и условия


инвариантности скользящих движений

Во всех рассмотренных ранее задачах управления


для получения желаемых уравнений скольжения следова­
ло соответствующим образом выбрать коэффициенты урав­
нений поверхностей разрыва. В случае, если объект управ­
ления является нестационарным, с практической точки
врения важно выделить класс систем, в которых скользя­
щие движения не зависят от внешних возмущений и от из­
менения параметров объекта. В связи с этим уместно
отметить, что на первом этапе развития теории систем
с переменной структурой [34] основные результаты были
получены применительно к системам со скалярным управ­
лением, обладающим свойством инвариантности скользя­
щих режимов за счет формирования функции управления
из координаты ошибки и ее производных. Такого рода
системы описываются уравнениями вида (II. V II), а воз­
никающие в них скользящие режимы согласно (II.V III)
зависят лишь от коэффициентов уравнения плоскости
разрыва.
Рассмотрим теперь условия инвариатности скользящих
режимов для динамических систем общего вида
х = / (х, t) + В (х, t) и + h (х , t). (11.1)

Система (11.1) отличается от системы (2.2) наличием до­


полнительного /г-мерного вектора h (х, t), а компоненты
m-мерного вектора и по-прежнему претерпевают разрывы

8*
228 ИНВАРИАНТНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ [ГЛ. XI

на поверхностях s, (ж) = 0 (i = 1, . . т) в соответствии


с (2.3).
Покажем, что движение в скользящем режиме инвари­
антно по отношению к вектор-функции h (х , t), если в любой
момент времени этот вектор принадлежит пространству,
натянутому на векторы-столбцы матрицы В (х , t). Выполне­
ние этого условия означает, что существует т-мерный
вектор X (ж, t), удовлетворяющий соотношению
h (х , t) = В (х , t) X (х , t). (11-2)
Действуя в соответствии с процедурой метода эквивалент­
ного управления, запишем для системы (11.1) уравнение
скользящего движения, возникающего на пересечении
всех поверхностей разрыва
х = [Е — В (G 5 )'1G] / (х, t) — [Е — В (G B)'1 G] h (х, t), (11.3)

где G — матрица размерности т X п, строками которой


являются градиенты функций st (х). В результате непос­
редственной подстановки вместо h (х, t) вектора В (ж, t) X
х Х (х , t) в уравнение (11.3) убеждаемся, что условие (11.2)
действительно является условием инвариатности сколь­
зящих движений по отношению к вектору h (х, t).
Далее мы воспользуемся этим общим условием для
получения различных видов инвариатности в линейных
нестационарных системах (I II.I). Порознь будут рассмот­
рены условия независимости скользящих движений от
внешних возмущений, изменения параметров объекта,
а также независимости какой-либо совокупности координат
от других координат системы.

§ 2. Инвариантность к внешним возмущениям

Пусть система управления вынужденным движением


линейного объекта описывается уравнением
х = A (t) х + D (t) F (t) + В (t) и. (11.4)
Параметры уравнения (11.4) определяются в соответствии
с (I I I .I) Выясним, при каких условиях движение в сколь­
зящем режиме по пересечению п л о с к о с т е й = 0 (г = 1, ...
. . ., т) не будет зависеть от произвольных внешних воз­
мущений Д, . . Д, составляющих вектор F (t). Рассмат-
§ 2] ИНВАРИАНТНОСТЬ К ВНЕШНИМ ВОЗМУЩЕНИЯМ 229

риваемая здесь задача об инвариантности, которая пред­


полагает независимость уравнений движения от возмуще­
ний, отличается от обычно изучаемой в теории инвариант-

’-дости постановки, связанной с достижением независимости
от возмущений какой-либо координаты [73, 91, 92]. Возму­
щения /i, ■ • ., /; — произвольные независимые функции
времени. Поэтому условия инвариантности следует найти
по отношению к каждому из них в отдельности. Согласно
(11.2) независимость движения в скользящем режиме от
Д, . . ., /, будет иметь место, если каждой из столбцов
d> (t) матрицы D (t) можно разложить по направлениям
векторов-столбцов матрицы В (t). Другими словами, ин­
вариантность по отношению к возмущениям в системе
(11.4) может быть достигнута, если существует такая матри­
ца A d (t), для которой выполняется соотношение

D (t) = B (t)A D(t). (11.5)

В частности, для системы (II.V II) со скалярным управле­


нием, в которой уравнения скольжения (II.V III) не зави­
сят от скалярного возмущения / (t), полученное условие
инвариантности выполняется, так как в векторах Ъ и d
все элементы, кроме последнего, равны нулю, и поэтому
эти векторы коллинеарны.
Существенно, что в системах рассмотренного типа
движение не зависит от возмущений, вообще говоря, лишь
с момента возникновения скользящего режима на пересе­
чении поверхностей разрыва. Задачи создания скользящих
движений могут быть решены с помощью описанных в
разделах II и III методов управления вынужденным дви­
жением. В случае, если внешние воздействия не удается
измерить, структура дифференциальных уравнений долж­
на удовлетворять определенным требованиям, в частности,
для систем со скалярным управлением и скалярным воз­
мущением одно из уравнений системы не должно зависеть
от функции управления (см. главу V III). В тех случаях,
когда эти требования не выполняются, желаемую структу­
ру уравнений движения можно получить искусственно
за счет введения в систему линейных фильтров с разрывны­
ми параметрами. Метод синтеза, основанный на этой идее,
применительно к системам с инвариантными скользящими
движениями, описан в монографии [45].
230 ИНВАРИАНТНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ [ГЛ. X i

§ 3. Инвариантность к изменяющимся параметрам


объекта
Рассмотрим систему управления свободным движением
объекта с переменными параметрами
х = А (г) х + АЛ (£) х + В (t) к, (11.6)
где АА (г) — матрица переменных параметров, влияние
которых на процесс управления желательно устранить.
И в этом случае возможность разложения векторов-
столбцов матрицы АА (t) по направлениям векторов-
столбцов матрицы В (t) свидетельствует о возможности
достижения инвариантности по отношению к элементам
АЛ (£). Существование матрицы А а (t), для которой
АЛ (£) — В (£) Да (0> (11.7)
является достаточным условием независимости сколь­
зящих движений от АЛ (t) в системе (11.6) по пересе­
чению плоскостей разрыва s{ = 0 (г = 1,..., т). Условия
(11.7) можно ослабить, если учесть, что скользящие
движения со свойством инвариантности возникают
на многообразии (III.II), и поэтому вектор АЛ (t) а; для то­
чек этого многообразия запишется в виде
АЛ {t)x = [АЛ' (J) — АЛ" (i) (С")'1 С') хт, (11.8)
где хт, С и С" определяются согласно (I II.IV),
АЛ (t)x = 1АЛ' (t) j АЛ" (<)||.
П—771 т

В соответствии с (11.8) инвариантность будет иметь


место, если существует такая матрица А а (2), для ко­
торой выполняется соотношение
АЛ' (0 — АЛ" (t) (<O'Г 1С = В (t) А а (г).
Для системы (II.V II), в которой движение в сколь-;
зящем режиме (II.V III) не зависит от коэффициентов
аг,..., ап, все строки матрицы АЛ (£), кроме последней,
равны нулю. Все элементы, кроме последнего, равны
нулю и в векторе Ъ этой системы. Это означает, что все
столбцы матрицы АЛ (i) и столбец Ъ коллинеарны и,
следовательно, условия инвариантности скользящих дви­
жений (11.7) для системы (II.V II) выполняются,
8И ПОСТАНОВКА ЗАДАЧИ 231

§ 4. Селективная инвариантность
Пусть движение системы управления описывается
уравнениями
я1 = А ц Х1 + Л 12ж2 + В v 1, 1
= А21х 1 + А ггхг + В2и•?, } ( •)

где ж1 и ж2 — векторы с размерностью пг и п2, и1 и и2 —


векторы управления с размерностью и т2, А п , А 12,
А 21, А г2, j51} В2 — постоянные или переменные матрицы.
Компоненты вектора и1 претерпевают разрывы на плос­
костях «i (ж1) = 0 (i = 1,..., тх), а вектора и2 — на
плоскостях si (ж2) = 0 (г = 1,..., т 2).
Задача состоит в определении условий, при которых
во время движения в скользящем режиме компоненты
вектора ж1 не зависят от вектора жг. Компоненты век­
тора ж8 в уравнениях относительно ж1 можно рассмат­
ривать как внешние возмущения, поэтому для решения
поставленной задачи можно воспользоваться условием
инвариантности, приведенным в § 2. Применительно к
системе (14.9) условие (11.5) запишется в виде
А п = В ,А Х- (11.10)
Если найдется такая матрица Л*, что выполняется ус­
ловие (11.10), то движение в скользящем режиме по пе­
ресечению плоскостей si = 0 (i = 1,..., mx) инвариант­
но по отношению к компонентам вектора ж2.

ГЛАВА XII
ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ
В ЗАДАЧАХ ОПТИМИЗАЦИИ

§ 1. Постановка задачи и принцип построения


системы оптимизации

В этой главе рассматривается задача статической


оптимизации, состоящая в нахождении такого сочета­
ния входных параметров оптимизируемого объекта, при
котором скалярный выход объекта достигает экстре­
мального (например, минимального) значения.
232 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. X II

Применительно к одномерному случаю, когда входной


параметр является скалярным, идея развиваемого здесь
подхода заключается в следующем. Выходная величина
оптимизируемого объекта сравнивается с некоторым подоб--,
ранным специальным образом задающим воздействием,
которое является монотонно убывающей функцией време­
ни. Входное же воздействие объекта формируется на основе
сигнала рассогласования между его выходом и задающим
воздействием и должно свести это рассогласование к нулю.
В результате выходная величина объекта, отслеживая
монотонно убывающее задающее воздействие, достигает
своего минимума. Специфика задачи, связанной с построе­
нием такой своеобразной следящей системы, заключается
в том, что локальный коэффициент усиления объекта управ­
ления неизвестен и изменяется как по величине, так и по
знаку. С физической точки зрения, управляющее устройст­
во в такой системе без использования какой-либо инфор­
мации об этом коэффициенте должно обеспечить такое
направление изменения входной величины объекта, чтобы
его входная величина всегда убывала, повторяя задающее ,
воздействие независимо от того, на какой ветви экстре­
мальной характеристики находится объект в данный мо­
мент. Сформулированная таким образом задача слежения
без измерения локального коэффициента усиления в каж­
дой точке экстремальной характеристики будет решаться
за счет преднамеренного введения в систему движения
в скользящем режиме. Заметим, что получение информа­
ции о локальном коэффициенте усиления объекта, по сути
дела, означает измерение градиента экстремальной харак­
теристики (или каких-либо его проекций), которое обычно
предусматривается в экстремальных системах. Сущест­
венно, что само измерение чаще всего связано с введением
в систему специальных устройств для организации проб­
ных движений на входе объекта и анализа их реакции на
выходе [70, 76].
Основной целью настоящей главы является изложение
сущности самого метода, и поэтому наиболее подробно
рассматривается задача одномерной оптимизации. Затем
поясняется, каким образом описываемый метод может быть
использован при решении многомерных задач оптимиза­
ции, и приводятся его модификации, позволяющие осущест­
вить оптимизацию при наличии ограничений типа равенств
§ 2] ОДНОМЕРНАЯ ОПТИМИЗАЦИЯ 233

и неравенств на входные параметры объекта. Обсуждаются


возможности использования предложенных алгоритмов
для решения задач оптимизации нестационарных объектов,
'-а_также возможности этих алгоритмов для организации
различных процедур изменения направления поиска в
пространстве входных параметров.

§ 2. Одномерная оптимизация с постоянной скоростью


поиска

Рассмотрим простейшую задачу оптимизации статиче­


ского объекта, описываемого уравнением
У = f (ж), (12.1)
где х, у — входное и выходное воздействия, а функция
/ (х) дифференцируема, достигает минимума при некото­
ром неизвестном значении входной величины х0 и ^ =j= О
при х =j= х0. Задача состоит в организации такого процесса
поиска, который позволяет минимизировать выходную
величину объекта. Попытаемся
решить эту задачу оптимизации
в классе алгоритмов аналого­
вого типа, в основе которых ле­
жит непрерывное изменение
входного воздействия в зави­
симости от состояния систе­
мы. Как обычно, такая си­ Рис. 15.
стема, состоит из управляющего
устройства (УУ на рис. 15), формирующего функцию уп­
равления и, которая подается на интегрирующее звено,
в результате чего и осуществляется процесс поиска. В со­
ответствии с намеченным в § 1 планом решения задачи
оптимизации нам предстоит построить систему, в которой
выходная величина у отслеживает какую-либо монотонно
убывающую функцию и тем самым приближается к экстре­
муму. Целью управления является сведение к нулю рас­
согласования е, равного
£ = 8 it) — У (*)> (12-2)
где g (t) и является монотонно убывающей функцией, на­
зываемой в дальнейшем задающим воздействием. В этом
234 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ. РЕЖИМОВ |ГЛ. XII

параграфе будет рассмотрена система оптимизации, в ко­


торой задающее воздействие убывает с постоянной скоро­
стью.
Решение сформулированной таким образом задачу
будем искать в классе релейных систем, в которых управ-'
ление и может принимать лишь одно из двух возможных
значений. Структурная схема системы изображена на
рис. 16, а движение в ней описывается уравнениями

» = /(* ). g = — Р + у,
(12.3)
± — и, и = A sign (sx s2),
где р, А — const, А > 0, р )> 0, % = е, s2 = е + 6, б —
малая положительная величина. О назначении дополни­
тельного воздействия v будет сказано ниже.

Обычно в релейных системах функция управления име­


ет вид и — A sign е. Однако при использовании такого
управления в нашей следящей системе на одной из ветвей
экстремальной характеристики оно приведет к отрицатель­
ной обратной связи и соответственно на другой — к поло­
жительной. Следовательно, в такой системе (разумеется,
если не производится измерение величины градиента)
невозможно обеспечить слежение оптимизируемой величи­
ны у за задающим воздействием g (t). Покажем, что эта
задача может быть решена с помощью управления (12.3.)^
являющегося релейной функцией двух аргументов
(рис. 17).
Пусть начальные условия в системе таковы, что
Si (*о) s2 (t0) < О, (12.4)

А >Р. (12.5)
§ 2] ОДНОМЕРНАЯ ОПТИМИЗАЦИЯ 235

и предположим пока, что функция v равна нулю. Рассмот­


рим поведение системы при таких начальных условиях
с помощью уравнения движения относительно координаты
^ошибки, которое согласно (12.2), (12.3) имеет вид

е= A sign (SxSj). ( 12. 6)

Так как ё = = s2, то при начальных условиях (12.4)


для одной из функций S* или s2
выполняется неравенствоя^сО ' 1
или s2s2 < 0. Поэтому вели­
чина s* (или s2) сменит знак и, +А
следовательно, согласно (12.5),
(12.6) сменит знак и производ­
Sj=C
ная (или а2), т. е. в окрест­ -------- г-9т
ности точки sx = 0 (или s2= 0 ) S
имеет место неравенство s1s1 < 0
(или sas2< ; 0). Из условий (1.9) -А
следует, что в системе возник- рис ^1
нет скользящий режим и во
время этого движения s1 = 0 (или s2 = 0).
Предположим, что условие А ^>р, нарушается
dx
лишь в некоторой окрестности экстремума. Тогда в силу
того, что либо у = g, либо у — g + б, и g является моно­
тонно убывающей функцией (g = — р < 0), выходная вели­
чина объекта за конечное время достигнет этой окрестно­
сти. Выберем теперь воздействие v, о котором выше шла
речь, таким образом, чтобы это воздействие, с одной сто­
роны, обеспечивало создание в системе начальных ус­
ловий типа (12.4) и, с другой стороны, позволило заста-
билйзировать движение системы в окрестности экстрему­
ма. Необходимость решения этих задач обусловлена тем,
что приведенное выше рассуждение справедливо лишь
для начальных условий типа (12.4), а после достижения
окрестности экстремума дальнейшее убывание g (t) лише­
но смысла. Для этой цели функцию v следует выбрать до­
статочно большой по модулю величиной, положительной
при < 0 , s2 < 0, отрицательной при )> 0, s2 0 и
равной нулю при %52 < 0. Тогда за счет «быстрого» изме­
нения задающего воздействия g в системе возникнут на­
236 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ [гл. х а

чальные условия типа (12.4). Так как интегрирующее зве­


но, формирующее задающее воздействие g (<), является
элементом управляющего устройства, то эту величину
можно менять сколь угодно быстро, и в дальнейшем будем»
считать, что начальные условия (12.4) создаются в системе
мгновенно. В соответствии с приведенными ранее рас­
суждениями после этого в системе возникнет скользящий
режим, обеспечивающий при v = 0 движение к экстремуму.
Во время этого движения одна из величин sx или s2 знако­
постоянная, а другая — знакопеременная величина, ме­
няющаяся с высокой частотой и малой амплитудой *).
При описанном законе изменения функции v и совпадении
знаков % и s2 во время скользящего режима величина v
будет отлична от нуля, функция g в эти моменты времени
не будет равна — р, и может оказаться, что задающее
воздействие g (t) уже не будет монотонно убывающей функ­
цией. Это явление можно исключить, если переключаю­
щие устройства, реализующие функцию v, обладают сим­
метричными гистерезисными петлями, ширина которых
превосходит удвоенную амплитуду колебаний Sj или s2
в скользящем режиме. В таком случае функция v имеет вид

( —М при — Д >0, s2> 0 ,


v—| 0 при (з2 + Д) (s2 — Д) < О,
( М при $ 1 < 0 , s2 + Д < О, М — const, М ^ > р,
(12.7)

где 2Д — ширина гистерезисной петли (рис. 18). На ин­


тервалах |Si |< Д и Is21<С Д величина v сохраняет то зна­
чение (— М , 0 или М ), которое она имела до попадания
изображающей точки в эти интервалы**). При таком спо­
собе формирования воздействия v изображающая точка
в начальный момент «забрасывается» не в область
sxs2 < 0 , а в область (sx + Д) (s2 — Д) < 0, 8атем, как и
ранее, регулируемая величина за счет скользящего режи­
ма попадает в некоторую область Е, содержащую

*) Напомним, что в любой реальной системе из-за наличия


неидеальностей движение в скользящем режиме происходит не точно
по поверхности разрыва, а в некоторой ее окрестности.
**) Состояние рассматриваемой системы характеризуется по­
ложением изображающей точки на оси е.
5 2] ОДНОМЕРНАЯ ОПТИМИЗАЦИЯ 237

экстремум, в которой нарушается условие (12.5), т. е.

A IS - < р - ( 12. 8)
ах
’ Условие (12.5) выделяет область, в которой движение
к экстремуму всегда осуществляется с постоянной скоро­
стью. Методом принасовы-
вания можно доказать, что +н , й
после достижения области 1
Е в окрестности экстрему­
ма, определяемой неравен­
ством (12.8), оптимизируе­
мая величина у продол­ -1
жает убывать в колеба­ _ •
ft
тельном режиме, причем .Т
скорость этого движения -Hi
постепенно уменьшается, л Д, у
а максимальное значение
у после окончания пере­ Рис. 18.
ходного процесса не прево­
сходит величины ут1п + Д.
Рассмотрим движение системы в области Е. При движении в этой
области для V — 0 справедливо неравенство е = — Р ± < 0.
Таким образом, независимо от того, какая из величин при движе­
нии в скользящем режиме (s: или s2) равнялась нулю, изображающая
точка при дальнейшем движении достигнет точки s2 = — Д; при этом
согласно (12.7) сигнал v мгновенно восстановит условие « = -+- Д
и, следовательно, возникнут колебания. При движении в интервале
df
О ^ Ч ^ Л выходная величина объекта у возрастает при < 0
df
и убывает при > 0 на величину

= \ { ~ A ^ ) dh <12-9)
о
а при движении в интервале — Д < s2 < 0 величина у убывает при
df df п
< 0 и возрастает при > 0 на величину

dt, (12.10)
238 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ [г л . X II

где Tj и тг — времена движения в этих интервалах, определяемые


из уравнений

Д=^ (р + A^jdt. (12.12)


о
Из выражений (12.11) и (12.12) непосредственно видно, что
df df
Tj < т2 при ■< 0 и Tj > т.2 при > 0. Изменение выходной вели­
чины объекта у за цикл колебания Tj тг согласно (12.9), (12.10)
вычисляется в соответствии с выражениями
т2—т,

Ат/ = — dt

о
V
при (12.13)
0
Vj-T,
-S']-а

Ау = — dt при о
А
(12.14)
0
Из (12.13), (12.14) следует, что выходная координата объекта
в области Е убывает в колебательном режиме. После достижения
экстремума колебания в системе сохраняются, а точность системы
оценивается величиной возрастания Ду во время этих колебаний.

Согласно выражениям (12.11) или (12.12) Ду = dt =

dj_
=Д — pxi или соответственно Ду = dt = Д — рта, т . е . п о -
dx
о
грешность поиска заведомо не превосходит величину Д. Уместно от
метить, что погрешность поиска близка к нулю, если в Д-окрестности
экстремума величину-^- можно приближенно считать равной нулю.
Вычислим среднюю скорость приближения входной координа­
ты к экстремальной точке в области Е. Для этого предположим, что
величина Д достаточно мала, т. е. изменением-^- за цикл колебания41
Ti + тг можно пренебречь. Тогда из (12.11) и (12.12) следует, что
df df
Ti = Д/р— A п Тг = Д/р + A Модуль средней скорости оп­
ределяется выражением
df
|Ti — та | dx
I ^ср I Т1 + Т2
= А- <А. (12.15)
§ 2] ОДНОМЕРНАЯ ОПТИМИЗАЦИЯ 239

В заключение целесообразно отметить основное разли­


чие описанной системы поиска экстремума от других ши­
роко распространенных релейных систем оптимизации
^достаточно подробно эти системы описаны в [77]).
Обычно в релейных экстремальных системах осущест­
вляется измерение производных экстремальной характери­
стики, которые определяют направление движения к экстре­
муму, а само движение организуется с помощью релейных
воздействий, сформированных на основе этой информации.
Необходимость измерения связана с введением в систему
дифференцирующих устройств, либо устройств для подачи
пробных воздействий на вход объекта и анализа их реак­
ции на выходе (например, либо измерение отношения про­
изводных входного и выходного сигналов, либо знаков
этих величин, либо фазы для периодических сигналов
и т. д.).
В основе описанного здесь метода решения задачи
оптимизации лежит принцип построения системы, способ­
ной управлять объектом со
знакопеременным и неизвест­
ным коэффициентом усиле­
ния (производная экстрема­
льной характеристики и иг­
рает роль этого коэффициен­
та), и затем с помощью такой
системы выходная величина
объекта уменьшается до ми­
нимально возможного значе­
ния. Идею работы такой сис­
темы можно пояснить следую­
щим образом. Пусть разрыв­
ное управление (рис. 17) при-
бли5кенпо реализовано с помощью усилителей с большим
коэффициентом усиления и насыщением и поэтому являет­
с я непрерывной функцией ошибки е, представленной на
рис. 19. Такая характеристика имеет два наклонных участ­
ка с большими по абсолютной величине и разными по знаку
угловыми коэффициентами. Очевидно, что при любом-
знаке коэффициента усиления объекта, один из этих коэф­
фициентов соответствует устойчивой системе, а другой —
неустойчивой. Начальные условия подбираются таким
образом, чтобы величина ошибки е находилась на сред-
240 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. XII

нем участке характеристики (рис. 19). После этого система


автоматически переходит на тот наклонный участок,
который соответствует устойчивости. При достаточно боль­
шом коэффициенте наклона этого участка обеспечивается
высококачественное слежение выходной величины за моно-"4
тонно убывающим задающим воздействием (рис. 16), в
результате чего и обеспечивается движение к экстремуму.
Такой подход позволяет избавиться от измерения ка­
ких-либо характеристик объекта и избежать колебаний,
вызванных пробными сигналами. Разумеется, высоко­
частотные колебания во время скользящего режима нель­
зя рассматривать как пробные, так как они обусловле­
ны лишь тем, что переключающие элементы не могут быть
реализованы идеально, а при реализации управления с
помощью непрерывной характеристики (рис. 19) эти ко­
лебания вообще отсутствуют.

§ 3. Одномерная оптимизация с переменной скоростью


поиска
Как известно, помимо ошибки поиска одним из наибо­
лее существенных показателей любой экстремальной си­
стемы является время нахождения экстремума. Очевидно,
что вопрос о быстродействии тесно связан с наличием огра­
ничений на управляющее воздействие. Так, например,
если в рассмотренной ранее системе управление не огра­
ничено, то можно добиться любого быстродействия, выби­
рая соответствующим образом величину р — скорость
приближения выходной величины к экстремуму. Если же
на управление наложено ограничение вида

|в | < Во, (12.16)


то в рассматриваемой системе движение к экстремуму
будет осуществляться заведомо не с максимальной ско­
ростью. Действительно, максимальная скорость измене-**,
ния входной величины равна и0. С другой стороны, при
движении системы в скользящем режиме, когда у = g =
= — р, в силу неравенства (12.5) имеем

df < А ^ и 0. (12.17)
dx
§ 3] ОДНОМЕРНАЯ ОПТИМИЗАЦИЯ 241

Движение системы в области Е, определяемой услови­


ем (12.8), имеет колебательный характер, и согласно
(12.15) средняя скорость изменения входной величины в
этой области оценивается неравенством
df

|*с р | = л ------- — < А < Ц 0- (12.18)


г
Непосредственно из сопоставления (12.17) и (12.18)
видно, что попытка ускорить процесс поиска за счет
увеличения скорости изменения задающего воздействия р
не приведет к желаемым результатам, так как, во-первых,
согласно (12.18) замедляется скорость сходимости процес­
са поиска в области Е, и, во-вторых, с ростом р увеличи­
вается сама область Е. В связи с этим возникает задача
построения такой системы, в которой без непосредственного
измерения величины df/dx скорость изменения задающего
воздействия р выбирается близкой к максимально возмож­
ной скорости выходной величины объекта, равной \dfjdx\ и0.
В такой системе при возникновении скользящего режи-
ма'Дэудет обеспечено монотонное движение к экстремуму
со скоростью, близкой к максимальной. Для получения
системы с таким свойством выберем величину А равной и0, а
задающее воздействие g (t), в отличие от системы (12.3),—
зависящим от функции управления следующим образом:

(12.19)

где Ро — const, ро > 0, а иср — среднее значение управле­


ния, о котором шла речь в § 6 главы II и которое может
быть получено с помощью инерционного звена с достаточ­
но малой постоянной времени т. Поясним, каким образом
осуществляется поиск экстремума в системе (12.3) со ско­
ростью задающего воздействия, изменяющейся в соответ-
вии с (12.19). При отсутствии скользящего режима управ­
ление и равно и0 или — и0, знак иср совпадает со знаком
и*) и, следовательно, скорость задающего воздействия р

*) Знаки иср и и совпадают, если постоянная времени % доста­


точно мала и можно пренебречь собственным движением фильтра.

9 В, И. Уткин
242 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. X II

равна нулю. Из соотношения (12.6) следует, что при


р = 0 в любой точке вне экстремума выполняется, по
крайней мере, одно из неравенств s1s1 < 0 или s2s2 < О
и согласно (1.9) в системе всегда возникнет скользящий
режим. Эти рассуждения в какой-то мере носят качествен­
ный характер, так как было сделано предположение о том,
что постоянная времени инерционного звена т является
достаточно малой величиной. Анализ поведения системы
с учетом собственного движения инерционного звена по­
казывает, что для возникновения скользящего режима
достаточно, чтобы выполнялось соотношение 2тр0 In 2 < Д
(2Д — ширина гистерезисной петли в устройстве, реали­
зующем функцию v).
Для вывода условий существования скользящего режима в си­
стеме (12.3), (12.19) будем считать, что вспомогательное управление v
обеспечнло'начальные условия .5,х2<Г0 и что иначалышймомент времени
df
0, а выходная велпчнна инерционного звена (12.19) иср отри­
цательна, т. е. совпадает по знаку с управлением и. В соответствии
с (12.3), (12.7), (12.19) в этом случае
( и \ df
S2
= -p °V J- ^ Sigau° p j - =
dj_
= — Po (1 + Sign S2 sign Ucp) — Uq dx Sign S2. (12.20)

При указанных начальных условиях величина s2 согласно


(12.20) убывает, а величина иср до момента смены знака s2 остается
отрицательной, так как вср является выходом инерционного звена,
с отрицательным входом. После того как величина s2 сменит знак,
So определяется выражением
dj_
S2 — — 2 р о -|- ио ( 12. 21)
dx
df_
Очевидно, что при 2ро < ио dx возникает скользящий режим
в точке s2 — 0. В противном случае s2 будет продолжать убывать при
и0 до тех пор, пока величина иор, определяемая пз уравне­
ния тмср -(- иср= + 1, ие станет положительной, после чего в си­
стеме возникнет скользящий режим. Приведенные рассуждения,
разумеется, справедливы, если во время рассмотренных движений
величина v равна нулю, т. е. s2 )> — Д. Величина s2 принимает ми­
нимальное значение в момент времени Т смены знака иср, которое
согласно (12.21) оценивается неравенством
s2 min ^ 2о0Г. (12.22)
§ 4] ОПТИМИЗАЦИЯ МНОГОМЕРНОГО ОБЪЕКТА 243

т
Оценим величину Т из уравнения 0 = 1 — [1 — ыср (0)]е т с уче­
том условия |wcp (0) |< 1: Т = г lu [1 — пср (0)] < т In 2.
Подставляя это значение в неравенство (12.22), находим условие,
при котором s2min > — Д:
2р0т In 2 < Д. (12.23)
Таким образом, при выполпении условия (12.23) в рассматри­
ваемой системе всегда возникнет скользящий режим. (Нетрудно
убедиться в том, что такой же результат имеет место и для слу­
df
чаев, когда в начальный момент времени величины ^ и иср не яв­
ляются отрицательными.)
Как было установлено в главе II, для получения урав­
нений скользящего режима нужно вместо управления и
подставить в систему цэкв — эквивалентное управление,
которое равно ггср. Это означает, что величина скорости
Задающего воздействия (12.19) в скользящем режиме равна

(12.24)

В (12.24) ы8КВ— некоторая непрерывная функция, кото­


рая согласно необходимому условию возникновения
скользящего режима (3.3) заключена между — и0 и и0.
Приведенные рассуждения позволяют сделать вывод о том,
что скользящий режим будет иметь место при любом зна­
чении р„. В силу ограниченности управляющего воздейст­
вия и выходная величина объекта может отслеживать лишь
ограниченные по скорости задающие воздействия, опреде­
ляемые величиной р. Это означает, что при стремлении
р0 к бесконечности величина |иакв | должна стремиться
к и0. Так как х = и, а в скользящем режиме х — м8КВ,
то в пределе входная величина х изменяется с максималь­
ной скоростью.

§ 4. Оптимизация многомерного объекта


Рассмотрим теперь задачу многомерного поиска, когда
входной параметр объекта х является re-мерным вектором
с компонентами хх, . . ., х п и задача состоит в минимизации
скалярной выходной величины у = / (х).
Для решения этой задачи воспользуемся широко рас­
пространенным приемом, который предполагает исполь-

9*
244 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ ' [ГЛ. X II

зование какого-либо метода одномерной оптимизации


и изменение тем или иным способом направления поиска
в пространстве входных параметров [115] (например, пе­
риодически, в зависимости от состояния системы, случай- ч
ным образом и т. д.). Движение такой системы описывается
уравнениями
х = ки, (12.25)
где к — кусочно-постоянный вектор (кг, . . . кп), а скаляр­
ное управление и зависит от того, какой метод одномерной
оптимизации используется. Выберем управление и в соот­
ветствии с описанным в § 1 алгоритмом поиска (12.3),
(12.7) для случая, когда скорость задающего воздействия
р меняется согласно (12.19), а величина А равна и0.
Запишем уравнение движения системы относительно
выходной величины
у = (grad f-k ) и, (12.26)
где g r a d / — вектор-строка с элем ентами-^-.
i
При постоянном векторе к изображающая точка будет
двигаться из любого начального положения вдоль пря­
мой, параллельной этому вектору, вплоть до достижения
условного экстремума на этой прямой в точке (grad / •к) =
= 0. В момент достижения условного экстремума следует
изменить направление поиска за счет изменения вектора к.
Покажем, что если движение к экстремуму происходит
в скользящем реяшме, то информация об этом моменте
может быть получена за счет измерения иср равного ггэкв.
Для вычисления иэкв воспользуемся уравнением (12.6),
которое в нашем случае согласно (12.19), (12.26) запишет­
ся в виде
ё = — Ро ( i - — — (g r a d /-Л) и.
Величина цэкв является решением уравнения 8 = 0 от­
носительно и. Найдем |ишв |, имея в виду, что в скользящем
режиме иср = иэкв:
_________ ррЦО__________
ЭДаки — ро — «о (grad / •/с) sign uaKD ’ (12.27)

(. I“ к
К экпI
пЦ
Ч 1- - - — } (1 2 .2 8 )
Wqkr --- --- '
grad f-k
§ 5] ОПТИМИЗАЦИЯ ПРИ НАЛИЧИИ ОГРАНИЧЕНИЙ 245

Так же как и в одномерном случае, величина |цэкв|заклю­


чена между нулем и и0. Из этого условия и (12.28) следует,
что sign иэкв = — sign (grad /• & )/т. е. уравнение (12.27)
.имеет вид
Рэкв! - p0+ K0|grad/.A| “ о-

Это соотношение означает, что по мере приближения к


условному экстремуму (т. е. к точке grad / -к = 0) величи­
на мэкв приближается к и0. Этой информацией можно вос­
пользоваться, замерив величину ггср, равную ггэкв, с по­
мощью фильтра (12.19), и изменив направление поиска,
когда
Щ — |макв |^ 6о, (12.29)

где б0 — некоторое достаточно малое положительное чис­


ло. Законы изменения вектора к могут быть самыми раз­
личными. Например, в соответствии с процедурой метода
Гаусса — Зейделя поочередно будем выбирать одну из
компонент отличной от нуля, а остальные — равными нулю,
или же значения компонент вектора к будем назначать
случайным образом и т. д. Мы здесь оставляем в стороне
вопросы о сходимости, так как они весьма мало связаны
со спецификой работы предлагаемых здесь алгоритмов
поиска и в основном определяются видом оптимизируе­
мых функций. Отметим лишь, что при решении задачи
оптимизации многомерных объектов также не использу­
ются какие-либо устройства, предназначенные для изме­
рения вектора градиента или различных его проекций.
По сравнению с одномерным случаем нужно предусмот­
реть лишь элемент, изменяющий направление поиска в
функции эквивалентного управления, которое легко по­
лучить в результате усреднения разрывного управления.

§ 5. Оптимизация при наличии ограничений


на входные параметры

Во многих случаях может оказаться, что при решении


задачи оптимизации вектор аргументов оптимизируемой
функции / (я) не может выбираться произвольно. Такие
постановки характерны также для различных задач про­
граммирования. Рассмотрим сначала случаи, когда
246 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. XXI

ограничения являются равенствами


(ж) = 0 (£ = 1, . . ., иг). (12.30)
Идея решения этой задачи на основе использования
скользящих режимов состоит в следующем. Введем допол^
нительное nz-мерное управление в систему (12.25), каждая'
компонента которого претерпевает разрывы на соответст­
вующей поверхности у г (х) — 0. С помощью этого управ­
ления обеспечим движение в скользящем режиме по пере­
сечению поверхностей y t {х) = 0 (г = 1, . . ., т) при лю­
бом значении вектора ки и, следовательно, ограничения
(12.30) на входные параметры будут автоматически вы­
полняться. После этого будем решать задачу об оптимиза­
ции с помощью описанного в § 4 метода.
Уравнение системы, с помощью которой реализуется
намеченный план, имеет вид
х = ки + ByUy, (12.31)
где Ву — некоторая матрица размерности п X т, гг'1'— т-
мерное управление с компонентами ul, . . ., Um'
|uf при Т г И > 0 ,
(12.32)
1 иГ при Тх (х) < 0, (£ = 1, . . ., иг).
Матрицу By и величины и и\~ выберем таким образом,
чтобы на пересечении у г (ж) —- 0 (г — 1, . . ., т) удалось
организовать скользящий режим с помощью метода
иерархии управлений. Пересечение у ; (х) = 0 (£ = 1,...
. . ., т) будет многообразием скольжения, если для систе­
мы (12.31) выполняются аналогичные (3.30) условия:
grad Yr+i brr+1u%i < min и grad Yr+i*r —
Y Y
u >u r+ %
m—r
— 2 gradYj.+i^rV^i],
i= 2
(12.33)"
grad 4 ,.+1b'r+1Ur+x )> max
Y Y L
Г — и grad Yr+i kr —
w*ur+2'*’*» um
m —r

— 2 grad Yr+ib?+V + i 1.
i—2 -* >
§ 5] ОПТИМИЗАЦИЯ ПРИ НАЛИЧИИ ОГРАНИЧЕНИЙ 247

Элементы, входящие в неравенства (12.33), которые долж­


ны выполняться для всех г — 0, . . ., т — 1, находятся
в соответствии с описанной в главе IV процедурой, ис­
пользованной для получения уравнений (3.27).
Условия (12.33) можно выполнить, если известны зна­
ки функций grad у,.+1Ьг+1 (г = 0, . . ., т — 1). В тех слу­
чаях, когда такая информация отсутствует, можно вос­
пользоваться предложенным в § 2 принципом управления
объектом со знакопеременным коэффициентом усиления.
Согласно этому принципу каждая компонента управле­
ния должна претерпевать разрывы уже на двух «близких»
поверхностях

uj = uoi sign ya yi2,


Tii = Ti + (12.34)
Ti2 = Ti + + 5,

где uoi — const, 6 — малая положительная величина,


а функция соi по аналогии с v (12.7) обеспечивает в системе
начальные условия у г1у г2 < 0:
’ — М g при Ти — А > 0 и Ti2> 0,
шг — acoi при (Та + А) (т « — А) < 0, (12.35)
.М при Tii < 0 и Ti2 + А < 0.
В (12.35) a, М — const, а 0, М )> 0, 2А — ширина
гистерезисной петли, на интервалах |y ix |< А, |у г2 |< А
величина сог сохраняет то значение (— М , — асог или М ),
которое она имела до попадания в эти интервалы. Величи­
на М такова, что для любого i — 1, . . ., т создаются на­
чальные условия y ;iYi2 < 0- Тогда при соблюдении иерар­
хии управлений компонента и[ обеспечит возникнове­
ние скользящего режима по одной из поверхностей уи = 0
или у12 = 0 (как это имело место в разобранной в § 2 одно­
мерной задаче), компонента к2 — по пересечению одной
из этих поверхностей с поверхностью у21 = 0 или Y22 = 0
и т. д. Так как величины со; , являясь решением уравнений
сЬг = — сссоi, стремятся к нулю, то все поверхности
Уп — 0 и у 1г — 0 асимптотически приближаются к по­
верхностям yi = 0 (с точностью до б), что и позволяет вы­
полнить ограничения (12.30) без использования информэ-
248 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. XII

ции о градиентах функций Yi (я)- Соотношения, которые


позволяют выбрать величины aoi, также могут быть полу­
чены с помощью рассуждений, которые позволили выпи­
сать условия (3.30). Специфика состоит в том, что в урав­
нениях (3.29) должны быть учтены производные по време-''
ни от функций к»; и должны быть известны диапазоны изме­
нения компонент градиентов функций уг (х). В результате
приходим к следующим соотношениям:

По, т > sup |gradT^ , +1| (| и grad T,.+1/tr |+


m—г
+ 2 |grad Tr+i^r и0) r+i |+ а |cor+1 | (r = Q , . . . , m — lV
i=2 '

(12.36)
В (12.36) следует вычислить верхнюю страницу по всем
компонентам векторов градиентов, по юг+1, которые опре­
деляются областью рассматриваемых значений х, а также
по всем компонентам вектора к *). В обоих случаях (12.31)
и (12.34) уравнения скользящего режима по пересечению
поверхностей Yi = 0 (i = 1, . . ., т), определяемые мето­
дом эквивалентного управления, имеют вид
х = [Е — В.< (GyB-t)*1Gy]ku, (12.37)

где Gч — матрица, строками которой являются градиен­


ты функций у г (i = 1, . . ., тя).
Задача выбора основного управления решается в соот­
ветствии с описанным в § 3 методом оптимизации без
ограничений. При произвольной последовательности из­
менения вектора к дополнительные управления и\ «на­
правят» вектор фазовой скорости, определяемый из (12.37),
вдоль пересечения поверхностей разрыва, что и гаранти­
рует выполнение ограничений (12.30).

*) Если окажется, что величина grad -уГ+11Ь^+1 близка к нулю,


то следует изменить направление вектора b£+1. Это можно сделать
автоматически в соответствии с предложенной в § 3 методикой —
замерить uj+1 экв и при приближении |и^+1 0КВ | к предельному
значению и-г+1, 0 (что свидетельствует о приближении величины
grad уГ+1&£+1 к нулю) изменить компоненты вектора Ь^+1-
§ 5] ОПТИМИЗАЦИЯ ПРИ НАЛИЧИИ ОГРАНИЧЕНИЙ 249

Синтез управляющего устройства следует начать с вы­


бора управления и, а затем, следуя процедуре метода
иерархии управлений, выбрать потом Um-i и т. д. вплоть
/' до и{.
Рассмотрим теперь ограничения типа неравенств
M s )< 0 (i = l , . . . , Z ) . (12.38)
Введем дополнительные координаты zx, . . ., z, и, считая
ихТтакже входными параметрами, применим описанный
в этом параграфе метод для нахождения минимума функ­
ции / (х) при наличии ограничений типа равенств
h\ (х, ъ) = hi (х) + z4 •
—0 (Z = 1 ,. . . , Z). (12.39)
Очевидно, что решение этой задачи совпадает с решением
задачи без ограничений. Действительно, если х* — точка
минимума функции / (х), то величины z; будут определены
таким образом, чтобы /г; (х *) = — z , , т. е. поверхности.
hi (х, z*) = 0 в пространстве х, z пройдут через точку х*.
Может оказаться, что точка х* лежит в запрещенной нера­
венствами (12.39) области. В связи с этим нужно преду­
смотреть в системе элементы, которые не допустили бы
отрицательных значений координат zu так как при выпол­
нении условий (12.39) это приведет к нарушению органиче-
ний (12.38). Такой подход может быть реализован в си­
стеме, описываемой уравнениями
х = кхи + Bhuh,
(12.40)
2 = kzu -f- BhUh + uz,
где z — вектор с компонентами zl5 . . ., z,, матрицы B h,
Bh, n- и Z-мерные векторы k x и k z, скалярное и векторное
управления и и и'1выбираются так, чтобы решить задачу
оптимизации при наличии ограничений (12.39), которую
мы уже рассмотрели. Компоненты Z-мерного вектора пг
претерпевают разрывы на плоскостях z; = 0:
M z при Zi < 0,
(12.41)
0 при Zi^> 0,

М-> max (kfu + 2 b'-fli-j, i = l,...,Z, (12.42)


. . , и, Uh
j 3=1
250 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ СГЛ. X II

к\, btf — элементы вектора k z и матрицы B"h, и? — компо­


ненты вектора uh. Условие (12.42) означает, что положи­
тельная величина М г всегда превосходит любой элемент
вектора кги -}- Bh.nh, и из этрго условия следует, что
в разрешенной области управление иг на движение не
влияет.
В этой системе будет осуществляться поиск точки х* и
эта точка будет найдена, если она лежит в допустимой
области. Если же ограничения являются существенными
и точка х * находится в запрещенной области, то в процессе
поиска траектории изображающей точки, лежащие на
поверхностях hi = 0, попадут на одну или несколько
плоскостей zt = 0, и при выполнении условия (12.43) на пе­
ресечении этих плоскостей возникает скользящий режим.
В результате движения в скользящем режиме, так же
как и в задаче с ограничениями типа равенств, будет най­
ден условный экстремум на границе допустимой области.
Если на координаты системы наложены ограничения обоих
типов (12.30) и (12.38), то для решения следует использо­
вать оба алгоритма одновременно.
Для того чтобы гарантировать сходимость всех приве­
денных здесь алгоритмов, нужно сделать соответствующие
предположения о виде оптимизируемой функции и о функ­
циях, задающих область допустимых значений входных
параметров, например, ограничиться рассмотрением лишь
выпуклых функций.

§ 6. Обсуждение метода оптимизации

В этом параграфе мы кратко обсудим возможности при­


менения алгоритмов с постоянной и переменной скоростью
поиска для нестационарных объектов, а также различные
способы организации многомерного поиска иа основе ис­
пользования специфических особенностей этих алгоритмов.
Поиск экстремальной точки услоясняется в случае,
когда координаты этой точки и вид нелинейной характе­
ристики изменяются во времени. Это обусловлено тем, что
для нестационарной характеристики затруднено измерение
компонент градиента (или знаков каких-либо его проек­
ций). Попытаемся с помощью алгоритма (12.3) осуществить
оптимизацию нестационарного объекта, описываемого
§ 6] ОБСУЖДЕНИЕ МЕТОДА ОПТИМИЗАЦИИ 251

уравнением
У = / (®. t) (12.43)
^предполож ении, что в любой момент времени характери­
стика имеет единственный минимум в точке х*, у*, а вели­
чина df/dt ограничена при любых х и t. Задача состоит в
построении системы, обеспечивающей равенство выходной
величины меняющемуся во времени экстремальному зна­
чению. Скорость изменения величины у* не превосходит
максимальное значение величины df/dt *). Поиск миниму­
ма осуществляется за счет скользящего режима, во время
которого выходная величина у отслеживает задающее воз­
действие g (t), монотонно убывающее со скоростью р. Оче­
видно, для того чтобы координата g (или равная ей коор­
дината у) «была способна догнать» изменяющую свое
положение точку экстремума, должно выполняться ус­
ловие
а/
Р > dt (12.44)

Запишем теперь условия возникновения скользящего ре­


жима, во время которого осуществляется такая «погоня».
Для этого нужно воспользоваться уравнением относитель­
но рассогласования е = g — у, в котором в отличие от
(12.6) должна быть учтена нестационарность характери­
стики (12.43):

в = - Р ~ 4 ! г А si§n М ~ 4 t~ ■ (12.45)
Из (12.45) получаем аналогичное (12.5) условие возникно­
вения скользящего режима для алгоритма с постоянной
скоростью воздействия:

А df. (12.46)
дх >
Для алгоритма с переменной скоростью (12.19) после на­
рушения скользящего режима величина р становится рав­
ной нулю, поэтому условием его существования согласно

df (х*, i) df (x'J)
*) Действительно, у* = — ^ + dt , или с учетом
df d (x\t )
условия -д~г = 0 получаем у* = ---- щ-----
252 ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ [ГЛ. X II

(12.45) будет неравенство


а/
и„ дх > dt (12.47)

Неравенствами (12.46) и (12.47) можно воспользоваться


для оценки точности поиска экстремума рассмотренных
здесь алгоритмов оптимизации в случае нестационарного
объекта. За счет увеличения коэффициентов А и и0 можно
уменьшить размер области, в которой срывается скользя­
щий режим и нельзя гарантировать движение к экстре­
муму.
В заключение отметим те возможности построения си­
стем многомерного поиска, которые появляются за счет
использования усредненного значения уравнения цср. Как
мы выяснили, при фиксированном направлении поиска но
мере приближения к условному экстремуму величина ггср
стремится к одному из своих предельных значений: а0
или — и0. Этой информацией можно воспользоваться для
непрерывного изменения направления поиска, например,
следующим образом:
& = T(ucp,k, t),
где к — вектор направления поиска, у — вектор-функ­
ция, зависящая от иср таким образом, чтобы при значени­
ях цср, по модулю, близких к и0, скорость изменения к
увеличивалась, и близких к нулю — уменьшалась. Это
приведет к тому, что в системе будет наблюдаться тен­
денция к смене направления поиска по мере приближе­
ния к условному экстремуму и большая часть времени
движение будет происходить по направлениям, близким
к градиенту*).
Изменение направления за счет измерения иор можно
осуществлять и случайным образом. Например, в момент
времени, когда начинает выполняться неравенство (12.29),
в каждом канале параметры к ь вектора к выбираются по
какому-либо случайному закону. Очевидно, что в такой
системе, у которой на каждом шаге решается одномерная
детерминированная задача, также будет реализовано
движение к экстремуму. Существенная особенность этого
*) Функции у следует выбрать таким образом, чтобы компонен­
ты вектора к были ограниченными, например, функциями вида
sin Ш, у которых параметр о. растет при приближении |и ср|к и0.
§ 1] ПОСТАНОВКА ЗАДАЧИ 253

способа поиска заключается в том, что в системе нужно


предусмотреть устройство, которое всегда решает одномер­
ную задачу независимо от размерности общей задачи, а
элементы, меняющие направление в каждом канале, также
реализуют функцию одного переменного (меняют k t в зави­
симости от цср) и функционируют независимо друг от друга.
Наконец, описанный в . этой главе метод одномерной
оптимизации с переменной скоростью задающего воздейст­
вия может быть использован для построения двухуровне­
вой системы оптимизации, позволяющей осуществить гра­
диентный поиск *). Второй контур оптимизации предпо­
лагает минимизацию функции

Ф(к) = ктк -f- к -j J | (X = const).

Как показано в § 4, величина |иср | определяется из соот­


ношения
I ________ррцр_______
ср ' ро + ио Igrad f-k\ ’
поэтому экстремум функции ф (к) достигается в точке
X
к0 — -------- sign (grad f-k) grad /, т. e. найденное направление
ро
совпадает с градиентом функции f( x) . Естественно, ско­
рость оптимизации второго уровня, осуществляемой, на­
пример, покоординатно, должна значительно превосхо­
дить скорость оптимизации в основном контуре. Это обычно
удается сделать, так как в управляющем устройстве на
скорости изменения компонент вектора к ограничений не
накладывается.

глава хш
, ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ

§ 1. Постановка задачи и уравнения модели


с переменной структурой
Во многих случаях перед этапом выбора управляющего
устройства возникает необходимость в определении пара­
метров управляемого объекта. Кроме того, такая задача
*) Принцип двухуровневой оптимизации предложен С. К. Ко­
ровиным и докладывался на V конгрессе ИФАК в 1972 г.
254 ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ [ГЛ. X III

должна решаться и при управлении объектами с изменяю­


щимися параметрами, когда предполагается использова­
ние средств адаптации, которые призваны улучшать дина­
мические свойства системы при различных вариациях
характеристик объекта.
В этой главе задача восстановления дифференциальных
уравнений объекта будет решаться с помощью моделей
с переменной структурой за счет преднамеренного введе­
ния в динамическую систему «объект — модель» движе­
ний в скользящем режиме *).
Предполагается, что известна система функций фj (x,t)
(J = 1, . . N ), являющихся компонентами вектора
ср (х , it), по которым правые части дифференциальных
уравнений объекта могут быть разложены в конечные
ряды. Тогда задача идентификации динамического объек­
та, описываемого уравнениями
х = Ац>(х, <), х т = х1г. . . , хп, (13.1)
сводится к восстановлению постоянной матрицы .А = |аи \\
(г = 1, . . п\ / = 1 , . . , , iV) — коэффициентов этого
разложения. Предполагается, что на любом решении
х (t) функции ф; (х (t), t) (/ = 1, . . ., N) линейно незави­
симы всюду, кроме множества точек меры нуль. Частным
случаем является задача восстановления матрицы А = |а^-Ц
системы линейных дифференциальных уравнений
П
Xi — 2 di j Xj ( i = 1 ,. . . , tz) . (13.2)
j'= i

В любом случае задача состоит в том, чтобы определить


матрицу А = | ац |, зная лишь протекание процесса х (<)
на конечном интервале времени. Будем далее считать, что
диапазон возможных значений коэффициентов ац ограни­
чен и известен.
Подобная задача изучалась применительно к линей­
ным уравнениям (13.2) (см., например, [22]) или же при­
менительно к системе «типа Лурье», которая отличается
от линейной системы (13.2) наличием одной аддитивно
*) В этой главе отражены результаты, полученные в работе
[68] и в доложенном на V конгрессе ИФАК в 1972 г. докладе
А. Д. Браславского, С. К. Коровина, Н. Е. Костылевой, В. И. Ут­
кина, А. М. Шубладзе.
§U ПОСТАНОВКА ЗАДАЧИ 255

входящей нелинейной функции одного аргумента. Им мо­


жет быть какой-либо из x t или их линейная комбинация
[95]. В [22, 95] предполагалось, что исходным материалом
■ служит набор одновременно выполненных замеров x t и жг.
Значения x t определяют значения правых частей уравне­
ний (13.2), и задача сводится к обычной задаче восстанов­
ления линейной функции по набору ее значений при фик­
сированном наборе аргументов. Известны многочислен­
ные алгоритмы решения задач такого рода. Трудности
применения их к задаче восстановления оператора (13.2)
связаны с доказательством сходимости алгоритма. Это
доказательство требует предположений о том, как отби­
раются решения, в ходе которых выполняются одновре­
менные замеры Xi и ж;. Всегда существует подмножество
решений, не удовлетворяющих условию независимости, и
даже если это подмножество имеет меру нуль, надо избе­
жать случая, когда либо решение целиком лежит в этом
подмножестве, либо отобранные точки оказываются в нем.
Обычно при доказательстве сходимости алгоритмов делает­
ся предположение о случайном разбросе начальных дан­
ных и доказывается, что алгоритмы сходятся в некотором
вероятностном смысле (например, почти наверное).
Для решения этой же задачи применительно к опера­
тору (13.1) составим модель, которая описывается урав­
нениями типа (13.1), но коэффициенты этих уравнений
выберем разрывными функциями. Попытаемся так изме­
нять структуру модели, чтобы изучаемые объект и модель,
рассматриваемые как совместная система, всегда выходили
на скользящие режимы, во время которых процессы в
объекте и модели протекали одинаково. В силу того, что объ­
ект и модель имеют подобную структуру уравнений движе­
ния и их выходные величины совпадают, по средним зна­
чениям разрывных коэффициентов модели в скользящем
режиме можно судить о неизвестных параметрах объекта.
Напомним, что среднее значение управления в скользящем
режиме совпадает с эквивалентным управлением и эта
величина может быть легко измерена с помощью инерцион­
ного звена с достаточно малой постоянной времени
(§ 6 главы II).
Итак'наряду с системой (13.1) рассмотрим уравнение
модели
У= Щ (1 3 *3 )
256 ИДЕНТИФИКАЦИЯ динамических объектов [ГЛ. хш

где у и и — п-мерные векторы состояния модели и управ­


ления с компонентами (?/х, . . у п) и (н^, . . ип) соот­
ветственно. Составим вектор управления в виде кусочно­
линейной функции компонент вектора ср:
N N

и, = 2 (®, t) + Г2 с1а I (*» о (dy — const),


У=1 S'=1
(13.4)
Г 1 при s4> О,
1 — 1 ПРИ S; < 0 (£ --= 1 ,. . . ,/г),

а функции Si, определяющие поверхности разрыва, равны


рассогласованиям между соответствующими координатами
объекта и модели
si = xi — yi. (13.5)

Вычисляя величины st из (13.1), (13.3) — (13.5)


N

Si = 2 [{ац by) <Pj dij |ср,-1Hi],


;'=l
находим, что условия скользящего режима (1.9) будут вы­
полнены на каждой поверхности st = 0, если

dy > max |a{j by |. (13.6)


aij
Условия (13.6) при достаточно общих предположениях о
функциях cpj являются одновременно и условиями попа­
дания. Это означает, что в рассматриваемой динамической
системе «объект — модель» с некоторого момента времени
возникнет движение в скользящем режиме по пересечению
всех поверхностей разрыва и при этом все рассогласования
между выходными величинами объекта и модели будут
тождественно равны нулю.
Для определения уравнений скольжения согласно
методу эквивалентного управления (глава II) нужно
в уравнение модели вместо и' подставить функции ц*01(в,
которые являются решениями уравнений st — 0 (£ = 1, ...
. . . , « ) относительно управлений. Из этого следует, что ве-
§ 1] ПОСТАНОВКА ЗАДАЧИ 257

личины Si при и' = н’ экв тождественно равны нулю, т. &


N

— 2 hffli (®> Z) —Щ (i — 1, . •• , п), (13.7)

где
N

hi ~ ® ij btf, — 2 d ijU { экв | Ф ; (* , t) |. (13.8)

Компоненты u ' 0 K B совпадают со средними значениями u * ,


и их можно получить на выходе фильтров с малой постоян-
ной времени, если на входы этих фильтров подавать истин­
ные значения ut. (Вопросы, связанные с выбором парамет­
ров и погрешностью измерения, рассматривались в § 6 гла­
вы II.)
Рассмотрим теперь следующие два случая.
1. Наблюдаемый на выходе фильтра i-ro фильтра
сигнал и* экв равняется постоянной величине.
2. Сигнал и* экв изменяется во времени.
С л у ч а й 1. Рассмотрим интервал времени, на кото­
ром ф;- (х , t) не меняют знака и сохраняются постоянными
значения dijUi3KB sign срj(x , t). В силу независимости функ­
ций фх (х , t) из равенства (13.7) сразу получаем

ац = by + d^ul экв sign cpj {х, t\ (13.9)


где н’ вкв— непосредственно наблюдаемый сигнал на выходе
фильтра. Подставляя в (13.9) это значение иТэкв и соответ­
ствующие разным / значения Ъц и dtj, восстанавливаем
г-то строку матрицы А .
В частном случае, когда неизвестен лишь один элемент
матрицы А , например ап , а все остальные ее элементы —за­
данные числа, параметры модели (13.4) выбираются таким
образом, что все dц, за исключением du , равны нулю, все
'btj, за исключением Ьп , равны atj, а коэффициенты Ьп и
выбираются так, чтобы они удовлетворяли условиям
существования скользящего режима (13.6). Тогда из (13.7),
(13.8) следует, что все ltj = 0 кроме ZX1, и так как функция
фх (х, t) ф 0, то
«11 = Ьц + dijUlер sign фх (х, t),
т. е. неизвестный коэффициент ап восстанавливается с
258 ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ [ГЛ. X III

помощью предлагаемого метода без какой-либо поисковой


процедуры.
С л у ч а й 2. В этом случае и*вкв — функция времени^
и поэтому функциями времени являются величине*
dijUi эквsign cpj (х, t). В таких условиях из уравнения (13.7)'
уже не следует, что все коэффициенты 1ц — d^u* экв X
X sign ф; (ж, t) равны нулю и формулы (13.9) не могут
служить для определения коэффициентов ац. Заметим,
однако, что всегда существует такой выбор чисел btj и d
при котором возникнет не случай 2, а случай 1, какова
бы ни была матрица А . Действительно, величина и‘ зкв,
являющаяся решением уравнения s t = 0 относительно и *,
имеет вид
N
У (в ц -Ь у)ф Д *,*)
_______ isi__________________ (13.10)
**1 ЭКВ — дг

Y (<*у sign qpj (х, i)) ф. (x, t)


3=1

Если выбрать коэффициенты diS так, чтобы они были


пропорциональны числам агу — Ъц с одним и тем же ко­
эффициентом пропорциональности, и рассмотреть затем
часть процесса, при котором срг (a;, t) ие меняют знака, то
на этом участке заведомо будет « i8KB = const. Таким обра­
зом нельзя, конечно, непосредственно подсчитать, как
надо выбрать и dtj, так как коэффициенты аи неиз­
вестны. Однако это рассуждение показывает, что коэффи­
циенты bij-adij, при которых щ ЭКп = const, заведомо сущест­
вуют. Задача сводится к их поиску.
Разумеется, и в описанном приеме методы систем с пере­
менной структурой используются в конечном счете для
восстановления производной х. Однако в отличие от цити­
рованных выше работ восстановление матрицы А осу­
ществляется здесь не с использованием дискретных одно-^
временных замеров векторов жи же последующей обработ-4
кой этих замеров с помощью какой-либо вычислительной
процедуры, а в ходе непрерывного процесса, без дискрет­
ных замеров. Поэтому предлагаемый способ оказывается
нечувствительным к тому, что в ходе изучаемого процес­
са траектория его в фазовом пространстве «прошивает»
подмножество меры нуль, где нарушается линейная неза­
висимость функций ср^ (ж, t) на решениях системы (13.1),
§ 2] ПРОЦЕДУРА НАСТРОЙКИ ПАРАМЕТРОВ МОДЕЛИ 259

а вероятность попасть на решение, целиком принадлежа­


щее этому подмножеству меры нуль, при произвольном
выборе начальных данных равна нулю. Поэтому у пас
'тк_возникает задачи сходимости процесса восстановлепия
'оператора. Заметим также, что предлагаемый метод прин­
ципиально пригоден и в том случае, когда система (13.1)
неустойчива (например, система (13.2) с негурвицевой
матрицей А). Требуется лишь, чтобы скорость процесса
позволила реально наблюдать и измерять его на протяже­
нии некоторого времени, достаточного для выхода в сколь­
зящий режим системы «объект — модель» и, если нужно,
для организации процесса поиска.

§ 2. Процедура настройки параметров модели

Опишем одну из процедур поиска таких параметров


/модели, при которых все величины щ экв окажутся постоян­
ными, и следовательно, искомые параметры объекта могут
быть определены из соотношений (13.9).
Дополним уравнение (13.8) аналогичными уравнения­
ми, в которых в левых частях вместо фу (х , it) стоят функ­
ции фу (х , t) = Lk {фу (х , i)}, т. е. функции, полученные
в результате /с-кратного применения какого-либо линей­
ного оператора L к фу (х, t). В этом случае правые части,
вообще говоря, являются функциями времени.
Введем обозначения
N

2 (*, 0 = е? (О (к = 0,. . . , N — 1). (13.11)


i=i
(Обратим внимание на то, что функции ef не равны
Lk {е?}, так как в процессе поиска параметров модели коэф­
фициенты l(j будут изменяться во времени и тогда левая
'часть в уравнении (13.11) не является результатом
/с-кратиого применения оператора L к линейной комбина-
N
ции 2 k№h которая согласно (13.7) равна е°.)
3=1
Убедимся теперь, что все функции sf могут быть изме­
рены непосредственно, несмотря на то, что параметры
объекта а гу, от которых зависят коэффициенты li}- в (13.11),
260 ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ [ГЛ. XIII

неизвестны. Из условий st = 0 при щ = г4ВКв следует


N N N

2 аиЪ (*> 0 = 2 0 + ( 2 da Iфi (*> 0 1) “ ibkb- (13.12)^


3=1 3= 1 '3 = 1 '

Применяя линейный оператор Ьк к правой и левой части


уравнения (13.12), получаем
N N N

2 а«Фз- (я, о= £к'{2


3= 1 3=1
ьрФз(ж.о+ (2 dpi Фз(*>oiWbkd}. 'з = 1 '

(13.13)
Соотношения (13.13) позволяют переписать уравнения
(13.11) следующим образом:
N N

^ |2 h m {.Х : 0+ (2 IФ; 01)М


1экв}
{ х ,

4=1 3=1 ' 1


N

— 2 ь«зФз- ix >0 = Si • (13.14)


3=1

Как следует из (13.14), все функции в левой части известны


и это позволяет вычислить величины ef.
Линейный оператор L подберем таким образом, чтобы
для функций фу (х , it) выполнялось условие

det ПФ/(зг, 0 1|¥= 0 (/ = 1 ,..., iV; к = 0 , . . . , N - 1). (13.15)


Рассмотрим поведение вспомогательных функций
N
1 V)
ц = — 2 1Ф если коэффициенты Ьц модели изменяются
3= 1
по следующему закону:
N -1

Ъхj —- с 2 е£фj ( x , t ) (с — const, с )> 0 ). (13.16)


к=0
Запишем производные по времени для функций гзр.
N

Vi = 2 3= 1
§ 3] ПРИМЕРЫ ВЫБОРА ЛИНЕЙНЫХ ОПЕРАТОРОВ 261

или с улетом (13.16)


N N -1

vi — ~ с Zj; 2 ei cP; (^1 Z). (13.17)


'— j= l k=0

Уравнение (13.17) согласно (13.11) приводится к виду


JV-1
Щ= — С 2 (8i)2I
к=о

т. е. функции vt являются ограниченными снизу (^ > 0)


и монотонно убывающими при всех е£, одновременно не
равных нулю. Процесс прекратится, когда все ef обра­
тятся в нуль. Из уравнений (13.11) и условия (13.15) *)
следует, что при этом
lim lij — 0,
( —►СХЭ

ИЛИ
lim Ъц = &'хj,
/—►
00

Таким образом, процедура поиска (13.16) для линейных


операторов типа (13.15) позволяет определить все пара­
метры идентифицируемого объекта.

§ 3. Примеры выбора линейных операторов


Описанная процедура определения параметров объекта
правомерна для линейных операторов типа (13.15). Приве­
дем примеры таких операторов.
П р и м е р 1. Пусть объект является линейной системой
(13.2), т. е. ер,- = Xj, И является квадратной матрицей раз­
мерности п X п с действительными и различными собствен­
ными числами. Покажем, что для линейного оператора L
типа «элемент запаздывания» условие (13.15) выполняется.

*) Предполагается, что процесс настройки параметров моде­


ли происходит намного быстрее процессов в объекте и если
lim del ||tpf ||= 0, то Н т (е^ / clet ||tpf ||) = 0.
/ —► оо / —►СО
262 ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ ЕГЛ. X III

В рассматриваемом случае вектор х имеет вид


х = ПФ (t) с, (3.18)
где D — матрица, столбцами которой являются собствен­
ные векторы матрицы А , Ф (t) — диагональная матрица с
элементами е“*\ оц (£ = 1, . . ., п) — собственные числа
матрицы А , с — вектор-столбец с компонентами с1; .. . ,
сп, зависящий от начальных условий. Для выбранного
оператора L с запаздыванием т задача сводится к до­
казательству следующего условия:

det ||xK
j (t) I = det ||Xj (t — (к — 1) т) ||=j= О
(/, к = 1, . . ., п). (3.19)

Как следует из (3.18), этот определитель имеет вид


П
t Za
i= l det II e
det ||хк I — схсч. . . сп det |D |е

По сделанному ранее предположению, компоненты век­


тора х в (3.18) должны быть линейно независимыми,
поэтому все с, отличны от нуля; матрица D состоит из
собственных векторов матрицы А с различными собствен­
ными числами, поэтому d et||Х>| 0; наконец, det ||е_аА;~1)т||
является определителем Вандермонда и поэтому также
отличен от нуля. Таким образом, неравенство (3.19) до­
казано.
П р и м е р 2. Рассмотрим теперь применение к функ­
циям X j ( t ) линейного оператора L типа «инерционное
звено» с постоянной времени Т и коэффициентом усиле­
ния, равным единице, для линейной системы, которая
изучалась в примере 1. Предположим, что собственные
движения инерционных звеньев затухают столь быстро,
что ими можно пренебречь.
В результате ^-кратного применения оператора L к
вектору х (3.18) получим:
хк = D Ф?: (if) с,
где Фк (г) — диагональная матрица с элементами
еаз1/{Ta,j + 1),:. Аналогичный (3.19) определитель для рас­
сматриваемого оператора, составленный из компонентов
§ 3] ПРИМЕРЫ ВЫБОРА ЛИНЕЙНЫХ ОПЕРАТОРОВ 263

векторов хк (к = 0, . . п — 1), запишется следующим


образом:
П
1.s а ,,
det IIхЧ II = с,С9. .. сп det IID IIе г~1 d e t ------------ г
II ; l l 1- п 11 11 I {Tctj + l ) fc •

При изучении оператора типа «элемент запаздывания» в


примере 1 было показано, что все с,- и det || || не равны
нулю. Последний сомножитель, как и в примере 1, являет­
ся определителем Вандермонда и поэтому ои также отли­
чен от нуля. Это означает, что и для оператора L типа
«инерционное звено» выполняется условие (13.15), при
котором процедура поиска (13.16) позволяет найти пара­
метры объекта.
П р и м е р 3. Покажем, что для систем произвольного
вида (13.1) в качестве оператора L можно выбрать опера­
тор дифференцирования
к dk<Pj (*. О
фу “ dtk '
Докажем, что найдутся такие интервалы времени, на
которых условие (13.15) выполняется. Доказательство
проведем методом математической индукции.
Рассмотрим определитель второго порядка
Ф 1 Фг
А 2 (t)
ф1 фг
Допустим, что А 2 (t) = 0. Тогда в каждый момент
его столбцы линейно зависимы, т. е.
< h (t) ф1 + сь(£) ср2 = 0,
(13.20)
ai (*0 ф1 + а2. (<0 Фг = 0.
Функция а2 (£) не равна тождественно нулю, поэтому
найдется интервал времени, на котором а2 (t) не обра­
щается в нуль и система (13.20) представима в виде
ai (t) Ф1 + Фг = 0,
(13.21)
(£) ф ! + фг = 0.
«1
После дифференцирования первого уравнения в (13.21)
и вычитания из него второго получим
Я1 Ф1 = 0 . ( 13. 22)
264 ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ СГЛ. X III

Так как фх ф 0, то соотношение (13.22) означает, что


a± {t) — является постоянной величиной, а это противо­
речит условию линейной независимости функций ср, и ср2.
Следовательно, определитель Л2 (t) не равен тождествен­
но нулю. Рассмотрим определитель к-топорядка, Ак =
d 1 - 1 cpj . . ..
= det (I, ; = 1 ,..., к), предполагая, что опреде-
dtl~
Xi-1
литель (к —1)-го порядка А к^х = det (i, / = 1 , . ..,/c— 1)
Idt'~
не равен тождественно нулю.
Предположим, что определитель A h (t) = 0, т. е. в каж­
дый момент времени его столбцы линейно зависимы. Пусть
функции ах (t), . . ., ак (t) являются коэффициентами ли­
нейной комбинации этих столбцов, которая по аналогии
с (13.20) равна нулю. Выберем интервал времени, когда
ак (t) не обращается в нуль, и запишем для определителя
А к уравнения, аналогичные (13.21):

2 « /о = 0 ( i = 1 , . . . ,/c), ak(0 = l . (13.23)


j= i
dti_1

Дифференцируя каждое уравнение в (13.23) и вычитая


из него последующее уравнение, получим
ft—
1
d f\ j
2 «з dti-l = 0 (« = 1 , . . . , Л — 1). (13.24)
7=1
Так как по нашему предположению определитель А /с_х
не равен нулю, то система (13.24) имеет только триви­
альное решение:
dt (t) = 0 или at (t) = const (i = 1, . . ., к — 1).
Однако этот вывод противоречит условию линейной незави­
симости функций <рх, . . ., срг,_. Таким образом, найдутся
интервалы времени, на которых определитель любого
порядка, составленный из линейно независимых функций
и их производных по времени, тождественно не равен
нулю. Это означает, что оператор дифференцирования
может быть использован для реализации описанной в § 2
процедуры определения параметров объекта.
ЛИТЕРАТУРА

1. А й з е р м а н М. А., Г а н т м а х е р Ф . Р-, О некото­


рых особенностях переключений в нелинейных системах автомати­
ческого регулирования с кусочно-гладкой характеристикой нелиней­
ного элемента. Автоматика и телемеханика, т. 48, № 11, 1957.
2. А н д р о н о в А. А., В и т т А. А., X а й к и н С. 3., Те­
ория колебаний. Физматгиз, 1959.
3. А н д р о н о в А. А., Б а у т и н Н. II., Г о р е л и к Г. С.,
Теория непрямого регулирования при учете кулоновского трения
в чувствительном элементе. Автоматика и телемеханика, т. 7, № 1,
1946.
4. Б а к а к и н А. В., Б е р м а н т М. А., Е з е р о в В. Б.,
Применение систем с переменной структурой для стабилизации
объекта с изменяющимися параметрами при наличии ограничений
на перемещение регулирующего органа. Автоматика и телемеха­
ника, т. 25, № 7, 1964.
5. Б а к а к и н А. В., Г р и ц е н к о М. Б., Костыле-
в а Н. Е., Алгоритмы управления систем с переменной структурой.
Сб. «Системы с переменной структурой и их применение в задачах
автоматизации полета», Изд-во «Наука», 1968.
6. Б а к а к и н А. В., У т к и н В. И., Об одном способе оп­
ределения областей устойчивого движения. Сб. «Системы с пере­
менной структурой и их применение в задачах автоматизации
полета», Изд-во «Наука», 1968.
7. Б а к а к и н А. В., У т к и н В. И., Системы с переменной
структурой с запаздыванием в переключающих устройствах. Сб.
«Системы с переменной структурой и их применение в задачах авто­
матизации полета», Изд-во «Наука», 1968.
8. Б а к а к и н А . В., У т к и н В. И., Об условиях устой­
чивости скользящих движений в системах с переменной структурой.
Сб. «Анализ и синтез систем автоматического управления», Изд-во
«Наука», 1968.
9. Б а р б а ш и н Е. А., Введение в теорию устойчивости.
Изд-во «Наука», 1967.
10. Б'а р б а ш и н Е. А., Г е р а щ е н к о Е. И., О стабили­
зации систем регулирования. ПММ, т. 28, выл. 4, 1964.
11. Б а р б а ш и н Е. А., Г е р а щ е н к о Е. И., О форси­
ровании скользящих режимов в системах автоматического регули­
рования. Дифференциальные уравнения, т. 1, № 1, 1965.
12. Б а р б а ш и н Е. А., Г е р а щ е н к о Е. И., Об одном
принципе построения систем стабилизации. Автоматика и телеме­
ханика, т. 26, № 6, 1965.
13. Б а р б а ш и н Е. А., П е ч о р и н а И. Н., Э й д и-
н о в Р. М., Применение систем автоматического регулирования с
266 ЛИТЕРАТУРА

переменной структурой для одного класса линейных статических


объектов. Автоматика н телемеханика, т. 24, № 1, 1963.
14. Б а р б а ш п н Е. А., Т а б у е в а В. А., Об одном спо­
собе стабилизации систем регулирования третьего порядка с боль­
шим коэффициентом усиления, I. Автоматика и телемеханика, т. 23,
№ 10, 1962.
15. Б а р б а ш и н Е. А., Т а б у е в а В. А., Об одном спо­
собе стабилизации систем регулирования третьего порядка с боль­
шим коэффициентом усиления, II. Автоматика и телемеханика,
т. 24, № 5, 1963.
16. Б а р б а ш и и Е. А., Табуева В. А., Э и д и -
s o в Р. М., Об устойчивости одной системы регулирования с пе­
ременной структурой при нарушении условий скольжения. Авто­
матика и телемеханика, т. 24, № 7, 1963.
17. Б е р м а н т М . А., Е м е л ь я н о в С. В., Об одном спо­
собе управления некоторым классом объектов с изменяющимися
параметрами. Автоматика и телемеханика, т. 24, № 5, 1963.
18. Б е р м а и т М. А., Е м е л ь я н о в С. В., Об устойчи­
вости одного класса систем автоматического управления с перемен­
ными параметрами. Изв. API СССР, Техническая кибернетика, № 6,
1964.
19. Б е р м а н т М. А., Емельянов С. В., Т а-
р а н В. А., Движение систем с переменной структурой в скользя­
щем режиме. Автоматика п телемеханика, т. 26, № 8, 1965.
20. Б е р м а н т М . А., У т к н и В. И., Условия устойчи­
вости свободных колебаний систем с переменной структурой для уп­
равления объектами с изменяющимися параметрами. Сб. «Системы
с переменной структурой н их применение в задачах автоматизации
полета», Изд-во «Наука», 1968.
21. Б е р н ш т е й н С . И., Теория вибрационных регулято­
ров электрических машин. Труды второго Всесоюзного совещания
по теории автоматического регулирования, т. 1. Изд-во АН СССР,
1955.
22. Б р а в е р м а н Э. М., Восстановление дифференциально­
го уравнения объекта в процессе его нормальной эксплуатации. Ав­
томатика и телемеханпка, № 3, 1966.
23. Б р о м б е р г П. В., Матричные методы в теории релей­
ного и импульсного регулирования. Изд-во «Наука», 1967.
24. Г а м к р е л и д з е Р. В., О скользящих оптимальных ре­
жимах. ДАН СССР, т. 143, № 6, 1962.
25. Г е р а щ е н к о Е. И., Об устойчивости движения в гипер­
плоскостях скольжения для некоторых систем автоматического
регулирования с переменной структурой. Изв. АН СССР, Техниче­
ская кибернетика, № 4, 1963.
26. Г е р а щ е н к о Е. И., О степени устойчивости нелиней­
ных систем в скользящем режиме. Изв. АН СССР, Техническая
кибернетика, № 2, 1964.
27. Г е р а щ е н к о Е. И., К и с е л е в Л. В., Об устойчи­
вости одной системы регулирования с форсированным скользя­
щим режимом. Дифференциальные уравнения, т. 1, № 12, 1965.
28. Д е м и д о в и ч Б. П., Лекции по математической теории
устойчивости. Изд-во «Наука», 1967.
ЛИТЕРАТУРА 267

29. Д о л г о л е н к о 10. Б., Скользящие режимы в релей­


ных системах непрямого регулирования. Труды второго Всесоюз­
ного совещания по теории автоматического регулирования, т. 1,
Изд-во АН СССР, 1965.
I 30. Д у д и н Е. Б., Условия переключения в комбинирован­
ных следящих системах переменной структуры. Изв. АН СССР,
Техническая кибернетика, № 2, 1964.
31. Д у д и н Е. Б., У л а н о в Г. М., Комбинированные си­
стемы автоматического управления с переменной структурой. Труды
Международной конференции по многомерным и дискретным систе­
мам автоматического управления. Прага. Секция Б, Прага, 1965.
32. Д у д н и к о в Е. Г., Введение в теорию непрямого регу­
лирования с постоянной скоростью' закрытия. Автоматика и теле­
механика, № 6, 1939.
33. Е з е р о в В. Б., У т к и н В. И., Фильтр с переменной
структурой как аналог форсирующего звена. Сб. «Системы с пере­
менной структурой и их применение в задачах автоматизации поле­
та», Изд-во «Наука», 1968.
34. Е м е л ь я н о в С. В., Системы автоматического управ­
ления с переменной структурой. Изд-во «Наука», 1967.
35. Е м е л ь я н о в С. В., Способ получения сложных зако­
нов регулирования с использованием лишь сигнала ошибки или ре­
гулируемой координаты и ее первой производной. Автоматика и
телемеханика, т. 18, № 10, 1957.
36. Е м о л ь я н о в С. В., Применение нелинейных коррек­
тирующих устройств типа «ключ» для улучшения качества систем
автоматического регулирования второго порядка. Автоматика и
телемеханика, т. 20, № 7, 1959.
37. Е м е л ь я н о в С. В., Регулирование объекта первого по­
рядка с запаздыванием астатическим регулятором с нелинейной
коррекцией. Автоматика и телемеханика, т. 20, № 8, 1959.
38. Е м е л ь я н о в С. В., Регулирование нейтрального объ­
екта астатическим регулятором с нелинейной коррекцией. Сб.
«Некоторые методы расчета систем автоматического регулирования
и их элемептов», выл. 112, Судпромгиз, 1959.
39. Е м е л ь я н о в С. В., О высококачественном управле­
нии некоторыми нелинейными объектами с переменными парамет­
рами. Изв. АН СССР, Энергетика и автоматика, № 4, 1962.
40. Е м е л ь я н о в С. В., Б е р м а н т М . А., К вопросу о
построении высококачественных систем автоматического управле­
ния объектами с изменяющимися параметрами. ДАН СССР, т. 145,
№ 4, 1962.
41. Е м е л ь я н о в С. В., Б е р ма н т М. А., У т к и н В. И.,
Построение систем автоматического регулирования (САР) с пе­
ременной структурой, малочувствительных к быстрому изменению
в широких пределах объекта регулирования. Сб. «Самонастраива­
ющиеся системы», Изд-во «Наука», 1965.
42. Е м е л ь я н о в С. В., Т а р а н В. А., К о с т ы л е-
в а Н. Е., Б е р м а и т М. А., У т к и н В. И., Принципы построе­
ния систем с переменной структурой для управления нестационар­
ными объектами. Труды III конгресса ИФАК в Лондоне, 1966, Изд-
во «Наука», 1971.
268 ЛИТЕРАТУРА

43. Е м е л ь я н о в С. В., Б е р м а н т М. А., Косты­


л е в а Н. Е., У т к и н В. И., Об одном способе компенсации пара­
метрических возмущений. Теория самонастраивающихся систем,
Изд-во «Наука», 1969.
44. Е м е л ь я н о в С. В., К о с т ы л е в а Н. Е., У т-
к и н В. И., Об одном способе построения инвариантных САР с пе­
ременной структурой. Сб. «Теория многосвязанного регулирования»,
Изд-во «Наука», 1966.
45. Е м е л ь я н о в С. В., У т к и н В. И., Т а р а н В. А.,
К о с т ы л е в а Н. Е., Ш у б л а д з е А . М., Е з е р о в В. Б.,
Д у б р о в с к и й Е. Н., Теория систем с переменной структу­
рой. Изд-во «Наука», 1970.
46. Е м е л ь я н о в С. В., К о с т ы л е в а Н. Е., О неко­
торых особенностях движения в САР с переменной структурой,
обладающих разрывной функцией переключения. ДАН СССР, т. 153,
№ 4, 1963.
г 47. Е м е л ь я н о в С. В., К о с т ы л е в а Н. Е., Синтез си­
стем автоматического регулирования с переменной структурой, об­
ладающих разрывной функцией переключения. Изв. АН СССР,
Техническая кибернетика, № 1, 1964.
48. Е м е л ь я н о в С. В., Т а р а н В. А., Об одном классе
САР с переменной структурой. Изв. АН СССР, Энергетика и авто­
матика, № 3, 1962.
49. Е м е л ь я н о в С. В., Т а р а н В. А., К вопросу исполь­
зования инерционных звеньев для построения одного класса систем
автоматического регулирования с переменной структурой, I.
Автоматика и телемеханика, т. 24, № 1, 1963.
50. Е м е л ь я н о в е . В., Т а р а н В. А., К вопросу ис­
пользования инерционных звеньев для построения одного класса
систем автоматического регулирования с переменной структурой,
II. Автоматика и телемеханика, т. 24, № 2, 1963.
51. Е м е л ь я н о в е . В., Т а р а н В. А., О способе стаби­
лизации систем автоматического регулирования с переменной струк­
турой без использования воздействий по производным. Изв. АН
СССР, Техническая кибернетика, № 1, 1963.
52. Е м е л ь я н о в С. В., Т а р а н В. А., К вопросу по­
строения систем автоматического регулирования с переменной
структурой для линейных объектов. Изв. АН СССР, Техническая
кибернетика, № 2, 1963.
53. Е м е л ь я н о в С. В., Т а р а н В. А., Дополнение к
статье Е. И. Геращенко. Изв. АН СССР, Техническая кибернетика,
№ 4, 1963.
54. Е м е л ь я и о в С. В., Т а р а н В. А., Применение ком­
мутируемых фазосдвигающих фильтров в системе автоматического
регулирования с переменной структурой. Изв. АН СССР, Техниче­
ская кибернетика, № 5, 1963.
55. Е м е л ь я н о в С. В., Т а р а н В. А., Стабилизация
САР с переменной структурой при помощи инерционных звеньев
с изменяемой постоянной времени. Автоматика и телемеханика,
т. 25, № 6, 1964.
56. Е м е л ь я и о в С. В., У т к и н В. И., Применение си­
стем автоматического регулирования с переменной структурой для
ЛИТЕРАТУРА 269

управления объектами, параметры которых изменяются в широких


пределах. ДАН СССР, т. 152, № 2, 1963.
57. Е м е л ь я н о в С. В., У т к и н В. И., Об устойчивости
движения одного класса САР с переменной структурой. Изв. АН
.СССР, Техническая кибернетика, № 2, 1964.
/ 58. Е м е л ь я н о в е . В., У т к и н В. И., Т а р а н В. А.,
О попадании изображающей точки на плоскость скольжения в си­
стемах с переменной структурой третьего порядка. Изв. АН СССР,
Техническая кибернетика, № 3, 1965.
59. Е м е л ь я н о в С. В., Ф е д о т 6 в а А. И., Создание
астатизма в следящих системах с переменной структурой. Автома­
тика и телемеханика, т. 23, № 10, 1962.
60. Е м е л ь я н о в е . В., Ф е д о т о в а А. И., Воспроизве­
дение управляющего воздействия астатическими следящими си­
стемами с переменной структурой. Автоматика и телемеханика,
т. 26, № 1, 1965.
61. Е м е л ь я н о в е . В., Ф е д о т о в а А. И., Об астати­
ческом воспроизведении трансцендентных функций следящими си­
стемами с переменной структурой. Автоматика и телемеханика, т. 26,
№ 3, 1965.
62. И т к и с 10. Ф., К вопросу об устойчивости движения си­
стемы с переменной структурой для управления объектами с изме­
няющимися параметрами. Сб. «Системы с переменной структурой и
их применение в задачах автоматизации полета». Изд-во «Наука»,
1968.
63. И ш л и н с к и й А. 10., Механика гироскопических си­
стем. Изд-во АН СССР, 1963.
64. К а р п и н с к а я Н. Н., Метод штрафных функций и
обоснование метода Пайна. Автоматика и телемеханика, № 1, 1967.
65. К о р н и л о в 10. Г., О влиянии нечувствительности ре­
гулятора на динамику непрямого регулирования. Автоматика и те­
лемеханика, № 1, 1950.
66. К о р о в и н С. К., У т к и н В. И., Применение сколь­
зящего режима в задачах статической оптимизации. Автоматика и
телемеханика, № 4, 1972.
67. К о р т н е в А. В., К о с т ы л е в а Н. Е., О компенса­
ции влияния возмущений в одном классе систем с переменной
структурой. Сб. «Техническая кибернетика», Изд-во «Наука», 1965.
68. К о с т ы л е в а Н. Е., Восстановление дифференциаль­
ных уравнений объекта методами систем с переменной структурой.
Автоматика и телемеханика, № 10, 1971.
69. К р а с о в с к и й А. А., О вибрационном способе линеа-
„ризации некоторых нелинейных систем. Автоматика и телемеханика,
№ 1, 1948.
70. К р а с о в с к и й А. А., Динамика непрерывных само­
настраивающихся систем. Физматгиз, 1963.
71. К р о т о в В. Ф., Методы решения вариационных задач
па основе достаточных условий абсолютного минимума 1. Автомати­
ка и телемеханика, т. 23, № 12, 1962.
72. К у л е б а к и н В .С ., К теории автоматических вибра­
ционных регуляторов для электрических машин. Теоретическая и
экспериментальная электротехника, № 4, 1932.
270 ЛИТЕРАТУРА

73. К у х т е н к о А. И., Проблема инвариантности в автома­


тике. Гос. изд-во технической литературы УССР, 1963.
74. Л я п у н о в А. М., Общая задача об устойчивости дви­
жения. Физматгнз, 1959.
75. М е е р о в М. В., Системы многосвязанного регулиро­
вания. Изд-во «Наука», 1967. '.
76. М е д в е д е в Г. А., Т а р а с е н к о В. П., Вероятном:,
ные методы исследования экстремальных систем. Изд-во «Наука»,
1967.
77. М о р о с а н ов И. С., Релейные экстремальные системы.
Изд-во «Наука», 1964.
78. Н е й м а р к 10. И., О скользящем режиме релейных си­
стем автоматического регулирования. Автоматика и телемеханика,
№ 1, 1957.
79. Н е й м а р к 10. И., Замечание к докладу А. Ф. Филип­
пова. Труды I конгресса ИФАК, Изд-во АН СССР, 1961.
80. Н и к о л ь с к и й Г. Н., К вопросу об автомтической
устойчивости корабля на заданном курсе. Труды центральной ла­
боратории проводной связи, № 1, 1934.
81. П е т р о в Б. Н., Е м е л ь я н о в С. В., Б е р-
м а н т М. А., У т к и н В. И., Чувствительность систем автомати-/
веского управления с переменной структурой. Труды международ-1
ного симпозиума по чувствительности систем автоматического уп­
равления. Дубровник, 1964. Изд-во «Наука», 1968.
82. П е т р о в Б. Н., Е м е л ь я н о в С. В., Принцип по­
строения комбинированных САР с переменной структурой. ДАН
СССР, т. 153, № 5, 1963.
83. П е т р о в Б. Н., Е м е л ь я н о в С. В., Г р и ц е н-
к о М. Б., Автономность в многосвязанных системах автоматическо­
го управления с переменной структурой. ДАН СССР, т. 169, № 1,
1966.
84. П е т р о в Б. Н., Е м е л ь я н о в С. В., Д у б р о в -
с к п й Е . Н., К о р т н е в А. В., О принципе построения беспо-
исковой адаптивной системы автоматического управления с пере­
менной структурой. ДАН СССР, т. 170, № 6, 1966.
85. П е т р о в Б. Н., Е м е л ь я н о в С. В., Д у д и н Е. Б.,
О выборе критериев синтеза комбинированных следящих систем с пе­
ременной структурой. ДАН СССР, т. 153, № 6, 1963.
86. П е т р о в Б. Н., Е м е л ь я н о в С. В., К о с т ы ­
л е в а Н. Е., Об управлении линейными объектами с переменными
параметрами. ДАН СССР, т. 155, № 1, 1964.
87. П е т р о в Б. Н. , Е м е л ь я н о в С. В., У т к и н В. И.,
Принцип построения инвариантных систем автоматического регу­
лирования с переменной структурой. ДАН СССР, т. 154, № 6, 1964.'
88. П е т р о в Б. Н., У л а н о в Г. М., Е м е л ь я н о в С. В.,
Оптимизация и инвариантность в системах автоматического регу­
лирования с жесткой и переменной структурой. Труды II междуна­
родного конгресса ИФАК по автоматическому управлению. Изд-во
АН СССР, 1963.
89. П о п о в с к и й А. М., Линеаризация скользящего режи­
ма работы регулятора постоянной скорости закрытия. Автоматика
и телемеханика, № 3, 1950,
ЛИТЕРАТУРА 271

90. Р о з е н в а с с е р Е. Н., Ю с у п о в Р. М., Чувстви­


тельность систем автоматического управления. Мзд-во «Энергия»,
1969.
91. Р о з о и о э р Л. И., Вариационный подход к проблеме
, инвариантности, I. Автоматика и телемеханика, № 6, 1963.
■*4 . 92. Р о з о н о э р Л. И., Вариационный подход к проблеме
инвариантности, II. Автоматика н телемеханика, № 7, 1963.
' 93. Т а р а н В. А., Регулирование линейного объекта аста­
тическим регулятором с переменной структурой без использования
чистых производных в законе управления, I, II. Автоматика и теле­
механика, т. 25, №№ 10, 11, 1964.
94. Т а р а н В. А., Построение систем автоматического уп­
равления с применением коммутируемых фазосдвигающих фильт­
ров. Изв. АН СССР, Техническая кибернетика, № 4, 1965.
95. Т р у х а н Н. М., Восстановление дифференциального
уравнения объекта при наличии одной нелинейности. Автоматика
и телемеханика, № 3, 1971.
96. У т к и н В. И., Применение систем автоматического ре­
гулирования с переменной структурой для компенсации возмуще­
ний, приложенных к различным точкам объекта. Сб. «Теория и
^применение автоматических систем», Изд-во «Наука», 1964.
97. У т к и н В. И., О компенсации вынужденной составляю­
щей движения в системах автоматического регулирования с пере­
менной структурой. Изв. АН СССР, Техническая кибернетика,
№ 4, 1965.
98. У т к и н В. И., Квазпинвариантное управление вынуж-
г'денным движением линейных объектов с переменными параметра­
ми. Техническая кибернетика, № 5, 1966.
99. У т к и н В. И., Условия устойчивости вынужденного
движения в системах с переменной структурой. Сб. «Системы с пе­
ременной структурой и нх применение в задачах автоматизации
полета», Изд-во «Наука», 1968.
100. У т к и н В. И., Скользящие режимы в системах с пере­
менной структурой, Teoretski prilog Automatika, № 3, 1970, Yugo­
slavia.
101. У т к и и В. И., Об уравнениях скользящего режима в
разрывных системах, I, Автоматика и телемеханика, № 12, 1971.
102. У т к и н В. И., Об уравнениях скользящего режима в
разрывных системах, II, Автоматика н телемеханика, № 2, 1972.
103. Ф и л и п п о в А. Ф., Дифференциальные уравнения с
разрывной правой частью. Математический сборник, т. 51, № 1,
1960.
104. Ф и л и п п о в А. Ф., Приложение теории дифференци­
ал ьн ы х уравнений с разрывной правой частью к нелинейным зада­
ч а м автоматического регулирования. Труды I конгресса ИФАК,
' Изд-во АН СССР, 1961.
105. Ц ы п к и н Я. 3., Теория релейных систем автоматиче­
ского регулирования. Гостехиздат, 1955.
106. Э й д и н о в Р. М., К оценке времени переходных про­
цессов в системах автоматического регулирования с переменной
структурой. Изв. АН СССР, Техническая кибернетика, № 5, 1965.
107. Я к у б о в и ч В. А., Метод матричных неравенств в тео­
272 ЛИТЕРАТУРА

рии устойчивости нелинейных регулируемых систем. Автоматика и


телемеханика, № 7, 1964.
108. А и d r e J S e i b e r t Р., Uber stiickweise Iineare Dif-
ferentialgleichungen, bei Regelungsproblem auftreten, I, Arcb, der
Math., 7, № 2, 1956.
109. A n d r e J., S e i b e r t P., Uber stuckweise lineara"
Differetialgleicbungen, die bei Regelungsproblem auffreten, II, Archj-
der Math., 7, № 3, 1956. i,
110. D г a z e n о v i с B., The invai'iance conditions in variable
structure systems. Automatica.vol. 5, 1969, Pergamon Press.
111. D r a z e n o v i c B., Sintera sisLema sa promjenljivom
structurom as invarijantnim lcvetangem u ldiznom rezimu, Automatica,
№ 5—6, 1970, Yugoslavia.
112. D r a z e n o v i c В., О stabilnosLi sistema sa promjenlji­
vom structurom, Automatica, № 5—6, 1970, Yugoslavia.
113. E m e l y a n o v S. V., U t k i и V. I., Invariant solu­
tions ol differential equation with discontinuous coefficients. Design
principles of variable structure control systems. Mathematical theory
of control. Proceedings of a conference held in Los Angeles, 1967, Aca­
demic Press.
114. M a t i c B . , Principi realizacije modela osjetljivostii sy­
stems s prominljivom structurom kod kojih je usrostavljen lclizni re-
zim Energoinvest, № 2, 1971, Yugoslavia.
115. W i l d e D., B e i g h t l e r C., Foundation of Optimi­
zation Prentice-hall. Inc., 1967.

Вам также может понравиться