Вы находитесь на странице: 1из 322

К.П.

ВЛАСОВ

ТЕОРИЯ
АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ
Учебное пособие

Рекомендовано к изданию Ученым советом Санкт-


Петербургского горного института
(технического университета)

ИЗДАТЕЛЬСТВО ГУМАНИТАРНЫЙ ЦЕНТР


ХАРЬКОВ 2006

3
УДК 62-50 (075.80)
ББК 32-065

Власов К.П. Теория автоматического управления. Учебное пособие. – Х.: Издательство «Гуманитарный центр»,
2006.- с.

Изложены основы современной теории автоматического управления. Дана классификация АСУ по раз-
личным признакам. Рассмотрены методы составления и решения дифференциальных уравнений движения от-
дельных звеньев АСУ, приведены статические и динамические характеристики типовых звеньев, а также прин-
ципы построения структурных схем систем управления. Рассмотрены методы расчета автоматических систем,
позволяющие анализировать их устойчивость и качество переходных процессов в системах. Излагаются основ-
ные методы синтеза систем управления различного класса Приведенный материал охватывает широкий круг
вопросов и методик расчета для линейных и нелинейных, непрерывных и дискретных, оптимальных и адаптив-
ных, нечетких и других автоматических систем управления.
Учебное пособие предназначено для студентов технических вузов, изучающих автоматические системы
управления

Рецензенты: кафедра робототехники и автоматизации производственных систем Санкт-Петербургского


государственного электротехнического университета (ЛЭТИ);
Л.В. Акимов (Национальный технический университет “Харьковский политехнический институт”

2
СОДЕРЖАНИЕ
ПРЕДИСЛОВИЕ………………………………………………………… 7
ВВЕДЕНИЕ………………………………………………………………. 8

РАЗДЕЛ I
ЛИНЕЙНЫЕ АВТОМАТИЧЕСКИЕ СИСТЕМЫ УПРАВЛЕНИЯ…. 14

1.СОСТАВЛЕНИЕ УРАВНЕНИЙ ДВИЖЕНИЯ ЭЛЕМЕНТОВ АСУ И


МЕТОДЫ ИХ РЕШЕНИЯ…………………………………………………………...…. 14

1.1. Математическое описание элементов системы с помощью


дифференциальных уравнений……………………………………………………… 14
1.1.1. Линеаризация дифференциальных уравнений……………………………... 16
1.2 Математическое описание системы в переменных состояния……………… 19
1.3. Методы решения линейных дифференциальных уравнений………………. 22
1.3.1. Классический метод………………………………………………………….. 22
1.3.2. Применение преобразования Лапласа. Передаточная функция…………... 25
1.4. Частотные характеристики линейных систем………………………………... 29
1.4.1. Условия однозначной связи между частотными характеристиками……… 31
1.5. Связь между операторами преобразования сигналов линейной системой.. 32

2. ТИПОВЫЕ ЗВЕНЬЯ И СТРУКТУРНЫЕ СХЕМЫ АСУ……………….……….. 34


2.1. Типовые динамические звенья………………………………………….………. 34
2.1.1. Усилительное звено……………………………………………………….….. 35
2.1.2. Апериодическое звено первого порядка……………………………………. 35
2.1.3. Апериодическое звено второго порядка……………………………………. 37
2.1.4. Колебательное звено………………………………………………….……… 38
2.1.5. Интегрирующее звено…………………………………………………….….. 41
2.1.6. Дифференцирующее звено…………………………………………….…….. 42
2.2. Структурные схемы АСУ………………………………………………………… 43
2.2.1.Основные виды соединения звеньев…………………………………………. 43
2.2.2. Правила структурных преобразований………………………………………... 45
2.2.3. Использование графов для преобразования структурных схем…………… 47
2.3. Многомерные системы управления…………………………………………….. 52
2.3.1. Управляемость и наблюдаемость……………………………………………. 55

3. УСТОЙЧИВОСТЬ И КАЧЕСТВО ФУНКЦИОНИРОВАНИЯ АСУ…………... 58


3.1. Устойчивость АСУ………………………………………………………………... 58
3.1.1. Переходные процессы в АСУ…………………………....………………….. 58
3.1.2. Алгебраический критерий устойчивости Гурвица…………………………. 61
3.1.3. Частотные критерии устойчивости………………………………………….. 63
3.2. Качество процесса управления………………………………………………….. 69
3.2.1. Прямые методы оценки качества……………………………………………. 69
3.2.2. Косвенные методы оценки качества………………………………………… 72

4. МЕТОДЫ СИНТЕЗА АСУ…………………………………………………………… 77


4.1. Законы регулирования в линейных АСУ……………………………………… 77
4.2. Коррекция линейных АСУ………………………………………………………. 81

215
4.3. Параметрический синтез устройств управления……………………...……… 87
4.3. Инвариантные системы…………………………………………………..……... 90
4.5. Синтез модальных регуляторов……………………………….……………….. 95
4.5.1. Синтез регуляторов состояния……………………………….……………... 95
4.5.2. Принципы построения наблюдателей состояния………..………….……….102
4.5.3. Модальный регулятор…………………………………………….…………. 105
4.6. Частотные методы АСУ…..……………………………………….…………….
107
4.6.1. Логарифмические частотные характеристики…..............……….………… 107
4.6.2. Синтез АСУ с помощью логарифмических амплитудно-частотных
характерстик….....................…………………………….…….…………….
112

РАЗДЕЛ II
ОСОБЫЕ ЛИНЕЙНЫЕ АВТОМАТИЧЕСКИЕ СИСТЕМЫ
УПРАВЛЕНИЯ …………………………………………………………………….………
119

5. СИСТЕМЫ С ЗАПАЗДЫВАНИЕМ И РАСПРЕДЕЛЕННЫМИ


ПАРАМЕТРАМИ………………………………………………………………….…………..
120

5.1. Системы с запаздыванием…………………………………………….……….…. 120


5.2. Системы с распределенными параметрами……………………….…………… 123
5.3. Устойчивость систем с запаздыванием……………………………….………… 126
5.4. Коррекция АСУ объектами с большим запаздыванием……………….…….. 130

6. ИМПУЛЬСНЫЕ СИСТЕМЫ……………………………………………….……….. 135

6.1. Математические методы анализа функционирования импульсных систем. 136


6.1.1. Разностные уравнения………………………………………………………… 136
6.1.2. Прямое z-преобразование…………………………………………………….. 143
6.1.3. Обратное z-преобразование…………………………………………………... 147
6.1.4. Модифицированное z-преобразование………………………………………. 150
6.2. Импульсные фильтры…………………………………………………………….. 151
6.3. Устойчивость импульсных систем………………………………………………. 154
6.3.1. w-преобразование……………………………………………………………... 156
6.3.2. Частотные критерии устойчивости…………………………………………... 158
6.4. Качество функционирования импульсных систем…………………………… 162

РАЗДЕЛ III
НЕЛИНЕЙНЫЕ АВТОМАТИЧЕСКИЕ СИСТЕМЫ
УПРАВЛЕНИЯ……………………………………………………………………………..
165

7. СТАТИКА НЕЛИНЕЙНЫХ СИСТЕМ………………….…………………………..


165
7.1. Основные типы нелинейных звеньев…………………………………………... 165
216
7.2. Соединение нелинейных звеньев………………………………………………... 170
7.3. Структурные преобразования нелинейных систем………………...………… 175

8. ТОЧНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ ДИНАМИЧЕСКИХ


СВОЙСТВ НЕЛИНЕЙНЫХ СИСТЕМ ………………………………………………. 178

8.1. Метод припасовывания…………………………………………………………... 178


8.2. Метод фазовых траекторий…………………….………………………………… 180
8.2.1. Анализ линейных систем с помощью метода фазовой плоскости…………. 181
8.2.2. Анализ нелинейных систем с помощью метода фазовой плоскости………. 185
8.2.3. Исследование релейных АСУ………………………………………………… 188
8.2.4. Колебательные процессы в релейных системах…………………………….. 190
8.2.5. Метод точечных преобразований……………………………………………. 193
8.2.6. Скользящий режим…………………………………………………………… 195

9. ПРИБЛИЖЕННЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ


ДИНАМИЧЕСКИХ СВОЙСТВ НЕЛИНЕЙНЫХ СИСТЕМ……………………………
198

9.1. Метод гармонической линеаризации…………………………………………… 198


9.1.1. Сущность метода……………………………………………………………… 198
9.1.2. Критерии устойчивости……………………………………………………… 200
9.1.3. Определение коэффициентов гармонической линеаризации……………... 204
9.1.4. Определение параметров автоколебаний………………………………….... 205
9.2. Вибрационная линеаризация нелинейностей…………………………………. 209
9.3. Статистическая линеаризация нелинейностей……………………………….. 212

РАЗДЕЛ IV
СПЕЦИАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ……………........................ 215

10. ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ………………………………... 215

10.1. Цель управления и критерий оптимальности…………………………….. 215


10.2. Энергетические соотношения при управлении, оптимальном по
Быстродействию……………………………………………………………………… 218
10.3. Основные методы синтеза оптимальных систем управления………….. 220
10.3.1. Синтез оптимальных систем с помощью вариационного исчисления 221
10.3.2. Динамическое программирование…………………………………….. 233
10.3.3. Принцип максимума……………………………………………………. 240
10.3.4. Синтез систем, оптимальных по быстродействию…………………… 242
10.4. Статистическая динамика и оптимальные фильтры……………………. 249
10.4.1. Основные характеристики случайных функций……………………… 249
10.4.2. Прохождение случайного сигнала через линейную систему
254
10.4.3. Расчет установившихся ошибок в системах управления…………….. 257
10.4.4. Синтез системы управления по минимуму средней квадратической
ошибки…………………………………………………………………………. 258

11. АДАПТИВНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ…………………………………… 269

11.1. Экстремальные системы управления………………………………………. 270

217
11.1.1. Непрерывные экстремальные системы………………………………… 272
11.1.2. Дискретные экстремальные системы…………………………………... 276
11.1.3. Методы поиска экстремума в многоканальных экстремальных
системах……………...…………………………………………………………... 281
11.2. Самонастраивающиеся системы управления……………………………... 284
11.2.1. Аналитические самонастраивающиеся системы……………………… 285
11.2.2. Идентификация динамических звеньев системы……………………… 292
11.3. Интеллектуальные системы управления……………………………………. 299
11.3.1. Самоорганизующиеся системы………………………………………….. 299
11.3.2. Обучающиеся системы……………………………………………………. 302
11.3.3 Искусственные нейронные сети………………………………………… 307

12. НЕЧЕТКИЕ СИСТЕМЫ УПРАВЛЕНИЯ………………………………………... 314

12.1. Формальная (четкая) логика…………………………………………… 315


12.2. Нечеткая логика (фази-логика)………………………………………… 316
12.2.1.Основные понятия нечеткой логики………………………………. 316
12.2.2. Основные операции с нечеткими лингвистическими
переменными………………………………………...………………………318
12.3. Основные принципы построения нечетких систем управления…. 329
12.3.1. Передаточные характеристики управляющего устройства……. 331
12.3.2. Синтез нечетких систем управления…………………………….. 332
12.3.3. Нечеткие нейронные сети в системах управления……………… 339

Рекомендательный библиографический список…………........................... 342

218
ПРЕДИСЛОВИЕ

На современном этапе развития человеческого общества дальнейшее его


совершенствование невозможно представить без знания законов управления во всех
сферах человеческой деятельности. В этой связи изучение основ кибернетики, как науки
об управлении, становиться одним из необходимых условий подготовки специалистов
практически во всех областях знаний. Раздел кибернетики, изучающий способы
управления разнообразными техническими устройствами, технологическими процессами
и производствами, обычно называется теорией автоматического управления или
технической кибернетикой. Эта дисциплина включена практически во все учебные планы
технических вузов. И фактически стала общеобразовательной, так как, например физика.
Поэтому издание учебной литературы, компактно и доступно излагающей широкий круг
вопросов, связанных с анализом и синтезом разнообразных автоматических систем
управления, является, безусловно полезным.
Книга состоит из четырех разделов. В первом разделе достаточно полно изложены
основы линейной теории автоматического управления. Особое внимание уделено
различным методам синтеза линейных систем. Материал раздела может быть
использован студентами различных технических специальностей. В этой связи в разделе
приведены необходимые пояснения математических методов, применяемых для
исследования динамических процессов в линейных системах. Второй раздел посвящен
изучению особых линейных систем содержащих звенья с запаздыванием,
распределенными параметрами, а также импульсные звенья. В третьем разделе приведены
основные сведения по расчету статических и динамических режимов нелинейных систем.
Последний, четвертый раздел посвящен созданию специальных (оптимальных,
адаптивных, нечетких и других) систем управления.
Для лучшего усвоения достаточно сложного материала его изложение не
загромождено излишними подробностями. В целом, книга дает общее представление об
основных проблемах, рассматриваемых в теории автоматического управления и
способствует получению базовых знаний в этой области, что существенно расширяет
кругозор специалистов.
Автор выражает признательность канд. техн. наук А.С. Анашкину и М.К. Анихину
за помощь, оказанную при подготовке рукописи к печати.

219
ВВЕДЕНИЕ

Родственные науки объединяются фундаментальными науками высшего ранга. На-


пример, физика охватывает наши знания о вещах очень разных, но подчиняющихся об-
щим законам (в частности, законам сохранения вещества и энергии). В процессе станов-
ления физики как науки были выработаны два могучих средства установления истины:
математический аппарат и опыт. В качестве критерия истины здесь, как и в любых других
науках, используется практика – реализация научных идей.
В 1948 г. Н.Винер опубликовал книгу «Кибернетика, или управление и связь в жи-
вотном и машинах», в которой показал, что можно создать еще одну науку высшего ранга.
Кибернетика – древнегреческое слово, означающее искусство управления кораблем, руле-
вой. Платон упоминает кибернетику как науку об административном управлении провин-
циями. В 1840 г. Ампер, классифицируя науки, отнес ее к общественным наукам. Совре-
менная кибернетика относится к области точных наук, широко использующих математи-
ческий аппарат и опыт. Как и физика, кибернетика не является наукой всех наук. Есть яв-
ления, где нет управления, и кибернетика к ним не применима.
Чтобы отличить управляемое от неуправляемого, обычно прибегают к понятию це-
лесообразности, под которым понимают соответствие объекта определенному состоянию.
Достижение этого состояния связано с воздействием процесса управления на объект.
Управление может быть привнесено извне, а может быть присуще самому объекту.
В последнем случае мы говорим о самоуправлении или автоматизме (от греч. самодейст-
вующий). Кибернетика, как правило, изучает самоуправляющиеся системы, т.е. такие, где
хотя бы один элемент является самоуправляющимся, определяющим целесообразность
управления объектом.
Рассматривая кибернетику как науку о целесообразности выделяют ту ее сторону,
которая примыкает к философии. Здесь у кибернетики есть предшественник – телеология
(учение о цели). Эта наука утверждает, что все в природе устроено целесообразно и всякое
развитие является осуществлением заранее предписанных целей. Однако кибернетическая

220
система может ставить себе и такие цели, которые противоречат целям системы более вы-
сокого уровня, и поэтому фатализм следует признать несостоятельным.
Говоря о кибернетике, как о теории автоматизма, мы выделяем другую ее сторону,
примыкающую к практике, – проблему реализации поставленной цели методами управле-
ния объектами. Нужно иметь в виду, что объекты управления можно классифицировать по
самому существенному признаку на живые и неживые. По одну сторону грани стоит че-
ловек вместе с животными и растениями, а по другую автомат – создание рук человече-
ских. Можно долго перечислять, чем отличается человек от автомата, но не к отрицанию
этих различий сводятся идеи кибернетики, а к поиску, исследованию аналогий между жи-
вым организмом и техническим устройством. Заметим, что все попытки человека в точно-
сти скопировать и воспроизвести с помощью технического устройства технологический
процесс, выполняемый живым организмом, были безуспешными: самолет летает не так,
как птица, подводная лодка плавает не так, как рыбы, и т.д. Отсюда следует, что если под
разумом понимать способность учиться и извлекать уроки из опыта, адекватно реагиро-
вать на новые ситуации, то можно утверждать, что разумные управляющие машины могут
быть созданы, но они будут выполнять свои функции не так, как человек. Уже сейчас ав-
томаты во много раз увеличивают интеллектуальные возможности человека, во многом
избавляя его от рутинной работы. Поэтому будущий мир рисуется как содружество авто-
мата и человека. Но надо всегда помнить, что как ни велика разница между обломком
камня и автоматом, она все же меньше, чем между человеком, создавшим этот автомат, и
его предком, впервые взявшим в руки этот камень, так как человек развивается гораздо
быстрее, чем неживая природа.
Учитывая изложенное, уместно напомнить, что, по А.И.Бергу, кибернетика – это
наука об управлении в сложных динамических системах различной природы, где слож-
ность понимается как наличие в системе разнородных элементов (человек, природа, тех-
ника) и разнообразных связей между ними (положительных, отрицательных, прямых, об-
ратных и др.).
В зависимости от класса объекта управления кибернетика подразделяется на тех-
ническую, организационную, экономическую, медицинскую и др.
Техническая кибернетика (или теория автоматического управления) – отрасль
науки, изучающая технические системы с помощью идей и методов кибернетики. Основ-
ная задача управления техническим объектом – найти и реализовать в данных условиях
алгоритм*) управления, при котором выполняются требования, предъявляемые к процессу.

*)
Алгоритм – предписание, определяющее содержание и последовательность операций, переводящих исход-
ные данные в искомый результат. При этом алгоритм должен обладать свойствами определенности, массовости и ре-
зультативности.

221
Выбор наиболее рационального алгоритма управления на основании имеющейся инфор-
мации – ярко выраженная экстремальная задача. Таким образом, анализ информационных
процессов в системе с целью их алгоритмизации и синтез систем управления, реализую-
щих этот алгоритм, и являются задачей теории автоматического управления.
Требованиями, предъявляемыми к управляемому процессу, могут являться: огра-
ничения на входные координаты (например, различного рода допуски, ошибки, погреш-
ности и т.д.); экстремальные условия (например, получение максимальной мощности,
КПД, минимальной себестоимости и т.д.); некоторые показатели качества.
Техническими средствами для реализации систем управления являются средства
получения информации (датчики), ее передачи и обработки и средства регулирования (ре-
гуляторы, исполнительные механизмы, регулирующие органы).
Протекание технологического процесса или поведение технического устройства
характеризуются некоторыми переменными величинами. Если речь идет об управлении,
то процессы и устройства рассматриваются как объект управления (ОУ), желаемое пове-
дение которого должно быть обеспечено. Переменные, которые характеризуют функ-
ционирование объекта управления, называют выходными величинами y (чаще всего, это
физическая величина). Иногда их называют выходными координатами системы (рис.1).
В реальных условиях на объект управления оказывает воздействие внешняя среда.
Все многообразие этого воздействия учесть невоз-
f
можно. Поэтому в поле зрения оставляют лишь вели-
x =u + f
чины, которые оказывают заметное влияние на вы-

ОУ y ходные координаты, их называют входными воздейст-


u
виями x . Эти воздействия подразделяются на две
Рис.1
группы: управляющие u и возмущающие f . Управ-
ляющие воздействия обеспечивают желаемое функционирование объекта, и должны быть
прежде всего изменяемыми. Если таких воздействий нет, то задача управления не имеет
решения. Возмущающие воздействия препятствуют нормальному функционированию
объекта управления, и изменить их, как правило, невозможно. Задача управления заклю-
чается в формировании такого алгоритма (закона) управления, при котором достигается
желаемое состояние объекта независимо от наличия возмущений.
При создании автоматических систем управления используют два основных прин-
ципа управления: по возмущению и по отклонению.

222
Суть принципа управления по возмущению (принципа Понселе) состоит в том, что
для уменьшения влияния возмущения f на выходные величины объекта y осуществляет-
ся контроль этого возмущения, и при его изменении управление u меняют так, чтобы
скомпенсировать влияние возмущения. Функциональная схема такой АСУ показана на
рис.2.
Основной недостаток управления по
y* f
возмущению заключается в том, что данная
УУ ЧЭ система является разомкнутой, т.е. текущее
значение величины y не учитывается при
u ИУ ОУ y управлении объектом. Это означает, что харак-
Рис.2 тер управляющих воздействий зависит от
ИУ – исполнительное устройство;
ЧЭ – чувствительный элемент; УУ – устройство функционирования объекта лишь в той степе-
управления
ни, в какой учтено влияние возмущения f и
управления u на выходную величину y . В большинстве случаев полная информация о
таком влиянии отсутствует, в связи с чем разомкнутая система не может обеспечить же-
лаемое поведение системы с достаточной точностью. Достоинством управления по воз-
мущению систем является принципиальная возможность упреждающей компенсации
влияния возмущения f на функционирование объекта за счет соответствующего управ-
ления u . В идеале выходная величина y не зависит от f (инвариантная система).
В случае необходимости изменения выходной величины y в УУ подается дополнитель-
ный сигнал y *, который называется задающим воздействием.
Основным признаком систем, использующих принцип управления по отклонению
управляемой величины y от заданного значения y * (принцип Ползунова – Уатта), явля-
ется наличие обратной связи (ОС), которая обеспечивает зависимость управления u
(входной величины) от управляемой (выходной) величины y (рис.3).
f Отклонение управляемой величины от заданно-
u ИУ ОУ го значения Δ y может быть вызвано разными причи-
у
ЧЭ
ОС нами, в том числе и изменением задающего воздейст-

УУ УС y* вия y *. Наличие отклонения Δ y является командой

Рис.3
для изменения управления u до тех пор, пока Δ y не
УС-устройство сравнения
M
снизится до допустимого значения, в частности до ну-

E ля. Таким образом, обратная связь предполагает прин-


ципиальное наличие ошибки, что является недостат-
quation.3 Δ y = y * − y
223
ком такой системы. Кроме того, в системах с обратной связью всегда имеет место запаз-
дывание информации о состоянии объекта в силу его инерционности, что ухудшает дина-
мические показатели работы системы, и в частности, увеличивает склонность системы к
колебаниям. Однако принцип обратной связи позволяет успешно решать задачу управле-
ния, несмотря на некоторую неопределенность и неточность данных о характеристиках
объекта управления и возмущениях. Это является основным преимуществом этих систем
по сравнению с системами, работающими по возмущению.
Для улучшения динамических свойств систем применяют комбинированное управ-
ление: сочетание разомкнутых и замкнутых систем. В этом случае сильные возмущения в
основном компенсируются по разомкнутому контуру, а все неучтенные возмущения и
ошибки, возникающие из-за отсутствия полной информации о поведении объекта, – замк-
нутой системой.
В общем случае система управления представляет собой совокупность взаимосвя-
занных элементов или частей, объединенных общей целью функционирования. Под целью
системы понимают достижение определенное состояние ее выходных координат, которое
может задаваться извне или вырабатываться самой системой. В первом случае система
управления часто называется системой регулирования. Если в результате функционирова-
ния системы достижение цели происходит без участия человека, то такая система управ-
ления называется автоматической.
Автоматические системы управления (АСУ) можно классифицировать по самым
различным признакам. В частности, по функциональным признакам АСУ можно разде-
лить на два больших класса – адаптивные и неадаптивные. В последнем случае структура
и параметры управляющего устройства в процессе функционирования АСУ остаются не-
изменными, т.е. такими, какими они были получены при расчете и наладке системы. Ос-
новой создания таких систем служит предположение, что внешние и внутренние условия
работы системы изменяются в незначительных пределах, что не приводит к ее неудовле-
творительному функционированию.
Если диапазон изменения внешних и внутренних параметров системы настолько
велик, что при помощи неадаптивной системы невозможно добиться удовлетворительного
ее функционирования, необходимо применять систему управления с изменяющимися
свойствами. Процесс изменения свойств системы, позволяющий ей достигнуть оптималь-
ного в определенном смысле или, по крайней мере, удовлетворительного функционирова-
ния в изменяющихся условиях, называется адаптацией (приспособлением). Системы,
осуществляющие процесс адаптации, называются адаптивными или самоприспосабли-
вающимися.

224
Неадаптивные АСУ классифицируются по различным признакам, основные из ко-
торых приведены ниже.

225
Классификация неадаптивных АСУ

1. По принципу действия

Разомкнутые Замкнутые
Комбинированные
(по возмущению) (по отклонению)

2. По цели управления [y*(t)]

Стабилизации Программные Следящие Оптимальные


y* = const y*(t) задана y*(t) произвольна y*(t) = extr

3. По количеству управляемых величин

Одномерные Многомерные

4. По характеру сигналов в цепи управления

Непрерывные Дискретные

Детерминированные Стохастические (случайные)

5. По идеализации математического описания

Линейные Нелинейные Четкие Нечеткие

6. По характеру параметров

Стационарные Нестационарные Сосредоточенные Распределенные

Классификация адаптивных систем управления по различным признакам приведе-


на в главе 11.

226
РАЗДЕЛ I

ЛИНЕЙНЫЕ АВТОМАТИЧЕСКИЕ СИСТЕМЫ УПРАВЛЕ-

НИЯ

К классу линейных систем управления относятся системы, процессы в которых


описываются линейными уравнениями (алгебраическими, дифференциальными, разност-
ными). Коэффициенты этих уравнений не зависят от переменных величин, входящих в
уравнение, т.е. являются постоянными либо зависящими от времени. Например, если сис-
тема уравнений описывается дифференциальным уравнением первого порядка вида:
dy
а0 + a1 y = kx ,
dt
и коэффициенты а0, а1 и k не зависят от переменных у, y& и х, то такая система относится к
классу линейных. Если хотя бы один из этих коэффициентов зависит от переменных, вхо-
дящих в уравнение, то уравнение, а следовательно, и система относится к классу нелиней-
ных. Заметим, что упомянутые коэффициенты обычно являются функцией параметров
системы и, следовательно, для линейных систем эти параметры не должны зависеть от пе-
ременных величин, характеризующих поведение системы.

1. СОСТАВЛЕНИЕ УРАВНЕНИЙ ДВИЖЕНИЯ ЭЛЕМЕНТОВ АСУ И


МЕТОДЫ ИХ РЕШЕНИЯ

1.1. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ЭЛЕМЕНТОВ СИСТЕМЫ С ПОМОЩЬЮ


ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

Поведение отдельных элементов системы в динамических режимах, возникающих


под действием внешних сил, и всей системы в целом обычно описывается дифференци-
альными уравнениями (ДУ). При составлении уравнений динамики исследуемого элемен-
та системы прежде всего необходимо выявить физический закон, определяющий его по-
ведение во времени. Таким законом обычно является закон сохранения материи (вещества
или энергии), который постулирует невозможность мгновенного перехода любого физи-
ческого объекта из одного состояния в другое, поскольку для этого потребовалась бы бес-
конечно большая скорость изменения состояния, что физически нереализуемо. Кроме то-
го, законы физики постулируют невозможность исчезновения материи, она может только

227
превращаться из одного вида в другой, причем это превращение тоже протекает во време-
ни.
Пример 1.1. Составим математическое описание процесса заполнение ёмкости
жидкостью.
Изменение объёма жидкости в ёмкости dV за время dt можно определить восполь-
зовавшись законом сохранения вещества:
dV = (Qвх − Qвых )dt , (1.1)

где V = FH ; H – уровень жидкости в емкости; F – площадь емкости, которая в общем


случае может зависеть от H; Qвх, Qвых – объемные расходы жидкости на входе и выходе
емкости соответственно.
Для случая F=const выражение (1.1) можно переписать в виде:
dH 1
= (Qвх − Qвых ) , (1.2)
dt F

Как видно из уравнения (1.2) величина и знак скорости изменения уровня dH


dt
определяется разностью расходов жидкости на входе и выходе емкости ΔQ= Qвх Qвых.

При ΔQ>0 уровень жидкости в емкости будет повышаться, а при ΔQ<0 снижаться.
Переписав (1.2) в виде:
dH
= kΔQ ,
dt
где k=1/F – коэффициент пропорциональности, получим дифференциальное уравнение,
описывающее процесс изменения уровня жидкости в емкости.
Пример 1.2. Составим математическое описание системы двигатель - рабочая машина.
В соответствии с законом сохранения энергии имеем:

Aд = Ас + ΔАк , (1.3)

т.е. работа движущих сил Ад расходуется на преодоление сил сопротивления Ас и изме-

нение кинетической энергии системы ΔАк , вызванное изменением скорости движения.


Продифференцировав уравнение (1.3) по времени, получим уравнение баланса
мощностей

Pд = Pс + ΔPдин ,

где Pс = dAc / dt – мощность, расходуемая на преодоление сил сопротивления;


Pдин = dΔAк / dt – динамическая мощность, характеризующая изменение запаса кинетиче-

ской энергии системы.

228
ω2
Для системы вращающихся тел имеем: Aк = J , где ω – частота вращения двига-
2
k
теля; J = ∑ mi ri2 = mρ 2 – момент инерции; mi – масса i-й частицы тела, удаленной от оси
i =1

k
вращения на расстояние ri, m = ∑ mi ; ρ – приведенный радиус инерции,
i =1

k k
ρ 2 = (∑ mi ri 2 ) ∑m . i
i =1 i =1

Если момент инерции зависит от угла поворота α, т.е. J = f(α), который, в свою оче-
редь, зависит от времени α(t), то

d ⎛⎜ ω2 ⎞ dω ω2 dJ dα
Pдин = J (α) ⎟ = Jω + .
dt ⎜⎝ 2 ⎟⎠ dt 2 dα dt

Разделив полученное уравнение на ω и учтя, что P = Mω , запишем

dω ω2 dJ
M дин = J + .
dt 2 dα

Если J = const, то M дин = Jdω / dt . Тогда с учетом уравнения (1.3) уравнение движе-
ния системы двигатель – рабочая машина можно записать так:

J = Mд − Mс. (1.4)
dt

Далее необходимо определить факторы, от которых зависят переменные, входящие


в уравнение (1.4), и формализовать эти зависимости.
Движущий момент M д , в рассмотренном примере, зависит от поступления энергии

в машину, т.е. от положения регулирующего органа x и от частоты вращения ω. Момент


сопротивления M с может состоять из ряда слагаемых: часть их может быть постоянна
(сила трения), другие – зависеть от ω («вентиляторная нагрузка»), третьи – от пути, вре-
мени и т.д. Предположим, что M д зависит от положения регулирующего органа и частоты

вращения, т.е. M д ( x, ω) , а момент сопротивления M с – только от частоты вращения, т.е.

M с (ω) и J = const. Вид этих зависимостей определяет тип уравнения (1.4), которое может

быть отнесено к линейным или нелинейным. Если нелинейность гладкая, без скачков, и
отклонение от номинального режима работы не очень существенно, то нелинейное урав-
нение можно с определенной погрешностью заменить на линейное. При этом существенно
упрощается анализ динамических свойств системы управления.

1.1.1. Линеаризация дифференциальных уравнений

229
Замена нелинейного уравнения линейным называется линеаризацией. При этом все
нелинейные функции переменных, входящих в уравнение движения, разлагают в ряд Тей-
лора в окрестностях рабочей точки (установившегося значения переменных). На том ос-
новании, что отклонения малы, в разложении оставляют лишь члены, содержащие откло-
нения в первых степенях, после чего из полученных уравнений вычитают уравнения рав-
новесия (статики) и получают запись линеаризованных уравнений в отклонениях.
В частности, нелинейная функция двух переменных F(x, y) разлагается
в окрестностях рабочей точки (x0, y0) в ряд Тейлора по формуле
∂F ∂F
F ( x, y ) = F ( x0 + Δx, y 0 + Δy ) = F ( x0 , y 0 ) + Δx + Δy +
∂x 0 ∂y 0
n

1⎛ ∂ ∂ ⎞
+ ∑ ⎜ Δx + Δy ⎟ F ( x0 , y0 ).
n = 2 n ! ⎝ ∂x ∂y ⎠
Линейная часть приведенного разложения определяется лишь первыми тремя чле-
нами, остальными слагаемыми можно пренебречь в силу малости Δx, Δy. Эту процедуру
можно интерпретировать как замену уравнения поверхности F(x,y) уравнением плоскости
вида: AΔx + BΔy + C = F ( x, y ) .
В условиях примера 1.2 линеаризация функций M д ( x, ω) , M с (ω) в окрестностях со-

стояния равновесия x = x0, ω = ω 0 дает следующие результаты:

⎧ ∂M д ∂M д
⎪M д ( x, ω ) = M д ( x 0 , ω 0 ) + Δx + Δω ;
⎪ ∂x 0 ∂ω 0
⎨ (1.5)
⎪ M (ω ) = M (ω ) + ∂M c Δω .
⎪ c c 0
∂ω 0

Подставив соотношения (1.5) в уравнение (1.4) и вычтя из полученного выраже-
ния уравнение равновесия M д ( x0 , ω 0 ) − M с (ω 0 ) = 0 , получим

dω ⎛ ∂M c ∂M д ⎞ ∂M д
J +⎜ − ⎟⎟Δω = Δx .
dt ⎜⎝ ∂ω ∂ω ⎠ ∂x 0

Разделив полученное выражение на коэффициент при Δω и опустив знак Δ, пере-


пишем его в виде:

Tω& + ω = kx, (1.6)


−1 −1
⎛ ∂M c ∂M д ⎞ ∂M д ⎛ ∂M c ∂M д ⎞
где T = J ⎜⎜ − ⎟⎟ ; k = ⋅⎜ − ⎟⎟ .
⎝ ∂ω ∂ω ⎠0 ∂x 0 ⎜⎝ ∂ω ∂ω ⎠0

Таким образом, уравнение движения машины-двигателя (1.6), описывающее пове-


дение этой системы в переходных режимах, представляет собой линейное (точнее, линеа-

230
ризованное) дифференциальное уравнение первого порядка с постоянными коэффициен-
тами: Т – постоянная времени и k – коэффициент передачи (усиления).
Заметим, что в данном случае мы учитывали только одну энергетическую емкость,
представляющую собой вращающиеся части машины-двигателя, в которых запасается ки-
нетическая энергия. Если число таких емкостей в системе равняется n, то она будет опи-
сываться ДУ n-го порядка. Напомним, что системы, поведение которых описывается ли-
нейными (или линеаризованными) ДУ, относятся к классу линейных.
Пример 1.3. Пусть объект описывается дифференциальным уравнением второго
порядка:

a0 &у&+ a1 у& + a 2 y = b0 x , (1.7)


где ai, bj – коэффициенты уравнения равные: а0=6; а1=17у; а2=5у2х; b0=8ух.
Так как коэффициенты уравнения (1.7) зависят от переменных, то оно относится к
классу нелинейных. Линеаризуем уравнение (1.7) в окрестностях номинального режима
х0=6.
Решение. Подставим значение коэффициентов в (1.7):

6 &y&+ 17 y y& + 5 xy 3 = 8 yx 2 . (1.8)


Уравнение установившегося (статического) режима, получим, положив в (1.8)

&y& = y& = 0 . Имеем: 5у2=8х, откуда


у=1,26х0,5. (1.9)
При х=х0=6 значение у=у0= 1,26 ⋅ 6 =3,1.
Для линеаризации уравнения (1.8), разложим его в ряд Тейлора по всем перемен-

ным ( &y&, y& , y, x) в окрестностях точки (х0, у0).


Перепишем (1.8) в виде:

F ( &y&, y& , y, x) = 6 &y&+ 17 y y& + 5 xy 3 − 8 yx 2 = 0 . (1.10)

Тогда разложение функции F ( &y&, y& , y, x) в ряд Тейлора без учета слагаемых второго
и высших порядков малости будет иметь вид:
∂F ∂F ∂F ∂F
F ( &y&, y& , y, x) = F0 + Δ &y&+ Δy& + Δ y+ Δx.
∂y& 0 ∂y& 0 ∂y 0 ∂x 0

Воспользовавшись выражением (1.10) и учтя что х0=6; у0=3,1; &y&0 = y& 0 = 0 найдем
значения функции F0 и частных производных, входящих в разложение. Имеем:

231
∂F ∂F
F0 = 5 x0 y 03 − 8 y0 x02 = x0 y0 (5 y02 − 8 x0 ) = 0 ; = 6; = 17 y0 = 52,7;
∂ &y& 0 ∂ y&

∂F ∂F
= 17 y& 0 + 15 y 02 x0 + 8 x02 = 577; = 5 y03 − 16 y0 x0 = −148,6.
∂y 0
∂x 0

С учетом полученных результатов и опустив знак Δ, уравнение (1.9) можно запи-


сать в отклонениях от номинального режима (точка х0,у0).

6 &y&+ 52,7 y& + 577 y = 148,6 х . (1.11)


Выражение (1.11) является линеаризованным дифференциальным уравнением, ис-
следуемого объекта, описываемого нелинейным уравнением (1.10).
Для оценки погрешности линеаризации в статическом режиме, определим относи-
тельную ошибку δ по формуле:
у л − ун
δ = ⋅ 100, % .
у0
Здесь ул=у0+0,257(х-х0) - статическое значение у, вычисленное в соответствии с

линеаризованным уравнением (1.11) при &y& = y& = 0 ; ун – то же, но вычисленное в соответ-


ствии с линейным уравнением (1.9).
Зависимость ошибки δ от величины вход-
δ,%
ного воздействия х представлена на рис.1.1.
Анализ зависимости δ(х) показывает, что ошибка
линеаризации существенно зависит от диапазона
изменения входного воздействия х. При измене-
x
нии х в диапазоне 3<x<10 величина ошибки не
Рис. 1.1. превышает 5 %.

1.2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ СИСТЕМЫ В ПЕРЕМЕННЫХ СО-


СТОЯНИЯ
Математическое описание поведения систем управления во временной области
может быть также выполнено с помощью, так называемых, переменных состояния. Под
состоянием системы понимают совокупность таких переменных ν (t ) = [ν 1 (t ),ν 2 (t ) Kν n (t )],

значение которых, наряду с входными воздействиями х (t ) , позволяет определить ее бу-


дущее состояние и выходные величины у (t ) . Используя определенный набор переменных
состояния, можно перейти от дифференциального уравнения n-го порядка, описывающего

232
поведение системы, к системе из n дифференциальных уравнений первого порядка. Запи-
сав эти уравнения в компактной матричной форме, получаем математическую модель сис-
темы в переменных состояниях, которая вполне приемлема для компьютерного анализа.
Именно последнее обстоятельство и делает целесообразным описание динамических сис-
тем в переменных состояния во временной области. C
Проиллюстрируем понятие переменных со-
стояния на примере электрической цепи, питаю-
щейся от источника тока i, приведенной на
рис.1.2.Заметим, что этот ток является входным
Рис воздействием х(t).
Состояние рассматриваемой системы можно полностью охарактеризовать двумя
переменными ν1 и ν2, где ν1 - напряжение uс на конденсаторе С; ν2 – ток iL в катушке ин-
дуктивности L. Выбор этих переменных произведен исходя из того, что общая энергия Е в
цепи RLC зависит именно от них:
E = 0,5( Li L2 + Сu c2 )

Таким образом, переменные ν1(t)= uс(t) и ν2(t)= iL(t) несут информацию о полной
энергии электрической цепи и, следовательно, о состоянии системы в текущий момент
времени t. Подчеркнем, что число переменных состояния равно числу независимых эле-
ментов системы, накапливающих энергию: в элементе L накапливается магнитная энер-
гия, а в элементе С – электрическая.
Используя законы Кирхгофа, можно записать:
ic+iL=i; uL + uR = uc или

du c
С + iL = i ; (1.12)
dt
diL
L + u R = uc . (1.13)
dt
Здесь uR=RiL – выходная переменная системы y(t); R – выходное сопротивление.
Запишем уравнение (1.12) и (1.13) относительно переменных состояния ν1 = uc и

ν2:= iL, и учтем, что uR=RiL= Rν 2 :


dν 1 1 1 ⎫
= − ν 2 + i ,⎪
dt C C (1.14)
dν 2 1 R ⎬
= ν1 − ν 2.⎪
dt L L ⎭
Решение полученной системы дифференциальных уравнений первого порядка при
известных начальных условиях ν1(t0) и ν2(t0), характеризующих энергетическое состояние

233
системы, в момент времени t=t0, дает возможность найти зависимости ν1(t) и ν2(t) при t>t0,
т.е. определить будущее поведение системы.
Заметим, что принятые переменные состояния uс и iL не являются единственными.
Всегда можно выбрать другой набор переменных, например uс и uL. Тогда новые перемен-
ные состояния ν 1* и ν 2* будут связаны со старыми ν1 и ν2 соотношениями:

ν 1* = u c = ν 1 ,

ν 2* = u L = u c − Ri L = ν 1 − Rν 2 .
Таким образом, в реальной системе всегда можно образовать несколько комбина-
ций переменных состояния, которые определяют энергию, запасенную в системе и, следо-
вательно, описывают ее динамику. Это дает возможность более широкого выбора пере-
менных состояния, в качестве которых обычно принимают физические величины доступ-
ные для измерения тем или иным способом.
Систему уравнений (1.14) с учетом того, что i=x можно записать в матричной фор-
ме:

d ⎡ν 1 ⎤ ⎡ 0 − 1C ⎤ ⎡ν 1 ⎤ ⎡ 1 ⎤
=⎢ ⎥ ⎢ ⎥ + ⎢ C ⎥ ⋅ i. (1.15)
dt ⎢⎣ν 2 ⎥⎦ ⎢ 1 − R ⎥ ⎣ν 2 ⎦ ⎣⎢ 0 ⎦⎥
⎣ L L⎦
Матрица – столбец, состоящая из переменных состояния, называется вектором со-
стояния ν .
Если в общем случае вектор входных сигналов обозначить через х , то дифферен-
циальное уравнение состояния системы запишется в виде:
ν& = Аν + В х , (1.16)
где А – квадратная матрица коэффициентов при переменных состояния νi ( i = 1, n ) раз-

мерности n × n; В – матрица коэффициентов при входных воздействиях хj (j= 1, m ) размер-


ности n × m.
Уравнение (1.16) представляет собой компактную форму записи системы диффе-
ренциальных уравнений первого порядка вида:

ν& i = ai1ν 1 + ai 2ν 2 + K + ainν n + bi1 x1 + bi 2 x2 + K + bim xm , i = 1, n .


Таким образом, решение дифференциального уравнения состояния (1.16) можно
получить точно также как и решение скалярного дифференциального уравнения первого
порядка.
В общем случае выходные переменные линейной системы у связаны с перемен-
ными состояния ν и входными переменными х уравнением выхода:

234
у = Сν +D х , (1.17)
где С и D – матрицы соответствующих коэффициентов.
Для рассмотренной цепи RLC уравнение выходной переменной можно записать в
виде:
y=Rν2. (1.18)
Здесь учтено, что у=uR, iL=ν2. В матричной форме уравнение (1.18) можно записать в ви-

⎡ν ⎤
де: y = [0, R ] ⋅ν +[0,0]х , где ν = ⎢ 1 ⎥ .
⎣ν 2 ⎦

В общем случае множество значений, которые может принять вектор ν (t ) в момент


времени t, называется пространством состояний или фазовым пространством. Более под-
робно этот вопрос будет рассмотрен в разделе III.

1.3. МЕДОДЫ РЕШЕНИЯ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВ-


НЕНИЙ

1.3.1. Классический метод


Классическим оператором преобразования, связывающим входной и выходной
сигналы линейной системы, является линейное дифференциальное уравнение (ДУ) с по-
стоянными коэффициентами. При этом переменная, стоящая в правой части уравнения,
является входным воздействием х, а в левой – выходной величиной у (рис.1.3).
В общем случае линейное неоднородное ДУ записывается в виде
a0 y (n) + a1 y (n−1) + K+ an−1 y& + an y = b0 x(m) + b1 x(m−1) + K+ bm−1 x& + bm x .
x y
(1.19) А

Из теории дифференциальных уравнений известно, Рис.1.3.


y = A{x} ; А – оператор
что интегрирование уравнения (1.19), т.е. определение y(t)
преобразования
при заданном x(t), сводится к нахождению общего интегра-
ла однородного ДУ (без правой части) и частного решения неоднородного ДУ (с правой
частью). Тогда общее решение неоднородного ДУ запишется в виде

y (t ) = y1 (t ) + y2 (t ) ,

где y1 (t ) – общее решение однородного ДУ, которое характеризует свободное движение


системы (без внешних воздействий); y2 (t ) – частное решение неоднородного ДУ, которое
характеризует вынужденное движение системы под воздействием входной величины x(t).
Общее решение однородного ДУ обычно ищется в виде экспоненты

235
. y1 (t ) = C e pt (1.20)

где р – величина, подлежащая определению; С – постоянная интегрирования, определяе-


мая из начальных условий.

Взяв от (1.20) производные и подставив их в (1.19), получим

a0 p n C e pt + a1 p n −1C e pt + K + a n −1 p C e pt + a n C e pt = 0 ,

или, сократив на Cept, имеем

a0 p n + a1 p n −1 + K + an −1 p + an = 0 . (1.21)

Уравнение (1.21) называется характеристическим уравнением ДУ (1.19), имеющим


n искомых корней pi, следовательно, n независимых решений типа (1.20). При этом их
сумма также является решением этого уравнения, что позволяет записать:
n
y1 (t ) = ∑ Ci e pi t , (1.22)
i =1

Частное решение неоднородного ДУ обычно отыскивается в том же виде, в каком


дана правая часть, т.е. зависит от вида функции x(t) на входе системы.
В реальных системах входной сигнал чаще всего бывает случайной функцией вре-
мени. Поэтому, чтобы сопоставить переходные процессы в различных системах, рассмат-
ривают их динамику при так называемых типовых входных воздействиях, в качестве ко-
торых чаще всего применяются единичные ступенчатая и импульсная функции.
Единичная ступенчатая функция (рис.1.4, а) описывает мгновенное изменение
входного сигнала и обозначается x(t ) = 1(t ) :

а б ⎧0 ∀ t < 0;
1(t ) = ⎨
1(t) δ(t) ⎩1 ∀ t ≥ 0.
Единичная импульсная функция (рис.1.4, б) опи-
1
сывается выражением:
t ⎧∞ ∀ t = 0; ∞
δ(t ) = ⎨ при этом ∫ δ(t )dt = 1 .
⎩ 0 ∀ t ≠ 0; −∞
Рис.1.4.
Очевидно, что функции 1(t) и δ(t) связаны между собой соотношением δ(t ) = 1′(t ) . При по-
даче на вход системы типового входного воздействия вида 1(t ) или δ(t ) выходная величи-
на системы будет изменяться во времени тем или иным образом. Это изменение
и является реакцией системы на определенное воздействие.
Если x(t ) = 1(t ) и начальные условия нулевые (система находится в установившемся
состоянии), то реакция системы на это воздействие называется переходной функцией или

236
переходной характеристикой h(t ) . Если x(t ) = δ(t ) и начальные условия также нулевые, то
реакция системы называется импульсной переходной характеристикой или функцией веса
w (t ) .

Функции h(t ) и w (t ) являются временными характеристиками системы или кривыми


разгона, и для линейных звеньев связаны соотношением
w ( t ) = h ′( t ) . (1.23)

Пример 1.4. Пусть система управления описывается дифференциальным уравне-


нием первого порядка Ty& + y = kx .
Найти временные характеристики системы.
Решение. Характеристическое уравнение Tp + 1 = 0 y

имеет корень p1 = −1/ T . Общее решение однородного ДУ k /T


h(t)
−t / T
k
имеет вид y1 (t ) = C1 e . Предположим, что x(t ) = 1(t ) , тогда
частное решение ДУ y2 (t ) = C2 = const . Подставив его в ДУ, w(t)

получим C2 = k. Тогда общее решение неоднородного ДУ t

y (t ) = C1 e −t / T + k . Из начальных условий y(0) = 0 находим Рис.1.5.

постоянную интегрирования C1 = –k. Тогда y (t ) = h (t ) = k (1 − e − t / T ) и, воспользовавшись


k −t / T
(1.23), найдем функцию веса w ( t ) = e (рис.1.5).
T
Если на вход системы подается линейно изменяющийся сигнал ( (рис.1.6, а), имеем
Ty& + y = kt .

При этом общее решение имеет тот же вид, что и ранее y1 (t ) = C1 e −t / T ; а частное
решение ищется в той же
а б
y
форме, что и правая часть
x
ДУ, т.е. в виде линейной
kT
tgα = k зависимости y2 (t ) = C2t + C3 .

α Подставив y2(t) в ДУ, полу-


α α
t t чим C2T + C2t + C3 = kt.
T
Откуда, приравняв коэффи-
Рис.1.6.
циенты при одинаковых
степенях переменной t, имеем C2 = k, C2T + C3 = 0, и, следовательно, C3 = – kT. Тогда об-
щее решение неоднородного ДУ запишется в виде:

y (t ) = C1 e −t / T + kt − kT

237
При начальных условиях y(0) = 0 найдем C1 = Tk. Окончательно получим

[ ]
y (t ) = k t − T (1 − e −t /T ) .

График изменения y(t) представлен на рис.1.6, б.


Пример 1.5. Пусть объект управления описывается ДУ второго поряд-

ка вида: а0 &y&+ a1 y& + a 2 y = b0 x , где a 0 = 0,01; a1 = 0,30; a 2 = 1; b0 = 0,26.


Тогда уравнение объекта имеет вид:

0,01 &у&+ 0,30 у& + у = 0,26 х . (1.24)


Требуется построить переходную характеристику h(t).
Решение. Общее решение однородного ДУ в соответствии (1.22) будет:
y1 (t ) = С1e p1t + С 2 e p2t ,

где р1 и р2 – корни характеристического уравнения ДУ (1.24): 0,01 р 2 + 0,30 р + 1 = 0 , отку-


да р1=-3,8; р2=26,2.
Учтя, что частное решение ДУ (1.24) при х(t)=1(t) равно у 2 (t ) = b0 = 0,26 , общее
решение неоднородного ДУ (1.24) будет:
y (t ) = y1 (t ) + y 2 (t ) = С1e −3,8t + С 2 e −26, 2t + 0,26 .
Постоянные интегрирования С1 и С2 находятся из начальных условий
у (0) = y& (0) = 0. Тогда имеем:

0 = С1 + С 2 + 0,26 ⎫
⎬.
0 = −3,8С1 − 26,2С 2 ⎭

Решив полученную систему уравнений, найдем С1= - 0,304; С2= 0,044. Таким обра-
зом, решение ДУ (1.24) при подаче на вход скач-
кообразного единичного возмущения x(t)=1(t)
окончательно примет вид:
y (t ) = h(t ) = 0,26 − 0,304e −3,8t + 0,044e −26, 2t .
На рис.1.7. представлен график переходно-
го процесса, который практически завершается за

Рис. 1.7
1 с.

1.3.2. Применение преобразования Лапласа. Передаточная функция

238
Применение преобразования Лапласа позволяет перейти от решения системы диф-
ференциальных уравнений к решению системы алгебраических уравнений. Кроме того,
отпадает необходимость специального определения постоянных интегрирования, а общее
решение неоднородного ДУ при любой правой части определяется сразу, т.е. исключается
раздельное нахождение общего y1(t) и частного y2(t) решений.
Пусть f (t) – действительная функция действительного переменного t, удовлетво-
ряющая условиям Дирихле (непрерывная и дифференцируемая на рассматриваемом ин-
тервале) и равная нулю при t < 0. Будем называть эту функцию оригиналом. Каждому ори-
гиналу f (t) всегда можно поставить в соответствие функцию F(p) комплексного перемен-
ного p = α ± jω , определенную как интеграл вида:

F ( p ) = L{ f (t )} = ∫ f (t )e − pt dt , (1.25)
0

Здесь L – оператор прямого преобразования Лапласа.

Правая часть (1.25) называется прямым преобразованием Лапласа функции f(t), а


функция F(p) – изображением Лапласа.

Примеры изображений Лапласа некоторых функций f(t) приведены в таблице 1.1.


Таблица 1.1.
Оригинал f(t) Изображение Лапласа F(p)
А ⋅ 1(t ) ∞
− 1 − pt

A
L{A ⋅ 1(t )} = ∫ A ⋅ 1(t ) ⋅ e − pt dt = A e =
0
p 0 p
1(t) 1
L{1(t )} =
p
δ (t ) b +0
L{δ (t )} = lim ∫ δ (t )e − pt dt = ∫ δ (t )dt = 1
a →0
b →∞ a −0

e − at ∞ ∞
Le{ }= ∫ e
− at − at
e − pt
dt = −
1
p+a
e −( p + a )t =
1
p+a
0 0

ω
e − jωt {
L e − jωt = cos ω t − j sin ω t = } 1
= 2
p
p + jω p + ω
−j 2
2
p +ω2
cos ω t
L{cos ω t } =
p
p +ω2
2

sin ω t ω
L{sin ω t } =
p +ω2 2

tn {}
L tn =
n!
p n +1

239
Рассмотрим некоторые свойства преобразования Лапласа.
1. Свойство линейности. Изображение алгебраической суммы нескольких функций
равно сумме изображений этих функций:

⎧n ⎫ n
L ⎨ ∑ ai f i (t ) ⎬ = ∑ ai L{ f i (t )} . (1.26)
⎩ i =1 ⎭ i =1

Справедливость выражения (1.26) вытекает из выражения (1.25), в соответствии с


которым преобразование Лапласа представляет собой линейную операцию.
2. Дифференцирование оригиналов. Производной от функции f(t) соответствует
разность изображения этой функции F(p), умноженной на p, и ее начального значения
f(0):

L { f ′( t )} = pF ( p ) − f ( 0 ) . (1.27)

Действительно, умножив (1.25) на p взяв интеграл по частям, получим


∞ ∞
pF ( p ) = p ∫ f (t )e − pt
dt = − f (t ) e − pt ∞
− ∫ − e − pt f ′(t )dt = f (0) + L{ f ′(t )}, откуда следует
0
0 0

(1.27).

Выполнив этот прием n раз, окончательно получим:

{ } n
L f ( n ) (t ) = p n F ( p ) − ∑ p n − k f ( k −1) (0) . (1.28)
k =1

Выражение (1.28) является математической записью теоремы дифференцирования.


При нулевых начальных условиях теорема дифференцирования принимает вид

{ }
L f ( n ) (t ) = p n F ( p) .

3. Изображение интеграла. Можно показать, что


0
⎧t ⎫ F ( p)
L ⎨ ∫ f (t )dt ⎬ =
⎩0 ⎭ p
при ∫ f (t )dt = 0 .
−∞

4. Интегрирование линейных дифференциальных уравнений с постоянными ко-


эффициентами. В соответствии со свойствами 1 и 2, ДУ в области вещественного пере-
менного t преобразуются в области комплексного переменного p в алгебраическое выра-
жение. При этом автоматически учитываются начальные условия и определяются посто-
янные интегрирования. Имеем

a0 y(n) + a1 y(n−1) +K+ an−1 y& + an y = b0 x(m) + b1 y(m−1) +K+ bm−1x& + bm x . (1.29)

240
Умножив (1.29) на e − pt после интегрирования его по t в пределах от 0 до ∞ при ну-
левых начальных условиях, получим это уравнение, преобразованное по Лапласу:

(a0 pn + a1 pn−1 +K+ an−1 p + an )Y( p) = (b0 pm + b1 pm−1 +K+ bm−1 p + bm) X ( p) .

Отсюда
b0 p m + b1 p m−1 + K+ bm−1 p + bm B( p)
Y ( p) = n n−1
X ( p) = X ( p) . (1.30)
a0 p + a1 p + K+ an−1 p + an A( p)

Обозначим B ( p ) / A( p ) = W ( p ) . Тогда (1.30) перепишется в виде Y(p) = W(p)X(p), от-


куда
Y ( p)
W ( p) = . (1.31)
X ( p)

Выражение (1.31), представляющее собой отношение изображения выходной вели-


чины системы Y(p) к изображению входной величины X(p) при нулевых начальных усло-
виях, называется передаточной функцией системы.
Поскольку при исследовании динамических свойств системы требуется определить
зависимость переменных системы в функции действительного аргумента t, возникает об-
ратная задача: как от изображения переменной перейти к ее оригиналу.
Наиболее общим способом нахождения оригинала y(t) по известному изображе-
нию Y(p) является применение обратного преобразования Лапласа:

1 α + j∞
y (t ) = L−1{Y ( p )} = ∫ Y ( p) e dp .
pt
2πj α − j∞

Здесь L−1 - оператор обратного преобразования Лапласа.*)

Самым простым способом нахождения оригинала по изображению является ис-


пользование таблиц, в которых для наиболее распространенных функций действительного
переменного t приведены соответствующие изображения (например, таблица 1.1).
Если изображение Y(p) можно представить дробно-рациональной функцией вида

Y ( p ) = B( p) / A( p ) , где B(p) и A(p) – полином соответственно m-й и n-й степени, причем для

инерционных объектов m < n, то оригинал y(t) можно найти воспользовавшись теоремой


разложения Хевисайда – Карсона:

n B ( pk ) p k t
y (t ) = ∑ e , (1.32)
k =1 A′( p k )

где pk – корни уравнения A(p) = 0; A′( p ) = dA ( p ) / dp .

*)
Заметим, что наиболее практичным способом нахождения оригинала y(t) по известному изображению Y(p),
является использование теоремы вычетов. Рассматриваемой в теории функций комплексного переменного.

241
Пример 1.6. Пусть ДУ системы уравнения имеет вид
a 0 &y& + a 1 y& + a 2 y = kx .

Требуется найти передаточную функцию W(p) и временные характеристики w(t),


h(t) системы.
Решение. Преобразуем ДУ системы по Лапласу при нулевых начальных условиях.
Получим (a0 p 2 + a1 p + a2 )Y ( p) = kX ( p) . Откуда передаточная функция будет

Y ( p) k
W ( p) = = .
X ( p) a0 p 2 + a1 p + a2

Пусть k = 1, a0 = 1, a1 = 3, a2 = 2. Для нахождения функции веса w(t) воспользуемся


теоремой разложения (1.32). При этом учтем, что L{δ(t)} = 1. Тогда

⎧ 1 ⎫ 2 B ( p k ) pk t
w(t ) = L−1 {W ( p )} = L−1 ⎨ 2 ⎬=∑ e . (1.33)
⎩ p + 3 p + 2 ⎭ k =1 A′( p k )
Имеем A(p) = p2 + 3p + 2 = 0; p1 = –1; p2 = –2; A′(p) = 2p + 3; B(p) = k = 1. Тогда,
подставив B(p), A′(p), p1 и p2 в выражение (1.33), получим:

1 1
w (t ) = e−t + e − 2t = e − t − e − 2t .
2( −1) + 3 2( −2) + 3

Аналогичным образом можно найти пере-


ходную характеристику h(t),учтя при этом, что
L{1(t)} = 1/р, тогда A(p) = (p2 + 3p + 2)р = 0;
p1 = –1; p2 = 2; p3 = 0; A′(p) = 3p2 + 6р + 2. Вос-
пользовавшись (1.32), найдем

h(t ) = 0,5 + 0,5 e −2t − e −t .

Рис. 1.8
Графики зависимостей w (t ) и h(t) приведе-
ны на рис.1.8.

1.4. ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ ЛИНЕЙНЫХ СИСТЕМ


Пусть дифференциальное уравнение системы имеет вид

a 0 y ( n ) + a1 y ( n −1) + K + a n −1 y& + a n y = b0 x ( m ) + b1 y ( m −1) + K + bm −1 x& + bm x . (1.34)

Воспользуемся прямым преобразованием Фурье, которое можно получить из пре-


образования Лапласа (1.25) при p = jω:

242

Ф{ f (t )} = F ( jω) = ∫ f (t ) e − jωt dt .
−∞

где Ф - оператор прямого преобразования Фурье.

Тогда уравнение (1.34) преобразованное по Фурье при нулевых начальных услови-


ях запишется в виде

(a 0 ( jω ) n + a1 ( jω ) n −1 + K + a n −1 jω + a n )Y ( jω ) = (b0 ( jω) m + b1 ( jω) m −1 + K + bm −1 jω + bm ) X ( jω) .

Обозначив полиномы, стоящие в скобках правой и левой частей полученного урав-


нения, A( jω ) и B( jω ) соответственно, получим B ( jω )Y ( jω ) = A( jω ) X ( jω ) , откуда
Y ( jω) B ( jω)
= = W ( jω) . (1.35)
X ( jω) A( jω)

Выражение (1.35) представляет собой частотную функцию или амплитудно-фазо-


частотную характеристику системы (АФЧХ), которую можно записать в виде

W ( jω) = W ( jω) e j arg W ( jω) , (1,36)

где |W(jω)| = A(ω) – амплитудно-частотная характеристика системы (АЧХ), а


argW(jω) = ϕ(ω) – фазо-частотная характеристика системы (ФЧХ).
Частотная функция системы (1.35) может быть представлена и в алгебраическом
виде:

W(jω) = A(ω)e jϕ(ω) = P(ω) + jQ(ω),

Q(ω )
где A(ω ) = W (iω ) = P 2 (ω ) + Q 2 (ω ) ; ϕ (ω ) = arg W (iω ) = arctg .
P(ω )

В данном случае P(ω) называют вещественной частотной характеристикой, а


Q(ω) – мнимой частотной характеристикой.
В некоторых случаях при анализе и синтезе АСУ используется логарифмическая
частотная характеристика*) вида:

logW(jω) = logA(ω) + jϕ (ω)log e,

где l o g A(ω ) - логарифмическая амплитудно–частотная характеристика (ЛАХ),


log e = 0,434.
В случае подачи на вход системы гармонического сигнала x = a sin ωt, который с
учетом того, что e jωt = cos ω t + j sin ω t , можно записать в виде

*)
Более подробно логарифмические частотные характеристики рассмотрены в параграфе 4.6.

243
x * (t ) = a e jωt [ x(t ) = Im x * (t )] , частное решение уравнения (1.34) отыскивается в том же ви-

де, что и входной сигнал x(t): y(t) = A0 sin(ωt + ϕ) или y*(t) = A0 e j(ϕ + ωt).
Подставив x*(t) и y*(t) в уравнение (1.34) и сократив его на e jωt, окончательно по-
лучим A(jω)A0e jϕ = B(jω)a, откуда:

A0 jϕ B( jω )
e = = W ( jω ) . (1.37)
a A( jω )

Из сопоставления уравнения (1.36) с уравнением (1.37) при ω = const получим

A0
W ( jω) = ; argW ( jω) = ϕ .
a

Если ω – переменная величина, то величина A0 будет функцией частоты, тогда


A0 (ω ) / a = A(ω ) . Таким образом, амплитудно-частотная характеристика А(ω ) харак-
теризует усиление периодического сигнала на различных частотах (рис.1.9, а). Как видно
из рисунка в системе могут отсутствовать (кривая 1) или
возникать резонансные колебания (кривая 2, ωр – частота
резонанса). Фазо-частотная характеристика ϕ (ω ) , харак-
теризующая сдвиг фаз между входным х(t) и выходным
y(t) сигналами, представлена на рис. 1.9, б. Из рисунка
видно, что с ростом частоты ω запаздывание выходной
координаты у(t) относительно входной х(t) увеличивается.

1
Геометрическое место концов вектора частотной
функции W(jω) на комплексной плоскости при изменении
частоты от нуля до бесконечности называется годографом
вектора W(jω) (рис.1.9, в).
Заметим, что в общем случае для нахождения
функции действительного переменного t при известной
функции Y(jω) необходимо воспользоваться обратным
преобразованием Фурье:
1 ∞
y ( t ) = Ф −1 {Y ( j ω )} = jω t
∫ Y ( jω) e d ω .
2π −∞

1.4.1. Условия однозначной связи между частотными характеристиками


Из соотношения W(jω) = A(ω)e jϕ(ω) = P(ω) + jQ(ω) следует, что частотная характе-
ристика полностью определена, если задана любая из пар: A(ω) и ϕ(ω) или P(ω) и Q(ω).

244
Однако при определенных условиях существует однозначная связь между A(ω) и ϕ(ω),
а также P(ω) и Q(ω). Это позволяет упростить исследования систем, ограничиваясь, на-
пример, рассмотрением только A(ω) или P(ω). В теории интегралов Фурье доказывается,
что условие существования однозначной связи заключается в том, чтобы частотная функ-
ция W ( jω ) = B ( jω ) A( jω ) не имела ни нулей, ни полюсов в нижней полуплоскости кор-
ней полиномов числителя и знаменателя (нули – корни полинома B(jω) = 0, следовательно,
при этом W(jω) = 0, а полюса – корни полинома A(jω) = 0, сле-
+j
довательно, W(jω) = ∞).


Системы, которые удовлетворяют этим условиям, назы-
ваются минимально- фазовыми (рис.1.10). Из всех возможных
+
систем с одной и той же АЧХ они дают наименьший сдвиг фаз
–α α
ϕ при любой частоте ω.
Р
Пример1.7. Пусть динамические звенья имеют следующие передаточные функ-
jω − a ω 2 − a 2 2ω a
ции W1(jω) = 1 и W 2 ( j ω ) = = 2 + j 2 , где a = const.
jω + a ω + a 2
ω + a2
Поскольку корень числителя W2(jω) лежит в нижней полуплоскости (ω1 = – ja),
второе звено принадлежит к классу неминально-фазовых, что свидетельствует о неодно-
значности связи между амплитудно- и фазо-частотными характеристиками этого звена.
Убедимся в справедливости сказанного, определив АЧХ и ФЧХ для каждого из
звеньев. Имеем:

ω 2 + a2
A1(ω) = 1; ϕ1(ω)=0, A2 (ω ) = W2 (ω ) = = 1;
ω 2 + a2
Q(ω ) 2ω a
ϕ 2 (ω ) = arctg
= arctg 2 .
P(ω ) ω − a2
Анализ полученных частотных характеристик показывает, что при одинаковых ам-
плитудно-частотных характеристиках звеньев их фазо-частотные характеристики различ-
ны: в то время как ϕ1(ω)=0 при любых ω, ϕ2(ω) отлична от нуля при ω ≠ 0 . Следовательно,
связь между A2(ω) и ϕ2(ω) неоднозначна и эти характеристики необходимо рассматривать
совместно.

1.5. СВЯЗЬ МЕЖДУ ОПЕРАТОРАМИ ПРЕОБРАЗОВАНИЯ СИГНАЛОВ ЛИНЕЙ-


НОЙ СИСТЕМОЙ
Как было сказано ранее, оператором преобразования А называется математическое
выражение, связывающее входную и выходную величины системы, т.е. y = A{x} (рис. 1.3).

245
Основным оператором линейной системы является линейное дифференциальное
уравнение, которое позволяет получить любые другие формы операторов преобразования.
Например, пусть система управления описывается ДУ первого порядка

a 0 y& + a1 y = b0 x . (1.38)

Преобразовав уравнение (1.18) по Лапласу при нулевых начальных условиях, най-


дем передаточную функцию, которая также является оператором преобразования. Имеем

L{a 0 y& + a1 y} = L{b0 x} или (a 0 p + a1 )Y ( p ) = b0 X ( p ) , откуда

Y ( p) b0
W ( p) = = . (1.39)
X ( p ) a 0 p + a1

Преобразовав уравнение (1.38) по Фурье, можно получить частотную функцию


системы:

Y ( jω ) b0
W ( jω ) = = . (1.40)
X ( jω ) a0 jω + a1

Сопоставив (1.39) и (1.40), найдем связь между W ( jω ) и W(p):

W ( j ω ) = W ( p ) p = jω . (1.41)

Решив ДУ (1.38) при типовом единичном ступенчатом возмущении x(t) = 1(t) и ну-
левых начальных условиях, получим переходную функцию h(t):

b0 ⎛⎜ − 1t ⎞
a
a0 ⎟
y(t ) x (t )=1(t ) = h(t ) = 1− e .
a1 ⎜⎝ ⎟

Воспользовавшись (1.39) и учтя, что при x(t)=1(t) имеем L{1(t )} = 1 / p и Y(p)=H(p),


получим:
W ( p)
H ( p) = W ( p) X ( p) = ,
p
тогда
⎧W ( p ) ⎫
h(t ) = L−1 ⎨ ⎬. (1.42)
⎩ p ⎭

Таким образом, выражение (1.42) связывает передаточную функцию с переходной


функцией. При этом W(p) = pL{h(t)} = pH(p).
Весовую функцию w(t) находим с учетом того, что входной сигнал
x(t) = δ(t) = 1′(t). Так как w(t) = h′(t), то
a1
− t
w (t ) = ( b0 / a 0 ) e a0
.

246
Воспользовавшись (1.39) и учтя, что L{δ(t)} = 1, получим: Y(p) = W(p) = L{w(t)},
откуда
w(t) = L-1{W(p)} (1.43)
Таким образом, соотношения (1.38) – (1.43) позволяют найти любой оператор пре-
образования сигналов линейной системы [ДУ, W(p); W(jω), h(t), ω (t ) ], если известен хотя
бы один из них.

2. ТИПОВЫЕ ЗВЕНЬЯ И СТРУКТУРНЫЕ СХЕМЫ АСУ

2.1. ТИПОВЫЕ ДИНАМИЧЕСКИЕ ЗВЕНЬЯ

Современные АСУ состоят из элементов различной физической природы, конст-


руктивного исполнения, источников энергии и т.д. Однако динамические свойства этих
элементов часто можно описать одним и тем же ДУ. Положив в основу классификации
динамические свойства, обычно выделяют следующие звенья: усилительное, инерцион-
ные, колебательное, интегрирующее, дифференцирующее.
1. Усилительное звено. Оператор преобразования равен k: y = kx.
2. Инерционные (апериодические) звенья первого порядка, описывается ДУ вида:
Ty& + y = kx ; второго порядка – T 2 &y& + 2T ξ y& + y = kx при ξ > 1.

3. Колебательное звено. Описывается ДУ такого же вида как инерционное звено


второго порядка, но при 0 < ξ < 1.
В статическом режиме (при равенстве нулю всех производных) все приведенные
звенья имеют уравнение, аналогичное усилительному звену, что свидетельствует о нали-
чии линейной связи между входной величиной x и выходной величиной y в статике. По-
этому все рассмотренные звенья относятся к классу статических.
4. Интегрирующее звено. Описывается выражением
t
y = k ∫ xdt , или y& = kx .
0
Здесь выходная величина y будет изменяться до тех пор, пока входная величина не станет
равной нулю.
5. Дифференцирующее звено – y = kx& = kdx / dt .
Последние два звена не имеют связи между входными и выходными величинами
в статике, поэтому относятся к классу астатических.
Реальные звенья могут описываться уравнением и выше второго порядка, но фор-
мально это описание можно заменить системой уравнений, каждое из которых имеет по-

247
рядок не выше второго, и таким образом, представить реальное звено в виде звеньев 1-5.
Поэтому эти звенья обычно называются типовыми.
Предполагается, что все звенья являются звеньями направленного действия (т.е.
выходная величина не оказывает влияния на входную). Каждое звено характеризуется
уравнением движения (динамики), передаточными и частотными функциями, временны-
ми характеристиками.

2.1.1. Усилительное звено

Усилительное или безинерционное звено описывается следующими операторами


преобразования:
• уравнением связи между выходной x и входной y величинами: y = kx или после преоб-
разования по Лапласу получим а б
Y(p) = kX(p). +j A(ω)
k
Y ( p)
• передаточной функцией: W ( p) = =k; k +
X ( p) ω
в г
• частотными характеристиками: ϕ(ω) y = h(t)
k
амплитудно-фазо-частотная характеристика (АФЧХ) – W(jω) = k;
амплитудно-частотная-характеристика (АЧХ) – A(ω) = k; ω t
Рис.1.11
фазо-частотная характеристика (ФЧХ) – ϕ(ω) = 0 (рис.1.11, а, б, в);
• временными характеристиками: переходной функцией h(t ) x (t ) =1(t ) = k (рис.1.11, г);

функцией веса w(t) = h′(t) = kδ(t).


2.1.2. Апериодическое звено первого порядка

Это звено относится к классу инерционных и имеет следующие операторы преобразова-


ния:
• уравнение динамики: a 0 y& + a1 y = b0 х , которое обычно записывают в виде:
Ty& + y = kx

После преобразования по Лапласу уравнения динамики примет вид:

(Tp + 1)Y ( p ) = kX ( p ) ,

где Т=а0/а1 – постоянная времени; k= b0 /a1 – коэффициент передачи;

Y ( p) k
• передаточная функция: W ( p) = = ;
X ( p ) Tp + 1

248
• частотные характеристики:
k k kTω
АФЧХ - W ( jω) = = −j = P(ω) + jQ(ω) ,
Tjω + 1 T ω +1
2 2
T ω2 + 1
2

где P(ω ) , Q(ω ) - вещественная и мнимая частотные характеристики.

На комплексной плоскости W(jω) годограф АФЧХ представляет собой уравнение окруж-


ности с радиусом, смещенным по оси абсцисс на k/2 (рис.1.12, а):
2
⎛ k⎞ k2
⎜ P (ω ) − ⎟ + Q 2
(ω ) = ;
⎝ 2⎠ 4

k
АЧХ - A(ω ) = W ( jω ) = , (рис1.12,б);
T 2ω 2 + 1
Q (ω )
ФЧХ - ϕ (ω ) = arctg = arctg( −ωT ) , (рис.1.12 в);
P (ω )
• временные характеристики:
переходная функция - h(t) = k(1-e–t / T ), (рис.1.12, г);
функция веса - w(t ) = h′(t ) = (k / T ) e −t / T , (рис.1.12, д).
Заметим, что некоторые объекты управления
характеризуются показателями, которые
являются функциями не только времени, но и пре-
образованных координат, и описываются уравне-
ниями в частных производных. Такие объекты
встречаются в различных тепловых, диффузионных и электромагнитных устройствах. В
этом случае зависимость переменных может носить степенной характер и в дифференци-
альном уравнении может появиться слагаемое, содержащее переменную (временную или
пространственную) в дробной степени. Например, если f(t) = tα, где 1 > α > –1, но α ≠ 0, то
изображение этой функции будет
∞ ∞ ∞
Θα −Θ dΘ 1
L{t α } = ∫ t α e − pt dt = ∫ α
e = α +1 ∫ Θα e −Θ dΘ (1.44)
0 0 p
p p 0
Здесь произведена замена переменных pt = Θ, и учтено, что dt = dΘ / p и t = Θ / p .

Интеграл в выражении (1.44) является функцией α. В частности, можно показать, что


при α = –1/2 он равен π , при α = 1/2 равен π / 2, а при α = 1 равен 1. Тогда, воспользовав-
шись (1.44), получим


1
π π 1
π π 1
L{t } = 2
= ; L{t 2 } = = ; L {t } =
p −0,5+1 p 2 p 0,5+1 2p p p2

249
h(t) Таким образом, ДУ, содержащее слагаемое в дроб-
ной степени, после преобразования по Лапласу может со-
k
держать p . Тогда передаточная функция примет вид:
1
2 k
W ( p) =
t
A( p )
Рис.1.13 Передаточная функция вида (1.45) называется ир-
рациональной. В частности, при А( p )=Т p +1, получим

k
W(p) = .
T p +1
Звено с такой передаточной функцией иногда называют – полуинерционным.
При этом Y(p) = W(p)X(p) и изображение переходной функции будет
Н(р) = [k /(T p + 1)](1 / p) . Произведя замену переменных p = s , найдем псевдоизображе-

ние H(s) = k/(Ts + 1)s2, которое дает возможность найти оригинал h(t).
На рис.1.13 для сравнения приведены переходные функции инерционного (кривая 1) и по-
луинерционного (кривая 2) звеньев.

2.1.3. Апериодическое звено второго порядка

Это звено также относится к классу инерционных с монотонным переходным про-


цессом. В отличие от инерционного звена первого порядка оно включает в себя две энер-
гетические или массовые емкости и имеет следующие операторы преобразования:
• уравнение динамики T 2 &y& + 2Tξ y& + y = kx (при ξ > 1) или, преобразовав его по Лапласу,
имеем
(T 2 p 2 + 2T ξ p + 1)Y ( p) = kX ( p) , (1.46)
Характеристическое уравнение звена имеет вид:
T 2 p 2 + 2T ξ p + 1 = 0 , (1.47)

− ξ ± ξ 2 −1
корни которого вещественные и отрицательные: p1, 2 = .
T
Разложив правую часть (1.47) на множители характеристическое уравнение звена
можно записать в виде:
(T1 p + 1)(T2 p + 1) = 0 , (1.48)
с корнями р1=-1/Т1; р2=-1/Т2.
Сравнив (1.47) и (1.48) получим: Т2=Т1Т2; 2ξТ=Т1+Т2 следовательно, при известных Т
и ξ можно найти Т1 и Т2 и наоборот.
• передаточная функция
250
Y ( p) k k 1
W ( p) = = 2 2 = ⋅ ,
X ( p ) T p + 2T ξ p + 1 (T1 p + 1) (T2 p + 1)
Таким образом, апериодическое звено второго порядка можно представить в виде двух
звеньев первого порядка.
• частотные характеристики:
k k (1 − T 2ω2 ) 2 ξ Tωk
АФЧХ- W ( jω) = = − j =
2 2
(1 − T ω ) + j 2 ξ Tω 2 2 2
(1 − T ω ) + (2 ξ Tω) 2
(1 − T ω 2 ) 2 + (2 ξ Tω ) 2
2

= P(ω ) + jQ(ω ) , (рис.1.14а);


Заметим, что при ω = 1 / T , ω2T2 = 1 и P(ω) = 0;
k
АЧХ - A(ω ) = , (рис.1.14, б);
(1 − T 2ω 2 ) 2 + (2 ξ Tω) 2
⎛ − 2 ξ Tω ⎞
ФЧХ - ϕ (ω ) = arctg ⎜ 2 ⎟
, (рис 1.14, в);
⎝1− T ω ⎠
2

• временные характеристики:
переходная функция – h(t ) = C1 e p1t + C2 e p 2 t + k
(рис.1.14, г);
весовая функция – w (t ) = C 1 p1 e p1t + C 2 p 2 e p1t
(рис.1.14, д).
Постоянные C1 и C2 находят из начальных
условий h(0) = h′(0) = 0. Окончательно получим

⎛ −
t

t ⎞ ⎛ t t ⎞
⎜ T1 T1 T2 T2 ⎟; k ⎜ − T1 − T2 ⎟
h(t ) = k ⎜1 − e + e ⎟ w(t ) = T − T ⎜ e − e ⎟
⎜ T1 − T2 T1 − T2 ⎟ 1 2 ⎜ ⎟
⎝ ⎠ ⎝ ⎠

2.1.4. Колебательное звено

Колебательное звено отличается от предыдущего тем, что переходный процесс но-


сит не монотонный, а колебательный характер. Это обусловлено взаимным обменом энер-
гии (массы) между соответствующими емкостями. Примером может служить обмен маг-
нитной и электрической энергией в цепи RLC при определенных значениях ее парамет-
ров.
Уравнение динамики этого звена и характеристическое уравнение аналогично
уравнениям (1.46) и (1.47), но при 0 < ξ < 1. При этом корни характеристического уравне-
ния будут комплексные сопряженные с отрицательной вещественной частью:

− ξ ± ξ 2 −1 ξ1− ξ 2
p1, 2 = = −α ± jω; α= ; ω= .
T T T

251
В данном случае звено второго порядка физически нельзя разделить на более про-
стые.
Передаточная функция и частотные характеристики описываются теми же выраже-
ниями, что и в предыдущем случае. При этом амплитудно-частотная характеристика мо-
жет увеличиваться до определенной (резонансной) частоты ωр, а затем снова уменьшаться
(рис.1.15, а).
Переходная функция (рис. 1.15,б) при комплексных корнях характеристического
уравнения (1.47) имеет вид:
h(t ) = k [1 − A e −αt sin(ωt + ϕ )] ,
где A = 1 / 1 − ξ 2 ; ϕ = arcsin 1 − ξ 2 – постоянные интегрирова-
а
ξ=0
ния, определяемые из нулевых начальных условий. A(ω)
0<ξ <1
Из изложенного вытекает, что коэффициент ξ опреде- k

ляет характер переходного процесса для звена второго поряд- ω ω


б ξ>1
ка. Чем больше этот коэффициент, тем меньше склонность
h(t)
звена к колебаниям. При ξ > 1 колебания отсутствуют. Поэто- k
му коэффициент ξ называют коэффициентом демпфирования ξ1<ξ2
ξ2
(успокоителя колебаний). t

При ξ = 0 имеем T 2 &y& + y = 0 ; p1,2 = ± jω, ω = 1 / T и в h(t)

переходная функция запишется в виде k

h(t) = = k[1 – cos ωt].


t
В этом случае в системе возникают незатухающие колебания Рис.1.15

(рис.1.15,в), что свидетельствует об отсутствии потерь энергии (замкнутая система). Поэтому


звено вида T 2 &y& + y = kx называют консервативным.
Пример 1.8. Пусть динамическое звено описывается ДУ второго порядка вида:
a 0 &y& + a1 y& + a 2 y = kх . (1.49)
Коэффициенты уравнения заданы и равны: a0=0,01 a1=0,09 a2=1 k=0,26.
Определим частотные и временные характеристики звена, описываемого уравнением
(1.49).
Решение. Запишем уравнение (1.49) в виде
T 2 &y& + 2T ξ y& + y = kx . (1.50)
Сравнение коэффициентов уравнений (1.49) и (1.50) позволяет найти постоянную времени
Т и коэффициент демпфирования ξ. В результате вычислений получим Т=0,1с; ξ=0,45. Так
как 0 ≤ ξ ≤ 1 , то звено, описываемое ДУ (1.49) принадлежит к классу колебательных с
амплитудно - фазо - частотной характеристикой вида:

252
k
W ( jω ) = . (1.51)
T ( j ω ) + j 2 ξ Tω + 1
2 2

Запишем W ( jω ) в алгебраическом виде, умножив числитель и знаменатель (1.51),


на выражение сопряженное знаменателю и подставив в него числовые значения коэффи-
циентов. Окончательно получим:
0.26(1 − 0.01ω 2 ) 0.023ω
W ( jω ) = P(ω ) + jQ(ω ) = −j (1.52)
(1 − 0.01ω ) + (0.09ω )
2 2 2
(1 − 0.01ω 2 ) 2 + (0.09ω ) 2
Годограф вектора W ( jω ) , построенный в соответствии с (1.52), приведен на рис
1.16 (сплошная линия).
Амплитудно-частотная A(ω ) и фазо -
частотная ϕ (ω ) характеристики, построенные в
соответствии с выражениями:
0,26
A(ω ) = ;
2 2 2
(1 − 0,01ω ) + 0,09ω

a) б)

Рис.17

⎛ − 0 , 09 ω ⎞
ϕ (ω ) = arctg ⎜⎜ ⎟,
2 ⎟
⎝ 1 − 0 , 01ω ⎠
приведены на рис. 1.17,а, б (сплошные кривые)
Переходная h(t ) и весовая w (t ) функции определяются в соответствии с выраже-
ниями:
h ( t ) = k [1 − A e − α t sin( ω t + ϕ )] , w(t ) = h′(t ) = k (α 2 + ω 2 )ω −1 e −αt sin ω t
где
ξ 0.45 1− ξ 2 1 − 0.45 2 1
α= = = 4.5 ; ω = = = 8.9 ; k = 0 , 26 ; A = = 1,12 ;
T 0.1 T 0.1 1−0,452
ϕ = arcsin 1 − 0,452 = 1,1 .
Графики h(t ) и w (t ) приведены на рис.1.18, а, б (сплошные линии).

253
Для сравнения на рисунках 1.16, 1.17 приведены частотные, а на рис.1.18 времен-
ные характеристики апериодического звена второго порядка с монотонным переходным
процессом (пунктирные линии), описываемым ДУ: 0 , 01 &y& + 0 , 3 y& + y = 0 , 26 x , (см.
пример 1.5). Здесь при тех же постоянной времени Т=0,1 с и коэффициенте передачи
k=0,26 коэффициент демпфирования ξ=1,5>1, что и обусловливает отсутствие в этом зве-
не колебаний.
2.1.5. Интегрирующее звено

Как уже упоминалось, интегрирующее звено относится к классу астатических. При


этом любое значение входной величины х(t) в том числе и х(t)=const, может
соответствовать любой значением выходной величины у(t). Поэтому иногда это звено
называют нейтральным.
Интегрирующее безинерционное звено имеет следующие а) +j
W(jω)
операторы преобразования:
ω=∞ +
t
• уравнение динамики: y = k ∫ xdt или y& = kx . Преобра- ω – π/2
0 ↓
0
зовав это уравнение по Лапласу, получим
pY(p) = kX(p); б)

Y ( p) k A(ω)
• передаточная функция: W ( p) = = ;
X ( p) p

• частотные характеристики:

АФЧХ - W ( jω) = W ( p) p = jω = k = − j k , (рис.1.19, а); ω


jω ω
Рис.1.19
k
АЧХ - A(ω) = W ( jω) = , (рис.1.19, б);
ω

Q(ω) π
ФЧХ - ϕ(ω) = arctg =− ; h(t)
P(ω) 2
tgα = k
• временные характеристики:

α
α
254
t
переходная функция: h (t ) = kt (рис.1.20, сплошная линия);
функция веса: w(t) = h′(t) = k.
Примером интегрирующего звена может служить электродвигатель, на вход кото-
рого подается напряжение, а выходом является угол поворота вала двигателя. При этом
предполагается, что инерционностью двигателя можно пренебречь. В случае ее учета,
уравнение динамики интегрирующего звена запишется в виде: T &y& + y& = kx , а переход-
ная функция, являющаяся решением этого ДУ при х(t)=1(t), будет:
−t
h(t ) = k [t − T (1 − e T )] .

График h(t) для этого случая показан на рис.1.20 пунктирной линией.


Заметим, что передаточная функция инерционного интегрирующего звена имеет
k
вид: W ( p) = . Следовательно, это звено можно представить в виде двух эле-
p(Tp + 1)
ментарных звеньев интегрирующего и апериодического.
2.1.6. Дифференцирующее звено
Это звено, как и предыдущее, относится к классу астатических (при х=const, y=0)
и имеет следующие операторы преобразования:
• уравнение динамики: y = kx& , или преобразовав его по Лапласу, получим

Y(p) = kpX(p).
Y ( p)
• передаточная функция: W ( p) = = kp .
X ( p)

• частотные характеристики:
АФЧХ - W ( jω) = jkω , (рис.1.21, а);
АЧХ - A(ω) = kω, (рис.1.21, б);
ФЧХ ϕ(ω) = π / 2 , (рис.1.21, б).
• временные характеристики:
переходная функция: h ( t ) = k δ ( t ) (рис.1.21, в, сплошная линия).

Таким образом, при подаче на вход идеального дифференцирую-


щего звена единичной ступенчатой функции, на его выходе полу-
чаем импульс с бесконечно большой амплитудой, что физически не
реализуемо.
Реальное (инерционное) дифференцирующее звено описы-
вается ДУ:
T y& + y = k х& ,
решение которого при x(t)=1(t) и нулевых начальных условий будет:

255
h(t)=(k/T)e-t/T.
График переходной функции h(t) представлен на рис.1.21, в пунктирной линией.

2.2. СТРУКТУРНЫЕ СХЕМЫ АСУ

Обычно АСУ можно рассматривать как комбинацию динамических звеньев с опре-


деленными передаточными функциями*). Графическое изображение АСУ в виде совокуп-
ности динамических звеньев с указанием их передаточных функций и связей между
звеньями называется структурной схемой. По существу эта схема представляет собой
графическое изображение системы уравнений, записанных в виде передаточных функций,
и может рассматриваться как схема прохождения и преобразования сигналов в АСУ. В
этой связи она часто называется алгоритмической.
Обозначения элементов в структурных схемах, приведены ниже.
Наименование элемента Обозначение элемента

Линия передачи сигналов x x

Динамическое звено с одним входом х и одним выходом у x W2(p) y


направленного действия
Y(p)=W(p)⋅X(p)

Динамическое звено с двумя входами и одним выходом x1


W1(p) y

W2(p)
x2

Y(p)=W1(p)⋅X1(p) + W2(p)⋅X2(p)

Узел или разветвление (в месте разветвления сигнал не де- x x


лится)
x

Сумматор сигналов x2 y=x1+x2

x1

Устройство сравнения сигналов x2 y=x1-x2

x1

*)
Заметим, что в звеньях структурных схем могут указываться и другие операторы преобразования сигналов,
dx
например, dt , ∫ xdt , w(t) и др.
256
Рассмотрим основные виды соединения звеньев.

2.2.1.Основные виды соединения звеньев

x x1 y 1. Последовательное соединение (рис.1.22).


W1(p) W2(p)
Имеем X1(p) = W1(p)X(p); Y(p) = W2(p)X1(p) = W1(p)W2(p)X(p)=
Рис.1.22
= Wэкв(p)X(p), где Wэкв(p) = W1(p)W2(p).
N
Wэкв ( p) = ∏ Wi ( p)
В общем случае i =1 , где Wэкв(p) – эквивалентная передаточная функ-
ция; N – число последовательно включенных звеньев. Таким образом, передаточная функ-
ция последовательно включенных звеньев равна произведению передаточных функций
этих звеньев.
y1 2. Параллельное соединение (рис.1.23).
W1(p)
x y = y1 + y2 Имеем Y(p) = Y1(p) + Y2(p) = W1(p)X(p) + W2(p)X(p) =
y2
W2(p) = [W1(p) + W2(p)]X(p) = Wэкв(p)X(p).
Рис.1.23 В общем случае эквивалентная передаточная функция па-
N
Wэкв ( p) = ∑Wi ( p)
раллельно соединенных звеньев равна сумме их передаточных функций: i =1 .

Пример 1.9. Найдем эквивалент-


W3(p)
ную передаточную функцию системы,
x y
W1(p) W2(p) W5(p) структурная схема которой приведена
на рис.1.24.
W4(p)
Воспользовавшись приведен-
Рис.1.24
ными выше правилами объединения
передаточных функций последовательно и параллельно соединенных звеньев, запишем

Wэкв(p) = W1(p)W2(p)[W3(p) + W4(p)]W5(p).

***
3. Параллельно-встречное соединение звеньев (обратная связь ОС) (рис.1.25).
x Δ y Имеем Δ = x – y1 – отклонение текущего значения
W1(p)
ОС управляемой величины от заданного.
y1
WОС(p)
Найдем передаточную функцию по каналу x→y:
Wxy(p).
Рис.1.25
Имеем
Δ(p) = X(p) – Y1(p) = X(p) – WОС(p)Y(p). (1.53)

257
где W1(p), WОС(p) – передаточные функции прямой цепи и цепи обратной связи соответст-
венно
С другой стороны

Y ( p)
Δ( p) =
W1 ( p ) .
f
W3(p) Приравняв правые части уравнений (1.53) и
u Δ
W1(p)
(1.54), окончательно получим
W2(p) y
Y ( p) W1 ( p )
W xy ( p ) = = = W экв ( p )
X ( p ) 1 + W1 ( p )W ОС ( p )
Рис.1.26
4. Передаточные функции замкнутых АСУ (рис.1.26)
Пусть структурная схема системы имеет вид, показанный на рис.1.26. Воспользо-
вавшись приведенными ранее правилами, для данной структурной схемы можно записать:
1. Передаточную функцию разомкнутой системы Wp(p) , под которой понимают
произведение передаточных функций всех звеньев, включенных последовательно в кон-
туре обратной связи. Тогда
Wp(p) = W1(p)W2(p).
2. Передаточную функцию замкнутой системы по управлению u

W1 ( p )W 2 ( p ) Wp ( p)
Wuy ( p ) = =
1 + W1 ( p )W 2 ( p ) 1 + W p ( p ) .

3. Передаточную функцию замкнутой системы по возмущению f


W2 ( p)W3 ( p) W ( p)W3 ( p)
W fy ( p) = = 2
1 + W1 ( p)W2 ( p) 1 + Wp ( p ) .

4. Передаточные функции замкнутой системы по ошибке Δ со стороны управления


WuΔ ( p ) и возмущения W fΔ ( p )

1 W2 ( p )W3 ( p)
W uΔ ( p ) = ; W fΔ ( p ) = −
1 + Wp ( p) 1 + Wp ( p) .

Из приведенных соотношений можно сделать вывод, что передаточная функция


замкнутой системы относительно любых входных и выходных координат равна дроби, у
которой числитель – передаточная функция звеньев, включенных между точкой прило-
жения входного воздействия и точкой измерения выхода, а знаменатель равен 1 + Wp(p).
Заметим, что в случае положительной обратной связи знаменатель имеет вид 1 – Wp(p)
и входной сигнал усиливается.

2.2.2. Правила структурных преобразований

258
Если структурная схема оказывается сложной и содержит много перекрестных свя-
зей, можно попытаться упростить ее с помощью определенных правил. Основной принцип
преобразования структурных схем заключается в том, что выходные величины исходной и
эквивалентной схем должны быть равны. Наиболее распространенные правила преобразо-
вания приведены ниже:

Правила преобра-
Исходная структурная схема Эквивалентная структурная схема
зования
1 2 3
x2 x4 yисх x1 x4 x2 yэкв = yисх
x1
Перестановка сум-
x3 x3
маторов yисх = x1 +x2 + x3 + x4

x1 yисх x1 Yэкв(p) = Yисх


W1(p) W2(p) W2(p) W1(p)
Перестановка
звеньев Yисх(p) = W1(p)W2(p)Х1(p)

x3
x1 yисх x3
x1 yэкв = yисх
Перестановка узлов x2
yисх = x1 = x2 = x3
x2

x1 y1 исх x1 yэкв = y1 исх


W1(p) W1(p)
Перенос узлов с y2 исх
yэкв = y2 исх
выхода на вход Y1 исх(p) = Y2 исх(p) = W1(p)X1(p) W1(p)

x1 yисх x1 yэкв = yисх


W1(p) W1(p)
Перенос суммато-
x2 x2
ров с выхода на -1 x2
вход Yисх(p) = W1(p)X1(p) + X2(p) W 1(p)

x1 y1 экв = y1 исх
x1 y1 исх W1(p)
W1(p)
Перенос узлов с y2 экв = y2 исх
y2 исх = x1 -1
Y1 исх(p) = W1(p)X1(p) W 1(p)
входа на выход

x1 yисх x1 yэкв = yисх


Перенос суммато- W1(p) W1(p)
ров с входа на вы- x2 x2
Yисх(p) = W1(p)[X1(p) + X2(p)] W1(p)
ход

259
Правила преобра-
Исходная структурная схема Эквивалентная структурная схема
зования
1 2 3
x1 yисх
W1(p)
ОС
Переход к единич-
ной обратной связи W2(p)
W1 ( p)
Yисх ( p) = X 1 ( p)
1 + W1 ( p)W2 ( p)

Пример 1.10. Пусть задана структурная схема, показанная на рис.1.27,а. Требует-


ся найти передаточную функцию по каналу x→y: Wxy(p).
Решение: Применив правило перестановки сумматоров 1 и 2 и переноса узла D с
выхода на вход пятого звена W5(p), а затем перестановки его с узлом C, получим струк-
турную схему без перекрестных связей (рис.1.27,б). Для преобразованной схемы можно
записать, передаточные функции для отдельных блоков:

W1 ( p ) W34 ( p )
W12 ( p ) = ; W34 ( p ) = W3 ( p ) + W4 ( p ) W3456 ( p ) =
1 + W1 ( p )W2 ( p ) ; 1 + W34 ( p )W5 ( p )W6 ( p ) ;

Тогда искомую передаточную функцию по каналу x → y можно записать в виде:


W12 ( p)W3456( p)
Wxy ( p) = W5 ( p)
1 + W12 ( p)W3456( p)W7 ( p) .

2.2.3. Использование графов для преобразования структурных схем

260
Для наглядного изображения прохождения и преобразования сигнала в АСУ поми-
мо структурных схем используют графы, которые, как и структурные схемы, представля-
ют собой запись системы уравнений АСУ в виде рисунка.
Граф состоит из точек (узлов) и линий (ветвей), соединяющих эти точки. Узлам и
ветвям могут быть сопоставлены некоторые величины и операторы. Если ветви графа
имеют стрелки, соответствующие направлению распространения сигнала, то граф называ-
ется направленным. Рассмотрим его свойства.
1. Каждому узлу (вершине), отмеченному на графе точкой или кружочком, соот-
ветствует некоторая переменная рассматриваемой системы.
2. Каждая ветвь (ребро) графа, изображенная в виде линии со стрелкой, имеет узел-
начало x – входная величина и узел-конец y – выходная величина (рис.1.28, а). Выходная
переменная ветви получается как результат преобразования входной величины, осуществ-
ляемый оператором (передачей) ветви: y = kx, где k – оператор (передача) ветви.
3. Если из узла выходят несколько ветвей, то все они име-
ют одинаковую входную величину (рис.1.28, б).
4. Если к одному узлу подходит несколько ветвей, то пе-
ременная, соответствующая этому узлу, получается алгебраиче-
ским суммированием выходных переменных ветвей (рис.1.28,в).
Между структурной схемой и графом прохождения сигна-
ла имеется прямое соответствие. Прямоугольник структурной
схемы соответствует ветви, а линия передачи сигнала соответст-
вует узлу.

Пример 1.11. Пусть имеем две параллельно соединен-


ные ветви, (рис.1.29, а) Тогда получим y = (k1 + k2)x = kэквx., где
kэкв- эквивалентная передача графа. В общем случае совокупность параллельных одина-
ково направленных ветвей может быть заменена одной ветвью, передача которой равна
сумме передач параллельных ветвей.
а Если две ветви соединены последовательно
k1
x y
(рис.1.29, б), то y = k2x1 = k1 k2x = kэквx. В общем случае цепь
k2 из последовательно соединенных ветвей, идущих в одном
б
направлении, может быть заменена одной ветвью, передача
x x1 y
которой равна произведению передач последовательно со-
k1 k2
единенных ветвей (см. рис.5.22, а).
Рис.1.29

261
x4*
PI
*** a 1
Для того чтобы отыскать
PII
любую переменную величину k
x1 b x2 h х4 x6

графа, при известных передачах L4


d
f
всех его ветвей, можно воспользо- c L2 g
ваться формулой Мезона. PIII L3
e

Пусть имеем граф, пока- x3 x5


r
занный на рис.1.30. Введем неко- m
L1
торые определения. n

Узлы подразделяются на: Рис.1.30

а) обычные узлы, имеющие как отходящие, так и подходящие ветви (x2);


б) источники, имеющие только отходящие ветви (x1);
в) стоки, имеющие только подходящие ветви (x6).
Любой узел можно превратить в сток с помощью ветви с передачей равной едини-

це ( x 4 = x 4 ) . Сигнал, который находится в источнике, является независимой переменной


*

(x1).
Путем между любыми двумя узлами графа называется непересекающаяся после-
довательность ветвей между этими узлами с одним и тем же направлением стрелки. На-
пример, между узлами x1 и x4 имеется три пути: I- x1 a x4; II- x1 bh x4; III- x1 cdh x4
Передачей пути Pij – называется произведение передач ветвей, входящих в путь
между узлами i и j. В нашем примере передача путей P14 будет следующей: PI = a,
PII = bh, PIII = cdh.
Контуром называется замкнутая непересекающаяся последовательность ветвей, ори-
ентированная в одном и том же направлении. Передачей контура Li называется произведе-
ние передач ветвей, образующих контур. Для нашего примера L1 = m, L2 = fd, L3 = dgr,
L4 = dhnr.
Передачей графа Tij – называется отношение выходной величины xj к входной ве-
личине xi, причем xi есть источник, т.е. величина независимая,

Tij = x j / xi
.
Для нашего случая при j = 4, i = 1 получим x4 = T14 x1.
Передача графа находится по формуле Мезона

262
∑ Ps Δ s
Tij = s
=
{(P1 + P2 + K + Pv )[(1 − L1 )(1 − L2 ) K (1 − Lu )]}*
Δ [(1 − L1 )(1 − L2 ) K (1 − Lu )]* , (1.56)

здесь Δ – определитель графа; * – знак «звездочки» обозначает, что учитываются произве-


дения только некасающихся (даже в точке) контуров, число которых равно u; Ps – переда-
ча s-го пути, число которых равно v; Δs – алгебраическое дополнение s-го пути, представ-
ляющее собой определитель графа Δ, из которого исключены все контуры, которых каса-
ется s-й путь; (именно поэтому в числителе стоит знак *). Если s-й путь касается всех кон-
туров, то Δs = 1.
Для графа, представленного на рис.1.30 определитель Δ в соответствии с (1.56) бу-
дет:

Δ = (1 – L1) (1 – L2) (1 – L3) (1 – L4) = 1 – (L1 + L2 + L3 + L4) +


+ (L1L2 + L1L3 + L1L4 ++ L2L3 + L2L4 + L3L4) –
– (L1L2L3 + L1L2L4 + L2L3L4 + L1L3L4) + L1L2L3L4 .
Поскольку должны учитываться произведения только несоприкасающихся контуров,
имеем Δ* = [1 – (L1 + L2 + L3 + L4) + L1L2] (не касаются друг друга только контуры 1 и 2).
Алгебраические дополнения, полученные из определителя графа Δ*: ΔI = 1 –
(L1 + L2 + L3) + L1L2 (путь PI касается только контура L4 в точке x4 ); ΔII = 1 – L1 ; ΔIII = 1 –
L1.
Тогда в соответствии с (1.56) передача графа от входа x1 к выходу x4 будет:

X4 PI [1 − ( L1 + L2 + L3 ) + L1 L2 ] + PII (1 − L1 ) + PIII (1 − L1 )
T14 = X1
=
1 − ( L1 + L2 + L3 + L4 ) + L1 L2 .

При рассмотрении АСУ передачи ветвей, входящих в передачи путей и передачи


контуров, представляют собой передаточные функции.
Пример 1.12. Пусть имеем
а б
структурную схему, показанную x 1 Δ W1 y
x Δ y
W1
на рис.1.31, а. Соответствующий граф L1
имеет вид, показан на рис.1.31,б. – W2
– W2
Здесь L1 = –W1W2; P1 = 1 ⋅ W1 = W1;
Рис.1.31
Δ1 = 1. Тогда воспользовавшись фор-
мулой Мезона (1.56) получим:

P1 Δ1 W1 ( p)
Txy = Wxy ( p) = =
1 − L1 1 + W1 ( p)W2 ( p) .

263
Этот результат естественно со- а
x 1 2 3 4 y
W1 W3
ответствует полученному ранее для W2

параллельно- встречного соединения – W4


звеньев (1.55) – W5

Пример 1.13. Пусть струк- б


x 1 W1 2 W2 3 4 y
W3
турная схема системы имеет вид, по-
1 1
казанный на рис.1.32, а. Требуется L1 L2

найти передаточную функцию по ка- – W5 – W4


Рис.1.32
налу x→y. Соответствующий граф по-
казан на рис.1.32,б. В соответствии с (1.56) найдем:
L1 = –W1W2W5; L2 = –W2W3W4; P1 = W1W2W3;
Δ* = (1 – L1)(1 – L2) = 1 - (L1 + L2) =
= 1 + W2(W1W5 + W3W4); Δ1 = 1.
Тогда, воспользовавшись (1.56), получим искомую передаточную функцию:

W1W2W3
Wxy ( p) =
1 + W2 (W1W5 + W3W4 ) .

Пример 1.14. Пусть динамическое звено представляет собой цепь RLC (рис.1.2).
Требуется найти передаточную функцию этого звена по каналу x=i → y = uR .
Решение. Так как цепь RLC имеет две энергетические емкости, то оператор пре-
образования может быть представлен передаточной функцией вида:

W xy ( p ) = k
T 2 p 2 + 2T ξ p +1 (1.57)
где k,T и ξ – искомые параметры, зависящие от величин R, L и C. Эти параметры можно
определить, составив граф, отображающий математическую модель электрической цепи в
переменных состояния (1.14):
v&1 = −C −1v2 + C −1 x ⎫

v&2 = L−1v1 − RL−1v2 ⎬ (1.58)
y = R v2 ⎪

Граф, отображающий систему уравнений (1.58) изображен на рис.1.33, где 1/р – оз-
начает операцию интегрирования переменной.

264
Воспользовавшись формулой Мезона (1.56), запишем
P1 R / LCp 2 R
W xy ( p ) = = =
1−( L1 + L2 ) 1 + R / Lp + 1/ LCp 2 LCp 2 + RCp + 1 (1.59)

Сравнив (1.57) с (1.59), получим k=R; T = LC ; ξ = 0,5 R C / L . Таким образом,


модель в переменных состояния в принципе может быть представлена в виде графа, кото-
рый позволяет найти оператор преобразования сигнала в виде передаточной функции по
исследуемому каналу.

2.3 МНОГОМЕРНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

К многомерным относятся АСУ, имеющие несколько управляемых величин yj


( j = 1, 2, ..., m ). Это имеет место во многих современных сложных системах.
Многомерная система предполагает наличие много-

мерного объекта управления (рис.1.34), который характери-
ui ОУ yj зуется существованием нескольких входов (точек приложе-

ния управляющих ui и возмущающих f μ воздействий) и не-


Рис.1.34
скольких выходов (управляемых величин yj). Многомерный
объект описывается системой уравнений, которую удобно представлять в матричной
T
y = ⎡⎣ y1 y2 ... y j ... ym ⎤⎦
форме. Введем: 1) m-мерный вектор управляемых величин - ; 2)
T
u = ⎡⎣u1 u2 ...u j ... uk ⎤⎦
k-мерный вектор управляющих величин - ; 3) l-мерный век-

тор возмущений - f = [ f1 f l ] , где Т –операция транспонирования матрицы.


τ
f 2 ... f m ...

Если управляемые величины имеют разную физическую природу, то они должны


входить в вектор-столбец со своими весовыми коэффициентами, уравнивающими их раз-
мерности. Аналогичным образом формируются векторы управления и возмущений.
Линеаризованные уравнения многомерного объекта могут быть представлены в
матричном виде:

265
q( p) ⋅ y (t ) = r ( p) ⋅ u (t ) + s( p) ⋅ f (t ) , (1.60)

где q( p), r ( p ), s( p ) - операторные матрицы;


⎡ q11 ( p ) ... q1m ( p ) ⎤ ⎡ r11 ( p ) ... r1k ( p ) ⎤ ⎡ s11 ( p ) ... s1l ( p) ⎤
q( p ) = ⎢⎢ ... ... ... ⎥⎥ r ( p ) = ⎢⎢ ... ... ... ⎥⎥ s( p ) = ⎢⎢ ... ... ... ⎥⎥
⎢⎣ qm1 ( p ) ... qmm ( p ) ⎥⎦ ⎢⎣ rm1 ( p ) ... rmk ( p ) ⎥⎦ ⎢⎣ sm1 ( p ) ... sml ( p ) ⎥⎦
; ; .
Преобразовав (1.60) по Лапласу при нулевых начальных условиях, получим
Q( p) ⋅ Y ( p) = R( p) ⋅ U ( p) + S( p) ⋅ F ( p) . (1.61)
−1
Умножив левую и правую части уравнения (1.61) на обратную матрицу Q ( p) , по-
лучим

Y ( p) = Wou ( p) ⋅U ( p) + Wof ( p) ⋅ F ( p)
, (1.62)

где Wou ( p); Wof ( p ) – матрицы передаточных функций объекта управления (ОУ) соответ-
ственно для управляющих и возмущающих воздействий (рис.1.35).
Выражение (1.62) позволяет установить связь между управляемыми величинами и
возмущающими и управляющими воздействиями объекта. Так, при m = 3; k = 2 и l = 0
уравнение (1.62) можно записать в виде:

Y1 ( p ) = W11 ( p )U1 ( p ) + W12 ( p )U 2 ( p ); ⎫



Y2 ( p ) = W21 ( p )U1 ( p ) + W22 ( p )U 2 ( p );⎬
Y3 ( p ) = W31 ( p )U1 ( p ) + W32 ( p )U 2 ( p ).⎪⎭
,

где Wij(p)– передаточная функция объекта управления по каналу ui-yj; i =1,k ; j =1, m.

Если в матрице передаточных функций Wou ( p) или Wof ( p) для каждого элемента
матрицы (частной передаточной функции) найти оригинал, то будет получена так назы-
ваемая матрица Коши (матрица весовых функций). Например, для управляющих воздей-
ствий

⎡ w11 (t ) ... w1k (t ) ⎤


w ou (t ) = ⎢⎢ ... ... ... ⎥⎥
⎢⎣ wm1 (t ) ... wmk (t ) ⎥⎦
.
Если в нулевой момент времени на все входы объекта поступают управляющие

воздействия ui (t ) , то на основании принципа суперпозиции изменение j-й управляемой


величины может быть определено с помощью интеграла Дюамеля (4.81):

k t
y j (t ) = ∑ ∫ ui (τ ) ⋅ w ji (t − τ )dτ
i=1 0 .

266
На рис.1.35 представлена структур-
ная схема замкнутой многомерной системы
управления объектом ОУ. На схеме все ука-
занные символы соответствуют матрицам:

y * (t ) – задающих воздействий; y (t ) –
управляемых (выходных) величин объекта;
Δ (t ) – отклонений для каждой управляемой величины; u (t ) – управляющих воздействий;

f (t ) – возмущений; Wou ( p) – передаточных функций объекта по управлениям; Wof ( p) –

передаточных функций объекта по возмущениям. Кроме того, введена матрица переда-

Wy ( p) = k ji
точных функций управляющего устройства k ×n , которая определяет исполь-
зуемые законы управления и показывает связь между изображениями управляющих воз-
действий и отклонений:

⎡U1 ( p) ⎤ ⎡ k1 ( p) ... k1n ( p)⎤ ⎡ Δ1 ( p) ⎤


⎢ ⎥ ⎢ ⎥ ⎢ ⎥
U ( p) = ⎢ ... ⎥ = ⎢ ... ... ... ⎥ × ⎢ ... ⎥
⎢U ( p)⎥ ⎢k ( p) ... k ( p)⎥ ⎢Δ ( p)⎥
⎣ k ⎦ ⎣ k1 kn ⎦ ⎣ n ⎦ .

Матрица передаточных функций разомкнутой системы имеет вид

Wp ( p ) = Wou ( p ) Wy ( p ) .

Характеристическая матрица системы имеет размерность n × n :

D( p) = I + Wp ( p) = d ji ( p)
n×n ,
где I – единичная матрица n × n , т.е. матрица, у которой все элементы главной диагонали
равны единице, а остальные – нулю.
Характеристическое уравнение системы получается приравниванием к нулю опре-
делителя характеристической матрицы.

Заметим, что отклонения Δ i ( i = 1, 2, ..., n ) представляют собой некоторые абст-


рактные величины, знание которых полностью определяет текущее состояние системы,
т.е. являются переменными состояния.

Матрицы передаточных функций замкнутой системы по каналам: задающие y * и

возмущающие f воздействия → выходные величины y , f , y * → ошибки Δ , могут быть


определены из выражений

Wy* y ( p) = Wp ( p) ⋅ D−1 ( p); W f y ( p ) = Wof ( p ) ⋅ D−1 ( p );


Wy*Δ ( p ) = D−1 ( p); W f Δ ( p ) = − Wof ( p ) ⋅ D−1 ( p ). (1.63)

267
Полученные выражения для матриц передаточных функций замкнутой системы по-

зволяют найти изображения ошибок Δ( p) и управляемых величин Y ( p) . Так, например,


для матрицы изображений ошибок можно записать

⎡ Δ1 ( p) ⎤
Δ( p) = ⎢⎢.... ⎥ = W ( p)Y *( p) + W ( p) F ( p)
⎥ y*Δ fΔ

⎢⎣ Δ m ( p) ⎥⎦

Пользуясь полученным выражением и взяв обратное преобразование Лапласа мож-

но найти оригиналы ошибок Δ (t ) и оценить качество функционирования многомерной


системы, а при необходимости скорректировать параметры и структуру управляющего
устройства.

2.3.1. Управляемость и наблюдаемость

Рассмотрим n-мерное пространство состояний ν , в котором каждому состоянию


системы соответствует некоторое положение изображающей точки, определяемое значе-

ниями переменные состояния ν i ( i = 1, 2, ..., n ).

Пусть в пространстве состояний ν заданы два множества G1 ⊂ ν и G2 ⊂ ν . Рас-


сматриваемая система будет управляемой, если существует такое управление

u (t ) = [u1 ... uk ] , определенное на конечном интервале времени 0 ≤ t ≤ T , которое пере-


T

водит изображающую точку в пространстве ν из подобласти G1 в подобласть G2 .


Можно сузить определение управляемости и понимать под ним возможность пере-

вода изображающей точки из любой области пространства состояний ν в начало коорди-

нат, т.е. в точку, соответствующую нулевым отклонениям управляемых координат yi от


*
заданных значений yi . Система будет полностью управляемой, если каждое состояние
управляемо в этом смысле. Если невозможно подобрать управления, приводящие систему
в начало координат ни из одного возможного состояния, система полностью неуправляе-
ма.
Система считается наблюдаемой, если в формировании вектора выходных коорди-

нат y участвуют все составляющие вектора переменных состояния ν . Если ни одна из

268
составляющих вектора ν не влияет на формирование выхода системы y , то такая система
ненаблюдаема.
Исходные дифференциальные уравнения многомерной системы управления могут
быть представлены в форме Коши в матричной записи:

dν ⎫
= Aν + Bu + E f ;⎪
dt ⎪⎪
y = Cν ; ⎬

u = Dν , ⎪
⎪⎭
(1.64)
где ν – вектор фазовых координат размерности 1×n (n соответствует порядку дифферен-

циального уравнения); y – вектор управляемых (выходных) величин системы размерно-

сти 1×m; u – вектор управляющих воздействий размерности 1×k; f – вектор возму-

A = a ji B = b ji
щающих и задающих воздействий размерности 1×l; n× n ; m× k ;

C = c ji D = d ji E = e ji
m×n ; k ×n ; m ×l – соответствующие матрицы коэффициентов.

От пространства состояний ν перейдем к преобразованному пространству состоя-

ний ν * посредством преобразования ν * = Rν , где R – матрица коэффициентов размер-


ности m× m .
Тогда вместо (1.64) будем иметь
dν * ⎫
= A *ν * +B * u + E * f ;⎪
dt ⎪⎪
y = C *ν *; ⎬

u = D *ν *. ⎪
⎪⎭
(1.65)
Здесь использованы преобразованные матрицы коэффициентов:
−1
A* = RAR −1 ; B = RB ; C* = CR ; D* = DR −1 ; E* = RE .
Введение новых переменных состояния посредством преобразования ν * = Rν при-
водит к эквивалентным системам различной структуры. При некотором преобразовании
может оказаться, что часть управляющих величин не входит в некоторые дифференциаль-
ные уравнения (1.65) или часть переменных состояния не участвует в формировании вы-
хода y . В первом случае система будет не полностью управляемой, во втором – не полно-
стью наблюдаемой.

269
В случае не полностью управляемой системы ее исходное дифференциальное
уравнение, входящее в систему (1.64) может быть представлено в виде

dν 1
= A11ν 1 + A12ν 2 + Bu,
dt ,
dν 2
= A 22ν 2 ,
dt

где ν 1 - вектор координат, соответствующий управляемой части системы, размерностью

ν
1⋅ν ; 2 - то же, но неуправляемой части, размерности 1⋅ (m −ν ) .
Р. Калман показал, что размерность v управляемой части системы, т.е. порядок
первой группы уравнений (1.65), совпадает с рангом следующей матрицы:
U = B, AB , A 2B, ... A n -1B . (1.66)
n × kn

При v = n система полностью управляема, при 0 < v < n – не полностью управляема, при
v = 0 – неуправляема.

В случае не полностью наблюдаемой системы переменные состояния группы ν 2 не

участвуют в формировании управляемых y и управляющих u величин, а также перемен-

ных состояния группы ν 1 , т.е. группа ν 2 относится к ненаблюдаемым переменным со-


стояния. В этом случае уравления системы могут быть представлены в виде:

dν 1
= A11ν 1 + B1 U;
dt
dν 2
= A 21ν 1 + A 22ν 2 + B 2 U ;
dt
y = C1ν 1 ; u = D1ν 1.
(1.67)
При этом, как показал Калман, порядок v первой группы уравнений (1.67) совпада-
ет с рангом следующей матрицы:

V = CT A T CT ( A T ) 2 CT ... ( AT ) n −1 CT .
n× mn

При v = n система полностью наблюдаема, при 0 < v < n – не полностью наблюдаема; при
v = 0 – ненаблюдаема.
Пример 1.15. Рассмотрим систему, изображенную на рис.1.36, а. Количество пе-
ременных состояния n = 3 (они обусловлены наличием в системе трех энергетических ем-
костей с постоянными времени

а
u2 T1 , T2 , T3 ). В отсутствие управляющего
u1 T1 p + 1 y
1
(T2 p + 1)(T3 p + 1) T1 p + 1

u1 1 y 270
T1 p + 1
T1 p + 1 (T2 p + 1)(T3 p + 1)
б
Рис.1.36
сигнала u2 управление u1 воздействует только на две переменных состояния, обусловлен-

ные емкостями T2 и T3 ( T1 сокращается), т.е. v = 2 < n = 3 , и система не полностью управ-

ляема. При подаче сигнала u2 появляется возможность воздействие и на переменную со-

стояния обусловленную емкостью T1 и система становится полностью управляемой


( v = n = 3 ).
Система, изображенная на рис.1.36,б, не полностью наблюдаема, так как в форми-

ровании выхода y из трех переменных состояния участвуют только две - T2 и T3 .


Таким образом, понятие управляемости системы характеризует способность входа

u (t ) возбуждать все переменные состояния (фазовые координаты) ν (t ) ; понятие наблю-

даемости – способность состояния ν (t ) изменять выходной сигнал y (t ) .

271
3. УСТОЙЧИВОСТЬ И КАЧЕСТВО ФУНКЦИОНИРОВАНИЯ АСУ

3.1. УСТОЙЧИВОСТЬ АСУ

Устойчивость АСУ характеризует способность системы возвращаться в состояние


равновесия после исчезновения внешних сил, которые вывели ее из этого состояния. По-
нятие ”устойчивость” наглядно иллюстрирует рис. 1.37, на котором представлена физиче-
ская система шар – опор-
а б ная поверхность. На
в
Fд рис. 1.37, а, б шар нахо-
дится в положении равно-
Неустойчивое Устойчивое Безразличное
равновесие равновесие равновесие весия. При отклонении от
этого положения в любую
г
сторону в первом случае
Ограничение
Ограничения (рис.1.37, а) шар не может
вернуться в исходное по-
Устойчивость в малом ложение (неустойчивое
Рис.1.37 равновесие), а во втором
(рис.1.37, б) – возвращается (устойчивое равновесие). Если опорная поверхность пред-
ставляет собой горизонтальную плоскость, то шар движется по ней до тех пор, пока дей-
ствует движущая сила Fд и после ее исчезновения останавливается в любой точке на плос-
кости (безразличное равновесие). Такая система иногда называется нейтральной (рис.1
37,в).
Говорят, что система устойчива в малом, если констатируют лишь факт наличия
области устойчивости, но не определяют каким-либо образом ее границы. Если границы
устойчивости определены, т.е. границы области начальных отклонений, при которых сис-
тема возвращается в состояние равновесия, известны (рис.1.37, г), и выяснено, что реаль-
ные начальные отклонения принадлежат этой области, то система устойчива в большом.
Когда система возвращается в состояние равновесия при любых начальных отклонениях,
ее называют устойчивой в целом, т.е. в малом и большом.
3.1.1. Переходные процессы в АСУ

В любой АСУ в результате воздействия возмущающих сил, с одной стороны, и вос-


станавливающего действия управляющего устройства, с другой, возникает переходный
процесс: переход АСУ из одного состояния в другое. Рассмотрим различные типы пере-
ходного процесса.
Пусть АСУ описывается дифференциальным уравнением вида

272
T 2 &y& + 2Tξ y& + y = kx . (1.68)

характеристическое уравнение, которого: T 2 p 2 + 2Tξ p + 1 = 0 имеет корни

p1,2 = ⎛⎜ − ξ ± ξ2 −1⎞⎟ / T .
⎝ ⎠

0 1
Как было показано ранее, решение ДУ (1.68) описы-
–1
ξ < –1 –1 < ξ <0 0<ξ <1 ξ>1 вает переходной процесс y(t), характер которого определя-
–∞←ξ I II III IV ξ → ∞
ется коэффициентом ξ. Возможное расположение корней
+j характеристического уравнения на комплексной плоскости
+j/T
IV V I
III
p1 (ξ = 0)
II
p при различных значениях ξ показано на рис.1.38. Рас-
p1 p1
IV IV ω I I смотрим переходные процессы, соответствующие различ-
p2 p1 p2 p1
–1/T (ξ = 1) 1/T (ξ = –1) ным значениям ξ.
II
III
p2 V
p2 I. ξ < –1. Переходная функция h(t) при подаче на
p2 – j/T (ξ = 0)
III II
–j вход единичного ступенчатого сигнала имеет вид:

h(t ) = c1 e p1t + c 2 e
p2t
Рис.1.38 + k , при этом корни характеристиче-

ского уравнения вещественные положительные ( p1I,2 > 0 ) и, следовательно, lim h(t ) = ∞ . В


t →∞

данном случае система не может восстановить равновесное состояние, значение управ-


ляемой координаты все больше отклоняется от заданного. Такой переходный процесс на-
зывается расходящимся монотонным (апериодическим) (рис.1.39, а), а система неустой-

а б в г д
h(t)

Рис. 1.39

чивой (идет процесс накопления энергии из внешней среды).


II. –1 < ξ < 0. II
При этом p1,2 = α ± jω, α > 0, а переходная функция имеет

вид:

h(t) = k[1 - Ae αtsin(ωt + ϕ)], где A = 1/ 1−ξ 2 , ϕ = arcsin 1 − ξ 2 . Характеристики системы те

же, что и в предыдущем случае, но переходный процесс колебательный (рис.1.39, б).


III. 0 < ξ < 1. Переходная функция h(t) та же, что и в случае II, но при α < 0. при
этом система возвращается к равновесному состоянию, а значение управляемой координа-
ты приближается к заданному. Такой переходный процесс называется сходящимся коле-

273
бательным, а система устойчивой (происходит диссипация энергии во внешнюю среду)
(рис.1.39, в).
IV. ξ > 1. Переходная функция h(t) имеет тот же вид, что и в случае I, но p1,2 < 0.
Характеристика системы та же, что и в III случае, но переходный процесс монотонный
(апериодический) (рис.1.39, в). На этом же рисунке показана переходная функция при

ξ = 1 , p1 = p 2 = − ξ T .

V. ξ = 0; p1,2
V
= ±jω, ω = 1 / T , h(t) = k(1 – cosωt). В системе устанавливается перио-

дическое движение, процесс называется колебательным незатухающим, система находит-


ся на границе устойчивости (рис.1.39, д). Она является замкнутой (консервативной), авто-
номной от внешней среды.
Все рассмотренные колебания (II, III и V случаи) относятся к классу свободных, их
параметры A и ϕ зависят от начальных условий, т.е. от привнесенной энергии. Для случаев
II и III функция h(t) ≠ h(t + T), где T– период колебаний, следовательно, эти колебания не-
периодические. Периодические колебания наблюдаются только в случае V*).
Сопоставление корней характеристического уравнения на комплексной плоскости
p с соответствующими переходными процессами (рис.1.39) показывает, что линейная сис-
тема восстанавливает равновесное состояние только тогда, когда корни характеристиче-
ского уравнения расположены слева от мнимой оси.
В общем случае условие устойчивости АСУ имеет вид

lim y (t ) − y ( 0 ) = ε ,
t→∞

где y(0) – начальное значение управляемой величины; ε = y(∞) − y(0) – установившееся от-

клонение управляемой величины или статическая ошибка, в случае астатической систе-


мы ε = 0.
Реальные системы всегда нелинейны, однако, если для анализа поведения системы
можно произвести линеаризацию уравнений, то о ее устойчивости можно судить исходя из
первой теоремы Ляпунова:
1. Если характеристическое уравнение линеаризованной системы имеет все корни с
отрицательными вещественными частями, то реальная система будет устойчива в малом.
2. Если характеристическое уравнение линеаризованной системы имеет хотя бы
один корень с положительной вещественной частью, то реальная система всегда неустой-
чива.

*)
Более подробная классификация колебательных процессов в системах приведена в п. 8.2.4.

274
3. Если характеристическое уравнение линеаризованной системы имеет хотя бы
один нулевой корень или пару чисто мнимых корней, то поведение реальной системы не
может определяться ее линеаризованным уравнением. В этом случае отброшенные при
линеаризации уравнения члены высшего порядка малости определяют поведение системы
и могут превратить ее как в устойчивую, так и в неустойчивую.
Таким образом, анализ устойчивости линеаризованной системы сводится
к нахождению расположения корней на комплексной плоскости, которое однозначно оп-
ределяется коэффициентами характеристического уравнения. Однако не всегда можно
вычислить корни характеристического уравнения в аналитическом виде. В соответствии
с теоремой Абеля, корни уравнения выше четвертого порядка не могут быть найдены ана-
литически в принципе. Поэтому желательно иметь такие критерии, с помощью которых
можно было судить об устойчивости системы непосредственно по коэффициентам харак-
теристического уравнения и определять влияние изменяемых параметров системы на рас-
положение корней характеристического уравнения на два больших класса комплексной
плоскости. Эти критерии называют критериями устойчивости и подразделяются на ал-
гебраические и частотные.
3.1.2. Алгебраический критерий устойчивости Гурвица

Пусть дано характеристическое уравнение системы вида

a0 pn + a1 pn-1 + a2 pn-2 + … + an-1 p + an = 0 при a0 > 0. (1.69)

Гурвиц предложил алгебраический критерий*), который основан на построении


специальных определителей характеристического уравнения (1.69), называемых опреде-
лителями Гурвица. Они составляются по следующим правилам:
1) по главной диагонали выписывают все коэффициенты от a1 до an в порядке воз-
растания индекса;
2) дополняют столбцы определителя вверх от диагонали коэффициентами с после-
довательно возрастающими, а вниз – с последовательно убывающими индексами;
3) на место коэффициентов, индексы которых больше n и меньше 0, ставят нули.
В соответствии с этими правилами, определитель Гурвица n-го порядка для урав-
нения (1.69) имеет вид

*)
Заметим, что впервые задача отыскания алгебраического критерия устойчивости была решена Раусом, но поскольку
этот критерий был сформулирован в виде алгоритма использование его на практике не всегда удобно.

275
a1 a3 a5 K 0
a0 a2 a4 K 0
Δn = 0 a1 a3 K 0 . (1.70)
M M M M M
0 0 0 K an
Определители Гурвица более низкого порядка являются диагональными минорами
Δn. Например, при n = 3
a1 a3 0
a1 a3
Δ 3 = a0 a2 0 ; Δ2 = ; Δ1 = a1. (1.71)
a0 a2
0 a1 a3

Поскольку в последнем столбце определителя Δn стоят нули, за исключением an, то


Δ n = an Δ n –1.

Критерий Гурвица формулируется следующим образом: для того, чтобы АСУ бы-
ла устойчива необходимо и достаточно, чтобы все определители Гурвица Δ1, Δ2, …, Δ n
были положительными, и при этом выполнялось условие a0 > 0.

Пример 1.16. 1. Пусть АСУ описывается уравнением второго порядка, характери-


стическое уравнение которого имеет вид: a0 p2 + a1 p + a2 = 0. Определить условие ус-
тойчивости АСУ по Гурвицу.
Решение. Составим в соответствии с (1.70) определитель Гурвица:
a1 0
Δ2 = ,
a0 a2

Тогда условия устойчивости системы запишутся в виде:

Δ2 = a2Δ1 = a2 a1 > 0; Δ1 = a1 > 0; a0 > 0.

Поскольку a1 > 0, то для выполнения условия Δ2 > 0, коэффициент a2 должен быть


также больше нуля. Таким образом, для устойчивости системы второго порядка необхо-
димо и достаточно, чтобы все коэффициенты характеристического уравнения были поло-
жительными.
В случае если АСУ описывается ДУ третьего порядка, с характеристическим урав-
нением вида
a0 p3 + a1 p2 + a2 p + a3 = 0, (1.72)
то определитель Гурвица будет
a1 a3 0
Δ3 = a0 a2 0 = a3Δ 2 .
0 a1 a3
В соответствии с (1.71) для устойчивой системы имеем

276
a1 a3
Δ3 = a3 Δ2 > 0; Δ2 = = a1a2 − a0a3 > 0 ; Δ1 = a1 > 0; a0 > 0.
a0 a2

Анализ приведенных неравенств показывает, что выполнения условия положи-


тельности всех определителей Гурвица, все коэффициенты уравнения (1.72) должны быть
также положительны, но, кроме того, должно выполняться неравенство: a1 a2> a0 a3. Та-
ким образом, условие положительности всех коэффициентов ai i = ( 0 , 3 ) является необ-
ходимым, но не достаточным условием устойчивости рассматриваемой системы. Это ут-
верждение остается справедливым при порядке дифференциального уравнения системы
выше третьего (n >3).
Заметим, что в случае, если Δ2 < 0 (неустойчивая система), то учитывая зависи-
мость коэффициентов ai от изменяемых параметров системы, необходимо эти параметры
подобрать таким образом, чтобы выполнялось условие устойчивости: a1 a2> a0 a3.
Пример 1.17. Пусть передаточные функции звеньев Δ y
x Wу(p) Wо(p)
замкнутой АСУ, представленной на рис. 1.40. имеют вид
ko ky
Wo ( p) = ; W y ( p) = .
T p + 2Toξ p + 1
o
2 2
p Рис. 1.40

Числовые значения параметров объекта управления приняты равными T0=0,1с;


ξ=0,45; ko = 0, 26 (см. пример 1.8). Найти числовые значения коэффициента передачи
управляющего устройства kу удовлетворяющего требованиям устойчивости системы.
Решение. Найдем передаточную функцию разомкнутой системы
k y ko
W p ( p ) = Wo ( p )W y ( p ) = .
T p + 2Toξ p 2 + p
o
2 3

Запишем передаточную функцию замкнутой системы по каналу x→∆

1 To2 p 3 + 2Toξ p 2 + p
W xΔ ( p) = = .
1 + W p ( p) To2 p 3 + 2Toξ p 2 + p + k y k o

Характеристическое уравнение системы имеет вид аналогичный (1.72). В нашем


случае а0= Т 02 = 0,01 ⋅ а1=2ξ T0=0,09; а2=1,0; а3=0,26 kу. Согласно критерию Гурвица

для устойчивой системы третьего порядка должно выполняться неравенство: a1 a2> a0 a3


(см. пример 1.16). После подстановки числовых значений коэффициентов окончательно
получим kу< 34. Это неравенство и является условием устойчивости рассматриваемой
системы.

***

277
Заметим, что для характеристических уравнений высоких степеней (n > 5) анализ
влияния коэффициентов на определитель Гурвица резко усложняется. Свободными от
этого недостатка являются частотные критерии устойчивости.

3.1.3. Частотные критерии устойчивости

Частотные критерии основаны на анализе расположения тех или иных частотных


характеристик на плоскости. При этом достигается:
1) наглядность, так как задача исследования системы любого порядка сводится к
изучению плоской кривой;
2) возможность экспериментального определения частотных характеристик систе-
мы, что позволяет исследовать такие системы, ДУ которых неизвестны;
3) сравнительно простой анализ влияния того или иного параметра на устойчи-
вость, а также возможность суждения о качестве переходного процесса.
Частотные критерии можно разделить на две группы: первые предназначены для
исследования устойчивости замкнутой системы – критерий Михайлова (он применяется
обычно для сложных систем); вторые – для исследования устойчивости замкнутой систе-
мы по частотной характеристике разомкнутой системы – критерий Найквиста (использу-
ется, когда размыкание системы приводит к существенным упрощениям частотной функ-
ции).
Критерий устойчивости Михайлова. Пусть дано уравнение замкнутой системы
Y(p) = W(p)X(p), где W(p) = В(p)/А(p) – передаточная функция замкнутой системы. Тогда
ДУ системы, преобразованное по Лапласу:
A(p)Y(p) = B(p)X(p),

где A(p) = a0 pn + a1 pn – 1 + … + an – 1 p + an – характеристический полином.


В соответствии с основной теоремой алгебры этот полином можно разложить на
множители в виде:

A(p) = a0(p – p1)(p – p2) … (p – pn), (1.73)


где p1, …, pn – корни характеристического уравнения A(p) = 0.
Выражение (1.73) действительно при любых значениях p, в частности при p = jω .
Тогда (1.73) можно переписать так:

A(jω) = a0 (jω – p1)(jω – p2) … (jω – pn). (1.74)

278
Выражение (1.74) называется кривой Михайлова и +j
(jω – p2) jω ω → +∞
обычно обозначается D(jω) =A(jω). Каждый сомножитель +π (jω – p1)
p2 jω2
выражения (1.74) отображается на комплексной плоскости
вектором, конец которого лежит на мнимой оси (рис.1.41). p2 p1
–α –π α
В основу критерия Михайлова положен принцип ар- (jω – p3) p1
p3 – jω2
p3
гумента: произведение комплексных чисел имеет аргумент, ω → –∞

равный сумме аргументов всех его сомножителей. –j

В нашем случае при изменении ω от –∞ до +∞ век- Рис.1.41

торы сомножителей (jω – pi), i = 1, n поворачиваются на угол π (рис.1.41). Если корни ле-
жат в левой части полуплоскости, то изменение угла будет положительным, если в пра-
вой, – то отрицательным (вектор (jω – pi) поворачивается против часовой стрелки в левой
полуплоскости и по часовой стрелке – в правой).
Запишем выражение (1.74) в показательной форме. Учтем, что ( jω − pi ) = Ai e jϕi ,
где Ai = jω − pi ; ϕi = arg( jω − pi ) . Тогда

⎡ n ⎤ j ∑ ϕi
D( jω) = A( jω) = a0 A1 e jϕ1 A2 e jϕ 2
K Ai e jϕi
K An e jϕ n
= a0 ⎢∏ Ai ⎥ e i =1 = A e jϕ . (1.75)
⎣ i =1 ⎦
Из (1.75) вытекает, что изменение аргумента вектора Михайлова D(jω) равно сум-
ме изменений аргумента каждого сомножителя выражения (1.75), т.е.
n
Δ arg D ( jω) = Δϕ = ∑ Δϕi .
i =1

Если все корни характеристического уравнения расположены слева от мнимой оси


(т.е. система устойчива), то изменение аргумента каждого из сомножителей (jω- pi) при
изменении ω от –∞ до +∞, равно +π, а изменение аргумента произведения всех сомно-
жителей Δ argD(jω) = +πn. Если хотя бы один корень будет расположен в правой полу-
плоскости (система неустойчива), то изменение аргумента вектора Михайлова
Δ argD(jω) = +π(n – 2).
Заметим, что при изменении ω от –∞ до +∞ кривая Михайлова симметрична отно-
сительно оси абсцисс, что позволяет ограничиться изучением кривой в диапазоне изме-
нения ω от 0 до +∞. Тогда условие устойчивости системы по Михайлову можно записать
в виде
π
Δ arg D( jω) 0 < ω< +∞ = + n . (1.76)
2

279
n=2 +j Годографы кривой Михайлова при изменении ω
n=1 от 0 до ∞ для устойчивых систем при различных значени-
n=3

an
ях n приведены на рис.1.42.
+
ω=0 В соответствии с (1.76) критерий Михайлова

n=4 n=5
формулируется сле-
+j
ω → +∞ n = 5, Н дующим образом: для
–j
Рис.1.42 того, чтобы замкну-
an +
тая система была устойчивой, необходимо и
n = 4, Н
достаточно, чтобы при изменении ω от 0 до ∞ вектор
Михайлова D(jω) повернулся на угол n = 4, У n = 4, ГУ + n(π / 2) .

Рассматривая расположение Рис.1.43


D(jω) на комплексной
Н, У, ГУ – система соответственно
плоскости (рис.1.42), условие ус- неустойчива, устойчива, на границе тойчивости можно
устойчивости
сформулировать иначе: чтобы система была
устойчива, необходимо и достаточно, чтобы годограф вектора D(jω) прошел на ком-
плексной плоскости последовательно n квадрантов в положительном направлении (про-
тив часовой стрелки), не проходя через начало координат. Если годограф проходит через
начало координат, то система находится на границе устойчивости. Расположение годо-
графа на комплексной плоскости для различных систем иллюстрируется рис.1.43.
Критерий устойчивости Найквиста.
Пусть дана замкнутая АСУ, структурная схема которой представлена на рис.1.44.
Запишем изображение выходной величины в виде:
Y(p) = Wху(p)X(p), (1.77)
W1 ( p) B( p )
где Wху ( p) = = – передаточная функция по каналу x → y замкнутой систе-
1 + Wp ( p) A( p)

Bp ( p )
мы; Wp ( p ) = W1 (p) ⋅W 2 (p) = – передаточная функция разомкнутой системы.
Ap ( p )

Подставив Wху(p)в (1.77), можем записать


[1 + Wp(p)]Y(p) = W1(p)X(p),
откуда характеристическое уравнение замкнутой системы: 1+ Wp(p) = 0
x y
W1(p)
или Ap(p) + Bp(p) = 0, где Ap(p) – характеристический полином разомк-
нутой системы n-й степени.
W2(p)
В реальных системах степень полинома Bp(p) меньше степени
Рис. 1.44
полинома Ap(p) вследствие инерционности динамических звеньев. Сле-
довательно, полином {Ap(p) + Bp(p)} имеет ту же степень, что и Ap(p).

280
При p = jω, разложив соответствующие полиномы на множители, имеем
n
Ap ( jω) + Bp ( jω) ∏ ( jω − p1i )
1 + Wp ( jω) = = A in=1 ,
Ap ( jω)
∏ ( jω − p2i )
i =1
где p1i и p2i – корни уравнений Ap(jω) + Bp(jω) = 0 и Ap(jω) = 0 соответственно i = 1, n ; A –
вещественный коэффициент.
В соответствии с первой теоремой Ляпунова, замкнутая система устойчива, если
все корни p1i лежат в левой полуплоскости. Если разомкнутая система устойчива, то корни
уравнения Ap(jω) = 0, p2i тоже лежат в левой полуплоскости. Поскольку при делении ком-
плексных чисел их аргументы вычитаются, то при изменении ω от – ∞ до + ∞
Δ arg[1 + Wp(jω)] = 0. Следовательно, чтобы замкнутая система была устойчива, необходи-
мо и достаточно, чтобы годограф вектора {1+ Wp(jω)} не охватывал начало координат при
изменении ω от – ∞ до + ∞. При ω = 0 и при ω → ∞ соответственно 1 + Wp(jω) = const
и 1 + Wp(jω) → 1. Годограф вектора {1 + Wp(jω)} представлен на рис.1.45, а.
Если сместить ось ординат вправо на +1, то начало координат в новой системе
совпадет с началом вектора Wp(jω), а старое начало координат в новой системе совпадет
с точкой (–1; j0) (рис.1.45, б).
Таким образом, критерий Найквиста можно сформулировать следующим образом:
чтобы замкнутая система была устойчива, необходимо и дос ратное утверждение явля-
ется только необходимым, таточно, чтобы АФЧХ разомкнутой системы при изменении
ω от нуля до бесконечности не охватывала точку с координатами (–1; j0). Заметим, что
обно недостаточным условием неустойчивости системы.
Пример 1.18. Определим вид АФЧХ при различных частотных характеристьиках

а
разомкнутой системы.
+j
Решение . 1. Пусть разомкнутая система
является апериодическим звеном второго порядка.
ω = ±∞ Тогда частотную характеристику системы можно
1
0 Wp(jω) ω=0 представить в виде:
k
WP1 ( jω ) = .
1 + Wp(jω) (T1 jω + 1)(T2 jω + 1)
Если T1 = 0, то АФЧХ имеет вид, показанный на
б +j
рис.1.46, а, если T1 ≠ 0, то АФЧХ имеет вид, пока-
занный на рис.1.46, б.
ω=∞
–1; j0 0 Wp(jω) ω=0

281

Рис.1.45
Поскольку АФЧХ разомкнутой системы с частотной функцией WP1 ( jω ) при любых

Ti > 0 (i = 1, 2) не пересекает отрицательную полуось абсцисс, то эта система всегда ус-


тойчива.
2. Пусть частотная функция разомкнутой системы определяется выражением вида:
k
WP2 ( jω) =
(T1 jω + 1)(T2 jω + 1)(T3 jω + 1)
Годограф вектора WP2 ( jω ) представлен на рис.1.46, в, и при определенных пара-

метрах, например при


увеличении k, может ох-
ватить точку(–1; j0). При
этом система потеряет
устойчивость.
3. Если последова-
тельно с инерционными
звеньями включить ин-
тегрирующее звено с
частотной характери-
стикой Wu ( jω) = ku ( jω) ,

то умножение вектора АФЧХ, представленного, например, частотной функцией WP2 ( jω ) ,

на вектор Wu ( jω) = − j(ku / ω) с аргументом, равным − π / 2 , означает поворот всех векторов


WP2 ( jω ) на угол – π /2 с одновременным делением на ω (рис.1.46, г). Таким образом,

АФЧХ приближается к точке (–1; j0) и, следовательно, включение интегрирующего звена


в разомкнутую цепь системы уменьшает запас ее устойчивости и увеличивает склонность
системы к колебаниям.
Пример 1.19. Для условий примера 1.17 проверить устойчивость АСУ с помощью
критерия Найквиста при коэффициенте передачи устройства управления kу=20.
Решение. Запишем частотную функцию разомкнутой системы WP ( jω ) в алгебраи-
ческом виде
k0k y
W P ( jω ) = W P ( p ) p = jω =
jQ(ω) T 02 ( j ω ) 3 + 2ξ T 0 ( j ω ) 2 +
P(ω)
− 0, 47 5, 2(1 − 0, 01ω 2 )
= − j
0.0081ω 2 + (1 − 0, 01ω 2 ) 2 0.0081ω 3 + ω (1 − 0, 01ω 2
.

282

Рис. 1.47
Полученная зависимость позволяет построить годограф WP ( jω ) (рис.1.47). Как
видно из рисунка годограф WP ( jω ) не охватывает точку (-1, j0), пересекая ось абсцисс в
точке (-0,57, j0), что свидетельствует о достаточном запасе устойчивости при принятом
коэффициенте передачи kу=20.
3.2. КАЧЕСТВО ПРОЦЕССА УПРАВЛЕНИЯ

Оценка качества процесса управления не менее важна, чем анализ устойчивости


системы, так как характер динамики процессов в системе управления определяет ее пове-
дение при переходе из одного состояния (начального) в другое (конечное). В конечном
итоге качество процесса управления определяется размером динамической ошибки, рав-
ной разности между текущим и заданным значениями управляемой величины.
Изменение состояния АСУ возникает в результате внешних воздействий, которые в
общем случае являются произвольной функцией времени и могут быть приложены со
стороны нагрузки, что характерно для систем стабилизации, или со стороны задающего
воздействия - следящие системы. В первом случае система должна минимально реагиро-
вать на воздействие по нагрузке – инвариантная задача. Во втором, для следящей систе-
мы, задание должно воспроизводиться с минимальной ошибкой – ковариантная задача.
Методы анализа качества процесса управления делятся на две группы: прямые, при
которых качество процесса оценивается непосредственно по кривой переходного процес-
са, и косвенные, оцениваемые по критериям качества.

3.2.1. Прямые методы оценки качества

Эти методы предусматривают непосредственное построение кривой переходного


процесса y(t) на основании решения уравнения движения системы или по данным экспе-
римента.
Переходный процесс устойчивой системы всегда затухает и, в зависимости от ха-
рактера затухания, подразделяется на монотонный и колебательный. При этом имеется в
виду, что на вход системы подано ступенчатое возмущение f(t) = 1(t).*)
Обычно качество переходного процесса
оценивается по нескольким показателям (рис.1.48):
Время регулирования tp – время, по истече-
нии которого отклонение управляемой величины

*)
При этом коэффициент передачи k по каналу f →y равен y (∞) . Если f (t ) = A ⋅1(t ) где
А=const, то k = y (∞ ) / A

283
y(t) от установившегося значения y(∞) становится и остается меньше зоны нечувствитель-
ности системы δ = (0,01 ÷ 0,05)y(∞). Этот показатель характеризует скорость протека-
ния переходного процесса. Если кривая переходного процесса монотонна, то этот пока-
затель является единственным.
Время первого согласования tc – время, по истечении которого управляемая вели-
чина первый раз достигает своего установившегося значения. Этот показатель также ха-
рактеризует скорость протекания процесса в начальный период.
Перерегулирование σ max – отношение максимального отклонения управляемой ве-

личины к своему установившемуся значению в процентах σ max = (Δymax / y∞ )100 , %.

Число перерегулирований n в течение времени tp и частота колебаний ωк = 2π /Tк.


Для процессов обоих типов (кривые 1 и 2 рис.1.48) существует оценка точности работы
АСУ в установившемся режиме. Пусть при номинальном режиме y(0) = y* = 0, т.е. рас-
сматриваем уравнение движения системы в отклонениях от y*. Тогда статическая ошибка
Δ(∞) = y(∞) – y(0) = y(∞). Значение y(∞) можно найти, воспользовавшись преобразованием
Лапласа. В соответствии с теоремой дифференцирования (1.27) имеем


L{y'(t)} = pY(p) – y(0) или pY( p) = y(0) + ∫ y′(t) e− pt dt . (1.78)
0

Взяв предел от (1.78), при p→0 получим

lim pY ( p ) = y (0) + lim ∫ y ′(t ) e dt = y (0) + y (∞) − y (0) = y (∞ ) , откуда


− pt

p →0 p →0
0

y (∞) = Δ(∞) = lim pY ( p) . (1.79)


p →0

Выражение (1.79) является математической формулировкой теоремы о конечном


значении*)
При y*(t) = 1(t) получим Y ( p) = W ( p)Y * ( p) = W ( p) / p , тогда

1
y (∞) = Δ (∞) = lim pW ( p ) = lim W ( p) . (1.80)
p →0 p p →0
Пример 1.20. Пусть структурная схема АСУ имеет вид, показанный на рис.1.49.
Передаточная функция объекта задана:

ko
Wo ( p ) = .
T p + 2Toξ p + 1
o
2 2

*)
Взяв предел от правой части выражения (1.79) при p → ∞ , получим математическую формулировку теоремы
о начальном значении:
y (0) = lim pY ( p ) , где y (0) - значение функции y (t ) при t = 0 .
p →0

284
Найти установившуюся ошибку системы для двух различных передаточных функ-
циях устройства управления: W y1 ( p ) = k1 ; W y 2 ( p ) = k 2 / p .

Решение. Запишем передаточную функцию замкнутой системы по каналу управ-


ляющее воздействие u ошибка ∆:
1
WuΔ ( p ) = .
1 + W0 ( p ) ⋅ W y ( p )

Подставив в полученное выражение соответствующие передаточные функции, по-


лучим для первого и второго случаев следующие соотношения:

T02 p 2 + 2Tξ p + 1 (T02 p 2 + 2Tξ p + 1) p


WuΔ1 ( p ) = 2 2 ; WuΔ 2 ( p ) = 2 3 .
T0 p + 2Tξ p + 1 + k 0 k1 T0 p + 2Tξ p 2 + p 2 + k 0 k 2

Воспользовавшись (1.80) найдем установившуюся ошибку в системе для первого


случая:

Δ 0 (∞ ) = lim WuΔ1 ( p ) = 1 ≠ 0.
p→0 1 + k 0 k1

Таким образом, рассматриваемая АСУ относится к классу статических систем,


ошибка которой отлична от нуля (рис.1.48) и уменьшается с ростом коэффициента пере-
дачи устройства управления k1.

Аналогичным образом найдем ошибку Δ2(∞) для второго случая:

Δ 2 (∞ ) = lim Wu Δ1 ( p ) = 0
p→0

В данном случае получим нулевую ошибку и, следовательно, АСУ относится к


классу астатических систем. Переходные функции этой системы для различных коэф-
фициентов демпфирования ξ показа-
ны на рис.1.50. Нетрудно убедиться, y y
ξ>1
0<ξ<1
что рассматриваемая система (при
W y 2 ( p ) = k 2 / p ), являясь астатиче- Δ∞ = 0 Δ∞ = 0
t t
ской по управляющему воздействию y(0) = y(∞)
y(0) = y(∞)
u может оказаться статической по Рис.1.50

возмущающему воздействию f. Для придания астатизма по ошибке ∆ и для этого канала,


устройство управления следует включить в прямую цепь последовательно с объектом
управления.

285
3.2.2. Косвенные методы оценки качества

Эти методы обычно используют связь между параметрами системы и показателями


качества. К ним в частности относят корневые методы, интегральные оценки и частотные
критерии качества.
1. Корневые методы. В общем случае уравнение переходного процесса имеет вид
n
y (t ) = k + ∑ ci e pit , (1.81)
i =1

где pi – корни характеристического уравнения; ci – постоянные интегрирования; k = y(∞).


Так как корни pi входят в уравнение (1.81), то о характере переходного процесса
можно судить по их расположению на комплексной плоскости. В частности, для устойчи-
вой системы эти корни лежат слева от оси (рис.1.51, а). Наиболее медленно затухают те
составляющие y(t), которые имеют наибольшую постоянную времени Ti, т.е. корень с наи-
меньшей вещественной частью по абсолютной величине, например pmin = ⏐p1⏐. Чем
дальше от мнимой оси расположены корни характеристического уравнения, тем дальше от
границы устойчивости находится система и тем выше ее быстродействие. Для оценки бы-
стродействия используют понятие степени устойчивости системы, под которым пони-
мают расстояние от мнимой оси до ближайшего корня.
Величина pmin может служить для оценки скорости затухания переходного процес-
са, так как составляющая переходного процесса, обусловленная этим корнем, затухает
медленнее других. Тогда можно записать:

y(t) ≈ k(1− e− pmint ) .


Всеми остальными составляющими переходного процесса можно пренебречь, так
как они затухают быстрее.
Положив зону нечувствительности δ = 0,05y∞ = 0,05k, можно найти время регули-
− pmin t p − pmint p
рования tp (рис.1.51, б). Имеем 0,95k = k (1 − e ) или 0,05 = e . Откуда

1 1
tp = ln ≈ 3Tmax ,
pmin 0,05

В общем случае t p = Tmax ln(1 / δ ) , где Tmax =1/ pmin.

286
Наличие комплексных сопряженных корней характеристического уравнения pk =
= - αk ± jωk свидетельствует о существовании колебательной составляющей в уравнении
движения системы (рис.1.51, в):

yk (t ) = A e−α k t sin(ωk t + ϕ) .
В этом случае для оценки скорости затухания колебательного процесса используют
логарифмический декремент*) затухания d:

y1 max A e −α k t1 sin(ωk t1 + ϕ)
d = ln = ln = ln e α k Tk = α k Tk .
y2 max A e − α k (t1 + Tk ) sin(ωk t1 + ωk Tk + ϕ)

Здесь учтено, что ωkTk=2π.


ω ω
Введем обозначение μ = α k , тогда можно записать d = μk ⋅ T = 2π . Таким обра-
k k μ
зом, чем меньше μ, тем больше d, и, следовательно, тем скорее затухает переходный про-
цесс. При ωk = 0 получим μ = 0, d = ∞, и, следовательно, колебания отсутствуют; при
αk = 0 имеем μ = ∞, d = 0, и, следовательно, колебания не затухают.
2. Интегральные оценки. Они имеют целью дать общую оценку скорости затуха-
ния и величины отклонения управляемой координаты от заданного значения без опреде-
ления того или другого в отдельности.
Простейшей интегральной оценкой может служить площадь между новым значе-
нием выходной величины y∞ и его текущим значением y(t)

I1 = ∫ Δ(t )dt . (1.82)
0

При этом Δ(t) = y∞ – y(t) является текущей динамической ошибкой системы (рис.1.52, а).
Для вычисления интеграла (1.82) можно воспользоваться преобразованием Лапласа

для ошибки системы. Имеем L{Δ (t )} = = Δ( p) = ∫ Δ(t ) e − pt dt , откуда
0


lim Δ( p) = ∫ Δ(t )dt = I1 . (1.83)
p →0 0

*)
Декремент – лат. уменьшение, убавление.

287
В нашем случае при y*(t) = 1(t); Y * ( p) = 1/ p имеем

y∞
Δ( p) = L{y∞ − y(t )} = − Y ( p) .
p
Учтя, что Y(p) = W(p)Y *(p)=W(p)/р и y∞ = lim pY ( p) = W (0) , получим
p →0

Δ( p) = (W (0) − W ( p)) / p , а затем, воспользовавшись (1.83), найдем I1.

Недостаток интегральной оценки вида (1.82) состоит в том, что она годится только
для монотонных процессов (рис.1.52, б). Если же имеют место колебания (рис.1.52, в), то
алгебраическое сложение площадей может привести к ситуации, когда при больших коле-
баниях I1 = min.
В целях устранения этого недостатка на практике чаще всего применяют квадра-
тичный интегральный критерий вида

I 2 = ∫ Δ2 (t )dt . (1.84)
0

Этот критерий не зависит от знака Δ(t) и, следовательно, может быть применен как
для монотонных, так и
для колебательных про-
цессов.
Критерии I1 и I2 яв-
ляются функциями пара-
метров системы, изменяя
которые можно миними-
зировать интегральные оценки.
Существуют методы, позволяющие вычислить критерий I2, не решая ДУ системы.

В частности, учитывая, что ⏐Δ(jω)⏐2 = Δ(jω)Δ(–jω) и Δ( jω) = ∫ Δ(t) e− jωt dt , и проинтегриро-
−∞

вав ⏐Δ(jω)⏐2 по ω, получим


∞ ∞ ∞ ∞ ∞ ∞
1 1 1
∫ ∫ Δ(− jω )dω ∫ Δ (t ) e dt = ∫ Δ (t ) dt ∫ Δ ( jΩ ) e d Ω = ∫Δ
2 − jω t
Δ ( jω ) d ω = jΩ t 2
(t ) dt = I 2 .
2π −∞
2π −∞ −∞ −∞
2π −∞ −∞

Здесь Δ( jω) = Δ( p) p= jω = (W(0) −W( jω)) /( jω) .

Поскольку частотная функция системы W(jω) зависит от параметров системы (ко-


эффициентов усиления ki и постоянных времени Tj линейных динамических звеньев),
можно записать I 2 = f (ki , T j ) . Исследуя полученную зависимость на экстремум, можно

найти значения изменяемых параметров ki и Tj, при которых удовлетворяется условие


I2 = min.

288
Заметим, что минимизация интегральной квадратичной ошибки вида (1.84) приво-
дит к большим перерегулированиям переходного процесса (до 20 % от установившегося
значения y∞). В связи с этим применяют интегральные критерии, учитывающие не только
величину ошибки, но и скорость ее изменения

I 3 = ∫ [ Δ2 (t ) + γ 2 Δ& 2 (t )] dt ,
−∞
(1.85)
где γ – весовой коэффициент, который определяет значимость второго слагаемого подын-
тегральной функции.
В данном случае помимо ограничения на величину ошибки Δ(t) налагается ограни-
чение на скорость ее изменения Δ& (t ) . В результате чего мы получаем достаточно быстрые
и плавные переходные процессы.
Иногда кроме указанных ограничений учитывают и ограничение на ускорение. То-
гда интегральный критерий принимает вид

I 4 = ∫ [Δ2 (t ) + γ12 Δ& 2 (t ) + γ 22 Δ
&&2 (t )]dt .
−∞
(1.86)
Подчеркнем, что все рассмотренные интегральные оценки являются функцией па-
раметров системы, следовательно, их можно минимизировать, изменяя параметры систе-
мы и прежде всего устройства управления.
3. Частотные критерии качества. Эти критерии базируются на некоторых свой-
ствах частотной функции и, в силу ее связи с временными характеристиками (см.п.1.5),
позволяют судить о качестве переходного процесса. Например, оценка качества этого
процесса по АФЧХ разомкнутой системы производится следующим образом. Пусть
структурная схема системы имеет вид, показанный на рис.1.53, а. Тогда частотная функ-
ция разомкнутой системы
n =3
Wp ( jω) = ∏ Wi ( jω) , где Wi ( jω) = ki /(Ti jω +1)
i =1

Годограф вектора Wp(jω) для устойчивой системы представлен на 1.53, б, где вели-
чина p1 характеризует запас устойчивости замкнутой системы по модулю, а
μ1 = 2π −ψ1 (ωc ) - запас устойчивости по фазе; ωс – частота среза, при которой
⏐W(jωc)⏐=1. В хорошо демпфированных системах (при σ < 5 %) p1 = 0,1÷0,5; μ1 ≥ 30÷60 о.

289
Оценка качества
переходного процесса
может быть также про-
изведена по АЧХ замк-
нутой системы
(рис.1.53, в). Макси-
мальное значение АЧХ
– Mmax, соответствую-
щее резонансной (собственной) частоте ωp, может служить показателем колебательности.
Чем больше Mmax, тем выше склонность системы к колебаниям. В хорошо демпфирован-
ных системах Mmax ≤ 1,1÷1,5. Частота, при которой A(ωc)/A(0) = 1, определяет частоту
среза ωс, которая характеризует полосу пропускания частот. Чем шире полоса пропуска-
ния частот, т.е. чем больше ωс, тем быстрее протекают переходные процессы, поэтому эта
частота может служить мерой быстродействия системы.
Существуют и другие методы оценки качества переходных процессов в системе по
ее частотным характеристикам.*) Например, учитывая, что для минимально-фазовых сис-
тем существует однозначная связь между переходной функцией h(t) и вещественной час-
тотной характеристикой P(ω), можно, анализируя последнюю, получить ряд оценок каче-
ства переходного процесса. В частности, если P(ω) представляет собой положительную
невозрастающую функцию, то перерегулирование σ не превышает 18 %, если dP(ω) / dω
отрицательная, убывающая по модулю, непрерывная функция, то имеет место монотон-
ный переходный процесс.

*)
Более подробно этот вопрос рассмотрен в п.4.6.

290
4. МЕТОДЫ СИНТЕЗА АСУ

Под синтезом АСУ понимают процедуру создания системы управления объектом,


обладающей требуемыми свойствами. Задача синтеза обычно решается исходя из сле-
дующих посылок: в любой АСУ можно выделить неизменяемую и изменяемую части (на-
пример, объект управления ОУ и устройство управления УУ). Следовательно, для полу-
чения системы с заданными свойствами необходимо определить структуру и параметры
изменяемой части системы, иными словами, определить зависимость, связывающую
входные и выходные сигналы изменяемой части системы. Эти зависимости называются
законами управления или регулирования.

4.1. ЗАКОНЫ РЕГУЛИРОВАНИЯ В ЛИНЕЙНЫХ АСУ

Пусть дана АСУ, структурная схема которой представлена на рис.1.54. В данном


случае изменяемая часть системы УУ формирует управляющее воздействие u(t) в зависи-
мости от величины ошибки: Δ(t) = y*(t) – y(t).

f Зависимость, связывающая u и Δ, т.е.


y* Δ
Wу(p)
u
Wo(p)
y u(t) = F{Δ(t)}, называется законом регулирова-

УУ ОУ
ния.
В некоторых случаях в устройство
Рис.1.54
управления может подаваться информация о
возмущающих воздействиях f(t) (рис.1.54, пунктирная линия). Тогда закон регулирования
примет вид

u(t) = F{Δ(t), f(t)}.

Рассмотрим линейные законы регулирования, при которых устройства управления


вырабатывают величину u(t) в функции ошибки Δ(t) в соответствии со следующим соот-
ношением:
t dΔ (t )
u (t ) = k1Δ (t ) + k 2 ∫ Δ (t )dt + k3 . (1.87)
0 dt

где ki - коэффициенты пропорциональности (передачи).

1. Пропорциональный закон регулирования (П-регулятор).


В данном случае управляющее воздействие u cвязано с ошибкой Δ пропорциональ-
ной зависимостью

291
u(t) = k1Δ(t), и Wу(p) =Wп(р)= k1 , (1.88)
где Wп(р) – передаточная функция пропорционального регулятора.
Если Wo(p) = ko, то передаточная функция замкнутой системы по ошибке
1 1
W ( p) = = ,
y *Δ 1 + Wp ( p) 1 + ko k1

а установившаяся ошибка Δ(∞) при подаче на вход системы со стороны задающего воз-

действия ступенчатой функции у ∗ (t ) = A ⋅ 1(t ) составит

A .
Δ(∞) = lim pΔ( p ) = lim pW y *Δ ( p )Y * ( p ) =
p →0 *
Y ( p) =
A p →0 1 + k o k1
p

Таким образом, статическая ошибка Δ(∞) в рассматриваемой системе пропорцио-


нальна задающему воздействию у ∗ (t ) = A и обратно пропорциональна коэффициенту
усиления в разомкнутой системы kp = kok1. При этом Δ(∞) ≠ 0, и следовательно рассматри-
ваемая система относится к классу статических.
Поскольку управляющее устройство реализуется с помощью усилительного (безы-
нерционного) звена, система обладает относительно высоким быстродействием. Если по-
лученные характеристики системы удовлетворяют технологическим требованиям, то за-
дача синтеза решена.
2. Интегральный закон регулирования (И-регулятор).
Здесь управляющее воздействие формируется пропорциональным интегралу от
ошибки
t
u (t ) = k2 ∫ Δ (t ) dt , (1.89)
0

При этом передаточная функция устройства управления (интегрального регулятора):


Wу ( p) = WИ ( p) = k2 / p .

Передаточная функция замкнутой системы по ошибке при Wo ( p) = k o ,будет

1 p .
Wy * Δ ( p ) = =
1 + k о k 2 / p p + kо k 2

Ap
Тогда при y*(t) = A⋅1(t) получим Δ(∞) = lim *)
=0 .
p →0 p + kо k2

Таким образом, рассмотренная система обладает высокой точностью в установив-


шемся режиме и относится к классу астатических. При реализации И-регулятора увеличи-

*) B( p)
Заметим, что полученный результат справедлив и при Wo = , где В(р) и А(р) полиномы m-ой и n-ой сте-
A( p )
пени соответственно, при чем n ≥ m .

292
вается склонность системы к колебаниям, что обусловлено снижением быстродействия
регулятора, т.к. после нанесения возмущения в начальный период времени значение инте-
грала мало.
Заметим, что система, астатическая по задающему воздействию y*, может оказаться
статической по возмущению f. Например, при Wof ( p) =−kf / p и f(t) = B⋅1(t) получим:

kf
Wf Δ = и Δ f (∞) = Bk f /(kоk2 ) , т.е. имеет место статическая ошибка по возмущению.
p + ko k 2
3. Пропорционально-интегральный закон регулирования (ПИ-регулятор).
Когда желательно сочетать в установившемся режиме высокую точность интегрального
регулятора с большим быстродействием в переходном режиме пропорционального регулятора,
сигнал управления формируют в соответствии с выражением
t
u (t ) = k1Δ(t ) + k2 ∫ Δ(t )dt . (1.90)
0

k 2 k1 p + k 2
При этом Wу ( p) = WПИ ( р) = k1 + = , а передаточная функция по ошибке при
p p
W0(p)=k0 имеет вид:
p
Wy*Δ ( p) = .
p + ko (k1 p + k2 )

Как и в предыдущем случае Δ(∞) = 0, т.е. система относится к классу астатических.


В то же время эта система обладает достаточно большим быстродействием, так как на на-
а чальном этапе управления она работает как П-
y* Δ УУ u y регулятор. В дальнейшем с течением времени преоб-
Wo(p)
k2 /p ОУ ладающее влияние оказывает интегральная часть и
система полностью устраняет ошибку.
б Заметим, что введение интегрирующего звена
+j
k2
−j Wo ( jω) уменьшает запас устойчивости системы, в связи с чем
ω
ω=0 + увеличивается склонность ее к колебаниям. Действи-
–1; j0 Wo(jω)
тельно, представим систему с ПИ-регулятором в виде,
Wp (jω) показанном на рис.1.55,а. Передаточная Wp(p) и час-
тотная Wp(j ω ) функции разомкнутой системы соответ-
Рис.1.55 ственно равны
⎛ k ⎞
W p ( p ) = W0 ( p )W у ( p ) = W0 ( p )⎜⎜1 + 2 ⎟⎟;
⎝ p⎠
⎛ k ⎞
W p ( jω ) = W0 ( jω )⎜1 − j 2 ⎟.
⎝ ω⎠

293
Таким образом, Wp(jω) состоит из двух слагаемых, второе из которых
[− j(k2 / ω)Wo ( jω)] поворачивает вектор Wp(jω) по часовой стрелке, приближая его годограф
к точке (–1; j0) и, следовательно, запас устойчивости системы уменьшается как по моду-
лю, так и по фазе (рис.1.55, б).
Подчеркнем, что введение интегрирующего звена в прямую цепь управления дела-
ет систему астатической по заданному возмущению y*, но увеличивает склонность ее к
колебаниям.
4. Пропорционально-дифференциальный закон (ПД-регулятор). Управление по
производной не имеет самостоятельного значения, так как в установившемся состоянии
производная ошибки равна нулю и регулирование прекращается.*) Однако введение про-
изводной играет существенную роль в динамических режимах, поскольку позволяет учи-
тывать не только наличие ошибки, но и тенденцию к ее изменению. Имеем:

dΔ(t )
u (t ) = k1Δ(t ) + k3 . (1.91)
dt
При этом Wу ( p) = WПД ( р) = k1 + k 3 p , а передаточная функция по ошибке при W0(p)=k0

1
имеет вид W ( p) = . В этом случае Δ(∞) ≠ 0, т.е. система относится к классу
y*Δ 1 + k o (k1 + k 3 p)

статических.
Введение в закон регулирования производной позволяет сформировать управляю-
щее воздействие даже при отсутствии ошибки на входе регулятора, что увеличивает быст-
родействие системы. Кроме того, введение производной подавляет колебания в системе и
ускоряет протекание переходных процессов, т.е.
улучшает качество переходного процесса.
Убедимся в сказанном, проанализировав час-
тотные характеристики системы, структурная схема
которой представлена на рис.1.56,а. Имеем
Wp(jω) = Wo(jω)[1 + jk3ω]. Следовательно, как и в
случае ПИ-регулятора, частотная функция Wp(jω)
состоит из двух слагаемых, но при этом второе
слагаемое поворачивает вектор Wp(jω) против ча-
совой стрелки, удаляя годограф этого вектора от
точки (–1; j0) и тем самым увеличивая запас ус-

*)
В связи с этим обратную связь по производной часто называют «гибкой», в отличии от жесткой обратной
связи, при которой существует функциональная зависимость u = f (Δ ) , в частности, в случае применения П-регулятора
u = k1Δ .

294
тойчивости системы (рис.1.56, б).
5. Пропорционально-интегрально-дифференциальный закон (ПИД-регулятор).
Здесь закон управления (1.87) реализуется в полном объеме. При этом передаточная
функция устройства управления запишется в виде:
k2
Wу ( p) = W ПИД ( р) = k1 + + k3 p . (1.92)
p

Введение в закон регулирования интегральной части приводит к тому, что установившаяся


ошибка в системе равна нулю, и, следовательно, система относится к классу астатических.
Поскольку вначале переходного процесса ПИ-регулятор ведет себя как П-
регулятор, введение производной для этого периода улучшает качество переходного
процесса (аналогично ПД-регулятору). В дальнейшем, по мере затухания переходного
процесса, роль производной падает и основную роль начинает играть интегральная со-
ставляющая (как в ПИ-регуляторе).
Подчеркнем, что при введении производной в закон регулирования необходимо
обязательно учитывать спектральный состав различных помех f(t), действующих в систе-
ме (см. п.10.4.1.). В частности, если предположить, что f(t) = a1sin ω1t (где ω1 – высокая
частота), то f ′ (t) = a1ω1cos ω1t и, следовательно, амплитуда производной увеличивается
в ω1 раз, что существенно снижает помехоустойчивость системы и может привести к
ухудшению качества ее работы.

4.2. КОРРЕКЦИЯ ЛИНЕЙНЫХ АСУ

Коррекция АСУ осуществляется введением в нее корректирующих звеньев для


обеспечения требуемого качества процессов управления объектом.
Существует несколько видов коррекции.
1. Последовательная коррекция (рис.1.57). Пусть x y
W ( p) Wk1 ( p )
c
передаточная функция скорректированной (желаемой)
системы задана и равна Wск(p). Передаточная функция не- Рис.1.57

изменяемой части системы равна Wc(p). В этом случае корректирующее звено с переда-
точной функцией Wk1 ( p) включается последовательно с неизменной частью системы

и определяется известными Wc(p) и Wск(p):


Wск ( p ) = Wc ( p)Wk1 ( p) , (1.93)

откуда
Wск ( p )
Wk1 ( p ) = .
Wc ( p )

295
W ( p)
2. Параллельная коррекция (рис.1.58). В этом случае x
c
y
корректирующее звено включается параллельно с неизменной
Wk2 ( p )
частью системы. Тогда можно записать
Рис.1.58
Wск ( p ) = Wc ( p) + Wk 2 ( p) , (1.94)

откуда
Wk 2 ( p) = Wск ( p ) − Wc ( p) .

3. Коррекция с помощью обратной связи. В


а
x y этом случае корректирующее звено может быть включе-
W ( p)
c
но как в цепь обратной связи (рис.1.59,а), так и в глав-
Wk3 ( p )
ную (прямую) цепь последовательно с неизменяемой
б
частью системы(рис.1.59,б) .
x y
Wk4 ( p ) W ( p) При включении в цепь обратной связи (встречно-
c
1 параллельной коррекции) имеем

Рис.1.59 Wс ( p)
Wск ( p) = , (1.95)
1 + Wc ( p)Wk3 ( p)

откуда
Wc ( p) − Wск ( p )
Wk 3 ( p ) = .
Wc ( p)Wcк ( p)

При включении в прямую цепь при единичной обратной связи имеем


Wс ( p)Wk4 ( p)
Wск ( p) = , (1.96)
1 + Wc ( p)Wk4 ( p)

откуда
Wск ( p)
Wk4 ( p) = .
Wc ( p)[1 − Wcк ( p)]
Использование того или иного вида коррекции в основном определяется удобством
технической реализации, поскольку в линейных системах их динамические свойства могут
быть в принципе одинаковыми при любых типах корректирующих устройств.
Для получения формул перехода от корректирующих устройств одного типа к дру-
гому при одинаковых Wск(p) необходимо приравнять правые части соответствующих
уравнений. Например, приравняв правые части уравнений (1.93) и (1.95):

Wс ( p ) 1 − Wk1 ( p )
Wс ( p )Wk1 ( p ) = , найдем Wk3 ( p ) = .
1 + Wc ( p )Wk3 ( p ) Wc ( p )Wk1 ( p )

Полученное соотношение связывает передаточные функции корректирующих


звеньев при последовательной и встречно-параллельной коррекциях.

296
Пример 1.21. Пусть необходимо синтезировать линейные ПД- и ПИ-регуляторы,
используя корректирующие звенья.
Решение: ПД-регулятор можно реализовать на базе П-
Δ u

регулятора с передаточной функцией Wп(p) = = Wc(p) = kу при
помощи охвата усилителя отрицательной обратной связью в ви-
ka
де апериодического звена первого порядка с передаточной Ta p + 1

функцией Wa(p)=ka/(Tap+1) (рис.1.60). Тогда передаточная


Рис.1.60
функция замкнутой системы запишется в виде
kу k у (Ta p + 1)
WΔu ( p) = = .
1 + k у ka /(Ta p + 1) Ta p + (1 + k у ka )

При достаточно большом коэффициенте усиления (kу >> 1), величинами Ta / k у и

Ta p + 1 1 Ta
1 / k у , можно пренебречь. Тогда WΔ u ( p ) ≈ = + p = k1 + k 3 p = W ПД ( р ).
ka ka ka

Для реализации ПИ-регулятора введем положительную обратную связь (ka<0). То-


гда получим:

kу k у (Ta p + 1) при kу 1 k
WΔu ( p) = = = = kу + = k1 + 2 = WПИ ( р) .
1 − k у ka /(Ta p + 1) Ta p + (1 − k у ka ) k у ka = 1 Ta p p

Таким образом, система, структурная схема которой представлена на рис1.60 мо-


жет при определенных значениях параметров динамических звеньев реализовать как ПД-
так и ПИ-законы регулирования

4. Системы подчиненного управления. Пусть объект управления представлен в


виде последовательно включенных инерционных звеньев, выходные координаты которых
могут быть измерены. Тогда каждым из этих звеньев можно управлять автономно, что
дает ряд преимуществ: независимость настройки контуров и возможность достижения вы-
сокого быстродействия.
Рассмотрим многоконтурную систему с n контурами, каждый из которых предназначен для
управления i-ой выходной координатой объекта yi (рис1.61). Поскольку во внутренние кон-
туры управления задание ui подается из внешних контуров, все они являются последо-
вательно подчиненными, за исключение последнего, который называется главным.
Именно поэтому рассматриваемые системы и получили название – системы подчиненного
управления (СПУ). Они были предложены Кесслером и являются разновидностью
коррекции с помощью обратной связи с корректирующим звеном, включенным в прямую
цепь.

297
В качестве кри-
териев качества пере-
ходного процесса Кесс-
лер предложил исполь-
зовать величину перере-
гулирования σ max и
время регулирования tp,
которые желательно
минимизировать. Поскольку эти критерии противоречивы, более корректной будет сле-
дующая формулировка цели управления: достижение максимального быстродействия, т.е.
tp = min, при перерегулировании, не превышающем заданного значения (обычно
σ max ≤ 5 %). Синтез системы, реализующей поставленную цель, производится поконтурно,
начиная с внутреннего контура. Рассмотрим процедуру синтеза на конкретном примере.
Пример 1.22. Определить передаточную функцию устройства управления при
заданной передаточной функции объекта управления, которая бы удовлетворяла сформу-
лированному выше критерию.
УУ ОУ
Структурная схема внутреннего y1
u1 Δ 1 1 k o1
Wу1(p) Tμ 1 p + 1 Tμ 2 p + 1 T o1 p + 1
контура системы имеет вид, пока-
занный на рис.1.62. Здесь объект
управления ОУ представлен тремя
Рис.1.62
последовательно включенными
звеньями, причем предполагается, что звенья, характеризуемые постоянными времени
Tμ1 , Tμ 2 – малоинерционные по сравнению со звеном, характеризуемым постоянной вре-

мени To1 , т.е. ∑ Tμi = Tμ << To1 .


i =1

Решение. При выполнении условия Т μ1 ⋅ Т μ 2 << Т μ1 + Т μ 2 , звенья с малыми постоян-

ными времени можно заменить эквивалентным звеном:


1 1 1 1 .
= ≈
T μ 1 p + 1 T μ 2 p + 1 T μ 1 T μ 2 p + (T μ 1 + T μ 2 ) p + 1 T μ p + 1
2

Тогда Wo1(p) примет вид

ko1
Wo1 ( p ) = . (1.97)
(Tμ p + 1)(Tо1 p + 1)

Структура устройства управления УУ, а следовательно, и вид передаточной функ-


ции Wy1(p) выбирается из следующих соображений:
298
1) установившаяся ошибка в системе должна быть равна нулю, т.е. система должна
быть астатической, следовательно, в структуре управляющей системы должна содержать-
ся интегральная составляющая;
2) для реализации цели управления (достижения максимального быстродействия
при σ max <5%) желательно скомпенсировать большую постоянную времени To1 .

Сформулированным требованиям отвечает ПИ-регулятор, передаточную функцию


которого можно представить в виде:

k2 k
Wу1 ( p ) = k1 + = u (Tu p + 1) ,
p Tu p

ku
где k1=ku; k 2 = .
Tu

Запишем передаточную функцию разомкнутой системы

ku ko1
Wp ( p) = Wу1 ( p)Wo1 ( p) = (Tu p + 1) .
Tu p (Tμ p + 1)(To1 p + 1)

Если принять Тu= To1 , то большая постоянная времени объекта управления To1 будет

скомпенсирована и передаточная функция замкнутой системы по каналу u1→y1 примет


вид:

Wp ( p) ko1 ku 1
Wu1 y1 ( p) = = = .
1 + Wp ( p) TuTμ p + Tu p + ko1 ku
2
(TuTμ / ko1 ku ) p + Tu /(ko1 ku ) p + 1
2

TuTμ Tu
Обозначим = T 2; = 2ξT , тогда
ko1 ku ko1 ku

1
Wu1 y1 ( p) = .
T p + 2ξTp +1
2 2

Таким образом, замкнутая система описывается линейным ДУ второго порядка, а


вид переходной функции h(t) системы зависит от величины коэффициента демпфирования
ξ.
Учитывая принятые соотношения между параметрами системы и коэффициентами
ξ и Т, получим:

Tu Tμ Tu 1 Tu
T= ;ξ= = . (1.98)
k o1 k u 2Tk o1 ku 2 k o1 kuTμ

299
Известно, что при ξ = 2 / 2 = 0,707 максимальное перерегулирование
σ max = 4,3 < 5 %, что соответствует, требованиям к качеству переходного процесса в сис-

теме. Подставив числовое значения ξ = 2 2 (1.98) и учитывая, что Tu = To1 , найдем зна-

чение ku, оптимальное, в смысле достижения цели управления:

Tu To1
ku = = . (1.99)
4ko1Tμξ 2
2ko1Tμ

При этом передаточная функция оптимального устройства управления:


ku 1
Wу1 ( p) = ku + ⋅ , (1.100)
To1 p

где ku – коэффициент передачи пропорциональной части ПИ-регулятора, определяемый в


соответствии с (1.99) параметрами объекта управления;
Статическую ошибку системы можно определить, воспользовавшись теоремой о
конечном значении (1.80) при u(t)=1(t).

Δ(∞) = lim pΔ( p) = limWu1Δ ( p) = 0 ,


p →0 p →0

1 (Tμ p + 1)To1 p
где Wu1Δ ( p) = = - передаточная функция замкнутой системы по
1 + Wp ( p) (Tμ p + 1)Tu p + 1

каналу u1 → Δ .
Таким образом, синтезированная система управления выходной величиной объекта
управления y1 , относится к классу астатических и отвечает всем требованиям сформули-
рованным выше.
Аналогично рассчитывают остальные контуры системы, причем внутренние конту-
ры принимают в качестве объекта управления.

***

В общем случае при синтезе систем подчиненного управления нужно руководство-


ваться следующими правилами.
1. Каждому звену объекта управления с большой постоянной времени должно со-
ответствовать звено с обратной передаточной функцией и такой же постоянной времени в
составе управляющего устройства.
2. Значения коэффициентов пропорциональности при пропорциональной и инте-
гральной частях должны быть выбраны в соответствии с соотношениями (1.99),(1.100).

300
Заметим, что если в составе объекта управления имеется интегрирующее звено, то
передаточная функция устройства управления для реализации поставленных целей долж-
на содержать только пропорциональную часть, т.е. Wу1(p) = k1, где k1 определяется выра-
жением (1.99).

4.3 ПАРАМЕТРИЧЕСКИЙ СИНТЕЗ УСТРОЙСТВ УПРАВЛЕНИЯ

Весьма часто приходится решать задачи выбора оптимальных параметров изме-


няемой части системы (устройства управления) в смысле экстремизации принятого крите-
рия оценки качества процесса управления. В частности, широкое применение получили
относительно простые пропорционально-интегральные регуляторы, во многих случаях
обеспечивающие удовлетворительное качество работы объекта управления. Типовая
структурная схема такой системы представлена
на рис. 1.63. Пусть объект управления описыва-
ется звеном второго порядка с передаточной
функцией
ko
Wo ( p) =
T p + 2ξ To p + 1
o
2 2

Передаточная функция устройства управления реализующего ПИ-закон регулиро-


вания может быть представлена в виде

Wу ( p ) = (Ty p + 1) ,
Ty p

где ky, Ty – искомые параметры ПИ-регулятора.

Тогда, передаточная функция замкнутой системы по каналу f → Δ (возмущающее


воздействие - ошибка) будет

Wo ( p ) Ty k o p
W f Δ ( p) = = .
1 + Wo ( p )W y ( p ) TyTo2 p 3 + 2TyToξ p 2 + Tp (1 + k y ko ) p + k y ko

При этом изображение ошибки по Лапласу при подаче на вход ступенчатого воз-
мущения f(t)= 1(t) можно записать в виде:

c2 p 2 + c1 p + c0 C ( p)
Δ ( p ) = W fΔ ( p ) F ( p ) = = ,
d 3 p + d 2 p + d1 p + d 0 D ( p )
3 2

(1.101)

301
где С(р), D(р) – алгебраические полиномы m-ой и n-ой степени соответственно (m=2, n=3);
ci, dj – коэффициенты полиномов: с0=Тy k0; с1=с2= 0; d0=kykо; d1=Тy(1+kyk0); d2=2ТyТ0ξ; d3=
ТyТо2.

В качестве критерия оценки качества функционирования системы примем инте-


гральный квадратичный критерий I2, определяемый выражением (1.84). Учтя что
∞ +∞
1
I 2 = ∫ Δ (t )dt = ∫
2
2
Δ ( jω ) dω , (п.3.2.2), для нашего случая можно записать
0
2π −∞

∞ +∞
1 C ( jω ) ⋅ C ( − jω )
I 2 = ∫ Δ dt =
2
∫ D ( j ω ) ⋅ D ( − j ω ) dω .
0
2π −∞

Подобные интегралы табулированы и при D( jω ) третьего порядка имеем:

c22 d 0 d1 + (c12 − 2c0 c2 )d 0 d 3 + c02 d 2 d 3


I2 = .
2 d 0 d 3 ( d1 d 2 − d 0 d 3 )

Подставив в полученные выражения значения коэффициентов полиномов ci и di ,


окончательно получим

koTy2ξ
I2 = = ϕ ( K y , Ty ) (1.102)
k y [2Tyξ (1 + k y ko ) p − To k y ko ]

Найденная зависимость интегральной оценки I 2 от изменяемых параметров систе-


мы в принципе позволяет исследовать его на экстремум-минимум, например, классиче-
ским способом: взяв частные производные от I 2 по параметрам ky и Ty и приравняв их ну-
лю. Решив полученную систему уравнений относительно неизвестных параметров уст-
ройства управления, найдем их оптимальные значения( k *y , Ty* ) минимизирующие I 2

Как показали результаты расчетов, поверхность I 2 = ϕ (k y , Ty ) не имеет четко выра-

женного экстремума и, следовательно, задача нахождения I 2 = min практически не имеет


однозначного решения. В связи с этим для определения конкретных значений параметров
регулятора ky и Ty, удовлетворяющих условию I 2 = min , применяются те или иные инже-
нерные методы суть которых состоит в том, что значением одного из параметров регуля-
тора задаются, а затем, исследуя зависимость I 2 как функцию второго параметра опреде-
ляют его оптимальное значение. В частности, искомые параметры можно определить,
∂I 2
воспользовавшись следующим приемом. Возьмем частную производную , где I 2 оп-
∂T y

302
ределяется выражением (1.102), и , приравняв к нулю, найдем зависимость Ty = f (k y ) .

Окончательно получим

k y koTo
Ty* =
ξ (1 + k y ko )

Из приведенного выражения вытекает, что при k y ⋅ ko >> 1 , единицей, стоящей в

знаменателе, можно пренебречь, и тогда T y* ≈ To ξ , т.е. значение параметра управляющего

устройства Ty* при определенных условиях практически не зависит от коэффициента пе-

редачи пропорциональной части регулятора ky. В связи с этим возникла возможность ав-
тономного определения k y = k *y . Заметим, что из полученного соотношения, определяю-

щего квазиоптимальное значение Ty* , следует, что чем меньше величина коэффициента

демпфирования ξ , т.е. чем больше склонность системы к колебаниям, тем меньше должен
быть коэффициент передачи интегральной части регулятора, уменьшая эту склонность.

Пример 1.23 Пусть параметры объекта управления в системе, представленной на


рис.1.63 имеют следующие числовые значения To=2.0 с; ξ=0.5; ko=1.2 . Требуется опреде-
лить оптимальные в смысле I 2 = min параметры устройства управления ky и Ty.

Решение. Воспользовавшись соотношением Ty* = To ξ , найдем оптимальное значе-

ние параметра Ty* = 2.0 0.5 = 4 с. Подставив числовые значения параметров объекта

управления (To, ξ, ko) и регулятора Ty* в (1,102) окончательно получим

19.2
I2 I2 =
4k y − 2.4k y2

Зависимость I 2 = f (k y ) представлена на

рис. 1.64. Ее анализ показывает, что при значениях


k y >8 интеграл I 2 становиться близок к нулю, и

дальнейшее увеличение коэффициента передачи


Ky
Рис.1.64 регулятора нецелесообразно. Приняв ky = 8 и

1
воспользовавшись (1.101) при F ( p) = , получим
p

4.8
Δ( p) = .
16 p + 8 p + 47.2 p + 10.8
3 2

303

Рис.1.65
Взяв от Δ( p ) обратное преобразование Лапласа, найдем переходную функцию
по каналу f → Δ , график которой представлен на рис. 1.65.

4.4 ИНВАРИАНТНЫЕ СИСТЕМЫ

В теории автоматического управления под инвариантными*) понимают системы, в


которых выходная величина инвариантна к внешним воздействиям, т.е. после окончания
переходного процесса ошибка системы не зависит от этих воздействий. Примером инва-
риантной системы может служить мостовая схема, применяемая в системах измерения
(рис.1.66). Здесь при условии соблюдении уравнения баланса R1R2 = R3 R4 ток i в одной из
диагоналей моста не зависит от напряжения U, подводимого к другой диагонали.
Для достижения полной инвариантности некоторой
R1 R3 i
координаты yj(t) относительно значения возмущающего
U А
воздействия fi(t) необходимо и достаточно, чтобы переда-
R2
R4 точная функция Wfy(p) между внешним воздействием fi(t) и
выходной величиной объекта yj(t) была тождественно рав-
Рис.1.66
на нулю при отсутствии прочих воздействий и при нуле-
вых начальных условиях. При ненулевых начальных условиях ставится цель сделать тож-
дественно равной нулю вынужденную составляющую решения дифференциального урав-
нения системы. При этом свободная составляющая, обуслов- f y
Wо(р)
ленная ненулевыми начальными условиями, может быть от-
личной от нулевого значения. Wи(р)

Рассмотрим систему управления с обратной связью, y1


Δ y*
Wос(р)
структурная схема которой представлена на рис.1.67. Имеем
Рис.1.67
Y ( p) = W fy ( p) F ( p) ,

*)
Инвариант (неизменяющийся – фр.) – выражение, остающееся неизменным при определенном преобразова-
нии входящих в него переменных.

304
Wo ( p )
где W fy ( p ) = - передаточная функция замкнутой системы по каналу
1 + Wo ( p)Woc ( p)Wи ( p )

внешнее воздействие f – выходная величина объекта у; Wo ( p) , Wи ( p) , Woc ( p) – передаточ-


ные функции объекта управления, измерительного элемента и обратной связи.
Поскольку Wo ( p) и Wи ( p) заданы, достигнуть абсолютной инвариантности можно
только при Woc ( p) → ∞ , т.е. при большом коэффициенте усиления в цепи обратной связи

kос, так как lim W fy ( p) =0. При этом передаточная функция по каналу y* → у может и не
k →∞ ос

быть равной нулю. Имеем:


Wo ( p)Woc ( p) 1 .
W y * y ( p) = ; тогда lim Wy* y ( p ) =
1 + Wo ( p)Woc ( p)Wи ( p) koc →∞ Wи ( p)

К такому результату и стремятся при синтезе абсолютно инвариантных систем, так


как необходимо достичь инвариантности выходной координаты и не потерять возможно-
сти управления объектом.
Для получения большого коэффициента усиления kос, можно применять внутреннюю по-
ложительную обратную связь. При этом

W1 ( p) B1 ( p ) A2 ( p )
Woc ( p) = = , (1.103)
1 − W1 ( p)W2 ( p) A1 ( p ) A2 ( p ) − B1 ( p ) B 2 ( p )

где W1(p)=В1(р)/А1(р), W2(p)=В2(р)/А2(р) – передаточные функции звеньев, являющихся


составными частями звена обратной связи (звено с передаточной функцией W1(p) охваче-
но положительной обратной связью с передаточной функцией W2(p)).
Условие инвариантности сводится к равенству нулю знаменателя выражения
(1.103):

A1 ( p ) A2 ( p ) − B1 ( p ) B2 ( p ) = 0 (1.104)

Заметим, что для выполнения условия инвариантности (1.104) требуются устройства, вы-
полняющие операцию идеального дифференцирования. Небольшая ошибка при этом может при-
вести к появлению в дифференциальном уравнении отрицательных членов и, следовательно, к по-
тере устойчивости. Такие системы, по определению академика Андронова, являются «негрубы-
ми». Таким образом, требования инвариантности и устойчивости противоречивы, и это противоре-
чие появляется вследствие того, что, приближаясь к абсолютно инвариантной, система может стать
«негрубой».
Можно показать, что необходимое условие физической реализуемости абсолютно
инвариантной системы заключается в том, чтобы характеристический полином разомкну-
той системы был не равен нулю, а передаточная функция корректирующего устройства

305
вводимого в систему для достижения условий абсолютной инвариантности имела степень
полинома числителя ниже степени полинома знаменателя.
Как уже отмечалось, для достижения инвариантности y j (t ) относительно f i (t ) не-

обходимо и достаточно, чтобы W fy ( p) = 0 . Этого можно добиться и в системах, исполь-

зующих принцип управления по возмущению, для чего W fy ( p ) нужно представить в виде

разности двух передаточных функций, одна из которых является корректирующей:


W fy ( p ) = Wo ( p ) − Wк ( p ) . Тогда критерий реализуемости абсолютно инвариантной системы

можно интерпретировать следующим образом: необходимым (но недостаточным) призна-


ком физической реализуемости и абсолютной инвариантности системы является наличие
в схеме по меньшей мере двух каналов передачи возмущающего воздействия между на-
чальным приложением возмущения и той точкой, относительно которой стремятся дос-
тичь инвариантности. Принцип двухканальности (дуальности) является основной идеей
при выборе рациональной структуры абсолютно инвариантных систем, но не заменяет ус-
ловий физической реализуемости.
В комбинированных системах управления выполнение условий инвариантности требует
также создания противодействия, равного по значению и противоположного по знаку возмущаю-
щему воздействию. Например, пусть име-
f
Wk ( p ) ем двухконтурную систему стабилизации,
изображенную на рис.1.68. Для удовлетворе-
Wo4 ( p)
ния условий инвариантности относительно
y* y
Wo1 ( p) Wo3 ( p) возмущения f требуется, чтобы передаточная

Wo2 ( p) функция объекта управления Wo4 ( p ) по ка-


ОУ
налу f → y была равна передаточной функ-
Woc ( p)
Рис.1.68
ции Wfy(p) по второму каналу f → y вклю-
чающему корректирующие звено с передаточной функцией Wk(p), но обратна по знаку, т.е. должно
выдерживаться соотношение:
Wo1 ( p )
Wo4 ( p ) − W fy ( p ) = Wo4 ( p ) − Wk ( p ) Wo3 ( p ) = 0 .
1 + Wo1 ( p )Wo2 ( p )

Откуда

Wk ( p ) =
[
Wo4 ( p ) 1 + Wo1 ( p )Wo2 ( p ) ].
Wo1 ( p )Wo3 ( p )

Здесь Woi ( p ) (i = 1, 4) – динамические звенья, входящие в структуру объекта управ-

ления. Если степень полинома числителя Wk ( p) меньше степени полинома знаменателя,

306
то корректирующее звено Wk ( p) физически реализуемо. Для компенсации неучтенных

возмущений в систему вводится обратная связь с передаточной функцией Woc ( p) . В отли-


чие от систем стабилизации, использующие только обратную связь по отклонению, сис-
темы, использующих также разомкнутую цепь управления по возмущению (комбиниро-
ванный принцип управления) не имеют противоречия между условиями устойчивости и
инвариантности.
Отметим, что инвариантность φ
Wk ( p)
системы по отношению к внешнему
u Δ y
неизменяющемуся воздействию W1 ( p ) W2 ( p ) W3 ( p)
f = const достигается в астатической
Рис.1.69
системе первого порядка. Действи-
тельно, для замкнутой астатической системы при Woc ( p) = k / p имеем

pWo ( p)
Y ( p) = F ( p) .
p + Wo ( p )k

где Wo(p) – передаточная функция объекта управления по каналу f → y .

Из полученного выражения следует, что соответственно с (1.80) в установившемся


режиме выходная координата y (t ) не зависит от возмущения f = const . Аналогично можно
показать, что астатическая система второго порядка отрабатывает без статической ошибки
любые постоянные сигналы и любые линейные функции времени. Эти рассуждения мож-
но распространить на астатические системы любого порядка.
Пример 1.24. Структурная схема следящей системы представлена на рис.1.69.
Требуется определить коэффициент передачи корректирующего звена Wk ( p ) , компенси-
рующего первую производную от управляющего воздействия u, при котором устраняется
скоростная ошибка, т.е. реализовать систему инвариантную по отношению к du/dt. Звенья
системы имеют следующие передаточные функции: усилитель – W1(p)=k1;
исполнительный электродвигатель – W2 ( p ) = k 2 p (Tp + 1) ; измерительное устройство уг-
ла поворота двигателя ϕ − W3 ( p ) = k 3 ; корректирующее звено – Wk(p)=kkp .

град
Числовые значения параметров звеньев – k1=10; k2=10 ; k3=1в/град; Т=0,02с.
в⋅с
Решение. Найдем передаточную функцию системы по каналу u → Δ . Учтя двух-
канальность подачи входного сигнала u, можно записать:
1 W ( p)W2 ( p)W3 ( p)
WuΔ ( p) = W1uΔ ( p ) + W2uΔ ( p) = − k ,
1 + W p ( p) 1 + W p ( p)

307
где Wp(p)=W1(p)W2(p)W3(p) – передаточная функция разомкнутой системы. Подставив
значения передаточных функций звеньев в полученное выражение, найдем:
Tp 2 + (1 − k2 k3 kk ) p
WuΔ ( p) =
Tp 2 + p + k1k2 k3
(1.105
)
Дифференциальное уравнение системы, преобразованное по Лапласу имеет вид:
Δ( p) = WuΔ ( p)U ( p) или

[ ]
(Tp 2 + p + k1k2 k3 )Δ( p) = Tp 2 + (1 − k2 k3k k ) p U ( p)

(1.106
)
Для того чтобы ошибка системы Δ была инвариантна к скорости изменения управ-
ляющего сигнала u, необходимо, чтобы полином в правой части уравнения (1.106) не со-
держал членов с комплексной переменной р в первой степени, что соответствует отсутст-
вию на входе системы производной du/dt. Это условие выполняется при
1 1
(1 − k2k3kk ) = 0 , откуда k k = = = 0,1c.
k1 k 2 10 ⋅ 1
Числовое значение kk, получено в предположении что корректирующее звено иде-
ально осуществляет операцию дифференцирования. Так как физически такое звено нереа-
лизуемо, то реальная инвариантная система будет работать с точностью до ε . Заметим,
коэффициент передачи kk не зависит от постоянной времени Т, так как эта величина опре-
деляет влияние ускорения d2u/dt2. В случае если была бы поставлена задача устранить
ошибку и по ускорению в корректирующее звено необходимо было бы ввести и вторую
производную от u. Рассмотренная система, как вытекает из (1.105), также инвариантна и к
постоянному управляющему воздействию u, т.е. относится к классу астатических.

308
4.5. СИНТЕЗ МОДАЛЬНЫХ РЕГУЛЯТОРОВ

В том случае, если все переменные состояния известны, возникает возможность


управления каждой составляющей переходного процесса е pit , где pi - i-й корень характе-
ристического уравнения замкнутой системы. Эти составляющие иногда называются мо-
дами∗), а управление ими – модальным управлением.
Переменные состояния могут быть измерены с помощью соответствующих средств
измерения. Тогда регулятор, состоящий из обратных связей по переменным состояния,
называется регулятором состояния. При этом качество переходного процесса определя-
ется расположением корней pi на комплексной плоскости, которое в свою очередь зави-
сит от коэффициентов передачи цепей обратной связи. Если часть переменных состояния
не может быть измерена, тогда строится так называемый наблюдатель состояния (модель
объекта управления), который воспроизводит не поддающиеся измерению переменные
состояния. Наблюдатель, выходными координатами которого являются все переменные
состояния (как воспроизведенные, так и измеренные) объекта управления совместно с ре-
гулятором состояния образует модальный регулятор.
Синтез модальных регуляторов основан на математическом описании системы в пере-
менных состояния. При этом в частности используются такие характеристики системы,
как управляемость и наблюдаемость (п.2.3.1.).

4.5.1. Синтез регуляторов состояния

Рассмотрим полностью управляемый объект с одним входом x = u , уравнения состоя-


ния которого имеют вид, аналогичный (1.16)
ν& = Aν + Bu . (1.107)
Будем полагать, что все переменные состояния ν i ( i = 1, n ) могут быть измерены и
использованы при построении регулятора состояния. Система в этом случае называется
системой с полной информацией о состоянии. Линейный закон управления, реализован-
ный с помощью обратной связи по всем переменным состояния, имеет вид
u = −Cν , (1.108)
где C - матрица коэффициентов передачи обратной связи размерности 1× n .
Если закон управления (1.108) используется в системе (1.107), то замкнутая систе-
ма описывается следующими уравнениями состояния:
ν& = [ A − BC]ν . (1.109)

∗)
Мода - лат. modus – мера, способ

309
Структурная схема объекта управ-
ления ОУ с регулятором состояния РС, со-
ставленная в соответствии с уравнением
(1.109), показана на рис. 1.70.
Проектирование регулятора состоя-
ния заключается в таком выборе матрицы
коэффициентов передачи C , чтобы были


получены желаемые динамические свойст-
Рис 1.70
ва системы. Один из методов синтеза регу-
лятора состояния состоит в достижении желаемого расположения на комплексной плоско-
сти корней характеристического уравнения системы, описываемой уравнением (1.109),
т.е. собственных значений матрицы замкнутой системы A - BC . Этот метод состоит из

следующих этапов.
1. При известном математическом описании объекта управления составляют урав-
нение состояния (1.107).
2. Вычисляют матрицу управляемости объекта (1.66) и проверяют совпадение ран-
га этой матрицы с размерностью системы.
3. Вычисляют характеристический многочлен матрицы по формуле
LA (λ ) = det λ I - A = λ n + a1λ n −1 + K + an −1λ + an , (1.110)

где λ - независимая переменная; I - единичная матрица.


4. Если пара матриц A и B полностью управляема, то она записывается в так на-
зываемой канонической форме A∗ и B∗ .
5. Задаются желаемым характеристическим полиномом замкнутой системы
Lu (λ ) = p n + b1 p n −1 + K + bn −1 p + bn . (1.111)
6. Вычисляют компоненты канонического вектора обратной связи
C∗ = cn∗ , cn −1∗ ,K , c1∗ как разность коэффициентов полиномов (1.110) и (1.111):

Ci ∗ = bi − ai , i = 1, n .
7. С помощью специальной матрицы преобразования P преобразуют коэффициен-
ты матрицы C∗ из канонического базиса, в котором они определены, в естественный ба-
зис, в котором записаны исходные уравнения состояния, т.е. определяют матрицу
C = C* P . Коэффициенты этой матрицы ci и являются коэффициентами передачи обрат-
ной связи, при которых обеспечивается желаемое поведение системы соответствующее
характеристическому полиному (1.111).

310
Проиллюстрируем применение изложенной методики на конкретном примере.
Пример 1.70. Пусть объект управления представляет собой электропривод состоя-
щий из двигателя постоянного тока с независимым возбуждением Д и безинерционного
тиристорного преобразователя ТП. Принципиальная схема электропривода представлена
на рис. 1.71. Электромеханическая Tм и электромагнитная Tэ постоянные времени заданы:

Tм = 0,5 с ; Tэ = 0,1 с . Необходимо синтезировать регулятор состояния объекта РС.


Решение. В качестве перемен-
ных состояния однозначно определяю-
щих состояние объекта примем частоту
i
uд вращения двигателя ω и ток якорной
цепи i . Предположим для простоты,

uI что момент сопротивления на валу дви-


гателя M c равен нулю. Тогда, учитывая

что момент двигателя M д пропорцио-

нален току в якорной цепи i ( M д = kдi ,


Рис 1.71
ТГ – тахогенератор, датчик частоты вращения ω с выход- где kд - коэффициент передачи двига-
ным сигналом uω ; ДТ – датчик тока i с выходным сигналом
u I ; u з - задающий сигнал; u - управляющий сигнал. теля при постоянном потоке возбужде-
ния) и воспользовавшись выражением
(1.4), уравнение движения электропривода можно записать в виде

J = kд i . (1.112)
dt
Учитывая, что электромеханическая постоянная времени Tм определяется выра-

жением Tм = JR / kд2 , где R - общее сопротивление якорной цепи двигателя, перепишем


(1.112) в виде
R
ω& = i. (1.113)
kдTм
В соответствии с вторым законом Кирхгофа, запишем уравнение равновесия ЭДС
в цепи якоря
di
uд = E + Ri + L , (1.114)
dt
где uд = k тпu - напряжение, подводимое к якорной цепи двигателя; k тп - коэффициент пе-

редачи тиристорного преобразователя; u - управляющий сигнал на входе ТП; E = kдω -


электродвижущая сила в обмотке якоря; L - индуктивность якорной цепи.

311
Разделив обе части уравнения (1.114) на R и учтя, что Tэ = L / R , запишем его в ви-
де
kд 1 k
i′ = − ω − i + тп u . (1.115)
RTэ Tэ RTэ
Уравнения (1.113) и (1.115) являются уравнениями состояния рассматриваемого
электропривода в скалярной форме. Обозначив ω = ν 1 ∗) и y = ν 2 , эти уравнения в соответ-

ствии с (1.107) можно записать в виде


ν& = Aν + Bu , (1.116)
где A и B - соответствующие матрицы:
R
0 0
kдTм
A= ; B = k тп .
kд 1
− − RTэ
RTэ Tэ

В соответствии с (1.66) определяем матрицу управляемости объекта (при n = 2 ):


k тп
0
kдTмTэ
U = B AB = . (1.117)
k тп k
− тп 2
RTэ RTэ

Так как определитель матрицы (1.117) не равен нулю( v = n = 2 ), то, следовательно,


рассматриваемый объект является полностью управляемым.
Определим характеристический полином матрицы A . В соответствии с (1.110)
имеем
R R
0 λ −
1 0 kдTм kдTм 1 1
LA (λ ) = det λ I - A = det λ − = det = λ2 + λ+ .
0 1 kд 1 kд 1 Tэ TэTм
− − λ+
RTэ Tэ RTэ Tэ

1 1
Обозначив a0 = 1 ; = a1 ; = a2 , запишем
Tэ TэTм

LA (λ ) = a0 λ 2 + a1λ + a2 . (1.118)
Собственные значения матрицы A (корни характеристического уравнения (1.118))
равны:

λ1,2 = − ±
a
2
a12
4
(
− a2 = −Tм ± Tм 2 − 4TэTм / 2TэTм . )
∗)
Заметим, что в данном случае частота вращения ω одновременно является выходной координатой системы
y.

312
Записав, в соответствии с (1.46), характеристический полином объекта в виде
LA (λ ) = T 2 λ 2 + 2ξ T λ + 1 , (1.119)

и сопоставив его с выражением (1.118), получим T = TэTм ; ξ = Tм / 2 TэTм . Тогда при

заданных числовых значениях Tм и Tэ получим T = 0, 22 c ; ξ = 1,12 . Таким образом, ко-

эффициент демпфирования ξ > 1 и электропривод представляет собой апериодическое


звено второго порядка. При этом корни характеристического уравнения LA (λ ) = 0 - веще-

ственные, отрицательные и равны: λ1 = −2,82 c −1 ; λ2 = −7,36 c −1 .


Так как объект, характеризуемый парой матриц A и B , полностью управляемый,
то эти матрицы можно представить в канонической форме A* и B* .Рассмотрим один из
алгоритмов такого преобразования. Можно показать, что если пара матриц A , B харак-
теризует полностью управляемый объект, то существует невырожденная матрица P , с
помощью которой можно преобразовать эти матрицы к канонической форме. В частности,
если уравнения состояния объекта заданы в виде (1.116), то существует следующее преоб-
разование подобия:

ν * = Pν или ν = P −1ν * ,
которое преобразует уравнение (1.116) к канонической форме пространства состояний

ν&* = A*ν * + B*u . (1.120)


Здесь
A* = PAP −1 ; B* = PB ; (1.121)
P1
P1A
P= , (1.122)
M
P1A n −1

где P1 = 0, 0,K1 U −1 ; U −1 - матрица, обратная матрице управляемости (1.66).

В нашем случае, воспользовавшись (1.117), найдем


Tм kд RTэ
k тп k тп
U −1 = .
TмTэ kд
0
k тп

TмTэ kд
Тогда P1 = 0,1 U −1 = 0.
k тп

В соответствии с (1.122), с учетом (1.116), найдем

313
TмTэ kд
0
P k тп
P= 1 = , (1.123)
P1 A КTэ
0
kтп

а в соответствии с (1.121), получим


0 1
0
A = −1
*
1 ; B* = .
− 1
TмTэ Tэ

Заметим, что элементы матриц A* и B* можно также получить, воспользовавшись


характеристическим полиномом (1.118). В этом случае имеем (при Tм = 0,5 c ; Tэ = 0,1 c )

0 1 0
A* = ; B* = . (1.124)
− a2 − a1 a0

Подставив в (1.124) соответствующее значение коэффициента ai , получим тот же


результат, что и ранее.
В качестве желаемого расположения на комплексной плоскости соответствующих
значений ai (корней характеристического уравнения λi = pi ) замкнутой системы, состоя-
щей из объекта управления и регулятора состояния, представляющего собой систему без-
инерционных обратных связей по переменным состояния, пользуются тем или иным рас-
пределением. В частности, при использовании распределения Баттерворта, корни характе-
ристического уравнения системы лежат на окружности в левой части комплексной плос-
кости и находятся на одинаковом угловом расстоянии друг от друга.
В нашем случае полином Баттерворта второго порядка имеет вид
Lu (λ ) = λ 2 + 2ω0 λ + ω0 2 , (1.125)

где ω0 - радиус полуокружности на которой расположены корни полинома Lu (λ ) , c −1 .

Обозначим: λ = p ; 2ω0 = b1 ; ω0 2 = b2 . Тогда полином (1.125) примет вид

Lu (λ ) = p 2 + b1 p + b2 . (1.126)

Определим коэффициенты канонического вектора обратной связи C* = c2* c1* , как

разность между коэффициентами характеристических полиномов разомкнутой (1.118) и


замкнутой (1.126) систем:

c2* = b2 − a2 = b2 − 1 ; c1* = b1 − a1 = b1 − 1 ,
TмTэ Tэ

и составим матрицу коэффициентов передачи в цепях обратной связи C = C* P , где P –


матрица преобразования (1.123). Имеется:

314
TмTэ kд
0
P kтп
C = c2 c1 = c c ⋅ 1 = b2 − 1
* *
b− 1 ⋅ =
2 1
P1 A TмTэ 1 Tэ КTэ
0
kтп

kд R
= ( b2TмT − 1) ( b1TэT − 1) . (1.127)
k тп kтп

Коэффициенты желаемого характеристического полинома замкнутой системы


(1.126) b1 и b2 выбираются исходя из требований к качеству переходного процесса. На-

пример, для того чтобы величина перерегулирования σ max не превышала 5 % коэффици-

ент демпфирования ξ должен быть равен 2 . Тогда, сравнивая коэффициенты поли-


2
номов (1.119) и (1.125) найдем ω0 = 2 2T ξ , где T = TмTэ . Подставив в полученное вы-

2
ражение числовые значения T и ξ получим ω0 = = 44, 6 c −1 . При этом
2 0,5 ⋅ 0,1 ⋅ 2 2

искомые коэффициенты равны: b1 = 2ω0 = 2 ⋅ 44, 6 = 63 c −1 ; b2 = ω0 2 = 44, 62 = 1971 c −2 .

Приняв R = 1 Ом; kд = 1 Вс ; kтп = 10 , найдем числовые значения коэффициен-


рад

тов матрицы: C = c2 c1 = 9, 75 0,53 .

Таким образом, знание матрицы коэффициентов передачи обратной связи C по-


зволяет записать закон управления (1.108) и уравнение состояния замкнутой системы
(1.109):
ν&1 g11 g12 ν 1 ν
= ⋅ =G 1 , (1.128)
ν&2 g 21 g 22 ν 2 ν2

где G = ( A - BC ) - матрица замкнутой системы, элементы которой cij определяются эле-

ментами известных матриц A, B и C . В нашем случае, эти матрицы приведены в восполь-


зовавшись выражениях (1.116), (1.127), что позволяет определить матрицу G
R
0 0
g g12 kдTм k R
G = ( A - BC) = 11 = − kтп ⋅ д ( b2TмT − 1) ( b1TэT − 1) =
g 21 g 22 kд 1 kтп kтп
− − RTэ
RTэ Tэ

R
0
kдTм 0 2
= = . (1.129)
T k −385,5 −63
− м д b2 b1
R

315
Воспользовавшись уравнениями (1.128), (1.129) и учтя, что ν 1 = ω , ν 2 = i , можно

построить структурную схему системы стабилизации частоты вращения привода ω с по-


мощью регулятора состояния. Эта схема может быть использована для моделирования пе-
реходных процессов в системе при ненулевых начальных условиях i (0) = i0 ; ω (0) = ω0 .
При нулевых начальных условиях свободное движение в системе определяется корнями
характеристического уравнения (1.126)∗), которые при b1 = 63 c −1 ; b2 = 1971 c −2 равны

p1,2 = −31,5 ± j 31,3 , что свидетельствует о наличии колебательного затухающего переход-

ного процесса.

Рис. 1.72

Заметим, что теоретически путем подбора коэффициентов характеристического


полинома (1.126) корни замкнутой системы p1 и p2 можно произвольно разместить в ле-
вой части комплексной плоскости корней, что в принципе позволяет обеспечить любое
быстродействие системы. Однако при этом увеличивается значение управляющего воз-
действия и резко форсируется переходный процесс в системе. Так как в реальных систе-
мах и тот и другой фактор ограничены, то при синтезе регулятора состояния необходимо
выбрать тот или иной критерий качества переходного процесса. В рассматриваемом при-
мере таким критерием является обеспечение величины σ max < 5 % . Часто закон управле-
ния синтезируется таким образом, чтобы обеспечить минимум квадратичной интеграль-
ной ошибки (1.84). Существуют и некоторые другие критерии, оценивающие качество пе-
реходного процесса конкретных систем.

4.5.2. Принципы построения наблюдателей состояния.

∗)
Здесь учтено, что характеристические полиномы желаемой и синтезированной системы совпадают.

316
В том случае если измерение всех переменных состояния невозможно, а иногда и
нецелесообразно, используются специальные устройства, получившие название наблюда-
телей состояния. Входными величинами наблюдателя являются входной u (t ) и выходной
y (t ) сигналы*), измеренные на физическом объекте, а выходными – восстановленные с

определенной точностью переменные состояния ν i (t ) , т.е. оценки вектора состояния νˆ (t ) ,


отмечаемые знаком “ ∧ ”. Эти оценки в соответствии с (1.108) поступают на вход регуля-
тора состояния, с выхода которого сигнал обратной связи u (t ) поступает на вход объекта
управления. Как уже упоминалось регулятор состояния с наблюдателем называются мо-
дальным регулятором состояния, структурная схема которого представлена на рис. 1.73.

Рис 1.73
ОУ – объект управления; НС – наблюдатель состояния; РС – регулятор состояния; u з -
задающее воздействие; A, B,C,C0 , K - матрицы преобразования.

Сформулируем задачу синтеза наблюдателя состояния. Пусть математическая мо-


дель объекта управления задана в виде уравнений состояния:

ν&* = A*ν * + B*u . (1.130)


y = C0ν . (1.131)

Матрицы A, B и C0 известны. Кроме того, имеется информация о входной u и вы-

ходной y величинах объекта управления. Требуется построить наблюдатель, который вы-

давал бы оценку переменных состояния νˆ . Имеется в виду, что непосредственно извлечь


переменные состояния ν из выражения (1.130) нельзя.

*)
Для примера 1.70: u (t ) - управляющий сигнал на входе тиристорного преобразователя; y (t ) - частота
вращения двигателя, ω

317
Если наблюдатель восстанавливает (оценивает) весь вектор состояния ν , то он называет-
ся наблюдателем состояния полного порядка, а если только его часть (например, n − 1 ), то
наблюдателем пониженного порядка или редуцированным*) наблюдателем.
Структурная схема простейшего наблюдателя состояния для объекта с одним вхо-
дом u и одним выходом y представлена на рис. 1.74 (жирные линии). Структурная схема
объекта управления ОУ построена в соответствии с уравнениями (1.130), (1.31) и пред-
ставляет собой абстрактную математическую модель той или иной степени сложности
описывающую (по крайней мере качественно) реальные процессы в объекте. Наблюдатель
состояния НС представляет собой физическое устройство, вырабатывающее оценку νˆ
вектора состояния ν . На вход модели и наблюдателя поступает реально измеренный сиг-
нал u .

Рис 1.74

Таким образом, если начальные условия модели объекта ν 0 и наблюдателя νˆ0 оди-
наковы, то переходные процессы в них будут также протекать одинаково. Необходимость
определения начальных условий объекта ν 0 с последующей передачей их на наблюдатель
является одним из недостатков простейшего наблюдателя. Другим его недостатком явля-
ется функционирование по разомкнутому циклу, что, как известно может привести к су-
щественным ошибкам. Эти недостатки устраняются в асимптотическом наблюдателе со-
стояния, в котором предусмотрена автоматическая оптимизация отклонения νˆ0 от ν ., за

*)
редуцировать – лат. упрощать

318
счет введения отрицательной обратной связи по ошибке Δ y = y − yˆ , которая через матрицу

коэффициентов передачи обратной связи наблюдателя К подается на вход интегрирующе-


го звена НС (рис.1.74, тонкие линии).
Размерность наблюдателя, показанного на рис. 1.74, равна размерности системы n .
При этом уравнения состояния n-мерного наблюдателя∗) имеет вид:

νˆ& = Aνˆ + KΔ y + Bu , (1.132)

или учтя, что Δ y = y − yˆ , ŷ = C0νˆ , выражение (1.132) можно записать в виде

νˆ& = A - KC0 νˆ + Ky + Bu . (1.133)

Из уравнения (1.133) следует, что варьируя элементами матрицы K , можно полу-


чить желаемое собственное значение матрицы A - KC0 например, с целью минимизации

ошибки Δ y .

Методика синтеза наблюдателя состояния практически аналогична методике синтеза


регулятора состояния, изложенной выше, но при этом вместо матрицы управляемости оп-
ределяется матрица наблюдаемости объекта (1.67), ранг которой позволяет сделать вывод
о наблюдаемости этого объекта.

4.5.3. Модальный регулятор.

Уравнение состояния наблюдателя (1.133) соответствует случаю, когда обратная связь по


управлению u отсутствует, т.е. это уравнение собственно наблюдателя. Для общего слу-
чая, когда регулятор состояния и наблюдатель состояния, образующие модальный регуля-
тор, включены в замкнутый контур (рис. 1.73), уравнения состояния системы управления
объектом имеют вид:
ν& = Aν − BCνˆ + Bu з , (1.134)

νˆ& = A - KC0 − BC νˆ + KC0ν + Bu з . (1.135)

Уравнение (1.134) описывает состояние замкнутого регулятора состояния РС, а


уравнение (1.135) – состояние замкнутого наблюдателя НС. Эти уравнения получены из
уравнений состояния (1.107) и (1.33) с учетом того, что для замкнутой системы управле-
ния имеют место следующие соотношения: y = C0ν ; u = u з − Cνˆ . Так как векторы со-

∗)
Заметим, что выходной сигнал объекта содержит одну ненулевую переменную состояния ν n , которая может
быть непосредственно подана на вход регулятора состояния. Это позволяет применять наблюдатель пониженного (n-1)
порядка.

319
стояния ν и его оценки νˆ , входящие в уравнения (1.134) и (1.135), однозначно связаны,
то при исследовании динамических режимов в замкнутой системе эти уравнения исполь-
зуются совместно.
Выясним характер свободных движений замкнутой системы, обусловленных нену-
левыми начальными условиями, положив u з = 0 и введя новую переменную Δ y = ν −νˆ .

Тогда уравнения (1.134), (1.135) примут вид


ν& = A - BC ν − BCΔ y , (1.136)

Δ& ν = A - KC0 Δ y . (1.137)

Уравнение (1.137) получено путем вычитания (1.134) из (1.135). Вектор Δ& ν харак-

теризует точность оценки наблюдателем вектора состояния ν при наличии в замкнутой


системе регулятора состояния. Из уравнения (1.137) следует, что ошибка Δν не зависит от

параметров (элементов матрицы C ) регулятора состояния.


Соотношения (1.136), (1.137) можно записать в виде
ν& A - BC BC ν ν
= ⋅ = A0 , (1.138)
ν&ν 0 A - KC0 Δ y Δν

Свободное движение системы (1.138) определяется характеристическим уравнени-


ем
L(λ ) = det λ I − A 0 = det λ I − A + BC ⋅ det λ I - A + KC0 = 0 , (1.139)

Из (1.139) вытекает, что полный набор собственных значений модального регулятора


(матрицы A 0 ) состоит из собственных значений системы управления без наблюдателя

( det λ I - A + BC = 0 ) и собственных значений наблюдателя det λ I - A + KC0 = 0 . Таким

образом собственные значения регулятора состояния и наблюдателя не влияют друг на


друга, что позволяет проводить синтез этих устройств независимо друг от друга. Регуля-
тор состояния синтезируется в предположении, что все переменные состояния объекта из-
вестны (например, рис.1.72), а затем синтезируют наблюдатель как независимую замкну-
тую систему (например, рис.1.74).
Из уравнения (1.138) следует, что порядок характеристического уравнения замкну-
той системы определяется порядком регулятора состояния и наблюдателя. Если матрица А
имеет размерность n, то управление с наблюдателем полного порядка и регулятором со-
стояния имеет порядок 2n. Так как наблюдатель обладает собственной инерционностью,
то замкнутая система, использующая только регулятор состояния, обладает большим бы-
стродействием.

320
В заключение заметим, что применение модальных регуляторов целесообразно в
том случае, если можно построить достаточно адекватную модель объекта управления и в
то же время не удается измерить те или иные переменные состояния.

4.5. ЧАСТОТНЫЕ МЕТОДЫ СИНТЕЗА АСУ

Эти методы традиционно применяются при решении задач синтеза электромехани-


ческих систем управления и основаны на связи переходной функции замкнутой системы с
ее вещественной частотной характеристикой, которая в свою очередь связана с логариф-
мической амплитудно-частотной характеристикой L(ω ) . При этом предполагается, что
синтезируемая система относится к классу минимально-фазовых.

4.6.1. Логарифмические частотные характеристики

Логарифмическая амплитудно-частотная характеристика (ЛАХ) представляет со-


бой зависимость соответствующую двадцати десятичным логарифмам амплитудно-
частотной характеристики A(ω ) :
L(ω ) = 20 lg A(ω ) . (1.140)
Здесь L(ω ) – ЛАХ, измеряемая в децибелах (дб).
Напомним, что бел это логарифмическая единица двух одноименных физических
величин, соответствующая десятикратному увеличению этих величин. Например, при
увеличении мощности выходного сигнала Pвых (ω ) по отношению к мощности входного

Pвх (ω ) в десять раз имеем Pвых (ω ) Pвх (ω ) = 10 . Тогда учитывая, что мощность сигнала
пропорциональна квадрату его амплитуды и учтя соотношение (1.37), можно записать:
A02 (ω ) a 2 = A2 (ω ) = 10 ,
или после логарифмирования получим:
2 lg A(ω ) = 1 бел.
При этом, в соответствии с (1.140) и с учетом того, что 1 бел=10 дб, получим
L(ω ) = 20 lg A(ω ) = 10 дб.
В случае если Pвых (ω ) Pвх (ω ) = 100 , аналогичным образом можно получить

L(ω ) = 20 дб и т.д.
При построении ЛАХ используется полулогарифмическая сетка: по оси абсцисс
откладывается частота ω в логарифмическом масштабе, а по оси ординат с равномерной
шкалой откладывается величина L(ω ) в дб. Если по оси абсцисс откладывается не сама

321
частота ω , а ее десятичный логарифм, то единица приращения lg ω соответствует одной
декаде (дек), т.е. десятикратному увеличению частоты ω .
Заметим, что использование логарифмических частотных характеристик позволяет
оперировать с более простыми соотношениями. В частности, если частотная функция мо-
жет быть представлена в видепроизведения сомножителей, то результирующая ЛАХ мо-
жет быть найдена путем суммирования ординат, соответствующих отдельным сомножи-
телям. Кроме того, логарифмические кривые выполаживаются, что позволяет с большей
уверенностью производить кусочно-линейную аппроксимацию этих кривых. Например,
для интегрирующего звена имеем: A(ω ) = k ω (гипербола). Тогда
L(ω ) = 20 lg A(ω ) = 20 lg k − 20 lg ω
и, следовательно, ЛАХ представляет собой прямую линию, проходящую через точку с ко-
ординатами lg ω = 0 при ( ω = ω1 = 1 c −1 ), L(ω ) = 20 lg k , и имеющую отрицательный наклон
равный -20 дб/дек. Это вытекает из того, что каждое удесятирение частоты соответствует
увеличению lg ω на одну единицу и, следовательно, уменьшению L(ω ) на 20 дб. Точку
пересечения этой прямой с осью абсцисс можно найти, положив L(ω ) = 0 , что соответст-
вует значению A(ω ) = 1 . Напомним, что частота, при которой выполняется условие
A(ω ) = 1 , называется частотой среза ωc . В рассматриваемом случае ωc = k .

В случае дифференцирующего звена A(ω ) = kω и L(ω ) = 20 lg k + 20 lg ω представ-


ляет собой прямую линию с положительным наклоном +20 дб/дек и частотой среза равной
ωc = 1 k .
Аналогичным образом можно показать, что если АЧХ объекта имеет вид:
A(ω ) = k ω n , то ЛАХ этого объекта представляет собой прямую с отрицательным накло-

ном − n ⋅ 20 дб/дек, а при A(ω ) = kω n прямая L(ω ) будет иметь положительный наклон
+ n ⋅ 20 дб/дек.
Логарифмическая частотная характеристика апериодического звена первого поряд-
ка имеет вид:
k
L(ω ) = 20 lg A(ω ) = 20 lg . (1.141)
T 2ω 2 + 1
При этом, так называемая, асимптотическая ЛАХ строится следующим образом. В коор-
динатах lg(ω ) , L(ω ) параллельно оси ординат проводится прямая lg ω1 = const , где

ω1 = 1 T называется сопрягающей частотой (рис.1.75). Для частот меньших чем сопря-


гающая, т.е. при ω < ω1 , в выражении (1.141) можно пренебречь первым слагаемым под

322
корнем. Это позволяет в диапазоне частот 0 < ω < ω1 заменить зависимость (1.141) при-

ближенным выражением: L(ω ) ≈ 20 lg k . Для диапазона частот ω1 < ω < ∞ в выражении

k
(1.141) можно под корнем пренебречь единицей, что позволяет записать: L(ω ) ≈ 20 lg .
ωT
Как было показано выше, это выражение соответствует прямой с отрицательным
наклоном -20 дб/дек, проходящей через точку lg ω = lg ω1 ; L(ω ) = 20 lg k . Кусочно-

линейная зависимость L(ω ) , показанная на рис. 1.75 сплошной линией и является асим-
птотической (приближенной) ЛАХ. Действительная ЛАХ показана на том же рис. Пунк-
тиром.
Для апериодического
звена второго порядка
(1.48) асимптотическая
ЛАХ строится анало-
гично изложенному
выше. Воспользовав-
шись выражением (1.46)
с учетом (1.48), имеем:

L(ω ) = 20 lg A(ω ) = 20 lg
T12ω 2 + 1
, (1.142)
В координатах ω , L(ω ) (рис.1.76,а) проведем вспомогательные прямые ω = ω1 и

ω = ω2 , где ω1 = 1 T 1 , ω2 = 1 T 2 -
сопрягающие частоты. Пусть
T1 > T2 . Тогда при 0 < ω < ω1 вы-
ражение (1.142) можно заменить
приближенным L(ω ) ≈ 20 lg k ;
при ω1 < ω < ω2 -

k
L(ω ) ≈ 20 lg ; при ω2 < ω < ∞
ωT1
k
- L(ω ) ≈ 20 lg . Таким об-
T1T2ω 2
разом, асимптотическая ЛАХ
апериодического звена второго

323
порядка состоит из трех отрезков прямых: с нулевым наклоном, с отрицательным накло-
ном -20 дб/дек, с отрицательным наклоном -40дб/дек. На рис.1.76,а эта характеристика
изображена сплошными линиями. Там же пунктиром показана действительная ЛАХ.
На рис.1.76,б приведена асимптотическая ЛАХ колебательного звена, которое опи-
сывается тем же уравнением (1.46), что и апериодическое звено второго порядка, но при
0 < ξ < 1 . Эта ЛАХ представляет собой две асимптоты с наклоном 0 и -40 дб/дек при со-
прягающей частоте равной ω = ω0 , где ω0 = 1 T - частота свободных колебаний (при

ξ = 0 ).
Аналогичным образом можно построить ЛАХ для объектов, описываемых дробно-
рациональными передаточными функциями более высокого порядка.
Так как для минимально-фазовых систем существует однозначная связь между пе-
реходными процессами и амплитудно-частотной характеристикой системы, то для оценки
качества процесса управления весьма удобным является использование логарифмической
амплитудно-частотной чарактеристики L(ω ) . Проиллюстрируем сказанное на конкретных
примерах.
Пусть имеем систему, состоящую из одного интегрирующего звена с W ( p ) = k p ,
охваченного единичной отрицательной обратной связью. Тогда, как было показано выше,
ЛАХ разомкнутой системы представляет собой прямую, представленную на рис.1.77.
Передаточная функция замкнутой
системы имеет вид
k 1
W ( p) = = , (1.143)
p + k T0 p + 1

где T0 = 1 k = 1 ωc .
Из (1.43) вытекает, что рассмат-
риваемая система представляет собой
апериодическое звено первого порядка с
переходной функцией
t

h(t ) = 1 − e T0
.
Таким образом, при пересечении ЛАХ оси абсцисс с наклоном -20 дб/дек переход-
ный процесс протекает монотонно. При этом как показано в параграфе 3.2.2., время регу-
лирования t р составляет примерно 3T0 .

Рассмотрим теперь систему с двумя звеньями, охваченными единичной обратной


связью (рис.1.77,а). Частотная функция разомкнутой системы будет:

324
k
W р ( jω ) = ,
jω (T1 jω + 1)
а соответствующая ЛАХ запишется в виде:

L(ω ) = 20 lg k − 20 lg ω − 20 lg T1ω 2 + 1 , (1.144)

В соответствии с (1.144) на рис.1.78,б построена асимптотическая ЛАХ, представ-


ляющая собой два отрезка прямых: один с наклоном -20 дб/дек при ω < ω1 , второй с на-

клоном и -40 дб/дек при ω > ω1 , где

ω1 = 1 T1 - сопрягающая частота.
Запишем передаточную функ-
цию замкнутой системы:

Wр ( p) 1
W ( p) = = ,
1 + Wр ( p) T0T1 p + T0 p + 1
2

или
1
W ( p) = ,
T p + 2ξ Tp + 1
2 2

1 T0
где T0 = ; T = T0T1 ; ξ = .
k 2 T0T1

Учтя, что ωc = k = 1 T0 ,
ω1 = 1 T1 , можно записать

1 ω1
ξ= . (1.145)
2 ωc

В соответствии с (1.145) при


ω1 > 4ωc величина коэффициента

демпфирования ξ больше единицы,


что свидетельствует о монотонности
переходного процесса (рис.1.78,в; кри-
вая 1). Заметим,что при ω1 = ωc и ξ > 1 имеем T12ω 2 < 1 и последним слагаемым в (1.144)
можно пренебречь. Следовательно, поведение системы практически определяется только
параметрами интегрирующего звена. При этом, как и в предыдущем примере, ЛАХ пере-
секает ось абсцисс с наклоном -20 дб/дек.

325
В случае если ω1 < 4ωc , имеем ξ < 1 и переходный процесс носит колебательный

характер (рис.1.78,в; кривая 2). При ω1 = 2ωc величина ξ = 2 2 , а величина максималь-

ного перерегулирования σ max составляет 4,3 % от установившегося значения управляемой

величины y (∞) . Как отмечалось ранее, такой переходный процесс обычно считается наи-
более приемлемым (см. пример 1.22).
Таким образом, по расположению ЛАХ на плоскости с координатами lg ω ; L(ω )
можно судить о качестве процесса управления. В частности:
а) для исключения колебательности переходного процесса необходимо (но не дос-
таточно), чтобы частота среза ωc соответствовала участку ЛАХ разомкнутой системы с
наклоном -20 дб/дек. Достаточным условием отсутствия колебательности является соблю-
дение неравенства ω1 > 4ωc , где ω1 - первая сопрягающая частота, следующая за частотой
среза;
б) величина времени регулирования t р определяется неравенством t р > π ωc , из

которого следует, что чем выше частота среза ωc , тем быстрее протекает переходный
процесс.
в) чем шире участок ЛАХ с наклоном -20 дб/дек, пересекающий ось абсцисс, тем
ближе переходный процесс к монотонному;
г) если ЛАХ ра-
зомкнутой системы
имеет произвольный
вид (рис.1.79), то вид ее
низкочастотных и высо-
кочастотных участков
незначительно влияет
на характер переходно-
го процесса. При этом
интервал низких
( 0 < ω < ωн ) , средних ( ωн < ω < ωв ) и высоких ( ωв < ω < ∞ ) частот определяются конкрет-

ными параметрами системы. Например, при точности воспроизведения сигнала Δ = 0, 05 и


соотношении вещественных частотных характеристик P(ωв ) P (0) = 0, 2 значения ωн и ωв

соответствуют L(ωн ) = 20 lg1 Δ = 26 дб, L(ωв ) = −16 дб, что позволяет выделить искомые
интервалы частот (рис.1.79). При этом вид характеристики в интервале средних частот
определяет запас устойчивости и в значительной мере качество процесса управления.
326
4.6.2. Синтез АСУ с помощью логарифмических амплитудно-частотных характе-
ристик

Частотные методы синтеза АСУ подробно рассмотрены в работах


В.В.Солодовникова и В.А.Бесекерского и обычно включают в себя следующие операции.
1. Строится ЛАХ исходной (нескорректированной) системы Lс (ω ) с учетом тре-

буемого коэффициента усиления системы k р в разомкнутом состоянии. Величина k р оп-

ределяется заданным значением статической ошибки системы: Δ* = 1 (1 + k р ) . Исходная

система должна быть минимально-фазовой.


2. По заданным показателям качества (обычно величины σ max и t р ) с учетом ЛАХ

нескорректированной системы Lс (ω ) строится желаемая ЛАХ скорректированной систе-

мы Lск (ω ) . При этом скорректированная система должна оставаться минимально-фазовой,

так как только в этом случае характеристика Lск (ω ) полностью определяет качество про-
цесса управления.
3. По построенным логарифмическим амплитудным характеристикам Lс (ω ) и

Lск (ω ) определяется ЛАХ корректирующего звена Lк (ω ) . Наиболее просто Lк (ω ) опреде-


ляется для корректирующего звена последовательного типа. В этом случае, воспользо-
вавшись выражением (1.93), имеем Wк ( p) = Wск ( p) Wс ( p) . Тогда соответствующее соот-

ношение для ЛАХ примет вид Lк (ω ) = Lск (ω ) − Lс (ω ) . Таким образом Lк (ω ) можно по-

строить путем вычитания ординат Lс (ω ) из ординат Lск (ω ) .

4. По полученной ЛАХ корректирующего звена Lк (ω ) определяется передаточная


функция последовательного корректирующего звена, а также способ его реализации. В
случае необходимости последовательное звено может быть пересчитано с помощью соот-
ношений (1.93)-(1.96) на эквивалентное параллельное звено или эквивалентную обратную
связь.
5. Строится ЛАХ реальной скорректированной системы и, в случае необходимости,
используя обычные методы анализа, определяются реальные показатели качества процес-
са управления.
Наиболее ответственной операцией синтеза АСУ является построение желаемой
ЛАХ Lск (ω ) и установление связи ее параметров с показателями качества переходного
процесса.
Для решения этой задачи В.В.Солодовников предложил ввести типовую вещест-
венную частотную характеристику P(ω ) замкнутой системы (рис.1.80) со следующими

327
параметрами: ωп – интервал положительности вещественной частотной характеристики

(ВЧХ); χ1 = ω3 ωп , χ 2 = ω1 ω2 – основной и
дополнительный коэффициенты наклона ВЧХ
соответственно; λ = ω2 ωп – основной
коэффициент формы. Как показывают расчеты,
при χ1 ≤ 0,8 , χ 2 ≥ 0, 4 и λ ≥ 0,5 величина
перерегулирования σ max в основном

определяется величиной Pmax . В этом случае

величина σ max и значение времени регулиро-

вания t р могут быть определены по расчетным кривым, приведенным на рис.1.81. Таким

образом при заданном перерегулировании σ max


*
можно определить Pmax , а затем величину

t рωп π (см. рис.1.81). При заданном значении t *р соответствующая величина ωп опреде-

ляется из выражения ωп = π ⋅ ОА t *р .

Заметим, что отрицательная часть вещественной характеристики также влияет на


величину перерегулирования, изменяя его на величину Δσ . Это можно учесть, положив
Pmin ≈ 1 − Pmax . Тогда по кривой σ max = f ( Pmax ) , построенной с учетом значения Pmin

(рис.1.81), можно найти допустимые значения Pmax и Pmin = 1 − Pmax , при которы суммарное

перерегулирование не будет превосходить заданного значения σ max


*
.
В таблице 1.2 приведены некоторые
типовые значения Pmax и соответствующие
качественные показатели замкнутой
системы, определенные с помощью
соотношения (1.45), связывающего
вещественную частотную характеристику
минимально-фазовой системы P(ω ) с ее
переходной функцией:

2 P(ω ) sin ωt
h(t ) =
π ∫
0
ω
dω .

328
Таблица 1.2
Pmax σ max ,% tр Число Pmax σ max ,% tр Ч
колебаний n колебани
6π 4π
1,4 ≤ 38 ≤ ≤3 1,2 ≤ 26 ≤
ωп ωп
5π 3π
1,3 ≤ 32 ≤ ≤2 1,0 ≤ 17 ≤
ωп ωп

Определив Pmax и ωп , можно переходить к формированию желаемой асимптотиче-

ской ЛАХ разомкнутой системы Lск (ω ) . При этом обычно придерживаются следующего
порядка.
1. Строится низкочастотная асимптота Lнск (ω ) таким образом, чтобы она имела на-
клон -20 дб/дек, соответствующий астатической системе первого порядка, и пересекала
ось абсцисс в точке ωк = kv , где kv - заданный коэффициент усиления разомкнутой систе-
мы, характеризующий точность ее работы по скорости (рис.1.82). При однократном изло-
ме в точке А первая сопрягающая частота определяется соотношением ω1 = kε kv , где kε
–заданный коэффициент, характеризующий точность работы системы по ускорению; при
двукратном – ω1 = 2kε kv .
2. По известной частоте поло-
жительности ωп , определяется частота

среза ωc так, чтобы она удовлетворяла


условию
ωc = (0, 6 ÷ 0,9)ωп .
3. Строится среднечастотная
асимптота Lсск (ω ) с наклоном -20
дб/дек, пересекающая ось абсцисс в
точке ω = ωc . Эта асимптота ограни-

чивается прямыми L(ω ) = L1 и

329
L(ω ) = L2 при L2 = L1 (рис.1.82). Значение L1 определяется по расчетной кривой, связы-

вающей величины L1 с σ max *) (рис.183). Например, если необходимо чтобы величина пе-

ререгулирования σ max не превышала 30 %, то, воспользовавшись зависимостью L1 (σ max ) ,

находим числовые значения величин L1 = 16 дб и L2 = − L1 = −16 дб, что позволяет опре-

делить среднечастотную область ЛАХ ( ωн < ω < ωв ). Точки А и В на асимптотах Lнск (ω ) и

Lсск (ω ) сопрягаются прямой (или ломаной) линией с наклоном кратным -20 дб/дек. При
этом ранее найденные сопрягающие частоты могут быть несколько скорректированы.
4. Высокочастотный участок асимптотической ЛАХ Lвск (ω ) строится с наклоном
кратным -20 дб/дек таким образом, чтобы он как можно ближе совпадал с ЛАХ нескор-
ректированной АСУ. При частотах в 5-10 раз превышающих ωв влияние сигнала практи-
чески не сказывается на переходном процессе и ЛАХ на этом участке можно не учиты-
вать.*)
5. Строят желаемую ЛАХ Lск (ω ) во всей частотной области. При этом для обеспе-
чения построения используются типовые передаточные функции, приведенные в таблице
1.3. Там же приведены отрицательные наклоны асимптот соответствующих логарифмиче-
ских амплитудных характеристик.
Таблица 1.3
Отрицательные
Тип
Передаточная функция наклоны асимптот в
ЛАХ
дб/дек
k (T2 p + 1)
1 W1 ( p) = 20-40-20-40
p(T1 p + 1)(T3 p + 1)

k (T2 p + 1) 2
2 W2 ( p) = 20-60-20-40
p (T1 p + 1)(T3 p + 1)

k (T2 p + 1)
3 W3 ( p) = 20-40-20-60
p (T1 p + 1)(T3 p + 1) 2

k (T2 p + 1) 2
4 W4 ( p) = 20-60-20-60
p(T1 p + 1)(T3 p + 1) 2

*)
Заметим, что величина σ max определяется значениями Pmax и Pmin (см.табл.1.2), которым соответствуют
определенные значения L(ω ) = L1 . Это обстоятельство позволяет определить для различных значений σ max соответ-
ствующие значения Pmax , Pmin и L1 и в конечном итоге построить зависимость L1 (σ max ) .
*)
Так как ωi = 1 Ti , то область высоких частот ( ω > (5 ÷ 10)ωв ), можно назвать областью малых посто-
янных времени.

330
Передаточные функции и ЛАХ всех четырех типов, приведенных в табл. 1.3, полностью
определяются заданием четырех параметров: k , T1 , T2 и T3 . Последние три параметра оп-

ределяют сопрягающие частоты ωi = 1 Ti , i = 1,3 . ЛАХ полностью определяется заданием

следующих четырех величин: коэффициента усиления в децибелах LA при частоте ω = ω1

(рис. 1.82), частоты среза ωc из соотношения (1.146), и двух относительных сопрягающих

частот ωн ωc и ωв ωc . Подчеркнем, что при построении желаемой ЛАХ Lск (ω ) ее низ-


кочастотные и высокочастотные участки следует располагать как можно ближе к ЛАХ не-
скорректированной системы Lс (ω ) . Это позволяет упростить реализацию корректирую-

щего устройства. При этом в низкочастотной области совпадение Lс (ω ) и Lск (ω ) обычно


достигается подбором коэффициента усиления желаемой системы, а в высокочастотной –
соответствующим выбором желаемой ЛАХ.
При формировании желаемой ЛАХ можно также увеличивать запасы по модулю L1

и L2 , если это способствует совпадению асимптот Lс (ω ) и Lск (ω ) . Это обусловлено тем,

что увеличение L1 и L2 приводит к уменьшению Pmax и Pmin и, следовательно, колеба-

тельность переходного процесса уменьшается, и условие σ max ≤ σ max


*
выдерживается.

6. После сформирования ЛАХ скорректированной системы Lск (ω ) необходимо проверить


выдерживается ли требуемое значение запаса устойчивости по фазе, которое определяется
по кривой μ (σ max ) , приведенной на рис.1.83*). Для этого необходимо подсчитать фазовый

сдвиг в двух крайних точках среднечастотного участка, т.е. при ω = ωн и ω = ωв , опреде-


ленных для найденной желаемой передаточной функции разомкнутой системы. Так, на-
пример, для ω = ωн и при передаточной функции типа 1 (табл.1.3) этот сдвиг равен

ϕн = −900 − arctgωнT1 + arctgωнT2 − arctgωнT3 .

Аналогично вычисляется сдвиг фаз ϕв при ω = ωв . Если требуемый запас по фазе μ * не

выдержан, т.е. μi = (180 + ϕi ) ≤ μ * , i = н,в, необходимо расширить среднечастотный уча-


сток желаемой ЛАХ и произвести повторный расчет.

*)
При построении кривой μ (σ max ) используется зависимость между вещественной частотной характеристи-
кой замкнутой системы P(ω ) (см., например, рис.1.80) и частотной функцией разомкнутой системы W ( jω ) , что
позволяет построить кривые, связывающие P(ω ) с амплитудной и фазовой характеристиками разомкнутой системы, и
в конечном итоге, найти зависимость μ (σ max ) .
331
Чтобы окончательно убедиться в приемлемости полученной ЛАХ, можно, определив со-
ответствующую передаточную функцию, построить переходный процесс в системе и про-
верить справедливость неравенств σ max ≤ σ max
*
, t р ≤ t *р .

После окончательного сформирования желаемой ЛАХ, вычитают из нее ординаты не-


скорректированной ЛАХ. Полученная разностная ЛАХ соответствует передаточной
функции последовательного корректирующего звена. Например, при Lс (ω ) и Lск (ω ) ,

представленных на рис. 1.84, ЛАХ корректирующего звена Lк (ω ) = Lск (ω ) − Lс (ω ) соответ-


ствует передаточной функции вида
(T2 p + 1)(T3 p + 1)
Wk ( p) = , (1.147)
(T1 p + 1)(T4 p + 1)

где Ti = 1 ωi i = 1, 4 - постоянные времени, определяемые сопрягающей частотой ωc .

Как отмечалось выше, последовательное корректирующее звено с передаточной


функцией (1.147) может быть заменено эквивалентным параллельным звеном или звеном
с обратной связью.

332
РАЗДЕЛ II
ОСОБЫЕ ЛИНЕЙНЫЕ АВТОМАТИЧЕСКИЕ СИСТЕМЫ
УПРАВЛЕНИЯ
К особым линейным системам, относятся системы, содержащие звенья, динамиче-
ские процессы в которых не описываются обыкновенными линейными дифференциаль-
ными уравнениями с постоянными коэффициентами. К таким звеньям относятся звенья с
запаздыванием, реакция которых на входной сигнал появляется через определенное время
τ; звенья с распределенными параметрам, переходные процессы в которых описываются
дифференциальными уравнениями в частных производных, что физически соответствует
изменению переменных не только во времени, но и в пространстве; импульсные звенья,
преобразующие непрерывное входное воздействие в равностоящие друг от друга импуль-
сы, для математического описания которых используется разностные уравнения. Исследо-
вание систем управления, содержащих такие звенья, имеет некоторые особенности, кото-
рые необходимо учитывать при их анализе и синтезе.
К особым системам обычно относят и системы содержащие звенья описываемые
линейными дифференциальными уравнениями с переменными коэффициентами, завися-
щими от времени. Например, если система управления описывается дифференциальным
уравнением вида
a0 y ( n ) + a1 y ( n−1) + ... + an−1 y& + an y = b0 x ( m ) + b1 x ( m−1) + ... + bm−1 x& + bm x ,

и все или некоторые из коэффициентов этого уравнения ai , b j (i = 1, n; j = 1, m) являются

функциями времени, то система называется нестационарной, или системой с переменны-


ми параметрами. Наиболее распространенный метод исследования таких систем носит на-
звание метода замороженных коэффициентов, который заключается в замораживании
числовых значений переменных коэффициентов уравнения системы в определенный фик-
сированный момент времени t = ϑ , что позволяет применять к системе методы анализа и
синтеза линейных систем с постоянными параметрами. При этом исследование системы с
замороженными коэффициентами должно быть последовательно произведено для различ-
ных моментов времени t = ϑ , лежащих в интервале 0 < ϑ < T , где Т- время работы систе-
мы. Если во всем рабочем диапазоне от 0 до Т качество системы управления оказывается
приемлемым, то ее считают работоспособной и при изменении коэффициентов в исследо-
ванных пределах.
Подчеркнем, что этот метод дает правильные результаты, если в течение переход-
ного процесса (пока функция веса не затухнет практически до нуля) коэффициенты урав-

333
нения системы, мало изменят свое значение. Следует отметить, что эффективность рас-
сматриваемого метода также зависит и от правильного выбора фиксированных моментов
времени, для которых производится замораживание коэффициентов. Необходимо так вы-
бирать эти моменты, чтобы охватить все возможные варианты значений коэффициентов,
обратив внимание на «опасные» точки, в которых происходит значительное изменение
величины коэффициента, его знака и т.п.

5. СИСТЕМЫ С ЗАПАЗДЫВАНИЕМ И РАСПРЕДЕЛЕННЫМИ


ПАРАМЕТРАМИ

5.1. СИСТЕМЫ С ЗАПАЗДЫВАНИЕМ


К этим системам относятся такие, в составе которых имеется звено с чистым за-
паздыванием, т.е. звено у которого выходная величина y(t) повторяет все изменения вход-
ной величины с постоянным сдвигом во времени, равным τ.
Уравнение звена с чистым запаздыванием имеет вид:
y(t) = x(t–τ), (2.1)
x где τ- время запаздывания.
Примером звена с чистым запаздыванием может служить
y
обычный конвеер (рис.2.1), реакция которого y(t) запаздывает по
x 1(t)
1 отношению к входному воздействию x(t) на время транспортирова-
t ния груза τ от места его подачи на конвейер до места выгрузки.
y h(t)=1(t–τ) Именно поэтому время τ, иногда называют транспортным запазды-
1
ванием.
τ t
Рис. 2.1
Преобразуем уравнение (2.1) по Лапласу, сделав замену пе-
ременной θ = t − τ , откуда t = θ + τ . Тогда получим
∞ ∞
Y ( p ) = ∫ x(t − τ )e − pt dt = ∫ x (θ )e − pθ e − pτ dθ = e − pτ X ( p ) .
0 0

При этом передаточная функция звена с запаздыванием имеет вид


Y ( p)
Wτ ( p) = = e − pτ . (2.2)
X ( p)

а его частотные характеристики – АФЧХ Wτ ( jω ) = e − jωτ ; АЧХ A(ω ) = 1 ;

ФЧХ ϕ (ω ) = −ωτ , представлены на рис.2.2. Переходная характеристика звена при x=1(t)


имеет вид, показанный на рис.2.1

334
Заметим, что звено с запаздыванием является неминимально-фазовым, так как в
отличие от усилительного звена с A(ω ) = 1 и ϕ (ω ) = 0 звено с запаздыванием имеет сдвиг
фаз, отличный от нуля и пропорциональный времени τ.
Приведенные характеристики пока-
зывают, что при любых частотах сигнал на
входе звена с чистым запаздыванием пере-
дается без искажения (A(ω) = 1), поэтому
понятие полосы пропускания частот в дан-
ном случае отсутствует. Физически такое
звено, как и дифференцирующее звено, не
может быть реализовано. Однако такие элементы как транспортное устройство системы
достаточно хорошо аппроксимируются этими звеньями. Кроме того, с помощью этих
звеньев в ряде случаев удается достаточно точно аппроксимировать объекты, описывае-
мые линейными ДУ высоких порядков.
Если кривая переходной функции h(t), начиная с момента
времени t = τ, мало отличается от экспоненты, а до момента
t = τ ординаты ее достаточно малы (рис.2.3), то соответствую-
щее приближенное значение передаточной функции объекта
можно записать в виде:
k
W ( p) = Wa ( p)Wτ ( p) = ⋅ e − pτ ,
Tp + 1
рис.2.3
а ДУ преобразованное по Лапласу:
(Tp + 1)epτY(p) = kX(p). (2.3)
В выражении (2.3) параметры T и τ определяются по кривой разгона с применени-
ем того или иного метода обработки экспериментальных данных.
Заметим, что при наличии большого числа последовательно включенных звеньев с
малыми постоянными времени Tμ их можно заменить на звенья с запаздыванием при
n
τ = ∑ Tμ i . Действительно, пусть система содержит n последовательно включенных инер-
i =1

ционных звеньев первого порядка с коэффициентом передачи k = 1 и постоянной времени


Tμ = τ /n. Тогда эквивалентная передаточная функция будет равна:
−n
n
1 ⎛ τp ⎞
W э ( p ) = ∏ Wi ( p ) = = ⎜1 + ⎟ .
i =1 (Tμ p + 1) n
⎝ n⎠

Возьмем предел левой части приведенного выражения при n→∞:

335
−τp
−n ⎡ n

⎛ τp ⎞ ⎛ τp ⎞ τp
lim⎜1 + ⎟ = lim ⎜1 + ⎟ ⎥
⎢ = e − pτ .
n⎠ n →∞ ⎢ n⎠ ⎥
n→∞
⎝ ⎝
⎣ ⎦
α
⎛ 1⎞ n
Здесь учтено, что lim ⎜1 + ⎟ = e . Тогда, обозначив = α , получим результат
α →∞
⎝ α⎠ τp
приведенный выше..
Таким образом, передаточную функцию при достаточно большом числе n
(n > 5÷10), можно аппроксимировать звеном запаздывания с τ = nTμ .
В общем случае передаточная функция линейного звена с запаздыванием имеет
вид:
B ( p ) − pτ
W ( p ) = W л ( p )Wτ ( p ) = e ,
A( p )
а соответствующая частотная функция при Wл (jω) = A(jω)ejϕ(ω) и Wτ(jω)=e-jωτ будет

W(jω) = A(jω)ej[ϕ(ω)-ωτ]. (2.4)


Из выражения (2.4) следует, что для построения АФЧХ линейного звена с запазды-
ванием, необходимо характеристику Wл(jω) повернуть в каждой точке на угол φτ=-ωτ (по
часовой стрелке), что приближает ее к точке (-1;j0), и, следовательно, наличие звена с за-
паздыванием снижает запас устойчивости системы.
Заметим, что реальные переходные процессы в АСУ во многих случаях достаточно
точно могут быть описаны, как линейными ДУ высокого порядка, так и линейными урав-
нениями второго порядка с запаздыванием (принцип акад. Ишлинского). В этом случае
передаточная функция системы имеет вид:
ke − pτ
W ( p) = ,
T 2 p 2 + 2ξTp + 1
где τ, T, ξ, k – параметры, подлежащие определению по экспериментальным данным.
Запишем W(p) в виде:
k B( p )
W ( p) = τp
= .
(T p + 2ξTp + 1)e
2 2
A( p)eτp
Здесь A(p)epτ – характеристический полином.
Решение и анализ трансцендентного уравнения A(p)eτp = 0 затруднено. В связи с
этим передаточную функцию запаздывающего звена иногда представляют в виде ряда Па-
да. Учитывая только первые два его члена, Wτ(p) приближенно заменяют дробно-
рациональной функцией вида:

336
a0 p 2 − a1 p + 1 τ2 τ
Wτ ( p ) = e − pτ = , где a0 = ; a1 = . (2.5)
a0 p 2 + a1 p + 1 12 2
Заметим, что полученная передаточная функция имеет корни числителя в правой
полуплоскости, следовательно, данное звено как и звено с передаточной функцией (2.2) не
является минимально-фазовым.

5.2. СИСТЕМЫ С РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ


К этим системам относятся такие, в составе которых имеется хотя бы одно звено с
распределенными параметрами. В отличие от звеньев с сосредоточенными параметрами,
описываемых обыкновенными ДУ (изменениями состояния звена в пространстве в данном
случае пренебрегают), звено с распределенными параметрами (т.е. параметрами, завися-
щими от пространственных координат) описываются ДУ в частных производных. Это об-
стоятельство приобретает практическое значение при управлении материальными пото-
ками, при передаче информации, например, в виде электрического сигнала по длинным
линиям и т.п. Проиллюстрируем сказанное.
Пример 2.1 Пусть в системе управления гидротурбиной в качестве связующего
элемента между резервуаром воды и гидротурбиной используется трубопровод, по кото-
рому протекает жидкость (рис.2.4). Требуется составить структурную схему модели тру-
бопровода.
Решение. Динамические процессы в трубопроводе, характеризуемые двумя пере-
менными: напором H* и расходом Q*, описываются при некоторых допущениях уравне-
ниями Жуковского:
∂h γ ∂q ∂q 1 ∂h
=− ⋅ ; =− ⋅ . (2.6)
∂x a ∂t ∂x γa ∂t

H* Q*
где h = * , q = * – относительные зна-
H0 Q0
чения напора и расхода соответственно;
H 0* ; Q0* – базовые значения H * и Q * ; а –
скорость распространения звука в трубо-
aQ0*
проводе; γ = ; g – ускорение силы
gFH 0*
тяжести; F – площадь сечения трубопро-
вода.
рис.2.4
Преобразуем уравнения (2.6) по

337
Лапласу при нулевых начальных условиях. Учтя, что

L{h( x, t )} = ∫ h( x, t )e − pt dt = H ( p, x); L{q( x, t )} = ∫ q ( x, t )e − pτ dt = Q ( p, x) , получим:
0

∂H ( p, x) γ
= − pQ ( p, x) , (2.7)
∂x a
∂Q( p, x) p
= − H ( p, x ) . (2.8)
∂x γa
Продифференцируем (2.7) по x и подставим в него (2.8):
∂ 2 H ( p, x ) γ ∂Q ( p, x) p 2
= − p = 2 H ( p, x ) ,
∂x 2 a ∂x a
или
∂ 2 H ( p, x ) p 2
− 2 H ( p, x ) = 0 . (2.9)
∂x 2 a
Аналогично, исключив из (2.8) функцию H(p,x), получим:
∂ 2 Q ( p, x ) p 2
− 2 Q ( p, x ) = 0 . (2.10)
∂x 2 a
Рассматривая координату x как независимую переменную, решим дифференциаль-
ные уравнения (2.9) и (2.10) относительно изображений H(p,x) и Q(p,x). Учтем, что харак-
p2
теристические уравнения ДУ (2.9) и (2.10) одинаковы: k 2 − 2
= 0 *), и имеют два корня:
a
p
k 1, 2 = ± . Тогда решения этих уравнений запишутся в виде суммы двух экспонент:
a
H ( p, x) = A1e k1 x + A2 e k 2 x , (2.11)

Q( p, x) = B1e k1x + B2 e k2 x , (2.12)


где A1; A2; B1; B2 – постоянные интегрирования, определяемые из граничных условий.
Запишем уравнение (2.11) для граничных условий x = 0, x = l:
H(p,0) = A1 + A2, (2.13)
H(p,l) = A1eτp + A2e-τp, (2.14)
где τ = l/a – время пробега звуковой волны вдоль трубопровода.
Продифференцировав (2.11) по x, и учтя (2.7), запишем:
γ
∂H ( p, x )
∂x
( )
= A1 k1e k1 x + A2 k 2 e k 2 x = − pQ ( p, x) .
a


*)
Здесь k= - операция дифференцирования по переменной x.
∂x
338
Тогда, при x = 0, получим:
γ
A1 k1 + A2 k 2 = − pQ ( p,0) .
a
Подставив в полученное выражение значения k1 и k2, имеем:
A1 –A2 = -γQ(p,0). (2.15)
Совместное решение уравнений (2.13) и (2.15) и дает искомые постоянные интег-
рирования A1 и A2, подставив которые в выражение (2.14) окончательно получим:
H ( p, l ) = H ( p,0)chτp − γQ( p,0) shτp , (2.16)

e τp + e −τp e τp − e −τp
где chτp = ; shτp = – гиперболические косинус и синус соответствен-
2 2
но.
Аналогично можно получить:
1
Q( p, l ) = Q( p,0)chτp − H ( p,0) shτp . (2.17)
γ
Обычно интересуются зависимостью значений h(l,t) и q(l,t) на выходе трубопрово-
да от напора h(0,t) и относительной степени открытия регулирующей заслонки μ, т.е. рас-
матривают трубопровод как объект с сосредоточенными параметрами*). В этом случае,
исключая переменную Q(p,0) из уравнений (2.16) и (2.17) и учтя, что ch2τp – sh2τp = 1, по-
лучим:
H ( p, l )chτp = H ( p,0) − γQ( p, l ) shτp .

Заменив гиперболические функции экспоненциальными, запишем:


H ( p, l ) = 2 H ( p,0)e − pτ − H ( p, l )e −2 pτ + γQ ( p, l )e −2 pτ − γQ ( p, l ) . (2.18)

Учтя, что обратное преобразование Лапласа от H(p,l), Q(p,l) и e-τp равны,:



1 −τp
dp = h(l , t ) ; L {Q(p,l)}=q(l,t); L {e } = 1(t − τ ) ,
−1
∫ H ( p , l )e
-1
L−1{H ( p, l )} = pt

2π −∞

уравнение (2.18) можно переписать для оригиналов в следующем виде:


h(l,t) = 2h(0,t-τ) – h(l,t-2τ) + γq(l,t-2τ) – γq(l,t). (2.19)
Полученное уравнение связывает две искомые величины h(l,t) и q(l,t) в конце тру-
бопровода связаны с напором в его начале h(0,t). Чтобы сделать задачу определенной, к
уравнению (2.19) необходимо добавить уравнение расхода q(l,t):

q (l , t ) = μf [h(l , t )] ≈ μ 1 + h(l , t ) . (2.20)

*)
Изменение переменных в пространстве целесообразно рассматривать в случае использования распределенно-
го управления.

339
Совместное решение уравнений (2.19) и (2.20) позволяет определить искомые зна-
чения h(l,t) и q(l,t) в конце трубопровода при известных значениях напора h(0,t) в его на-
чале и положение заслонки μ .
Анализ уравнения (2.19) показывает, что протяженный трубопровод можно заме-
нить усилительными звеньями с запаздыванием (т.к. жидкость, в отличие от газа, несжи-
маема), а произведя линеаризацию выражения (2.20), можно применять методы анализа
линейных систем с запаздыванием.
Структурная схема модели, предназначенная для определения величин h(t ) x=l и

q(t ) x=l , т.е. для определения изменения напора и расхода в точке x=l (рис.2.5), составляет-

ся на базе уравнений (2.19) и


(2.20). На вход модели пода-
ем сигналы, пропорциональ-
ные h(0,t) и μ, которые, прой-
дя через звенья модели, пре-
образуются в искомые пере-
менные h(l, t) и q(l,t). Здесь:
ЗЗ – звено с запаздыванием;
УЗ – усилительное звено; БУ
– блок умножения; ФБ – функциональный блок с входом h(l,t) и выходом
f (h) = 1 + h(l , t ) ; I, II, III, IV – слагаемые уравнения (2.19).
Заметим, что полученный вывод о возможности записи звеньев с распределенны-
ми параметрами звеньями с запаздыванием вытекает из чисто физических соображений:
объект с распределенными параметрами можно представить как n последовательно вклю-
ченных элементарных звеньев первого порядка, а было показано выше (п.5.1) такие звенья
можно представить запаздывающим звеном.

5.3. УСТОЙЧИВОСТЬ СИСТЕМ С ЗАПАЗДЫВАНИЕМ


В силу трансцендентности передаточной функции звена с запаздыванием, характе-
ристическое уравнение замкнутой системы будет также трансцендентным, и поэтому ал-
гебраические критерии устойчивости непосредственно использованы быть не могут. В то
же время, частотные критерии Михайлова и Найквиста могут быть обобщены и на случай
систем с запаздыванием. В этом случае используется уравнение Эйлера: e-jωτ = cosωτ –
jsinωτ.

340
Критерий Михайлова. Пусть имеем систему
Wл(p) Wτ (p)
(рис.2.26), включающую звено с запаздыванием:
Рис 2.26
Wτ(jω) = e− jωτ , а остальная часть системы описывается обык-
новенными ДУ и имеет передаточную функцию:
B ( jω )
W л ( jω ) = .
A( jω )
Запишем передаточную функцию замкнутой системы по каналу y*→ y:
B( p )e − pτ
Wy * y ( p ) =
A( p ) + B( p )e − pτ
(2.21)
Воспользовавшись (2.21), запишем характеристический полином системы:
D(p) = A(p) + B(p)e-pτ, и, положив p = jω , - уравнение кривой Михайлова:

D(jω) = A(jω) + B(jω)e-jωτ.


(2.22)
Критерий Михайлова для систем с запаздыванием формулируется практически
также, как и для линейных систем без запаздывания: для того, чтобы линейная система,
включающая звено с запаздыванием, была устойчива, необходимо и достаточно, чтобы
годограф вектора Михайлова D(jω) при изменении ω от нуля до бесконечности, нигде не
π
обращаясь в нуль, повернулся на угол + n , где n – степень полинома A(p).
2
Рассмотрим некоторые примеры применения критерия Михайлова к исследованию
устойчивости систем с запаздыванием.
1. Пусть B(jω) = c = const. Поделив выражение (2.22) на c, получим:
D ( jω )
D * ( jω ) = = A * ( j ω ) + e − jωτ , (2.23)
c
A( jω )
где A * ( jω ) = .
c
На рис.2.7 отдельно построены годографы векторов, входящих в выражение (2.23).
Анализ размещения годографов на комплексной
плоскости (рис.2.7,а) показывает, что если годограф кри-
вой A*(jω) не пересекает окружность единичного радиуса
и проходит последовательно n квадрантов, то и годограф
D*(jω) проходит квадранты в той же последовательности.
Таким образом в соо тветст-
вии с критерием Михайлова

341
все корни уравнения D (p) = 0 лежат в левой полуплоскости, и, следовательно, система
устойчива. Если годограф A*(jω) не отвечает сформулированным требованиям (рис.2.7,б),
то система с запаздыванием будет неустойчива для любых τ.
При τ = 0 система называется предельной , а кривая Михайлова принимаем вид
D * ( j ω ) = A * ( jω ) + 1 . (2.24)
Из (2.24) вытекает, что годограф Михайлова представляет собой вспомогательную
кривую A * ( jω ) смещенную на комплексной плоскости на единицу враво (рис2.8), что
эквивалентно смещению оси ординат на единицу влево (точка О1). Таким образом, распо-
ложение кривой A * ( jω ) относительно нового начала координат О1 позволяет судить об
устойчивости предельной системы: для того чтобы система была устойчива вспомога-
тельная кривая A * ( jω ) должна охватывать точку О1.
2. Рассмотрим случай, когда предельная система ус-
тойчива, а кривая A*(jω) пересекает окружность единич-
ного радиуса в точке k (рис.2.9,а). Частота ωk, при которой
произошло пересечение двух годографов (e-jωτ и A*(jω)),
называется критической. Если время запаздывания τ = τk
таково, что ωk⋅τk = π–ψk, то, как следует из рисунка,
⏐D*(jωk)⏐ = 0 и система находится на границе устойчиво-
сти. При этом: τ k = π − ψ k , и следовательно, для того, чтобы
ωk

кривая Михайлова охватывала начало координат, необхо-


димо выполнение условия τ < τk .
Таким образом, в рассматриваемом случае, для того, чтобы система была устойчи-
ва, необходимо и достаточно, чтобы вектор A*(jω) при изменении ω от 0 до ∞ последова-
тельно проходил n квадрантов в положительном направ-
лении и кроме того выполнялось условие τ < τk .
Заметим, что если годограф вектора A*(jω) пересе-
кает окружность единичного радиуса дважды (рис.2.9,б),
то имеем две критические частоты ωk1 и ωk2 и два крити-
ческих времени τk1 и τk2. В этом случае дополнительное
условие устойчивости имеет вид: τ < τk min . Для случая

342
изображенного на рис.2.9,б, имеем ψ k 2 > ψ k1 и ω k 2 > ω k1 и следовательно
π −ψ k2
τ k = τk2 = .
min
ωk2

3. Рассмотрим более общий случай, когда B(jω) ≠ const. В этом случае соотношение
(2.22) записывается в виде:
D( jω ) = A(ω )e jϕ A (ω ) + B(ω )e j[ϕ B (ω ) −ωτ ] .
Построив зависимости частотных характеристик A(ω) и B(ω),можно показать, что:
а) если кривые A(ω) и B(ω) (рис.2.10а) не пересекаются, то устойчивость системы
при любых временах запаздывания полностью определяется устойчивостью предельной
системы;
б) если кривые A(ω) и B(ω) пересекаются (рис.2.10б), то система будет устойчивой,

если предельная система устойчива и τ < τk, где τ k = π − ϕ A (ω k ) + ϕ B (ω k ) ; ϕA(ωk) и ϕB(ωk) –


ωk

аргументы комплексных чисел A(jω) и B(jω) при частоте ω = ωk, которая соответствует
точке пересечения кривых.
в) если кривые A(ω) и B(ω) пересекаются дважды и в случае устойчивой предель-
ной системы, необходимым и достаточным условием устойчивости является неравенство
τ < τk min, где τk min соответствует ωk max .
Критерий Найквиста. Этот критерий, обобщенный для систем с запаздыванием,
формулируется также как и для линейных систем: для того, чтобы замкнутая система бы-
ла устойчива, необходимо и достаточно, чтобы годограф вектора АФЧХ разомкнутой сис-
темы Wp(jω) при изменении частоты от нуля до бесконечности не охватывал точку (–1;j0).
Пусть частотная функция разомкнутой системы имеет вид:
Wp(p) = Wл(p)e-pτ. (2.25)
В соответствии с критерием Найквиста, для устойчи-
вой предельной системы ( τ = 0 ) годограф вектора час-
тотной характеристики для разомкнутой системы
Wp(jω) = Wл(jω) не должен охватывать точку (–1;j0).
В случае наличия запаздывания (τ > 0 частотная
характеристика разомкнутой системы ), в соответст-
вии с (2.25), получается перемножением частотных
характеристик Wл(jω) и e − jωτ . Эта процедура заключа-
ется в повороте каждого вектора Wл(jω) на угол (-ωτ).
При этом возможны следующие случаи.

343
1. Пусть предельная система устойчива и годограф вектора Wл(jω) не пересекается
с кругом единичного радиуса (рис.2.11,а). В этом случае замкнутая система будет устой-
чива при любом запаздывании, так как никакой поворот любых векторов Wл(jω) на любой
угол не приводит к охвату точки (–1;j0).
2. Если имеет место пересечение упомянутых характеристик (рис.2.11,б), то при
повороте вектора ОК на угол (π – ψk), где ψk = ωk⋅τk, характеристика Wp(jω) = Wл(jω)e-jωτ
попадает в точку (–1;j0), т.е. система окажется на границе устойчивости. Следовательно,
для того, чтобы система была устойчивой, необходимо ввести дополнительное условие
ψk
τ <τk = .
ωk
Заметим, что если частотная функция разомкнутой системы более сложная, чем
(2.25), например:
B1 ( jω )e jωτ + B2 ( jω )e − jωτ
W p ( jω ) = ,
A1 ( jω )e jωτ + A2 ( jω )e − jωτ

то исследование устойчивости целесообразно проводить при помощи критерия


Михайлова.
Пример 2.2. Пусть передаточная функция разомкнутой системы с запаздыванием
имеет вид

W p ( p) = Wл ( P) ⋅Wτ ( p ) = ⋅ e − pτ (2.26)
a0 p + a1 p 2 + a2 p + a3
3

Числовые значения параметров составляют: а0=0,01с3; а1=0,09с2; а2=0,5с; а3=1,0;


kл=1,6. Требуется определить критическое значение величины запаздывания τ = τ k , опре-
деляющей границу устойчивости.
Решение. Построим частотную характеристику разомкнутой предельной системы.
Воспользовавшись (2.26), имеем
1.6
Wл ( jω ) =
0.01( jω ) + 0.09( jω ) 2 + 0.5( jω ) + 1
3

Годограф вектора Wл ( jω ) представленный на


рис.2.12, свидетельствует об устойчивости предельной
системы. Пересечение кривой Wл ( jω ) с окружностью
Wл(jω)

рис.2.12
единичного радиуса происходит при критической час-
тоте ω k = 4.6 с-1. Следовательно, для того чтобы замк-

нутая система, содержащая звено с запаздыванием Wτ ( p) = e − pτ , была устойчива, должно


удовлетворяться неравенство

344
ψ k 0.967
τ <τk = = = 0.21 с.
ωk 4.6

Здесь величина ψ k была определена из соотношения ψ k = π − arg W ( jωк ) .

Заметим, что при arg W ( jωк ) > π , точка пересечения годографов Wл ( jω ) и e − pτ


всегда будет лежать во втором квадранте комплексной плоскости, т.е. годограф
Wp(jω) при любом значении τ будет охватывать точку (-1, j0) и, следовательно, дополни-
тельное условие устойчивости не выполняется.

5.4. КОРРЕКЦИЯ АСУ ОБЪЕКТАМИ С БОЛЬШИМ ЗАПАЗДЫВАНИЕМ


Для многих технологических процессов: в металлургической, химической, горной,
транспортной и других отраслях промышленности, характерным признаком является су-
щественное время запаздывания (до нескольких десятков минут) реакции объекта (изме-
нения выходной величины y) на изменение управляющего воздействия u. Как показывают
расчеты при определенной величине отношения времени запаздывания объекта τо к его
постоянной времени То (например, при τ o To > 0.5 ) эффективность законов управления,
рассмотренных в предыдущей главе, резко снижается из-за большой статической (П, ПД-
законы) или динамической (И, ПИ, ПИД-законы) ошибки, а в некоторых случаях система
может потерять устойчивость. В связи с этим были разработаны специальные (некласси-
ческие) законы управления: пропорционально-интегрально-разностный (ПИР-закон) и
пропорционально-интегральный по предыстории (ПИП-закон). В отличии от классиче-
ских законов управления, использующих только информацию об отклонении управляемой
величины у от заданного ее значения у* (Δ= у*- у), здесь используется также априорные
сведения об управляемом объекте, на базе которых в классический закон управления
(1.87) вносится определенная коррекция. В случае параллельной коррекции передаточную
функцию скорректированного закона управления W yск ( p ) можно записать в виде

W yск ( p ) = Wδ ( p) + Wк ( p ) , (2.27)

где Wδ ( p) , Wк ( p ) - передаточные функции базового регулятора и корректирующего звена.


Обычно в качестве базового принимается ПИ-регулятор с передаточной функцией (1.90),
которую в данном случае удобно записать в виде
ky k y (Ty p + 1)
Wδ ( p) = k y + = , (2.28)
Ty p Ty p

где k y , Ty - параметры настройки ПИ-регулятора.

345
Для сокращения времени переходного процесса tp и снижения его колебательности
(сокращения числа перерегулирований) скорость нарастания интегральной составляющей
управляющего воздействия u должна уменьшаться с те-
чением времени. В простейшем случае этим требованиям
отвечает корректирующие звено с передаточной функци-
ей
k y ⋅ kк
Wк ( p) = − ⋅ e − pτ к ,
Ty p

где k к , τ к - параметры настройки корректирующего зве-


на.
С учетом (2.28) и (2.29) выражение (2.27) для про-
Рис.2.13 порционально-интегрально-разностного закона регули-
рования (ПИР-регулятор) можно записать в виде
ky
Wyск ( p) = k y +
T p
(1 − k к ⋅ e− pτ к ) (2.30)
y

Для иллюстрации сказанного на рис.2.13 приведена переходная функция u(t) ПИР-


регулятора (сплошная линия) при подаче на него входного сигнала ошибки Δ(t)=1(t).
Пунктирными линиями показаны составляющие этой функции: 1 – пропорциональная; 2 –
интегральная ( tgα = k y Ty );

3 – интегральная составляющая с запаздыванием ( tg (π − β ) = −k y k к Ty , k к < 1 ). Как видно

из рис.2.13 при t > τ к скорость роста управляющего сигнала снижается, что, как указыва-
лось выше, улучшает качество переходного процесса.
Пример 2.3. Найти параметры ПИР-регулятора, предназначенного для стабилиза-
ции температуры в металлургической печи. Структурная схема АСУ представлена на
рис.2.14. Передаточная функция объекта управления имеет вид
ko
Wo ( p) = ⋅ e − pτ o . (2.31)
To p + 1
Числовые значения параметров (2.31), оп-
ределенные по кривой разгона, составляют
ko=1.0; To =80 c; τo=28 c.
Решение. Соотношение динамических
характеристик объекта τ o To = 0.35 < 0.5 в прин-
ципе позволяет применять стандартный ПИ-

346
регулятор. Для удобства расчетов аппроксимируем передаточную функцию запаздываю-
щего звена рядом Пада (2.5).
a0 p 2 − a1 p + 1 65.3 p 2 − 14 p + 1
e − pτ o = = .
a0 p 2 + a1 p + 1 65.3 p 2 + 14 p + 1
Тогда передаточная функция объекта управления (2.31) запишется в виде
65.3 p 2 − 14 p + 1
Wo ( p) = .
(80 p + 1)(65.3 p 2 + 14 p + 1)
Определим параметры ПИ-регулятора (kу, Tу) с передаточной функцией (2.30) при
k к = 0 , обеспечивающее минимум колебательности переходного процесса, характеризуе-
мой отношением σ 2 σ 1 , где σ 1 , σ 2 - величина пре-
дыдущего и последующего перерегулирования.
Как показали расчеты, наименьшее соотношение
σ 2 σ 1 = 0,16 достигается при значениях парамет-
ров ПИ-регулятора: ky=1,7, Ty=50 c. При этом вре-
мя регулирования tp составляет 350с. Кривая пере-
ходного процесса у(t), полученная на модели при
подаче на вход объекта ступенчатого возмущения
Рис.2.15
f(t)=A ⋅ 1(t), представлена на рис.2.15 (кривая 1).
Дальнейшее улучшение переходного процесса производится путем введения кор-
ректирующего звена (2.29), параметры которого можно определить путем постановки вы-
числительного эксперимента. Обработка полученных результатов позволила найти опти-
мальные значения параметров корректирующих звеньев: kк=0,19; τк=21. Кривая скоррек-
тированного переходного процесса приведена на рис.2.15 (кривая 2). Исследование моде-
ли ПИР-регулятора показывает, что оптимальные его параметры в основном определяют-
ся соотношением τ o To . Сравнение кривых переходного процесса свидетельствуют о том,
что введенное корректирующего звена позволяет существенно улучшить качество пере-
ходного процесса. В частности колебательность процесса уменьшилась примерно на по-
рядок в результате чего переходный процесс практически стал монотонным. Кроме того
реализация ПИР-закона регулирования позволила почти в два раза сократить время регу-
лирования.
* * *
В случае применения пропорционально-интегрального по предыстории закона ре-
гулирования (ПИП-регулятор) передаточная функция корректирующего звена имеет вид

347
⎛ k ⎞
Wk ( p ) = −k y ⎜ k1 + 2 ⎟ ⋅ Wo ( p) = W1 ( p )Wo ( p) , (2.32)
⎜ Ty p ⎟⎠

⎛ k ⎞
где W1 ( p) = −k y ⎜ k1 + 2 ⎟ ; k1,k2 - параметры настройки корректирующего звена; Wo ( p ) -
⎜ Ty p ⎟⎠

передаточная функция объекта с запаздыванием.
Передаточная функция скорректированного устройства управления в соответствии
с (2.27) и с учетом (2.28) и (2.32) имеет вид
[ ]
W yск ( р ) = k y 1 − k1Wo ( p ) + (1 / Ty P )(1 − k 2Wo ( p ) ) . (2.33)

Структурная схема АСУ с ПИП-регулятором представлена на рис.2.16.


Анализ структурной схемы (рис 2.16) показывает что управляющее воздействие u
формируется как алгебраическая
сумма двух составляющих: uб –
составляющая на выходе ПИ-
регулятора; uк – составляющая
звеньев параллельной коррек-
ции. Введение составляющей uк
ослабляет пропорциональную и
интегральную части базовой со-
ставляющей (k1 и k2 меньше единицы) при t > τ o . Последнее условие обеспечивается вве-
дением звена 4, представляющего собой модель объекта управления. Таким образом,
ПИП-регулятор обеспечивает высокий уровень управляющего воздействия u = u б при

t < τ o и плавное снижение этого уровня при t > τ o ( u = u б − u к ). Как и в случае примене-
ния ПИР-регулятора, реализация ПИП закона управления улучшает качество переходного
процесса и увеличивает запас устойчивости по амплитуде и фазе по сравнению с ПИ-
регулятором. Кроме того настройка параметров корректирующего звена k1 и k2, в силу
линейной их связи с пропорциональной и интегральной составляющими выходного сиг-
нала корректирующего звена 3, осуществляется сравнительно просто. К основным недос-
таткам ПИП-регулятора можно отнести необходимость достаточно точного знания мате-
матической модели объекта, что в ряде случаев вызывает определенные затруднения.
Таким образом, введение запаздывающих звеньев в структуру параллельного кор-
ректирующего звена позволяет существенно улучшить качество переходных процессов в
АСУ объектами с существенным запаздыванием.

348
6. ИМПУЛЬСНЫЕ СИСТЕМЫ

Системы, в которых, по крайней мере, между двумя непрерывными её элементами


формирования сигнала производится не непрерывно, а прерывисто, относятся к классу
дискретных систем.
Процесс преобразования непрерывного сигнала в дискретный называется кванто-
ванием (дискретизацией). Различают три основных вида квантования:
1) квантование по времени. При этом выделение значений сигнала х(t) происходит
в определенные равностоящие моменты времени t = nT, где T – период (шаг) квантования
по времени; n = 1, ∞ (рис.2.18,а).Системы, в которых реализуется этот вид квантования,
называются импульсными. Если те или иные параметры импульсов пропорциональны ве-
личине сигнала х(t), то такой вид квантования относится к классу линейной дискретизации
сигнала.
2) квантование по уровню. При этом величина сигнала x(t) изменяется только то-
гда, когда x(t) проходит через один из уровней квантования xi (рис.2.18,б). Разность (xi - xi-
1) называется шагом квантова-
а) б)
ния Δx. Такой вид квантования
имеет место в релейных эле-
ментах, например, с трехпози-
ционной безпетлевой характе-
Рис.2.18
ристикой. Системы, исполь-
зующие такие элементы в принципе относятся к классу нелинейных и называются релей-
ными. Методы исследования таких систем будут рассмотрены в следующем разделе.
3) одновременное квантование по времени и
по уровню, при котором значения сигнала x(t) фикси-
руется в равностоящие дискретные моменты времени,
но их величина округляется до ближайшего уровня xi
(рис.2.19). Такой вид квантования имеет место при
табулировании функции, использовании цифровых
Рис.2.19 машин и т.п. Системы, использующие этот вид кван-
тования называются цифровыми или релейно-
импульсными.
Таким образом, в зависимости от способа квантования сигналов дискретные систе-
мы подразделяются на импульсные, релейные и цифровые, а под линейной импульсной
системой автоматического управления понимается система, которая кроме звеньев, опи-

349
сываемых обыкновенными линейными дифференциальными уравнениями, содержат зве-
но, реализующее линейное квантование сигнала по времени. Заметим, что цифровые сис-
темы управления при малом шаге квантования по уровню сигнала Δx, соизмеримом с при-
борной погрешностью измерительного устройства, могут рассматриваться как импульс-
ные. Следовательно, к таким системам применимы методы исследования динамических
режимов, разработанные для импульсных систем.
Замечено, что процесс регулирования для инерционных систем существенно об-
легчается, если перемещение регулирующего органа производить не непрерывно, а им-
пульсно (дискретно), наблюдая во время паузы за результатами действия импульса. Изме-
нение параметров импульса приводит к изменению средней скорости перемещения регу-
лирующего органа, что эквивалентно изменению коэффициента передачи этого органа.
Кроме того, импульсные системы позволяют реализовать многоканальные системы
управления, радиолокацию и др. Основной смысл введения импульсного управления за-
ключается в освобождении измерительного устройства регулятора от нагрузки на выходе.
Это позволяет применить более точное и тонкое измерительное устройство с обеспечени-
ем в то же время достаточной мощности управляющего воздействия. Так как в дискрет-
ных системах, по сравнению с непрерывными, в принципе происходит потеря информа-
ции об изменениях сигнала, то можно ожидать снижения точности функционирования
системы. Однако при достаточно малом шаге квантования и при сравнительно медленно
меняющихся сигналах, снижение этой точности несущественно. Кроме того, процедура
дискретизации сигнала сопровождается отфильтровыванием высоких частот, увеличивая
помехозащищенность системы, а применение вместо непрерывных устройств цифровых
преобразователей позволяет существенно снизить приборную погрешность. Таким обра-
зом, суммарная точность функционирования дискретной системы, по сравнению с непре-
рывной, может существенно повысится.

6.1 МАТЕМАТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА ФУНКЦИОНИРОВАНИЯ


ИМПУЛЬСНЫХ СИСТЕМ

6.1.1 Разностные уравнения


Основным математическим аппаратом для описания импульсных систем служат
разностные уравнения (уравнения в конечных разностях). Неоднородные линейные разно-
стные уравнения имеют вид:
A0Δmy(nT) + A1Δm-1y(nT) + …+ AiΔm-iy(nT) + …+ Am-1Δy(nT) + Amy(nT) =
= B0Δℓx(nT) +B1Δℓ-1x(nT) + …+BjΔℓ-jx(nT)+…+ Bℓx(nT), i = 0, m ; j = 0, l . (0.1)

350
Здесь x(nT) – входной сигнал системы, определяемый для дискретных моментов
времени t=nT. Так как Т=const, то функция x(nT) является функцией целочисленного ар-
гумента n и называется решетчатой функцией; y(nT) – выходной сигнал системы, свойст-
ва которого аналогичны х(nT); Ai, Bj – постоянные коэффициенты разностного уравнения;
Δiy(nT) –конечная разность i-го порядка.
Проиллюстрируем сказанное. Пусть, напри-
мер, функция y(t) изменяется так, как показано на
рис.2.20. Первая разность этой функции равна Δy(nT)
= y[(n+1)T] – y(nT), т.е. равна длине отрезка 11′, где
11′ – геометрическая интерпретация первой разности
(см. рис.2.20). Заметим, что при Т → 0 первая раз-
ность функции y(t) стремится к ее дифференциалу.
Вторая разность представляет собой разность
первых разностей:
Δ2y(nT) = Δy [(n+1)T] - Δy[nT] = y[(n+2)T] – y[(n+1)T] – y[(n+1)T] + y(nT) =
= y[(n+2)T] – 2y[(n+1)T] + y(nT), т.е. равно длине отрезка 2′2′′, где 2′2′′ = 11′ - 22′
– геометрическая интерпретация второй разности.
В общем случае i-тая разность (при t=nT) будет равна:
Δiy(nT) = Δi-1y[(n+1)T] – Δi-1y(nT).
Последовательно понижая порядок разности, можно представить разность любого
порядка в виде алгебраической суммы функции y(t) для различных моментов времени.
Можно показать, что в этом случае:
ι
Δ ι y (νΤ ) = ∑ (−1)κ ⋅ Сικ y[(ν + ι - κ )Τ ] , (0.2)
κ =0

i!
где Сik = - число сочетаний из i элементов по k.
k!(i − k)!
Например, воспользовавшись формулой (2.34), определяем вторую разность, поло-

жив i=2. Окончательно получим: С2 = С2 = 1; С21 = 2 и Δ2y(nT) = y[(n+2)T] – 2y[(n+1)T]


0 2

+ y(nT), что совпадает с результатом полученным выше.


Применив линейное преобразование (0.2) ко всем членам разностного уравнения
(0.1), запишем его в виде:
a0y(n+m) + a1y(n+m-1) + …+ am-iy(n+m-i) +…+ am-1y(n+1) + amy(n) =
= b0x(n+ℓ) + …+ bℓx(n). (0.3)

351
Можно показать, что коэффициенты уравнений (0.1) и (0.3) связаны следующим
соотношением:
i
ai = ∑ (−1) i −k Ak C mi −−kk .
k =0

Заметим, что если в уравнении (0.3) коэффициент am=0, то, в отличие от дифферен-
циальных уравнений, можно понизить его порядок, заменив n+1 = k.
Решение однородного разностного уравнения (0.3) при x(t)=0, описывающее сво-
бодное движение импульсной системы, ищется в виде показательной функции

y (t ) = z t . (0.4)

где: z – число подлежащее определению; t = n ; n = 0, ∞ .


После подстановки (0.4) в (0.3) получим:
a0 z(n+m) + a1z(n+m-1) + aiz(n+m-i) + …..+ am-1 z(n+1) + amzn = 0 (0.5)
Сократив (2.37) на zn , имеем:
a0 zm + a1z(m-1) + …+aiz(m-i)+…+am-iz+ am = 0 (0.6)
Уравнение (0.6) называется характеристическим уравнением разностного уравне-
ния (0.3), решение которого и дает искомые числа z. Пусть корни характеристического
уравнения равны zi ( i = 1, m ), тогда получаем m независимых решений типа(0.4). Следова-
тельно, решение уравнения (0.3) может быть представлено в виде суммы вида:
y(n) = C1z1n + C2 z2n + …+Cizin+…+ Cmzmn, (0.7)
где Ci – произвольная постоянная, определяемая из начальных условий.
Корни характеристического уравнения zi в общем случае комплексные числа, ко-
торые могут быть представлены в виде: zi = Аi e jϕi Тогда уравнение (0.7) можно записать в
виде:
m
y (n) = ∑ Сi Аin е jϕi n . (0.8)
i =1

Из выражения (0.8) вытекает, что при модулях комплексных чисел zi меньше еди-
ницы все свободные составляющие затухают, т.е. система устойчива. Таким образом ус-
ловие
z i =mod zi = Ai < 1 (0.9)

является условием устойчивости импульсных систем, ко-


торое можно сформулировать следующим образом: все
корни zi характеристического уравнения (0.6) должны

352
быть расположены на комплексной плоскости корней zi внутри круга единичного радиуса
(рис.2.21).
В зависимости от вида корней характеристического уравнения (0.6) переходный процесс
может иметь апериодический или колебательный характер.
Пример 2.4. Дано линейное однородное разностное уравнение второго порядка с
постоянными коэффициентами:
x(n+2) + a1x(n+1) + a2x(n) = 0.
(0.10)
Требуется найти его решение.
Решение. Запишем характеристическое уравнение выражения (0.10):
z2 + a1z +a2 = 0.
(0.11)

а а12
Корни уравнения (0.11) равны: z1,2 =− 1 ± − а 2 . Тогда в соответствии с (0.7)
2 4
решение разностного уравнения (0.10) будет иметь вид:
x(n) = C1z1n + C2 z2n,
где C1 и С2 – постоянные величины, определяемые из начальных условий: при t = 0 x(n) =
x(0); x(n+1) = x(1)
Подставив начальные условия в полученное решение, имеем:
z2 х( 0 ) − х( 1 )
x( 0 ) = C1 + C 2 ⎫ С1 = ;
⎪ z2 − z1
⎬, откуда
х( 1 ) − х( 0 )z1
x( 1 ) = C1 z1 + C 2 z 2 ⎪⎭ С2 = .
z2 − z1
Допустим, что корни характеристического уравнения равны: z1=-0,1; z2=-0,5. Пусть
при импульсном возмущении начальные условия будут: x(0)=0; x(1)=0,4. Тогда постоян-
ные величины равны: С1=1, С2= -1, и решение уравнения примет вид:
x(n)=(-0,1)n-(-0,5)n
График изменения решетчатой функции x(n) при объкте управления, описываемом
уравнением первого порядка, представлен на рис.2.22,а.

а) б)
x(n) x(n)
0,4 0,4
0,2
0,2
1 2 3 4
n
0,2
1 2 3 4 n

Рис.2.22

353
При z1=0,1; z2=0,5 и тех же начальных условиях получим: С1=-1, С2= 1. Тогда
x(n)=(0,5)n -(0,1)n и переходный процесс, представленный на рис.2.22,б, носит апериоди-
ческий характер.
Пример 2.5. Решим систему разностных уравнений с правой частью
x(n+1) +x(n) = b01y(n), (0.12)
y(n+1) + a12y(n) = b02x(n). (0.13)
Решение. Исключим переменную х из приведенной системы уравнений. Для чего за-
пишем уравнение (0.13) для n+1 интервала:
y(n+2) + a12y(n+1) = b02x(n+1). (0.14)
Из уравнений (0.13) и (0.14) определим x(n) и x(n+1) и, подставив найденные зна-
чения в (0.12), окончательно получим:
y(n+2) + (1+a12) y(n+1) + (a12 – b01 b02) y(n) = 0. (0.15)
Уравнение (2.47) решается также, как и в предыдущем примере.
Заметим, что если a12 = b01b02, то произведя замену переменных n+1=k, уравнение
(0.15) можно записать в виде: y(k+1) + (1+a12) y(k) = 0. Полученное уравнение является
разностным уравнением первого порядка, т.е. порядок исходного уравнения (0.15) пони-
зился.
Пример 2.6. Рассмотрим импульсную
систему автоматического управления темпера-
турой в печи, функциональная схема которой
представлена на рис.2.23.
Уравнения отдельных звеньев, системы
имеет вид.
1. Уравнение объекта управления (ОУ):

To + Θ = − k0 ⋅ ϕ ,
dt
(0.16)
где Θ - отклонение температуры печи Θп от её заданного значения Θп*; ϕ - перемещение
регулирующего органа (РО), управляющего расходом подаваемого энергоносителя q; Тo,
k0 – постоянная времени и коэффициент передачи объекта соответственно.
2. Уравнение регулирующего органа совместно с исполнительным механизмом
(ИМ):

= k1 ⋅ U , (0.17)
dt

354
где U – напряжение, подводимое к двигателю исполнительного механизма; k1 – коэффи-
циент передачи.
3. Функционирование импульсного регулятора (ИР), реализующего широтно-
импульсную модуляцию (см.п.6.2), описывается следующими уравнениями:

U = c ⋅ signΘ(t ) при n ≤ t < n + γ ⎫⎪


⎬ (0.18)
U =0 при n + γ ≤ t < n + 1⎪⎭
γ = kи ⋅ Θ(n) = kи ⋅ Θ(n) ⋅ sign Θ ; (0.19)

Здесь с=const; t = t / T ; Т – период квантования; γ =tи/T - ширина импульса; kи – ко-


эффициент передачи импульсного элемента.
Решение. Для определения значений переменных в начальные моменты периода
квантования Т проинтегрируем уравнения (0.17) с учетом (0.18) внутри n-го периода.
Имеем
dϕ=k1.⋅T⋅Ud t =k1 ⋅T⋅c⋅signΘ( t )d t . (0.20)

Интегрируя(0.20) при n ≤ t < n + γ , получим:


t
ϕ ( t ) = ϕ (n) + k1 ⋅ T ⋅ c ⋅ sign Θ(n) ∫ dt = ϕ (n) + α ( t − n) ⋅ sign Θ(n), , (0.21)
n

где α = k1 ⋅ T ⋅ c ; ϕ(n) – значение ϕ в начале n-го периода.

Интегрируя (2.52) при n + γ ≤ t < n + 1 найдем:


n +γ

ϕ (t ) = ϕ (n) + k1 ⋅ T ⋅ c ⋅ sign Θ(n) ⋅ ∫ dt = ϕ (n) + α ⋅ γ ⋅ sign Θ(n) = ϕ (n + γ ) . (0.22)


n

Из (0.22) следует, что исполнительный механизм играет


роль запоминающего устройства, так как значение ϕ( t ) остает-
ся постоянным на протяжении всей паузы и равным ϕ(n+γ).
Изменение координат системы U(t) и ϕ( t ) иллюстрируется на
рис.2.24.
Заметим, что при достаточно малых периодах квантова-
ния Т движение исполнительного механизма может приобрести ϕ(n+1)

практически непрерывный характер, что позволяет производить ϕ(n)

расчет обычными методами линейной теории управления. Рис.2.24

Значение ϕ( t ) для конца n-го и, следовательно, начала (n+1) периода найдем, под-
ставив (0.19) в (0.22) и учтя, что │signΘ(n)│=+1:
ϕ(n+1)=ϕ(n)+αkиΘ(n). (0.23)

355
t
С учетом того, что t = , уравнение объекта (0.16) можно записать в виде:
T
dΘ T
+ β Θ = − k0 βϕ , где β = . (0.24)
dt To
Известно, что решение уравнений первого порядка с правой частью:
dy − p ( x ) dx ⎡ ∫ p ( x ) dx dx + C ⎤ , где С – постоянная ин-
+ p( x) y = q ( x) , ищется в виде: y = e ∫ ⎢⎣ ∫ q ( x ) e ⎥⎦
dx
тегрирования.
В нашем случае y=Θ; x = t ; р(х)=β; q(х)=-k0βϕ( t ); C=Θ(n). Тогда решение уравне-
ния (0.24) после преобразований примет вид:
t
Θ(t ) = Θ(n) ⋅ е − β ( t − n ) −k 0 βе − β ( t − n ) ∫ е β ( t − n )ϕ (t )d t . (0.25)
n

Вычислим значение Θ( t ) в конце n-го (или начале (n+1) периода). При этом учтем,

что переменная ϕ( t ) в интервале от n до (n+γ) описывается уравнением (0.21), а в интер-

вале от (n+γ) до (n+1) – уравнением (0.22). Тогда подставив в (0.25) t =n+1, после интегри-
рования и преобразований окончательно получим:
Θ(n + 1 ) = Θ(n) ⋅ e − β − k 0 ⋅ ( 1 − e − β ) ⋅ ϕ(n) − k o k и ⋅ α ⋅ ( 1 − e − β ) ⋅ Θ(n) . (0.26)
Здесь учтено, что при γ<<1 значение e β ⋅γ ≈ 1 + β ⋅ γ .

Систему полученных разностных уравнений первого порядка (0.23) и (0.26) за-


пишем в виде:
ϕ(n + 1 ) − ϕ(n) = α ⋅ k и ⋅ Θ(n) ; (0.27)

[ ]
Θ(n + 1 ) + k 0 ⋅ k и ⋅ α ⋅ ( 1 − e − β ) − e − β ⋅ Θ(n) = − k 0 ⋅ ( 1 − e − β ) ⋅ ϕ(n) . (0.28)

Эта система решается аналогично рассмотренной в примере 2.5. Исключив из


уравнений (0.27) и (0.28) переменную ϕ , после преобразований окончательно получим
следующее уравнение движения импульсной системы:
[ ]
Θ( n + 2) + k 0 ⋅ k и ⋅ α ⋅ ( 1 − e − β ) − e − β − 1 ⋅ Θ(n + 1 ) + e − β ⋅ Θ( n ) = 0 . (0.29)
При этом характеристическое уравнение системы имеет вид:

[ ]
z 2 + k0 ⋅ kи ⋅ α ⋅ ( 1 − e − β ) − e − β − 1 ⋅ z + e − β = 0 .

Обозначив а1 = k 0 ⋅ k и ⋅ α ⋅ ( 1 − e − β ) − e − β − 1 , а2= e − β ; найдем кор-

а1 а2
ни z1, 2 = − ± 1 − а2 .
2 4

356
При этом решение уравнения (0.29) запишется в виде: Θ(n)=C1.z1n+C2.z2n , где С1 и

С2 – произвольные постоянные определяемые из начальных условий: Θ(0)=θ0 ; Θ(1)=θ1


При заданных параметрах системы k0, k1, kи, Tо, T, с, γ – можно найти числовые
Т
значения α=k1.T.с=Н; β = , а, следовательно, и коэффициентов а1 и а2 и корней z1, z2.
Тo

На рис.2.25 построены переходные характеристики системы Θ(n) по каналу расход


энергоносителя q(t) – отклонение температуры в печи при следующих параметров ее
звеньев: k0 = 10 oC/рад; k1 = 5⋅10-4 рад/В; То = 100 с; Т = 1,5 То; с = 100В; γ = 0,05. Значение
коэффициента передачи импульсного регулятора принималось равным: kи1= 25⋅10-4 В/оС;
kи2= 12⋅10-4 В/оС; kи3= 50⋅10-4 В/оС. Для всех трех случаев начальные условия принимались
одинаковыми: Θ(0)= 0 ; : Θ(1)=12 оС. Заметим что величина Θ(1) вычисляется путем ре-
шения уравнения объекта (0.16) на на первом интервале квантования по времени.
Приведем результаты расчета для первого варианта при kи = kи1. После подстанов-
ки числовых значений параметров в уравнение (0.29) , получим
Θ(n + 2) − 0.64Θ(n + 1) + 0.22Θ(n) = 0 .

Корни характеристического уравнения: z 2 − 0.64 z + 0.22 = 0 , комплексные сопря-


женные: z1, 2 = 0.32 ± j 0.35 , и следовательно, переходной процесс имеет колебательный

характер. Произвольные постоянные для принятых начальных условий, равны С1=-16,8;


С2= 16,8. Тогда уравнение решетчатой переходной функции запишется в виде
[
Θ(n) = 16.8 (0.32 − j 0.35) − (0.32 + j 0.35) .
n n
]
а) б) в)
kи1 kи2 kи3

Рис.2.25

Решетчатая функция, соответствующая полученной зависимости Θ(n) приведена на


рис.2.25,а. Сопоставление зависимостей Θ(n), приведенных на рис.2.25,а,б,в показывает,
что увеличение коэффициента передачи импульсного регулятора увеличивает склонность
системы к колебаниям. Во всех случаях условия устойчивости выполняются ( zi < 1 ). В

случае, если z i ≥ 1 , необходимо решить задачу параметрического синтеза, т.е. подобрать

357
такие параметры изменяемой части системы (Т, с, γ, kи), при которых она была бы устой-
чивой.
* * *
Рассмотренный метод решения разностных уравнений относится к классическим.
Более эффективным методом решения этих уравнений является метод, использующий так
называемое z-преобразование, играющее для анализа дискретных систем ту же роль, что и
преобразование Лапласа для линейных систем.
6.1.2 Прямое z-преобразование
Запишем последовательность ординат функции x(t) для дискретных моментов вре-
мени t=nT, n= 0, ∞ в виде:

∞ ⎧ 0 , ∀ t ≠ nT

х*(t) = ∑ х(t)δ(t − nT) , где δ(t − nT) = ⎨ . (0.30)
n =0 ⎪⎩δ(nT), ∀ t = nT

Выражение (0.30) формализует за-


x пись решетчатой функции x*(t), представ-
x*(t) x(t)
ленной на рис.2.26.Преобразуем (0.30) по
Лапласу:

X * (р) = ∫ x * (t )e − рt dt .
0

T nT t Так как δ(t-nT) = 0 при t ≠ nT, то зна-


Рис.2.26
чение интеграла на этих отрезках времени
равно нулю и, следовательно, вместо x(t)e-pt можно подставить x(nT)e-pnT , а затем вынести
его из-под интеграла. С учетом сказанного, имеем:
∞ ∞ ∞ ∞
Х*(p) = ∑ ∫ х(t)δ(t)δ( )e dt = ∑ x(nT)e
-рt − pnT
∫ δ(t − nT)dt . (0.31)
n =0 0 n =0 0


Так как ∫ δ (t − nT )dt = 1
0
по определению, то выражение (0.31) можно записать в

виде:

Х(p) = ∑ x(nT)e − pnT . (0.32)
n =0

Так как правая часть уравнения (0.32) представляет собой дискретную функцию
целочисленного элемента n, то знак дискретности * может быть опущен.

358
Выражение (0.32) введено Я. З. Цыпкиным и носит название дискретное преобра-
зование Лапласа или D-преобразование: X(p) = D{x(nT)}. Заметим, что функция x(nT), как
и в случае преобразования Лапласа, должна тождественно равняться нулю при n<0.
Обозначим pT = q. Тогда eq = z является комплексным числом и выражение (0.32)
можно записать в виде:

∑ x(nT)z
n=0
−n
= Х(z) = Z { x(nT)} . (0.33)

Функция X(z) комплексного аргумента z полученная в соответствии с (0.33) носит


название z-преобразование решетчатой функции x(nT).
Пример 2.7. Найдем z-преобразования некоторых решетчатых функций:
1) единичной ступенчатой - x(nT) = 1(nT) , представленной на рис. 2.27,а;
2) экспоненциальной - x(nT)=e-αnT (рис.2.27,б);
3) линейной - x(nT) =nT (рис.2.27,в).
Решение. Найдем z-преобразование для всех трех случаев, воспользовавшись вы-
ражением (0.33).

1. Z{ 1(nT)} = ∑1(nT)z − n = 1 + z −1 + z −2 + K + z n + K
n =0

Пр
авая часть полученного выражения представляет собой сумму бесконечно убывающей
геометрической прогрессии со знаменателем z-1. Тогда получим:
1 z
Z{ 1(nT)} = −1
= .
1− z z −1

2. Z{e −αnT } = ∑ e −αnT z − n = 1 +e −αT z −1 + e − 2 αT z − 2 + K + e −αnT z − n + K
n =0

В данном случае знаменатель геометрической прогрессии равен e-αTz-1. Тогда полу-


чим:
1 z
Z{e −αnT } = −αT −1
= .
1− e z z − e −αT

3. Z {nT } = ∑ nTz − n = Тz −1 + 2Tz −2 + K + nTz − n + K =
n=0

= Tz (1 + 2 z −1 + 3z −2 + K + nz − ( n −1) + K).
−1

359
Выражение в скобках, стоящее в правой части полученного уравнения, представля-
ет собой разложение бинома Ньютона вида (1 – z-1)-2. Тогда можно записать:
Tz
Z {nT } = Тz −1 (1 − z −1 ) −2 =
( z − 1) 2
Заметим, что во всех рассмотренных примерах коэффициенты при общем члене
ряда, представляет собой оригинал решетчатой функции x(nT).
* * *
Сформулируем основные свойства z-преобразования.
1. Свойство линейности, вытекает из определения (0.33).
m m
Z {∑ a j x j (nT )} = ∑ a j Z{x j (nT )} . (0.34)
j =1 j =1

Это свойство позволяет применять z-преобразования к каждому члену разностного


уравнения.
2. Теорема сдвига (смещение аргумента в области оригинала на τ =mT).
Пусть τ = T. Найдем z-преобразование решетчатой функции x(nT+T). Имеем:
∞ ∞ ∞
Z{x(nT +T )} = ∑x(nT +T )z−n = k = n +1 = z∑x(kT )z−k = z∑x(kT)z−k − zx(0) = z[ X ( z ) − x(0) ].
n=0 k =1 k =0

В общем случае получим:


⎡ m −1

Z {x(nT + mT )} = z m ⎢ X ( z ) − ∑ x(kT ) z − k ⎥ . (0.35)
⎣ k =0 ⎦
Соотношения (0.34) и (0.35) позволяют получить z-преобразование разностных
уравнений.
Пример 2.8. Пусть система описывается разностным уравнением второго порядка:
x(n+2) + a1x(n+1) +a2x(n) = 0. Требуется найти его z-преобразование.
Решение. Воспользовавшись свойством линейности (0.34), запишем:
Z{x(n+2)} + a1Z{x(n+1)} + a2Z{x(n)} = 0.
На основании теоремы сдвига (0.35), можно записать:
z2 [X(z) – x(0) –x(1)z-1] + a1z[X(z) –x(0)] + a2X(z) = 0.
Откуда:
x(0) z 2 + [a1 x(0) + x(1)]z
X ( z ) = Z {x(n)} = .
z 2 + a1 z + a 2
* * *
Подчеркнем что, применение z-преобразования для решения разностных уравнений
(как и применение преобразования Лапласа для решения дифференциальных уравнений)

360
позволяет алгебраизировать разностные уравнения и автоматически учесть начальные ус-
ловия.
3. Теорема запаздывания (смещение аргумента в области оригинала в сторону τ = -
mT)
Иногда разностные уравнения записывают, используя смещения в сторону запаз-
дывания. Например, обозначив n+m=k, разностное уравнение, рассмотренное в примере
2.8 (при т=2) можно переписать его в виде: x(k) + a1x(k-1) +a2x(k-2) = 0
В общем случае, учтя, что k – m = n, имеем:

⎡∞ −1

Z {x[(k − m)Т ]} = ∑ x(nT ) z −k
= z −k = z −m z − n = z − m ⎢∑ x(nT ) z − n + ∑ x(nT ) z − n ⎥ =
k =0 ⎣ n =0 n=− m ⎦
( n=− m)

⎡ m

= z −m ⎢ Х ( z ) + ∑ x(−nT ) z n ⎥ .
⎣ n =1 ⎦
Так как при nT<0 x(nT)=0 по определению, то второе слагаемое в квадратных скоб-
ках равно нулю. Тогда окончательно получим:
Z{x[(k-m)T]} = z-mX(z). (0.36)
4. Теорема о конечном значении.
Конечное значение функции x(nT) равно:
lim x(nT ) = x(∞) = lim( z − 1) X ( z ) . (0.37)
t →∞ z →1

Для доказательства справедливости приведенного выражения найдем


z-преобразование первой разности:
Z{x[(n+1)T] – x(nT)} = z[Х(z) – x(0)] – X(z)=(z–1)X(z) –zx(0). (0.38)
С другой стороны z-преобразование этой же разности можно записать следующим
образом:
k
Z{x[(n + 1)T] – x(nT)} = lim
k →∞
∑ {x [( n + 1)T ] − x ( nT ) } z
n=0
−n
. (0.39)

Приравняв правые части, уравнении (0.38) и (0.39) и взяв от обеих частей предел
при z→1, получим:
k
lim[ ( z − 1) X ( z ) − zx (0 )] = lim{lim ∑ { x[( n + 1)T ] − x ( nT )} z − n =
z →1 z →1 k → ∞
n=0

= lim {x (T ) − x ( 0 ) + x ( 2T ) − x (T ) + x (3T ) − x ( 2T ) + K + x[( k + 1)T ] − x ( kT )} =


k →∞

= lim{− x ( 0 ) + x[( k + 1)T ]}.


k →∞

361
−n
Здесь учтено, что lim z = 1 и произведено сокращение подобных членов в фигур-
z →1

ных скобках. Взяв предел от полученного выражения, окончательно получим:


lim[( z − 1) X ( z )] = x (∞ ) , что и требовалось доказать.
z →1

5. Теорема о начальном значении:


Начальное значение функции x(t) равно конечному значению ее z-преобразования
X(z):
x (0) = lim X ( z ) . (0.40)
z →∞

Действительно, по определению имеем



X ( z ) = ∑ x(nT ) z − n = x(0) + x(T ) / z −1 + x(2T ) / z − 2 + K .
n =0

Взяв предел от этого выражения при z → ∞ получим выражение (0.40) .


6.1.3 Обратное z-преобразование
Нахождение оригинала x(nT) по известному z-преобразованию X(z) называется об-
ратным z-преобразованием: Z −1{Z ( z )} = x(nT ).
Эта операция осуществляется следующими способами:
1. Пользованием таблицами прямого и обратного z-преобразования. Фрагмент та-
кой таблицы представлен ниже:
Таблица 2.1
x(nT ) 1(n) nT e −αnT sin βnT cos βnT 1 − e −αnT

z Tz z z sin βT z ( z − cos βT ) (1 − e −αT ) z


X (z )
z −1 ( z − 1) 2 z − e −αT z 2 − 2 z cos βT + 1 z − 2 z cos βT + 1
2
( z − 1)( z − e −αT )

2. Разложением z-преобразования X(z) в ряд по степеням z-1 в окрестностях рабочей


точки z0=0.
Так как из определения z-преобразования следует, что коэффициент при z-n разло-
жения в ряд функцию X(z) равен значению x(nT), то, воспользовавшись соотношением
(0.33) и записав z-преобразование в виде ряда, получим:

X(z) = ∑ x(nT )z - n = x(0) + x(T)z-1 + x(2T)z-2 + …. + x(nT)z-n + … (0.41)
n =0

Коэффициент при общем члене ряда (0.41) и является искомой функцией x(nT).
Tz 2
Пример 2.9 Пусть X ( z) = . Необходимо найти x(nT).
( 1 − z)2
Решение. Представим X(z) в виде ряда, для чего z2 поделим на (1-z)2:

362
z2: (z2- 2z+1)= 1+2z-1+3z-2+…+(n+1)z-n+…
Тогда можно записать:
X(z) = T [1 + 2z-1 + 3z-2 + …+ (n+1)z-n + …], откуда x(nT) = (n+1)T.
* * *
3. Общий метод нахождения оригинала базируется на том, что ряд вида (0.41) от-
носится к ряду Лорана. Известно, что коэффициент этого ряда C-n при z-n вычисляется по
формуле:
1
С −n = ∫ X ( z ) z n −1 dz = Z −1 {X ( z )} . (0.42)
2πj
Выражение (0.42) является обратным z-преобразованием, аналогичным обратному
преобразованию Лапласа.
Воспользовавшись (0.42), можно показать, что в случае, если X(z) является дробно-
В( z )
рациональной функцией, т. е. X ( z ) = , где В(z) и A(z) – алгебраические полиномы,
A( z )
причем степень полинома В(z) меньше степени полинома А(z), то оригинал x(nT) можно
найти по формуле:
N
B( z k ) n−1
x(nT ) = ∑ zk , (0.43)
k =1 Az/ ( z k )
где: zk – корни характеристического уравнения A(z)=0; N– общее количество корней того
же уравнения; Az/ ( z ) - производная полинома A(z) по z.
Выражение (0.43) является аналогом теоремы разложения Хевисайда-Карсона ис-
пользуемой для нахождения оригинала в операционном исчислении.
Пример 2.10 Пусть z-преобразование решетчатой функции x(nT) задано в виде, по-
лученном в примере 2.8.
x(0) z 2 + [a1 x(0) + x(1)]z
Z {x(nT )} = . (0.44)
z 2 + a1 z + a 2
Примем, что числовые значения коэффициентов равны: а1 = -1; а2 = 3/16, а на-
чальные условия: x(0) = 0; х(1) = 2 . Найдем решетчатую функцию x(nT).
Решение. Подставим числовые значения параметров в выражение (0.44), получим:
2z
X ( z) = .
z − z + 3 / 16
2

Корни характеристического уравнения A(z)= z2 –z + 3/16 = 0, равны:


z1 = 0,75; z 2 = 0,25.

Заметим, что так как |zi|<1 то lim x ( n) = 0 , и следовательно система устойчива.


n →∞

363
Воспользовавшись теоремой разложения (0.43), получим:
2
B( z k ) 2 z1 2z2
x ( n) = ∑ z kn = z1n + z 2n . (0.45)
k =1 z k Az′ ( z k ) z1 (2 z1 − 1) z 2 (2 z 2 − 1)
Здесь коэффициенты при zin представляют собой постоянные величины Cn, которые
после подстановки числовых значений z1 и z2 равны: С1=4, С2=-4. Тогда выражение (0.45)
примет вид:
x(n) = C1 z1n + С2 z 2n = 4[(0,75) n − (0,25) n ] (0.46)
Переходный процесс в системе, построенный в соответствии с выражением (0.46),
представлен на рис.2.28. Здесь кривая 1 представляет собой
график весовой функции w(t) непрерывной системы, описы-
ваемой дифференциальным уравнением второго порядка, а
решетчатая функция 2 – график дискретной весовой функ-
ция w(n) для той же системы.
Заметим, что обычное z-преобразование позволяет
определять значения x(nT) по известному X(z) только для
дискретных моментов времени t=nT, где T=const.
6.1.4 Модифицированное z-преобразование
Если необходимо определять величину x(t) в любой момент времени, то пользуют-
ся модифицированным z-преобразованием, которое имеет вид:

X ( z , ε ) = Z {x[(n + ε )T ]} = ∑ x[(n + ε )T]z -n , (0.47)
n =0

где x[(n+ε)T] – решетчатая функция, сдвинутая относительно момента времени nT на ве-


личину εT (0<ε<1).
Пусть, например, x[(n+ε)T] = (n+ε)T –дискретная прямая, смещен- x
ная на время εT (рис.2.29). Модифицированное z-преобразование этой пря-
x[(n+ε)T]
мой найдем, воспользовавшись (0.47) и данными таблицы 2.1. x(nT)
∞ ∞ ∞
Tz z
X ( z , ε ) = ∑ (n + ε )Tz −n = ∑ nTz −n + ∑ εTz −n = + εT .
n =0 n =0 n =0 ( z − 1) 2
z −1 T 2T t
εT
Нахождение оригинала модифицированного z-преобразования про- Рис.2.29

изводится аналогично обратному z-преобразованию рассмотренному выше. Так как вели-


чина ε=const, то соответствующие сомножители могут быть вынесены за знак интеграла
ze −αεT
(2.60). Например, если X ( z , ε ) = , то
z − e −αT
⎧ z ⎫
Z −1{ X ( z , ε )} = e −αεT ⋅ Z −1 ⎨ −αT ⎬. (0.48)
⎩z −e ⎭

364
Здесь второй сомножитель представляет собой обычное обратное z-преобразование
которое можно найти, воспользовавшись таблицей 2.1. Тогда оригинал выражения (0.48)
запишется в виде дискретной смещенной экспоненты:
x(nT ) = e −αεT ⋅ e −αnT = e −α ( n+ε )T .
Заметим, что в случае запаздывающей функции x(nT–ξT), ее z-преобразование на-
ходится с помощью теоремы запаздывания (0.36). Имеем
x(nT- ξT)=x[(n+ε)T-(k+1)T]. (0.49)
Здесь ξT=τ – время запаздывания; ξ=k+1- ε; k=0,1,2,….
Взяв z-преобразование от левой и правой частей выражения (0.49) с учетом (0.36),
получим:
X ( z , ξ ) = z − ( k +1) X ( z , ε ) ,; k=0,1,2,…. (2.82)
Например, при k=0 и, следовательно, ξ = (1 − ε ) <1, выражение

Ошибка! Источник ссылки не найден. примет вид X ( z , ξ ) = z −1 X ( z , ε ) и, если

zе −αεТ
X ( z, ε ) = , то, воспользовавшись таблицей 2.1 и учтя соотношение (0.36), полу-
z − е −αТ
чим:
x[(n − ε )T ] = e −α ( n −ξ )T .
Выражение Ошибка! Источник ссылки не найден., являющееся z-
преобразованием запаздывающей функции x(nT–τ), может быть использовано при анализе
и синтезе дискретных систем, содержащих звенья с запаздыванием.
6.2 ИМПУЛЬСНЫЕ ФИЛЬТРЫ

Импульсным фильтром или разомкнутой импульсной цепью называют устройство,


состоящие из последовательно включенных импульсного элемента (ИЭ) и непрерывной
части (НЧ) (рис.2.30).
Импульсный элемент предназначен для
дискретизации сигналов во времени. Заметим,
что в соответствии с теоремой Котельникова,
непрерывный сигнал можно полностью (без по-
тери информации) восстановить по его дискрет-
ным значениям, если интервал дискретности Т ≤ Δ = π/ωmax, где ωmax –максимальная час-
тота гармоники, присутствующей в непрерывном сигнале. Если Т>π/ωmax, то высокочас-
тотные составляющие восстановить нельзя, т.е. дискретная система отфильтровывает вы-
сокие частоты и, следовательно, обладает повышенной помехоустойчивостью.

365
Идеальные ИЭ преобразуют непрерывный сигнал в последовательность импульсов,
типа δ-функции, величина которых (интеграл) пропорциональна непрерывному сигналу
x(t) в момент времени t=nT. В реальных системах ИЭ формируют импульсы разнообраз-
ной формы, которые характеризуются определенными параметрами. Изменение парамет-
ров импульсов в функции входного воздействия x(t) называют импульсной модуляцией.
К основным видам моду- б)
а)
ляции прямоугольных импуль-
сов (рис.2.31) относятся:
1. Амплитудно-
импульсная модуляция (АИМ)
(рис.2.31,а). Этот вид модуляции
Рис.2.31
характеризуется постоянным
периодом квантования T = const и длительностью (шириной) импульса tи=const. Амплиту-
да импульса Н пропорциональна величине входного сигнала x(t) в дискретный момент
времени t=nT, т.е. H=kx(nT), где k - коэффициент пропорциональности.
2. Широтно-импульсная модуляция (ШИМ) (рис.2.31,б). Этот вид модуляции ха-
рактеризуется: постоянными периодом квантования (T=const) и абсолютной величиной
амплитуды импульса H=c⋅sign x(nT); c=const. Ширина импульса tи пропорциональна абсо-
лютному значению входного сигнала x(t) в момент времени t=nT, т. е. tи=k│x(nt)│, где k –
коэффициент пропорциональности
Кроме рассмотренных видов модуляций существует время-импульсная, которая
подразделяется на частотно-импульсную (Т=var) и фазо-импульсную (ϕ=var, где ϕ - сдвиг
импульса относительно начала периода nT). Эти виды модуляции применяются в основ-
ном в радиотехнике.
Классическими представителями импульсных элементов, наглядно иллюстрирую-
щими их функционирование является падающая дужка и ключ.*)
1. Падающая дужка, реализующая АИМ (рис.2.32,а). В результате вращения экс-
центрика 1 с постоянной частотой ω, падающая дужка 2 совершает движение «вверх –
вниз», прижимая на определенное время tи стрелку измерительного прибора 3 к потен-
циометру 4. При этом с вы-
a) б)
хода импульсного элемента x(nT)

снимается сигнал x(nT), про- x(t)


x(t)

ω x(nT)

*)
В современной практике эти импульсные элементы заменены технически более совершенными. Однако про-
стота и наглядность функционирования падающих дужек и ключей делает их рассмотрение методически целесообраз-
ным.
ω
366

Рис.2.32
порциональный положению стрелки относительно нулевого значения величины x(t). По
мере удаления стрелки от нулевого положения амплитуда импульсного сигнала увеличи-
вается. Вращение экцентрика осуществляется синхронным двигателем 5.
2. Ключ, реализующий АИМ (рис.2.32,б). Ключ 6 при вращении эксцентрика 1

замыкается на определенное время tu с периодом повторения T = , где ω – частота
ω
вращения двигателя 5.
3. Падающая дужка, реализующая
ШИМ (рис.2.33). Отличие этого устройства
от устройства представленного на рис.2.32,а
заключается в том, что падающая дужка 2
имеет вырез, а потенциометр заменен двумя
контактными пластинами 4. Благодаря выре-
зу на дужке время замыкания цепи (длитель-
ность импульса tu) будет пропорциональна
отклонению стрелки измерительного прибора 3 от нулевого положения в ту или иную сто-
рону. При этом амплитуда импульса остается постоянной.
Определим математический оператор, связывающий входную x(t) и выходную y(t)
переменные импульсного фильтра (рис. 2.30)
Известно, что входная и выходная переменные в непрерывных системах связаны
между собой интегралом Дюамеля (см.п.10.4.2):
t
y (t ) = ∫ w(θ ) x(t − θ )dθ ,
0

где w(θ ) - функция веса непрерывного звена.


Можно показать, что интеграл Дюамеля можно записать и в дискретной форме:
n
y (nT ) = ∑ w(kT ) x(nT − kT ) ,
k =0

или более компактно:


n
y n = ∑ wk x n − k . (0.50)
k =0

Найдем z-преобразование от выражения (0.50), для чего воспользуемся теоремой


свертки, доказательство которой базируется на теореме запаздывания. Пусть имеем
Z{f1(kT)} = F1(z); Z{f2(nT)} = F2(z).
Запишем произведение правых частей приведенных уравнений в виде:

367

F1 ( z ) F2 ( z ) = ∑ f 1 (kT ) z − k F2 ( z ) .
k =0

Учтя, что в соответствии с теоремой запаздывания z − k F2 ( z ) = Z { f 2 (nT − kT )} , по-


лучим
∞ ∞ ∞
⎧∞ ⎫
F1 ( z ) F2 ( z ) = ∑ f 1 (kT )∑ f 2 (nT − kT )z −n
=∑ ⎨∑ f 1 (kT ) f 2 (nT − kT )⎬ z − n =
k =0 n =0 n =0 ⎩ k =0 ⎭
⎧∞ ⎫
= Z ⎨∑ f 1 (kT ) f 2 (nT − kT )⎬ .
⎩k =0 ⎭
Учтя, что f(nT) ≡ 0 при n<0, получим, что: f2(nT – kT) ≡ 0, k>n. Следовательно, верх-
ний бесконечный предел суммы, стоящей в фигурных скобках, можно заменить на конеч-
ный равный n. Тогда получим:

⎧n ⎫
F1 ( z ) F2 ( z ) = ∑ ⎨∑ f1 (kT ) f 2 (nT − kT )⎬ z − n (0.51)
n =0 ⎩ k =0 ⎭
Выражение (0.51) является математической формулировкой теоремы свертки в
дискретном виде.
Возьмем z-преобразование от выражения (0.50). Тогда с учетом (0.51), получим:

Z{yn} = Z{wk} Z{xn-к}. Обозначив Z {wk } = ∑ wk z − k = W * ( z ) , можно записать:
k =0

Z {yn } Y ( z )
W * ( z) = = (0.52)
Z {xn } X ( z )

Выражение (0.52), при условии что x(t) ≡ 0, t<0, представляет собой дискретную
передаточную функцию. В случае подстановки в (0.52): z = epT|p=jω = ejωT, получим дис-
кретную частотную функцию W*(ejωT), позволяющую производить частотный анализ
дискретных систем.
Пример 2.11 Пусть непрерывная часть импульсного фильтра представляет собой
интегрирующее звено с передаточной функцией W(p)=k/p. Требуется найти дискретную
передаточную функцию импульсного фильтра Wф* .

Решение. Найдем функцию веса непрерывной части системы:


w(t) = L-1{W(p)} = L-1{k/p} = k
При этом дискретная весовая функция представляет собой ступенчатый дискрет-
ный сигнал: wn = k(nT) аналогичный представленному на рис.2.27,а, но с амплитудой

z kz
равной k. Тогда имея в виду, что Z {1(nT )} = , получим Z {k (nT )} = = Wф* (z) . По-
z −1 z −1
лученное выражение и представляет собой искомую передаточную функцию импульсного

368
фильтра, которая является дискретным оператором преобразования двух последовательно
включенных элементов: импульсного элемента и непрерывной части.
Подчеркнем, что дискретная передаточная функция последовательно включенных
непрерывных звеньев не равна произведению дискретных передаточных функций этих
звеньев, т.к. для этого требовалось бы иметь импульсные элементы перед каждым непре-
рывным звеном. Поэтому для нахождения передаточной
ИФ
функции сложной дискретной системы необходимо с x(t) x(nT) y
ИЭ НЧ
помощью структурных преобразований или графов све-
Wф* ( z )
сти всю непрерывную часть в одно непрерывное звено, y*

на входе которого стоит один импульсный элемент (рис Рис.2.34

2.34).

6.3 УСТОЙЧИВОСТЬ ИМПУЛЬСНЫХ СИСТЕМ.

Для облегчения анализа функционирования сложной импульсной системы ее сле-


дует привести к виду, представленному на рис.2.34. Пусть дискретная передаточная
функция импульсного фильтра Wф* ( z ) известна. Тогда передаточная функция замкнутой

системы с единичными отрицательной обратной связью будет:


Wф∗ ( z )
W ∗ ( z) = .
1 + Wф∗ ( z )

Воспользовавшись полученным выражением, можем записать Y(z) = W*(z)X(z), что


позволяет найти оригинал, выходного сигнала:
y(nT) = Z-1{Y(z)}.
Известно, что для устойчивой системы необходимо и достаточно, чтобы выполня-
лось следующие условие:
lim Δ(nT) = ε , (0.53)
n →∞

где Δ = ( y* -y) - величина рассогласования (для астатических систем ε = 0 ).


Для нахождения y(nT) воспользуемся теоремой разложения (0.43):
N
B(zk ) n N
y(nT) = ∑ zk = ∑ Сk zkn , (0.54)
k =1 zk A′(zk ) k =1

где zk – корни характеристического уравнения замкнутой системы: 1 + Wф* ( z ) = 0; N – ко-

B(z)
личество корней этого уравнения (k = 1, N ) ; = W * ( z ) - дискретная передаточная
A(z)

369
B(z k )
функция системы; Ck = - постоянные величины; n –относительное дискретное
z k Az′(z k )
время.
Как отмечалось выше, из выражения (0.54) вытекает, что для устойчивой системы,
отвечающей требованию (0.53), необходимо чтобы выполнилось условие:
z k = mod zk <1. (0.55)

Рассмотрим условия устойчивости импульсных систем, описываемых разностны-


ми уравнениями первогои второго порядка.
Пример.2.12 Найдем условия при которых импульсная система, описываемая раз-
ностным уравнением первого порядка y (n + 1) + a1 y (n) = 0 , будет устойчива. Решим ту же
задачу для случая когда уравнения системы имеет вид: y (n + 1) + a1 y (n) + a2 y (n) = 0
Решение. Запишем характеристическое уравнение системы для первого случая:
z + а1 = 0.
Корень этого уравнения z1 = - а1. Тогда в соответствии с (0.55) условие устойчиво-
сти системы примет вид: | а1|<1.
Во втором случае характеристическое уравнение системы имеет вид:
z2 + а1z + а2 = 0, (0.56)
Тогда условие устойчивости |zi|<1, i = 1, 2 можно разбить на три условия:
1. z1 < 1; 2. z2> - 1; 3. mod zi < 1, где zi - корни уравнения (2.89). Первые два условия
должны выполняться в случае вещественных корней уравнения (0.56), третье – в случае
комплексных сопряженных.
В общем случае корни характеристического уравнения (0.56) равны:

a1 a12
z1, 2 =− ± − a2 .
2 4
Тогда условия устойчивости для всех трех случаев запишется в виде:

a1 a2
1. z1 = − + 1 − a2 <1, откуда 1 + a1 + a 2 > 0. (0.57)
2 4

a1 a2
2. z2 = − − 1 − a2 >-1 , откуда 1 - a1 + a 2 > 0. (0.58)
2 4

a1 a2
3. При 4 a 2 > a12 , z1, 2 = − ± j a 2 − 1 . Модуль комплексного числа zi (i = 1,2)
2 4
равен:

370
1
⎛ a2 a2 ⎞ 2
−1
mod zi = ⎜ 1 + a2 − 1 ⎟ = a2 2
,
⎝ 4 4 ⎠
1
Тогда в соответствии с условием (0.55), условие устойчивости будет: a2 2 <1 или

1 − a 2 >0. (0.59)
Таким образом, условия (0.57)-(0.59) являются условиями устойчивости импульс-
ной системы второго порядка при любых типах переходного процесса.
6.3.1 w-преобразование.
Так как непосредственный анализ влияния коэффициентов разностных уравнений
на корни характеристического уравнения выше четвертого порядка в принципе невозмо-
жен, а третьего и четвертого порядков достаточно громоздок, то для облегчения решения
задачи целесообразно воспользоваться такими критериями, которые позволяют непосред-
ственно по коэффициентам уравнения судить об устойчивости системы. С этой целью
используютw-преобразование, которое позволяет непосредственно применять известные
критерии устойчивости непрерывных линейных систем.
При применении w-преобразования окружность единичного радиуса на комплекс-
ной плоскости z отображается на мнимую ось комплексной плоскости w (рис. 2.35).
Для этого используется следующая подстановка:

1+ w z −1
z= ; откуда w = . (0.60)
1− w z +1
Выражение (0.60) на границе области устойчивости при z = e jωT = e jω * , где ω*=
ωT, (рис.2.35а), примет вид:
e jω* − 1
w = jω* . (0.61)
e +1
Имея в виду, что
ejω*=cosω*+jsinω*, и умножив числи-
тель и знаменатель правой части вы-
ражения (0.61) на число сопряженное
знаменателю, окончательно получим

j sin ω *
w= = jtg 0,5ω * = jλ . (0.62)
1 + cos ω *
Здесь λ=tg0,5ω* - так называемая относительная псевдочастота (при малых час-
тотах tg0,5ω*≈ 0,5ω*.

371
Из (0.62) вытекает, что при изменении частоты ω* от –π до +π псевдочастота λ про-
бегает все значения от -∞ до +∞, а комплексная величина w движется по оси мнимых от -
j∞ до +j∞. Эта ось, отображающая окружность z = e jω * на плоскости z, и является грани-
цей устойчивости на плоскости w (рис.2.35,б). Заметим, что прямая w=jλ является кон-
формным отображением (образом) окружности z=ejωT. Таким образом, для устойчивой
системы корни ее характеристического уравнения после подстановки в него преобразова-
ния (0.60) должны лежать на комплексной плоскости w слева от оси мнимых. Это и позво-
ляет для w -преобразованных дискретных передаточных функций W*(w) использовать
обычные критерии устойчивости, применяемые для непрерывными линейных систем.
Пример 2.13 Пусть характеристическое уравнение импульсной системы имеет вид
2
z + а1z + а2 = 0. Требуется определить условия устойчивости.
Решение. После подстановки в характеристическое уравнение системы выражения
(2.93), получим:
[(1+w)2/(1-w)]2+ a1 [(1+w)/(1-w)]+ a 2 =0 ,
или после преобразований:
(1- a1 + a 2 )w2+2(1- a 2 )w+1+ a1 + a 2 =0.
В соответствие с критерием Гурвица (п.3.1.2) для устойчивости системы второго
порядка необходимо и достаточно, чтобы все коэффициенты уравнения были положи-
тельны. Тогда имеем:
1- a1 + a 2 >0;
1- a 2 >0;
1+ a1 + a 2 >0.
Эти результаты совпадают с результатами, полученными ранее при непосредствен-
ном (более громоздком) анализе корней характеристического уравнения (пример 2.12).
6.3.2 Частотные критерии устойчивости
Для анализа устойчивости импульсных систем могут быть использованы классиче-
ские частотные методы, применяемые в линейной теории управления.
Ранее было введено обозначение: pT=q и epT=eq=z, что позволяет записать
W*(z)=W*(eq)=W*(q)=В*(q)/A*(q). Тогда для замкнутой импульсной системы (рис 2.34) ха-
рактеристическое уравнение 1 + Wф* ( z ) = 0 , опуская индекс «ф» и учтя, что z= eq , можно

записать в виде
1+W*(eq)=0, (0.63)
где W*(eq) – дискретная передаточная функция разомкнутой ситемы (импульсного фильт-
ра).

372
В соответствии с условием устойчивости |zk|<1, корни уравнения (0.63) qk должны
лежать в левой полуплоскости комплексного переменного q=(α±jω)T=α*±jω*. Это утвер-
8 ∗
ждение вытекает из условия (0.55), имеем z k = e qk = eα k ⋅ e jω k < 1 и, следовательно, для

выполнения этого условия величина α* должна быть отрицательной. Следовательно, кор-


ни qk должны лежать на комплексной плоскости q слева от оси мнимых.
Заметим, что так как sinω*=sin(ω*+2πm), то корни уравнения (0.63) qk= αk*±jωk*
(m=0), лежащие в левой полуплоскости ограни-
ченной прямыми +jπ и - jπ (рис 2.36), принято
называть главными. При этом остальные корни
(m=1,2…) будут также лежать в левой полуплос-
кости, так как величина αk* остается отрицатель-
ной. Следовательно, для определения устойчи-
вости системы достаточно исследовать располо-
жение на комплексной плоскости только глав-
ных корней.
Трансцендентность характеристического уравнения (0.63) свидетельствует о целе-
сообразности использования частотных критериев для определения устойчивости систе-
мы.

Аналог критерия Михайлова.


В основу этого критерия как и для непрерывных систем положен принцип аргумен-
та. Пусть дискретная передаточная функция разомкнутой системы имеет вид:
W*(q)=В*(q)/А*(q). Тогда уравнение (2.96) можно записать в виде:
D*(q)=A*(q)+B*(q)=0 . (0.64)
Для устойчивой системы, т.е. такой когда ни один главный корень qk уравнения
(0.64) не лежит на комплексной плоскости q в правой полуполосе, ограниченной прямыми
± jπ, изменение аргумента D*(q) при обходе этой полуполосы по замкнутому контуру L1-
L4 должно равняться нулю (рис.2.36). Это положение соответствует принципу аргумента
Коши.
Изменение аргумента D*(q) при обходе по замкнутому контуру правой полуполо-
сы можно записать в виде:
Δ arg D *(q ) = Δ L1 + Δ L2 + Δ L3 + Δ L4 ,

373
где Δ Li - изменение аргумента комплексной функции D *(q) при обходе контура на участ-

ке Li (i = 1, 4) :

Δ L1 = Δ1 arg D *( jω ) при −π ≤ ω* ≤ +π ;

Δ L2 = Δ 2 arg D *(q ) при 0 ≤ α * ≤ ∞ ;

Δ L3 = Δ 3 arg D *(q ) при +π ≤ ω* ≤ −π ;

Δ L4 = Δ 4 arg D *(q ) при ∞ ≤ α * ≤ 0 ;

Так как при обходе контура L1-L4 вектором D*(q) каждой точке на участке контура
L2 с положительным аргументом +φ соответствует точка на участке L4 с отрицательным
аргументом -φ, то, Δ L + Δ L = 0 . Изменение аргумента на бесконечно удаленном участке
2 4

контура L3 (при +π ≤ ω* ≤ −π ), составит:


Δ L3 = Δ 3 arg D *(q ) =-2πm, (0.65)

где m – степень полинома D*(q).


Убедимся в справедливости (0.65). Представим характеристический полином сис-
темы в виде:
D*(q)=a0eqm+a1eq(m-1)+…+aieq(m-i)+…+am-1eq+am (0.66)
При достаточно большой вещественной части комплексного числа q=α*+jω* всеми
членами полинома (0.66), за исключением первого можно пренебречь, т. е. lim
*
D*(q)=
α →∞

a0eqm.
Тогда при движении по участку контура L3 комплексное число q изменится от значения
* *
α*+jπ до α*–jπ, а аргумент функции D*(q) = a0eqm = a0 eα m e jω m на –2mπ, что и требовалось
доказать.
Так как для устойчивой системы должно выдерживаться условие ΔargD*(q)=0, то с
учетом сказанного можем записать: ΔargD*(q)=ΔargD*(jω*)-2πm =0, или, опуская индекс
«1», получим:
ΔargD*(jω*)=2πm, при –π ≤ ω ≤ +π. (0.67)
Выражение (0.67) и является условием устойчивости импульсной системы, в соот-
ветствии с которым критерий Михайлова можно сформулировать следующим образом:
для того, чтобы замкнутая импульсная система была устойчива необходимо и достаточно,
чтобы годограф вектора D*(jω*) при изменении ω* от 0 до +π, нигде не обращаясь в нуль,
прошел на комплексной плоскости в положительном направлении последовательно 2m
квадрантов.

374
В случае применения w-преобразования характеристический полином замкнутой
системы D*(w) при w=jλ превращается в кривую Михайлова D*(jλ), которая для устойчи-
вой системы при изменении λ от 0 до +∞ последовательно в положительном направлении
проходит m квадрантов (так как λ=ω*/2), т. е. имеем полную аналогию с критерием Ми-
хайлова применяемым для непрерывных систем.
Аналог критерия Найквиста.
Обобщение критерия Найквиста на импульсные системы производится также, как и
для критерия Михайлова. Но при этом рассматривается не кривая Михайлова D*(jω*), а
характеристический полином замкнутой системы 1+W*(jω*). Формулировка критерия
Найквиста для импульсной системы аналогична формулировке этого критерия для непре-
рывных систем: для того, чтобы замкнутая импульсная система была устойчива необхо-
димо и достаточно, чтобы АФЧХ разомкнутой системы W*(jω*) при изменении ω* от 0 до
+π не охватывала точку (–1,j0). В случае использования w-преобразования формулировка
рассматриваемого критерия отличается от приведенного выше тем, что при ω*=jλ псевдо-
частота λ изменяется от 0 до ∞.
Пример 2.14 Пусть дана система автоматического управления структурная схема
которой представлена на рис 2.37. Требуется
проверить устойчивость системы.
Передаточные функции звеньев заданы
и имеют вид:
1. Объекта управления:
k1
W1 ( р ) = .
T1 p + 1
2. Исполнительного механизма:
k2
W2 ( р ) = .
T2 p
3. Импульсного пропорционального регулятора, реализующего АИМ:
Wu ( р) = ku ,
где kи – коэффициент передачи импульсного элемента.
Решение. Запишем передаточную функцию непрерывной части системы
k
W ( p ) = W1 ( p )W2 ( p)Wu ( p) = ; где k = k1k2 ku .
T2 p (T1 p + 1)
Т T
Введя безразмерные величины: β 1 = ; β 2 = ; q = pT , где Т – период кванто-
Т1 T2
вания импульсного элемента, получим:

375
kβ1 β 2 B(q)
W (q) = = .
q(q + β1 ) A(q )
Найдем корни характеристического уравнения разомкнутой системы, решив урав-
нение q(q+β1)=0, откуда q1=0, q2= –β1.
Функцию веса w(t ) = L−1{W (q)} найдем воспользовавшись теоремой разложения:
N =2
B ( q K ) qK t
w(t ) = ∑ e = k β 2 (1 − e − β1t ) .
K =1 Aq′ (qK )

Последовательность функций веса для дискретных моментов времени t=nT запи-


шется в виде:
w(t ) = w(n) = k β 2 (1 − e − β0 n ), где β 0 = β1T .

При этом Z{w(n)}, найденное по таблице 2.1, будет:


⎛ z z ⎞ ⎛ 1 1 ⎞
Z {w( n )} = W * ( z ) = k β 2 ⎜ − − β0 ⎟
= k β2 ⎜ − -1 − β 0 ⎟
⎝ z −1 z − e ⎠
-1
⎝ 1- z 1- z e ⎠
Заменив z на ejω* (α*=0), найдем частотную функцию разомкнутой системы:
⎛ 1 1 ⎞
W * ( jω *) = kβ 2 ⎜ − jω *
− − jω * − β 0

⎝1 − e 1− e e ⎠
Предположим, что числовые значения параметров системы
равны: β0=β2=1; k=1. Подставив эти значения в выражение W(jω*),
можно построить годограф частотной характеристики разомкну-
той системы при изменении ω* от нуля до +π (рис.2.38). Как вид-
но из рисунка годограф W*(jω*) не охватывает точки (-1, j0), что
свидетельствует об устойчивости системы.

6.4. Качество функционирования импульсных систем

Для оценки качества работы импульсных систем используются как прямые методы,
заключающиеся в непосредственном построении кривой переходного процесса, так и кос-
венные. В первом случае по кривой переходного процесса определяются его параметры. В
частности, в случае колебательного процесса
(рис.2.39) определяются: время регулирова-
ния tp (при заданной зоне нечувствительности

376
± δ ), величина максимального перерегулирования σmax, период колебаний Tk .
Для апериодических процессов основным параметром, характеризующим переход-
ный процесс в системе, является время регулирования tp.
Пример 2.2 Пусть непрерывная часть системы (рис.2.40) представляет собой интегри-
рующее звено. Тогда как было показано ранее (пример 2.11), дискретная передаточная
функция импульсного фильтра (ИФ) будет:
kz
W * ( z) = ,
z −1
где k=kнkи, kн, kи – коэффициенты передачи непре-
рывной части системы и импульсного элемента
соответственно. Требуется найти время регулиро-
вания tp.
Решение. При подаче на вход импульсного фильтра единичной ступенчатой функ-
z
ции y* (n) =1(n), z-преобразование которой имеет вид Y * ( z ) = , можно записать:
z −1
kz 2
Y ( z ) = W * ( z )Y * ( z ) = .
( z − 1) 2

Найдем оригинал y(n), разложив Y(z) в степенной ряд путем деления числителя kz 2
на знаменатель ( z − 1) 2 . Окончательно получим:

[
Y ( z ) = k 1 + 2 z −1 + 3 z −2 + K + ( n + 1) z − n + K . ] (0.68)

Коэффициент ряда (0.68) при z − n является искомым оригиналом:


y (n) = k (n + 1) .
Здесь y (n) - дискретная прямая, сдвинутая в сторону опережения.
При замыкании импульсного фильтра единичной отрицательной обратной связью
(рис. 2.40), получим:
W * ( z) kz z kz 2
Y ( z) = Y ( z) =
*
⋅ = .
1 + W * ( z) (kz + z − 1) ( z − 1) (1 + k ) ⋅ ( z − (1 + k ) −1 ) ⋅ ( z − 1)
Обозначив 1+k=еα, можно записать:

Y ( z) = α
k

(1 − e −α )

Z
⋅z. (0.69)
e (1 − e ) ( z − e ) ( z − 1)
−α −α

По таблице z-преобразований (табл.2.1) можно найти оригинал второго сомножи-


теля стоящего в правой части выражения (0.69):

377
⎧⎪ (1 − e −α ) z ⎫⎪
−1 −α n
Z ⎨ ⎬ = 1− e .
⎩⎪ (
z − e ) ( z − 1) ⎪
−α

k
Тогда учтя, что выражение = 1 ( в чем можно убедиться, подставив в не-
e (1 − e −α )
α

го вместо еα, величину 1+к) и применив теорему сдвига окончательно получим:

[
Z −1 {Y ( z )} = y (n) = 1 − e −α ( n +1) ] (0.70)
Выражение (0.70) соответствует экспонен-
циальному переходному процессу (рис.2.41), по-
строив который, можно определить время регули-
рования tp при заданной зоне нечувствительности
δ.
* * *
При использовании косвенных методов оценки качества процесса управления,
можно, как и в случае непрерывных систем, ввести понятия запасов устойчивости и сте-
пени колебательности, определяемых на основании анализа расположения частотной ха-
рактеристики разомкнутой системы относительно точки (-1, j0). Можно также пользовать-
ся аналогами интегральных оценок:
∞ ∞
J 1 = ∑ [ y (∞) − y (n)]; J 2 = ∑ [ y (∞ ) − y ( n) ] .
2
(0.71)
n =0 n =0

Первая сумма отражает величину пропорциональную площади между текущим


значением отклонения управляемой переменной y(n) и установившимся его значением
y( ∞ ) и применяется для оценки качества монотонных переходных процессов; вторая от-
ражает ту же площадь, но для квадрата отклонений y(n) от y( ∞ ) и применяется для оценки
качества как монотонных, так и колебательных процессов. Заметим, что для астатических
систем установившаяся ошибка равна нулю и выражение (0.71) принимает вид:

J 2 = ∑ y 2 ( n) .
n=0

Для улучшения качества функционирования дискретных систем управления можно


пользоваться методами как непрерывной, так и импульсной коррекции. В первом случае в
непрерывную часть системы обычно вводятся дополнительные обратные связи, во втором
– дополнительный импульсный фильтр, преобразующий определенным образом входные
импульсы.

378
РАЗДЕЛ III
Нелинейные автоматические системы управления

К классу нелинейных систем управления относятся системы, содержащие хотя бы


одно звено, параметры которого зависят от переменных величин, характеризующих пове-
дение системы. Характерной особенностью нелинейной системы является резко измене-
ние ее параметров при изменении переменных величин, вплоть до скачкообразного типа.
Это обстоятельство обуславливает неэффективность линеаризации нелинейных зависимо-
стей путем их разложения в ряд Тейлора, в виду невозможности обеспечения удовлетво-
рительной точности аппроксимации. В связи с этим возникает необходимость применения
специальных методов анализа и синтеза нелинейных систем, основные из которых рас-
сматриваются ниже.

7. СТАТИКА НЕЛИНЕЙНЫХ СИСТЕМ.

7.1. ОСНОВНЫЕ ТИПЫ НЕЛИНЕЙНЫХ ЗВЕНЬЕВ.

В системах управления встречаются различные типы нелинейностей, которые


можно характеризовать соответствующей нелинейной функцией y(x), связывающей вход-
ную x и выходную y величины нелинейного звена в статическом режиме. При этом будем
считать, что имеет место одномерная нелинейность, т.е. переменная y представляет собой
функцию только одной переменной x. Заметим, что если параметры нелинейного звена
зависят от скорости изменения выходной величины или от более высоких ее производных,
то такая нелинейность проявляется только в переходных режимах, в связи с чем ее отно-
сят к классу динамических.
Нелинейные звенья можно классифицировать по различным показателям: симмет-
рии, гладкости, однозначности характеристик. Рассмотрим каждый из этих показателей.
Симметрия. Для нелинейных характеристик можно указать два типа симметрии:
1) если функция y(x) удовлетво-
ряет условию
y(x) = y(-x),
(3.1)
то такую характеристику называют
симметричной относительно оси орди-
нат или четно-симметричной (рис. 3.1,

379
а). При однозначной зависимости такие характеристики могут быть представлены сле-
дующим рядом:

y ( x) = ∑ C 2i x 2i ,
i =0

где С2i - постоянные коэффициенты;


2) если функция y(x) удовлетворяет условию
y(x)= -y(-x), (3.2)
то характеристику называют симметричной относительно начала координат или нечетно-
симметричной. (рис.3.1, б). При однозначной зависимости y(x) такие характеристики мо-
гут быть представлены следующим рядом:

y ( x) = ∑ C 2( i +1) x 2 ( i +1) .
i =0

Характеристики, не удовлетворяющие ни одному из приведенных условий относятся к не-


симметричным.
В ряде случаев путем перемещения координат несимметричные характеристики
могут быть приведены к симметричным. Например, для характеристики y1(x1) (рис.3.2, а)
можно путем подстановки x1=x0+x и y1=y0+y получить не- а) y1 б) y

четно-симметричную характеристику y(x) (рис.3.2,б). Струк- y0 x


x1
турная схема, соответствующая рассмотренному преобразо- x0

ванию координат приведена на рис.3.2,в. Заметим, что здесь в) x0 y0


x1 x y
y(x)
нелинейный элемент, в отличие от линейного, обозначен y1
Рис.3.2
двойной рамкой.
Гладкость. Если в любой точке характеристики y(x) существует производная
dy/dx, то такая характеристика относится к гладким. Если на характеристике имеются из-
ломы, в которых производная dy/dz имеет разрыв, то характеристика относится к ломан-
ным. Большую группу ломанных характеристик составляют кусочно-линейные характери-
стики.
Ф Примером гладкой характеристики может служить кри-
вая намагничивания электрической машины Φ (iB), где Φ, iB –
Ф0
магнитный поток и ток возбуждения соответственно (рис.3.3,
сплошная линия), которая путем соответствующей аппроксима-
iв ции может быть сведена к ломаной кусочно-линейной характе-
iв0 ристике (рис.3.3, пунктирная линия).
Рис.3.3
Однозначность. Если к каждому значению x соответст-
вует одно определенное значение y характеристика является однозначной. Если таких

380
значений y несколько (в зависимости от предшествовавшего режима), то характеристика
относится к классу многозначных. При этом число возможных значений y может лежать в
пределах от двух до бесконечности. Примерами однозначных характеристик могут яв-
ляться характеристики, приведенные на рис.3.1. Примеры многозначных звеньев будут
приведены ниже.
Рассмотрим наиболее распростаненные нелинейные звенья, характеристики кото-
рых при некоторых допущениях симметричны относительно начала координат и могут
быть достаточно хорошо представлены кусочно-линейными кривыми. Иногда эти звенья
называют типовыми.
1.Звенья с однозначными непрерывными характеристиками. К ним относятся:
Звено с зоной нечувствительности η . Характеристика такого звена приведена на
рис.3.4, а. Такими характеристиками обладают некоторые электронные, магнитные, гид-
равлические усилители в области сла-
бых входных сигналов |x|<η. Простей-
шей механической моделью зоны не-
чувствительности звена является систе-
ма соединения двух валов с пружинным
возвратом ведомого вала в нейтральное
положение при наличии участка сво-
бодного хода (люфта) в системе передачи (рис.3.4, б)
Формализованную запись характеристики, изображенной на рис.3.4, можно представить
следующим образом.

⎧0 ∀ x ≤ η;
⎪⎪
y = ⎨k ( x − η ) ∀ x > η; (3.3)
⎪k ( x + η )
⎪⎩ ∀ x < −η ;

Звено с ограничением (насыщением). Характеристика этого звена показана на


рис. 3.1,а. Подобными характеристиками обладают практически все усилители, ограни-
ченные по мощности в области больших входных
сигналов x > x 0 . Примером простейшей механиче- а) y б)
с
ской модели ограничения является система соеди-
-xo x
нения двух валов через упругую пружину при на- o
x
личии системы упоров в системе ведомого вала

(рис. 3.5,б) . Характеристика этого звена описывает- Рис. 3.5
ся следующим уравнением

381
⎧kx ∀ x ≤ xo
y=⎨ . (3.4)
⎩c sign x ∀ x > x
o

⎧ +1 ∀ x ≥ 0
Здесь sign x = ⎨ .
⎩ −1 ∀ x < 0
Звено с ограничением и зоной нечувствительности. Многие нелинейные элементы,
используемые в АСУ, обладают как зоной нечувствительности, так и ограничением вы-
ходного сигнала (рис. 3.6.) и описываются следующим уравнением

⎧0 ∀ x ≤η

⎪k ( x − η ) ∀ xo > x > η
y=⎨ . (3.5)
⎪k ( x + η ) ∀ − x o > x > −η
⎪c sign x
⎩ ∀ x > xo

Звено описываемое выражением (3.5) , представляет собой


достаточно общий случай однозначной непрерывной нелиней-
ности.
2.Звенья с однозначными разрывными характери-
стиками. К ним относятся:
Релейное трехпозиционное звено без петли возвра-
та(гистерезиса). Однозначная разрывная характеристика этого звена показана на рис.
3.7.а.
Формализованная запись этой характеристики имеет вид:

⎧c signx ∀ x > η
y=⎨ . (3.6)
⎩0 ∀ x <η

При анализе и синтезе различных релейных сис- а) y б) y


тем часто используются идеализированные двухпозици- с с
-η x -η x
онные реле, уравнение которого можно получить, если в
η η
выражении (3.6) положить η=0. Тогда получим. -с -с

y = c sign x . Рис. 3.7(3.7)

Характеристика этого звена представлена на рис.3.7,б. y


Аналого-цифровой преобразователь без петли возвра-
та. К числу нелинейных звеньев с однозначными разрывными x
характеристиками относится звено со ступенчатой характери-
стикой, преобразующее аналоговую величину в дискретную с
квантованием по уровню. Примером такой характеристики Рис. 3.8

382
может служить характеристика, приведенная на рис.3.8, формализованное выражение ко-
торой может быть записано в виде
y = E ( x − 0.5 sign x) ,

где под E(ζ ) понимается целая часть ζ = x − 0.5 sign x .

3. Звенья с двузначными характеристиками. К ним относятся: трехпозиционное


реле с петлей возврата, характеристика которого приведена на рис. 3.9,а. Как видно из
рисунка на участках − η < x < −mη и mη < x < η (−1 < m < 1) трехпозиционная характери-
стика неоднозначна, так как переход от y=0 к y=±c происходит при x=±η , а возврат – при
x=± mη. Эту зависимость можно выразить соотношением
⎧c sign x ∀ x > η
y=⎨ (3.8)
⎩0 ∀ x < mη .

При использовании (3.8.) необходимо иметь в виду, что на участках, указанных


выше, величина y имеет два значения. Классическим примером звена с трехпозиционной
релейной характеристикой является поляризованное реле с переключающейся контактной
группой.
В случае, если положить m=-1, то получим двухпозиционную петлевую релейную
характеристику с шириной петли равной 2η. Типичным представителем звена с такой ха-
рактеристикой является обычное электромагнитное реле, напряжение срабатывания кото-
рого U c всегда больше напряжения возврата Uв. При этом U c − U в = 2η . Заметим, что ре-
лейная характеристика, представленная на рис.3.9,а, позволяет получить любой вид ха-
рактеристик этого типа. Например, положив m=1 получим иде-
альную трехпозиционную релейную характеристику (рис.3.7,а), а
при η=0 – идеальную двухпозиционную (рис.3.7,б).
4. Звенья с многозначными характеристиками. Наиболее
распространенными представителями этих нелинейных звеньев
являются звенья с зазором (люфтом), часто встречающиеся в ме-
ханических передачах. Механическая модель такого звена пред-
ставлена рис.3.10,а. Характеристика, отражающая за-
висимость между положениями ведущего x и ведомого
y валов, представлена на рис.3.10,б. Из рисунка видно,
что каждому положению ведущего вала x соответствует
множество положений ведомого вала y, лежащего пре-
делах, ограниченных прямыми 1 и 2. Выбор того или
иного из возможных значений y обусловлено макси-

383
мальным или минимальным отклонением у, предшествовавшим рассматриваемому мо-
менту времени.
Характеристиками типа люфт обладают помимо механических систем с зазорами,
механические системы с сухим трением, модель которых представлена на рис.3.10,в .
Здесь вращающий момент x=М уравновешивается моментом пружины MП. При достиже-
нии момента MП величины равной моменту трения МТ (МП=МТ=η), начинается движение
выходного вала у. При изменении направления вращения х движения выходного вала у
начинается после изменения момента пружины на величину 2η. Описанному режиму ра-
боты механической системы с сухим трением соответствует характеристика приведенная
на рис.3.10,б.
Рассмотренные типовые звенья безусловно не исчерпывают разнообразие звеньев
нелинейных систем. Среди звеньев как линейных, так и нелинейных систем особое место
занимает множительное звено. Если на его входы подаются независимые сигналы, то на-
личие такого звена не нарушает линейности системы, так как при этом выполняется прин-
цип суперпозиции. Структурная схема перемножения независимых сигналов у=хх1 пока-
зана на рис.3.11,а. Если сигналы х
и х1 зависимы, то даже при ли-
нейности всех остальных звеньев
система становится нелинейной.
Пример получения нелинейного
звена с четно-симметричной параболической характеристикой у=кх2 показан на
рис.3.11,б, в. Такие характеристики встречаются при исследовании экстремальных систем
управления (гл.11).
С помощью множительного
звена и простых нелинейных звеньев
(типа двухпозиционного релейного)
может быть получено нелинейное
звено, обладающее нечетко-
симметричной параболической ха-
рактеристикой. Структурная схема
такого звена и его характеристика представлены на рис.3.12,а,б. Подобные звенья при-
меняются при реализации систем оптимальных по быстродействию (гл.10) .
Таким образом, применение множительного звена или других функциональных преобразо-
вателей в принципе позволяет получить нелинейные звенья с заданными статическими характери-
стиками.

384
7.2. СОЕДИНЕНИЕ НЕЛИНЕЙНЫХ ЗВЕНЬЕВ.
В нелинейных системах преобразование сигнала описывается в общем случае
дифференциальными или интегральными нелинейными уравнениями и может быть выра-
жено некоторым достаточно сложным оператором преобразования Λ
y (t ) = Λ{x(t )}. (3.9)
В некоторых случаях преобразование сигнала нелинейным звеном может быть
представлено в виде последовательного воздействия линейного динамического оператора,
например, в виде передаточной функции W(р), и нелинейного оператора ψ , описывающе-
го статическое преобразование сигнала нелинейным звеном. В зависимости от последова-
тельности действия линейного и нелинейного а) x(t) x1(t) y1(t)
W(p) ψ(x1)
операторов имеет место различное преобразова-
ние сигналов. Эквивалентные схемы, соответст- [
y1 (t ) = Λ1 {x(t )} = ψ L−1{W ( p) ⋅ L[x(t )]} ]
вующие двум видам преобразования входного б) x(t) x2(t) y2(t)
ψ(x1) W(p)
сигнала х(t), представлены на рис.3.13,а,б.
y 2 (t ) = Λ 2 {x(t )} = L−1 {W ( p ) ⋅ L[ψ [x(t )]]}
В общем случае y1 (t ) ≠ y 2 (t ) , принцип
Рис.3.13
коммутативности (перестановки) не выдержива-
ется и, следовательно, при последовательном соединении нелинейного статического и ли-
нейного динамического звеньев их перестановка недопустима. Исключение составляет
звено с запаздыванием: W ( p) = e − pτ , перенос которого через нелинейное статическое звено
ψ(х) не изменяет свойств нелинейной системы.
При рассмотрении статики нелинейных систем, сигналы х и у не зависят от време-
ни, а линейное звено может рассматриваться как усилительное с коэффициентом усиления
W (0) = k y и объединяться с нелинейным статическим звеном.

Рассмотрим некоторые виды соединений нелинейных статических звеньев. При


этом полагаем, что звенья являются направленными и что соединение звеньев не меняет
их характеристик.
1. Последовательное соединение нелинейных звеньев.
При последовательном соединении n нелинейных звеньев (рис.3.14) выходная ве-
личина одного звена является входной величиной другого, т.е.
xi +1 = yi = ψ i ( xi ), i = 1, n.
(3.10)

385
где ψ i - оператор преобразования i-го
нелинейного звена.
Решая совместно n нелинейных
уравнений вида (3.10), получим для по-
следовательного соединения n звеньев следующую нелинейную функцию, выражающую
характеристику y(x):
y ( x) = ψ 1n ( x) = ψ n {ψ n −1 ... [ψ 1 ( x) ]} .

(3.11)
Определение общей характеристики y(x) может быть сведено к нахождению n-1 раз
эквивалентных характеристик двух последовательно соединенных звеньев и определению
y2(x1), y3(x1), и т.д. до yn(x1)= y(x).
Путем построения эквивалентных характеристик для конкретных случаев можно
убедиться в том, что при изменении последовательности соединений звеньев результи-
рующая характеристика в большинстве случаев изменяется, т.е. в нелинейных системах
принцип коммутативности не выполняется.
Пример3.1. Найдем характеристику последовательно соединенных звеньев, одно
из которых имеет зону нечувствительности y1= ψ1(x1), а другое – ограничение y2=ψ2(x2)
при различной последовательности их соединений (рис.3.15, а,б). Характеристики ψ1(x1) и
ψ2(x2) заданы графически (рис.3.15,в).

Решение. Графическое построение эквивалентной характеристики


ψ 12 ( x1 ) = ψ 2 [ψ 1 ( x1 )] = y 2 ( x1 ) при соединении звеньев по схеме, приведенной на рис.3.15,а

386
показано на рис. 3.15,в. При построении используются четыре квадранта: в первых двух
приведены исходные зависимости ψ 1 ( x1 ) и ψ 2 ( x2 ) ; в третьем квадранте приведена вспомо-
гательная прямая (ВП), с помощью которой удобно осуществлять переход от оси y2 во
втором квадранте к такой же оси в четвертом квадранте. В последнем и построена иско-
мая зависимость y2(x1). Аналогичные построения (рис. 3.15,г) выполнены для варианта со-
единения звеньев, приведенного на рис. 3.15, б.
Из приведенных построений видно, что в обоих случаях получили эквивалентное
звено с зоной нечувствительности и ограничением. Однако значения выходной величины
соответствующие ограничению выходной величины yэ и зоне нечувствительности на вхо-
де xэ оказываются различными. В первом случае они совпадают со значениями для исход-
ных нелинейностей: y э = с ; xэ = η , а во втором – существенно отличаются: y э = с − η ;

xэ = η / k2 . При c ≤ η второе соединение эквивалентно разрыву цепи.


***
Заметим, что при последовательном соединении двух нелинейных звеньев с пря-
мым ψ и обратным ψ-1 операторами преобразования может оказаться, что результирую-
щая характеристика окажется линейной с коэффициентом передачи равным единице. Та-
кое соединение звеньев называется взаимно обратным и перемена местами этих звеньев
не изменяет общей характеристики системы. Подчеркнем, что это свойство справедливо
только для монотонных нелинейных характеристик, не имеющих горизонтальных и вер-
тикальных участков, т.е. значение производной dy/dx не должно быть равным ни нулю, ни
бесконечности.
2. Параллельное соединение нелинейных звеньев.
При параллельном соединении как линейных так и нелинейных звеньев на их вхо-
ды подается один и тот же входной сигнал, выходные величины алгебраически суммиру-
ются. Таким образом выходная величина y равна:
n
y = f ( x) = ∑ f i ( x) . (3.12)
i =1

Из выражения (3.12) следует, что характеристика параллельного соединения n не-


линейных звеньев может быть получена путем непосредственного суммирования соответ-
ствующих ординат составляющих характеристик.

387
Пример 3.2. Найдем характеристику параллельного соединения двух нелинейных
звеньев с зоной нечувствительности (рис.3.16,а), характеристики которых y1 = ψ 1 ( x) и
y 2 = ψ 2 ( x) приведены на
рис.3.16,б. Здесь η1<η2 и k1<k2.
Решение. На рис.3.16,в по-
строена результирующая характе-
ристика для случая, когда сигналы
y1 и y2 положительны. Уравнение
этой кусочно-линейной характери-
стики (отрезки прямых 1,2,3) мож-
но записать в виде:

⎧0 ∀ 0 ≤ x ≤ η1 ;
⎪⎪
y = ⎨k1 ( x − η1 ) ∀ η1 < x ≤ η 2 ; , (3.13)
⎪kx + d
⎪⎩ ∀ x > η2 ;

где k = k1 + k 2 ; d = −(k1η1 + k 2η 2 ) .
На рис.3.16,г приведена результирующая характеристика для случая, когда сигналы
y1 и y2 имеют разные знаки: y1>0 ; y2 < 0. Уравнение результирующей характеристики
(отрезки прямых 1,2,3) запишется в виде аналогичном (3.13), но при этом величина k=(k1-
k2)<0, а постоянная d=(k2η2-k1η1)>0. Заметим, что при k1=k2 величина k=0 и при x>η2 име-
ем y=d=const, т.е. характеристика соответствует звену с зоной нечувствительности и
ограничением.
3. Параллельно-встречное соединение нелинейных звеньев.
Структурная схема для этого случая представлена на рис. 3.17. Здесь звено с харак-
теристикой ψ1(x1) включено в прямую цепь, а звено ψ2(x2) в
цепь обратной связи, которая может быть отрицательной или
положительной. Соответственные уравнения замкнутой цепи
имеют вид
x1 = x ± y 2 ; y = y1 = x2 . (3.14)
Для построения результирующей характеристики y(x) параллельно-встречного со-
единения звеньев, необходимо уравнение (3.14) рассматривать совместно с характеристи-
ками ψ1(x1) и ψ2(x2).
Пример 3.3 Построим характеристику звена c зоной нечувствительности и ограни-
чением y1=ψ1(x1), охваченного отрицательной или положительной жесткой обратной свя-

388
зью: y2 = ψ 2 ( x2 ) = k2 x2 , где k2 – коэффициент передачи. Структурная схема соединения
аналогична представленной на рис.3.17.
Решение. Результирующая характеристика, построенная графическим путем для
случая отрицательной обратной связи, приведена на рис.3.18, а. Заданные характеристики
звеньев, включенных в прямую и обратную цепи показаны на рисунке пунктирными ли-
ниями.
Для получения зависимости y(x) необходимо в соответствии с (3.14) алгебраически
сложить абсциссы зависимостей ψ 1 ( x1 ) и ψ 2−1 ( y2 ) = x2 = y2 / k2 , где ψ 2−1 - обратный опера-
тор преобразования второго звена. При отрицательной обратной связи построение ре-
зультирующей характеристики y(x) выполнено путем суммирования соответствующих
абсцисс. В случае положительной обратной связи при таких же характеристиках звеньев
для получения зависимости y(x) абсцисса звена ψ 1 ( x1 ) вычитается из абсциссы звена

ψ 2−1 ( y 2 ) (рис. 3.18, б).


Р
езул
ьта-
ты
по-
стро
ения
характеристики y(x) показывают, что в первом случае эта характеристика однозначна и
соответствует первому звену - с зоной нечувствительности и ограничением, но с расши-
ренной зоной линейной зависимости, (по сравнению с характеристикой ψ 1 ( x1 ) ). В случае
положительной обратной связи при k2с>(х0-η) характеристика y(x) становится неодно-
значной и соответствует трехпозиционной релейной характеристике с петлей возврата
(рис.3.9, а).
7.3. СТРУКТУРНЫЕ ПРЕОБРАЗОВАНИЯНЕЛИНЕЙНЫХ СИСТЕМ.
В связи с тем, что для нелинейных систем не выполняются принципы суперпози-
ции и коммутативности, возможности их структурных преобразований существенно огра-
ничены. Невыполнение принципа наложения исключает возможность осуществления опе-
рации переноса сумматоров через нелинейное звено, а невыполнение функции коммута-
тивности – операцию перестановки этих звеньев. Что касается переноса нелинейных
звеньев через узел разветвления, то эта операция не противоречит упомянутым принци-

389
пам и может быть применена для преобразования нелинейных систем. Соответствующие
правила преобразования могут быть сформулированы следующим образом:
1. При переносе узла со входа на выход нелинейного звена необходимо в отходящих от
узла ветвях добавить звено с оператором этого нелинейного звена (рис. 3.19, а).
2. При переносе узла с выхода на вход нелинейного звена необходимо в отходящих от
узла ветвях добавить звено с обратным оператором этого нелинейного звена (рис.
3.19, б).
На основе понятия обратных операторов можно показать, что схема с прямой ψ1
и обратной ψ2 связями (рис. 3.19,в) эквивалентна схеме, построенной из звеньев с об-
ратными операторами ψ1-1, ψ2-1, если звено ψ1-1 включено вместо звена ψ2, а звено ψ2-1
вместо звена ψ1.

Исходная структурная схема


Эквивалентная структурная схема

а)
y=ψ(x) x y
x

y
y

x y
б)
y=ψ(x)
x

x x=ψ-1(y)

в)x x y1 y
x1 y1= ψ1(x1) ψ2-1(y1)
ψ1(x1) -
- x1
y1=ψ2(y)
x2= y
x2= y ψ1-1(y)
ψ2(y)

Рис. 3.19

Действительно, записав уравнение замкнутой цепи в виде:


y = ψ 1 ( x1 ) = ψ 1 [ x −ψ 2 ( y ) ] или ψ 1−1 ( y ) = x −ψ 2 ( y ) , после элементарных преобразований

получим:
[ ]
y = ψ 2−1 x − ψ 1−1 ( y ) . (3.15)

390
Выражение (3.15) соответствует эквивалентной структурной схеме, приведенной на
рис. 3.19,в.
Таким образом, введение обратных операторов дает возможность сформулировать еще
одно правило преобразования, справедливое как для линейных, так и для нелинейных структур-
ных схем.
3. В системе с отрицательной обратной связью можно менять местами звенья, включен-
ные в цепи прямой и обратной связи, с заменой операторов звеньев на обратные.
Пример 3.4. Для системы, состоящей из прямо-
го и усилительного звена с коэффициентом передачи kу,
охваченного гибкой обратной связью в виде последова-
тельно включенных дифференцирующего звена
Wд ( р) = k д p с и нелинейного звена y1 = ψ ( y 2 ) (рис.

3.20,а), требуется найти эквивалентную схему с обрат-


ными характеристиками.
Решение. Применив сформулированное выше
правило (рис. 3.19,в), получим эквивалентную схему, приведенную на рис. 3.20,б.
Нелинейные характеристики ψ-1(y1) и ψ(у2) могут быть описаны кусочно-линейными зави-
симостями:

⎧αy1 ∀ y1 ≤ y10

y 2 = ψ ( y1 ) = ⎨αy10 + β ( y1 − y10 ) ∀ y1 > y10
−1

⎪− αy + β ( y − y ) ∀ y > − y ,
⎩ 10 10 1 10

⎧ y2 / α ∀ y2 ≤ α y10

y1 = ψ ( y 2 ) = ⎨ y10 + ( y 2 − αy10 ) / β ∀ y2 > α y10
⎪− y + ( y − αy ) / β ∀ y > −α y .
⎩ 10 2 10 2 10

Здесь α и β - угловые коэффициенты соответствующих отрезков прямых; у10 – ко-


ордината точки стыковки отрезков прямых.
Из приведенных зависимостей следует, что при α→0 и β→∞ характеристи-
ка y1 = ψ ( y 2 ) переходит в зависимость y1 = c sign y 2 , с=y10 (рис.3.7,б).

Так как реализация интегрирующего звена осуществляется точнее, чем дифферен-


цирующего, эквивалентная схема (рис. 3.20,б) предпочтительнее, чем исходная
(рис.3.20,а).

391
8. ТОЧНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ ДИНАМИЧЕСКИХ СВОЙСТВ
НЕЛИНЕЙНЫХ СИСТЕМ

Для исследования динамических свойств нелинейных АСУ существует целый ряд


методов, которые можно подразделить на две большие группы:
1. Точные методы, которые имеют строгое математическое обоснование. К ним
относятся метод припасовывания, фазового пространства, математического моделирова-
ния и некоторые другие.
2. Приближенные методы, которые не имеют строгого математического обоснова-
ния, но дают результат практически удовлетворяющий разработчика. Заметим, что при-
менение этих методов требует обязательной экспериментальной проверки. Наибольшее
распространение из приближенных методов получил метод гармонической линеаризации.

8.1. МЕТОД ПРИПАСОВЫВАНИЯ

Основная идея метода заключается в применении кусочно-линейной аппроксима-


ции при решении нелинейных задач. При этом нелинейная характеристика с существен-
ной нелинейностью заменяется кусочно-линейной. Для каждого из линейных интервалов
записывают дифференциальное уравнение и его решение, с входящими в него постоян-
ными интегрирования. Приравнивая те значения ко-
ординат и их производных в конце предыдущего и
начале последующего интервалов, которые не изме-
няются скачкообразно, находят числовые значения
постоянных интегрирования, что дает возможность
построить переходный процесс в системе и оценить
его динамические свойства.
Обычно нелинейные АСУ состоят как из ли-
нейных звеньев, так и из нелинейных. Поэтому можно выделить отдельно линейную и не-
линейную части системы.
Пусть имеем АСУ с релейным управляющим устройством (нелинейная часть НЧ),
имеющим трехпозиционную идеальную характеристику (рис.3.7,а).
Предположим, что линейная часть (ЛЧ) сиcтемы имеет передаточную функцию ви-
да:
k
Wл ( р) = .
Tp + p
2

Структурная схема системы представлена на рис.3.21.

392
Уравнение, описывающее движение замкнутой системы в различных зонах нели-
нейной характеристики (I, II, III), имеет вид:
Ty''+y'=ku.
(0.72)
Тогда для первой зоны (u = 0) это уравнение запишется в виде:
Ty''+y'=0, при –η≤y≤η ,
(0.73)
для второй зоны (u = u0), с учетом отрицательной обратной связи, в виде:
Ty''+y'=-ku0, при y>η ,
(0.74)
для третьей зоны (u = −u0) :
Ty''+y'=ku0, при y<-η.
(0.75)
Решение дифференциального уравнения, соответствующего той или иной зоне, по-
зволит отслеживать изменение выходной переменной у(t) в этой зоне. Как только величи-
на у попадает в другую зону, фиксируется значе-
ние переменных у и у', которые являются конеч-
ными для исследуемой зоны и начальными для
новой зоны, описываемой своим дифференци-
альным уравнением. Решение этого ДУ характе-
ризует движение системы в новой зоне и т.д. до
достижения устойчивого состояния (равновесия
или периодического колебания).
Предположим, что при t=t0 система нахо-
дится в точке «a» и при этом у=уа ; уа'=0
(рис.3.22). Это состояние системы соответствует II-й зоне, следовательно, система описы-
вается уравнением (0.74). Интегрируя это ДУ, получим:
Ty'+y=-ku0t+С1 .
(0.76)
Решение неоднородного дифференциального уравнения (0.76) имеет вид :

y = C 2 e p1t − ku 0 t + C1 ,
(0.77)
где p1 = −1 / T корень характеристического уравнения Тр+1=0; С1, С2-постояные интегри-
рования, которые определяются из начальных условий.

393
При t = t0 =0 имеем:
y = ya = C2 + C1 ⎫
⎬.
y′ = ya′ = p1C2 − ku0 = 0 ⎭

(0.78)
Решение системы (0.78) и дает искомые C1 и C2 . Подставив числовые значения С1
и С2 в (0.77), можно построить переходной процесс y(t) в зоне II (рис.3.22). Попав в точку
«б», находим уб=η и уб'. Эти значения являются конечными значениями для второй зоны и
начальными для первой. Последовательно интегрируя уравнение (0.73) для первой зоны
получим
у=С4 e p1t ерt+С3 .
(0.79)
Подставив в уравнения (0.79) значения уб и у'б при t1=0, найдем постоянные интег-
рирования С3, С4 и строим кривую переходного процесса в зоне I, вплоть до достижения
точки «в» (рис.3.22). В этой точке также фиксируются значения ув и ув', которые являются
начальными для третьей зо,ны описываемой уравнением (0.75). Решение этого уравнения,
найденное аналогично решению уравнения (0.74), позволяет построить кривую переход-
ного процесса для III зоны. Расчеты продолжаются до тех пор, пока зависимость y(t) не
будет удовлетворять условию:

lim y (t ) = Ciп < η ,


t →∞

где Сiп – значение i-той постоянной интегрирования в n-ом интервале времени (для приве-
денного примера i=7, n=4). Заметим, что рассмотренный метод исследования динамиче-
ского режима нелинейных АСУ достаточно громоздок и требует большого объема вычис-
лений. Однако применение компьютерных технологий позволяет решить эту проблему.

8.2. МЕТОД ФАЗОВЫХ ТРАЕКТОРИЙ

Этот метод может быть использован для исследования динамических режимов как
линейных, так и нелинейных систем.
Известно, что состояние системы, описываемой дифференциальным уравнением n-
ного порядка, полностью определяется значениями в каждый момент времени управляе-
мой величины у и n-1 ее производных.∗) Это дает возможность представить в некотором n-
мерном пространстве состояние системы отдельной точкой, называемой изображающей

∗)
Напомним, что эти величины являются переменными состояния, рассмотренными в п.1.2.

394
точкой. Процесс изменения состояния системы представляется в этом случае как движе-
ние изображающей точки по некоторой траектории, называемой фазовой траекторией.
Начальные условия системы определяют начальное положение изображающей
точки в n-мерном пространстве, которое называется фазовым пространством или про-
странством состояний. Совокупность фазовых траекторий, найденных для всевозмож-
ных начальных условий, составляет фазовый портрет системы.
В том случае, когда систему можно описывать уравнением второго порядка, фазо-
вое пространство превращается в фазовую плоскость с координатами у и у' , на которой
можно наглядно изобразить фазовые траектории y′ = f ( y ) и проанализировать поведение
системы.

8.2.1. Анализ линейных систем с помощью метода фазовой плоскости


Для иллюстрации метода фазовых траекторий рассмотрим линейную систему, опи-
сываемую дифференциальным уравнением второго порядка
T2y''+2ξTy'+y=kx,
Отбросив правую часть получим однородное уравнение
T2y''+2ξTy'+y=0,
(0.80)
характеристическое уравнение которого имеет вид
T2p2+2ξTp+y=0.
(0.81)
Для получения зависимости y ′ = f ( y ) обозначим y'=dy/dt=z. Тогда однородное
уравнение (0.80) можно записать в виде:
y''=dz/dt= − (2ξTz+y)/T2
dz dz dy dz
Имеем: = ⋅ = z,
dt dz dt dy
dz − 2ξTz + y
откуда: =− .
dy T 2z
(0.82)
Решение дифференциального уравнения (0.82), связывающего две текущие коор-
динаты системы у и у’=z, и является уравнением фазовой траектории z=f(y). Иными сло-
вами уравнение (0.82) является уравнением фазовой траектории в дифференциальной
форме.
Рассмотрим следующие случаи.

395
1. Коэффициент демпфирования ξ = 0 . Тогда корни характеристического уравне-
ния (0.81) будут мнимыми, p1,2=±jω, ω=1/T и решение однородного уравнения (0.80) бу-
дет:
⎧ y = A sin(ωt + ϕ )

⎩ y′ = z = Aω cos(ωt + ϕ ),
(0.83)
где А и ϕ постоянные интегрирования, определяемые из начальных условий.
Система (0.83) представляют собой уравнения фазовой траектории в параметриче-
ской форме, где параметром является переменная t. Для получения уравнения фазовой
траектории в явном виде необходимо исключить параметр t. Возведя уравнения (0.83) в
квадрат, а затем просуммировав их, окончательно получим:
y2 z2
+ =1.
A 2 A 2ω 2
(0.84)
Уравнение (0.84) является уравнением фазовой траектории в явном виде и пред-
ставляет собой семейство эллипсов, величина полуосей которых равна А и Аω, т. е. опре-
деляется начальными условиями (рис.3.23,а).
В рассматриваемом случае производная dz/dy для всех точек фазовой плоскости
имеет вполне определенное значение, которое вычисляется в соответствии с уравнением
(0.82) при ξ=0:
dz y
=− 2 .
dy T z
(0.85)
В точке у=0, z=0 производная dz/dy представляет собой неопределенность. Эта
точка называется цен-
тром, который охватыва-
ется замкнутыми фазо-
выми траекториями. Эти
траектории позволяют
построить зависимость
y(t) и оценить характер
свободной составляющей переходного процесса (рис.3.23,б).
Отметим следующие свойства фазовых траекторий: а) направление движения изо-
бражающей точки по фазовой траектории должно соответствовать знаку скорости изме-
нения управляемой величины у. При dy/dt>0 движение изображающей точки всегда будет

396
происходить в сторону увеличения y, т.е. слева направо а при dy/dt<0 - справа налево; б)
касательные к фазовым траекториям в точке с ординатой z=0 пересекает ось абсцисс под
π
прямым углом, т. к. из уравнения (0.85) имеем: dz/dy|z=0= ∞ , следовательно tgψ=∞, ψ =
2
(рис.3.23,а).
2. Корни характе-
ристического уравнения
(0.81) комплексные со-
пряженные с отрица-
тельной вещественной
частью (0<ξ<1) имеем:

ξ j 1−ξ 2
p1, 2 =− ± = −α ± jω
T T
ξ1− ξ 2
; α= ; ω= .
T T
В этом случае решение однородного уравнения (0.80) имеет вид:
⎧ y = Ae −αt sin(ωt + ϕ )

⎨ dy
⎪ y′ = z =
⎩ dt
(0.86)
Уравнения (0.86) являются уравнениями искомой фазовой траектории в параметри-
ческом виде. Можно показать, что уравнение фазовой траектории в явном виде представ-
ляет собой логарифмическую спираль, наматывающуюся на начало координат. Изменяя
начальные условия, можем получить семейство фазовых траекторий (рис.3.24,а) и по-
строить переходный процесс (рис.3.24,б). Особая точка, лежащая в начале координат
dz/dy, в которую сходятся все фазовые траектории, носит название устойчивого фокуса
(точка равновесия).
3. То же, что и вариант 2, но вещественная часть корней положительна (–1<ξ<0):
p1,2=+α ± jω.
В этом случае уравнения фазовой траектории в параметрической форме имеют вид:
⎧ y = Aeαt sin(ωt + ϕ )

⎨ dy
⎪ y′ = z =
⎩ dt
(0.87)

397
Фазовые траектории, построенные по уравнениям (0.87) для различных начальных
условий, представляют со-
бой выходящие из начала
координат разматываю-
щиеся логарифмические
спирали (рис.3.25,а). Соот-
ветствующий расходящий-
ся переходный процесс
представлен на рис.3.25,б.
Особая точка, лежащая в
начале координат называ-
ется неустойчивым фокусом.
4. Корни характеристического уравнения (0.81) вещественные отрицательные,

ξ ξ 2 −1 ξ 2 −1
(ξ>1): p1,2 = − ± = −α ± β < 0 ; β = .
T T T
В этом случае решение однородного уравнения (0.80) имеет вид:
⎪⎧ y = C1e 1 + C 2 e 2
pt p t

⎨ .
⎪⎩ y ′ = C1 p1e p1t + C 2 p 2 e p2t

(0.88)
Как и в предыдущих случаях, уравнения
(0.88) являются уравнениями фазовой траектории в
параметрическом виде. Можно показать, что поми-
мо уравнений (0.88) решениями уравнения (0.82)
является уравнения z = p1 y , z = p2 y . Тогда фазо-
вый портрет имеет вид, представленный на рис.3.25.
Анализ фазового портрета показывает, что все фа-
зовые траектории стягиваются к началу координат,
что соответствует сходящемуся монотонному переходному процессу. В отличие от точек
центра и фокуса в данном случае производные dz/dy в точке равновесия имеют вполне оп-
ределенное значение, равное p1 = −(α + β ) . Эта точка носит название устойчивого узла.
5. То же, что и вариант 4, но при ξ<–1. Тогда получим p1, 2 = (α − β ) > 0 и решение

однородного ДУ (0.80) запишется в виде

398
⎧⎪ y = C1e p1t + C 2 e p2t

⎪⎩ y ′ = C1 p1e p1t + C 2 p2 e p2t

(0.89)
Фазовые траектории в данном случае выходят из начала координат (рис.3.26), что
соответствует расходящемуся монотонному переходному процессу. Точка в начале коор-
динат соответствует точке неустойчивого равновесия и называется неустойчивым узлом.
Общие выводы
Фазовый портрет дает возможность произвести
анализ поведения системы, получив следующие данные:
1) тип переходного процесса – колебательный (случаи 2,
3), монотонный (случаи 3, 4);
2) в случае колебательного процесса - величину и
количество перерегулирований;
3) сведения об устойчивости системы: при фазо-
вых траекториях сходящихся в начало координат система
устойчива, при расходя-
щихся – неустойчива.
Для получения более
полных сведений о дина-
мических режимов работы
системы может быть по-
строена кривая переходно-
го процесса y(t), например
следующим образом. Из-
вестно,
t t i +1

что y = ∫ y′dt или Δyi = ∫ y′dt = y& cpi


′ i = 0,5 ( yi′ + yi′+1 ) = zcpi ; Δti = ti +1 − ti
Δti , где ycp
0 ti

Пусть имеем фазовую траекторию, приведенную на рис.3.27,а. Разобьем ось абс-


′ i = z cpi . Тогда время изменения
цисс на участки Δyi, для каждого из которых определим y cp

координаты y на величину Δyi будет Δt i = Δy i / z cpi . Зная Δti и соответствующее ему Δyi

(i=1,2, …) можно построить переходной процесс (рис.3.27,б). Чем меньше шаг Δyi, тем
точнее построение.

399
8.2.2. Анализ нелинейных систем с помощью метода фазовой плоскости
Запишем уравнение движения нелинейной системы в неявном виде: y''=F(y,y'), или,
учтя, что y'=z в виде системы уравнений первого порядка:
z'=F(y,z).
(0.90)
y'=z .
(0.91)
Здесь - F- нелинейная функция.
Поделив (0.90) на (0.91) получим:
dz/dy=F(y,z)/z=M1(y,z)/M2(y,z)
(0.92)
Уравнение (0.92) является дифференциальным уравнением фазовой траектории в
неявном виде. Если правая часть этого уравнения заданна аналитически и интеграл берет-
ся, то найдя зависимость z=f(y) получаем уравнение фазовой траектории в аналитическом
виде. Если нет, то пользуемся теми или иными приемами графического интегрирования.
Одним из таких приемов является метод изоклин, сущность которого заключается в по-
строении кривых (изоклин), представляющих собой геометрическое место точек фазового
портрета, на котором угол наклона касательных к фазовым траекториям постоянен. При-
мером изоклины может служить ось абсцисс, которую фазовые траектории пересекают
под прямым углом. Заметим, что в выражении (0.92), характеризующем наклон касатель-
ной к фазовой траектории в данной точке, присутствуют три неизвестных: y, z, zy'=dz/dy.
Тогда, задавшись определенным значением zy', например, zy'=N, получим уравнение с
двумя неизвестными, что на фазовой плоскости yОz и дает искомую изоклину. Эта изо-
клина пересекается фазовыми траекториями с постоянным углом наклона ψ равным:
ψ=arctgzy'=arctgN=const.
Задаваясь различными значениями N можно построить семейство изоклин для кон-
кретного уравнения фазовой траектории, заданного в дифференциальном виде (0.92). Ин-
тегральная кривая z=f(y) фазовой траектории для заданных начальных условий строится с
помощью отрезков прямых, направленных в соответствие с наклоном определяемым изо-
клинами.
Пример 3.5. Пусть имеем консервативную систему (ξ =0), описываемую уравнени-
ем
Т2y” +y = 0.
Требуется построить фазовый портрет системы с помощью метода изоклин.

400
Решение: Воспользовавшись (0.82), запишем уравнение фазовой траектории в

дифференциальной форме: dz = − y2 . При этом уравнение изоклины имеет вид:


dy T z

y y
N =− или z = − 2
.
2
T z Т N
Таким образом, изоклины в данном случае представляют собой семейство прямых
с угловым коэффициентом, зависящим от
принятого N=z'y. При N=0 и N=±∞ изоклины
совпадают с осями координат z и у соответст-
венно (ψz =0; ψу=π/2). Построив для разных N
семейство изоклин, можно построить фазо-
вые траектории для различных начальных ус-
ловий, которые будут представлять собой се-
мейство эллипсов вложенных друг в друга (рис.3.28).
Пример 3.6. Пусть система описывается нелинейным уравнением y''+yy'+y=0. Тре-
буется построить фазовый портрет системы.
Решение: Учтя, что y' = z перепишем уравнение системы в виде:
dz dz
+yz+y=0, откуда =-(z+1)y.
dt dt
dz dz
Произведя замену = ⋅ z , запишем уравнение фазовой траектории в диффе-
dt dy
ренциальной форме:
dz ( z + 1) y
=− .
dy z
Для построения фазовой траектории воспользуемся методом изоклин. Уравнение
изоклины найдем, положив dz/dy = N. Тогда можно записать:
( z + 1) y y Nz
N =− , откуда z = − , y=− .
z y+N z +1
Таким образом, изоклина представляет собой гиперболу со смещенными асимпто-
тами (рис.3.29). При у→ −N получим:
⎡ y ⎤
lim z = lim ⎢ − ⎥ = ±∞
y →− N y →− N
⎣ y+N⎦
и, следовательно, уравнение первой асимптоты гиперболы запишется в виде: у = −N.
⎡ zN ⎤
При z → − 1 имеем lim y = lim ⎢ − = ±∞
z →−1 z →−1
⎣ 1 + z ⎥⎦

401
И уравнение второй асимптоты будет: z = − 1.
На рис.3.29 построены изоклины для некоторых числовых значений N. Так как
dz/dy= N = const, то любая фазовая траектория пересекает изоклину в любой точке под од-
ним и тем же углом, ψ = arctgN . Например, любая фазовая траектория при N =1 будет пе-
y
ресекать изоклину z = − под углом 450.
y +1
Построение фазовых траек-
торий для заданных начальных
условий производится следующим
образом. Пусть начальная изобра-
жающая точка лежит на опреде-
ленной изоклине, которую фазовая
траектория пересекает под углом
ψо, а ближайшую изоклину - под
углом ψ1. Тогда отрезок фазовой
траектории между изоклинами
можно приближенно заменить
прямой выходящей из начальной
точки со средним углом наклона:
ψср = (ψо +ψ1)/2 до пересечения с
упомянутой ближайшей изокли-
ной. Точка пересечения принима-
ется за начальную и аналогично
описанному выше строится сле-
дующий отрезок прямой и т.д. По-
строение будет тем точнее, чем
большее количество изоклин нане-
сено на фазовой плоскости.
Заметим, что при начальных условиях z0>–1, переходный процесс y(t) представляет
собой незатухающие колебания, а при z<–1 – убывающую монотонную кривую:
lim y (t ) = −∞ . При z=–1 фазовая траектория сливается с асимптотой и переходной процесс
t →∞

протекает с постоянной скоростью.

402
8.2.3. Исследование релейных АСУ
Эти системы относятся к классу существенно нелинейных и обычно исследуются
методом фазовой плоскости. При использовании этого метода структурная схема системы
разбивается на линейную и нелинейную части, причем предполагается, что линейная
часть системы удовлетворительно описывается дифференциальным уравнением второго
порядка. Проиллюстрируем сказанное на конкретном примере.
Пусть имеем автоматическую систему стабилизации температуры в сушильном
шкафу, передаточную функцию которого можно представить в виде: Wо=kо/(Tp+1). Изме-
рение температуры производится с помощью чувствительного элемента, например, тер-
мопары с передаточной функцией: Wчэ(p)=kчэ.. Регулирование температуры достигается за
счет изменения подачи воздуха в сушильную камеру, путем изменения положения заслон-
ки, приводимой в движение исполнительным механизмом с электроприводом, передаточ-
ная функция которого имеет вид: Wим(p)=kим/p.
Структурная схема системы приведена на рис.3.30.
На схеме приняты следующие обозначения: uθ - текущее
напряжение пропорциональное температуре θ в сушильном
шкафу; u* - напряжение пропорциональное заданному зна-
чению температуры; uд – напряжение, подводимое к двига-
телю исполнительного механизма.
Запишем передаточную функцию линейной части
(ЛЧ) системы:
Wлч(р)=k/(Tp2+p), где k=kokчэkим.
Соответствующее дифференциальное уравнение в операторной форме будет;
U(p)=Wлч(р)Uд(p) или (Tp2+p)U(p)=kUд(p),
а в области вещественного переменного это уравнение примет вид:
Tu''+u'=kuд
(0.93)
Запишем уравнение нелинейной части (НЧ), представляющей собой трехпозици-
онное релейное устройство, выполняющее функцию регулятора:

⎧0, ∀ u ≤η

uд=F(u)= ⎨u0 , ∀ u >η .
⎪− u , ∀ u < −η
⎩ 0
(0.94)
При замыкании системы отрицательной нелинейной обратной связью уравнение
движения замкнутой системы можно получить, подставив (0.94) в (0.93):

403
Tu''+u'= − kF(u)
(0.95)
Знак «минус» в правой части (0.95) учитывает отрицательную обратную связь.
Воспользовавшись выражением (0.94), уравнение (0.95) можно представить в виде
трех уравнений (см. п. 8.1)
I. Tu''+u'=0, при |u|≤ η;
II. Tu''+u'+ku0=0, при u>η;
III. Tu''+u'-ku0=0, при u<-η.
Обозначив y=u, dy/dt=z, построим фазовый портрет системы в координатах z,у с
помощью метода изоклин (рис.3.31).

Заметим, что уравнение I действительно для бесконечной полосы, ограниченной


прямыми линиями y=η, y= − η. Эти линии называются линиями переключения, так как при
упомянутых значениях y=η, y= − η происходит включение реле в ту или другую сторону.
Отсюда вытекает, что уравнение II действительно для части фазовой плоскости, лежащей
справа от линии переключения y=η, а уравнение III - для части, лежащей слева от линии
y=-η.
Найдем уравнения изоклин для каждой области фазовой плоскости.
Для области I в соответствии с уравнением I имеем:
Tz'+z=0, или T(dz/dy)z+z=0, откуда dz/dy=-1/T .
Полученное уравнение является уравнением фазовой траектории в дифференци-
альной форме, которое после интегрирования примет вид:
z= − ( y/T)+C1,
(0.96)
где С1 – постоянная интегрирования, определяемая из начальных условий.

404
Таким образом, фазовые траектории в области I представляют собой семейство па-
раллельных прямых с углом наклона ϕ = arctg (−1/ T ) . Следовательно, вся область I пред-
ставляет собой изоклину, так как угол наклона любых фазовых траекторий здесь одина-
ков.
Для области II в соответствии с уравнением II имеем:
Tz'+z+ku0=0, откуда dz/dy=-(z+ku0)/Tz .
(0.97)
При dz/dy=N получим уравнение изоклины:
z= − ku0/(1+TN) .
(0.98)
Правая часть уравнения (0.98) постоянна и зависит от принятой величины N. Таким
образом, изоклины представляют собой семейство прямых, параллельных оси абсцисс.
Для нахождения угла наклона фазовых траекторий при пересечении их с изоклина-
ми проанализируем уравнение (0.98). Для II области имеем: 1) при N=0, ψ= аrсtgN = 0 и
уравнение изоклины z= − ku0 совпадает с уравнением фазовой траектории; 2) при N=±∞,
ψ= ±π/2 и изоклина z=0 совпадает с осью абсцисс; 3) при N>0, 0 <ψ< π/2 и фазовые
траектории пересекают изоклины z=C=cоnst (0 >C >−ku0 , при у >η) с положительным ко-
эффициентом наклона; 4) при N<0 0>ψ>−π/2 и фазовые траектории пересекают изокли-
ны z=C=cоnst (C>0 и С <−кu0 при у >η) с отрицательным коэффициентом наклона.
Аналогичным образом находится уравнение изоклины для области III:
z=ku0/(1+TN) и строятся соответствующие траектории для этой области (рис.3.31).
Для рассматриваемого случая уравнение фазовой траектории можно получить и
аналитически, решив уравнение (0.97) путем разделения переменных и последующего ин-
тегрирования. Для области II имеем:
zdz ( z + ku0 − ku0 )dz
dy = −T = −T .
z + ky0 z + ku0
После интегрирования этого уравнения получаем уравнение фазовой траектории:
ku0 dz
y = −T ∫ dz + T ∫ = T {ku0 ln z + ku0 − z} + С2 .
z + ku0
(0.99)
Аналогично, можно найти уравнение фазовой траектории для области III.
y = −T {ku0 ln z − ku0 + z} + С3 .

(0.100)

405
Постоянные интегрирования С2 и С3 определяются из начальных условий. Напом-
ним, что при переходе фазовой траектории из одной зоны в другую, конечное состояние
системы в момент переключения (y=± η) для предыдущей зоны является начальным ус-
ловием для последующей.
Найденные в явном виде уравнения фазовых траекторий(0.96), (0.99) и (0.100) дают
возможность построить фазовый портрет системы аналитическим методом.

8.2.4. Колебательные процессы в релейных системах.


Исследование колебаний в линейных системах, обычно сводится к изучению процессов в
колебательном звене, описываемым линейным дифференциальным уравнением второго
порядка: T2y''+2Tξy'+y=kx(t), при ξ < 1 .(см. п.3.1.1)

Напомним что, в линейных системах могут возникать вынужденные колебания, ко-


торые происходят под действием внешнего колебательного, в частности периодического
воздействия x(t), и собственные колебания, возникающие в автономных системах, т.е. при
x(t)=0. В последнем случае колебания возникают за счет ненулевых начальных условий
которые физически соответствуют мгновенной подпитке системы энергией. Собственные
колебания в линейных системах называются также свободными, т.к. система продолжает
движение без внешних воздействий. Заметим, что характер собственных колебаний зави-
сит от конкретного значения коэффициента демпфирования ξ. При ξ=0 запасенная энер-
гия в системе сохраняется и в ней возникают свободные периодические (незатухающие и
нерасходящиеся) колебания: y=Asin(ωt+φ), где А и φ – постоянные интегрирования (ам-
плитуда и фаза колебаний), определенные из начальных условий. Такая система называет-
ся консервативной замкнутой системой. Если 0 < ξ < 1 в системе возникают свободные
непериодические затухающие колебания; если, − 1 < ξ < 0 то свободные непериодические
колебания будут расходящимися. В первом случае система отдает энергию во внешнюю
среду, а во втором - она потребляет энергию из внешней среды. И та, и другая системы
относятся к классу диссипативных, в которых происходит убыль или пополнение энергии.
В зависимости от конкретного значения коэффициентом демпфирования ξ колеба-
ния могут быть сходящиеся (0<ξ<1), расходящиеся ( − 1<ξ<0), периодические (ξ=0).
В теории нелинейных колебаний, к которым относятся релейные системы, исследу-
ется интегралы дифференциальных уравнений следующего вида:
T2y''+ψ(y',у,t)=0,
где ψ- нелинейная функция в неявном виде.

406
В случае возникновения периодического колебательного процесса изображающая
точка на фазовой плоскости перемещается по одной и той же замкнутой кривой. Напри-
мер, при линейной системы при ξ=0 этой кривой является эллипс (рис.3.23,а). Характер
движения и фазовый портрет нелинейных систем гораздо разнообразней, чем линейных.
Здесь возможно наличие одного или даже нескольких замкнутых контуров, которые назы-
ваются предельными циклами. Как и точка равновесия линей-
z Неустойчивый
ных систем (фокусы, узлы), предельные циклы могут быть ус- предельный цикл
тойчивы и неустойчивы. В первом случае фазовая траектория
навивается на предельный цикл, во втором – свивается.
Примером нелинейной системы с так называемым же- y

стким режимом возбуждения колебаний является обычные


Устойчивый
часы с маятником, фазовый портрет движения которого при- предельный
цикл
.
Рис.3.32
веден на рис.3.32. Здесь состояние равновесия (у= y ′ =0) ус-
тойчиво и окружено неустойчивым предельным циклом (часы не пойдут, если отклонить
маятник в пределах этого цикла). Если изображающая точка будет находиться вне неус-
тойчивого цикла, то фазовые траектории будут стягиваться к устойчивому предельному
циклу и в системе возникнут устойчивые периодические колебания, которые носят назва-
ние автоколебаний. При этом компенсация расхода энергии происходит за счет ее подвода
из внешних источников (в нашем примере упругая или энергия пружины потенциальная
энергия свободно подвешенной гири).
В общем случае автоколебаниями называются устойчивые собственные периоди-
ческие колебания нелинейной системы при отсутствии внешних воздействий (внешняя
связь остается только в виде подвода энергии), частота и амплитуда которых зависит от
внутренних параметров системы.
Подчеркнем, что в линейных системах параметры собственных колебаний А и φ за-
висят от начальных условий, поэтому эти колебания относятся к классу свободных, а в
нелинейных – не зависят от них, и следовательно, автоколебания относятся к классу не-
свободных. Частота колебаний и определяется как для линейных, так и для нелинейных
систем, параметрами системы.
Заметим, что если точка равновесия, находящаяся в начале координат, является не-
устойчивой и предельный цикл существует, то при включении системы в ней устанавли-
вается определенный режим автоколебаний при любых начальных условиях. Такой режим
возбуждения колебаний называется мягким. Примером таких систем могут служить сис-
темы, в которых используются релейные элементы с петлевыми характеристиками.

407
Рассмотрим случай, когда в качестве управляющего устройства системы рассмот-
ренной выше (рис.3.30), используется реле, с двухпозиционной петлевой релейной харак-
теристикой (рис.3.33).
Фазовый портрет системы строится с помощью уравнения (3.37), которое в данном
случае можно представить в виде двух уравнений для II и III зоны: II. Tu''+u'+ku0=0 и III.
Tu''+u'-ku0=0 уравнение для I зоны отсутствует, так как отсутствует
зона нечувствительности.
В соответствии с характеристикой реле (рис.3.33) его пере-
ключение производится: а) при движение
слева направо на прямой у=η; z>0; б) при
движении справа налево на прямой у= –η;
z<0. На фазовой плоскости (рис.3.34) линии
переключения нанесены пунктиром. Фазовый портрет системы
имеет расходящиеся траектории при малых начальных значени-
ях координат z, у и сходящиеся - при больших. Границей сходя-
щихся и расходящихся траекторий является замкнутый контур
(предельный цикл). Равновесное состояние системы z=y=0 неус-
тойчиво. Колебательный процесс устойчив, т.е. система работает в режиме автоколеба-
ний.
Рассмотрим случай, когда управляющим устройством является трехпозиционный
релейный элемент с петлей возврата (рис.3.35,а).
Здесь, в зависимости от соотношений параметров системы η и m, (0<m<1), пере-
ходной процесс в ней может носить либо характер затухающих колебаний, обусловлен-
ных наличием зоны нечувствительности, либо автоколебаний, обусловленных петлей воз-
врата. То значение коэффициента m, при котором возникает предельный цикл, называется
критическим (m=mk). Воспользовавшись уравнением фазовых траекторий для соответст-
вующих зон(0.96), (0.99) и (0.100) можно построить эти траектории для начальных усло-
вий у=+ η, z=0 и у = - η, z = 0 (рис.3.35,б). Абсцисса пересечения фазовых траекторий для
II-й и I зоны (или III и I) и дает искомое значение mkη.
В случае идеального двухпозиционного реле условие равновесия физически невы-
полнимо и в окрестностях точки z=y=0 возникнут
колебания с бесконечно малой амплитудой и бес-
конечно большой частотой. В реальных системах
и тот, и другой параметры колебаний конечны,
что обусловлено идеализацией дифференциаль-

408
ного уравнения движения системы. Здесь определяющую роль играют отброшенные про-
изводные более высокого порядка (третьего и выше). Поэтому анализ поведения такой
системы с помощью метода фазовой плоскости непригоден, и для ее исследования приме-
няют другие методы, в частности, метод гармонической линеаризации.

8.2.5. Метод точечных преобразований.


Этот метод заключается в последовательном рассмотрении положения изобра-
жающей точки на линии переключения.
Пусть в качестве управляющего элемента используется двухпозиционное реле с
петлевой характеристикой (рис.3.33), и объект управления описывается линейным диффе-
ренциальным уравнением второго порядка. Тогда, по аналогии с (3.39) уравнение системы
можно записать в виде:
Ty''+y' = kF(y);
(0.101)
где F(y)=± u0=const, а линии переключения на фазовой плоскости изображаются полу-
прямыми y= ± η.
Запишем ДУ фазовой траектории, положив Т=1с, k=1c-1 и учтя, что y' =z,

y′′ = zt′ = z ⋅ z y′ . Тогда имеем:

dz dz F ( y ) − z
z + z = F ( y) или = .
dy dy z
После разделения переменных и интегрирования получим:
z + F ( y) − F ( y)
y=∫ dz = –z–F(y)ln|z-F(y)|+С1 .
F ( y) − z
(0.102)
Для точки В(η,s) (рис.3.46) при t=0, имеем:
η=-s-F(y)ln|s-F(y)|+С1 .
(0.103)
Определив из (0.103) постоянную интегрирования С1 и подставив ее в (0.102), по-
лучим:
s − F ( y)
y=η+s-s+F(y)ln .
z − F ( y)

(0.104)
Уравнение (0.104) и есть уравнение фазовой траектории в явном виде. Запишем это
уравнение для точки А (-η, -v), :

409
1+ s 1+ s
−η = η + s + υ − ln , или ln =2 η +s+υ .
1−υ 1 −υ
(0.105)
Выражение (3.49) задает положение точки А в зависимости от положения точки В.
Зная s можно вычислить v. Заметим, что если s=|v|, то имеем замкнутый цикл (рис.3.36),
т.е. система находится в режиме автоколебаний. Параметры автоколебаний могут быть
вычислены путем решения уравнения (0.105). После потенцирования уравнения (3.48)
имеем:
e2η+s+υ=(1+s)/(1- v) или (1- v)eυe2 η
=(1+s)e-s
(0.106)
Обозначим правую и левую части полученного уравнения
соответственно ψ 1(s) и ψ 2(s). Эти функции называются функ-
циями точечного преобразования.
Уравнение (0.106) обычно решается графически. Если гра-
фики функции ψ 1(s) и ψ 2(s). имеют точки пересечения, т.е. есть
решение, то в системе имеют место колебания с амплитудой ymax.
Для качественного исследования функции ψ 1 и ψ 2 определим их
граничные значения для v =s=0 и v =s=1. Имеем: ψ 1(0)=e2η>1;
ψ 2(0)=1; ψ 1(1)=0; ψ 2(1)=2e-1≈ 0.73.
Отсюда вытекает, что графики кривых ψ 1(v) и ψ 2(s) обязательно пересекутся
(рис.3.37). При этом в точке пересечения кривых «о» s = v, т.е. имеем замкнутый цикл и,
следовательно, в системе существуют колебания.
Для выявления их устойчивости возьмем точку «а»
на кривой ψ 2(s). Через полуколебание имеем
z= v1<s1, т.е. колебания затухают, следовательно,
колебания – сходятся к предельному циклу. Для
точки «б» – колебания будут расходиться к этому
циклу (v2>s2). Таким образом предельный цикл ус-
тойчив и колебания системы представляют собой
автоколебания, параметры которых можно найти следующим образом.
Амплитуду автоколебаний ymax можно получить, воспользовавшись уравнением
(0.104). Например, при F(y)=1 и y=ymax , z=0 (см. рис.3.36) с учетом начальных условий в
точке В: у(0)=η; z(0)=s=zmax, окончательно получим: ymax=η+zmax+ ln|zmax-1|.

410
Период автоколебаний Та находится путем решения исходного дифференциального
уравнения движения системы (0.101) например при T=k=F(y)=1 имеем:
у''+у'+1=0, или zt'+z= –1.
После интегрирования получим: z=С2e-t-1. Учтя, что при t = 0, z= zmax определим
постоянную интегрирования С2=zmax+1. Окончательно получим:
z=(zmax+1)e-t − 1.
Так как при t=Ta/2 величина z= − zmax, можно записать:
− zmax=(zmax+1)e-Ta/2-1, или (1 − zmax)/(1+zmax)=e-Ta/2.
Логарифмируя последнее выражение окончательно получим:
1 + z max
Ta = 2 ln .
1 − z max

Метод точечных преобразований целесообразно применять при наличии в системе


автоколебаний, так как он дает возможность не только построить фазовый портрет систе-
мы, но сравнительно просто определить параметры автоколебаний.

8.2.6. Скользящий режим.


Рассмотрим простейшую релейную систему (рис.3.38), линейная часть которой
представляет собой астатическое звено второго порядка. Если F2(z)=0, F1(y1)=k1y1, то име-
ем линейную консервативную систему (ξ= 0), описы-
ваемую уравнениями: y''=x; x=-k1y, или
y''+k1y=0,
Здесь и далее полагаем y*=0 при этом y1= –y–
F2(z).
В этой системе под действием внешнего им-
пульсного возмущения возникают свободные незатухающие колебания, амплитуда кото-
рых зависит от начальных условий. Фазовая картина при этом представляет собой семей-
ство эллипсов, вложенных друг в друга (рис.3.23,а). В случае релейной системы при
F1(y)=сsigny=±с и учетом того, что y''=(dz/dy)z, уравнение (3.50) перепишется в виде:
(dz/dy)z ± c=0, или zdz ± cdy=0.
После интегрирования последнего уравнения получим уравнение фазовой траекто-
рии
(z2/2) ± cy=С1 ,
(0.108)
где С1- постоянная интегрирования, определяемая из начальных условий.

411
В соответствии с урав-
а) z б) z в) z нением (0.108) фазовые траек-
III II III I II III I II
тории будут замкнутыми кри-
выми, образованными отрез-
y −η η y −η η y
ками парабол, вершины кото-
рых перемещаются на оси абс-
цисс в зависимости от началь-
Рис.3.39
ных условий (рис.3.39,а).
При наличии зоны нечувствительности: F1(y1)=0, при |y1|<η величина z в этой зоне
равна z = 2C1 = const , т.е. фазовые траектории на бесконечной полосе фазовой плоско-

сти I представляют отрезки прямых, параллельных оси абсцисс (рис.3.39,б). В случае


трехпозиционной характеристики с петлей возврата в системе возникают расходящиеся
колебания (рис.3.39,в).
Во всех рассмотренных случаях релейная система функционирует неудовлетвори-
тельно, т. к. в ней возникают свободные незатухающие или расходящиеся колебания, па-
раметры которых зависят от начальных условий.
Для коррекции этой системы с целью получения удовлетворительного режима ее
функционирования можно ввести корректирующие звенья, в частности, звено F2(z).
Если на вход нелинейного элемента F1(y) дополнительно подать сигнал F2(z)=k2z,
то для идеальной двухпозиционной характеристики получим
⎧ .
⎪+ с, ∀ ( y + k2 y′) < 0
.
F1(y)= F1(-у-к2 y ' ) = ⎨ .
,
⎪−с, ∀ ( y + k2 y′) > 0

412
Переключение реле, как и ранее будет производиться при у1= у+k2, z = 0, и, следо-
вательно, уравнение линии переключения будет z = − y / k2 , т.е. эта линия не будет совпа-
дать с осью ординат. Уравнение фазовой траектории при этом остается прежним (0.108),
но вследствие упреждающего переключения
процесс будет затухающим. Например, при
движении системы из точки 1 (рис.3.40) пе-
реключение происходит в точке 2, т.е. при
скорости изменения координаты y меньшей,
чем при переключении, происходящем при у
= 0, и эта скорость продолжает уменьшаться.
При попадании изображающей точки на от-
резок линии переключения АВ фазовые тра-
ектории будут подходить к ней с обеих сто-
рон (точка 3) и, следовательно, изображаю-
щая точка не может уйти с этой линии. Но она не может и остаться на ней, т.к., например,
для точки 3, z<0, и, следовательно, изображающая точка будет двигаться влево, но уже не
по фазовой траектории, а по линии переключения. Этот режим работы получил название
скользящего. Так как переключение реле не могут производиться мгновенно, скользящий
режим реализуется не в виде плавного скольжения по линии переключения, а в виде виб-
раций малой амплитуды и большой частоты вокруг линии переключения.
Учтя z = y′ , перепишем уравнение линии переключения в виде: k2y'+y=0. Решение

этого уравнения y = C2 e − p1t при p1=-1/k2, характеризует процесс движения по линии пере-
ключения, определяемый только коэффициентом передачи корректирующего звена k2.
Подчеркнем, что в рассматриваемом случае линия переключения не являются фа-
зовой траекторией. Если же на входе релейного элемента сформировать сигнал так, чтобы
линия переключения совпадала с фазовой траекторией аОб, движение по которой проис-
ходит в направлении точки равновесия О, то скользящий режим исключается. Можно по-
казать, что при этом время переходного процесса минимизируется. (см. главу 10).

413
9. ПРИБЛИЖЕННЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ ДИНАМИЧЕСКИХ СВОЙСТВ
НЕЛИНЕЙНЫХ СИСТЕМ

9.1. МЕТОД ГАРМОНИЧЕСКОЙ ЛИНЕАРИЗАЦИИ

9.1.1. Сущность метода


Метод гармонической линеаризации нелинейностей основан на предположении о
том, что в замкнутой нелинейной системе устанавливается режим автоколебаний с неиз-
вестными амплитудой и частотой. При этом все переменные, характеризующие движение
такой системы являются периодическими функциями времени и могут быть разложены в
ряд Фурье. Предполагая, что линейная часть системы является низкочастотным фильтром,
ограничиваются первыми членами этого ряда, что существенно упрощает расчеты.
Представим нелинейную АСУ в виде линейной (ЛЧ) и нелинейной (НЧ) частей
(рис.3.41). Здесь ЛЧ – объект управления (ОУ), а НЧ – управляющее устройство (УУ).
Запишем уравнения линейной и нелинейной частей системы :
B( p)
Y ( p ) = Wл ( p ) X ( p ) = X ( p) ,
A( p)
(0.109)
x=F(y) .
(0.110)
B( p)
где Wл ( p ) = -передаточная функция линейной части системы; B( p) , A( p) - поли-
A( p )
номы m-ной и n-ной степени соответственно ( m ≤ n );F(y) –нелинейная функция.
Требуется установить факт отсутствия или наличия автоколебаний. В случае нали-
чия последних определить их амплитуду a и
частоту ω=2π/Tа, где Tа – период колебаний.
Строго говоря, автоколебания имеют
несинусоидальную форму, но так как по ус-
ловию линейная часть является низкочастот-
ным фильтром, то в первом приближении
можно предположить, что y=asinωt. Заме-
тим, что принятое допущение корректно при
выполнении условия A(ω3)/A(ω1)<<1, где A(ω1) и A(ω3) – амплитуды первой и третьей гар-
моник ряда Фурье соответственно. Тогда с учетом выражения (0.110) можно определить
Y(р) для различных нелинейных функций F(y). Например, в случае, если нелинейная ха-
рактеристика представляет собой двухпозиционное реле с петлевой характеристикой

414
(рис.3.42), то при подаче на его вход гармонического сигнала на выходе получаем прямо-
угольные импульсы той же частоты но со сдвигом на время τ, величина которого зависит
от ширины петли η .
Разложим выходную переменную нелинейного элемента, x(t), являющуюся перио-
дической функцией времени в ряд Фурье.
n
x(t ) = ∑ ( Ak sin kωt + Bk cos kωt ) ,
k =0

(0.111)
где ω – частота первой гармоники
Коэффициенты гармонического ряда (0.111) определяются по формулам:
2π 2π 2π
1 1 1
B0 =
2π ∫
0
x(ω t )dω t ; Ak =
π ∫
0
x(ω t ) sin kω dω t ; Bk =
π ∫ x(ωt ) cos kω tdω t .
0

Заметим, что если нелинейная характери-


стика симметрична относительно начала коорди-
нат, то постоянная составляющая В0 в разложе-
нии (0.111) отсутствует.
Так как линейная часть системы является
низкочастотным фильтром, то в разложение
(0.111) можно ограничиться первыми тремя чле-
нами. Тогда, учтя, что y=asinωt, y'=aωcosωt и,
следовательно, sinωt=y/a, cosωt=y'/aω, и поло-
жив В0=0, получим:
A1 B dy (t )
x(t ) = y (t ) + 1 .
a aω dt
A1 B1
Обозначив q(a ) = ; q1 (a) = , можно записать:
a a
q1 (a) dy (t )
x(t ) = q (a ) y (t ) + ⋅ .
ω dt
(0.112)
Дифференциальное уравнение (0.112) по форме подобно линейному дифференци-
альному уравнению, но с коэффициентами, зависящими от искомых величин а и ω. По-
следнее обстоятельство и отражает нелинейный характер зависимости x=F(y).
Именно линейная форма записи (0.112) позволяет назвать этот прием гармониче-
ской линеаризацией, а коэффициенты q(a) и q1(a) – коэффициентами гармонической ли-
неаризации.

415
Преобразуем (0.112) по Лапласу, получим:
⎡ q (a ) ⎤
X ( p ) = ⎢q (a ) + 1 ⋅ p ⎥Y ( p).
⎣ ω ⎦
(0.113)
Заметим, что выражение в квадратных скобках уравнения (0.113) можно трактовать
как передаточную функцию нелинейного гармонически линеаризованного звена. Тогда
можно записать:
⎡ q (a) ⎤
Wн ( p, a,ω ) = ⎢q (a) + 1 p⎥ .
⎣ ω ⎦
(0.114)
При замыкании системы отрицательной обратной связью в соответствии с уравне-
ниями(0.109), (0.113) и (0.114) получим:
Y(p)=Wл(p)X(p)= Wл(p)Wн(p,a,ω)Y(p),
С учетом того, что Wл(p)=В(р)/А(р), уравнение движения замкнутой системы (при
отсутствии внешних воздействий) примет вид:
[A(p)+B(p)Wн(p,a,ω)]Y(p)=0 .
(0.115)
Воспользовавшись выражениями (0.114), (0.115), можно записать характеристиче-
ское уравнение системы:
⎡ q (a) ⎤
D(p) = A(p) + B(p)⎢q(a) + 1 p ⎥ = 0 .
⎣ ω ⎦
(0.116)

9.1.2. Критерии устойчивости


Линейная форма записи уравнения движения (3.56) позволяет применить для ис-
следования нелинейных систем методы, разработанные в теории линейных систем. В ча-
стности, для этой цели широко используются частотные и алгебраические критерии ус-
тойчивости.
Применение критерия Михайлова
Напомним, что уравнение кривой Михайлова имеет вид:
D (jω) = a0 (jω)n + a1 (jω)n-1 +…+ an-1 (jω) + an=P(ω)+jQ(ω),
где P(ω),Q(ω) –вещественная и мнимая части комплексной переменной D(jω).
В случае наличия пары чисто мнимых корней характеристического уравнения
D(р)=0, в системе возникают незатухающие колебания. В этом случае кривая Михайлова

416
проходит через начало координат (кривая 1, рис.3.43). В частности для системы, движение
которой описывается выражением (0.115), уравнение кривой Михайлова имеет вид:
⎡ q (a) ⎤
D( jω) = A(jω) + B(jω) ⎢q(a) + 1 jω⎥ .
⎣ Ω ⎦
(0.117)
где: ω- текущее значение частоты; Ω - искомая частота колебаний замкнутой системы.
Представим выражение (0.117) как сумму вещественной и мнимой частей:
D(jω) = P(ω,a, Ω ) + jQ(ω,a, Ω) .
(0.118)
Из (0.118) следует что для того чтобы характеристическое
уравнение системы имело чисто мнимые корни, т.е. кривая Михай-
лова D(jω) проходила на комплексной плоскости через начало ко-
ординат, должны одновременно выполняться следующие условия.
P(ω , a, Ω) = 0; Q(ω , a, Ω) = 0.
Учитывая, что текущее значение частоты в начале координат
ω совпадает с частотой колебаний системы Ω и обозначив обозначив амплитуду колеба-
ний a = A , условия (0.119) можно записать в виде:
P( A, Ω) = 0; Q( A, Ω) = 0.
(0.120)
Соотношения (0.120) дает возможность установить факт отсутствия или наличия
колебаний и в последнем случае найти числовые значения искомых величин A и Ω . Если
система уравнений (0.120) имеет решение в положительных вещественных числах, то в
физической системе существует периодическое движение. Если такое решение отсутст-
вует, то периодическое движение не возникает.
Для исследования устойчивости колебательного процесса, т.е. для установления
факта возникновения автоколебаний, поступают следующим образом: увеличивают ам-
плитуду А на величину Δа. Тогда кривая Михайлова вследствие изменения параметров
уравнения (0.117) отклонится от начала координат в ту или иную сторону. Если она от-
клонится в положение 2 (рис.3.43), то попадаем в устойчивую зону и колебания будут за-
тухать, если в положение 3 – расходиться. Таким образом, в первом случае система воз-
вращается в первоначальное положение, а во втором – нет. Следовательно для возникно-
вения устойчивого периодического движения необходимо, чтобы при увеличении ампли-
туды колебаний (А+Δа) кривая Михайлова отклонялась в положение 2. Аналогичным об-
разом можно показать, что при уменьшении амплитуды колебаний (А-Δа) устойчивые ко-

417
лебания в системе возникают при смещении кривой Михайлова в положение 3. Это гео-
метрическое условие можно выразить и в аналитическом в виде:
∂P ∂Q ∂P ∂Q
⋅ | − ⋅ | >0.
∂a ∂ω A,Ω ∂ω ∂a A,Ω
Здесь в частные производные, взятые от выражений P(a,ω) и Q(a,ω) берутся в точке
a=A и ω=Ω.
Применение критерия Найквиста
Воспользовавшись соотношениями (0.109) и (0.114), запишем выражения для час-
тотных характеристик линейной и нелинейной частей системы, представленной на
рис.3.41.

B( jω) q1 (a)
Wл ( jω) = ; Wн ( jω , ja ) = q(a) + jω .
A( jω) Ω
(0.121)
Так как критерий Найквиста использует частотные функции разомкнутой системы,
то частоты внешних возмущений ω и искомая частота колебаний Ω совпадают, что позво-
ляет в выражении (0.121) их сократить. Тогда АФЧX разомкнутой системы примет вид:

B ( jω )
Wp(jω,a) = Wл(jω) Wн(a)= ⋅ [q(a) + jq1(a)].
A( jω )
В соответствии с критерием Найквиста колебательный процесс в системе возникает
в случае, если годограф вектора Wp(jω,a) пройдет через точку (-1, j0). Запишем это усло-
вие в виде:
Wл(jω) Wн(a) = − 1
(0.122)
Условие (0.122) можно переписать в виде:
1
Wл (j,ω) = −
Wн (a)
(0.123)
Уравнение (0.123), предложенное Гольдфарбом, позволяет определить искомые А и
Ω. В частности, построив отдельно частотную характеристику линейной части Wл(jω) и
обратную частотную характеристику ее нелинейной части с отрицательным знаком
(рис.3.44,а) можно найти точку их пересечения на комплексной плоскости, которая дает
искомые значения ω=Ω; a=A. Значения Ω и А определяются по отметкам ωi и aj на соот-
ветствующих кривых. Если кривые не пересекаются, то периодическое решение отсутст-

418
вует и, следовательно, колебание в системе не возникают. Заметим, что в случае, если
q1(a)=0 , характеристика − 1 / Wн(a) сливается с осью абсцисс (рис.3.44,б).

Можно показать, что если точки характеристики − 1 / Wн(a) с меньшими значения-

ми амплитуды охватываются линейной частотной характеристикой Wл(jω), то есть a1 < a 2


(рис.3.44,а,б), и имеются точки пересечения этих характеристик, то в системе возникают
устойчивые колебания (автоколебания). Действительно, пусть годограф частотной харак-
теристики разомкнутой системы Wp(jω,a) при
а=А проходит через точку (-1, j0) (рис.3.45).
Тогда для системы работающей в режиме ус-
тойчивых колебаний при а=А+Δа этот годо-
граф должен пересечь ось абсцисс справа от
точки (-1, j0), т.е. система должна попасть в
устойчивую область, что приводит к затуха-
нию колебаний ( Δa → 0 ). Следовательно, при
увеличении амплитуды а, абсолютное значе-
ние Wн(A+Δa), а вместе с ним и Wp(jω,A+Δa)=Wл(jω)*Wн(A+Δa), должно уменьшаться.
При этом значение 1/Wн(А+Δа) увеличивается, что и отражает сформулированный выше
признак устойчивых колебаний. Аналогичную картину получим при а=А-Δа. В этом слу-
чае колебательный процесс также будет сходиться к а=А, но с
другой стороны.
Другой способ исследования устойчивости колебаний
сводится к непосредственному анализу смещение годографа
Wp(jω,a) относительно точки (-1,j0), при добавлении и вычита-
нии приращения Δа к амплитуде колебаний А. В частности,
при смещении годографа Wp(jω,a), показанном на рис.3.45, ко-
лебания сходятся в точку (-1,j0), что свидетельствует об их ус-
тойчивости.
Применение критерия Гурвица
Известно, что условие устойчивости линейной системы по Гурвицу записывается в
виде: Δi>0, i = 1, n , a0 > 0, где Δi – определитель Гурвица; а0 - коэффициент при высшей
производной дифференциального уравнения движения системы.
В случае, если предпоследний определитель Гурвица Δn-1 равен нулю, то, система
находится на границе устойчивости и в ней возникают колебания.

419
Для гармонической линеаризованной системы коэффициенты ее характеристиче-
ского уравнения зависят от частоты ω и амплитуды а колебаний. Тогда при прочих посто-
янных параметрах условие возникнавения колебаний в системе можно записать в виде
Δn-1(а,ω) = 0
(0.124)
Таким образом необходимо найти а и ω удовлетворяющие условию (0.124). Так как
имеем два неизвестных, то для решения задачи необходимо иметь второе уравнение, ко-
торое можно получить, представив характеристическое уравнение стстемы в виде соот-
ветствующем наличию пары чисто мнимых корней (периодический режим).
Например, пусть дано характеристическое уравнение для системы третьего поряд-
ка:
а0р3 + а1р2 + а2р + а3 = 0.
При p1, 2 = ± jω это характеристическое уравнение можно записать в виде:

(р2 + ω2) (а0р +b1) = а0р3 +b1p2 + a0ω2p + ω2b1 = 0.


Здесь: b1 = a1, а0ω2= a2; ω2b1= a3, откуда ω2 = a3 / a1, или в общем случае:
ω2 = an / an-2 = f(a,ω).
(0.125)
Решение системы уравнений (0.124) и (0.125) дает искомые а=А и ω=Ω. Если это
решение является вещественным и положительным, то в системе имеет место незату-
хающий колебательный процесс.
Исследование устойчивости колебаний проводится аналогично предыдущему: если
при А +Δа, Δn-1>0, а при А -Δа, Δn-1< 0, имеем устойчивое периодическое решение, (авто-
колебания). В остальных случаях получим неустойчивые колебания: либо сходящиеся
при а→0, либо расходящиеся при а → ∞.

9.1.3. Определение коэффициентов гармонической линеаризации


Использование любого критерия устойчивости для определения А и Ω требует зна-
ния передаточной функции нелинейной части системы, определяемой выражением (0.114)
, а следовательно, знания коэффициентов гармони-
ческой линеаризации q(a) и q1(a).
В качестве примера найдем коэффициенты
гармонической линеаризации q(a) и q1(a) для трех-
позиционной релейной характеристики с петлей
возврата (рис.3.46).

420
Пусть на вход релейного элемента подается гармонический сигнал: y = a sin ωt . То-
гда, в соответствии с рис.3.46, имеем: η = a sinα1; mη = a sinα2 = a sin(π - α2). Откуда:
sin α1 = η / a ⎫

sin(π − α 2 ) = mη / a.⎭

(0.126)
Коэффициент гармонической линеаризации q(a) находится следующим образом.
2π α
А1 1 2 2
q (a ) = =
а πa ∫
0
x (ω t ) sin ω td ω t =
π a α∫1
c sin ω td ω t =

−2c 2c
= [ cos α 2 − cos α1 ] = [cos(π − α 2 ) + cos α 1 ].
πa πa
Учтя, что cosα = 1 − sin 2 α , и воспользовавшись соотношениями (0.126), полу-
чим:

2с ⎛⎜ m2η2 η 2 ⎞⎟
q(а) = 1− 2 + 1− 2 .
πа ⎜⎝ а а ⎟⎠

(0.127)
Выражение (0.127) позволяет определить коэффициент гармонической линеариза-
ции q(a) для различных релейных характеристик. Например при η = 0 релейная характе-
ристика, представленная на рис.3.46 принимает вид показанный на рис.3.47,а. При этом
коэффициент гармонической линеаризации

q(a) = .
πа
При m =± 1 характеристики релей-
ных элементов представлены на
рис.3.47,б,в. Коэффициенты гармониче-
ской линеаризации q(a) для обоих случа-
ев одинаковы и равны

4с η2
q(a) = 1− 2 .
πа а
Аналогично найдем второй коэффициент гармонической линеаризации нелинейно-
сти, представленной на рис. 3.46,q1(a). Имеем:
2π α
B1 1 2 2 2c
q1 (a) = = ∫ x(tω ) cos ωt ⋅ dωt = ∫ c ⋅ cos ωt ⋅ dωt = [sin α 2 − sin α 1 ] .
a πa 0 πa α1 πa

Учтя соотношение (0.126), окончательно получим:

421
2сη
q1(a) = (m − 1 ) .
πа 2
(0.128)
Воспользовавшись выражением (0.128) можно определить значение коэффициента
q1(a) для других релейных характеристик. В частности, для релейного элемента с петле-
вой двухпозиционной характеристикой (рис.3.47,в) получим
4сη
q1(а) = − .
πа 2
Для релейных элементов с характеристиками представленными на рис.3.47,а,б ко-
эффициент q1(a) = 0 . Заметим, что коэффициент q1(a) < 0 в том случае когда характери-
стика релейного элемента имеет петлю возврата, обуславливающую запаздывание в этом
элементе.
Подставив полученные q(a) и q1(a) в выражение передаточной функции соответст-
вующих релейных элементов, получим конкретное выражение этой функции.

9.1.4. Определение параметров автоколебаний.


Рассмотрим методику определения частоты и амплитуды автоколебаний, возни-
кающих в нелинейной системе на конкретном примере.
Пример 3.7 Пусть имеем систему управления тепловым режимом в сушильном
шкафу, функциональная схема которой представлена на рис.3.48.
Здесь ИМ – исполнительный механизм (серводвигатель с заслонкой); ОУ – объект
управления (сушильный шкаф); ЧЭ – чувствительный элемент (термопара).
Передаточные функции звеньев линейной части системы имеют вид:
kи k0
Wим (р) = ; Wоу (р) = ; Wчэ (p) = kэ .
р T0 р + 1
В качестве управляющего устройства
используется трехпозиционный релейный регу-
лятор, петлей возврата которого можно пренеб-
речь. Требуется установить факт наличия коле-
баний, исследовать их на устойчивость и опре-
делить параметры A и ω.
Решение. Запишем уравнение движения линейной части системы в отклонениях:
(Т0p2 + p) Y(p) = kX(p), k = kиkokэ . (0.129)
Уравнение трехпозиционного гармонически линеаризованного релейного регуля-
тора (при m ≈ 1 ) имеет вид:

422
Х(p) = Wн (p,ω,a) Y(p), (0.130)
⎡ q (a) ⎤
где: Wн ( p, ω , a) = ⎢ q(a) + 1 p ⎥ – передаточная функция нелинейной части (НЧ) системы.
⎣ ω ⎦
Учитывая, что в нашем случае q1(a)=0, имеем:

4с η2
Wн (а) = q(a) = 1− 2 . (0.131)
πа а
Воспользовавшись выражениями (0.129)-(0.131), запишем уравнение замкнутой
системы с отрицательной обратной связью:
[Т0p2 + p + kq(a)] Y(p) = 0.
В соответствии с алгебраическим критерием устойчивости Гурвица.
Δn-1 = Δ1 = a1 = 1 > 0; а0 = Т02 > 0.
Таким образом, в рассматриваемой системе, описываемой уравнением второго по-
рядка, колебания возникнуть не могут, что обусловлено наличием зоны нечувствительно-
сти элемента. Этот вывод совпадает с полученным в главе 8.
Учтем инерционность исполнительного механизма. Тогда передаточная функция
ИМ примет вид:
kи 1
Wим (р) = ⋅ ,
р Ти р + 1
где: Tu – электромеханическая постоянная времени серводвигателя.
При этом уравнение линейной части будет:
[T0Tиp3 + (T0 + Tи)p2 + p] Y(p) = kX(p).
Замкнув систему отрицательной обратной связью, и обозначив T0Tи=T2, T0+Tи=Т1,
запишем характеристическое уравнение замкнутой системы системы:
T2p3 + T1p2 + p + kq(a) = 0.
(0.132)
Предпоследний определитель Гурвица:
а1 а3 Т 1 kq
Δn−1 = Δ2 = = = Т 1 − Т 2 kq(a) ,
а0 а2 Т 2 1

Запишем условия возникновения колебаний в системе:


Δ2=T1–T2kq(a)=0. (0.133)
откуда

4с η2
Т1 = Т 2 k ⋅ 1− 2 . (0.134)
π а

423
Из полученного выражения найдем амплитуду колебаний а. Обозначив
4cT2 k / π = b и возведя в квадрат обе части уравнения (0.134), получим биквадратное
уравнение:
T1a4 – b2a2 + b2η 2 = 0,
решив которое, имеем:

b 2 ± b4 − 4Т 12 b 2η 2
а =
2
. (0.135)
2Т 12
Как вытекает из (0.135), найденное решение имеет физический смысл только при
условии: b>2T1η, которое можно записать
2Т 2 kc
Т1 < . (0.136)
πη
Полученное неравенство (0.136) и есть условие возникновения колебаний с ампли-
тудой а=А.
Частота колебаний ω определяется из уравнения: an − 2ω 2 = an , или в нашем случае
при n=3 имеем: ω2 = a3 /a1, где в соответствии с (0.132): a1 = T1; a3 = kq(a). Тогда с уче-
том (0.131), получим:

а3 k 4с η2
ω2 = = ⋅ 1− 2 . (0.137)
а1 Т 1 πа а

Полученное выражение имеет физический смысл при а > η.


Таким образом из соотношений (0.135) и (0.137) находим искомые а=А и ω= Ω.
Для установления факта наличия автоколебаний необходимо проверить устойчи-
вость полученного периодического решения. Для этого в соответствии с (3.74) построим
график q(a) (рис.3.49).
Воспользовавшись выражением (0.133)
получим: q (a ) a = A = T1 T2 k = const . Пересечения

прямой q( A) и кривой q(a) имеет место при


q( A) < qmax (рис.3.49). При этом точки 1 и 2 соот-
ветствуют двум корням (a1, a2) уравнения (0.133).
Проверим устойчивость полученных решений
(А=a1 и А=a2), воспользовавшись выражением
(0.133). Для этого к А добавим и вычтем Δа. При
А=a1 (точка 1) получим следующие варианты: 1) если а=а1+Δа, то как видно из рис.3.49
величина q(a) растет и, следовательно, определитель Δ2 в соответствии с (0.133) становит-

424
ся отрицательным, что свидетельствует о наличии расходящихся колебаний; 2) если а= а1-
Δа, то величина q(a) уменьшится, следовательно, Δ2 > 0 , и колебания будут затухать. Сле-
довательно, решение А=а1, характеризует режим неустойчивых колебаний. Аналогичный
анализ показывает, что решение А=а2 (точка 2) характеризует режим устойчивых колеба-
ний, что свидетельствует о наличии в системе автоколебаний, амплитуда которых равна
а2. Подставив найденное А=а2 в (0.137) найдем частоту автоколебаний ω = Ω. Таким об-
разом, при выполнении условия (0.136) в системе имеют место автоколебания.
Выражение (0.136) позволяет находить соотношение параметров рассматриваемой
системы, при которых возникают автоколебания. Учтя, что T2=T0Tи и Т1=Т0+Ти запишем
(0.118) в виде:
2TиT0 kс πT0η
(Т и + Т 0 ) < или Т и > (0.138)
πη 2T0 kс − πη
Тогда условие отсутствия автоколебаний в системе третьего порядка (n=3) при релейном
управляющем устройстве с трехпозиционной идеальной релейной характеристикой можно
записать, поменяв знак неравенства в выражении (0.138).

425
9.2. ВИБРАЦИОННАЯ ЛИНЕАРИЗАЦИЯ НЕЛИНЕЙНОСТИ
В случае воздействия на нелинейную часть системы, работающей в режиме автоко-
лебаний с частотой ω=Ω и амплитудой а=А внешних медленно меняющихся сигналов y0(t),
под которыми понимают сигналы удовлетворяющие условию: y0 (t + Ta ) − y 0 (t ) << y 0 (t ) , в
системе возникают несимметричные автоколебания и в разложении функций х(t) в ряд
Фурье, появляется постоянная составляющая В0 , отличная от нуля (рис.3.50)*).
Так как внешний сигнал изменяется медлен-
но, то в течение одного периода автоколебаний
Ta его можно считать постоянным и равным y0 . То-
гда уравнение нелинейной части системы можно
записать в виде:
q1(а) dy а
х(t) = В0 + q(a)yа + ⋅ ,
ω dt
где: yа = y – y0 =а sinωt - периодическая состав-
ляющая входного сигнала y(t); y0 - квазипостоян-
ная составляющая этого сигнала; а, ω – амплитуда и частота автоколебаний.
Коэффициенты гармонической линеаризации q(a) и q1(a) определяются аналогично
рассмотренному выше (п. 9.1.3) Можно показать, что для нелинейного элемента с трехпо-
зиционной релейной характеристикой с петлей возврата коэффициент q1(a) не зависит от
величины y0 и определяется по формуле (0.128), а коэффициент q(a) определяется сле-
дующим выражением:

c ⎡⎢ (η + y0 ) 2 (η − y0 ) 2 (mη + y0 ) 2 (mη − y0 ) 2 ⎤

q(a) = 1− + 1 − + 1 − + 1 − .
πa ⎢ a2 a2 a2 a2 ⎥
⎣ ⎦
(0.139)
В рассматриваемом примере (рис.3.50, η = 0 ) эти коэффициенты равны:

4c y2
q(a) = 1 − 02 ; q1(a) = 0.
πa a
(0.140)
Величина постоянной составляющей на выходе релейного элемента В0 (рис.3.50)
определяется из следующего соотношения:

*)
Заметим, что в случае несимметрии нелинейной характеристики x=F(y) относительно начала координат не-
симметричные автоколебания могут возникнуть и при отсутствии внешних воздействий. Однако этот случай не пред-
ставляет практического интереса и в дальнейшем не рассматривается.

426
с ⎡1 ⎤ с
2π α α2 2π
1
В0 =
2π ∫0 x (ω t )d ω t =
2π ⎣⎢ ∫0
⎢ d α − ∫0 d α + ∫ ⎥⎥ = π [α1 − α 2 + π ] ;
d α
α2 ⎦
y0
Учтя, что y0=asinα1 (рис.3.50) получим α1 = arcsin . Аналогично:
a
y0
π − α 2 = arcsin . Тогда:
a
2с y
В0 = arcsin 0 = Ф(y0 ) ,
π а
(0.141)
Φ(y0)=x0 где Ф(y0) – так называемая функция смещения.
c
Таким образом, если рассматриваемый релейный элемент
ψ
y0 находится в режиме автоколебаний, то при подаче на его вход мед-
-c ленно меняющегося сигнала y0(t) на выходе получаем составляю-
Рис. 3.51
щую сигнала x(t) в виде x0=В0=Ф0(y0), изменяющуюся в соответст-
вии с (0.141)(рис.3.51).
Функция Ф(у0) является достаточно гладкой кривой и пред-
ставляет собой квазистатическую характеристику релейного эле-
мента по каналу у0→x0, которую можно подвергнуть обычной ли-
неаризации. В результате этого нелинейное звено можно предста-
вить в виде усилительного звена с коэффициентом усиления kн, равным:
dФ(y0 )
k н = tgψ = .
dy0 y =0
0

(0.142)
При этом уравнение движения системы относительно медленно меняющегося воз-
действия можно записать в следующем виде:
[A(p) + B(p)kн]Y0(p) = kн A(p)F(p),
где: Wл(p) = B(p) / A (p) – передаточная функция линейной части системы; F(p) = L{f(t)};
f(t) – внешнее медленно меняющееся воздействие, приложенное к замкнутой системе.
Структурная схема системы может иметь вид, показанный на рис.3.52. Здесь внешнее воз-
действие f(t) приложено со стороны задания f(t)=y*(t). Переменная на выходе линейного
звена содержит помимо медленно меняющегося сигнала y0(t) высокочастотную состав-
ляющую yа=аsinωt, которая отфильтровывается линейной частью системы. Таким образом
можно считать, что медленно меняющиеся сигналы проходят через релейный элемент с
коэффициентом передачи равным kн, в то время как для автоколебательного контура пере-

427
q1 (a)
даточная функция этого элемента равна WН (a, ω, p ) = q (a ) + p . Здесь величины, q(a)
ω
и q1(a), kн для идеального трехпозиционного релейного элемента (рис.3.50), определяется
соотношениями (0.140),(0.142).
Аналогичным образом определяется функция смещения Ф(у0) для других типов не-
линейностей. Например, для нелинейности с зоной нечувствительности (рис.3.53,а) функ-
ция смещения имеет вид показанный на рис.3.35,б.
Анализ зависимостей, приведенных на
а) x x
рис.3.51 и 3.53,б показывает, что для медленно ме-
y α3 ωt
-η η α1 α2 α4
няющегося сигнала y0(t) эффект сглаживания су-
щественен. При этом значительно повышается
y0
точность работы системы. Можно показать, что
α1 y б) Ф(y0)
α3 α2 аналогичный эффект имеет место и при других ти-
α
α4 -(η+a)
пах нелинейных характеристиках
η+a
Этот эффект называется вибрационной ли-
ωt
Рис. 3.53 неаризацией или вибрационным сглаживанием не-
линейностей при помощи возбуждения автоколебаний в системе. Поэтому функцию Ф(у0)
иногда называют сглаженной нелинейной характеристикой. Заметим, что эффект сглажи-
вания нелинейности можно получить и при вынужденных колебаниях, но при этом возни-
кает необходимость иметь специальный генератор колебаний.
Изложенное позволяет сформировать необходимое условие возникновения эффекта
вибрационного сглаживания нелинейностей:
ωa >> ω0 max ,

(0.143)
где ω a - частота автоколебаний в нелинейной систем; ω 0 max - максимальная частота внеш-

него сигнала f (t ) .
Для проверки выполнения условия (0.143), а также для оценки уровня вибраций,
возникающих с системе обязательно определяются числовые значения частоты ω a и ам-
плитуды а автоколебаний. При этом используется один из методов рассмотренных ранее.
Эффект вибрационного сглаживания нелинейностей используется при
проектировании высокоточных систем с целью исключения отрицательного влияния на
качество работы системы таких негативных факторов как наличие зоны
нечувствительности, люфта, петли и т.п.

428
В качестве иллюстрации, рассмотрим систему управления штурвалом самолета, в
которой, для уменьшения
влияния сухого трения в
приводе штурвала, приме-
нен релейный усилитель,
возбуждающий автоколе-
бания в локальной системе.
Функциональная схема
системы приведена на
рис.3.54, на котором пунк-
тиром выделена упомянутая локальная система.
Амплитуда а и частота ω автоколебаний переменной в локальной системе подбира-
ется такой, чтобы они не воспринимались корпусом самолета. Приведенная система мо-
жет рассматриваться как следящая за произвольно медленно меняющимся внешними сиг-
налами f (t ) , вызывающими отклонение самолета от заданного курса у* . В соответствии с

методикой изложенной выше, для данной системы находят значения а, ω и Ф(Δ). Далее
производят обычную линеаризацию функции смещения, т.е. заменяют нелинейную глад-
кую зависимость Ф(Δ) линейной: Ф(Δ)=kн Δ. К полученному уравнению присоединяют
уравнения всех остальных звеньев системы (самолета, штурвала и др.) и рассчитывают
всю систему как линейную. При этом уже не обращают внимания на наличие автоколеба-
ний в локальном контуре, так как они учтены при определении эквивалентного коэффи-
циента усиления этого контура kн.

9.3. СТАТИСТИЧЕСКАЯ ЛИНЕАРИЗАЦИЯ НЕЛИНЕЙНОСТЕЙ

Если в состав системы управления, находящейся под воздействием случайных сиг-


налов и помех, входит элемент с нелинейной характеристикой, то для анализа ее работы
системы обычно пользуются приближенные методы, основанные на статистической ли-
неаризацияи нелинейностей.
Идея этого метода сводится к тому, что нелинейный элемент заменяется статисти-
чески эквивалентным линейным с передаточной функцией Wсэ ( p) так, чтобы среднеквад-
ратичное значение разности процессов в нелинейной и линеаризованной системе было
наименьшим*).

*)
Более подробно статистические характеристики рассмотрены в главе 10 п.10.4.1.

429
Постановка задачи поясняется схемой (рис.3.55)
для случая безинерционного нелинейного элемента НЭ
Требуется определить эквивалентный коэффициент пере-
дачи этого элемента kсэ .

Ошибка преобразования входного сигнала ϕ (t ) ли-


неаризованным элементом будет
Δ(t ) = y * (t ) − y (t ) = y * (t ) − k сэϕ (t ) ,
а дисперсия ошибки

DΔ = M [Δ 2 ] = M [( y *) ] − 2kсэ M [ y *ϕ ] + kсэ2 M [ϕ 2 ] =
2

= Ry* (0) − 2kсэ Ry*ϕ (0) + kсэ2 Rϕ (0) , (0.144)

где M [Δ2 ] − математическое ожидание квадрата центрированной случайной величины


T
1
T →∞ 2T ∫
Δ ; Rϕ (0) = lim ϕ 2 (t )dt = ∫ ϕ 2 P(ϕ )dϕ = σ ϕ2 − дисперсия входного сигнала; P(ϕ ) −
−T

плотность распределения вероятности входного сигнала ϕ (t ) ; Ry*ϕ (0) = M ⎡⎣ y *(t )ϕ (t ) ⎤⎦ =

T ∞
1
= lim
T →∞ 2T ∫ y *(t )ϕ (t )dt = ∫ F (ϕ )ϕP(ϕ )dϕ = r
−T −∞
y*ϕ - корреляционный момент случайных вели-

чин y* = F (ϕ ) и ϕ .
Найдем экстремум DΔ , взяв производную по k сэ от выражения (0.144):

∂DΔ
= −2 R y*ϕ (0) + 2k сэ Rϕ (0) = 0 ,
∂k сэ
откуда статистически эквивалентный коэффициент усиления будет:
R y *ϕ (0)
k сэ = . (0.145)
Rϕ (0)

∂ 2 DΔ
Так как > 0 , то найденное значение k сэ дает минимум дисперсии DΔ .
∂k сэ2

Величина DΔ min определиться после подстановки (0.145) в (0.144):

R y2*ϕ (0)
DΔ min = R y* (0) − .
Rϕ (0)

Пример 3.8 Дана замкнутая система управления, изображенная на рис.3.56.

430
Требуется определить дисперсию выходной величины y , обусловленную влияни-
1
ем помехи f , имеющей спектральную плотность S f (ω ) = . При этом полагаем
1 + T 2ω 2
u=0.
Решение. В статистической динамике f
u φ F y* k 1 y
доказывается, что любой закон распределения ϕ Tjω + 1 jω

случайной величины, поданный на вход линей-


Рис.3.56
ной цепи, преобразуется таким образом, что за-
кон распределения выходной величины приближается к нормальному.
Таким образом, можно считать, что на вход нелинейного элемента падан сигнал с
плотностью нормального распределения вероятности:
ϕ2

1 2σ ϕ2
P(ϕ ) = e ; при mϕ = 0 .
2π σ ϕ

Учтя, что уравнение идеальной релейной характеристики имеет вид:


⎧⎪+ c при ϕ > 0
F (ϕ ) = y* = c sign ϕ = ⎨
⎪⎩− c при ϕ < 0,

найдем корреляционный момент R y*ϕ (0)

⎛ ⎞ ϕ2
2
ϕ

1 − 2
2c
∞ −
2σ ϕ2 ⎛ ϕ ⎞
2
2cσ ϕ ∞ − z ϕ2
⎜ 2σ ϕ
⎟ ϕ dϕ =
2π σ ϕ ∫0 2π ∫0
Ry*ϕ (0) = ∫ c sign ϕ e e d ⎜
⎜ 2 ⎟⎟ = e dz , где z = .
⎜ 2πσ ϕ ⎟ ⎝ ⎠ 2σ ϕ2
−∞
⎝ ⎠


Так как ∫ e − z dz = − e − z = 1 , то получим:
0
0

2
R y*ϕ (0) = cσ ϕ .
π
Учтя, что Rϕ (0) = σ ϕ2 и воспользовавшись (0.145), найдем статистически эквива-

лентный коэффициент усиления:


Ry*ϕ (0) c 2 . (3.90)
kсэ = =
Rϕ (0) σϕ π

Частотная передаточная функция замкнутой системы по каналу f → y будет


1 + jωT .
W fy ( jω ) =
T ( jω ) 2 + jω + kkсэ

Заметим, что ϕ = y и k сэ = f (σ ϕ ) при u = 0 .

431
Для нахождения дисперсии выходной величины y (t ) можно воспользоваться фор-
мулой Парсеваля (4.86). Тогда, учтя соотношение между спектральными плотностями
выходного сигнала y и помехи f (4.84), получим:
∞ ∞ ∞
1 1 2 1 dω
σ = ∫−∞S y (ω )dω = 2π ∫−∞W fy ( jω ) S f (ω )dω = 2π ∫ T ( jω ) = I2
2


y 2
−∞
2
+ jω + kk сэ

Интеграл I 2 табулирован и для нашего случая равен:


1
I2 = = σ y2 . (0.146)
2kk сэ

Тогда после подстановки значения k сэ из Ошибка! Источник ссылки не найден.


в (0.146) и преобразований получим окончательное значение квадратической ошибки вы-
ходной величены y (t ) , обусловленной влиянием помехи f (t ) :


σy =
4kc
* * *
Статистическая линеаризация безынерционных нелинейных элементов может быть
основана не только на минимизации дисперсии ошибки Δ = y * − y (рис.3.55), но и на дру-
гих критериях. В частности, находит применение линеаризация, основанная на выполне-
нии равенства математических ожиданий и дисперсии истинной и аппроксимирующей
случайных функций.
В этом случае
σ y*
k сэ = (0.147)
σϕ
Замечено, что лучшее приближение получается в случае, если в качестве величины
k сэ взять среднее арифметическое величин k сэ вычисленных по формулам (0.145), (0.147).
Для линеаризации инерционных нелинейных элементов могут быть использованы
приближения с помощью более простых линейных преобразований для нормально рас-
пределенного сигнала или для сигнала и его производной.

432
РАЗДЕЛ IV
СПЕЦИАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

Под оптимальной системой управления понимается система, которой тем или иным спо-
собом приданы наилучшие качества в каком-либо определенном смысле.
Вообще говоря, любая научно обоснованная система является оптимальной, так как, вы-
бирая ту или иную систему, мы тем самым предпочитаем ее другим. Оценка функциони-
рования системы производится с помощью вполне определенных и всегда наличествую-
щих критериев оптимальности, без которых обоснованный выбор системы был бы не-
возможен.
Задачей теории оптимальных систем управления является определение в общем
виде законов управления объектом, дающих возможность судить о том, что можно и чего
нельзя достигнуть в реальных условиях. Классической постановкой такой задачи является
задача определения оптимального в определенном смысле алгоритма управления при на-
личии полной априорной информации (математическое описание, включая ограничения,
накладываемые на любые координаты системы) об объекте управления, а также достаточ-
но строгой математической формулировки цели управления.

ЦЕЛЬ УПРАВЛЕНИЯ И КРИТЕРИЙ ОПТИМАЛЬНОСТИ

В качестве цели управления каким-либо объектом можно рассматривать выполнение оп-


ределенных требований, предъявляемых к системе управления. Такими требованиями
могут быть ограничивающие условия, налагаемые на выходные координаты (например,
допуски на изготавливаемые изделия, ошибки стабилизации управляемой величины), экс-
тремальные условия (например, максимальная мощность или коэффициент полезного
действия, минимальные потери энергоресурсов) и некоторые показатели качества (напри-
мер, содержание вредных компонентов в конечной продукции).
Следует отметить исключительную сложность задачи строгой формализации цели управ-
ления. Дело в том, что любая система управления входит как подсистема в систему управ-
ления более высокого уровня. В принципе при формировании критерия необходимо учи-
тывать факторы, определяющие поведение систем более высокого уровня, вплоть до со-
циально-экономических факторов глобального масштаба. Но такой подход в чистом виде
вследствие огромного количества локальных требований (часто противоречивых), предъ-
являемым к переменным и определяющим эффективность работы системы, фактически
означал бы отказ от поставленной задачи.
Более плодотворна идея приближенного учета влияния верхних уровней управления пу-
тем введения соответствующих коррекций в выражение, характеризующее эффективность
работы системы на конкретном уровне управления. В частности, при добыче или обога-
щении полезных ископаемых выгодно получить максимальный выход товарного продук-
та, но при этом неизбежно ухудшается его качество, что не соответствует интересам по-
требителя. В этом проявляется антагонизм между локальным и глобальным критериями.
Сформулировав критерий как максимум продукта заданного качества и не зная строгого
обоснования заданного показателя качества, можно учесть требования потребителя. Дру-
гим примером противоречивых интересов могут быть интересы поставщика и потребите-
ля электроэнергии. Если для потребителя электроэнергии важна активная часть потреб-

433
ляемой мощности (компенсация реактивной мощности – это дополнительные заботы), то
производителю необходимо учитывать и реактивную ее составляющую (так как она влия-
ет на величину потерь электроенергии в сетях). Поэтому в качестве одного из кон-
тролируемых показателей, по которым производятся расчеты за электроэнергию, обяза-
тельно используется коэффициент мощности.
В общем случае при поиске формализованного (математического) выражения для крите-
рия оптимальности обычно руководствуются следующими соображениями:
• Критерий, прежде всего, должен отражать экономические показатели или величины с
ними связанные.
• Для конкретной системы должен учитываться только один критерий. В случае много-
критериальной задачи целесообразно синтезировать глобальный критерий как определен-
ную функцию от частных критериев.
• Критерий должен быть связан с управляющими воздействиями, в противном случае он
бесполезен.
• Критериальная функция должна иметь подходящую форму. Желательно пользоваться
критериальной функцией, имеющей один экстремум. К нежелательным формам критери-
альной функции относятся неоднозначные функции, имеющие разрыв, локальные экстре-
мумы и т.п.
• Информация, необходимая для формирования критерия, не должна быть избыточной.
Это позволяет максимально упростить систему измерительных устройств и повысить на-
дежность функционирования системы в целом.
Если целью управления является достижение максимальной точности (например,
стабилизации, слежения), критерием может служить средняя квадратическая ошибка управ-
ления в виде
T
Q = ∫ y 2 (t )dt , (4.1)
0

где y (t ) – отклонение управляемой величины от заданного значения; T – время наблюде-


ния; t – текущее время.
Если требования предъявляются не только к основной координате, но и к другим показа-
телям (например, к скорости и ускорению ее изменения), критерий оптимальности чаще
всего задается в виде аддитивного интегрального критерия вида
T
Q = ∫ ∑ γi yi (t )dt ,
2
(4.2)
0 i

где γ i - заданные весовые коэффициенты, учитывающие значимость i -го показателя yi (t ) .


В выражениях (4.1) и (4.2) вместо t , вообще говоря, может быть любой другой физиче-
ский параметр: например, если ставится задача получения минимума неравномерности
распределения температур в объеме V , то место t займет V .
В общем случае критерий, оценивающий оптимизируемый процесс, зависит от состояния
системы, характеризуемой векторами выходных y = ( y1 , y2 ... yn ) , задающих y* , возмущаю-
щих f и управляющих u воздействий, а также времени t . Тогда
T
Q = ∫ F ( y , y * , f , u , t )dt . (4.3)
0

В классической задаче об оптимальном управлении, сформулированной


А.А.Фельдбаумом, требуется найти такое управление u (t ) , удовлетворяющее условию

434
u ∈ Ω(u ) ( u принадлежит области допустимых управлений), и соответствующее движение
y (t ) , чтобы при переходе системы из состояния y0 в состояние yT минимизировалось вы-
ражение (4.3), в котором векторы y* и f полагаются неизменными и поэтому не учиты-
ваются. В частном случае, при F = 1 получим Q = T . Тогда, если требуется реализовать
цель Q = min, получаем задачу о максимальном быстродействии.

ЭНЕРГЕТИЧЕСКИЕ СООТНОШЕНИЯ ПРИ УПРАВЛЕНИИ,


ОПТИМАЛЬНОМ ПО БЫСТРОДЕЙСТВИЮ

Работа объекта управления при определенном, например номинальном, режиме возможна


только тогда, когда энергия, запасенная в нем, соответствует этому режиму. Например,
работа двигателя с постоянной скоростью ω = ωн возможна только тогда, когда кинетиче-
ская энергия, запасенная в его вращающихся массах, соответствует этой скорости. Если
такого соответствия нет, то координата системы ω будет изменяться.
Увеличивая подводимую мощность, можно ускорять процесс изменения запасенной энер-
гии в системе и тем самым ускорять изменение управляемых координат до заданного зна-
чения. Однако увеличение мощности ограничено возможностями объекта управления, а
также мощностью источника питания. Следовательно, задача состоит в поиске оптималь-
ных законов управления для конкретных объектов.
Пусть объект описывается линейным дифференциальным уравнением первого порядка
(например, обмотка возбуждения электрической машины постоянного тока)
Т y& + y = ku , а) б)
где T – постоянная времени; k – коэффициент
усиления.
Решение этого уравнения при скачкооб-
разном изменении управляющего воздействия
u = u0 ⋅1[t ] (рис.4.1, а) и нулевых начальных усло-
виях имеет вид
y (t )) = ku 0 (1 − e − t / T ) .
Зависимость y (t ) представлена на рис.4.1,б. Мож-
но показать, что заштрихованная площадь
S1 пропорциональна количеству энергии, запа-
сенной в системе. Например, если к источнику
напряжения U= U 0 подключается электрическая
цепь R − L , то

S1 = ∫ [i∞ − i (t ) ] dt = i∞T ,
0

где i (t ) = i∞ (1 − е −t / T ) ; i∞ = U 0 / R ; T = L / R .
С другой стороны, количество энергии А, запасенной в индуктивности L, равно
Li∞2 U U
A= = Ti∞ 0 = 0 S1 .
2 2 2
Так как U0 = const , то величина А пропорциональна площади S1. При этом площадь S 2 про-
порциональна полезной работе, совершаемой на активном сопротивлении R .

435
Форсировку переходного процесса можно по-
лучить, увеличивая подводимое напряжение
(управляющее воздействие) до U = U max
(рис.4.2, а). Если в момент достижения y = y∞
уменьшить U до U 0 , то управляемая координа-
та y сразу примет установившееся значение
y∞ (рис.4.2, б). Это обусловлено тем, что коли-
чество энергии, запасенное к моменту времени
t1 , равно тому, которое необходимо для работы
в установившемся режиме y = y∞ , так как мож-
но доказать, что S3 = S1 . По истечении интервала t1 управление прекратить нельзя, его
нужно поддерживать на уровне U 0 , чтобы удерживать y = y∞ .
U
а) 2 3 1
Umax

4
U0

– Umax

б) y

ymax
1
S3
3
y∞

S1

2 4

t2 t1 t

Рис.4.3

В случае, если объект является апериодическим звеном второго порядка (например, элек-
трическая цепь R − L − C ), то описанный порядок управления (рис.4.3, а, ступенчатая
функция 1) не приводит к равенству площадей S1 и S3 (рис.4.3, б кривая 2). Можно пока-
зать, что при любых параметрах объекта S3 > S1 . Это приводит к избытку запасенной
энергии, а переходной процесс будет происходить с перерегулированием (рис.4.3,б кри-
вая 1). В случае, если производить переключение несколько ранее, в момент t2 , соответ-
ствующий равенству S1 = S3 , то при этом координата y < y∞ и переходной процесс будет
продолжаться (рис.4.3, кривая 2). Траектории 1 и 2 не являются оптимальными, хотя и

436
обеспечивают большее быстродействие по сравнению с переходным процессом, получен-
ным при отсутствии форсировки (кривая 4).
Управление координатой y можно осуществить и другим путем. Дадим объекту запас
энергии несколько больший, чем требуется при режиме y = y∞ . При подходе к y∞ отни-
мем этот излишек путем подачи отрицательного управления U = −U max . К моменту окон-
чания управления энергия и координата должны быть равны заданным значениям (рис.4.3,
кривая 3). При этом переходной процесс является оптимальным и заканчивается за конеч-
ное время. Таким образом, для оптимального управления объектом, описываемым диффе-
ренциальным уравнением второго порядка, управление должно один раз менять знак.
Продолжая аналогичные рассуждения для объектов, описываемых линейными уравне-
ниями более высокого порядка, придем к выводу: количество смен знака управляющего
воздействия зависит от порядка дифференциального уравнения и равно n − 1 , где n - по-
рядок уравнения. Это положение носит название теоремы об n интервалах или ( n − 1 )
переключениях. Отыскание моментов переключения управлений и является задачей, ко-
торую необходимо решить для создания системы, оптимальной по быстродействию.
Заметим, что если характеристическое уравнение системы имеет комплексные корни, то
число переключений управления зависит от начальных условий и может быть большим,
чем n − 1 .

ОСНОВНЫЕ МЕТОДЫ СИНТЕЗА ОПТИМАЛЬНЫХ СИСТЕМ


УПРАВЛЕНИЯ

Наиболее широкое распространение получили методы синтеза, использующие классиче-


ское вариационное исчисление, динамическое программирование и принцип максимума.
Вариационное исчисление целесообразно применять к задачам, в которых области изме-
нения y (t ) и u (t ) не содержат ограничений и являются непрерывными, что имеет место
при малых отклонениях величин y и u от установившихся состояний.
Метод динамического программирования и принцип максимума применяются, когда об-
ласти векторов y (t ) и u (t ) замкнутые, а коэффициенты векторов y (t ) и u (t ) могут быть
кусочно-непрерывными функциями и находиться на границах этих областей.
Каждый из упомянутых методов сопровождается различными приемами доведения задачи
до численного решения, что во многих случаях, особенно для систем высокого порядка,
представляет весьма трудную задачу даже при наличии решения задачи в принципиаль-
ном виде.
Синтез оптимальных систем с помощью вариационного исчисления
Фундаментальным понятием вариационного исчисления является функционал v, под кото-
рым понимают переменную величину, значение которой определяется выбором одной или
нескольких функций. Например, функционалом v является длина кривой l, соединяющей
две заданные точки А и В, расположенные на плоскости x0y, так как эта величина опреде-
ляется выбором функции y(x), описывающей кривую, проходящую через эти точки, т.е.
xb

v {y ( x)} = l{y ( x)} = ∫ dl = ∫ 1 + y& 2 dx


AB xA

Другим примером функционала v может служить критерий эффективности системы Q,


определяемый, в частности, выражением (4.1), который зависит от вида функции y(t),
описывающей переходные процессы в системе управления:
T
v {y (t )} = Q{y (t )} = ∫ y 2 (t )dt
0

437
В общем случае зависимость, характерную для функционалов, можно сформулировать
следующим образом: функции y(x) соответствует число v, определяющее значение
функционала. Напомним, что для обычной функции y(x) числу x соответствует число y,
определяющее значение функции.
Вариационное исчисление изучает методы исследования функционалов на максимум и
минимум. Соответствующие задачи называются вариационными. К ним, прежде всего, относятся
три классические задачи.
1. Задача о брахистохроне (см. пример 4.1).
2. Геодезическая задача, в которой требуется определить линию наименьшей дли-
ны l, соединяющую две заданные точки на некоторой поверхности
ϕ ( x, y, z) = 0 .
3. Изопериметрическая задача, в которой требуется найти уравнение замкнутой
линии заданной длины L, ограничивающей максимальную площадь S. Эта ва-
риационная задача была решена еще в Древней Греции: такой замкнутой лини-
ей оказалась окружность.
Заметим, что в последних двух задачах экстремум функционала ищется при определенных
условиях {ϕ ( x , y , z ) = 0, L = const } . Поэтому такие задачи называются задачами на услов-
ный экстремум.
Методы решения вариационных задач весьма сходны с методами исследования функции
на максимум и минимум. В частности, если функционал, например, Q{y(t)}, достигает экс-
тремума при y(t) = yэ(t), то вариация функционала δQ , под которой понимают линейную
часть его приращения по отношению к приращению функции y(t), равна нулю, то есть
δQ{ yэ (t )} = 0
Здесь yэ(t) – это функция, принадлежащая к некоторому классу функций, при которой зна-
чение функционала Q достигает экстремума. Именно поэтому функция yэ(t) называется
экстремалью функционала Q{y(t)}.
В теории вариационного исчисления доказывается, что если функционал задан в виде
t1

Q = ∫ F ( y, y& , t )dt , (4.4)


t0

то экстремаль функционала y (t , C1 , C2 ) , где C1 ,C2 – постоянные интегрирования, опреде-


ляемые из граничных условий y (t 0 ), y (t1 ), является решением уравнения Эйлера:

∂F d ∂F dF& y&
− =0 или F& y − =0 (4.5)
∂y dt ∂y& dt
Проиллюстрируем методику решения вариационных задач на одном классическом приме-
ре.
Пример 4.1. В 1696 г. Я.Бернулли опубликовал задачу
о линии быстрейшего ската (задача о брахистохроне),
которая формулируется следующим образом: опреде-
лить уравнение траектории, соединяющей две заданные
точки А (0,0) и В ( x1, y1 ), не лежащие на одной верти-
кальной прямой (рис.4.4) и обладающие тем свойством,
что материальная точка, помещенная в точку А, скатит-
ся по этой траектории в точку В за кратчайшее время t .
Решение. Известно, что скорость движения материальной точки при свободном падении

438
dS
= 2 gy , (4.6)
dt
где S – путь; g – ускорение свободного падения.
( dx ) + ( dy )
2 2
Интегрируя (4.6) и учтя, что dS = , получим
x1
dS 1 1 + y& 2
t [ y ( x) ] = ∫ = ∫ dx (4.7)
∪ AB 2 gy 2g 0 y
при граничных условиях y (0) = 0; y ( x1 ) = y1 .
Сравнивая правые части уравнений (4.4) и (4.7), можно записать

F = 1 + y& 2 y.
Подставив найденное значение F в (4.5), после преобразований и интегрирования полу-
чим первый интеграл Эйлера в виде
y (1 + y& 2 ) = C1 .

Введя параметр α и полагая y& = ctg α , получим


C1 C
y (α ) = = 1 (1 − cos 2α ) .
1 + ctg α
2
2
Учитывая, что
dy C1 sin 2α
dx = = dα ,
y& ctg α
после интегрирования можем записать
⎛ 1 ⎞
x(α ) = C1 ⎜α − sin 2α ⎟ + C 2 .
⎝ 2 ⎠
где C1 , C2 - постоянные интегрирования, определяемые из граничных условий.
Полученные зависимости y (α ) и x(α ) являются уравнениями циклоиды в параметриче-
ской форме и представляют собой искомую экстремаль функционала (4.7).
***

Вариационную задачу можно обобщить и на случай, если функционал зависит от не-


скольких функций одной и той же переменной t :
t1

Q = ∫ F ( y1 ,..., y n , y& 1 ,... y& n , t )dt . (4.8)


t0

В этом случае, варьируя одну из функций yi (t ) и оставляя все остальные неизменными,


получаем функционал, зависящий от одной исследуемой функции. Функция yi (t ) , реали-
зующая экстремум функционала Q , должна в этом случае удовлетворять уравнению Эй-
лера. Таким образом, для любой функции yi (t ) , имеем

d F& y& i
F& yi − = 0; i = 1, n . (4.9)
dt
Решение системы уравнений (4.9) дает семейство искомых экстремалей yi (t ) .

439
Вариационная задача обобщается также и на случай, когда в подынтегральную функцию
входят производные высших порядков, т.е. функционал Q имеет вид:
t1 . ..
Q = ∫ F ( y, y, y,..., y ( l ) , t )dt (4.10)
t0

при заданных граничных условиях y ( i ) (t 0 ) и y ( i ) (t1 ) , i = 0, l − 1 .


Можно показать, что в этом случае экстремаль функционала находится как решение урав-
нения Эйлера – Пуассона

d F& y& d 2 F&&y& d (l ) F& y ( l )


F& y − + − ... + (−1) l
=0. (4.11)
dt dt 2 dt ( l )
Если в функционал (4.10) входит несколько функций yi (t ) , то экстремали определяются
решением системы уравнений Эйлера – Пуассона.
Вариационные методы применимы также к решению задач на условный экстремум. Пусть
задан функционал вида (4.8) и дополнительные уравнения

ϕ j ( y1 ,... yn , y&1 ,... y& n , t ) = 0, j = 1, m, m< n, (4.12)

называемые уравнениями связи.


Подобные задачи встречаются при синтезе систем автоматического управления. В них
обычно задаются критерий в виде функционала и система уравнений, описывающая объ-
ект, и требуется найти min Q при условии (4.12). Такие задачи решаются сведением их к
безусловному экстремуму. Для этого вводится вспомогательная функция
m
F * = F + ∑ λ j (t )ϕ j , (4.13)
j =1

где λ j (t ) – неопределенные множители Лагранжа.


Для функции F * решают систему уравнений Эйлера, аналогичную системе (4.9). Эта сис-
тема дополняется заданными уравнениями связи (4.12). Таким образом, n уравнений Эйле-
ра и m уравнений связи позволяют определить m + n неизвестных yi (t ) и λ j (t ) .
Если в функционал (4.8) входят также высшие производные, то систему уравнений Эйлера
заменяют системой уравнений Эйлера – Пуассона типа (4.11).
Заметим, что уравнения связи могут иметь и интегральную форму, например,
t1

Q j = ∫ F j ( y, y& , t )dt = L j ; j = 1, m . (4.14)


t0

В этом случае вспомогательная функция имеет вид:


m
F * = F + ∑ λ j Fj , (4.15)
j =1

где λ j – неопределенный множитель Лагранжа, равный константе.


Пример 4.2. Пусть критерий оптимальности имеет вид

Q = ∫ ( y 2 + γ 1 y& 2 + γ 2 &y& 2 )dt , (4.16)
0

где γ1 и γ 2 – весовые коэффициенты, учитывающие значимость скорости и ускорения пе-


реходного процесса.

440
Первое слагаемое подынтегрального выражения (4.16) запрещает длительное существова-
ние отклонения выходной координаты от заданного значения, а последующие – длитель-
ное существование больших значений производных. Поэтому минимуму интеграла (4.16)
соответствуют достаточно быстрые и плавные переходные процессы. Заметим, что в слу-
чае необходимости минимизации мощности управления в подынтегральное выражение
(4.16) вводят квадратичные члены вида γ i u 2 .
Синтезируем оптимальную систему в смысле минимума критерия Q.
Решение. Для нахождения экстремали функционала вида (4.16) составим и решим урав-
нение Эйлера – Пуассона (4.11). При F = y 2 + γ 1 y& 2 + γ 2 &y& 2 имеем

d F& y& d 2 F& &y&


F& y − + 2
= 2( y − γ 1 &y&+ γ 2 y ( 4 ) ) = 0 . (4.17)
dt dt
Характеристический полином H ( p) дифференциального уравнения (4.17) можно записать
в виде
H ( p ) = 1 − γ 1 p 2 + γ 2 p 4 = (1 + θ1 p + θ 2 p 2 )(1 − θ1 p + θ 2 p 2 ) = M ( p) N ( p) , (4.18)
где M ( p ) и N ( p ) – полиномы второй степени соответственно с корнями в левой и правой
полуплоскостях.
С учетом требований устойчивости при нахождении экстремали необходимо учитывать толь-
ко корни уравнения M ( p ) = 0. Тогда
p1,2 = (−θ1 ± θ12 − 4θ 2 ) 2θ 2 < 0 ,
и уравнение экстремали (при θ12 > 4θ2 ) примет вид
y = C1e p1t + C2 e p2t . (4.19)

Постоянные интегрирования находятся из начальных условий: y (0) = y0 ; y& (0) = y& 0 .


Как вытекает из (4.19), уравнение экстремали представляет собой решение дифференци-
ального уравнения второго порядка, например, вида
T 2 &y&+ 2ξT y& + y = 0 . (4.20)
Таким образом, синтез оптимальной в смысле минимума выражения (4.16) системы управ-
ления приводит к получению переходных процессов, являющихся решением дифференциального
уравнения второго порядка вида (4.20). Воспользовавшись выражением (4.18) и сравнивая коэф-
фициенты полиномов при одинаковых степенях, можно определить параметры этого уравнения:
θ1 γ1 + 2 γ 2
T 2 = θ2 = γ 2 ; ξ= = .
2T 24 γ 2
Пусть объект управления (рис.4.5) представляет собой
интегрирующее звено с передаточной функцией
W0 ( p) = k 0 / p . Тогда характеристическое уравнение
замкнутой системы можно записать в виде
W0* ( p )W y* ( p ) + 1 = 0 ,

где W0* ( p) и Wy* ( p) – обратные передаточные функции объекта и устройства управления.


Так как оптимальному переходному процессу соответствует система, описываемая урав-
нением (4.20), то, сравнивая полученное характеристическое уравнение с характеристическим
уравнением дифференциального уравнения (4.20), имеем
p *
W y ( p) + 1 = α (T 2 p 2 + 2ξTp + 1) , (4.21)
k0

441
где α – любое отличное от нуля число.
Из (4.21) следует, что Wy* ( p) должна представлять собой полином первого порядка. Тогда
1 1
Wy ( p ) = = .
Wy* ( p) a0 p + a1

Коэффициенты a0 и a1 находят, приравнивая коэффициенты при одинаковых степенях в


(4.21). Окончательно
ky
W y ( p) = ,
Ty p + 1

где T y = T /(2ξ ); k y = 1 /(2k 0ξT ) .


Таким образом, знание параметров объекта k 0 и весовых коэффициентов γ1 и γ 2 , а сле-
довательно и величин T и ξ , позволяет синтезировать управляющее устройство, при ко-
тором минимизируется критерий (4.16). Заметим, что если весовой коэффициент γ 2 , а
следовательно и T , задать сколь угодно малым, то время переходного процесса будет
также сколь угодно малым, но при этом величина коэффициента усиления k y , а следова-
тельно, и управление u должны быть сколь угодно большими. Это обусловливает при вы-
боре весовых коэффициентов в выражении (4.16) необходимость учета ограничений, нала-
гаемых не только на величины y& и &y& , но и на u .
***
Описанная методика синтеза оптимальной системы управления была предложена
А.М.Летовым и получила название аналитического конструирования оптимальных регу-
ляторов.
В том случае, когда порядок характеристического уравнения реальной системы превыша-
ет порядок характеристического уравнения желаемой системы оптимальная система фи-
зически не реализуема, так как не реализуемы идеальные дифференцирующие звенья. В
связи с этим ограничиваются параметрическим синтезом системы заданной структуры.
Для этого определяют зависимость принятого критерия Q от изменяемых параметров
системы, а затем отыскивают значения параметров, при которых Q = min . Таким образом,
вариационная задача сводится к задаче отыскания экстремума функции нескольких пере-
менных (изменяемых параметров системы).
Пример 4.3. Имеем следящую систему заданной структуры (рис.4.6), описываемую диф-
ференциальным уравнением второго порядка, в котором для улучшения качества пере-
ходного процесса исполнительный механизм охвачен жесткой отрицательной обратной
связью по скорости. Требуется определить оптимальное значение коэффициента обратной
связи koc, при котором критерии
∞ ∞
Q1 = ∫ ( y + γ 1 y& 2 )dt = min , и Q2 = ∫ y 2 dt = min .
2

0 0

Решение. Экстремаль функцио-нала Q1


является решением уравнения Эйлера u (t )
k1
y& (t ) k2 y(t )
(4.5) при F = y 2 + γ 1 y& 2 . Имеем: Tp + 1 p

∂F d ∂F
− = 2( y − γ 1 &y&) = 0 , или
∂y dt ∂y& koc
y − γ 1 &y& = 0 .
Характеристическое уравнение получен- Рис.4.6
ного дифференциального уравнения бу-

442
дет
1 1
H ( p) = 1 − γ 1 p 2 = (1 + γ 1 2 p)(1 − γ 1 2 p) = 0 .
Исходя из требований устойчивости при нахождении экстремума учитываем корни только
−1 / 2
первого сомножителя. Тогда p1 = −γ 1 и уравнение экстремали имеет вид:
y1 (t ) = C ⋅ e p1t , (4.22)
где С – постоянная интегрирования.
Заметим, что уравнение экстремали соответствует решению ДУ вида Ty& + y = 0 с
характеристическим уравнением Tp + 1 = 0 , где T – постоянная времени. Таким образом
экстремалью функционала Q1 является экспонента с постоянной времени T = γ 11/ 2 .
Уравнение экстремали функционала Q2 получим, положив в (4.22) γ 1 =0. Тогда, приняв
начальное значение координаты y(0)=1, можно записать
С ∀ t< 0
y2(t) =
0 ∀ t≥ 0.
Так как объект управления описывается дифференциальным уравнением второго порядка
переходные процессы минимизирующие функционалы Q1 и Q2 физически нереализуемы.
Поэтому можно лишь определить величины изменяемых параметров системы (в нашем
случае koc), при которых переходной процесс максимально приближался бы к оптималь-
ному. Для решения этой задачи запишем дифференциальное уравнение системы. Имеем
W р ( p) k1 k
W ( p) = , где W р ( p) = ⋅ 2 .
1 + W р ( p) Tp + 1 + k1k ос p
Тогда дифференциальное уравнение системы примет вид:
T&y& + (1 + k1k oc ) y& + k o y = k o u , где ko=k1k2.
Пусть входной сигнал меняется скачком от u до 0, тогда, полагая y (0) = 1 ; y& (0) = 0 и обо-
значив a1 = (1 + k1 k oc ) / k o и a0 = T / k o , получим:
a0 &y& + a1 y& + y = 0 . (4.23)
Определим значения Q1 и Q2 через коэффициенты дифференциального уравнения. Для
этого умножим (4.23) поочередно на y и y& . Тогда получим
a0 &y&y + a1 y& y + y 2 = 0 ⎫⎪
⎬. (4.24)
a0 y&&y& + a1 y& 2 + y& y = 0⎪⎭
Вычислим следующие интегралы, учтя при этом, что y(∞)= y& (∞)=0
∞ ∞

∫ y&y&dt = yy&
0
0
− ∫ y& 2 dt = − y0 y& 0 − Q11 = −Q11 ;
0
∞ y∞ 2 ∞ y∞
y0 1 y& 0 2
∫ yy&dt =
0
∫ ydy = −
y0
2
=− ;
2 ∫ yydt
0
&&& = ∫
y0
& &=−
ydy
2
= 0.

Тогда после интегрирования системы уравнений (4.24) получим:


a ⎫
− a0Q11 − 1 + Q2 = 0 ⎪
2 ⎪
⎬.
1 ⎪
a1Q11 − = 0
2 ⎪⎭
1 a a 1 2
Отсюда Q11 = ; Q2 = 1 + 0 = (a1 + a0 ) . Тогда
2a1 2 2a1 2a1

443

1 (1 + k1k oc ) 2 + (a0 + γ 1 )k 02
Q1 = ∫ ( y 2 + γ 1 y& 2 )dt = Q2 + γ 1Q11 = (a1 + a0 + γ 1 ) =
2
.
0
2a1 2k 0 (1 + k1k oc )
Для нахождения koc1 , соответствующего Q1=min, запишем:
∂Q1 1 (a + γ 1 )ko
= − 0 = 0.
∂k oc k o (1 + k1k oc ) 2
Отсюда оптимальное значение koc2 :
1
(k 0 a0 + γ 1 − 1).
k oc1 =
k1
Коэффициент koc , соответствующий Q2=min (при γ 1 =0) , будет
1
k oc 2 = (k 0 a0 − 1).
k1
T 0.5
Пусть T=0.5c; k1=200; k2=0.25 1/c; k0= k1 ⋅ k 2 =50 1/c; a0 = = = 0.01 c2.
k 0 50
Оценку Q1 находим, задаваясь γ 1 . Потребуем, чтобы переходной процесс приближался к
экспоненте с постоянной времени 0,1 с, тогда γ 1 =0,01 с2, а
1
k oc1 = (50 0.02 − 1) = 0.03.
200
Для оценки Q2 получим
1
k oc 2 = (50 0.01 − 1) = 0.02.
200
Качество переходного процесса определяется коэффициентом демпфирования ξ, который
в нашем случае равен
a 1 + k1k oc
ξ= 1 = .
2 a0 2 k 0T
Подставляя числовые значения koc , имеем для первого случая ξ1=0,7, а для второго ξ1=0,5.
Перерегулирование при ξ=0,7 не превышает 5%, а при ξ=0,5 достигает 20 %, т.е. выбор koc
по критерию Q1 дает меньшее перерегулиро-
вание, чем по Q2. Дальнейшее увеличение γ 1
еще больше увеличивает koc1 и, следовательно,
ξ. При этом уменьшается перерегулирование,
но увеличивается время переходного процесса
(рис.4.7).
Таким образом, при заданной структуре объ-
екта мы не можем реализовать оптимальный
переходной процесс в чистом виде, миними-
зирующий критерий Q1 и Q2, при любых koc.
Это обусловленно инерционностью объекта
управления, что оставляет возможность реа-
лизации процесса лишь близкого к оптималь-
ному.
***
Пример 4.4. Найти оптимальную по быстродействию кривую изменения частоты враще-
ния двигателя постоянного тока независимого возбуждения при отработке заданного пе-
T T
ремещения ϕ0 = ∫ ωdt и ограничениях, наложенных на нагрев двигателя: q = ∫ Ri 2 dt ≤ A .
0 0

444
Здесь T – время перемещения двигателя; ω – частота вращения; A – допустимые тепло-
вые потери; i и R – ток и сопротивление якоря.
Решение. Математически поставленная задача формулируется следующим обра-
зом: найти экстремаль функционала
T
Q1 = ∫ dt = min (4.25)
0

при наличии уравнений связи в виде


T T
Q2 = ∫ Ri 2 dt ≤ A ; Q3 = ∫ ωdt = ϕ0 . (4.26)
0 0

Таким образом, имеем задачу на условный экстремум, для решения которой составим
вспомогательную функцию
F * = F + λ 2 F2 + λ 3 F3 = 1 + λ 2 Ri 2 + λ 3ω . (4.27)
Запишем уравнение движения двигателя при неизменном потоке возбуждения Ф = const и
отсутствии момента сопротивления M c = 0 :
dω J
J = M д = KM i ; i= ω& . (4.28)
dt KM
Здесь J – момент инерции, приведенный к валу двигателя; M д – момент двигателя;
K M = CM Ф ; CM – электромашинная постоянная.
Тогда (4.27) можно записать в виде:

F * = 1 + λ2 K ω& 2 + λ3ω ,
где K = J 2 R / K M2 .
Экстремаль функционала (4.25) с учетом (4.26) находят, решая уравнение Эйлера
∂F * d ∂F *
− = λ3 − 2λ2 K ω&& = 0
∂ω dt ∂ω&
Откуда
λ3 1
ω&& = = ; (4.29)
2λ2 K 2λ0 K
где λ 0 = λ 2 / λ 3 .
Интегрируя (4.29), найдем уравнение экстремалей
1 1
&=
ω t + C1 ; ω= t 2 + C1t + C2 . (4.30)
2λ0 K 4λ0 K
С учетом уравнения (4.28) запишем
J J J
i= ω& = t+ C1 . (4.31)
KM 2λ0 KK M KM
Таким образом, оптимальное в смысле быстродействия управление двигателем при вы-
полнении условий (4.26) осуществимо при линейном законе изменения тока и изменении
ω по параболическому закону.
Постоянные интегрирования C1 и C2 и постоянный множитель λ 0 определяют из гранич-
ных условий

445
ω(0) = 0; ω(T ) = 0; i (0) = i0 ; i (T ) = −i0 , (4.32)
соответствующих началу разгона и окончанию торможения. Подставив (4.32) в (4.30) и
(4.31) окончательно запишем
KM JT
C1 = i0 ; C2 = 0; λ0 = − . (4.33)
J 4i0 KK M

Значения i0 и T найдем с помощью уравнений связи (4.26) и соотношений (4.30)-(4.33).


После интегрирования получим
T
TRi02
q = ∫ Ri 2 dt = = A; (4.34)
0 3
T
K M i0T 2
ϕ0 = ∫ ωdt = . (4.35)
0
6J

Решив совместно (4.34) и (4.35), определим


2
12ϕ0 RJ 2 6ϕ0 J
T =3 ; i0 = . (4.36)
AK M2 KM T 2

Подставив (4.33) с учетом (4.36) в (4.30) и (4.31), найдем в окончательном виде закон из-
менения тока i (t ) и скорости ω (t ) при оптимальном режиме в функции времени (рис.4.8).
Так как управление двигателем постоянного тока обычно производится изменением на-
пряжения на зажимах якоря U я , то воспользовавшись вторым законом Кирхгофа для
якорной цепи двигателя
U я = Ri + K e ω (4.37)
и уравнениями i (t ) и ω (t ) , можно найти зависимость U я (t ) . Так как зависимость i (t ) ли-
нейная, а ω (t ) параболическая, то U я (t ) тоже будет
изменяться по параболе (рис.4.8).
Если управлять двигателем, контролируя выходные
координаты ϕ и ω , то, исключив из уравнений i (t ) и
ω(t ) переменную t , получим зависимость i (ω) , под-
ставив которую в (4.37), найдем зависимость U я (ω) .
Кроме того, для учета знака i необходимо также про-
изводить непрерывное измерение угла поворота ϕ.
Окончательно
U я ( ω, ϕ ) = B1 ( B 2 − 2 ω) sign( ϕ 0 − 2 ϕ ) + K e ω ,
(4.38)
1/ 3
где RA ; ⎛ 9 AK M2 ⎞ .
B1 = B 2 = ⎜⎜ ⎟

ϕ0 ⎝ 4 ϕ 0 RJ
2

Как вытекает из (4.38), для реализации оптимального алгоритма требуется нели-
нейный регулятор.

Динамическое программирование
В основе метода динамического программирования лежит принцип оптимальности, сфор-
мулированный Р. Беллманом для широкого круга задач. Согласно этому принципу, опти-
мальная стратегия управления не зависит от «предыстории» системы, а определяется ее
состоянием в настоящий момент времени и целью управления.

446
Поясним метод динамического программирования на простом примере управления объек-
том, движение которого характеризуется уравнением первого порядка
dy
= f 0 ( y, u ) , (4.39)
dt
где u и y – единственные управление и координата системы, причем на u наложено ог-
раничение в виде u ∈ Ω(u ) . Предполагается, что при этом координата y также не выходит
за границы допустимых значений.
Пусть заданы граничные условия y (0) = y0 ; y (T ) = yT и требуется минимизировать функ-
ционал вида
T
Q = ∫ F0 ( y, u , t )dt . (4.40)
0

Прежде всего дискретизируем задачу, т.е. приближенно заменим непрерывную систему


дискретной. Этот этап является неизбежным при подготовке решения задачи на компьютере, и, в
то же время существенно упрощает процедуру поиска оптимального управления.
Запишем уравнение (4.39) в конечных разностях, разбив интервал T на N равных участ-
ков длительностью Δ = T / N :
y[(k + 1)Δ ] − y (kΔ )
= f 0 [ y (kΔ), u (kΔ )] ,
Δ
или
y k +1 − y k = f ( y k , u k ) , (4.41)
где f ( yk , uk ) = f 0 ( yk , uk )Δ .
Заменим интеграл (4.40) суммой
N −1
Q= ∑ F ( yk , uk ) + ϕ( yN ) , (4.42)
k =0

где F ( yk , uk ) = F0 ( yk , uk )Δ .
В выражении (4.42) выделено последнее слагаемое суммы ϕ( y N ) при k = N , так как оно не
зависит от управления, ибо при t = T процесс управления заканчивается и u N = 0 .
Теперь задача состоит в определении последовательных значений управляющих воздейст-
вий uk ( k = 0, N − 1 ), минимизирующих сумму (4.42) при условии (4.41) и ограничении
u ∈ Ω(u ) . Таким образом, вариационная задача свелась к задаче нахождения минимума
функции многих переменных.
Метод динамического программирования дает возможность свести эту операцию к после-
довательности минимизаций функции одной переменной. Для этого применяется прием,
заключающийся в движении от конца процесса (t = T ) к его началу (t = 0) .
Допустим сначала, что рассматривается момент времени t N - 1=Δ(N–1). Все значения uk,
кроме последнего, уже каким-то образом были осуществлены и при этом получили опре-
деленные значения y N −1 , соответствующие моменту времени tN-1. Согласно принципу оп-
тимальности, воздействие u N −1 не зависит от «предыстории» системы и определяется
лишь состоянием системы, характеризуемым величиной y N −1 и целью управления. На по-
следнем участке траектории (от t N −1 до t N ) величина t N −1 влияет на те члены суммы
(4.42), которые относятся к этому участку, т.е.
Q N −1 = F ( y N −1 , u N −1 ) + ϕ ( y N ).
Пользуясь (4.41) при k = N–1, запишем полученное выражение в виде
Q N −1 = F ( y N −1 , u N −1 ) + ϕ[ y N −1 + f ( y N −1 , u N −1 )] . (4.43)

447
Так как целью управления является минимизация Q, то это условие необходимо выдер-
жать и для рассматриваемого участка. Обозначим min QN −1 = S N −1 . Как видно из (4.43),
uN ∈Ω (u )
−1

значение SN-1 зависит от состояния системы в момент tN-1, т.е. от y N −1 . Тогда


S N −1 ( y N −1 ) = min QN −1 =
u N −1∈Ω (u )

= min {F ( y N −1 , u N −1 ) + ϕ [ y N −1 + f ( y N −1 , u N −1 )]} .
u N −1∈Ω (u )

В данном случае для определения S N –1 нужно производить минимизацию QN –1 только по


одному переменному u N –1. Выполнив эту операцию, получим SN –1 в виде функции от y N −1 .
Эту функцию необходимо запомнить в компьютере перед переходом к последующим ста-
диям решения. Перейдя к предпоследнему участку траектории (от tN –2 до tN –1), получим
Q N − 2 = F ( y N − 2 , u N − 2 ) + F ( y N −1 , u N −1 ) + ϕ ( y N ) . (4.44)
Пользуясь снова принципом оптимальности, можем сказать, что лишь значение y N − 2 и
цель управления (минимизация QN –2) определяют оптимальное управление uN –2 и uN –1 на
рассматриваемом участке траектории. Но минимум по uN –1 и, следовательно, само оптима-
льное значение uN –1 = u*N –1 уже были найдены для каждого возможного значения y N −1 .
Это позволяет с учетом того, что первое слагаемое (4.44) не зависит от uN –1, а два вторых
равны QN –1 записать
S N − 2 ( y N − 2 ) = min Q N − 2 = min [F ( y N − 2 , u N − 2 ) + S N −1 ( y N −1 )].
u N − 2∈Ω ( u ) u N − 2∈Ω ( u )
u N −1∈Ω ( u )

С учетом (4.41) при k = N–2 получим


SN −2 ( yN −2 ) = min { F ( yN −2 ,uN −2 ) + SN −1[ yN −2 + f ( yN −2 ,uN −2 ) ]}. (4.45)
uN −2 ∈Ω(u)

Минимизация здесь производится также по одному переменному uN –2. При этом опреде-
ляются оптимальное значение управления u*N –2 и минимум функции QN –2, равный SN –2.
Значение SN –2 заносится в память компьютера, а SN –1 стирается. Как u*N –2, так и SN –2 явля-
ются функцией y N − 2 . Продолжая аналогичным образом, получим рекуррентную формулу
вида

S N − k ( y N − k ) = min { F ( y N − k , u N −k ) + S N − k +1 [ y N − k + f ( y N − k , u N − k ) ] }. (4.46)
u N − k ∈Ω ( u )

Выражение (4.46) называется уравнением динамического программирования в дискретной


форме.
Важно отметить, что оптимальное управление u*N – k минимизирует все выражение в фи-
гурной скобке (4.46), а не одно лишь первое слагаемое FN – k. Стратегия, в которой каждое
значение uN – k выбиралось бы путем оптимизации лишь соответствующего слагаемого FN –
k, не является оптимальной, так как не учитывает конечной цели управления.
Вычисляя по формуле (4.46) последовательно значение S N – k и соответствующие u*N – k, по-
лучим, наконец, значение управляющего воздействия, требуемое в начальный момент
времени u*(0) и минимальное значение критерия эффективности S(0). На этом процедура
отыскания оптимального управления заканчивается.
Весь процесс решения без затруднений переносится на объект управления, описываемый
дифференциальным уравнением любого порядка с любым числом выходных координат
системы и управляющих воздействий. Нужно лишь заменить скаляры y , u в выражении
(4.46) векторами y , u , а функцию f – вектор-функцией f .
Как показал А.М.Летов, уравнение динамического программирования может быть записа-
но и в непрерывной форме.

448
Учитывая, что левая часть выражения (4.46) не зависит от управления, величину S N – k
можно перенести в правую часть под знак минимума. Тогда (4.46) можно записать в виде
⎧ S N − k +1 − S N − k ⎫
min ⎨ F ( y N −k , u N −k ) + Δy ⎬ = 0 (4.47)
u N − k ∈Ω ( u ) ⎩ Δy ⎭
Произведя предельный переход при Δy → 0 и учтя, что Δy = f ( y, u ) , запишем (4.47) в не-
прерывной форме:
⎡ dS ( y ) ⎤
min ⎢ F ( y , u ) + f ( y, u )⎥ = 0 . (4.48)
u∈Ω ( u ) ⎣ dy ⎦
Для получения минимума выражения, стоящего в квадратных скобках, в уравнении (4.48),
его нужно продифференцировать по управлению. Тогда условие минимума (4.48) можно
заменить системой уравнений
dS ( y )
F ( y, u ) + f ( y, u ) = 0 ;
dy
(4.49)
∂F ( y, u ) ∂f ( y, u ) dS ( y )
+ = 0.
∂u ∂u dy
Решение системы (4.49) позволяет найти зависимость u = ϕ( y ), при которой реализуется
оптимальное управление в смысле минимизации критерия (4.40). Для этого сначала из
второго уравнения системы (4.49) определяется величина dS ( y ) / dy, а затем искомая за-
висимость u = ϕ( y ).
В случае, если система имеет n выходных координат y = y1 ,... yn и r управлений
u = u1 ,...u r , имеем


( ) ∂S ( y ) ⎫
n
min ⎨ F y, u + ∑ f i ( y, u ) ⎬ = 0 . (4.50)
u∈Ω ( u ) ⎩ i =1 ∂yi ⎭
или
( ) ∂S ( y )
n
F y, u + ∑ fi ( y, u ) = 0 ;
i =1 ∂yi
(4.51)

r ( )
∂F y , u
+∑∑
n ∂ S ( y ) ∂f i ( y , u )
r
=0.
j =1 ∂u j i =1 j =1 ∂ y i ∂u j

Система уравнений (4.51) является наиболее распространенной формой записи уравнений


динамического программирования в непрерывной форме. Заметим, что функция S ( y )
должна быть непрерывной и дифференцируемой по yi . При этом ∂S ( y ) ∂yi играет ту же
роль, что и неопределенный множитель λi в вариационной задаче на условный экстремум.
Уравнения dyi / dt = fi ( y, u ) аналогичны уравнениям связи.
Пример 4.5. Пусть требуется провести трубопровод энергоносителя между пунктами О и
Т таким образом, чтобы стоимость прокладки была минимальной. Это статическая вариа-
ционная задача. Так как прокладка осуществляется на участке территории, ограниченном
по различным причинам, и математическое описание местности отсутствует, то для ре-
шения задачи целесообразно воспользоваться рекуррентным соотношением (4.46).
Решение. Разобьем путь между О и Т на несколько горизонтальных и вертикальных уча-
стков с интервалом Δ, т.е. дискретизируем задачу (рис.4.9). Стоимость строительства на
каждом участке F N – k можно подсчитать заранее с помощью топографической карты и
другой априорной информации. На рис. 4.9 эта стоимость приведена в условных едини-
цах.

449
Δ
N1 − 3 N1 − 2 N1 −1
N Т
38 13 25 15 10 10

14 12 18 8 Δ
N2 − 4 N2 − 3 N2 − 2 N2 −1

46 9 37 16 26 18 8

10 7 11 16
N3 − 5 N3 − 4 N3 −3 N3 − 2

53 9 44 9 37 16 24

8 8 17 15
N4 − 6 N4 − 5 N4 −4 N4 − 3

59 7 52 11 54 18 39

O
Рис. 4.9

Решение задачи начинаем с конечного пункта Т (точка N). В точку N можно попасть за
один последний шаг либо из точки N1–1 либо из N2 –1. Заметим, что из каждой из этих то-
чек можно попасть в точку N только одним способом, т.е. на последнем шаге имеем
единственное управление uN –1. Примем, что в связи с окончанием строительства в точке N
затраты в этой точке минимальны и равны нулю, т.е. ϕ ( y N) = 0. Тогда в соответствии с
(4.43) получим
S N i −1 = min QNi −1 = min FNi −1 ( y Ni −1 ) = FNi −1 ( y Ni −1 ), i = 1,2 .
u N i −1∈Ω ( u ) u N i −1∈Ω ( u )

Таким образом можно определить затраты на последнем участке и записать их в память


компьютера (на рис.4.9 численное выражение затрат указано в кружках). Перейдем к
предпоследнему участку строительства (от точек N i –2 до N i –1). Из точек N1 –2 и N3 –2, как
и ранее, есть только один путь в точку Ni –1, а для точки N2 –2 таких путей, а следователь-
но, и управлений u N 2 −1 уже два. Вычислим затраты на предпоследний шаг с учетом затрат
на последний:
S N1 − 2 = F ( y N1 − 2 ) + S N1 −1 = 15 + 10 = 25; S N 3 − 2 = F ( y N 3 − 2 ) + S N 2 −1 = 16 + 8 = 24;

⎧⎪18 + 10 = 28⎫⎪
S N2 −2 = min {F ( y N2 − 2 , u N2 − 2 ) + S N1 −1[ y N2 − 2 + f ( y N2 − 2 , u N2 − 2 )]} = min ⎨ ⎬ = 26 .
u N 2 −2∈Ω ( u ) u N 2 − 2 ∈Ω (u ) ⎪18 + 8 = 26 ⎪
⎩ ⎭
Полученные результаты заносятся в память компьютера. Заметим, что путь из точки N2 –2
в точку N, минимизирующий затраты QN −2 , соответствует управлению, при котором тру-
бопровод прокладывается в точку N2 –1, а путь через точку N1 –1 исключается из дальней-
шего рассмотрения.
Аналогично, переходя к последующим точкам, минимизируем на каждом шаге величину
QN – k, отбрасывая неоптимальные траектории. Попав, наконец, в точку О и двигаясь от нее
к точке N, найдем траекторию, оптимальную для всего трубопровода (на рис.4.9 выделена
сплошной линией).
Исключение неоптимальных траекторий по мере движения от Т к О существенно упроща-
ет расчет по сравнению с методом простого перебора траекторий (в нашем случае количе-
ство арифметических операций уменьшается более чем на порядок).

450
Пример 4.6. Пусть объект управления описывается уравнением вида
dy
= by + mu = f ( y, u ).
dt
Найти управление u, при котором минимизируется функционал
∞ ∞
Q = ∫ F ( y, u )dt = ∫ ( y 2 + γu 2 )dt .
0 0

В данном случае второе слагаемое в подынтегральном выражении функционала учитыва-


ет требование ограничения управления как по величине, так и по мощности.
Решение. Воспользуемся уравнениями Беллмана (4.49). Для рассматриваемого примера
эти уравнения примут вид
dS
y 2 + γu 2 + (by + mu ) = 0;
dy
(4.52)
dS
2γu + m = 0.
dy
Исключив dS/dy, получим уравнение
mγu 2 + 2γbyu − my 2 = 0 ,
решив которое относительно u, найдем
b b2 1
u = −ky ; k= + + .
m m2 γ
Здесь решение со знаком минус перед корнем отброшено как не отвечающее требованиям
устойчивости.
Для нахождения минимального значения критерия воспользуемся вторым уравнением
системы (4.52)
y∞
2γ γ
min Q = S = ∫ m kydy = k m (y )
− y02 ,
2

y0

где y∞ , y0 – заданные граничные значения выходной координаты y.


Принцип максимума
Принцип максимума был обоснован в работах Л.С.Понтрягина и его учеников как необ-
ходимый и достаточный признак оптимального процесса для линейных систем управле-
ния и необходимый для нелинейных.
Хотя принцип максимума был выведен самостоятельно, позже было доказано, что между
ним и принципом оптимальности Беллмана существует прямая связь. Для упрощения вы-
кладок выведем принцип максимума, воспользовавшись уравнением Беллмана (4.50).
Введем новую координату
T
dy0
y0 = Q = ∫ F ( y, u )dt ; = F ( y, u ) = f 0 ( y, u ).
0
dt

Тогда y = y0 , y1 ,K, yn ; f = f 0 , f1 ,K, f n и уравнение (4.50) можно переписать в виде

⎧ n ∂S ( y ) ⎫
min ⎨∑ ⋅ f i ( y, u )⎬ = 0, (4.53)
u∈Ω ( u )
⎩ i =0 ∂yi ⎭
где ∂S ( y ) / ∂y0 = 1.

451
Учтем, что max(– y ) = –min( y ) . Тогда (4.53) примет вид
⎧ n ∂S ( y ) ⎫
max ⎨∑ − f 0 ( y , u ) ⎬ = 0. (4.54)
u∈Ω ( u )
⎩ i =0 ∂yi ⎭
Обозначим ψ i = − ∂S ( y ) ∂yi , тогда

∂S ( y ) ∂S ( y )
ψ = − 1, − ,K , − = ψ 0 ,ψ1,K ,ψ n
∂y1 ∂y n

и (4.54) запишется в виде


n
max
u ∈Ω ( u )
∑ψ i f i = max ψ ⋅ f = 0, (4.55)
i =0 u∈Ω ( u )

где ψ ⋅ f – скалярное произведение двух векторов.


Выражение (4.55) и есть математическая запись принципа максимума Понтрягина.
Заметим, что при применении метода динамического программирования (в непрерывной
форме) необходимо предварительно найти функцию S ( y ) , что связано с громоздкими
операциями, в частности, с решением дифференциальных уравнений в частных производ-
ных. Для применения принципа максимума необходимо знать значение вектора ψ , кото-
рое можно найти значительно проще, решив так называемые сопряженные уравнения
dψ i ∂ψ ⋅ f
=− ; i = 0, n. (4.56)
dt ∂yi
Систему уравнений (4.56) можно получить, взяв полную производную функции многих
переменных S ( y ) . Действительно, учтя, что ψ i = −∂S ( y ) / ∂yi , имеем:
n ∂ψ ⋅ f
dψ i d ∂S ( y ) n
∂ ∂S ( y ) dy j ∂ψ ⋅ f
=− = −∑ ⋅ ⋅ = −∑ j j
=−
dt dt ∂yi j =0 ∂y j ∂yi dt j =0 ∂yi ∂yi
Часто уравнения (4.55) и (4.56) записывают в более компактной форме, обозначая скаляр-
ное произведение векторов ψ и f ( y, u ) через Н:
max H ( ψ , y, u ) = 0 , (4.57)
u ∈Ω ( u )

dψ i ∂H
= − . (4.58)
dt ∂yi
n n
dyi
Учитывая, что H = ∑ ψ i fi = ∑ ψ i , и взяв производную от H по ψi, можно записать
i =0 i =0 dt
dyi ∂H
= . (4.59)
dt ∂ψ i

Система уравнений (4.58)-(4.59) представляет собой канонически сопряженную систему


типа известной из механики системы уравнений Гамильтона:
dP ∂A dl ∂A
=− ; = ,
dt ∂l dt ∂P
где A – полная энергия системы, затрачиваемая на перемещение тела на расстояние ℓ; P –
импульс силы.

452
Таким образом, функцию H можно интерпретировать как энергию (или мощность) систе-
мы, которая вводится в нее с помощью управления u , а функции ψi – как импульсы, за-
дающие направление движения.
Отметим, что при выводе принципа максимума из уравнений Беллмана предположение о
непрерывности и дифференцируемости функции S ( y ) остается в силе. Однако если усло-
вие ψ0 = –1 заменить более слабым условием ψ0 ≤ 0 , то принцип максимума, как это сде-
лал Понтрягин, можно вывести без каких-либо предположений о функции S ( y ) , что зна-
чительно расширяет круг задач, решаемых с помощью этого принципа.
В общем случае принцип максимума формулируется следующим образом: для получения
оптимальной системы управления в смысле достижения минимума функционала Q необ-
ходимо существование таких ненулевых непрерывных функций ψ0(t), ψ1(t), ..., ψn(t), яв-
ляющихся решением системы сопряженных уравнений (4.58), что при любом t, находя-
щемся в заданном интервале 0 ≤ t ≤ Т, величина H как функция переменных u1, ..., ur в за-
данной области их допустимых значений достигает максимума согласно условию (4.57).
Синтез систем, оптимальных по быстродействию
Для синтеза систем, обеспечивающих максимальное быстродействие, наиболее целесооб-
разно применять принцип максимума. Сформулируем задачу в общем виде.
В n-мерном пространстве в момент времени t = 0 задан вектор состояния объекта y 0 и его
конечное состояние y T при t = T. Объект описывается линейными дифференциальными
уравнениями:
dyi
= f i ( y, u ); i = 0, n.
dt
На управления наложены ограничения u j ≤ u j max , j = 1, r.
Критерий оптимальности по быстродействию, т.е. при F ( y, u ) = 1 , имеет вид
T
Q = ∫ 1 ⋅ dt = T .
0

Требуется найти такое управление u (t ) , при котором время перехода объекта T из состоя-
ния y 0 в y T минимально.
Предполагается, что fi ( y, u ) определены для любых значений y ∈ Ω( y ) , соответствующих
области управления u ∈ Ω(u ) . Кроме того, функции fi ( y, u ) непрерывны и дифференци-
руемы по всем переменным y i. Управление может принадлежать к классу кусочно-не-
прерывных функций, содержащих разрывы первого рода.
Так как F = f0 = 1, то с учетом того, что в общем случае ψ0 ≤ 0, первое слагаемое суммы в
уравнении (4.55) ψ0 f0 ≤ 0. Тогда уравнение (4.55) для рассматриваемой задачи можно
представить в виде
n
max
u ∈Ω ( u )
∑ψ
i =1
f ≥0
i i или max H ( ψ , y, u ) ≥ 0 .
u ∈Ω ( u )
(4.60)

Порядок решения задачи следующий:


1. Составляют функцию Гамильтона H, равную скалярному произведению векторов f и
n
ψ , т.е. H = ∑ ψ i f i .
i =1

2. Берут частные производные H по uj, которые приравнивают нулю. Из полученной сис-


темы уравнений находят uj, максимизирующие функцию H согласно условию (4.60). В
случае линейной зависимости H от uj частная производная ∂H ∂u j является функцией од-

453
ной или нескольких составляющих вектора ψ . При этом для достижения положительного
максимума H необходимо, чтобы
u j = u j max sign ψ i (t ) , (4.61)
где
⎧+ 1 ∀ ψ i > 0;
sign ψ i (t ) = ⎨
⎩ − 1 ∀ ψ i < 0.
Таким образом, в данном случае управляющее воздействие при смене знака ψi (0) изменя-
ется скачкообразно от + umax до − umax или наоборот. Момент смены знака называется мо-
ментом переключения.
3. Для нахождения вспомогательной функции ψi (t), определяющей управление, в частно-
сти согласно (4.61), составляют и решают систему сопряженных уравнений (4.58).
4. В случае замкнутой системы ищут зависимость управления от контролируемых коор-
динат системы, соответствующих оптимальной траектории: u = ϕ( y ) . При этом моменты
переключения определяются автоматически при отклонении фактической траектории от
оптимальной. В случае разомкнутой системы устанавливают количество изменений знака
ψi (t), т.е. число корней функции ψi (t). Моменты переключения могут быть найдены мето-
дом стыковки решений дифференциальных уравнений со знакопеременной правой час-
тью. При этом в конечном итоге получают систему n трансцендентных уравнений с n не-
известными моментами переключения ti (i = 1, n) , решение которой возможно только чис-
ленными методами. Исключение составляют системы, характеристическое уравнение ко-
торых имеет кратные нулевые корни.
Пример 4.7. Пусть объект управления задан следующими уравнениями:
d 2 y1 dy1 dy2
=u или = y2 = f1; = u = f2. (4.62)
dt 2 dt dt
Если положить, что y1 = ℓ, y2 = v, u = F, то приведенная система уравнений описывает
движение материальной точки с массой m = 1, свободно и без трения движущейся по го-
ризонтальной прямой (с координатами ℓ – путь, v – скорость) и снабженной двигателем,
развивающим силу F = ma, где a = y& 2 .
Найти оптимальное управление u*, обеспечивающее максимальное быстродействие сис-
темы при переходе ее из произвольного начального состояния y 0 в конечное равновесное
состояние yT . На управление наложено ограничение |u| ≤ umax.
Решение. Составим функцию Гамильтона:

H = f1ψ1 + f2ψ2 = y2ψ1 + uψ2 .


Так как функция H линейна по отношению к u, то в соответствии с (4.61) имеем
u* = umax sign ψ2 . (4.63)
Для определения ψ2, а следовательно и u*, составим и решим систему сопряженных урав-
нений:
dψ 1 ∂H dψ 2 ∂H
=− = 0; =− = − ψ1 .
dt ∂y1 dt ∂y2

Интегрируя их, найдем


ψ1 = C1; ψ2 = C2 – C1t,
где C1, C2 – постоянные интегрирования.

454
Поскольку функция ψ2(t) обращается в нуль один раз при t1 = C2 / C1 , то управление
*
u имеет одну перемену знака (два интервала управления). Так как начальные условия для
функций ψi (t), а следовательно, и постоянные C1 и C2 неизвестны, то использование
принципа максимума дает только качественное представление об изменении управляюще-
го воздействия – одно переключение. Для определения количественных характеристик
необходимо определить моменты переключения t1 и окончания управления T. Для этого
необходимо решить уравнения системы (4.62), правая часть которых в соответствии с
(4.63) знакопеременная:
&y&1 = ±u max . (4.64)
Интегрируя (4.64), получим
y2 = y&1 = ±umaxt + C1;
umax 2 (4.65)
y1 = ± t + C1t + C2.
2

Исключив из (4.65) время t, найдем уравнение фазовой траектории движения системы y2 =


ϕ ( y1 ) .
Пусть, например, материаль-ная точка при t = t0 = 0 находится в точке В (рис.4.10). Для
быстрейшего перемещения ее из этой точки в точку О необходимо вначале разогнаться с
максимальным ускорением (u = +umax), а затем затормозить с максимальным замедлени-
ем (u = –umax). Соответствующие фазовые траектории ВА и АО приведены на рис.4.10.
Заметим, что при любых координатах точки В управление должно обеспечивать попада-
ние материальной точки на фазо-
вую траекторию, входящую в нача-
ло координат (АОА'). Именно на
этой траектории происходит смена
знака управления, и поэтому она
носит название линии переключе-
нии. Уравнение этой линии при
подходе материальной точки в точ-
ку О (t = T) слева и справа от оси
ординат (u = ±umax) находится из
(4.65):
y 22
y1 = m .
2u max
(4.66)
Здесь при определении постоянных
интегрирования C1 и C2 учтено, что
в точке О (при t = T) координаты системы y1 (T) и y2 (T) равны нулю. Выражение (4.66)
является уравнением параболы, лежащей в разных квадрантах в зависимости от знака y2 .
Знак минус ставится при y2 > 0, знак плюс – при y2 < 0.
Нетрудно показать, что уравнение фазовой траектории для режима разгона также является
параболой, но с постоянными C1 и C2, зависящими от начальных условий y1 (t0) и y2 (t0). В
общем случае фазовый портрет системы представляет собой семейство парабол, разли-
чающихся произвольными постоянными (рис.4.10).
Таким образом, для перемещения материальной точки из точки B в точку О необходимо
осуществить движение по траектории BAО (разгон – смена знака управления – торможе-
ние). Как видно из фазового портрета, в области I управление должно быть положитель-

455
ным ( y2 растет), а в области II – отрицательным ( y2 падает). Линия переключения и явля-
ется границей, разделяющей области I и II. Зная уравнение этой линии и состояния систе-
мы y1 и y2 , можно определить знак управления.
Запишем уравнение линии переключения (4.66) в виде

ϕ ( y1 , y2 ) = 2umax y1 + y22 sign y2 = 0 . (4.67)

Из (4.67) следует, что если начальные значения y1 и y2 таковы, что изображающая точка
не лежит на линии переключения, то для области I ϕ ( y1 , y2 ) < 0, а для области II ϕ ( y1 ,
y2 ) > 0. Тогда в случае замкнутой системы уравнение управляющего устройства примет
вид

u = – umax sign ϕ ( y1 , y2 ) . (4.68)

Таким образом, реализация даже такой простейшей замкнутой системы требует наличия
функционального преобразователя, вычисляющего в соответствии с (4.67) величину ϕ ( y1 ,
y2 ), и релейного исполнительного элемента, выдающего управляющий сигнал в соответ-
ствии с (4.68).
В случае разомкнутой системы моменты переключения находятся методом припасовыва-
ния решений дифференциальных уравнений. Воспользовавшись граничными условиями
y1 (t0) = – y10 ; y2 (t0) = 0 и y1 (T) = y2 (T) = 0, запишем уравнения (4.65) в виде
u max 2
y1 (t0 ) = + t0 + C11t 0 + C21 = − y10 ;
2
y2 (t0 ) = +umaxt0 + C11 = 0;
(4.69)
u
y1 (T ) = − max T 2 + C12T + C 22 = 0;
2
y2 (T ) = −u maxT + C12 = 0 .
где C11, C12 и C21, C22 – постоянные интегрирования на первом (разгон) и втором (тормо-
жение) интервалах управления.
Так как координаты системы y1 и y2 непрерывны, можно произвести стыковку решений
на границе первого и второго интервалов управления:
u max 2 u
t1 + C11t1 + C 21 = − max t12 + C12 t1 + C 22 ;
2 2 (4.70)
u max t1 + C11 = −u max t1 + C12 .
Решая совместно систему уравнений (4.69) и (4.70), можно определить постоянные интег-
рирования и моменты времени t1 и T. Окончательно получим C11 = 0; C21 = –y10;
u max 2
C12 = umaxT; C22 = − T ; T = 2t1; t1 = y10 umax . Таким образом, управление объектом
2
можно осуществлять с помощью программного устройства, подающего команду на измене-
ние знака управления в момент времени t = t1.
Пример 4.8. Для условий примера 4.4 учесть ограничения по току двигателя i ≤ imax .
Решение. Так как на координату системы оптимальной по быстродействию наложены ог-
раничения, то для нахождения алгоритма оптимального управления двигателем целесооб-
разно применять принцип максимума. Представим уравнение движения двигателя (4.28) в
виде
dω / dt = Kмi / J = ki = f1; k= Kм/ J ; d ϕ / dt = ω = f2; ϕ = y2 .

456
К этим уравнениям добавим условие ограничения на нагрев (4.26), которому соответству-
ет уравнение вида
dQ2
= Ri 2 = f 3 .
dt
Заметим, что величины ω , ϕ , Q2 являются координатами системы yi ( i = 1,3 ), а сила тока i
– управляющим воздействием u.
Составим функцию Гамильтона для рассматриваемой системы:
H = ψ1 f1 + ψ2 f2 + ψ3 f3 = ψ1ki + ψ2ω + ψ3 Ri 2. (4.71)
Для нахождения вспомогательных переменных ψi запишем сопряженные уравнения
dψ 1 ∂H dψ 2 ∂H dψ 3 ∂H
=− = −ψ 2 ; =− = 0; =− = 0.
dt ∂ω dt ∂ϕ dt ∂y3
Интегрируя эти уравнения, получим
ψ3 = C3; ψ2 = C2; ψ1 = C1 – C2t. (4.72)
2
Так как ψ3 = const, а Ri – существенно положительная величина, то согласно принципу
максимума значение ψ3 может быть в частности принято равным ψ3 = +1. Тогда (4.71)
примет вид
H = ψ1ki + ψ2ω + Ri2.
Для определения зависимости i(t), при которой максимизируется величина H, решим урав-
нение ∂H / ∂i = ψ 1k + 2 Ri = 0 , откуда
ψ 1k
i=− . (4.73)
2R
Подставив (4.72) в (4.73), получим

i=
( C1 − C2t ) k = C4 − C5t , (4.74)
2R
где C4 = C1k / 2R; C5 = C2k / 2R.
Таким образом, управление u = i является, как и ранее, линейной функцией времени
(4.74). Однако в нашем случае необходимо учесть ограничение, накладываемое на ток
двигателя. Тогда закон изменения управления примет вид
⎧C4 − C5t ∀ i (t ) < imax ;

i (t ) = ⎨+ imax ∀ i (t ) ≥ imax ; (4.75)
⎪− i ∀ i (t ) ≤ −imax ,
⎩ max
где i(t) – ток, определяемый в соответствии с (4.74). i, u, ω
Заметим, что в связи с ограничением тока двигателя для i ω
imax
полного использования машины по нагреву можно увели- ω1
чить угол наклона прямой i(t) по сравнению с прямой i1(t), ϕ0
ϕ0 ϕ
рассчитанной методом вариационного исчисления без уче- 2
t1 T t1′ = T − t1 T t
та ограничений по току (рис.4.11). При незначительных 2
углах поворота вала двигателя ограничение по нагреву
– imax
можно вообще не учитывать, и тогда закон изменения тока i1
будет носить релейный характер: Рис.4.11
i(t) = imax signψ1 (t) .
Для расчета конкретного алгоритма управления необходимо определить числовые значе-
ния моментов времени t1 и T (рис.4.11). С этой целью к системе сопряженных уравнений
присоединяют уравнение объекта с учетом закона изменения тока (4.75) и уравнений свя-

457
зи, учитывающих ограничения по нагреву Q2 ≤ A при заданном перемещении ϕ 0 . Интег-
рируя полученную систему уравнений, можно найти неизвестные t1 и Т, что позволяет по-
строить оптимальные законы изменения тока и частоты вращения двигателя.
***

СТАТИСТИЧЕСКАЯ ДИНАМИКА И ОПТИМАЛЬНЫЕ ФИЛЬТРЫ

Во многих случаях характер сигналов, действующих в системе управления, является слу-


чайной функцией времени. Примером такой системы может быть система регулирования
напряжения генератора, нагрузка которого зависит от включения и отключения многих
потребителей электрической анергии. Другим примером могут служить транспортные
средства, перемещающиеся по рельсовым путям, на которые воздействуют случайные
возмущения со стороны нагрузки: уклоны и состояние рельсов, порывы ветра и др. Третий
пример – следящие системы, на вход которых, кроме полезного сигнала, обычно поступа-
ет и помеха. Причем оба сигнала носят, как правило, случайный характер.
Случайные сигналы (помехи), возникающие в результате действия внешних и внутренних
возмущений, могут оказывать существенное влияние на работу автоматической системы,
что обусловливает необходимость количественной оценки и минимизации этих влияний,
путем отфильтровывания помех, т.е. необходимость решения оптимизационной задачи.
При этом в качестве критерия оптимальности может быть использована величина средней
квадратической ошибки, определяемой в соответствии с выражением вида (4.1). Решение
упомянутых задач и рассматривается в разделе, получившем название статистической ди-
намики, которое в качестве основного математического аппарата использует теорию слу-
чайных функций.

10.4.1. Основные характерстики случайных функций


Напомним, что случайной функцией называется функция X(t), которая в результате опыта
может принять тот или иной вид, неизвестно заранее, какой именно. Процессы, описы-
ваемые случайными функциями, называются случайными или стохастическими. Реализа-
цией случайной функции называется конкретный (неслучайный) вид, принимаемый функ-
цией в результате опыта. На рис. 4.12 приведено семейство таких реализаций.
При фиксированном значении t=t1 случайная функция x(t) превращается в случайную ве-
личину x, которая может принимать различные значения x1, x2,… xi,… xn. Совокупность
значений случайной функции при t = t1 называется ее сечением.
Основные характеристики случайных функций аналогичны характеристикам случайных
величин, но в отличие от последних являются не числами, а функциями.
Математическим ожиданием случайной функции x(t) называется неслучайная функция
mx(t), которая при каждом значении аргумента t равна математическому ожиданию соот-
ветствующего сечения случайной функции (рис. 4.12):
mx (t ) = M [ X (t )] .
x
xi mx(t1) mx(t)
Корреляционной (или автокорреляци-онной)
функцией случайной функции x(t) называется
неслучайная функция двух аргументов
Rx (t , t + τ ) , которая при каждой паре значений t,
t+τ равна корреляционному моменту соответст-
вующих сечений случайной функции x(t).
o o
t R x (t , t + τ ) = M [ X (t ) ⋅ X (t + τ )] ,
xi(t1)
o
где X (t ) = X (t ) − mx (t ) - центрированное значе-
Рис. 4.12 ние случайной функции.
Если аргументы корреляционной функции сов-
458
падают, т.е. τ = 0, то она обращается в дисперсию соответствующего сечения случайной
функции.
Rx (t , t + τ ) τ =0 = M [ X& 2 (t )] = Dx (t ) .
На практике часто встречаются процессы, протекающие во времени приблизительно одно-
родно и имеющие вид непрерывных случайных колебаний вокруг некоторого среднего значения,
при чем ни средняя амплитуда, ни характер этих колебаний не обнаруживают существенных из-
менений с течением времени. Такие случайные процессы называются стационарными. Примером
стационарного случайного процесса может являться процесс колебания напряжений в электриче-
ской сети.
В общем случае случайная функция x(t) называется стационарной, если все ее вероятно-
стные характеристики не зависят от времени. Если в качестве таких характеристик ис-
пользуется только математическое ожидание, дисперсия и корреляционная функция, то
условия стационарности формулируются следующим образом:
m x (t ) = m x = const ; Dx (t ) = Dx = const ; Rx (t , t + τ ) = Rx (τ ) .
Корреляционная функция Rx(τ) характеризует связь между сечениями, находящимися друг
от друга на расстоянии τ. При τ = 0 корреляционная функция максимальна и равна дис-
персии, а с увеличением τ связь между сечениями стационарной случайной функции ста-
новится слабее.
На рис. 4.13 приведены корреляционные функции
стационарных процессов различной внутренней
Rx (τ )
R x (τ ) структуры, но с одинаковой дисперсией Dx. Так
Dx как корреляционная функция является четной, то
графики Rx(τ) симметричны относительно оси ор-
2 динат. Колебания корреляционной функции ука-
зывают на скрытую периодичность процесса (кри-
3 1 вая 1). Если процесс не содержит периодической
составляющей, то корреляционная функция имеет
вид 2 или 3. При этом чем больше высокочастот-
ных составляющих содержит процесс, тем быстрее
Рис. 4.13 уменьшается связь между сечениями с увеличени-
ем τ.
Важным свойством стационарных случайных процессов является представительность
единственной реализации достаточной продолжительности, знание которой позволяет оп-
ределить вероятностные характеристики исследуемого процесса. В этом случае говорят,
что случайный процесс является эргодическим. При этом справедливо следующее соот-
ношение
T ∞
1
M [X (t )] = m x (t ) = lim
T →∞ 2T ∫ ∫
x (t ) dt = xf ( x)dx . (4.76)
−T −∞
Из (4.76) вытекает, что для эргодического процесса среднее значение случайной функции
x(t), вычисленное по одной реализации на интервале [-T,T] при Т → ∞, равно среднему
значению этой же функции, вычисленной по множеству реализаций. Здесь f(x,t) – плот-
ность распределения случайной величины в сечении, взятом для момента времени t. Заме-
тим, что для стационарного случайного процесса f(x,t) = f(x) и mx(t) = mx.
Корреляционная функция стационарного случайного процесса, обладающего свойством
эргодичности, определяется по формуле
T
1 o o
R x (t ) = lim x(t ) x(t + τ )dt .
T →∞ 2T ∫
(4.77)
−T
При τ = 0 имеем

459
T
1
Rx ( 0 ) = lim ∫ x& ( t ) dt .
2
T →∞ 2T
−T
(4.78)
Пример 4.9. Предположим, случайная функ-
ция X(t) задана совокупностью двенадцати
реализаций, приведенных на рис. 4.14. Там
же приведена зависимость математического
ожидания mx(t), вычисленного как среднее
значение случайной величины X в соответст-
вующем сечении. Требуется найти корреля-
ционную функцию случайного процесса.
Рис. 4.14
Решение. Анализ экспериментальных экспе-
риментально снятых реализаций (рис. 4.14)
показывает, что математическое ожидание mx и дисперсия Dx меняются незначительно,
что позволяет, учитывая ограниченное число реализаций, отнести рассматриваемую слу-
чайную функцию к классу стационарных с mx = -0,02 и Dx = 0,236. Для построения корре-
ляционной функции случайного процесса найдем корреляционные моменты K ij между i-м
и j-м сечениями случайной функции X(t) по формуле
∑ (xi − mx )(x j − mx )
i, j
K ij = ; i = 1,6 ; j ≥ i .
n −1
Вычислив значение корреляционного момента для раз-
личных τ ij = t j − t i и осредняя полученные значения K ij
для одинаковых τ получим числовые значения корреля-
ционной функции Rx(τ) для стационарного случайного
процесса X(t) (рис. 4.15). Найденные дискретные значения
корреляционной функции можно аппроксимировать ка-
ким-либо аналитическим выражением. Обычно в качестве
аппроксимирующей зависимости выбирается функция
вида
к
Rx (τ ) = Dx ∑ e
−α i τ
cos β iτ ,
i =1

где α i β i - параметры, подлежащие определению, например, по способу наименьших


квадратов.
***
Распределение дисперсий (или мощностей) по частотам, входящим в состав стационарной
случайной функции X(t) характеризует спектральная плотность Sx(ω), которая прямым
преобразованием Фурье однозначно связана с корреляционной функцией Rx(τ):

∫ R (τ ) e
− jωτ
S x (ω ) = x dτ . (4.79)
−∞
Подставив в (4.79) значение корреляционной функции, определяемой выражением (4.77),
найдем:
∞ T T ∞ o
1 o o 1 o
S x (ω ) = ∫ e − jωτ dτ lim ( ) ( ) ( ) x(t + τ )e − jω ( t +τ ) dτ =
T →∞ 2T ∫ T →∞ 2T ∫ ∫
j ωt
x t x t + τ dt = lim x t e dt ⋅
−∞ −T −T −∞
2
1 X ( jω )
= lim X (− jω ) ⋅ X ( jω ) = lim
T →∞ 2T T →∞ 2T

460
Таким образом, спектральная плотность случайного процесса S x (ω ) является функцией
частоты и пропорциональна мощности (квадрату амплитуды) случайного сигнала. Поэто-
му ее часто называют энергетическим частотным спектром.
Для определения Rx(τ) по известной S x (ω ) можно воспользоваться обратным преобразо-
ванием Фурье

1
R x (τ ) = ∫ S x (ω ) e jωτ d ω . (4.80)
2π − ∞
Выражения (4.79) и (4.80) свидетельствуют об однозначной связи между Rx(τ) и S x (ω ) .
Поэтому для характеристики случайного процесса достаточно знать одну из этих функ-
ций.
Пример 4.10 Построить график спектральной плотности стационарного случайного про-
цесса X(t), если его корреляционная функция R x (τ ) = N ⋅ δ (τ ) .
Решение. Найдем S x (ω ) , воспользовавшись (4.79):

S x (ω ) = ∫ Nδ (τ ) e
− jωτ
dτ = N .
−∞

Здесь учтено, что e − jωτ |τ =0 = 1 и ∫ δ (τ )dτ = 1 . График S
−∞
x (ω ) представляет собой прямую,

параллельную оси абсцисс (рис. 4.16,


а). Это свидетельствует о том, сто а) S(ω) б) S(ω)
рассматриваемый случайный сигнал
X(t) содержит все частоты от -∞ до
+∞ с одинаковой средней мощно-
стью. Такой сигнал носит название
«белый шум».
Определим среднюю мощность Рис. 4.1
(дисперсию) этого сигнала, для чего
воспользуемся выражением (4.80) при τ=0. Получим
∞ ∞ ∞
1 1 Nω
Rx (0 ) = Dx = ∫ S x (ω )dω = ∫ Ndω = =∞.
2π −∞ 2π −∞ 2π −∞
Таким образом, для получения сигнала типа «белого шума», требуется источник беско-
нечной мощности, что физически неосуществимо.
Заметим, что в силу инерционности высокие частоты отфильтровываются любыми физи-
ческими объектами. Поэтому представляет интерес определение характеристик случайно-
го сигнала с ограниченным спектром частот (рис. 4.16, б).
⎪⎧ N ∀ ω ≤ ωmax
S x (ω ) = ⎨
⎪⎩0 ∀ ω > ωmax.
Воспользовавшись обратным преобразованием Фурье (4.80) и формулой Эйлера:
e jωτ = cos ωτ + j sin ωτ , и учтя, что интеграл от нечетной функции в симметричных преде-
лах равен нулю, можем записать:
ω
1 max N sin ω maxτ
R x (τ ) = ∫ N cos ωτdω = .
2π −ω max πτ
При этом дисперсия случайного сигнала
N sin ω maxτ N
Dx = Rx (0) = lim = ω max .
τ →0 πτ π

461
Таким образом требуемая мощность источника энергии случайного сигнала X(t), спек-
тральная плотность которого представлена на рис. 4.16, б ограничена полосой пропуска-
ния частот ωmax.

10.4.2. Прохождение случайного сигнала через линейную систему


Предварительно найдем связь между произвольным сигналом x(t), поданным на вход ли-
нейной системы с передаточной функцией W(p), и сигналом y(t), снимаемым с выхода сис-
темы (рис.4.17, а).
Представим сигнал x(t) в виде серии прямоугольных импульсов продолжительностью Δτ и
амплитудой xi = x(τi), где τi = iΔτ (рис.4.17, б). При а
x(t) y(t)
достаточно малом Δτ реакцию объекта на каждый i- W(p)
й импульс можно приближенно заменить реакцией
объекта на импульсную функцию Ai δ(t), где Ai = б
xiΔτ – мощность импульса. Реакция объекта на δ- x
функцию известна и равна импульсной переходной
xi
характеристике: w(t) = L-1 [W(p)].
Тогда при подаче на вход объекта сигнала Aiδ(t –
τi) выходной сигнал
y (t – τi) = w(t– τi)Ai ≈ w(t – τi)x(τi)Δτ .
Здесь учтено, что i-я реакция объекта существует τi Δτ t
только при t ≥ τi. Рис.4.17
Реакцию объекта на серию импульсов, поданных
на вход объекта, можно записать в виде
n n
y (t ) = ∑ y (t − τi ) ≈ ∑ w(t − τi ) x(τi )Δτ .
i =0 i =0

Переходя к пределу при Δτ →0, имеем


t
y (t ) = ∫ w(t − τ) x( τ)dτ , (4.81)
0

а, произведя замену переменных t – τ = θ, можем записать


t
y (t ) = ∫ w(θ) x(t − θ)dθ . (4.82)
0

Выражения (4.81) и (4.82) представляют собой различные формы записи интеграла Дюа-
меля или свертки функций w(t) и x(t).
k −t
Пример 4.11. Найти реакцию объекта (рис.4.18, а) с весовой функцией w(t ) = e T на
T
прямоугольный импульс длительностью Tu и амплитудой Au =1 (рис.4.18,б).
Решение. Реакцию объекта y(t) можно найти, воспользовавшись выражением (4.81). При
0 ≤ t ≤ Tи имеем
t ( t −τ )
k −
⋅ 1(τ )dτ = k ⎛⎜1 − e T ⎞⎟ .
−t
y (t ) = ∫ e T

0
T ⎝ ⎠
Аналогичным образом найдем y(t) при t ≥ Tu:
⎛ Tu ⎞ −t
y (t ) = k ⎜ e T − 1⎟ e T
⎝ ⎠
Таким образом, при подаче импульсов на вход объекта, представляющего собой аперио-
дическое звено, на его выходе получаем пилообразный сигнал. (рис.4.18, в)
а б x в y
x(t) y(t) 1 y(Tи)
w (t)
462
Tu Tu t
Рис.4.18
* * *
В общем случае при подаче на вход линейного объекта случайного сигнала x(t) с корреля-
ционной функцией Rx(τ) соотношения (4.81) и (4.82) дают возможность определить связь
между корреляционными функциями выходного y(t) и входного x(t) сигналов.
Пусть x(t) представляет собой стационарный эргодический случайный сигнал. В силу ли-
нейности преобразования сигнал y(t) будет обладать теми же свойствами. Так как для ус-
тановившегося режима (t = ∞ )

y (t ) = ∫ w(θ) x(t − θ)dθ
0
и при t < 0 w(θ) = 0, то в соответствии с соотношением (4.77), запишем
1 T 1 T ∞
R y (τ) = lim ∫ y (t ) y (t + τ)dt = lim ∫ dt ∫ w(θ) x(t − θ)dθ ×
T → ∞ 2T −T T →∞ 2T −T − ∞

∞ ∞ ∞
× ∫ w(η) x(t + τ − η)dη = ∫ ∫ w(θ) w(η) Rx (τ + θ − η)dθ dη . (4.83)
−∞ −∞ −∞

Полученное соотношение устанавливает связь между корреляционными функциями вход-


ного и выходного сигналов в интегральной форме. Более простое соотношение можно по-
лучить между спектральными плотностями этих сигналов, взяв прямое преобразование
Фурье от выражения (4.83). Тогда
∞ ∞
S y (ω) = ∫ R y (τ) e − jωτ dτ = ∫ ∫ ∫ w(θ) w(η) Rx (τ + θ − η) e − jωτ dθ dη dτ =
−∞ −∞

∞ ∞ ∞
= ∫ w(θ) e jωθ dθ ∫ w(η) e − jωη dη ∫ Rx (τ + θ − η) e − jω( τ+ θ−η) dτ =
−∞ −∞ −∞

= W (− jω)W ( jω) S x (ω).

Окончательно
Sy(ω) = | W(jω) |2 Sx(ω). (4.84)
Таким образом, по известным Rx(τ) и Sx(ω), а также известным динамическим характери-
стикам объекта с помощью соотношений (4.83) и (4.84) можно найти характеристики слу-
чайной функции на выходе системы (задача анализа). Эти соотношения в принципе по-
зволяют также выбрать параметры динамической системы таким образом, чтобы миними-
зировать влияние случайных воздействий на функционирование систем (задача синтеза
оптимальной системы).
Рассмотрим два важных случая прохождения случайного сигнала через линейную систе-
му.
1. Статистическое дифференцирование. При поступлении случайного сигнала на вход
дифференцирующего звена с частотной функцией W(jω) = jω имеем
Sy(ω) = ω2 Sx(ω).
В случае двойного дифференцирования Sx(ω) умножается на ω4 и т.д. Таким образом, вы-
сокочастотные составляющие, содержащиеся в случайном сигнале, в данном случае уси-
ливаются значительно сильнее, чем низкочастотные. Это всегда нужно иметь в виду при
вводе в систему корректирующего дифференцирующего звена. В случае существенного
уровня высокочастотных помех ввод этого звена может не привести к улучшению дина-
мических свойств системы, а, наоборот, даже ухудшить их.
2. Статистическое интегрирование. При поступлении сигнала на вход интегрирующего
звена с частотной функцией W(jω) = 1/jω спектральная плотность сигнала на его выходе

463
S y (ω) = S x (ω) / ω2 .

В данном случае высокие частоты ослабляются (отфильтровываются) интегрирующим


звеном и выходной сигнал получается более сглаженным.

10.4.3. Расчет установившихся ошибок в системах управления


Замкнутая система автоматического управления (рис.4.19) может находиться под воздей-
ствием случайного управляющего сигнала u(t) и помехи f(t) с известными Ru (τ) и Rf (τ). В
этом случае точность работы системы обычно оценивается величиной средней квадратиче-
ской ошибки σΔ.
Решим задачу в общем виде для различных условий:
1. Пусть u(t) является случайным стационарным сигна-
лом с Su(ω), а f(t) = 0. В этом случае спектральная плот-
ность ошибки Δ согласно (4.84)
SΔ(ω) = | WuΔ(jω) |2 Su(ω),
где WuΔ(jω) = 1 / [1+W0 (jω)Wy(jω)] – частотная функция
замкнутой системы по ошибке; W0 ( jω),W y ( jω) – частот-
ные функции объекта и устройства управления соответственно.
Для нахождения корреляционной функции ошибки возьмем обратное преобразование Фу-
рье от спектральной плотности:

1
RΔ (τ) = ∫
2π − ∞
S Δ (ω) e jωτ dω . (4.85)

Так как при τ = 0 корреляционная функция случайного сигнала равна его дисперсии, т.е.
RΔ(0) = DΔ , то в соответствии с (4.85) можно записать

1
2π −∫∞
DΔ = S Δ (ω) dω . (4.86)

Выражение (4.86) носит название формулы Парсеваля.


Средняя квадратическая ошибка
σ Δ = DΔ . (4.87)
Заметим, что величина DΔ может быть вычислена и через корреляционные функции в со-
ответствии с формулой (4.83), однако пользоваться формулой (4.86) гораздо проще.
2. Пусть u(t) = 0, а f(t) – случайный стационарный процесс c Sf (ω). Тогда аналогично пре-
дыдущему имеем
SΔ(ω) = | Wf Δ(jω) |2 Sf (ω) ,
где Wf Δ(jω) – частотная функция по возмущению, равная:

− W0 ( jω )W y ( jω )
W fΔ ( jω ) = .
1 + W0 ( jω )W y ( jω )

Далее, воспользовавшись соотношениями (4.86) и (4.87), можно вычислить дисперсию DΔ


и среднюю квадратическую ошибку σΔ, обусловленные помехами f.
3. Пусть на систему действуют одновременно два независимых сигнала u(t) и f(t). Тогда,
воспользовавшись принципом суперпозиции (система линейна), можем записать
σ 2Δ = DΔ = DΔu + DΔf =

464

1 ⎡ W ( jω) 2 S (ω) + W ( jω) 2 S (ω) ⎤ dω .
= ∫
2π − ∞ ⎢⎣
uΔ u fΔ f ⎥⎦

В случае, если y (t) и f(t) коррелированы, то можно показать, что подынтегральное выра-
жение в формуле для σ 2Δ примет вид
2 2
S Δ (ω ) = WuΔ ( jω ) S u (ω ) + W fΔ ( jω ) S f (ω ) +

+WuΔ (− jω )W f Δ ( jω ) Suf (ω ) + WuΔ ( jω )W f Δ (− jω ) S fu (ω ) , (4.88)

где Suf (ω) и S fu (ω) – взаимные спектральные плотности управляющего u(t) и возмущающего f(t)
сигналов.

10.4.4. Синтез системы управления по минимуму средней квадратической ошибки


Если на систему управления действует полезный сигнал и помеха, то возникает задача
расчета оптимальной системы, сводящей к минимуму результирующую ошибку, количе-
ственная оценка которой производится с помощью средней квадратической ошибки:
T
1
σ2Δ ∫ Δ (t )dt = min .
2
= DΔ = RΔ (o) = lim (4.89)
2T −T

Достижения цели (4.89) можно добиться, определив либо оптимальные параметры систе-
мы при заданной ее структуре (параметрический синтез), либо не только параметры, но и
структуру системы (структурно-параметрический синтез).
Параметрический синтез системы. В этом случае обычно принимают следующий поря-
док расчета:
1. По экспериментально снятым реализациям u (t ) и f (t ) определяют корреляционные
функции полезного сигнала и помехи Ru(τ) и Rf (τ), а затем, с помощью преобразования
Фурье, находят соответствующие спектральные плотности. В частности,

∫ Ru (τ) e
− jωτ
Su (ω) = dτ
−∞

или, учитывая, что Ru(τ) четная функция, а e-jωτ = cos ωτ – jsinωτ, получим

S u (ω) = ∫ Ru (τ) cos ωτdτ .
−∞

2. Находят частотные функции замкнутой системы по ошибке со стороны управления и


возмущения WuΔ(jω) и Wf Δ(jω).
3. В соответствии с соотношением (4.88) определяют спектральную плотность ошибки
SΔ(ω).
4. По формуле Парсеваля (4.86), вычисляют дисперсию ошибки DΔ как функцию парамет-
ров звеньев системы αi , где α i – как правило, коэффициенты передачи и постоянные
времени звеньев, i = 1, n .
5. Числовые значения изменяемых параметров находят, решая систему уравнений

∂DΔ = 0,
∂α j

где α j - изменяемые параметры системы; j = 1, m, m < n .

465
6. Подставив значения найденных параметров в выражение DΔ (α1 ,..., α i ,..., α n ) , получают
минимальное значение дисперсии DΔ min и средней квадратической ошибки σ Δ min = DΔ min .
Если σΔ min ≤ σΔ доп, то задача синтеза решена. Если это условие не выполняется, то следует
изменить структуру управляющего устройства, т.е. решить задачу структурно-
параметрического синтеза.
Пример 4.12. Система слежения за движущейся целью, работает по функциональной схе-
ме, представленной на рис.4.20. В случае отклонения цели от линии визирования возрас-
тает рассогласование θ = θ1 – θ2, которое подается на вход усилителя У и далее через
фильтр Ф на тахометрический привод ТП. Последний разворачивает визир В с датчиком
(фотоэлемент, локатор) до совпадения с направлением на цель.
Тахометрический привод состоит из усилителя У1, двигателя Д, редуктора Р и тахогенера-
тора ТГ с передаточными функциями соответственно Wy1 (p) = ky, Wд(p) = kд /(Тд + 1),
Wр(p) = kр /р и Wтг(p) = kтг. Передаточная
функция этого привода имеет вид
k у kр kд
Wтп ( p) = W3 ( p) =
p(Tp + 1) + pk у kд k тг
.
При достаточно сильной обратной связи
по скорости двигателя (kу → ∞) можно
записать
kp k3
W3 ( p) ≈ = ,
k тг р р
где k 3 = k p / k тг .
Передаточные функции усилителя У и фильтра Ф можно представить в виде
W1(p) = k1 и W2(p) = k2 /(Т2р + 1) соответственно.
Определим значение коэффициента усиления системы, при котором минимизиру-
ется ошибка слежения в соответствии с (4.89). Все остальные параметры системы заданы.
Решение. Найдем статистические характеристики входных сигналов θ(t) и ϕ(t), необходи-
мые для решения задачи, из следующих соображений. Пусть цель движется со скоростью,
изменяющейся по случайному закону (рис.4.21). Подобный сигнал иногда называют типо-
вым входным сигналом следящей системы. 3десь Ω – угловая скорость движения цели,
которая сохраняет постоянное значение в течение некоторых интервалов времени ti. За-
метим, что рассматриваемый сигнал Ω (t) соответствует кусочно-линейной аппроксима-
t
ции кривой θ1 (t ) = ∫ Ω(t )dt . Корреляционная функция подобного сигнала при заданных ма-
0

тематических ожиданиях M[Ω] = 0, M[Ω2] = DΩ имеет два значения:


• при моментах времени t и t + τ, относящихся к одному интервалу времени ti,
R1(τ) = M[Ω(t) Ω(t + τ)] = M[Ω2] = DΩ;
• при моментах времени t и t + τ, относящихся к разным интервалам, R2(τ) = 0, так как
произведения с положительным и от-
рицательным знаком в этом случае Ω
равновероятны.
Если положить, что вероятность на- ti
хождения моментов времени t и t + τ в
t1 t2 t

466

Рис.4.21
одном интервале равна p1, а в разных интерва-лах p 2 = 1 − p1 , то
R(τ) = p1R1(τ) + p2R2(τ) = p1R1(τ).
В соответствии с законом распределения Пуассона вероятность отсутствия перемены зна-
ка скорости (к = 0) на интервале τ
(λτ ) k − λτ
p1 = P(k ) = е k =0 = е − λτ ,
k!
где λ – среднее число перемен знака скорости в единицу времени; λ = 1/T; T = M [ti ] .
Следовательно,
τ

R(τ) = p1 R1 (τ) = DΩ е T .
Воспользовавшись преобразованием Фурье, имеем
∞ τ
− 2ТDΩ
S Ω (ω) = ∫ DΩ е T е − jωτ dτ =
1 + Т 2 ω2
.
−∞

Для нахождения ошибки в определении угла θ1 полученную спектральную плотность ско-


рости необходимо проинтегрировать, что эквивалентно ее делению на ω2. Тогда
SΩ (ω) 2ТD Ω
Sθ1 (ω) = 2
= 2 .
ω ω (1 + Т 2ω2 )
Заметим, что S θ1 соответствует нестационарному случайному процессу, так как

1
2π −∫∞ 1
D θ1 = S θ (ω)dω → ∞ .

Однако так как рассматриваемая система является астатической, то она инвариантна к ве-
личине возмущения и имеет ошибки только по скорости и более высоким производным,
относительно которых процесс стационарен. Это позволяет использовать полученную
спектральную плотность при расчете динамической ошибки системы.
В качестве помехи рассмотрим шумовое напряжение датчика со средним квадратическим от-
клонением M [ϕ2] = Dϕ в полосе частот Δfφ = 2fc, где fc – частота среза. Спектральная плот-
ность в этой полосе соответствует помехе типа белого шума Sϕ(ω) = N. Величину N можно
найти из соотношения
ω fc
1 с
2π −∫ωс
Dϕ = Ndω = ∫ Ndf = N 2 f c ,
− fc

откуда N = Dϕ / Δf ϕ .
Считая, что полезный сигнал θ1(t) и помеха ϕ (t) не коррелированы, спектральная плот-
ность ошибки в соответствии с (4.88)
2
S θ1 (ω) W ( jω)
S θ (ω) = + S ϕ (ω) = S θθ1 (ω) + S θϕ (ω) , (4.90)
1 + W ( jω)
2
1 + W ( jω)

где W(jω) = W1(jω) W2(jω) W3(jω) – передаточная функция разомкнутой системы.


Рассмотрим вначале составляющую плотности ошибки, определяемую полезным сигна-
лом. После подстановки значений S θ1 (ω) и W(jω) в первое слагаемое уравнения (4.90) полу-
чим
2
2ТDΩ Т 2 ( jω ) 2 + jω
Sθθ1 (ω ) = 2 ,
ω (1 + ω 2Т 2 ) T2 ( jω ) 2 + jω + k
где k = k1k2k3 – общий коэффициент усиления разомкнутой системы.
467
С учетом равенств
| T2(jω)2 + jω |2 = | jω |2 | T2 jω + 1 |2 = ω2(– T22(jω)2+ 1) ,
(1 + ω2T2) = | Tjω + 1 |2,
окончательно запишем

Sθθ1 (ω ) =
[
2TDΩ − T22 ( jω ) 2 + 1 ] .
2
TT2 ( jω ) 3 + (T + T2 )( jω ) 2 + (1 + kT ) jω + k
Проинтегрировав Sθθ1(ω) по всем частотам, найдем дисперсию ошибки, вызванную полез-
ным сигналом:
1 ∞
Dθθ1 = ∫ S θθ (ω)dω = 2TDΩ I 3 ,
2π − ∞ 1

1 G ( jω )
где I3 – интеграл вида I n =
2π ∫ A( jω )
−∞
2
dω ; A(jω) = a0(jω)n + + a1(jω)n-1 + ... + an;
2n – 2 2n – 4
G(jω) = b0(jω) + b1(jω) + ... + bn.
Интегралы In табулированы. В нашем случае при n = 3 имеем
a0 a1b2 a 3−1 − a0b1 + a2b0 T + T2 + kT22
I3 = = ,
2a0 (a1a2 − a0 a3 ) 2k (T + T2 + kT 2 )
где a0 = TT2; a1 = T + T2; a2 = 1 + kT; a3 = k; b0 = 0; b1 = –T22; b2 = 1.
Тогда
TDΩ (T + T2 + kT22 )
Dθθ1 = .
k (T + T2 + kT22 )
Рассмотрим теперь слагаемое Sθφ(ω). После подстановки Sφ(ω) и W(jω) во второе слагае-
мое уравнения (4.90) получим
k 2N
Sθϕ (ω ) = 2
.
T2 ( jω ) 2 + jω + k

Проинтегрировав Sθφ(ω) по всем частотам, найдем дисперсию ошибки, обусловленную


помехой:

1
Dθϕ = ∫ Sθϕ (ω )dω = k
2
NI 2 ,
2π −∞

a0b1a2−1− b0
где I 2 = ; a0 = T0; a1 = 1; a2 = k; b0 = 0; b1 = 1.
2a0 a1
Тогда
1 kN
Dθϕ = k 2 N = .
2k 2
Из полученной формулы вытекает, что k/2 численно равно эквивалентной полосе пропуска-
ния частот Δfэ при подаче на вход рассматриваемой системы помехи типа белого шума.
Обычно Δfφ > Δfэ, что позволяет производить интегрирование Sθφ(ω) по всем частотам.
Таким образом, суммарная дисперсия ошибки
TDΩ (T + T2 + kT22 ) kN
Dθ = Dθθ1 + Dθϕ = + .
k (T + T2 + kT 2 ) 2

468
Для получения оптимального значения коэффициента усиления необходимо исследовать
полученное выражение на минимум.
Пусть имеем следующие значения параметров: DΏ = 4 град2/с2; T = 5 с; T2 = 0,1 с;
k2 = 34,4; k3 = 0,035 град/(В·с); Δfφ = 500 Гц; σφ = 0,167 град;
Sφ(ω) = N = Dφ /Δfφ = 0,1672 /500 = = 5,6·10-5 град2/Гц. В нашем случае Т >> Т2 , что позво-
ляет пренебречь малыми величинами и записать
DΩ kN
Dθ ≈ Dθ* =
+ .
k2 2
Дифференцируя это выражение по k и приравняв полученный результат нулю, получим
∂Dθ* 2D N
= − 3Ω + = 0 ,
∂k k 2
откуда
4 DΩ 4⋅4
kопт = 3 =3 −3
= 66 c−1 .
N 5, 6 ⋅10
При этом Δfэ = 66/2 = 33 Гц < 500 Гц = Δfϕ .
Значения средней квадратической ошибки по углу, вычисленные по точной и при-
ближенной формулам, соответственно

2 5 ⋅ 4(0,1 + 5 + 66 ⋅ 0,12 ) 66 ⋅ 5,6 ⋅ 10 −5


σ θ = Dθ = + = 0,0029; σθ = 0,054°;
66 (5 − 0,1 − 66 5) 2

4 66 ⋅ 5, 6 ⋅10−5
(σθ* ) = Dθ* =
2
+ = 0,0027; σθ = 0,0525°,
662 2
практически совпадают, что свидетельствует о корректности принятых допущений. Учи-
тывая, что коэффициент усиления разомкнутой системы k = k1k2 k3 , найдем оптимальное
значение коэффициента усиления усилителя k1
k опт 66
k1 = = = 55 В/град.
k 2 k 3 34,4 ⋅ 0,035
***
Структурно-параметрический синтез системы (задача оптимальной фильтрации Ви-
нера). В данном случае перед системой ставится задача преобразовать входной сигнал u(t)
так, чтобы на ее выходе воспроизводилась величина y*(t), связанная с u(t) некоторой фор-
мулой преобразования
L{y*(t)} = H(p) L{u(t)}, (4.91)
где L{y*(t)} и L{u(t)} – преобразованные по Лапласу функции y*(t) и u(t); H(p) – оператор
преобразования.
При H(p) = 1/p, например, имеем задачу интегриро- u (t ) y * (t )
вания входного сигнала, при H(p) = p – задачу диф- I H ( p)
pτ Δ (t )
ференцирования, при H(p) = e – задачу упреждения
(предсказания), при H(p) = 1 – задачу воспроизведе- u (t ) + f (t ) = ϕ(t ) y (t )
ния (обычная следящая система). II Wопт ( p)
Постановка задачи поясняется рис.4.22. Здесь
I канал – желаемое преобразование u(t) согласно Рис.4.22

(4.91); II канал – преобразование u(t) оптимальной системой Wопт(jω) при наличии помех
f(t). При этом ошибка системы Δ(t) = y (t) – y*(t) должна удовлетворять цели управления

469
(4.89). Эта задача иногда носит название оптимальной фильтрации входного сигнала φ(t),
т.е. систему можно рассматривать как оптимальный фильтр помех, поступающих на ее
вход.
Прежде чем решать поставленную задачу, найдем связь между корреляционными функ-
циями входного x(t ) и выходного y (t ) сигналов, действующих в линейной динамической
системе. Запишем выражение для взаимной корреляционной функции этих сигналов:
Т
1 *)
R yx (τ) = lim
T →∞ 2T ∫ y (t ) x (t − τ)dt . (4.92)
−Т

Воспользовавшись соотношением (4.82), получим


1 Т ∞
R yx (τ) = lim ∫ x(t − τ) dt ∫ w (θ) x(t − θ) dθ
T → ∞ 2T −Т −∞

или (поменяв порядок интегрирования)



R yx ( τ) = ∫ w (θ) Rx (τ − θ) dθ . (4.93)
−∞

Полученное выражение носит название уравнения Винера – Хопфа.


Для решения интегрального уравнения (4.93) применим преобразование Фурье. Оконча-
тельно
Syx(ω) = W(jω)Sx(ω) . (4.94)
Заметим, что уравнение (4.94) позволяет найти частотную функцию системы по экспери-
ментально снятым реализациям входного и выходного сигналов, т.е. без активного вмеша-
тельства в процесс.
Воспользовавшись выражениями (4.82) и (4.93) с учетом равенства
Δ(t) = y * (t ) – y (t ) ,
дисперсию ошибки (4.89), можно записать в виде
2
1 T ⎡ * ∞

DΔ = lim ∫ ⎢ y (t ) − ∫ w (θ)ϕ(t − θ)dθ⎥ dt =
T →∞ 2T −T
⎣ −∞ ⎦
∞ ∞
= R y* (0) − 2 ∫ w (θ) R y*ϕ (θ)dθ + ∫ ∫ w (θ) w (η) Rϕ (θ − η) dθ dη . (4.95)
−∞ −∞

Произведем замену переменной θ–η= λ и учтем, что ϕ (t) = u(t) + f(t). Тогда

Ry* φ(θ) = Ry* u(θ) + Ry* f (θ);


Rφ(λ) = Ru(λ) + Rf (λ) + R u f (λ) + Rf u(λ) .
Заметим, что, так как определенным корреляционным функциям соответствуют опреде-
ленные спектральные плотности, приведенные соотношения остаются справедливыми и для соот-
ветствующих спектральных плотностей.
Из выражения (4.95) следует, что оптимальная весовая функция wопт(t), соответствующая
минимуму дисперсии ошибки DΔ, зависит только от вида корреляционных функций по-
лезного сигнала и помехи и ее определение является вариационной задачей, где DΔ{w(t)} –
минимизируемый функционал.
Винер показал, что необходимое и достаточное условие минимизации DΔ = σ 2Δ , которое
должно быть наложено на весовую функцию, заключается в том, чтобы она была решени-
ем интегрального уравнения Винера – Хопфа вида

*)
Заметим, что Ryx (τ ) = Ryx (−τ ) , т.е. взаимная корреляционная функция несимметрична относительно от
ординат.

470

R y*ϕ (θ) = ∫ wопт (η) Rϕ (θ − η) dη . (4.96)
−∞

Тогда в соответствии с (4.94)


S y*ϕ (ω)
Wопт ( jω) = . (4.97)
S ϕ (ω)

Оптимальная частотная функция Wопт(jω), определяемая из (4.97), в общем случае оказы-


вается нереализуемой в смысле устойчивости. Это можно показать на простейшем приме-
ре. Пусть u(t) и f(t) не коррелированы и Sf (ω) = 1. Тогда с учетом того, что
Sφ(ω) = Su(ω) + Sf (ω), получим
S y*ϕ (ω)
Wопт ( jω) = .
1 + S u (ω)

Поскольку величина 1 + Su(ω) существенно положительна, то ее можно разложить на два


комплексных множителя, один из которых будет иметь корни в нижней полуплоскости,
что является признаком неустойчивости системы. В этой связи для отыскания Wопт(jω),
удовлетворяющей условию устойчивости, применяют искусственный прием, заключаю-
щийся в разложении знаменателя (4.97) на комплексные множители:
Sφ(ω) = |ψ(jω)2 | = ψ(jω)ψ(–jω). Тогда (4.97) можно представить в виде
1 S y*ϕ (ω)
Wопт ( jω) = .
ψ ( jω) ψ (− jω)

В этом случае, как показал Винер, реализуемая оптимальная передаточная функция имеет
вид
B ( jω)
Wопт ( jω) = , (4.98)
ψ ( jω)

где

1
∞ S
y *ϕ
(ω)
B ( jω) = ∫ β(t ) e − j ω t dt ; β(t ) = ∫
2π −∞ ψ (− jω)
e j ω t dω .
−∞

Пример 4.13. На вход следящей системы поступает управляющий сигнал со спектраль-


ной плотностью Su(ω) = 1/(1 + ω2) и помеха типа белого шума с Sf (ω) = с2, причем u(t) и
f(t) некоррелированы. Требуется найти оптимальную в смысле минимума σΔ частотную
функцию системы Wопт(jω).
Решение. Так как для следящей системы желаемый оператор преобразования H(p) = 1 и,
следовательно, y * (t ) = u(t), то учитывая что ϕ (t) = u(t) + f(t), можно записать
Sy*φ(ω) = Suφ(ω) = Su,u + f (ω) = Su(ω) ;
Sφ(ω) = Su(ω) + Sf (ω),
здесь учтено, что для некоррелированных сигналов Suf (ω) = Sf u(ω) = 0.
Подставив в полученные выражения известные спектральные плотности, получим
1 1 2 1 + c 2 + c 2 ω2 .
S y *ϕ = ; S ϕ (ω) = + c =
1 + ω2 1 + ω2 1 + ω2
Разложим последнее выражение на сопряженные множители

1 + c 2 + jωc 1 + c 2 − jω c
Sϕ (ω ) = ψ ( jω )ψ (− jω ) = ⋅
1 + jω 1 − jω

471
и вычислим в соответствии с (4.93):
1
∞ S y*ϕ (ω ) 1

(1 − jω ) e jω t d ω
β (t ) =
2π ∫
−∞
ψ (− jω )
e jω t dω =
2π ∫ (1 + ω
−∞
2
)( 1 + c 2 − jω c)
=


1 e jω t dω
=
2π −∞
∫ (1 + jω )( 1 + c 2 − jω c )
.

Разложив подынтегральную функцию на простые дроби, получим

1
∞ ⎡ 1 c ⎤
β (t ) =
2π ∫
−∞
⎢ + ⎥ e jω t dω .
⎢⎣ (c + 1 + c ) (1 + jω ) (c + 1 + c )( 1 + c − jω c) ⎥⎦
2 2 2
(4.99)

Для вычисления B(jω) в соответствии с (4.98) необходимо взять прямое преобразование


Фурье от функции β(t), которая, в свою очередь, является обратным преобразованием Фу-
рье от подынтегральной функции, стоящей в квадратных скобках выражения (4.99). Сле-
довательно, B(jω) будет равно этому подынтегральному выражению. Исходя из условий
реализуемости Wопт(jω), отбрасываем слагаемые подынтегральной функции, имеющие
корни в нижней полуплоскости. Тогда

1 1
B ( jω ) = ∫ β (t )e − jωt dt = ⋅ ,
0 c + 1+ c 2 1 + jω
а искомая передаточная функция примет вид
B ( jω) 1
Wопт ( jω) = =
ψ ( jω) (c + 1 + c )( 1 + c 2 + jωc)
2

или
k опт
Wопт ( jω ) = ,
Tопт jω + 1
где
1 c
K опт = ; Tопт = .
2 2
(с + 1 + с ) 1 + с 1 + c2
Таким образом, оптимальный фильтр в данном случае представляет собой апериодическое
звено первого порядка.
***
В заключение заметим, что решение задачи оптимальной фильтрации может быть также
произведено с помощью фильтра Калмана. При этом предполагается, что на вход системы
поступает аддитивная смесь управляющего воздействия u(t), являющегося гауссовским
марковским случайным процессом, и помеха f(t), представляющая собой гауссовский «бе-
лый» шум, не коррелированный с сигналом u(t). Физически реализуемый линейный опе-
ратор замкнутой системы, при котором процесс y(t) на выходе системы является опти-
мальным по критерию минимума средней квадратической ошибки, находится по специ-
ально разработанному алгоритму. Этот алгоритм достаточно громоздок и, в частности,
связан с решением дифференциального уравнения Риккати, для чего, как правило, требу-
ется применять численные методы с использованием компьютерных технологий. В ко-
нечном итоге, алгоритм Калмана дает тот же результат, что и алгоритм Винера, но, в от-
личие от последнего, позволяет синтезировать оптимальные фильтры не только для уста-
новившегося, но и для переходного режимов при нестационарных входных воздействиях.

АДАПТИВНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

472
В большинстве случаев проектирование системы управления производится в предположе-
нии, что статические и динамические свойства объекта управления и всех элементов сис-
темы известны, не зависят от изменений внешних условий и постоянны во времени. Одна-
ко в действительности характеристики объекта и некоторых элементов системы бывают
известны лишь приближенно, так как они изменяются в результате физического старения
и под действием внешних условий. Благодаря запасам устойчивости система управления,
спроектированная для определенных расчетных характеристик, может удовлетворительно
управлять объектом и в том случае, когда его фактические характеристики несколько от-
личны от расчетных. Однако если статические и динамические свойства системы изменя-
ются в широком диапазоне, то управление объектом с помощью простейшей системы с
постоянными параметрами и структурой может оказаться неудовлетворительным либо
вообще невозможным вследствие потери устойчивости. Для таких случаев необходимы
системы управления с изменяющимися свойствами.
Процесс изменения свойств системы, позволяющий ей достигнуть наилучшего или, по
крайней мере, удовлетворительного функционирования в изменяющихся условиях, назы-
вается адаптацией. Системы, осуществляющие процесс адаптации, называются адаптив-
ными (самоприспосабливающимися) системами.
Характерным признаком адаптивных систем является отсутствие полной априорной ин-
формации об объекте управления, внешних возмущениях и граничных условиях, т.е. адап-
тивной системе присущ индетерминизм (неопределенность). Функционирование системы
направлено на раскрытие неопределенности, т.е. на нахождение такого состояния, при ко-
тором реализуется цель управления. Раскрытие неопределенности может обеспечиваться
благодаря: избыточности системы, логичности ее действий, прогнозированию ее состояния
и анализу накапливаемой информации с целью самообучения.
Оптимальное, в известном смысле, функционирование адаптивной системы может
рассчитываться на основе информации о состоянии системы. Такие системы называются
аналитическими. Если же оптимальный режим работы определяется в результате поиска
условий экстремума критерия эффективности, то системы называются поисковыми. В
этом случае система как бы ставит серию экспериментов и извлекает из них данные, необ-
ходимые для улучшения своего поведения.
Изменение состояния системы можно производить за счет контролируемых изменений
управляющих воздействий, параметров и структуры системы.
Адаптивные системы классифицируются в зависимости от объема этих изменений на:
• экстремальные – только управляющие воздействия;
• самонастраивающиеся – управляющие воздействия и параметры системы;
• самоорганизующиеся – управляющие воздействия, параметры и структура систе-
мы;
• обучающиеся – управляющие воздействия, параметры и структура системы, алго-
ритм функционирования, а в случае самообучения и целевая функция.
Два последних класса систем, обладающих способностью к обучению и использо-
ванию человеко-машинного интерфейса*) в какой-то мере имитирует поведение человека,
и поэтому часто называются интеллектуальными.

*)
Интерфейс – система связей, предназначенная для обмена информацией между структурами.

473
По способу осуществления контролируемых изменений адаптивные системы под-
разделяются на пассивные, в которых эти изменения осуществляются по заранее разрабо-
танной программе, и активные, в которых контролируемые изменения заранее не опреде-
лены, а диктуются сложившейся ситуацией.
Наконец, как и любые другие автоматические системы, адаптивные системы могут рабо-
тать по замкнутому и разомкнутому циклам. В первом случае производится анализ дей-
ствия контролируемых изменений, а во втором – не производится.
Заметим, что наиболее совершенными являются аналитические активные замкну-
тые обучающиеся системы.

11.1. ЭКСТРЕМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

Задачей экстремальных систем управления (ЭСУ) является обеспечение в известном


смысле наилучшего статического режима работы объекта. При этом предполагается обя-
зательное наличие экстремальной зависимости критерия эффективности Q , по крайней
мере, от одного управляющего воздействия u . В худшем случае знание лишь того, что та-
кой экстремум существует, может служить достаточной априорной информацией для по-
строения ЭСУ. Таким образом, если статическая характеристика Q = f (u ) имеет экстре-
мум, то ЭСУ должна вывести и удержать рабочую точку в глобальном экстремуме.
Примером объекта с экстремальной характеристикой может служить топочная установка
энергетического блока. Здесь статическая характеристика по каналу расход воздуха на
горение и – температура топочных газов Q имеет экстремум-максимум при определенном
u = u * . При u < u * имеем неполное сгорание топлива, при u > u * – избыток воздуха. И в
том, и в другом случае температура топочных газов снижается (рис.4.23, кривая 1). При
изменении, либо расхода либо качества подаваемого топлива значение u , при котором
Q* = max, изменяется (кривые 2, 3 рис.4.23). Задача ЭСУ в данном случае сводится к из-
менению расхода воздуха до значений, обеспечивающих наилучшие условия сгорания
топлива, т.е. к отслеживанию координат экстремальной точки Q*, u*, которые изменяются
(дрейфуют) во времени. Q 3
Другим примером объекта с экстремальной статической ха- Q* 1
рактеристикой может служить измельчительный агрегат,
подготавливающий твердое топливо для топочной установ-
ки. В данном случае выходная производительность агрегата
Q зависит от массы твердого в нем, которая может изме- 2
няться за счет изменения поступления материала в агрегат и u* u
(производительности на входе). Эта зависимость имеет экс-
Рис.4.23
тремум (рис.4.24, кривая 1), причем участок ОА кривой 1
соответствует устойчивому режиму работы (в установившемся режиме входная и выход-
ная производительности равны), а участок АВ – неустойчивому, при котором увеличение
входной производительности u > u * может привести к завалу агрегата и полной его оста-
новке. Изменение качества твердого топлива (размер, твер- Q
дость и др.) приводит к дрейфу точки экстремума (рис.4.24,
3
кривые 2, 3), и следовательно, для достижения цели управ-
А
ления Q = max целесообразно применять ЭСУ. Q*
В некоторых случаях экстремальная характеристика объекта 2 1
может быть сформирована искусственно. Например, для
многих технологических установок качество конечной про- Q
O *
u Q(G) В u
дукции зависит от их производительности. При этом реали- Рис.4.24 QΣ
зационная стоимость продукта Q , с одной стороны, растет
G, K
Q(K)
474

Рис.4.25
пропорционально его количеству G , а с другой – падает за счет ухудшения качества K
n
(рис.4.25). Результирующая кривая QΣ = C1G − C2 K (здесь C1 , C2 – весовые коэффициен-
ты; n – показатель степени) имеет явно выраженный экстремум.
Экстремальные системы можно классифицировать по различным признакам, в частности:
по характеру сигналов ЭСУ подразделяются на непрерывные и дискретные (шаговые); по
числу управляющих воздействий – на одно-, двух- и многоканальные; по способу форми-
рования поискового сигнала – с непосредственным измерением производной, с запомина-
нием экстремума, с внешним поисковым сигналом и др.
Остановимся на принципах построения и функционировании некоторых ЭСУ.
11.1.1. Непрерывные экстремальные системы.
Наиболее широкое применение получили поисковые одноканальные экстремальные
системы, которые используют одно управляющее воздействие. Это, помимо относительной
простоты реализации, позволяет значительно улучшить динамические показатели качества
работы системы, и значительно расширить класс объектов, для которых применение ЭСУ яв-
ляется эффективным.
Достаточной информацией для функционирования таких ЭСУ является знание величины
dQ
или, по крайней мере, знака производной , где Q=f(u), экстремальная статическая ха-
du
рактеристика объекта управления.
В качестве примера рассмотрим систему дизель – генератор (Д – Г), работающую парал-
лельно с энергосистемой. Целью управления этой установкой является максимизация ее
КПД (Q = η → max) в условиях нестабильности зависимости η = f (q) , где q = u – расход
топлива, подаваемого к дизелю. Какой бы ни была функция η = f (q) , экстремальное зна-

чение η будет достигнуто при = 0 . Поэтому для обеспечения цели управления необхо-
dq
димо вычислить текущее значение η и η′q и осуществлять управление так, чтобы величи-
на производной η′q стремилась к нулю.
Возможный вариант функциональной схемы ЭСУ представлен на рис.4.26. Информация о
q входной мощности Pвх , пропорциональной расходу топ-
Д Г
Рг
лива q , и о выходной мощности генератора Pг дает воз-
V
Рвх = ky q можность непрерывно измерять КПД установки
ИМ У η = Pг / Pвх . Дифференцирование величин η и q по вре-
мени с помощью дифференцирующих звеньев (ДЗ) и по-
ДЗq Рг /Рвх следующим делением производных η′t и qt′ дает величи-
η′q
q′ ну, пропорциональную η′q ,
t
η′t / qt′ ДЗη которая подается на ис-
η η η′q =0
η′t
полнительный механизм *
η
Рис.4.26 (ИМ). Последний в соот-
ветствии со знаком и величиной η′q изменяет расход подво-
димого топлива до тех пор, пока не будет достигнуто равен- η′q > 0, η′q < 0,
ство η′q = 0 (рис.4.27). В рассматриваемой системе скорость v>0 v<0
изменения величины q пропорциональна величине η′q , т.е.
u* q
v = qt′ = k иη q′ , (4.100) Рис.4.27

475
где k è – коэффициент передачи исполнительного механизма.
В том случае, если определяется только знак производной η′q , исполнительный механизм
движется в ту или другую сторону с постоянной скоростью v 0 , т.е.
v = ±v 0 = v 0U , (4.101)
где U = sign ϕ = sign{η′q + δsign v } – функция переключения; sign ϕ – единичная функция, знак
которой определяется знаком функции ϕ; δ – зона нечувствительности экстремального
регулятора.
Пример 4.14 В функциональной схеме ЭСУ (рис.4.28) объект управления ОУ можно
представить в виде двух последовательно соединенных звеньев: нелинейного безынерци-
онного звена (НЗ), уравнение которого приближенно можно записать в параболической
форме
Q = −k 0 u 2 , (4.102)
и линейного звена (ЛЗ), дифференциальное уравнение
которого имеет вид:

T0 +θ=Q, (4.103)
dt
где k 0 и T0 – коэффициент усиления и постоянная вре-
мени объекта управления.
Исполнительный механизм системы ИМ представляет собой интегрирующее звено, опи-
сываемое уравнением
du
= kиv . (4.104)
dt
Экстремальный регулятор ЭР функционирует на основании информации о знаке
производной в соответствии с выражением (4.101).
Определить динамические показатели работы системы.
Решение. Перепишем (4.103) с учетом (4.102) в виде
dθ du
T0 + θ = −k 0 u 2 .
du dt
Тогда с учетом (4.104) и (4.101) имеем

± T0 k и v 0 + θ = −k 0u 2 .
du
1 K0
Обозначив = a; = b , получим
T0 K и v 0 T0 K и v 0

± aθ = mbu 2 . (4.105)
du
Заметим, что полученное уравнение представляет собой уравнение фазовой траектории в
координатах u , θ .
Общее решение уравнения вида (4.105) при v = +v 0 ищется в виде

θ = e ∫ ⎡⎢ ∫ ( −bu 2 ) e ∫ du + C ⎤⎥ ,
− adu adu

⎣ ⎦
где С – постоянная интегрирования.

476
После двойного интегрирования по частям выражения, стоящего в квадратных скобках,
получим, уравнение фазовой траектории θ (u ) в явном виде.
b 2b 2b
θ = C e − au − u 2 + 2 u − 3 , (4.106)
a a a
где С определяется из начальных условий u (0) = u 0 и θ(0) = θ0 :
⎛ b 2b 2b ⎞
C = ⎜ θ 0 + u 02 − 2 u 0 + 3 ⎟ e au0 . (4.107)
⎝ a a a ⎠
В соответствии с (4.106) на рис.4.29 построена фазовая траектория, характеризующая
движение системы на фазовой плоскости с координатами θ, u . После пересечения фазовой
траекторией θ (u ) , обозначенной на рис.4.29
пунктирными линиями, статической характери-
стики Q(u ) координата θ начинает уменьшаться

и, следовательно, знак производной станет
du
отрицательным. При θ′u > δ sign v (точка u01 , θ01 )
функция переключения U = sign {Qu′ + δ signv}
меняет свой знак на противоположный и экстре-
мальный регулятор в соответствии с (4.101) подает команду на реверс исполнительного ме-
ханизма. Уравнение фазовой траектории сохраняет тот же вид, но так как в данном случае
v0 < 0 , то коэффициенты a и b в уравнениях (4.106) и (4.107) меняют свой знак, а в уравне-
ние (4.107), кроме того, вместо θ0 и u0 следует подставить θ 01 и u01 . В точке u02 , θ02 снова
произойдет реверс и так далее. Предельный цикл, показанный на рис.4.29 сплошными ли-
ниями, характеризует установившиеся симметричные автоколебания в системе.
Имея фазовую траекторию и предельный цикл, можно определить качественные показа-
тели работы системы, к которым относятся потери на поиск*), время выхода в зону экс-
тремума и параметры автоколебаний. В последнем случае помимо периода автоколебаний
Ta определяется размах колебаний как управляющего воздействия Δи (зона поиска на вхо-
де), так и показателя качества Δθ (зона поиска на выходе). Из рис.4.29 видно, что
Δu = u1 + u2 и Δθ = θ 2 − θ1 . Так как скорость исполнительного механизма в соответствии
с уравнением (4.104) равна k u v , где v = ±v0 , то период автоколебаний можно найти по
формуле:
Δu
Ta = .
kиv 0
Потери на поиск P определяются как разность между экстремальным Q* (в нашем случае
Q* = 0 ) и средним Qср значениями критерия на выходе объекта и характеризуют точность
работы ЭСУ. Так как автоколебания симметричны, то величина потерь P = 0,5( θ1 + θ 2 ) .
Время выхода в зону экстремума Tв определится как сумма времен, за которые система
проходит определенные участки фазовой тра-
ектории:
N
u + u0i +1
Tв = ∑ Δti ; Δti = 0i ,
i =1 kи v 0

*)
Иногда потери на поиск, обусловленные автоколебаниями в зоне экстремума, называют потерями на рыска-
ние.

477
где N – количество участков фазовой траектории до выхода на предельный цикл.
Заметим, что аналогичные результаты можно получить, определяя поведение выходной
координаты во времени. Учитывая, что в соответствии с (4.104) un = ± kиv 0t + u0 , и под-
ставляя это выражение в (4.106), получим зависимость θ(t ) , которая также позволяет ус-
тановить качественные показатели работы системы (рис.4.30).

11.1.2. ДИСКРЕТНЫЕ ЭКСТРЕМАЛЬНЫЕ СИСТЕМЫ

Непрерывные экстремальные системы обладают сравнительно низкой помехозащищенно-


стью. Например, если при движении к экстремуму на характеристику Q(u ) накладываются
высокочастотные помехи, то система будет совершать ложные реверсы, что значительно
ухудшает ее динамические свойства.
С целью повышения помехозащищенности применяют дискретные ЭСУ шагового типа, в
которых значение экстремального показателя Q измеряется дискретно, через определен-
ные интервалы времени Δt , называемые шагами. В зависимости от результатов сравнения
величин Q в начале и в конце каждого шага, осуществляют изменение управляющего
воздействия u в соответствии с алгоритмом
u n +1 = u n + ΔuU n +1 , (4.108)
где U n +1 = sign(ΔQn + δ ) sign U n - функция переключения на n+1-м шаге квантованияпо
времени; u n и u n+1 – величина управляющего воздействия на n -м и n + 1 -м шаге кванто-
вания по времени соответственно; Δu – величина изменения управляющего воздействия
на каждом шаге квантования по времени; ΔQn – приращение критерия эффективности на
n -м шаге; δ – зона нечувствительности экстремального регулятора.
Нетрудно заметить, что при сравнительно большой величине Δи обеспечивается доста-
точно надежное измерение приращения критерия эффективности, что способствует по-
вышению быстродействия и помехозащищенности системы, но приводит к увеличению
потерь на поиск. Величина шага квантования по времени Δt ограничена: при очень боль-
шом шаге в системе могут появить-
ся ошибки, обусловленные времен-
ным дрейфом статической характе-
ристики Q(u ) ; при слишком малом
шаге на правильность работы сис-
темы помимо запаздывания инфор-
мации о выходных показателях,
обусловленного инерционностью
объекта, могут также оказывать
влияние высокочастотные помехи.
Таким образом, оптимальные вели-
чины Δu и Δt выбираются, исходя
из конкретных условий работы сис-
темы.
Рассмотрим дискретную ЭСУ,
функциональная схема которой представлена на рис.4.31. Здесь для повышения помехо-
защищенности систем величина Q , пропорциональная критерию эффективности объекта
управления ОУ, подается на вход блока усреднения БУ, который выдает среднее за шаг
Δtn значение критерия Qсрn и подает его на вход устройства сравнения УС и в блок памяти
БП. С выхода УС снимается сигнал пропорциональный разности ΔQn=Qnср-Q ср,n-1. В соот-
ветствии со знаком этой разности формируется тем или иным способом управление u, на-

478
пример, по алгоритму (4.108). При этом на каждом шаге квантования Δt импульсный эле-
мент ИЭ подает импульсный сигнал на вход исполнительного механизма ИМ, который
изменяет управление на величину Δu в ту или иную сторону. Изменение координат Q(t) и
u(t) безинерцонной ЭСУ, работающей в соответствии с алгоритмом (4.108), показано на
рис.4.32.

Для повышения быстродействия системы целесообразно применять стратегию по-


иска при переменном шаге управления Δu. В частности, можно так сформулировать кри-
терий эффективности, чтобы при переходе в зону недопустимых режимов работы объекта
управления происходила смена его знака, например, с положительного на отрицательный.
Тогда при Q<0 шаг квантования может быть равным Δu2, а при Q>0 – равным Δu1, причем
Δu1<Δu2. Последнее условие обеспечивает сокращение времени выхода системы в зону
допустимых режимов без увеличения потерь на поиск. Алгоритм поиска экстремума для
этого случая запишется в виде:
un +1 = un + Δu1U nI+1 + Δu2U nII+1 ,
где U I + U II = U - функция переключения:
U nI +1 = 0,5(1 + signQn ) sign(ΔQn + δ ) signU n ;
U nII+1 = 0,5(1 − signQn ) sign(ΔQn + δ ) signU n .
Дальнейшее сокращение времени выхода в зону экстремума может быть полу-
чено, за счет того, что шаг квантования Δu при выходе из зоны Q<0 остается равным
большему его значению Δu2 до тех пор, пока рабочая точка на статической характеристике
Q(u) не сместится за точку экстремума, т.е. до первого отрицательного приращения ΔQn.
После этого поиск экстремума осуществляется с малым значением шага Δu1.
Пример 4.15. Пусть объект управления ОУ можно представить в виде двух последова-
тельно включенных звеньев: линейного инерционного звена с запаздыванием ЛЗ и нели-
нейного безинерционного НЗ (рис.4.33). Нелинейное звено объекта описывается парабо-
лической зависимостью вида
Q = a0 + a1θ1 + a2θ12 , (4.109)
где а0, а1, а2 – коэффициенты изменяющиеся во времени.
Требуется определить динамические показатели работы систем, использующей в качестве
управляющего устройства дискретный экстремальный регулятор ЭР, функционирующий в
соответствии с алгоритмом (4.108)
При этом предполагается, что с целью уменьшения времени переходного процесса испол-
нительный механизм ИМ работает в им-
пульсном режиме. При этом изменение
величины управляющего воздействия
происходит ступенчато в начале каждого
шага квантования по времени. Такой ЭР
иногда называют шаго-импульсным.

479
Решение. Введем новую переменную θ=θ1 - θ*, где θ* - величина промежуточной пере-
менной θ, при которой достигается экстремум критерия эффективности Q . Эта величина
∂Q(u, t )
определяется из выражения = a1 + 2a 2θ * = 0 , откуда
∂θ
a
θ* = − 1 . (4.110)
2a 2
Подставив (4.110) в (4.109), окончательно получим
Q = b0 + b2θ 2 , (4.111)
2
a
где b0 = a0 − 1 ; b2 = a2.
4a 2
Найдем зависимость θ(t) за время Δt = t n − t n−1 , где tn, tn-1 – текущее время в конце и начале
n-го шага соответственно.
Пусть в конце (n-1)-го шага координаты объекта управления равны: u = un-1, θ = θn-1 (рис
4.34). В течение времени запаздывания τ зависимость θ(t) определяется из уравнения
Tθ& + θ = u n −1 . (4.112)
Решение (4.112) при ненулевых начальных условиях θ(0)= θn-1 имеет вид
⎛ −t
⎞ −t
θ (t ) = u n −1 ⎜⎜ 1 − e T ⎟ + θ n −1 e T
⎟ (4.113)
⎝ ⎠
Подставив в (4.113) t=τ можем записать
−τ
⎛ ⎞
θ (τ ) = θ n −1 + ( un −1 − θ n −1 ) ⎜1 − e T ⎟ = θ n −1 + Δθ nI ,
⎝ ⎠
где Δθ n - приращение координаты θ за время τ
I

(рис.4.34)
Аналогичным образом определяется зависимость
θ(t) для промежутка времени (Δt − τ ) :
⎧⎪ ⎛ −t
⎞⎫
θ (t ) = (θ n−1 + Δθ I
n ) [ (
+ ⎨ u n − θ n −1 + Δθ nI )] ⎜1 − e T ⎟⎪⎬ ,
⎜ ⎟⎪
⎪⎩ ⎝ ⎠⎭
(4.114)
где u n = u n−1 + Δu
Приращение координаты θ за время t = (Δt − τ ) оп-
ределяется вторым слагаемым правой части урав-
нения (4.114) и обозначено на рис.4.34 Δθ nII .
Полученные соотношения позволяют построить
кривую переходного процесса в системе и опреде-
лить потери на поиск.
Пусть параметры объекта управления имеют следующие значения T=300c, τ =420с;
b0=2,2; b2= –0,05. Параметры экстремального регулятора выбираются из следующих сооб-
ражений. Величина шага квантования по уровню управляющего воздействия Δu принима-
ется из условий надежного измерения приращения критерия ΔQ при допустимых потерях
на поиск. Например, при Δu=1,5 минимальное изменение критерия Q в зоне экстремума
при статическом режиме (Δu=Δθ и Q*=b0) составит ΔQ=Q*-Q(Δu)=0.11, что удовлетворя-
ет требованиям сформулированным выше. Шаг квантования по времени Δt выбирается
исходя из обеспечения устойчивости движения системы в области экстремума, для чего

480
должно выполняться неравенство Δt > τ . Для обеспечения надежного изменения выход-
ной координаты θ шаг квантования определяется по формуле:
Δt = τ + cT ,
где с – коэффициент, обычно с=1÷2. Положив с= 1,5, получим Δt= 420+1,5⋅300=870с.
Зона нечувствительности экстремального регулятора δ зависит от характеристик техниче-
ских средств, реализующих регулятор, и в нашем случае принимается равной 0,05.
Воспользовавшись соотношениями (4.110), (4.111), (4.113), и (4.114) можно построить
зависимость u(t) и Q(t) (рис.4.35) , характеризующую процесс выхода системы в зону экс-
тремума при заданных начальных условиях u(0)=-12.8. При этом, как видно из рис.4.35,
время выхода в зону экстремума (до первого отрицательного приращения критерия ΔQ за
время Δt) составляет Тв= 7.8⋅103 с.
Потери на поиск Р в
зоне экстремума
(режим

автоколебаний, при t>Тв), определяемое как разность между максимальным значением


критерия эффективности Q*=b0 и его средним значением за период автоколебаний Qср,
можно найти воспользовавшись соотношением, определяющим потери на n-ном шаге
квантования по времени
Δt
1
Pn = Q * − ∫ Q (t )dt
Δt 0
где Q(t) определяется уравнениями (4.113) при t n−1 < t ≤ t n −1 + τ , (4.114) при t n−1 + τ < t ≤ t n с
учетом уравнения (4.111). Тогда потери на поиск будут
1 N
P = ∑ Pn
N n =1
где N – число шагов за период автоколебаний Та=N⋅Δt выходной координаты системы Q.
В нашем случае величина Р=0.089, что составляет 4% от максимального значения крите-
рия, что вполне допустимо.
11.1.3. Методы поиска экстремума в многоканальных экстремальных системах
Случай, когда критерий эффективности Q является функцией одного управляющего воз-
действия u , наиболее распространен. Однако, если этот критерий зависит от нескольких
управляющих воздействий, то дальнейшее повышение эффективности функционирования
системы может быть получено за счет применения многоканальных ЭСУ.
Рассмотрим наиболее распространенные методы поиска экстремума критерия Q как
функции нескольких управляющих воздействий.

481
1. Метод Гаусса-Зайделя, или метод покоординатного восхождения (спуска), заключается
в последовательном приближении к экстремуму путем поочередного варьирования каж-
дого управляющего воздействия до тех пор, пока не будет достигнут экстремум критерия
Q. Характерная особенность метода – необходимость стабилизации всех входных пере-
менных, кроме варьируемого. Процесс поиска экстремума по методу Гаусса-Зайделя в
случае зависимости критерия Q от двух управляющих воздействий иллюстрируется рис.
4.36 (траектория 1). Функция Q = f (u1 , u 2 ) представлена здесь линиями равных значений
критерия Q = const . Движение, параллельное осям координат, происходит до тех пор пока
не будет достигнут частный экстремум, при котором
u2
∂Q / ∂u i = 0 . Это условие выполняется в точке каса- O3
3
Q j+1 < Q
ния прямой, параллельной оси координат, с одной из j

линий равных значений критерия. Из рис. 4.36 вид-


но, что путь изображающей точки к экстремуму да-
леко не кратчайший, поэтому время поиска относи-
тельно велико. С ростом числа управляющих
воздействий эффективность поиска резко снижа- u1
ется.
2. Метод градиента отличается от предыдущего
тем, что движение изображающей точки к экстрему- 2
му (рис. 4.36, кривая 2) производится в направлении
вектора градиента: O2
∂Q ∂Q ∂Q
gradQ = i + i2 + ... + i k , O1
∂u1 ∂u2 ∂u k
1
где i - единичные векторы в k -мерном пространст- Рис. 4.36
ве.
В точке экстремума значение gradQ =0 и движение изображающей точки прекращается.
При использовании метода градиента длина траектории существенно меньше, чем при ме-
тоде Гаусса - Зайделя. Однако, необходимость непрерывно определять градиент функ-
ции Q требует больших затрат времени, что делает этот метод малоэффективным.
3. Метод крутого восхождения (наискорейшего спуска) предложен Боксом и Уилсоном.
Сущность этого метода заключается в том, что направление вектора градиента L , найден-
ного в начальной точке состояния объекта исследования, определяет направление движе-
ния в k-мерном пространстве до тех пор, пока частная производная ∂Q / ∂L взятая по этому
направлению, не обратится в нуль. В этой точке вновь определяется направление гради-
ента и происходит движение этого вектора до обращения в нуль частной производной
критерия Q, по новому направлению, и так до тех пор, пока система не выйдет в зону экс-
тремума критерия Q (рис. 4.36 траектория 3). Этот метод, обладая достоинствами метода
градиента, выгодно отличается от него тем, что не требует непрерывного определения
величины и направления градиента критерия Q.
Все три метода поиска рассмотренные выше, предусматривают получение информации о
производных критерия эффективности по направлению движения к экстремуму. В
реальных условиях эта информация может быть получена по дискретным резуль-
татам измерения величины Q . При этом изменение управляющих воздействий u
производится с шагом квантования Δu , величина которого определяется конкретными ус-
ловиями.
При применении метода Гаусса - Зайделя выбор направления первого шага Δu (из точки
O1 ) осуществляется случайным образом. Если при поиске экстремума-максимума прира-
щение критерия ΔQ = Q1 − Q0 > 0, то движение продолжается в том же направлении, если
ΔQ1 < 0 - направление меняется на противоположное (происходит реверс). Сме-

482
на знака ΔQi свидетельствует о прохождении частного экстремума критерия эффек-
тивности по выбранному управлению и необходимости смены варьируемого управления.
Далее процедура повторяется до достижения зоны экстремума.
При поиске экстремума функции Q (u1 , u 2 ) с помощью метода градиента градиент этой
функции должен определяться на каждом шаге квантования факторов Δu . Это требует
определения, хотя бы в первом приближении, зависимости Q = f (u1 , u 2 ) например, в виде
линейного полинома: Q = b0 + b1u1 + b2 u 2 . При этом, коэффициенты b1 и b2 являются со-
ставляющими градиента, определяющими направление движения.
При применении метода Бокса - Уилсона процесс поиска отличается от описанного выше
тем, что движение изображающей точки в направлении вектора градиента O3 O4 про-
должается вплоть до смены знака приращения критерия Q . Затем определяется новое
направление движения, и процесс повторяется до выхода в зону экстремума.
При практической реализации классические методы поиска экстремума, рассмотренные
выше, претерпели существенные изменения.
Одним из специальных методов является симплекс-метод*). Напомним, что под симплек-
сом понимают простейший выпуклый многогранник в k-мерном пространстве. Правиль-
ным k-мерным симплексом называется многогранник, у которого все вершины находятся
на одинаковом расстоянии от центра, а длина всех ребер одинакова. В двухмерном про-
странстве симплекс это равносторонний треугольник. Рассмотрим применение симплекс-
метода при поиске экстремума в объекте с двумя управляющими воздействиями u1 и u 2
(рис. 4.37). Пусть точка А - исходная точка поиска. Делаются пробные движения с таким
расчетом, чтобы проекция симплекса на плоскость u1Ou 2 образовала правильный тре-
угольник аbс. В каждой вершине треугольника измеряются значения экстремального па-
раметра, которые затем сравниваются между собой. Пусть, например Qa < Qc < Qb . В
этом случае на стороне треугольника bс, противоположной вершине а, строится новый
треугольник а'bс при помощи только одного шага, сделанного по направлению перпенди-
куляра, опущенного из точки а на сторону bc. Далее снова происходит сравнение значе-
ний Q . Если Qc < Qb < Qa , то происходит движение по направлению к с' и т.д. По своей
идее этот метод близок к методу градиента, но не требует вычисления производной в каж-
дой точке траектории, что значительно уменьшает время поиска. Для уменьшения ампли-
туды автоколебаний вокруг экстремальной точки можно уменьшить величину шага при
приближении к точке экстремума.
Все рассмотренные методы поиска экстремума относятся к классу детерминированных.
При сложной зависимости критерия эффективности от управляющих воздействий («овра-
ги», «гребни», «ямы» и т.п.) поиск глобального экстремума этими методами может быть
затруднен. Плодотворными оказываются случайные методы поиска, основанные на алго-
ритмах, в которых порядок вычисления частных производных случаен.
К случайным методам поиска можно отнести ал-
горитм перебора всех возможных значений
управляющих воздействий (метод сканирова-
ния), когда каждое последующее положение ра-
бочей точки выбирается случайно. Все положе-
ния, в которых система уже побывала, исключа-
ются из рассмотрения, и запоминаются только
управляющие воздействия, соответствующие
наилучшему значению критерия Q. К основным

*)
Заметим, что этот метод разработан и теоретически применен для решения задач линейного программирова-
ния. Его обобщения допустимы при возможности корректной линеаризации целевой функции и (или) учета ограниче-
ний, налагаемых на переменные

483
недостаткам этого метода относится возможность возникновения аварийной ситуации, а
также большая длительность поиска. Например, для r управляющих воздействий с m
уровнями квантования существуют m r возможных состояний. Для ряда случаев число
этих состояний, а, следовательно, и время поиска весьма велики.
Несколько совершеннее метод чисто случайного поиска, впервые нашедший свое прило-
жение в гомеостате Эшби, устройство которого рассмотрено ниже. Система из начального
состояния совершает случайное пробное движение, направление которого равновероятно
с любым другим. В запоминающем устройстве хранится значение критерия Q, соответст-
вующее начальному состоянию системы. Далее производится сравнение критерия в новом
положении с исходным. Если случайное перемещение привело к успеху (в смысле при-
ближения к экстремуму), то осуществляется рабочий шаг в том же направлении и случай-
ный поиск производится из нового положения. Если положение ухудшилось, то пробное
движение начинают снова из исходного положения. Для увеличения быстродействия сис-
темы применяется сочетание метода случайного поиска с методом крутого восхождения.
При этом из исходной точки совершают не одно, а несколько случайных пробных движе-
ний, по которым находят приближенное значение градиента. Затем осуществляется дви-
жение в направлении градиента до изменения знака приращения и вновь производится
несколько случайных пробных движений, вычисляется новое значение градиента и т.д.
до выхода в зону экстремума.
Заметим, что методы случайного поиска особенно эффективны для многоканальных (три
и более управлений) ЭСУ.

11.2. САМОНАСТРАИВАЮЩИЕСЯ СИСТЕМЫ УПРАВЛЕНИЯ

Задачей самонастраивающихся систем управления (СНС) является обеспечение в извест-


ном смысле наилучшего статического и динамического режимов работы объекта управле-
ния. При этом предполагается, что помимо управляющих воздействий u (t ) возможно так-
же изменение некоторых параметров (обычно коэффициентов усиления и постоянных
времени отдельных звеньев), влияющих на динамические процессы в системе.
Реализация цели управления Q = extr в СНС обычно осуществляется с помощью поиско-
вых или аналитических (беспоисковых) алгоритмов. В первом случае изменение парамет-
ров системы СНС происходит на основании реакции системы на поисковые воздействия,
т.е. в этом случае она представляет собой сочетание экстремального регулятора и коррек-
тирующего устройства, осуществляющего за счет изменения параметров системы компен-
сацию влияния внешних и внутренних возмущений на свойства системы. Во втором слу-
чае СНС производят контролируемые изменения параметров устройства управления с по-
мощью вычислительных операций, использующих в качестве исходной информации на-
блюдаемые воздействия и параметры системы, измеряемые системой измерительных уст-
ройств, т.е. для своей успешной работы аналитические СНС нуждаются в гораздо боль-
шей априорной информации по сравнению с поисковыми, но не требуют больших затрат
времени на поиск, что дает возможность реализовать СНС даже при сравнительно быст-
рых изменениях свойств системы.

11.2.1. Аналитические самонастраивающиеся системы


Функциональная схема аналитической СНС (рис.4.38) состоит из основного контура
с выходной координатой y0 (t ) и контура самонастройки. Основной контур включает в се-
бя объект управления (ОУ), состоящий из трех динамических звеньев (I, II и III) и устрой-
ства управления (УУ). Предполагается, что при отключении контура самонастройки ос-
новной контур может работать как обычная система автоматического управления, в кото-
рой контролируемые изменения параметров не имеют места. Нахождение уравнения уст-

484
ройства управления без учета связи между параметрами управляющего устройства и
внешними и внутренними изменениями системы составляют так называемую задачу пер-
вичной оптимизации. В результате решения этой задачи определяется оптимальная или
идеальная модель системы (структура и параметры идеального управляющего устройст-
ва). Примерами решения таких задач могут служить задачи синтеза оптимальных систем,
рассмотренные в предыдущей главе.
Контур самонастройки включает в
себя элементы основного контура (в
частности, звено объекта управления
I, динамические характеристики ко-
торого подвержены заранее непред-
сказуемым изменениям) и корректи-
рующее вычислительное устройство
(КУ), вырабатывающее управляю-
щее воздействие uс (t ) в виде изме-
нения параметров устройства управ-
ления (УУ) или введения дополни-
тельного воздействия u (t ) в цепь ос-
новного контура. Управление uс (t )
вырабатывается на основе имею-
щейся априорной и текущей инфор-
мации о внешних и внутренних условиях работы системы, критерия эффективности, опре-
деляющего цель управления, и критерия самонастройки, характеризующего отклонение
действительных характеристик системы от заданных.
Корректирующее устройство может состоять из следующих функциональных элементов:
анализаторов внешних и внутренних условий 1 и 2, определяющих соответственно текущие
характеристики внешних воздействий f 0 (t ) и изменяемой части системы, и вычислителей 3
и 4. Первый вычислитель решает задачу первичной оптимизации, второй – вырабатывает
управляющие воздействия в контуре самонастройки.
Работа КУ организована следующим образом. Вычислитель 3 по выбранному критерию
эффективности, заданным ограничениям и информации, поступающей на его вход от ана-
лизаторов 1 и 2, определяет оптимальные динамические характеристики системы и вы-
бранные для их количественного описания параметры и управления. Оптимальные значе-
ния параметров сравниваются с текущими их значениями, которые выдает анализатор 2.
Получаемые при этом сигналы рассогласования, характеризующие отклонения действи-
тельных характеристик системы от оптимальных, поступают в вычислитель 4, вырабаты-
вающий управляющий сигнал uс (t ) , который воздействует на УУ, стремясь изменить ди-
намические характеристики основного контура так, чтобы они, с точки зрения принятого
критерия самонастройки, незначительно отличались от оптимальных. Тут решается так
называемая задача вторичной оптимизации. Если действительные характеристики не от-
личаются от оптимальных, сигналы рассогласования равны нулю и контролируемые из-
менения в системе не производятся.
Таким образом, в аналитической СНС (рис.4.38) контур самонастройки вырабатывает
управляющее воздействие uс (t ) в зависимости от внешних и внутренних условий работы
системы.
Некоторые СНС используют информацию только о внешних воздействиях (рис.4.39). В
этом случае анализатор 2 отсутствует и настройка производится по разомкнутому циклу.
В процессе работы под влиянием внешних воздействий свойства объекта изменяются, в
связи с чем его передаточная функция W0 ( p ) бу-
дет отличаться от исходной W0u ( p) . Если СНС 4 1 f (t)
предназначена для стабилизации динамических u с (t) КУ
u (t) y(t)
УУ ОУ
485

Рис.4.39
свойств системы, то должно выполняться условие
Wy ( p)W0 ( p)
W ( p) = = const , (4.115)
1 + Wy ( p)W0 ( p)
где W ( p) – передаточная функция замкнутой системы; Wy ( p ) – передаточная функция
управляющего устройства.
Для выполнения условия (4.115) необходимо, чтобы
Wy ( p )W0 ( p ) = Wyu ( p )W0u ( p ) .
Тогда
Wyu ( p )W0u ( p )
Wy ( p ) = . (4.116)
W0 ( p )
Условие (4.116) выполняется приближенно, поскольку задача получения полной инфор-
мации о возмущающих воздействиях и определения их влияния на параметры объекта в
полном объеме практически решена быть не может. Подобные системы применяются в
некоторых автопилотах, учитывающих изменение таких внешних воздействий, как давле-
ние и температура окружающего воздуха, скорость и КУ
4 2
направление ветра и др.
f (t)
Примером системы, самонастраивающейся по дина- uс(t)
мическим характеристикам объекта, может служить u (t)
УУ
y(t)
М ОМ ОУ
СНС (рис.4.40), в которой управляющее устройство,
включенное в основной контур системы, представляет
собой последовательное соединение желаемой модели
прямой цепи (М) и обратной модели объекта управле- Рис.4.40
ния (ОМ) с передаточными функциями WM ( p ) и WOM ( p) . Задача цепей самонастройки со-
стоит в том, чтобы, вычислив текущие динамические характеристики объекта (анализатор
2), найти и затем ввести в управляющее устройство параметры обратной модели (вычис-
литель 4). При этом передаточная функция прямой цепи основного контура

W ( p) = WM ( p )WOM ( p)W0 ( p ) ,

а с учетом того, что в результате самонастройки WOM ( p) = W0−1 ( p) , имеем W ( p) = WM ( p) .


Таким образом, рассмотренная СНС стабилизирует желаемые динамические свойства сис-
темы. Однако ошибки, могущие возникать в цепях
самонастройки, не компенсируются системой и по- КУ
тому она относится к классу разомкнутых. 2
В случае определения динамических характеристик
цепи, включающей помимо объекта управления
4 М
(ОУ) управляющее устройство (УУ), ошибка само- f (t)
настройки формируется по замкнутому циклу (вы- uс(t)
u (t) y(t)
числитель 4) на основе сравнения текущих УУ ОУ
значений параметров прямой цепи, выда-
ваемых анализатором 2, и известных пара- Рис.4.41
метров желаемой модели (М) разомкнутой
системы (рис.4.41).
Ошибка цепей самонастройки может быть
также получена при сравнении текущих
координат эталонной модели yм (t ) и сис-
темы y (t ) . В отличие от предыдущей сис-
темы, где ошибки цепей самонастройки об-
разуются при сравнении параметров, в дан-
486
ном случае сравниваются текущие значения выходных переменных модели и системы.
Рассмотрим еще один способ стабилизации динамических характеристик системы реали-
зуемый путем введения глубокой отрицательной обратной связи. Структурная схема СНС
для этого случая представлена на рис.4.42, а. Передаточную функцию системы после не-
сложных структурных преобразований (рис.4.42, б) получим в виде
Wy ( p )W0 ( p)
W ( p) = [1 + kWм ( p)] , (4.117)
1 + kWy ( p )W0 ( p)

где W0 ( p), Wy ( p), Wм ( p ) – передаточные функции соответственно объекта управления,


управляющего устройства и эталонной модели; k – коэффициент усиления цепи обратной
связи.
Нетрудно убедиться, что при k → ∞ правая часть выражения (4.117) стремится к Wм ( p) . В
пределе
W ( p ) = Wм ( p ) . (4.118)
В реальных системах величина k ограничивается условиями устойчивости системы и ра-
венство (4.118) выполняется лишь приближенно.
Контуры самонастройки по замкнутому циклу в значительной степени устраняют недос-
татки разомкнутых аналитических СНС: необходимость достаточно точной реализации
вычислительного алгоритма; зависимость критерия самонастройки от методических по-
грешностей, допущенных при определении этого алгоритма; нарушение исходных пред-
посылок в постановке задачи и т.п.
При синтезе цепей самонастройки по замкнутому циклу необходимо выделить изменяе-
мые (настраиваемые) параметры bi , сформулировать критерий самонастройки Qс , кото-
рый должен зависеть от bi , выбрать метод поиска экстремума Qс и лишь затем переходить
к определению алгоритма функционирования СНС.
Пример 4.16. Пусть имеем СНС, у которой ошибка цепей самонастройки вырабатывается
на основе сравнения выходных координат эталонной модели yм (t ) и системы y (t )
(рис.4.43). Допустим также, что выполняются условия квазистационарности, и поэтому
объект (неизменяемая часть системы), управляющее устройство (изменяемая часть) и эта-
лонную модель можно описывать передаточными функциями W0 ( p ), W y ( p ) и Wм ( p) . Тре-
буется синтезировать корректирующее устройство, состоящее из цепей самонастройки
параметров bi и работающее по замкнутому циклу.
Решение. В качестве критерия эффективности самонастройки примем точность работы
системы
Q(t ) = ε 2 (t ) → min , (4.119)
где ε(t ) = yм (t ) − y (t ) – величина отклонения текущего значения выходной координаты y (t )
от желаемого значения yм (t ) .
Для реализации цели управления (4.119) применим градиентный метод, полагая, что кри-
терий Q является функцией изменяемых параметров bi и существуют такие значения bi* ,
при котором Q имеет неизвест- yм(t)
ный экстремум. Алгоритм поис- Wм(t)
3
ка bi* основан на необходимом
∂y / ∂bi ε(р)
условии экстремума функции: в W1(р)
точке экстремума частные про-
∂Q
изводные должны быть рав- 1 W2(р)
∂bi
bi 2
КУ
u (t)
Wy(р) W0(р) 487
y(t)

Рис.4.43
ны нулю ( grad Q = 0 ). Если это не так, то значение bi должно изменяться до тех пор, пока
∂Q
условие = 0 не будет выполнено. В простейшем случае уравнение, определяющее из-
∂bi
менение настраиваемого параметра во времени, может быть записано в виде
dbi ∂Q(bi , t )
=k , (4.120)
dt ∂bi

где k – коэффициент пропорциональности, k > 0 при Q* = max и k < 0 при Q* = min .


Запишем передаточную функцию основного контура системы:

Wy ( p )W0 ( p)
W ( p) = . (4.121)
1 + Wy ( p)W0 ( p)
Тогда
y (t ) = L−1{W ( p)U ( p)} . (4.122)

Имея в виду, что Wy ( p), y (t ) и ε(t ) зависят также от величин настраиваемых параметров
bi , и учтя (4.119), найдем

∂Q(bi , t ) ∂ε 2 (bi , t ) ∂[ yм (t ) − y (bi , t )]2 ∂y (bi , t )


= = = −2ε(bi , t ) . (4.123)
∂bi ∂bi ∂bi ∂bi

Взяв частную производную по bi от (4.122), запишем

∂y (bi , t ) ⎧ ∂W ( p, bi ) ⎫
= L−1 ⎨ U ( p)⎬ . (4.124)
∂bi ⎩ ∂bi ⎭
Воспользовавшись (4.121), получим
∂W ( p, bi ) W0 ( p ) ∂W y ( p, bi )
Wb′i ( p, bi ) = = . (4.125)
∂bi [1 + W y ( p, bi )W0 ( p )]2
∂bi

Подставив (4.123) в (4.120), при k < 0 имеем


dbi ∂y (bi , t )
= 2kε (bi , t ) . (4.126)
dt ∂bi
Выражение (4.126) с учетом (4.124) и (4.125) описывает алгоритм самонастройки системы
и позволяет выбрать структуру корректирующего устройства.
В схеме СНС (рис.4.43) вычислитель 1 корректирующего устройства КУ имеет структуру,
соответствующую передаточной функции, определяемой выражением (4.125):
W1 ( p) = Wb′i ( p ) , а блок 2 и блок умножения 3 функционируют согласно (4.126). Так как иде-
альное значение параметра bi – медленно меняющаяся функция времени, то исполнитель-
ные элементы 2 корректирующего устройства выбраны здесь в качестве интеграторов с
W2 ( p ) = 2k / p . Чем больше коэффициенты передачи исполнительных элементов k , тем
выше скорость самонастройки. Значение k ограничивается скоростью изменения парамет-
ров bi , при которой нарушаются условия квазистационарности, положенные в основу син-
теза контура самонастройки.
***

488
При наличии в системе существенных случайных помех f (t ) для нахождения экстремума
целевой функции Q применяют помехозащищенные алгоритмы поиска, в частности, ал-
горитм стохастической аппроксимации. При этом термин аппроксимация означает, что
параметры bi находят приближенно. Как и в методе градиента, условием экстремума це-
левой функции Q будет grad Q(bi ) = 0 , но так как Q(bi ) определяется в обстановке помех,
то значению bi = bi* должно соответствовать условие M {grad Q} = 0 , где M – математиче-
ское ожидание.
Идея этого метода может быть проиллюстрирована на простейшем примере вычисления
какой-либо величины z с помощью реального прибора, имеющего погрешность. Пусть z*
– истинное значение измеряемой величины, zi – последовательность измеренных значений
величины z , fi – ошибка измерения (аддитивная помеха). Тогда zi = z* + fi и задача стохас-
[ ]
тической аппроксимации формулируется в виде M z − z * = 0 . Известно, что наилучшим
1 n
приближением к величине z * является среднее арифметическое n измерений: zn* = ∑ zi .
n i =1
Перепишем это выражение в виде

n − 1 ⎛ 1 n −1 ⎞ 1 n −1 * 1
z n* = ⎜ ∑ zi ⎟ + z n =
n ⎝ n − 1 i =1 ⎠ n n
z n −1 + z n ,
n
(4.127)

где zn = zn* + f n .
Из (4.127) видно, что предыдущая оценка измеряемой величины zn* −1 входит в оценку zn* с
весом (n − 1) / n , а новое измеренное значение zn имеет вес 1 / n , т.е. с ростом числа измере-
ний влияние новой информации уменьшается. Это основная идея, которой руководству-
ются при работе системы в условиях помех: чем больше накоплено данных, тем меньшие
изменения в окончательный результат должны вносить новые измерения. С учетом ска-
занного уравнение, определяющее скорость изменения настраиваемого параметра, можно
записать в виде

dbi ⎡ ∂Q(bi , t ) ⎤
= k (t ) ⎢ + f (t )⎥ . (4.128)
dt ⎣ ∂bi ⎦
Выражение (4.128) носит название алгоритма стохастической аппроксимации и отличает-
ся от детерминированного градиентного алгоритма (4.120) только тем, что коэффициент
k должен быть убывающей функцией времени (например, k (t ) = 1 / t при t ≥ 1 ). Это приво-
дит к тому, что с течением времени, т.е. с приближением к точке экстремума, скорость
изменения параметра bi уменьшается даже при наличии существенного уровня помех.
Можно показать, что при t → ∞ алгоритм (4.128) с вероятностью p = 1 обеспечивает дви-
жение bi к bi* . Для контроля дрейфа статической характеристики Q(bi ) после достижения
экстремума производят непрерывное (или дискретное) измерение частных производных
∂Q
, естественно, с помехами. При существенном их значении, превышающем зону не-
∂bi
чувствительности, вновь начинается поиск экстремума функции Q(bi ) и т.д.

11.2.2. Идентификация динамических звеньев системы

Дальнейшее совершенствование самонастраивающихся систем может быть осуществлено


за счет определения математической модели объекта в процессе его функционирования.
Эта процедура носит название идентификации (от лат. – отождествлять), под которой по-

489
нимают установление соответствия распознаваемого предмета (объекта) своему образу
(математическому описанию). Совершенным средством получения уравнений статики яв-
ляются экспериментальные методы, основанные на обработке опытных данных (напри-
мер, по методу наименьших квадратов), собранных непосредственно на действующем
объекте. Динамические свойства линейного объекта, описываемые временными или час-
тотными характеристиками, определяются также по экспериментальным данным.
Принципиально наиболее простой является идентификация объекта, основанная на физи-
ческой сущности частотного метода. Известно, что при подаче на вход линейного объ-
екта гармонических воздействий, представленных рядом
n
x(t ) = ∑ Bк sin кω t , (4.129)
к =1
на выходе формируется сигнал y (t ) , который можно представить аналогичным рядом
n
y (t ) = ∑ Bк A(кω ) sin[кω t − ϕ (кω )] . (4.130)
к =1

Здесь Bк – коэффициенты гармонического ряда; A(кω ) , ϕ (кω ) – значения амплитудной и


фазовой частотных характеристик объекта на частоте кω , где ω – частота первой гармо-
ники.
Экспериментальное определение A(кω ) , ϕ (кω ) производят следующим образом. На вход
исследуемого объекта подают гармонические колебания x(t ) = Bк sin кω t , а на выходе
объекта измеряют частоту и фазу колебаний выходной переменной y (t ) . Тогда, как сле-
дует из (4.129) и (4.130), отношение амплитуды выходного сигнала к входному определяет
значение амплитудно-частотной характеристики A(кω ) для данной частоты кω , а фазо-
вый сдвиг – значение фазы ϕ (кω ) . Полученные значения амплитуд и фаз для различных
частот входного сигнала позволяют построить частотную характеристику объекта
W ( jω ) = A(кω )e jϕ ( кω )
Применение рассмотренного метода в условиях нормальной эксплуатации весьма ограни-
чено, так как подаваемые на вход гармонические сигналы могут привести к недопустимым режи-
мам работы установки. Кроме того, чтобы исключить переходные составляющие реакции объекта
на пробные сигналы, время наблюдения должно быть значительным, что увеличивает время экс-
перимента.
Использовав богатые по спектральному составу пробные сигналы типа ступенчатой или
импульсной функции, можно резко сократить длительность эксперимента. Наиболее простой ме-
тод состоит в том, что на вход объекта подается импульсное возмущение достаточно малой про-
должительности. Этот сигнал рассматривается как δ -функция (с точностью до постоянного мно-
жителя α ). Тогда, воспользовавшись интегралом свертки
t
y (t ) = ∫ x(t − θ ) w(θ )dθ , (4.131)
0
можно записать
t
y (t ) = ∫ αδ (t − θ ) w(θ )dθ = αw(t ) ,
0

где w(t ) – искомая весовая функция.


Вместо импульса на вход объекта можно подавать ступенчатый сигнал x(t ) = α ⋅ 1(t ) , ре-
акция на который с точностью до постоянного множителя α является переходной функцией h(t ) .
Заметим, что перед проведением эксперимента по определению временных характеристик
объект на время эксперимента следует как можно тщательнее изолировать от различных возмуще-
ний, а перед началом каждого опыта необходимо обеспечить установившийся режим. Экспери-
мент может считаться успешно законченным, если в объекте реализуется новый установившийся
режим, который в зависимости от особенностей конкретных динамических свойств объекта харак-
теризуется постоянством значения выходной величины либо постоянством ее производных. Визу-

490
альный анализ полученных временных характеристик обычно позволяет в первом приближении
найти форму записи дифференциального уравнения объекта. Например, наличие колебательной
составляющей во временной функции свидетельствует о том, что характеристическое уравнение
имеет, по крайней мере, два комплексных корня, а если после окончания переходного процесса
скорость изменения выходной величины отлична от нуля, то объект обладает интегрирующими
свойствами.
Весовая функция w(t ) в принципе может быть найдена и при произвольных сигналах на
входе и выходе объекта. Тогда задача сводится к решению интегрального уравнения вида (4.131).
Однако при наличии шумов это выражение малопригодно для определения функции веса, так как
основанные на нем методы вычисления w(t ) не удовлетворяют условиям помехоустойчивости.
Действительно, пусть к объекту приложено не только входное воздействие x(t ) , но и по-
меха f (t ) . Тогда, воспользовавшись (4.131) и используя принцип суперпозиции, имеем
t t
y (t ) = ∫ x(t − θ ) w x (θ )dθ + ∫ f (t − θ ) w f (θ )dθ . (4.132)
0 0

Здесь wx (θ ) и w f (θ ) – весовые функции объекта по отношению к сигналам x(t ) и f (t )


соответственно.
Определить w x (t ) из выражения (4.132) практически невозможно, поскольку второй член
в правой части этого выражения является источником погрешности, оценка которой неизвестна.
Указанного недостатка лишены статистические методы определения весовой функции,
основанные на решении интегрального уравнения Винера – Хопфа (4.93):

Ryx (τ ) = ∫ Rx (τ − θ ) w(θ )dθ . (4.133)
0

Такие методы позволяют по корреляционной функции сигнала на входе R x (τ ) и взаимной


корреляционной функции между выходным и входным сигналом R yx (τ ) найти весовую функцию
w(t ) . В данном случае при любом количестве помех, некоррелированных с входным сигналом
x(t ) , уравнение (4.133) остается справедливым. Действительно, если умножить обе части выра-
жения (4.132) на x(t − θ ) , а затем усреднить их на всем интервале наблюдения и учесть, что вто-
рое слагаемое будет после этой операции будет содержать взаимную корреляционную функцию
некоррелированных сигналов x(t ) и f (t ) , равную нулю, то в конечном итоге получим выражение
(4.133).
Решение уравнения (4.133) обычно сводится к решению системы алгебраических уравне-
ний, формируемых путем замены интеграла суммой и выделения дискретных значений подынте-
грального выражения в моменты времени τ μ = μΔ . Здесь μ = 0, n , где n = T / Δ ; T – интервал
наблюдения; Δ – интервал дискретности*). Эта система n + 1 уравнений имеет вид
n
Ryx ( μ ) ≈ ∑ w(i ) Rx ( μ − i ) . (4.134)
i =0
Неизвестными являются дискретные значения w(i ) импульсной переходной характери-
стики w(t ) . Вычислительные алгоритмы для решения системы уравнений высокого порядка вида
(4.134) достаточно разработаны и могут быть реализованы с помощью современных компьютер-
ных технологий. Аналитическое решение функции w(t ) может быть найдено путем обработки
дискретных значений w(i ) , например, по методу наименьших квадратов.

*)
Величину Δ обычно выбирают исходя из теоремы Котельникова, согласно которой всякая непрерывная
функция с частотным спектром, ограниченным значением ω макс , может быть восстановлена по ее дискретным значе-
ниям, взятым через интервал аргумента, равный Δ = π / ω max

491
Определение весовой функции значительно упрощается, если на вход объекта подать ис-
кусственный сигнал типа белого шума, корреляционная функция которого имеет вид
R x (τ ) = Nδ (τ ) . Подставив это выражение в уравнение (4.133), запишем

R yx (τ ) = ∫ Nδ (τ − θ ) w(θ )dθ = Nw(τ ) .
0
Из приведенного соотношения следует, что при подаче на вход объекта сигнала типа бело-
го шума функция веса w(t ) с точностью до постоянного множителя совпадает со взаимной корре-
ляционной функцией R yx (τ ) .
Если корреляционные функции заданы в виде аналитических выражений, то можно вос-
пользоваться соотношением (4.94)
S yx (ω ) = W ( jω ) S x (ω ) . (4.135)

Здесь S yx (ω ) = ∫R
−∞
yx (τ )e − jωτ dτ – взаимная спектральная плотность между выходным и

∫ w(t )e
− jωτ
входным сигналами; W ( jω ) = dt – частотная характеристика объекта;
−∞

S x (ω ) = ∫R
−∞
x (τ )e − jωτ dτ – спектральная плотность входного сигнала.

Как вытекает из уравнения (4.135), для определения W ( jω ) = P(ω ) + jQ (ω ) по извест-


ным S x (ω ) , S yx (ω ) нужно воспользоваться следующими соотношениями:

P (ω ) =
[
Re S yx (ω ) ]; Q(ω ) =
[
Im S yx (ω ) ].
S x (ω ) S x (ω )
Из всех рассмотренных методов идентификации объектов исследования наиболее распро-
страненными в силу простоты реализации являются методы определения временных характери-
стик h(t ) и w(t ) . Однако, когда активное вмешательство (подача импульсного и единичного
входного сигнала) в ход процесса невозможно или недопустимо, привлекают статистические ме-
тоды, базирующиеся на решении интегрального уравнения (4.133). При этом необходимой и дос-
таточной информацией для определения весовой функции объекта w(t ) является знание корреля-
ционных функций R x (τ ) и R yx (τ ) .
Остановимся еще на одном вопросе. Оптимизация динамического состояния системы при
полной идентификации объекта неизбежно приводит к затягиванию процесса самонастройки. По-
этому для повышения быстродействия стремятся использовать частичную информацию, которая,
несмотря на свою неполноту, дает достаточное представление об изменении динамики системы.
Методы определения таких частичных характеристик получили название методов косвенной
идентификации. Известны, например, методы косвенной оценки коэффициента демпфирования ξ
через частоту колебаний ω . В частности для затухающих колебательных процессов можно ис-
1
пользовать зависимость ω = 1 − ξ 2 , причем частоту ω можно подсчитывать через число пе-
T
ремен знака весовой функции за определенный постоянный интервал времени Δt (рис. 4.44). Ин-
тервал Δt подбирается так, чтобы при заданном значении коэффициента демпфирования ξ в него
укладывался бы один период колебаний, что соответствует двум переменам знака весовой функ-
ции.

Уменьшение или увеличение числа перемен знака приводит в действие управляющее уст-
ройство, которое подстраивает те или иные параметры системы (обычно коэффициент усиления)
таким образом, чтобы восстановить две перемены знака за время Δt .

492
Более эффективным с точки зрения быстродействия является способ оценки ξ с помощью
подсчета числа переходов через уровни Δy выходного сигнала y (t ) за заданный интервал време-
ни Δt1 (рис. 4.44).
В качестве косвенной оценки динамических свойств системы может также служить вели-
чина амплитуды автоколебаний на выходе системы, зависящая от коэффициента усиления ра-
зомкнутой системы. Отклонение амплитуды от заданного значения служит сигналом рассогласо-
вания, который обрабатывается системой.
Как уже упоминалось во многих случаях, для нормального функционирования самона-
страивающихся систем необходимо знание характеристики внешних воздействий. Так
как эти воздействия, поступающие на вход системы, обычно являются заранее непредска-
зуемыми функциями времени, то для возможности самонастройки в таких условиях необ-
ходимо выполнение условия квазистационарности характеристик воздействия, т. е. эти
характеристики должны изменяться незначительно за время, необходимое для их вычис-
ления.
Анализ характеристик внешних воздействий обычно производится на основе одного из
двух предположений.
1. Это воздействие может рассматриваться как заданная аналитическим выражением
функция времени. Например, если внешнее воздействие x(t ) аппроксимируется полино-
мом m-го порядка вида
m
x(t ) = ∑ ai t n ,
n =1
то в системе должны быть предусмотрены устройства автоматического определения ко-
эффициентов полинома ai . Обычно эти коэффициенты подбираются по методу наимень-
ших квадратов.
2. Внешнее воздействие является случайной функцией времени с определенными стати-
стическими характеристиками: корреляционной функцией, спектральной плотностью и
др., которые в подавляющем большинстве случаев находятся путем обработке экспери-
ментально полученных реализаций, в частности, по методике рассмотренными в примерах
4.9 и 4.12.
В заключение подчеркнем, что знание текущих статических и динамических свойств объ-
екта управления позволяет внести необходимые коррективы в эталонную модель и более
обоснованно решать задачи первичной и вторичной оптимизации.

493
11.3 ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
К интеллектуальным системам относятся системы, способные к «пониманию» пове-
дения объектов управления, работающих в изменяющихся условиях. Главным отличитель-
ным признаком интеллектуальных систем является использование современных информа-
ционных технологий для получения, хранения и системной обработки знаний с целью реа-
лизации своих функций при управлении сложными объектами. Характерными особенно-
стями сложных объектов управления, в частности, являются: отсутствие математической
модели, связывающей входные и выходные переменные объекта; нестационарность, стохас-
тичность и распределенность параметров.
Интеллектуальные системы управления (ИСУ) технологическими объектами долж-
ны обладать, помимо способности к обучению и адаптации, умением эффективно функцио-
нировать в составе человеко-машинных систем с гибкой структурой и иметь высокую ус-
тойчивость к повреждениям и неполадкам, т. е. обладать так называемой живучестью. В
известной мере к этим системам можно отнести самонастраивающиеся системы, корректи-
рующие устройства которых можно рассматривать как структуру, выполняющую роль
«учителя» управляющего устройства, включенного в основной контур (рис. 4.38). Ещё с
большей уверенностью к интеллектуальным системам можно отнести самоорганизующиеся
и обучающие системы, обладающие большой изменчивостью основных характеристик. Рас-
смотрим принципы построения этих систем.
11.3.1. Самоорганизующиеся системы
По своей первоначальной структуре самоорганизующаяся система может представ-
лять набор элементов, связанных случайным образом. В дальнейшем при внешних возмуще-
ниях в них образуются устойчивые отрицательные и положительные обратные связи, подобно
тому, как в природе происходит приспособление живых организмов к различным внешним ус-
ловиям.
Классическим примером технического устройства, имитирующего адаптационные
свойства живых организмов, служит гомеостат Эшби. Он представляет собой совокуп-
ность четырех одинаковых блоков Б1 – Б4 (рис.4.45), каждый из которых содержит под-
вижный электромагнит, поворачивающийся под действием токов, протекающих по его
четырем обмоткам. Угол поворота каждого из электромагнитов от некоторого нулевого
положения является выходной координатой z i соответствующего блока. На магнитах же-
стко закреплены указательные стрелки, которые одновременно являются движками по-
тенциометров, что позволяет преобразовывать механические перемещения магнитов в
электрический сигнал. Каждый из полученных электрических сигналов передается на об-
мотки остальных трех магнитов через потенциометры с коэффициентами передачи aij так,
что передаваемый сигнал может изменяться по величине и по знаку. Кроме того, каждый
блок имеет цепь собственной обратной связи, коэффициент передачи aii которой также
может меняться по величине и знаку. Таким образом, гомеостат характеризуется наличи-
ем всех возможных связей между блоками. Поведение а11 а22
такой системы можно представить уравнениями:
а21
z&1 = a11 z1 + a12 z 2 + a13 z 3 + a14 z 4 ; Б1
а12
Б2

z& 2 = a 21 z1 + a 22 z 2 + a 23 z 3 + a 24 z 4 ;
а24 а31
z&3 = a31 z1 + a32 z 2 + a33 z 3 + a34 z 4 ; а41 а32
а14 а23
а13 а42
z& 4 = a 41 z1 + a 42 z 2 + a 43 z 3 + a 44 z 4 .

Б4 а43 Б3
а34

494
а44 а33

Рис.4.45
Здесь коэффициенты aij определяют долю выходного сигнала j-го блока, передаваемого на
вход i-го блока, причем aij ≤ 1 .
Цель работы гомеостата заключается в автоматическом поиске устойчивого со-
стояния, т.е. такого положения подвижных электромагнитов, при котором ни одна из свя-
занных с ним стрелок не достигает крайнего положения. При нарушении устойчивости по
любой причине (изменение параметров системы и даже обрыв какой-нибудь цепи) вклю-
чается устройство управления, которое изменяет коэффициенты передачи aij до тех пор,
пока не будет найдена такая их комбинация, при которой ни одна из подвижных систем не
будет достигать своих крайних положений. Заметим, что при aij = 0 изменяется также
структура системы.
Гомеостат Эшби имеет ряд принципиальных особенностей, которые существенно
отличают его от других систем. В первую очередь, следует отметить избыточность струк-
туры гомеостата, достигаемую за счет того, что каждый из настраиваемых коэффициентов
aij может принимать несколько значений и общее количество всех возможных комбина-
ций коэффициентов достигает четырёхсот тысяч. Исследования гомеостатических систем,
проведенные Эшби, позволили ему сформулировать так называемый закон необходимого
разнообразия, который гласит, что разнообразие состояний управляющей системы должно
быть не меньше разнообразия состояний управляемого объекта. Иными словами, размер-
ность множества состояний объекта должна быть меньше размерности множества состоя-
ний устройства управления. Только в этом случае самоорганизация системы может при-
вести к желаемому результату. Закон необходимого разнообразия указывает общую тен-
денцию решения задачи так же, как, например, утверждение, что сложные задачи просто
не решаются или сложные объекты требуют сложного управления и т.п.
Другая важная особенность гомеостата состоит в случайном характере поиска ус-
тойчивого состояния. Скачкообразное изменение автоматически настраиваемых коэффи-
циентов aij осуществляется до тех пор, пока не будет достигнута устойчивость рассмат-
риваемой системы. Случайный поиск придает гомеостату важнейшее свойство – способ-
ность целенаправленно добиваться нужного результата при отсутствии априорной инфор-
мации о свойствах системы и условиях ее работы. Поскольку целью в данном случае яв-
ляется отыскание устойчивых состояний, то свойство целенаправленного поведения сис-
темы назвали ультраустойчивостью.
Экспериментальные исследования, проведенные на моделях, подтвердили универ-
сальность и исключительно высокую надежность (живучесть) гомеостатических систем.
Например, гомеостат Эшби находил устойчивое состояние и при различных дополнитель-
ных условиях, не предусмотренных при его конструировании. В частности, устойчивое
состояние было найдено при жестком соединении двух подвижных магнитов друг с дру-
гом, т.е. при изменении первоначальной структуры системы.
Гомеостатические системы были применены для автоматизации процессов конст-
руирования автоматических систем управления. Как правило, часть структуры и парамет-
ров проектируемой системы строго детерминирована и не подлежит изменению (напри-
мер, характеристика объекта управления, исполнительного двигателя и т.п.). Поэтому за-
дача проектировщика сводится к синтезу стабилизирующих и корректирующих уст-
ройств, которые в совокупности с детерминированной частью системы должны обеспе-
чить заданные статические и динамические свойства. Задача определения передаточной
функции стабилизирующих и корректирующих звеньев может быть решена компьютер-
ным методом с помощью гомеостатической системы, автоматически подбирающей пара-
метры этих звеньев в соответствии с поставленными требованиями.

495
Пример 4.17. Определить передаточную функцию Wk ( p) корректирующего уст-
ройства, предназначенного для подавления автоколебаний в релейной системе, структур-
ная схема которой представлена на рис.4.46. Передаточные функции отдельных звеньев
системы заданы:
k1 k2 k3
W1 ( p ) = ; W2 ( p ) = ; W3 ( p ) = ,
T1 p + 1 T2 p + 1 T3 p + 1

где Т1 = Т2 = 1,0 с; Т3 = 0,1 с; k1 = k2 = k3 = 1.


Решение. Осуществим автоматический
синтез корректирующего устройства с помо-
щью модели простейшей гомеостатической
системы, состоящей из двух блоков и подклю-
ченной параллельно релейному элементу и зве-
ну с W1 ( p ) . На вход второго блока гомеостата
подается сигнал y1 (t ) , а выходной сигнал этого
же блока z 2 (t ) поступает на вход релейного
элемента. После включения гомеостата за пять циклов его работы (по 40 с. каждый) были
получены значения коэффициентов а11 = а12 = = а21 = а22 = –1.
Уравнение корректирующего устройства (гомеостата) в данном случае имеет вид
z&1 = − z1 − z 2 ; z& 2 = − z1 − z 2 + y1 ,
откуда передаточная функция по каналу y1 → z 2 будет
p +1
Wk ( p) = .
p ( p + 2) y 1

На рис.4.47 кривой 1 представлен переходный


процесс в нескорректированной релейной системе при
единичном ступенчатом изменении входного сигнала 2

u (t ) , а кривой 2 – переходный процесс в скорректиро- t


ванной системе при том же возмущении. Рис.4.47
11.3.2. Обучающиеся системы

Системы, предназначенные для целенаправленного совершенствования структуры и


алгоритмов действия на основе анализа накапливаемой в процессе функционирования ин-
формации, относятся к классу обучающихся автоматических систем.
Под обучением обычно понимают процесс выработки в некоторой системе той или
иной реакции на внешние сигналы путем многократного воздействия на систему и внеш-
ней корректировки. Внешняя корректировка, или, как ее часто называют, поощрение или
наказание, осуществляется обучающей системой, которой известна желаемая реакция на
определенное внешнее воздействие. Самообучение отличается от обучения отсутствием
внешней корректировки. Кроме того, в процессе функционирования такой системы могут
меняться и цели управления. Типичным представителем систем такого вида является че-
ловеко-машинная система, которая относится к классу сложных динамических образова-
ний, состоящих из взаимосвязанных элементов различной природы: человек, коллектив

496
людей, технические устройства и их комплексы, природные компоненты и т.п., и с разным
качеством связей: прямые, обратные, положительные, отрицательные, жесткие, гибкие и
др.
Обучение решению задач может осуществляться двумя существенно различными
методами. Первый состоит в сообщении обучаемому алгоритма решения задачи. Можно
считать, что человек, определяя структуру автомата или разрабатывая программу для
управляющей машины, обучает ее решению задачи указанным методом. К задачам этого
типа можно отнести задачи, например, отыскания наиболее эффективного алгоритма по-
иска экстремума показателя качества посредством перебора ряда заранее заданных алго-
ритмов и выбора того из них, который при данной ситуации дает максимальный эффект.
Этот метод бесполезен для задач, которые мы умеем решать интуитивно, хотя алго-
ритм решения нам неизвестен. Например, мы можем отличать женское лицо от мужского,
буквы, написанные разным почерком, и т.п. В этом случае эффективен второй метод, кото-
рый основан на обучении с помощью примеров. Типичным представителем систем, обу-
чающихся этим методом, являются системы распознавания образов. Заметим, что, усвоив
некоторое ограниченное число распознаваемых объектов, обучающаяся система приобрета-
ет способность правильно распознавать и новые объекты того же класса.
Рассмотрим некоторые принципы построения систем распознавания образов. На-
блюдаемую в данный момент ситуацию будем называть объектом. Группа различных объ-
ектов, характеризуемая определенной совокупностью признаков, свойственных объектам
только данной группы, называется образом. Так, если к признакам, по которым устанав-
ливается образ, отнесены черты человеческого лица, то образом для группы лиц может
быть женское или мужское лицо, лицо ребенка или взрослого, русского или грузина, но,
например, не образ группы лиц, живущих в данном доме.
Признаки, по которым устанавливается образ, называются информативными. По-
мимо информативных, любой объект имеет множество других признаков, не существен-
ных для опознания образа. Так, для выделения мужского лица не информативны цвет во-
лос, глаз и т.д., но для выделения лица блондинов, брюнетов и т.д. эти признаки информа-
тивны. Одна из основных трудностей при распознавании образов состоит в том, что очень
часто информативные признаки не могут быть полно и точно описаны на математическом,
логическом или каком-либо другом подобном языке, хотя известно, что они существуют,
так как наблюдатель достаточно уверенно и с малой вероятностью ошибки их обнаружи-
вает.
Распознавание образов при обучении показом основано на преобразовании данных
наблюдения над объектами в совокупности чисел и на обработке этих чисел по специаль-
ным алгоритмам. Для этих операций полезным оказывается понятие метрического про-
странства. Каждому признаку (не только информативному) можно приписать некоторое
число, не совпадающее с числами, приписанными другим признакам. Тогда всей совокуп-
ности N признаков объекта будет соответствовать совокупность чисел, которые можно
рассматривать как координаты некоторой точки в N-мерном пространстве признаков. Та-

497
ким образом, каждый объект в данном пространстве отображается точкой, а образ – сово-
купностью точек, обладающих общими информативными признаками. Если удалось вы-
полнить отображение признаков в пространстве так, что различным образам соответству-
ют непересекающиеся области, внутри которых точки расположены достаточно близко
друг к другу, и между этими областями могут быть проведены разделяющие их гиперпло-
скости, то решение задачи распознавания образа облегчается.
К сожалению, проблема построения пространств признаков, в которых гипотеза
разделимости образов поверхностями оказывается справедливой, не имеет общего реше-
ния. Во многих же задачах образы взаимно проникают друг в друга, делая невозможным
построение гиперповерхности. Но тем не менее на основе гипотезы разделимости удалось
построить алгоритмы для опознания букв, цифр и других символов.
Рассмотрим один из известных алгоритмов распознавания – пандемониум. Это од-
на из первых машин, построенных для распознавания образов. Согласно упрощенной схе-
ме пандемониума (рис.4.48), образ Ai характеризуется совокупностью величин
x = ( x1 , ..., x N ) в пространстве
х1 y1
признаков Х, воспринимае-
Д1 ВУ1 k1 мых системой датчиков Д
(рецепторов). Области, со-
ответствующие двум образ-
хi ам, могут оказаться разде-
yi
Дi ВУi ki S ленными сложной поверх-
Σ РБ ностью (рис.4.49, а), что за-
трудняет построение алго-
хN ритма распознавания. По-
yN этому предварительно
ДN ВУN kN
с помощью вычислитель-
k0
ных устройств ВУi ( i = 1, N )
производят построение
УУ
спрямляющего пространст-
Рис.4.48 ва Y , на которое отобража-
ется пространство призна-
ков Х. С этой целью вычислительные устройства вырабатывают некоторые функции со-
стояния датчиков yi = f i ( x1 , x2 , ... , x N ) , причем функции f i выбираются так, чтобы множе-
ство точек yi ∈ Y в пространстве Y , соответствующих одному образу, попало в область B1 ,
а соответствующих другому образу – в область B2 (рис.4.49, б), и между областями B1 и
B2 можно было бы провести разделяющую гиперплоскость
N
S = k0 + ∑ ki yi .
i =1
Если такая гиперплоскость существует и построена, то для любой точки B1 линей-
ная форма S будет иметь один знак, а для области B2 – противоположный. По этому зна-
ку можно судить, к какому из двух классов образов принадлежит показанный объект.
б Функция S образуется
а
путем суммирования выходов
х1 S y1
S усилителей с переменными ко-
А1 эффициентами усиления ki
B1 (рис. 4.48), а затем поступает в
А2
B2 решающий блок РБ, выявляю-
щий знак S и выдающий в со-
хi yi ответствии с этим знаком код
Рис.4.49 образа. Этапу распознавания

498
предшествует этап обучения, который заключается в том, что оператор показывает панде-
мониуму серию образов и контролирует правильность его ответов. Если пандемониум
ошибся, то оператор подает сигнал на управляющее устройство УУ. Число ошибок за не-
который промежуток Т представляет собой некоторую функцию F (k0 , k1 , ..., k N ) . Предпо-
лагается, что эта функция имеет минимум в пространстве K. Так как функция F заранее
неизвестна, то УУ осуществляет поиск ее экстремума, т.е. УУ, по существу, является мно-
гоканальной экстремальной системой.
Заметим, что пандемониум действует, исходя из того, что задача построения про-
странства признаков Х, в котором справедлива гипотеза разделимости образов, решена. На
практике, однако, воспринимаемые рецептором входные величины не вполне соответст-
вуют информативным признакам и, следовательно, не гарантируют выполнения гипотезы
разделимости.
Примером попыток преодоления этой трудности является построение в 1958 г. Ро-
зенблатом классифицирующей машины, названной им перцептрон (лат. – восприятие).
Перцептрон был задуман как модель восприятия изображений системой зрения живого
организма. Подобно тому, как зрительный образ воспринимается по элементам рецепто-
рами сетчатки глаза, в перцептроне восприятие объекта осуществляется группой элемен-
тов S, называемых также рецепторами (рис. 4.50). Каждый из рецепторов может находить-
ся в возбужденном либо невозбужденном состоянии. Для преобразования пространства
рецепторов в перцептрон введена группа ассоциативных элементов А. Так как для по-
строения разделяющих поверхностей требуемый закон преобразования неизвестен, то свя-
зи между рецепторами и А-элементами устанавливаются случайно. Каждый из рецепторов
может быть подключен к данному А-элементу или со знаком плюс (возбуждающая связь)
или со знаком минус (тормозящая связь) или вообще не подключен. А-элемент работает
как сумматор с порогом: он возбуждается, если сумма сигналов, поступающих к нему от
рецепторов, превысит некоторую величину. Выходы А-элементов через усилители У с пе-
ременными коэффициентами λ передаются в сумматор ∑ . Значения λ устанавливаются
в процессе обучения.
Разобьем все рецепторы на две группы – возбуждающую и тормозную в зависимо-
сти от знака связи с А-элементами. Если в первой группе l элементов, а во второй m , то в
некоторый дискретный момент времени n имеем:
l m
σ (n) = ∑ λ1i (n) x1i (n) − ∑ λ 2 j (n) x 2 j (n) = ∑1 −∑2 , (4.136)
i =1 j =1

где индексами 1i отмечены рецепторы первой группы, а индексами 2 j - второй.


Если ∑1 >∑2 ( σ > 0 ), то система относит изображение к одному образу (например, на вы-
ходе решающего блока РБ y1 = 1 , y 2 = 0 ), если ∑ <∑ , то – к другому ( y1 = 0 ,
1 2
y 2 = 1 ).
Этапу распознавания предшествует период обучения, который сводится к выбору
коэффициентов усиления λi ( j ) . Величины λ фиксируются на таких минимальных значе-
ниях, при которых для объектов данного образа разность (4.136) имеет требуемый знак и
величину. Это обеспечивает наиболее широкий охват объектов данного образа.
Перцептрон далеко не всегда в состоянии вырабатывать понятия или определения,
которые совпадают с представлениями оператора. Это вполне понятно: при построении
его конструктор, не зная точно, какой должна быть внутренняя структура машины
РБ и пыта-
ясь воспроизвести схему зрительного аппарата, хотя и она не была известна ему во всех
деталях, понадеялся на удачный случай (первоначальный выбор связей) и на то, что про-
цесс обучения в какой-то степени выправит ошибки.

499
Исследования показали, что возможности перцептрона весьма ограничены. Напри-
мер, при различении прямоугольников вытянутых а горизонтальном и вертикальном на-
правлениях, количество ошибок достигало 6%, при различении произвольно расположен-
ных окружностей и прямоугольников разных размеров – 33%, а при различении прямо-
угольников и эллипсов – 50%. Иными словами, первая задача решалась удовлетворитель-
но, вторая – плохо, а при решении третьей перцептрон практически не работал.
Рассмотренные распознающие устройства – пандемониумы и перцептроны отно-
сятся к классу специализированных систем, которые, вообще говоря, являются малоэф-
фективными. Однако, дальнейшее их развитие привело к созданию так называемых ней-
ронных сетей, которые решают подобные задачи значительно эффективнее.
Поиски эффективных способов обучения систем распознавания образов привели к
разработке целого ряда оригинальных методик, из которых особый интерес представляет
метод потенциальных функций. Здесь
при показе некоторой точки x , принад- F(х1, x2)
лежащей к образу X , компьютер строит II
I
поверхность, соответствующую некото-
рой функции F,
Для всех показанных точек, при-
надлежащих одному образу, строятся та-
кие функции и затем суммируются. В ре-
зультате для каждого из образов получа- х1
Образ 1 Образ 2
ют потенциальные поверности, каждая из
которых имеет вершину над областью,
принадлежащей соответствующему обра-
х2
зу. Геометрическая интерпретация по-
Рис.4.51
строения функций при двух признаках x1
и x2 иллюстрируется рис.4.51. При показе новой точки после сравнения значений ее по-
тенциальных функций, определяемых поверхностями I и II, точку относят к тому образу,
для которого значения потенциальной функции оказались большими. Заметим, что метод
потенциальных функций, предложенный в 60-х годах прошлого столетия, по существу яв-
ляется предшественником нечеткой логики, основные положения которой рассмотрены в
следующей главе.
Из изложенного выше следует, что распознавание образов представляет собой пер-
вую и важную ступень обработки информации, получаемой нами при помощи органов
чувств и приборов. Вначале мы распознаем предметы, затем – отношения между предме-

500
тами, а также между предметами и нами, т. е. ситуации. Наконец, мы распознаем измене-
ния этих ситуаций, т. е. явления. Именно это дает возможность обнаружить закономерно-
сти и прогнозировать на их основе дальнейший ход явлений и их развитие, что сущест-
венно облегчает задачу управления сложными системами.

11.3.3 Искусственные нейронные сети.


Под искусственными нейронными сетями подразумевают вычислительные структуры, со-
стоящие из большого количества однотипных элементов (нейронов), каждый из которых
выполняет относительно простые функции, а вся сложность и гибкость функционирова-
ния в основном определяется связями между нейронами. Такой подход, иногда называе-
мый коннекционизмом (англ. connection – связь), предполагает, что широкие возможности
систем связи компенсируют бедность выбора элементов, их малую надежность и возмож-
ность разрушения части сети. Процессы, происходящие в искусственных нейронных сетях
, иногда ассоциируют с процессами, происходящими в нервной системе живых организ-
мов, что и послужило причиной возникновения этого термина*.
Первые нейронные сети (НС) предназначались для решения задач классификации и распо-
знавания образов. Дальнейшее развитие НС позволило расширить область применения
нейросетевого подхода, в частности, он на-
чал применяться для решения задач управ-
ления. Здесь наиболее широкое распростра-
нение получали многослойные НС прямого
распространения (многослойные перцеп-
троны), в которых элементарным преобра-
зователем является искусственный нейрон,
представленный на рис.4.52. Математиче-
ское описание этого нейрона имеет вид:
n

s = ∑ γ i xi + b ⎪
i =1 ⎬,
y = F ( s) ⎪

(4.137)
где γ i - весовые коэффициенты; n - число входов в нейрон; b – постоянное смещение;
F (s ) - передаточная функция нейрона, иногда называемая функцией активации, в качест-
ве которой обычно используется так называемая сигмоидальная функция вида:
1
F (s) = . (4.138)
1 + e − as
Как вытекает из (4.138) выходная переменная нейрона лежит в пределах от 0 до 1 (при
−∞ < s < ∞ ), а сам нейрон обладает свойством усиливать слабые сигналы сильнее, чем
большие, так как последние соответствуют областям аргумента, где сигмоид F (s) имеет
пологий наклон. Это свойство предотвращает насыщение нейронов от больших сигналов.
Нейронная сеть состоит из ряда связанных между собой нейронов, обычно обра-
зующих несколько слоев. На рис.4.53 приведена простейшая двухслойная нейронная сеть.

*
По аналогии с функционированием живых организмов возник и термин «генетическое программирова-
ние», под которым понимают методику создания компьютерных программ для задач, алгоритм решения
которых априори неизвестен, например, для задачи нахождения глобального экстремума функции несколь-
ких переменных, к которой сводятся многие задачи синтеза АСУ.

501
Заметим, что нейроны входного слоя сети (синапсы), служащие лишь для размножения
сигналов, при определении числа слоев не учитываются.
Чтобы нейронная сеть могла решить поставленную задачу ее необходимо предварительно
обучить. Сущность обучения состоит в настройке весовых коэффициентов нейронов при
показе примеров из обучающей выборки. Эффективность использования нейронных сетей
устанавливается так называемыми теоремами о полноте, смысл которых сводится к тому,
что любая непрерывная функция на замкнутом неограниченном множестве может быть
приближенно выражена функциями, полученным нейронными сетями. Таким образом НС
являются универсальными аппроксиматорами.
Основным алгоритмом обучения
многослойных перцептронов
(МСП), используемых в системах
управления, является алгоритм об-
ратного распространения. При
этом НС обучается воспроизво-
дить зависимость, заданную набо-
( )
ром из N пар точек xi , yi ; i = 1, N ,
с минимизацией средней квадра-
тической ошибки:
σ 2 = ∑ ( yi − y pi )2
N

i =1
(4.139)
где y pi - выход НС при поступле-
нии на ее вход xi ( i = 1, N ), рас-
считанный в соответствии с при-
нятой активационной функцией нейрона, например, вида (4.138), при а = γ i .
Наиболее распространенным алгоритмом обучения, является алгоритм, реализующий гра-
диентный метод поиска минимума выражения (4.139). При этом оптимизируемыми пере-
менными являются весовые коэффициенты γ ijk – i-ый коэффициент j -го нейрона в k -ом
слое. Помимо градиентного метода разработан ряд более эффективных, в смысле быстро-
действия, алгоритмов поиска экстремума функции (4.139). Однако, все они предназначены
для поиска локального экстремума, в связи с чем, для увеличения вероятности нахожде-
ния глобального экстремума необходимо проводить обучение несколько раз с разными
начальными весами нейронов или пользоваться специальными алгоритмами, предназна-
ченными для решения задач глобальной оптимизации.
Кроме многослойных перцептронов в системах управления находят применение двух-
слойные радиальные нейронные сети (РНС), представляющие собой двухслойную ней-
ронную сеть. Первый слой этой сети состоит из так называемых радиальных нейронов,
описываемых соотношением:
⎛ x −cj ⎞
z j = ϕ⎜ ⎟, (4.140)
⎜ bj ⎟
⎝ ⎠
где z j - выходной сигнал j -го нейрона; x - входной сигнал сети, подаваемых на каждый
нейрон рассматриваемого слоя; b j , c j - постоянные параметры, которые могут настраи-
ваться в процессе обучения.
Часто в качестве функции (4.140) используется функция Гаусса.
s2

ϕ ( s) = e 2
. (4.141)

502
Второй слой РНС осуществляет преобразование выходных сигналов. В частности, если
выходной сигнал сети скалярная величина, то этот слой состоит из одного нейрона, осу-
ществляющего вычисление средневзвешенного значения выходных сигналов первого слоя
n N
zi = ∑ γ j z j ∑z j , (4.142)
i =1 i =1

где γ i – весовые коэффициенты, числовое значение которых получено в процессе обуче-


ния; n - число нейронов первого слоя; N - число элементов обучающей выборки.
Допустим, что обучающая выборка состоит из N -пар значений ( xi , y i ) . В простейшем
случае при обучении формируется радиальный слой из n = N нейронов с параметрами c j
(в соответствии с (4.140)), а параметры второго слоя γ i выбираются из условия соответст-
вия выходной величины НС z i заданному
значению y i с целью упрощения НС. Разра-
ботаны также алгоритмы обучения, в кото-
рых число радиальных нейронов уменьшено,
т.е. n < N .
Для реализации динамических операторов
преобразования сигнала в НС используется
элемент запаздывания (задержки) на r -
шагов, который обозначим υ − r . На рис.4.54
приведена возможная структура нейросете-
вого дискретного динамического оператора,
описываемого уравнением:
y i = ϕ ( xi , xi −1 ,...xi − m ; y i −1 , y i − 2 ,... y i −l )
(4.143)
где ϕ - функция, реализуемая многослойным
перцептроном (МСП).
Таким образом, использование в нейронных сетях элементов запаздывания υ − r позволяет
реализовать разнообразные динамические звенья устройства управления с произвольными
гладкими статическими характеристиками. в соответствии с выбранным алгоритмом
управления.
Рассмотрим некоторые системы с нейросетевым управлением.
1. Последовательная схема нейросетевого управления приведена на рис.4.55. Обученная
нейронная сеть (НС), на вход которой поступает информация о контролируемых возму-
щениях f , стремится воспроизвести обратную динамику объекта управления (ОУ). При
этом обеспечивается равенство задающего y * и выходного y сигналов системы управле-
ния, работающей по замкнутому циклу.
Обучение НС может производиться разными
способами. В частности, при обучении в про-
y
цессе функционирования системы НС на-
страивается таким образом, чтобы сигнал
ошибки Δ (рис.4.55, пунктирная линия) был
сведен к минимуму. Другой способ обучения
предполагает введение в систему дополни-
тельной нейронной сети НСэ (эмулято-
ра), которая выполняет имитационное
моделирование ОУ (рис.4.56). При этом
эмулятор может использоваться как для
определения математической модели

503
ОУ, так и для обучения управляющей НС.
2. Параллельная схема нейросетевого управления приведена на рис.4.57 (сплошные ли-
нии). В данном случае НС исполняет роль корректора выходного сигнала управляющего
устройства u y . При этом на вход ОУ подается скорректированный сигнал u = u y + u HC .
Обучение НС может производиться по схеме с обратной связью (рис.4.57, пунктирная ли-
ния). После завершения обу-
чения нейронная сеть прини-
мает участие в управлении
объектом вплоть до нового
цикла обучения.
3. Схема нейросетевого
управления с обратной связью
представлена на рис.4.58.
Здесь нейронная сеть выпол-
няет функцию управляющего
устройства в замкнутой сис-
теме. Достоинством этой системы является способность обес-
печивать высокое качество управления при нестационарности
ОУ.
Для обучения НС, функционирующих в замкнутых системах
могут быть применены системы с эмулятором.
Пример 4.18. Пусть объект управления представляет собой технологический аппарат,
производящий разделение исходного продукта на отдельные компоненты, различаемые по
определенному признаку. В частности, для разделения угольной мелочи на низкозольные
(концентрат) и высокозольные (отходы) конечные продукты обычно используется флота-
ционная машина, на вход которой поступает угольная пульпа*), характеризующаяся сле-
дующими контролируемыми переменными: производительностью Qп , концентрацией
твердого компонента Сп , зольностью исходного угля Aиd . Разделение угольных частиц на
концентрат и отходы происходит благодаря свойству одних частиц (концентрата) прили-
пать к воздушным пузырькам и всплывать на поверхность, а других (отходов) – оставать-
ся в воде. Этот процесс и называется флотацией. (англ. всплытие), на ход которого ре-
шающее влияние оказывают реагенты вспениватель и собиратель., добавляемые в пульпу.
Меняя расходы этих реагентов ( qв , qc ) можно управлять процессом разделения исходного
угля на концентрат и отходы. В качестве выходных переменных, характеризующих ко-
нечные продукты разделения. Обычно принимается зольность концентрата Aкd и отходов
Aоd .
Помимо перечисленных входных переменных ( Qп , Сп , Aиd ) на разделительный процесс
существенное влияние оказывает целый ряд параметров (например, фракционный и гра-
нулометрический составы исходного угля), учесть которые не представляется возмож-
ным. Это обуславливает индетерминизм объекта и делает создание достаточно точной его
математической модели. Практически неразрешимой задачей. Именно в этом случае эф-
фективно применение нейросетевых систем управления, например, использующих эмуля-
тор для выполнения имитационного моделирования объекта управления (рис.4.56). При
этом адекватность модели устанавливается по реализациям входных x(t ) и выходных
y (t ) переменных процесса. Реализуем имитационную модель объекта с помощью допол-
нительной нейронной сети (НСэ), используя данные промышленного эксперимента.

*)
Жидкость (вода) с находящимися в ней во взвешенном состоянии твердыми частицами (мелким углем разме-
ром до 0,5 мм).

504
Решение. Так как теоретическое обоснование выбора необходимых и достаточных
свойств нейронной сети при решении задачи управления конкретным объектом пока от-
сутствуют, что практически единственной возможностью получения результата является
испытание различных сетей и сравнения результатов моделирования. В ходе проведения
вычислительных экспериментов было исследовано около ста тысяч различных вариантов
конфигурации сети. В результате установлено, что наиболее точная модель получается
при реализации эмулятора трехслойной сетью с 5 входами ( Qп , Сп , Aиd , qв , qc ). При этом
количество перцептронов в первом слое равно восьми, во втором – пяти, в третьем – од-
ному. Каждый перцептрон реализует скалярную функцию векторного аргумента вида
(4.137) с функцией активации вида (1.138). Структурная схема сети приведена на рис.
4.59.

Рис. 4.59
Для обучения нейронной сети эмулятора (выбора значений весовых коэффициентов γ i ,
i = 1,5 ) лучшим оказался градиентный метод, использующий алгоритм обратного распро-
странения ошибки. В качестве последней была принята ошибка имеющихся эксперимен-
тальных данных.
Адекватность модели оценивалась параметрами регресии, определяющими наклон α и
смещение β линии регрессии в координатах эксперимент xэ - модель xм ( xм = α xэ + β ), а
также тесноту линейной связи, характеризуемую коэффициентом корреляции r . При точ-
ном совпадении выходов ( Aкd , Aоd ) эксперимента и модели значения параметров составля-
ют: α = 1 , β = 0 (рис. 4.60, пунктирная линия). В нашем случае были получены следую-
щие расчетные значения параметров регрессии: α = 0,94 , β = 0, 43 , r = 0,97 (рис.4.60,
сплошная линия), что указывает тесную связь выходами модели и объекта.
Таким образом малые изменения выходов объ-
екта адекватно отражаются в выходах нейрон-
ной сети, что яввляется доказательством ее вы-
сокого качества.
***

К недостаткам нейросетевых систем относятся:


1) остановка процесса обучения НС (нахожде-
ние оптимальных значений весовых коэффи-
циентов) в локальном минимуме критерия эф-
фективности, что приводит к необходимости
применения алгоритмов глобальной оптимиза-
ции, и, следовательно, к увеличению времени
обучения;
2) невозможность введения в нейронную сеть
априорной информации о системе, так как не-
обходимую информацию НС получают только

505
в процессе обучения; 3) отсутствие достаточно полной теоретической базы, позволяющей
обоснованно выбрать тип и структуру НС, что обуславливает необходимость применения
алгоритмов самоорганизации и, следовательно, к дополнительным затратам времени. От-
меченные недостатки в ряде случаев приводят к нежелательному увеличению времени
обучения. В связи с этим разработка компьютерных технологий, повышающих быстро-
действие нейросетевых управляющих устройств является актуальной задачей.
В качестве иллюстрации применения нейронных сетей для целей управления рассмотрим автома-
тическую систему управления ориентированием подвижного промышленного робота в простран-
стве. Подвижный робот используется для выполнения некоторых технологических операций в тех
местах, где по каким-то причинам не могут работать люди (высокие температуры, загазован-
ность, запыленность и т.п.). Робот перемещается на колесах, приводимых в движение электро-
двигателями, и имеет возможность поворачивать в любую сторону и разворачиваться на месте.
Для обеспечения перемещений робота по промышленному помещению он оборудован систе-
мой навигации, построенной на основе распознавания образов различных участков помеще-
ния. На теле робота установлено около двух де-
сятков лазерных датчиков, определяющих рас-
стояние до объектов на пути робота. Датчики
ориентированы в пространстве под углом 15° от-
носительно друг друга, охватывая угол примерно
в 270° относительно передней части робота.
Любое промышленное помещение, в котором
перемещается робот, может быть разделено на
ряд типовых объектов (рис.4.61): коридор (КО),
перекресток (ПР), Т-образный перекресток
(ТПР), левый поворот (ЛП), правый поворот (ПП), тупик (ТП), левый угол (ЛУ), правый
угол (ПУ). Для распознавания образов объектов промышленного помещения в системе нави-
гации робота используется трехслойная нейронная сеть. Первый слой (входной) ивторой
(внутренний) имеют количество нейронов, соответствующее числу датчиков на теле робота.
Третий (выходной) слой имеет число нейронов соответствующее числу образов, которые дол-
жен распознавать робот ( в нашем случае восемь).
Согласно схеме системы навигации робота (рис.4.62) сигналы с лазерных датчиков, ха-
рактеризующие расстояния до ближайших объектов, нормируются и подаются на входной
слой нейронной сети. Далее сигналы проходят по слоям сети, преобразуясь в соответствии
с функциями переключения нейронов. В результате на нейронах выходного слоя появляет-
ся некоторая комбинация сигналов, которая расшифровывается декодером, принимающим
решение об опознании полученного образа
того или иного объекта.
Описанная нейронная сеть обучается при по-
мощи специальных тестов, во время которых
производится сравнение выдаваемых нейрона-
ми комбинаций сигналов с требуемыми для
правильного распознавания образов. После того
как количество получаемых ошибок сводится к
минимуму, нейронная сеть готова к работе в со-
ставе системы навигации робота.
Центральная система управления робота,
имеющая задание на произведение каких-
либо действий в той или иной части промыш-
ленного помещения, на основании информа-
ции о местонахождении робота, получаемой
от системы навигации, принимает решение о
направлении движения и подает управляющие сигналы на электродвигатели колес робота.

506
В результате обеспечивается возможность перемещения робота по производственному по-
мещению без участия оператора, который только дает роботу задание на выполнение тех
или иных операций.

НЕЧЕТКИЕ СИСТЕМЫ УПРАВЛЕНИЯ

Традиционный подход к постановке и решению задач управления основывается на


предположении, что математическая модель объекта и цель управления этим объектом
известны и однозначно определяют алгоритм функционирования управляющего устрой-
ства. Однако, в силу принципа несовместимости, согласно которому сложность системы и
точность, с которой ее можно описать традиционными математическими методами, про-
тиворечат друг другу, построить адекватную модель удается далеко не всегда. В этом слу-
чае строгие и однозначные процедуры синтеза алгоритмов управления не применимы.
Именно поэтому возникла необходимость в разработке нового математического аппарата,
позволяющего решать задачи управления и принятия решений в обстановке, когда объект
и условия его функционирования недостаточно изучены, а модель объекта и цель управ-
ления слабо формализованы. Такой аппарат и был предложен американским математиком
Л. Заде, основы которого были сформулированы в статье “Fuzzy Sets” (1965 г.), название
которой на русский язык чаще всего переводят как нечеткие множества (fuzzy – англ. раз-
мытый, мутный). Теория нечетких множеств, возникшая на стыке классической теории
множеств и формальной логики, нашла практическое применение при построении слож-
ных систем управления.

ФОРМАЛЬНАЯ (ЧЕТКАЯ) ЛОГИКА


Введем некоторые определения.
Понятие – это результат отражения в сознании человека общих свойств (признаков),
группы предметов или явлений, которые существенно необходимы для определения рас-
сматриваемой группы. Суждение – это имеющее смысл языковое выражение или форма
мысли, в которой посредством понятий что-либо утверждается об определенном объекте.
Умозаключение – это вывод суждения из других суждений, называемых посылками. Про-
стейшим умозаключением является силлогизм. Силлогизм – это умозаключение, состоя-
щее из двух посылок (суждений) и вывода.
Пример 4.8 Рассмотрим следующий силлогизм.
1-я посылка: если А, то В;
2-я посылка: если В то С.
Определим содержание вывода.
Решение. Из первой посылки следует, что если есть множество А, то множество В есть в
любом случае. В свою очередь, если есть множество В, то и множество С также есть в любом слу-
чае. Отсюда следует вывод: если есть множество А, то имеет место и множество С.
Пусть конкретная форма рассматриваемого силлогизма имеет вид:
1-ая посылка : все студенты (А) являются отличниками (В);
2-ая посылка : все отличники (В) учатся в вузах (С);
Вывод: все студенты (А) учатся в вузах (С);
Формально этот силлогизм ничем не отличается от рассмотренного выше, но содержание
посылок неправильно (ложно), а вывод, полученный логически корректным путем правилен (в
других случаях может быть и неправилен). Следовательно, чтобы опровергнуть полученный вы-
вод, необходимо проанализировать посылки и, если они ложны, то нет необходимости проверять
правильность самого доказательства.
***
В 40-х годах XIX в. английский ученый Дж. Буль предложил каждому суждению в зависи-
мости от его содержания присвоить либо истинное значение, обозначив его цифрой 1, либо лож-
ное – 0, и в дальнейшем оперировать именно понятиями «истинно» и «ложно», отвлекаясь от

507
внутреннего содержания самого суждения. Функциональные построения, связанные с четкими
логическими операциями над суждениями, служат предметом булевой алгебры, базовыми логиче-
скими операциями которой являются:
1. Отрицание – это суждение С, которое истинно тогда и только тогда, когда посылка А

ложна (запись C = A читается так: «С равно не А»).


2. Конъюнкция двух суждений А и В - суждение С, которое истинно тогда и только тогда,
когда А и В истинны (запись А ∧ В, читается: «А и В»).
3. Дизъюнкция двух суждений А и В - суждение С, которое истинно в том случае, когда ис-
тинно хотя бы одно из этих суждений (запись А ∨ В, читается: «А или В»).
В булевой алгебре логические операции чаще всего описываются с помощью таблиц ис-
тинности, основные из которых представлены в табл. 4.1. В предпоследнем столбце таблицы при-
ведены значения логической функции, называемой импликацией (лат. – сплетение), которая пред-
ставляет собой суждение С, которое ложно тогда и только тогда, когда А истинно, а В ложно (за-
пись А → В, читается: «Если А, то В»). Последний столбец табл.4.1 свидетельствует о том, что эта
логическая операция может быть также выражена с помощью базовых операций «отрицание» и
«дизъюнкция».
Таблица 4.1
А B А А∧ В А∨ В А→ В А∨ В
0 0 1 0 0 1 1
0 1 1 0 1 1 1
0 0 0 0 1 0 0
1 1 0 1 1 1 1

НЕЧЕТКАЯ ЛОГИКА (ФАЗИ-ЛОГИКА)


Идея нечеткой логики заключалась в том, чтобы принадлежность элементов к тому или
иному множеству определять не в виде однозначных ответов типа «да» или «нет» (или логических
булевых переменных 1 и 0), а посредством ответов типа: «может быть», «вероятнее всего» и т. п.,
или с помощью коэффициентов истинности, которые могут принимать любые значения между 1 и
0. В частности, 30-летнего человека можно отнести и к молодым и к немолодым категориям (мно-
жествам) людей, полагая, например, что он относится с вероятностью 0,65 к молодым, а с вероят-
ностью 0,35 к немолодым. Такой подход к описанию множества элементов, безусловно, расплыв-
чат, но позволяет использовать строгие математические процедуры теории множеств для форма-
лизации качественных, словесно выраженных знаний о свойствах объекта и для составления чет-
кой процедуры получения умозаключений из нечетко заданных исходных условий. Этот подход
предоставил возможность математически оперировать такими часто встречающимися размытыми
характеристиками как, например, «очень много», «много», «немного», «мало», «очень мало».
Совокупность методов математического описания нечетких множеств и формализация по-
лучения логических выводов из таких же предпосылок и получила название нечеткой или фази-
логики.

12.2.2. Основные понятия нечеткой логики


К базовым понятиям фази-логики относятся «нечеткое множество» и «лингвистическая
переменная».
Известно, что классическая (четкая) теория множеств является разделом математики, изу-
чающим общие свойства множеств, понятие которых не определяется, а лишь поясняется на при-
мерах (множество книг на полке, множество точек на прямой и т. д.). То, что данный элемент x
принадлежит множеству Х записывают в виде х ∈ Х . Факт принадлежности элемента x к
множеству М, которое является подмножеством базисного множества Х , определяется с помо-
щью функции принадлежности - μ М ( х ) , которая для четких множеств принимает значения 1, ес-
ли элемент х принадлежит множеству М, и 0, если не принадлежит ему, т. е.

508
⎧1, ∀ х ∈ М
μМ ( х ) = ⎨ (4.144)
⎩0, ∀ х ∉ М .
Если под переменной x понимать, например, температуру воздуха, а под множеством М
отрицательные числа, то единичная ступенчатая функция будет характеризовать четкое множест-
во отрицательных температур М, которое условно можно назвать «мороз» и графически изобра-
зить в виде зависимости μ1 ( x) (рис.4.63).
Нечеткое множество, в отличие от четкого, ха-
рактеризуется непрерывной функцией принад-
лежности μ 2 ( x) , которая может принимать лю-
бые промежуточные значения от 0 до 1, отобра-
жая все значения базисного множества Х в этом
интервале и устанавливая каждому значению х
степень его принадлежности к нечеткому множе-
ству М, которое в общем случае может быть за-
писано в виде:
М = {[х, μ М ( х )] х ∈ Х }.
Для рассматриваемого случая множество М можно представить как нечеткое множество
температур в пределах [− 5, 5], которое можно назвать размытым термином «холод».
Функции принадлежности, характеризующие нечеткие множества, могут быть заданы
аналитически или графически и чаще всего носят нелинейный характер, но на практике
аппроксимируется кусочно-линейными зависимостями, основные из которых представле-
ны на рис.4.64.
Последняя функция принадлежности, описывающая четкое множество содержащее всего
одну пару: {х1 , μ М ( х1 )} , где μ М ( х1 ) = 1 , называется синглтоном.

Лингвистической переменной называют переменную, которая задана на количественной


шкале базисной переменной х и принимает значение в виде слов или словосочетаний.
Отдельные значения лингвистической переменной, называемые лингвистическим тер-
мом, задаются не в виде конкретного числа, а с помощью функций принадлежности. Дру-
гими словами каждому терму соответствует определенное нечеткое множество. Напри-
мер, если температура в жилом помещении характеризуется такими нечеткими понятиями
как: «холодно» – Х, «прохладно» - П, «норма» - Н, «тепло» - Т, «жарко» - Ж, то совокуп-
ность Мt этих пяти значений рассматривается как лингвистическая переменная, прини-
мающая эти значения. Эта переменная полностью определена, если заданы множество
термов и множество соответствующих функций принадлежности (Рис.4.65). Заметим, что
вместо абсолютных значений базисных переменных х часто используют их нормирован-
х − х0
ные значения xн . В нашем случае xн = , при x0 = 20 0 C .
2

509
12.2.2. Основные операции с нечеткими лингвистическими переменными
Для определения логических операций с лингвистическими переменными может быть ис-
пользована таблица истинности, описывающая операции над четкими логическими пере-
менными (табл. 4.1). Анализ данных этой таблицы позволяет записать следующие соот-
ношения для базовых четких логических операций и их схемные аналоги (рис.4.66).
1. Отрицание А = 1 − μ А ; μ А = {0, 1}. Здесь лампа Л
тухнет при включении реле размыкании контакта
А (рис.4.66,а).
б)
2. Конъюнкция А ∧ В = min{μ A , μ В } . Здесь лампа за-
горается при включении двух реле ( μ А = μ В = 1 ) и
одновременном замыкании двух контактов А и В в)
(рис.4.66,б).
3. Дизъюнкция, А ∨ В = max{μ A , μ B } . Здесь лампа
загорается при включении одного из двух реле или обоих вместе ( μ А = 1, μ В = 0 ;
μ А = 0, μ В = 1 , μ А = μ В = 1 ) и соответственно замыкания контакта А или В или
обоих вместе (рис.4.66,в).
По аналогии с рассмотренными четкими логическими операциями для нечеткой логики
можем записать:
1. Нечеткое отрицание (фази-дополнение) терма А в виде:
μ А ( х ) = 1 − μ А ( х ), х ∈ Х . (4.145)
Функции принадлежности термов А и
А могут иметь вид, представленный
на рис.4.67 сплошной и пунктирной
линиями соответственно.
2. Нечеткую конъюнкцию (фа-
зи-пересечение) двух лингвистиче-
ских термов А и В, заданных функ-
циями принадлежности μ А ( х ) и μ В ( х )
(рис.4.68), в виде нечеткого терма С, функция принадлежности которого определяется вы-
ражением:

510
μС ( х ) = μ А∧ В ( х ) = min {μ А ( х ) , μ В ( х )} , х ∈ Х . (4.146)

3. Нечеткую дизъюнкцию (фази-объединение) двух лингвистических термов А и В, задан-


ных функциями принадлежности μ А ( х ) и μ В ( х ) (Рис.4.69) в виде нечеткого терма С,
функция принадлежности которого определяется выражением:
μС ( х ) = μ А∨ В ( х ) = max{μ A ( x ), μ B ( x ) }, х ∈ Х . (4.147)

Заметим, что понятие нечетких операций может быть распространено и на случай не-
скольких исходных лингвистических термов.
Главной операцией нечеткой логики является процедура нечеткого вывода с помощью
которой из нечетких условий получают приближенное решение. Эта процедура основана
на операции импликации, используемой в четкой логике (табл.4.1) и образующей сложное
высказывание из двух высказываний посредством логической связки, соответствующей
союзу «ЕСЛИ …, ТО …». Из таблицы истинности вытекает, что А → В = А ∨ В . Учтя,
что А = 1 − А , получим: А → В = (1 − А) ∨ В .
Полученные выражения можно применить и для нечетких множеств, но при этом они
должны быть записаны в виде функций принадлежности: μ А→ В ( х ) = {[1 − μ A ( x )] ∨ μ B (x )} . Из
выражения (4.146) следует, что операция дизъюнкции соответствует правилу максимиза-
ции и, следовательно, имеем:
μ А→ В ( х ) = max{[1 − μ A (x )] ; μ B ( x )}. (4.148)
Из таблицы истинности 4.1 также вытекает, что если посылка А и сама импликация
А → В истинны, то и вывод В истинен. Эта логическая связь выражается с помощью пра-
вила замены, позволяющего перейти от истинной посылки А и истинного высказывания:
«ЕСЛИ…, ТО…» к истинному значению вывода В. При этом А рассматривается как малая
посылка, а высказывание А → В («ЕСЛИ А, ТО В») как большая.
Таким образом, логическая функция, описывающая правило замены, может быть пред-
ставлена в виде:
В = А ∧ ( А → В) = А ∧ ( А ∨ В) . (4.149)
Заметим, что функция истинности выражения (4.149) совпадает с четкой логической
конъюнкцией: А ∧ В (табл.4.1).
Пример 4.19. Пусть имеем следующие высказывания: А : ( х > 4 ) и В : ( х > 2 ) , где х – це-
лые, положительные нечетные числа. Найти значения х, при котором выход В истинен.
Решение. Объединим приведенные выражения их истинной импликацией:
«ЕСЛИ х > 4, ТО х > 2 ».
Используя выражение (4.149), можно убедиться в том, что для х =1 и х =3 истинность вы-
вода В : ( х > 2 ) равна нулю (то есть В ложно, так как ложно А), а для х ≥ 5 - единице (то

511
есть В истинно, так как А и А → В – истинны). Таким образом, правило замены (4.149)
устанавливает истинность вывода В лишь в случае истинности посылки А и импликации
( А → В ) . Поэтому, умозаключение, полученное с помощью правила (4.149) является бо-
лее осторожным, чем простая импликация А → В . В этом можно убедиться, сравнивая
функции истинности импликации ( А → В ) и конъюнкции ( А ∧ В ) (табл.4.1) и учтя, что
функции истинности конъюнкции и правила замены совпадают.
***
Изложенное выше позволяет сформулировать следующее правило четкого логического
вывода: функция истинности вывода В равна максимальному значению функции истин-
ности конъюнкции посылки А и импликации ( А → В ) . Тогда, учтя, что операция конъ-
юнкции соответствует правилу минимизации, можем записать:
μ В = max{μ А∧ А→ В } = max{min[μ А , μ А→ В ]}. (4.150)
А А
Распространение алгоритма логического четкого вывода (4.150), полученного для выска-
зывания А → В , на нечеткие множества сталкивается с определенными трудностями.
Сложность формализации словесного правила «ЕСЛИ …, ТО …» применительно к нечет-
ким множествам заключается в том, что множества А и В, фигурирующие в импликации,
определены для большинства случаев на разных базисных множествах. Например, в зада-
чах управления подмножество больших значений управляемой величины А может при-
надлежать базисному множеству Y всех значений этой величины, а подмножество малых
значений управляющего воздействия В – базисному множеству U всех значений этих
воздействий (Рис.4.70).

Четкое множество «ЕСЛИ …, ТО …» образуется из упорядоченных числовых пар или кор-


тежей (y, u), которые относятся к новому базисному множеству, называемому декартовым произ-
ведением Р множеств А и В: P = A × B . Это множество может быть использовано для описания
взаимосвязи между множествами А и В, элементы которого принадлежат разным базисным мно-
жествам. Эти взаимосвязи описывают с помощью так называемого отношения, которое представ-
ляет собой множество R , являющееся подмножеством P ( R ⊂ P) и образующееся по определен-
ному правилу R yu из элементов A и B . Пояс-
ним сказанное на примере.
Пример 4.20. Пусть заданны два четких
множества:
А = {y1 , y 2 } = {10, 20} ;
В = {u1 , u 2 , u 3 } = {10, 20, 30}, (4.151)
для которых в качестве правила служит четкое предписание:
Ryu = { y ≥ u} (4.152)
Требуется найти четкоетакое отношение между множествами A и B .
Решение. Воспользовавшись (4.151), составим новое множество Р:
Р = А × В = {( y1 , u1 ) , ( y1 , u 2 ) , ( y1 , u 3 ) , ( y 2 , u1 ) , ( y 2 , u 2 ) , ( y 2 , u 3 )} =
= {(10;10 ) , (10; 20 ) , (10; 30 ) , ( 20;10 ) , ( 20; 20 ) , ( 20; 30 )} .
В общем виде декартово произведение Р двух четких множеств А и В можно записать так:
{
Р = А × В = ( y, u ) y ∈ А, u ∈ В . }
Отношение R , удовлетворяющее неравенству (4.152) будет выглядеть следующим обра-
зом:
R = {(10;10 ), (20;10 ), (20; 20 )} .
Полученное отношение R можно представить в виде таблицы с соответствующими функ-
циями принадлежности μ R равными 0 или 1 (табл.4.2).
Таблица 4.2

512
В общем случае четкое отношение R между четкими множествами А и В может быть запи-
сано так:
{
R = ⎡⎣( y, u ) , μ R ( y, u ) ⎤⎦ y ∈ А, u ∈ В , }
где μ R ( y, u ) = {1, 0} - функция принадлежности пар ( y; u ) ∈ P = A × B к подмножеству R, обра-
зованному по определенному правилу R yu . В нашем случае Ryu = { y ≥ u} .
***
Между четкими множествами могут быть не только четкие, но и нечеткие отношения.
Например, нечеткое отношение (множество) пар реальных чисел ( y, u ) , которые приблизительно
равны между собой, можно представить с помощью следующей непрерывной функции принад-
лежности:
1
μ R ( y, u ) = .
1 + (y − u)
4

Эта функция может быть записана в виде:


⎧ μ R = 1, ∀ ( y − u ) = 0

⎨ μ R ≈ 1, ∀ ( y − u ) << 1

⎩ μ R ≈ 0, ∀ ( y − u ) >> 1.
В данном случае правило R yu имеет смысл «приблизительно равны».
Нечеткие отношения могут существовать и между нечеткими множествами. Напри-
{ } {
мер, между множествами: А = [ y, μ А ( y )] y ∈ Y и В = [u , μ В (u )] u ∈ U , нечеткое отношение }
(новое множество) имеет вид:
{
R = ⎡⎣( y, u ) , μ R ( y, u ) ⎤⎦ ( y, u ) ∈ P , } (4.153)
где μ R ( y; u ) - функция принадлежности, характеризующая одновременную принадлежность обоих
элементов y, u, образующих пары (y; u), к множеству Р.
Функцию принадлежности, входящую в выражение (4.153), можно определить по формуле
аналогичной фази-пересечению (4.146), т. е. с помощью процедуры минимизации.
μ R ( y, u ) = min{μ A ( y ), μ B (u )} (4.154)
A× B
Выражение (4.154), называемое оператором Мамдани является самой распространенной
процедурой для определения функции принадлежности μ R ( y, u ) .
Заметим, что существует несколько десятков правил, преследующих ту же цель, что и опе-
ратор Мамдани. Например, кроме оператора (4.154) находит также применение оператор Заде:
μ R ( y, u ) = max{min[μ A ( y ), μ B ( y )], [1 − μ A ( y )]}.
Наиболее наглядно правило замены выражается с помощью оператора фази-импликации,
предложенного Геделем.
⎧⎪1, ∀ μ А ( y ) ≤ μВ ( u )
μ R ( y, u ) = ⎨ . (4.155)
⎪⎩ μ В ( u ) , ∀ μ А ( y ) > μ В ( u )
Пример 4.21. Пусть функции принадлежности управляемой величины Y и управляющего
воздействия U имеют вид, представленный на рис.4.71. Необходимо найти функцию принадлеж-
ности μ R ( y, u ) , характеризующую взаимосвязь между переменными y и u.

μ А (y) μ B (u )

1.0 1.0 513

0.5 0.5
y*=y3
y1 y2 y3 y u1 u2 u3 u
Рис.4.71
Решение. Составим декартово произведение P = Y × U , воспользовавшись данными, при-
веденными на рис.4.69.
( y1 u1 ) ( y 2 u1 ) ( y3 u1 )
Р = ( y1 u 2 ) ( y 2 u 2 ) ( y 3 u 2 ) .
( y1 u 3 ) ( y 2 u 3 ) ( y3 u 3 )
Применив оператор Мамдани (4.154) к каждой паре ( y i u i ) множества Р, можно найти
числовые значения μ R ( y, u ) . При этом необходимо учесть, что для конкретного значения
управляемой величины y=y*, оператор (4.154) ограничивает μ В (u ) сверху на уровне
μ А (y * ) . Например, пусть y*=y3. Тогда μ А ( y * ) = 0,5 (рис.4.69) и, следовательно, величина
μ В (u ) будет ограничена сверху величиной 0,5, что соответствует правилу замены
[ В = А ∧ ( А → В)] , то есть истинность вывода В не может превышать истинности посылки
А. В соответствие с изложенным искомая функция принадлежности будет:
μ R ( y * , u ) = 0.25; 0.5; 0.5 .
В общем случае:
0.25 0.25 0.25
μ R ( y, u ) = 0.75 1.0 0 .5 . (4.156)
0 .5 0 .5 0 .5
Если воспользоваться правилом Геделя (4.143), функция принадлежности примет вид:
0.25 0.25 0.25
μ R ( y , u ) = 1 .0 1 .0 1 .0 . (4.157)
0 .5 0 .5 1 .0
Сравнение матриц (4.156) и (4.157) показывает, что в последнем случае размытость ситуа-
ции несколько уменьшается.

Обобщая результаты, полученные в рассмотренном


*** примере, можно записать общий алго-
ритм определения функции принадлежности управляющего воздействия μ B ( u ) , аналогичный
правилу замены (4.150) и справедливый для любого y:
μ В ( u ) = max {min ⎡⎣ μ A ( y ) , μ B ( y, u ) ⎤⎦ } , u ∈ B . (4.158)
y∈ A

В частном случае при y=y* алгоритм (4.158)упрощается и принимает вид аналогичный


(4.154):
μ В* (u ) = μ R ( y * , u ) = min{μ A ( y * ), μ B (u )}. (4.159)
y∈ A

На рис.4.72 проиллюстрировано определение функции принадлежности правила: «ЕСЛИ


…, ТО…», с помощью метода максимина, согласно которому функция принадлежности
вывода В ограничивается сверху функцией принадлежности посылки А при y=y*. Заметим,
что определение функций принад-
лежности μ В* (u ) для заданного зна-
чения y=y* называется процедурой
фазификации. Здесь от четкого зна-
чения y*, воспользовавшись функци-

514
ей принадлежности μ А ( y ) переходим к нечеткой зависимости μ А ( y * ) и далее к нечеткому
множеству U с функцией принадлежности μ B* (u ) . Функция μ В* (u ) дает возможность най-
ти тем или иным способом конкретное значение управляющего воздействия u*=u, т.е. пе-
рейти от нечеткого множества U к четкому значению u*. Эта процедура называется дефа-
зификацией и может быть выполнена, например, по методу центра тяжести по формуле:

u* =
∫ u ⋅ μВ* ( u ) du . (4.160)
∫ μB* ( u ) du
Процедура определения функции принадлежности нечеткого правила: «ЕСЛИ…, ТО…»,
например, по формуле (4.159), и объединение нескольких таких правил, связанных союзом «ИЛИ»
называется инференц-процедурой и осуществляется согласно фази-объединению (4.147) путем
максимизации функций принадлежности объединяемых правил. Тогда результирующая функция
принадлежности примет вид:

Р j
{ *
j
} j
{
μ В ( u ) = max μ В ( u ) = max min μ A ( y* ) , μ B ( u ) ,
j j
} (4.161)

где j = 1, n , n – количество объединяемых правил «ЕСЛИ …, ТО ..», μ А j ( y * ) - значение


функции принадлежности посылки А j–ого правила при y=y*, μ B j (u ) - функция принад-
лежности вывода В j–ого правила, μ B* (u ) - функция принадлежности вывода В j–ого
j

правила, ограниченная (усеченная) сверху на уровне μ А j ( y * ) .


Пример 4.22. Пусть множество В задано на базисном множестве U лингвистическими пе-
ременными: отрицательное отклонение от нормы – O, норма – Н, положительное откло-
нение от нормы – П, с соответствующими функциями принадлежности:
μ ВO (u ), μ BH (u ), μ ВП (u ) , заданными графически*) (рис.4.73,а). Требуется найти результи-
рующую функцию принадлежности μ ВР (u ) следующего выражения:
{ } { } { }
«ЕСЛИ А1* = {y1 , μ А* ( y1 )} И ВH = u, μ ВН (u ) ИЛИ А2* y 2 , μ А* ( y 2 ) И В П = u, μ ВП (u ) ,
{ }
2

ТО С = u, μ ВР (u ) »
Решение. Применим инференц-процедуру, воспользовавшись выражением (4.161), т. е.
используя процедуру максимина. На рис.4.73,а, б показаны процедуры минимизации двух
конъюнкций, ограниченных сверху. В результате получены две функции принадлежности
μ А* ∧ В (u ) и μ А* ∧ В (u ) . Для получения результирующей функции принадлежности μ ВР (u )
1 H 2 П

(рис.4.71,в), эти функции соединяются союзом «ИЛИ» с помощью процедуры максимиза-


ции. Конкретное числовое значение u=u*, соответствующее результирующей функции
принадлежности, можно найти по формуле (4.160).

*)
Заметим, что так как функции принадлежности обычно трактуются как вероятности принадлежности лингвистической
переменной к тому или иному терму, то целесообразно, чтобы эти функции для соседних термов удовлетворяли усло-
вию: μ i + μ i +1 = 1 .
515
Рис. 4.73
Пример 4.23. Пусть на вход устройства управления поступает сигнал рассогласования
Δ(t ) = Δ1 и какая-либо его характеристика Δ 2 (скорость, ускорение и т. п.). При этом Δ1 и
Δ 2 (Δ ⊂ A) представлены функциями принадлежности μ A (Δ l ), l = 1, 2 , приведенными на
рис.4.74,а, б. Здесь термы О, Н, П имеют то же содержание, что и в предыдущем примере.

Алгоритм нечеткого управления представлен следующими четырьмя правилами:


1. ЕСЛИ Δ1 = О И Δ 2 = П , ТО u = П ;
2. ЕСЛИ Δ 1 = О И Δ 2 = Н , ТО u = Н ;
3. ЕСЛИ Δ1 = Н И Δ 2 = П , ТО u = П ;
4. ЕСЛИ Δ 1 = Н ИЛИ Δ 2 = Н , ТО u = Н .
Требуется найти результирующую функцию принадлежности μ B p (u ) .
Решение. Пусть измеренные значения Δ i (t ) равны: Δ*1 = −0,7 ; Δ*2 = 0,4 . Так как функции
принадлежности μ А (Δ l ) заданы, то можно найти их конкретные значения μ A (Δ*l ) , т. е.
провести процедуру фазификации (см. рис.4.74). Для проведения инференц-процедуры
посылки «ЕСЛИ …» первых трех правил, содержащих внутри союз «И», определяются с
помощью процедуры нечеткой конъюнкции (4.146):
{ }
μ A1 (Δ*1 , Δ*2 ) = min μ AO (Δ*1 ), μ AП (Δ*2 ) = min{0.7, 0.4} = 0.4 .
Аналогично μ A2 ( Δ1* , Δ*2 ) = min {0.7, 0.6} = 0.6 ; μ A3 ( Δ , Δ ) = min {0.3, 0.4} = 0.3 .
*
1
*
2

Посылка последнего правила, содержащая союз «ИЛИ» определяется с помощью проце-


дуры нечеткой дизъюнкции (4.147):
{ }
μ A4 ( Δ1* , Δ*2 ) = max μ AH ( Δ1* ) , μ AH ( Δ*2 ) = max {0.3, 0.6} = 0.6 .
Воспользовавшись правилом Мамдани (4.159):
{
μ В* (u ) = min μ А j ( y * ), μ Bi (u )
j
}
516
определим функции принадлежности, характеризующие нечеткие импликации, опреде-
ляемые четырьмя правилами приведенными выше. Здесь j = 1, 4 - номер правила, i = О,
Н, П – лингвистическая переменная. В соответствие со сказанным, имеем:
{ ( ) } { ( )
μ В* = min μ A1 Δ*1 , Δ*2 , μ BП (u ) ; μ В * = min μ A2 Δ*1 , Δ*2 , μ BH (u ) ;
1 2
}
μВ* = min{μ (Δ , Δ ), μ (u )}; μ
A3
*
1
*
2 BП В 4*
= min{μ (Δ , Δ ), μ (u )}.
A4
*
1
*
2 BH
3

Функции принадлежности μ Bi (u ) , характеризующие нечеткие множества управляющих


воздействий (u ∈ B ) приведены на рис.4.75,a.

Так как функции принадлежности μ A j (Δ*1 , Δ*2 ) заданы конкретными числовыми значения-
ми (0,4; 0,6; 0,3; 0,6), которые меньше единицы, то операции минимизации соответствуют
усеченные исходные функции принадлежности μ B* (u ) (рис.4.73,а). Таким образом, про-
i

цедура фазификации сигналов Δ = −0.7 и Δ = 0.4 завершена. Следующим этапом явля-


*
1
*
2

ется инференц-процедура, объединяющая те или иные функции μ В* в соответствии с вы-


j

ражением (4.161):

Р j
{
μ В ( u ) = max μ B ( u ) .*
j
}
Например, посылки «ЕСЛИ …» правил 1 и 3 можно объединить союзом «ИЛИ», так как
выводы этих правил аналогичны (u=П). При этом результирующая функция принадлеж-
ности μ BP , найденная путем максимизации функций μ B* и μ B* , представлена на
1 3

рис.4.73,б. Результирующее четкое значение управляющего воздействия u=u* находится c


помощью процедуры дефазификации, например, в соответствии с выражением (4.160).
Заметим, что при объединении правил 2 и 4 ( μ B* = μ B* ) результирующее значение u* равно
3 1

нулю.

ОСНОВНЫЕ ПРИНЦИПЫ ПОСТРОЕНИЯ НЕЧЕТКИХ СИСТЕМ УПРАВЛЕНИЯ


Функциональная схема нечетких систем управления (НСУ), реализующих концепцию
Мамдани, представлена на рис.4.76. Согласно этой концепции нечеткое управляющее
устройство (УУ) вырабатывает четкое однозначное управляющее воздействие u * . Здесь
вся исходная информация о стратегии управления хранится в базе правил условного логи-
ческого вывода «ЕСЛИ …, ТО …» и базах функций принадлежности (ФП) сигнала ошиб-
ки μ A (Δ ) и управляющего воздействия μ B (u ) , которые формируются на основе тщатель-
ного изучения объекта управления (ОУ) и целевой функции (критерия управления) путем
анкетного опроса высококвалифицированных специалистов – экспертов.

517
Рис. 4.76
В блоке нормирования фиксированные значения составляющих векторного сигнала
ошибки Δ* = y* − y нормируются умножением на соответствующий масштабный коэф-
фициент: Δ*н = kΔ ⋅ Δ* . Блок фазификации выдает значения функции принадлежности по-
сылок μ A ( Δ*н ) , соответсвующих фиксированным значениям всех составляющих векторно-
го сигнала ошибки Δ* .
Основным блоком устройства управления является блок инференц-процедуры, в котором
вырабатываются нечеткие логические выводы в соответствии с исходными правилами,
сформулированными экспертами с помощью союзов «И», «ИЛИ», т. е. с помощью опера-
ций минимизации и максимизации соответственно. При этом частные посылки объединя-
ются в общую посылку, затем для каждого правила по алгоритму Мамдани определяется
истинность заключения, которая не может быть больше результирующей истинности об-
щей посылки данного правила. В этом же блоке с помощью операции максимизации про-
изводят объединение частных выводов в общий вывод, которому соответствует результи-
рующая функция принадлежности μ ВР ( uн ) .
В блоке дефазификации по методу центра тяжести вычисляется фиксированное значение
нормированного управляющего воздействия uн* , которое затем денормируется путем ум-
ножения его на соответствующий масштабный коэффициент.
Помимо управляющего устройства, реализующего концепцию Мамдани, используются
УУ, реализующие концепцию Сугено. В этом случае конкретные значения управляющего
воздействия u j вычисляются как алгебраические функции входных переменных:
Δ l , l = 0, m .
u j = c0 j + c1 j ⋅ Δ1 + c2 j ⋅ Δ 2 + ...clj ⋅ Δ l + ... + cmj ⋅ Δ m , j = 1, k , (4.162)
где clj - постоянные коэффициенты, устанавливаемые экспертами для вывода каждого j-го
правила, сформулированного не для лингвистических переменных (например О, Н, П), а в
виде полинома (4.162). При этом исключается необходимость дефазификации по методу
центра тяжести, а четкое значение результирующего управляющего воздействия u * , соот-
ветствующее фиксированным значениям Δ*l , вычисляется как средневзвешенная величи-
на:

518
n

∑u
j =1
j ⋅ μ A*
j

u =
*
n
, (4.163)
∑μ
j =1
A*j

где μ A* = μ A (Δ*l ) - значение функции принадлежности всей посылки j-ого правила, соот-
j j

ветствующее всем значениям Δ*l .


Объединение составных частей посылки, соединенных союзом «И», «ИЛИ» производится
также, как и в методе Мамдани с помощью процедур минимизации и максимизации.
Формула (4.162) соответствует алгоритму Сугено первого порядка. Часто применяют ал-
горитм Сугено нулевого порядка:
u j = c0 j + c1 j + c 2 j + ... + clj , (4.164)
где clj - четкое значение управляющего воздействия, заданного в виде синглтонов {сlj , 1}
при формулировке исходных логических правил.
Пример 4.23. Пусть имеем пять лингвистических значений переменной Δ (посылок А),
заданных в форме функций принадлежности μ Aj ( Δ ) и представленных на рис.4.77. Здесь
ОБ, ОМ, Н, ПМ, ПБ – термы означающие «отрицательные большие (ОБ) и малые (ОМ)
отклонения»; «норма (Н)»; «положительные малые (ПМ) и большие (ПБ) отклонения».

Рис. 4.77
База правил сформулирована следующим образом:
1. ЕСЛИ Δ=ОБ, ТО u1 = c01 = −5 ;
2. ЕСЛИ Δ=ОМ, ТО u2 = c02 = −2.5 ;
1. ЕСЛИ Δ=Н, ТО u3 = c03 = 0 ;

2. ЕСЛИ Δ=ПМ, ТО u4 = c04 = 2.5 ;

3. ЕСЛИ Δ=ПБ, ТО u5 = c05 = 5 .

Здесь с0 j -постоянные величины, заданные экспертами.


Требуется определить результирующее управляющее воздействие u * .
Решение. Допустим, что фиксированное значение Δ = Δ* = 1,2 , тогда в результате проце-
дуры фазификации находим значение функции принадлежности μ Аj ( Δ* ) для всех пяти
посылок Aj (см. рис.4.75). В результате получим:
μ А (Δ* ) = μ А (Δ* ) = μ А (Δ* ) = 0 ; μ А (Δ* ) = 0,8 ; μ А (Δ* ) = 0,2 .
ОБ ОМ Н ПМ ПБ

Общий вывод В, т. е. четкое значение управляющего воздействия u*, определяется по


формуле (4.63):

519
2.5 ⋅ 0.8 + 5 ⋅ 0.2
u* = = 3.
0.8 + 0.2

12.3.1. Передаточные характеристики управляющего устройства


Из изложенных принципов построения и функционирования НСУ следует, что нечеткое
управляющее устройство ФР (фази-регулятор) представляет собой безынерционный нелинейный
преобразователь с одним или несколькими входными и выходными сигналами. На структурных
схемах его обычно обозначают прямоугольником с двойной рамкой, внутри которого символиче-
ски изображают функции принадлежности (рис.4.78).
Для придания безынерционному фази-регулятору необходимых динамических свойств,
вытекающих из требований к НСУ, к нему часто присоединяют ПИД-регулятор с тремя
каналами: пропорциональным «П», интегрирующим «И» и дифференцирующим «Д» (см
рис.4.78). При этом в базе правил ФР в качестве входных переменных помимо сигнала
ошибки Δ1 должны фигурировать интеграл Δ2 и производная Δ3 этого сигнала по време-
ни.

Рис. 4.78
Передаточные свойства фази-регулятора, без динамических составляющих можно описы-
вать с помощью нелинейных статических характеристик. Например, пусть линейный про-
порциональный регулятор с коэффициентом передачи k1 : u (t ) = k1 ⋅ Δ (t ) , можно прибли-
женно заменить в виде следующих пяти правил:
1. ЕСЛИ Δ = ОБ, ТО u = ОБ;
2. ЕСЛИ Δ = ОМ, ТО u = ОМ;
3. ЕСЛИ Δ= Н, ТО u = Н;
(4.165)
4. ЕСЛИ Δ = ПМ, ТО u = ПМ;
5. ЕСЛИ Δ = ПБ, ТО u = ПБ.Рис.
Если предположить, что входная переменная Δ при-
нимает только четкое значение (синглтоны), то базе
правил (4.165), связывающей u и Δ, будет соответ-
ствовать нелинейная статическая характеристика u
= f( Δ ) пятипозиционного реле (рис.4.77, кривая 1).
Если же правила (4.165) реализуются в фазе-
регуляторе с выполнением процедур фазификации,
то статическая характеристика u = f (Δ ) принимает
более плавный вид (рис.4.77, кривая 2). Причем
форма характеристики зависит как от формы и вза-
имного расположения функций принадлежности

520
входной переменной Δ , так и от конкретных методов инференц- процедуры и дефазифи-
кации.

12.3.2 Синтез нечетких систем управления


Прежде всего отметим, что в теории нечеткого управления еще многое предстоит обосно-
вать и систематизировать. Действительно, в сравнении с традиционной теорией автомати-
ческого управления здесь отсутствуют строгие математические методы синтеза, оценки
качества, устойчивости и др. Пока для этих сложных нелинейных систем единственным
способом исследования является моделирование. При этом качество и эффективность
функционирования НСУ в значительной мере зависят от квалификации экспертов. Тем не
менее, несмотря на разнообразие подходов к созданию нечетких систем и на преоблада-
ние эвристических приемов формализации задач нечеткого управления, можно выделить
последовательность процедур синтеза этих систем.
1. Предварительное изучение объекта управления, его традиционной модели и опыта его
эксплуатации.
2. Выбор наблюдаемых (измеряемых) выходных переменных yi и управляющих воздей-
ствий u j , определение пределов их изменения и выбор масштабных нормировочных ко-
эффициентов.
3. Определение лингвистических переменных y и u и их функций принадлежности, соот-
ветствующих отдельным термам. При этом необходимо учитывать, что количество, форма
и взаимное расположение функций принадлежности оказывают весьма существенное
влияние на качество управления.
4. Формулирование на основе интервьюирования и анкетирования экспертов логических
правил («ЕСЛИ…,ТО…»), определяющих алгоритмы управления. При этом полезна совместная
работа экспертов по объекту управления и по фази-управлению. В случае необходимости коррек-
тируют функции принадлежности, принятые на предыдущем этапе. Правила с одинаковым выво-
дом объединяют с помощью союза «ИЛИ» в одно правило.
5. Проверка сформулированных выше правил на полноту, непротиворечивость и избыточ-
ность. В случае двух входных переменных y1 и y2 составляется таблица правил, устанавливающих
соответствие между лингвистическими значениями входных и выходных переменных.
6. Выбор операторов импликации и инференц-процедуры, а также метода дефазификации.
7. Программирование всех функций принадлежности, правил и процедур объединения по-
сылок как для отдельных правил «ЕСЛИ…, ТО», так и всех правил между собой.
8. Проведение исследования функционирования нечеткой системы управления путем вы-
числительного эксперимента с использованием четкой или нечеткой модели объекта
управления и оценка устойчивости и качества функционирования нечеткой системы
управления. Для технической реализации модели нечеткого управляющего устройства ис-
пользуют программные языки высокого уровня, а также различные стандартные функ-
циональные блоки.
Пример 4.23. Пусть объектом управления является смеситель-водонагреватель (рис.4.80).

521
Рис. 4.80
Подогрев воды производится водонагревателем ВН, снабженным источником тепла Н (на-
греватель). В смеситель С поступает горячая и холодная вода, температура смеси которой θ
должна поддерживаться на заданном уровне θ* с помощью регулирующего органа З (заслонки),
перемещаемого исполнительным механизмом ИМ. Требуется определить базу правил нечеткой
системы управления температурой воды, на выходе смесителя.
Решение. Примем в качестве входной величины фази-регулятора ФР сигнал рассогласо-
вания Δ = θ * − θ , а в качестве управляющего воздействия u - скорость перемещения за-
dL
слонки . Входную Δ и выход-
dt
ную u величины будем характе-
ризовать функциями принадлеж-
ности μ A (Δ ) , μ B (u ) графики ко-
торых показаны на рис.4.81,а,б.
Обозначения термов на этом ри-
сунке такое же, как и на рис.4.77
(термы «ОС» и «ПС» означают
средние отрицательное и положи-
тельное отклонения соответст-
венно). Количество термов, фор-
ма и взаимное расположение
функций принадлежности опре-
деляется экспертами. В данном
случае для улучшения точности и
динамических показателей систе-
мы плотность расположения
функций принадлежности в сере-
дине диапазона изменений Δ вы-
брана большей, чем по краям.
Стратегию управления объ-
ектом можно сформулировать в ви-
де следующей базы правил.

522
Из-за наличия инерционности объекта в системе управления могут возникать нежелатель-
ные колебания, которые особенно существенны при малых расходах воды q. С целью
демпфирования колебаний можно использовать дополнительный входной сигнал пропор-
циональный q, подав его на вход фази-регулятора. При этом расширенную базу правил
можно представить в виде таблицы 4.3 , где расход q описывается четырьмя термами
(термы ОМ, ОС, ОБ отсутствуют, так как направление потока воды не меняет свой знак),
функции принадлежности которых μ A (q ) представлены на рис.4.81,а (пунктиром).
Таблица 4.3

В эту таблицу сведены 28 правил вида: « ЕСЛИ Δ = ai И q = b j , ТО u = cij », где ai и b j -


лингвистические значения входных переменных объекта Δ и q; сij - лингвистическое зна-
чение управляющего воздействия u, соответствующие i – му столбцу и j –ой строке таб-
лицы 4.3. База правил (4.166), составленная без учета использования сигнала пропорцио-
нального расходу q соответствует среднему значению расхода q =ПС. Большему значению
q =ПБ соответствуют большие регулирующие воздействия u, а меньшему - q = ПМ -
меньшие значения u. База правил, представленная таблицей 4.3, дает возможность, ис-
пользуя ту или иную концепцию, синтезировать нечеткую систему управления.
Пример 4.24. С помощью нечеткой логики синтезировать систему оптимизации газового
режима горизонтального конвертера (рис.4.82).
Решение. Как известно, при продувке сульфидных расплавов в горизонтальных конверте-
рах 1 образуется значительное количество газов, содержащих диоксид серы ( SO 2 ). Обра-
зующиеся конвертерные газы удаляются через напыльник 2, очищаются от пыли в пыле-
вой камере 3 и подаются на производство серной кислоты. Разрежение в напыльнике, не-
обходимое для улавливания газов, создается дымососом 6 с электроприводом 7. В силу
конструктивных особенностей газового
тракта, между горловиной конвертера и на-
пыльником имеется зазор, через который в
зависимости от разрежения, создаваемого
дымососом происходит либо подсос возду-
ха, который разбавляет газы в газоходе 5,
что нежелательно с точки зрения производ-
ства серной кислоты, либо выбросы газов в

523
атмосферу цеха, что недопустимо с точки зрения экологии и охраны труда. Избыток газа
сбрасывается через газоход 4 в атмосферу. Таким образом, имеется следующая задача
управления: поддерживать разрежение в газовом тракте конвертера на уровне, исклю-
чающем как чрезмерное разбавление газов подсасываемым воздухом, так и выбивание га-
зов из-под напыльника в помещение цеха.
Количество газов, образующихся в ванне конвертера, определяется расходом воздуха, по-
даваемого в конвертер. Расход дутья V непрерывно измеряется, так же, как и разрежение
в газовом тракте конвертера P.
Сложность управления газовым режимом конвертера заключается в том, что не сущест-
вует технических средств, позволяющих зафиксировать и количественно оценить факт
выброса газов в атмосферу или подсоса воздуха под напыльник. Данные явления могут
быть зафиксированы лишь визуально и описаны лингвистическими оценками типа «силь-
но», «слабо» и т.п.
Указанная проблема может быть решена применением системы нечеткого управления,
позволяющей оперировать экспертными оценками. Характер газоудаления Y можно опи-
сать пятью термами: конвертер сильно выбрасывает газы СГ; конвертер выбрасывает газы
Г; нормальное газоудаление Н; подсос воздуха П; сильный подсос воздуха СП, – ставя им
в соответствие конкретные количественные оценки измеряемых параметров: расхода ду-
тья V и разрежения в газовом тракте P . Будем считать, что режиму нормального газоуда-
ления соответствуют некоторые оптимальные значения ( Vопт и Pопт ). Разбив интервал воз-
можного изменения параметров на пять термов, получим функции принадлежности, пред-
ставленные на рис.4.83.
а б
μ(Р) μ(V)
ОБ ОМ Н ПМ ПБ ОБ ОМ Н ПМ ПБ

Р-2 Р-1 РОПТ Р2 Р1 Р V–2 V-1 Vопт V1 V2 V


Рис.4.83
Учитывая, что выбивание газов из-под напыльника происходит при большом коли-
честве газов и при недостаточном разрежении, а подсос воздуха – при малом количестве
газов и при большом разрежении, запишем следующие правила оценки характера газоуда-
ления, соединяемые союзом ИЛИ:

«ЕСЛИ V = ПБ И Р =Н
«ЕСЛИ V = ПМ И Р = ОМ
«ЕСЛИ V=Н И Р = ОБ
«ЕСЛИ V = ПБ И Р = ПМ , ТО Y = Г»;
«ЕСЛИ V = ПМ И Р=Н
«ЕСЛИ V=Н И Р = ОМ
«ЕСЛИ V = ОМ И Р = ОБ
«ЕСЛИ V=Н И Р=Н
«ЕСЛИ V = ОБ И Р = ОБ
«ЕСЛИ V = ПБ И Р = ПБ , ТО Y = Н»;
«ЕСЛИ V = ОМ И Р=ОМ
«ЕСЛИ V = ПМ И Р=ПМ

«ЕСЛИ V = ПМ И Р = ПБ
«ЕСЛИ V = Н И Р = ПМ
«ЕСЛИ V = ОМ И Р = Н
524
«ЕСЛИ V = ОБ И Р =ОМ , ТО Y = П»;
«ЕСЛИ V = Н И Р = ПБ
«ЕСЛИ V = ОМ И Р = ПМ
«ЕСЛИ V = ОБ И Р = Н

«ЕСЛИ V = ПБ И Р = ОБ
«ЕСЛИ V = ПБ И Р = ОМ , ТО Y = СГ»;
«ЕСЛИ V = ПМ И Р = ОБ
«ЕСЛИ V = ОБ И Р = ПБ
«ЕСЛИ V = ОМ И Р = ПБ , ТО Y = CП»,
«ЕСЛИ V = ОБ И Р =ПМ
Приведенные правила логического вывода можно представить в виде таблицы базы правил
(табл.4.4).

Таблица 4.4

Дальнейший синтез системы производим в следующей последовательности. Запи-


шем аналитические выражения для функций принадлежности расхода дутья и разрежения.
Например, при треугольном виде функций принадлежности μ (V ) выражения для них
при V-1 ≤ V * ≤ Vопт будут иметь вид (рис.4.81)

V * − V−1
μ ОМ (V ) = 1 −
*
;
Vопт − V−1
(4.167)
V − V−1
*

μ Н (V * ) = ,
Vопт − V−1
где V * – измеренное значение параметра.
Выражения, подобные (4.167), записываются для всего диапазона изменения расхода ду-
тья и разрежения в газовом тракте конвертера.
Фазификацию произведем по методологии, изложенной выше. Используя выражение: μi
(V *; Р *) = min {μi (V *); μi (Р *)}, получим пять функций принадлежности для различных оценок
характера газоудаления. Истинной оценкой считаем ту, которой соответствует максимальная
функция принадлежности
μ*(Y) = max{μ (V *; Р *)}.

525
Значение управляющего воздействия определим воспользовавшись алгоритмом Сугено
нулевого порядка (4.164). Предусмотрим пять фиксированных вариантов управления
(рис.4.81):
• при сильном подсосе уменьшить разрежение на ΔP− 2 (u сп
*
= − ΔP− 2 ) ;
• при подсосе уменьшить разрежение на ΔP−1 (u п* = −ΔP−1 ) , причем ΔP−1 < ΔP−2 ;
• при нормальном газоудалении разрежение не менять ( uн* = 0 );

• при выбросе газов увеличить разрежение на ΔP1 (u г* = + ΔP1 ) ;


• при сильном выбросе газов увеличить разрежение на ΔP2 (u сг* = + ΔP2 ) , причем
ΔP1 < ΔP2 .
Конкретное значение управляющего воздействия определяется как средневзвешенная ве-
личина:
5

∑u
j =1
*
j ⋅ μ j (V * , P * )
u* = 5
.
∑μ
j =1
j
* *
(V , P )

Управляющий сигнал u* реализуется изменением производительности дымососа, меняю-


щего тем самым разрежение в газовом тракте.
Описанный алгоритм можно осуществить программно на управляющей машине
либо микроконтроллере. Для настройки алгоритма на реальный объект требуется про-
мышленный эксперимент с привлечением в качестве экспертов обслуживающего персо-
нала конвертера для увязки правил логического вывода с измеренными на объекте дан-
ными. После настройки модели и проверки ее адекватности подобная система может ра-
ботать без участия человека либо во взаимодействии с ним как взаимообучающаяся чело-
веко-машинная система.

12.3.3. Нечеткие нейронные сети в системах управления


Основным достоинством систем с нечеткой логикой является способность решения задач,
описанных на языке близком к языку, используемому при общении между людьми. Однако при
построении обычных нечетких систем, рассмотренных выше, в качестве исходной информации
используются данные, которые определяются специалистами-экспертами. В частности, перечень
термов для входных и выходных переменных, набор нечетких правил «ЕСЛИ…ТО…», форма и
параметры функции принадлежности каждого терма, алгоритм нечеткого вывода и др. задаются
экспертами. Следовательно, исходные данные в значительной мере являются субъективными и не
всегда адекватно отражают поведение реальной системы. Для устранения этого недостатка, эф-
фективно использование нечетких многослойных нейронных сетей, в которых слои выполняют
функции элементов системы нечеткого вывода. Нейроны нечеткой сети характеризуются набором
параметров, настройка которых производится в процессе обучения, как в обычных обучающихся
системах, рассмотренных в предыдущей главе.
В качестве примера рассмотрим нечеткую нейронную сеть (рис.4.84), построенную на базе
концепции Сугено и использующую алгоритм нулевого порядка (4.164). Эта сеть состоит из четы-
рех слоев, каждый из которых выполняет определенные функции.

526
Слой 1 осуществ-
ляет процедуру фазифика-
ции. Функции принадлеж-
ности μij ( x j )
(i = 1, m; j = 1, n) соответ-
ствуют посылкам i-ых не-
четких правил для j-го
входного воздействия, а
настраиваемыми парамет-
рами этого слоя являются
параметры упомянутых
функций принадлежности.
Слой 2 производит
вычисление функции при-
надлежности для всех по-
сылок нечетких правил.
Этот слой не имеет на-
страиваемых параметров.
Слой 3, состоящий
из нейронов, осуществляет
взвешенное суммирование
S1 и суммирование S2 вы-
ходных сигналов fj слоя 2.
Настраиваемыми парамет-
рами этого слоя являются
весовые коэффициенты C j .
Слой 4 реализует процедуру дефазификации, вычисляя выходную величину сети
y = S1 / S2 , которая, в частности, может представлять собой управляющее воздействие, подавае-
мое на вход объекта управления.
В процессе обучения нечеткой нейронной сети определяются оптимальные значения изме-
няемых (настраиваемых) параметров. При этом в качестве критерия оптимальности чаще всего
используется средняя квадратическая ошибка, минимальное значение которой можно найти вос-
пользовавшись одним из методов поиска экстремума многих переменных, например, например,
методом градиента.
Следует отметить, что в том случае, если выбор исходных правил функционирования не-
четкой нейронной сети неадекватно описывает поведение исследуемой системы, процесс обучения
не приведет к желаемому результату. В этом случае применяются адаптивные нечеткие системы,
корректирующие исходный набор правил в процессе работы системы, т.е. реализующих режим
самообучения нечетких нейронных систем.
Подчеркнем, что нечеткие системы, вообще, и нечеткие нейронные сети, в частности, це-
лесообразно применять для управления сложными и большими объектами, полную информацию о
состоянии которых по тем или иным причинам получить не удается. Если это не так, то более
предпочтительным оказывается реализация традиционных систем управления.

527
РЕКОМЕНДАТЕЛЬНЫЙ БИБЛИОГРАФИЧЕСКИЙ СПИ-
СОК
1. Александров А.Г. Оптимальные и адаптивные системы. М.: Высшая школа, 1989.
262c.
2. Бесекерский В.А. Теория систем автоматического управления / В.А. Бесекерский,
Е.П. Попов. М.: “Профессия”, 2004. 747с.
3. Вентцель Е.С. Теория вероятностей. М.: Высшая школа, 1998. 564с.
4. Власов К.П. Специальный курс по теории автоматического управления. Х.: Харь-
ковский политехнический институт, 1974. 198с.
5. Власов К.П. Теория автоматического управления / К.П. Власов, А.С. Анашкин. С.-
Пб.: Санкт- Петербургский горный институт, 2003. 103с.
6. Власов К.П. Теория автоматического управления (особые, дискретные и нелиней-
ные системы) / К.П. Власов, М.К. Аникин. СПб.: Санкт- Петербургский горный ин-
ститут, 2005. 105с.
7. Власов К.П. Теория автоматического управления (специальные методы) / К.П. Вла-
сов, А.С. Анашкин. СПб.: Санкт- Петербургский горный институт, 2001. 119с.
8. Воронов А.А. Основы теории автоматического управления. М. – Л.: Энергия, 1965,
Ч.1, 423с. 1966, Ч.2, 372с. 1970, Ч.3, 328с.
9. Галушкин А.И. Теория нейронных сетей. Кн.1. М.: ИРПЖР, 2000. 415с.
10. Голубь А.П. Системы управления электроприводами / А.П. Голубь, Б.Н. Кузнецов,
И.А. Опрышко, В.П. Соляник. К.: УМК ВО, 1992. 376с.
11. Гусев А.Н. Основы теории автоматического управления / А.Н. Гусев, В.А. Вьюжа-
нин, В.Д. Закаблуковский. Самара: Самарский аэрокосмический университет, 1966.
110с.
12. Заде Л. Понятие лингвистической переменной и его применение к принятию при-
ближенных решений. М.: Мир, 1976. 368с.
13. Зайцев Г.Ф. Теория автоматического управления и регулирования. 2-е издание пе-
рераб. и дополн. Киев: Высшая школа, 1988. 430с.
14. Иващенко Н.Н. Автоматическое регулирование. Теория и элементы систем. М.:
Машиностроение, 1973. 606с.
15. Интеллектуальные системы автоматического управления / под ред. И.М. Макарова,
В.М. Лохчена. М.: Физматлит, 2001. 576с.
16. Кочетков В.П. Основы теории автоматического управления. Учебное пособие. Ха-
касия.: Хакасский государственный университет, 2001. 264с.

528
17. Круглов В.В. Нечеткая логика и искусственные нейронные сети / В.В. Круглов,
М.И. Дли, Р.Ю. Годунов. М.: Физматлит, 2001. 224с.
18. Лукас В.А. Основы фази–управления. Екатеринбург: Уральская горно-
геологическая академия, 2000. 76с.
19. Лукас В.А. Теория автоматического управления. М.: Недра, 1990. 416с.
20. Математические основы теории автоматического регулирования / под ред. Б.К. Че-
моданова. М.: Высшая школа, 1971. 807с.
21. Методы исследований и организация экспериментов / под ред. К.П. Власова. Х.:
Гуманитарный центр, 2002. 256с.
22. Мирошник И.В. Теория автоматического управления. Линейные системы. СПб:
“Питер”, 2005. 333с.
23. Михайлов В.С. Теория управления. Учебное пособие для ВУЗов. Киев: Высшая
школа, 1988. 309с.
24. Олейников В.А. Основы оптимального и экстремального управления / В.А. Олей-
ников, Н.С. Зотов, А.М. Пришвин. М.: Высшая школа, 1969. 331с.
25. Пантелеев А.В. Теория управления в примерах и задачах / А.В. Пантелеев, А.С.
Бортаковский. М., Высшая школа, 2003. 583с.
26. Первозванский А.А. Курс теории автоматического управления. М.: Наука, 1986.
615с.
27. Попов Е.П. Теория линейных систем автоматического регулирования и управле-
ния. М.: Наука, 1989. 496с.
28. Попов Е.П. Теория нелинейных систем автоматического регулирования и управле-
ния. М.: Наука, 1988. 255с.
29. Поспелов Д.А. Логико-лингвистические модели в системах управления. М.: Энер-
гоатомиздат, 1981. 231с.
30. Ройтенберг Я.Н. Автоматическое управление. Учебное пособие. 3-е издание пере-
раб. и дополн. М.: Наука, 1992. 576с.
31. Ротач В.Я. Расчет динамики промышленных автоматических систем регулирова-
ния. М.: Энергия, 1973. 440с.
32. Солодовников В.В. Основы теории и элементы систем автоматического регулиро-
вания / В.В. Солодовников, В.Н. Плотников, А.В. Яковлев. М.: Машиностроение,
1985. 536с.
33. Солодовников В.В. Статистическая динамика линейных систем автоматического
управления. М.: Физматгиз, 1960. 213с.

529
34. Справочник по теории автоматического управления / под ред. Красовского А.А.
М.: Наука, 1987. 711с.
35. Теория автоматического регулирования. Учебное пособие для вузов / под ред.
Ю.М. Соломенцева. М.: Машиностроение, 1992. 286с.
36. Теория автоматического управления / под ред. А.В. Нетушила. М.: Высшая школа,
1972. 432с.
37. Теория автоматического управления. Учебное пособие / под ред. А.А. Воронова.
Ч.1. М.: Высшая школа, 1987. 367с.
38. Тэрано Т. Прикладные нечеткие системы / Т. Тэрано, К. Асаи, М. Сучено. М.: Мир,
1993. 368с.
39. Усков А.А. Интеллектуальные системы управления на основе методов нечеткой
логики / А.А. Усков, В.В. Круглов. Смоленск: Смоленская городская типография,
2003. 177с.
40. Фельдбаум А.А. Основы теории оптимальных автоматических систем. М.: Наука,
1966. 539с.
41. Филипс Ч. Системы управления с обратной связью / Ч. Филипс, Р. Харбор. М.: Ла-
боратория базовых знаний, 2001. 616с.
42. Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990. 292с.
43. Цыпкин Я.З. Релейные автоматические системы. М.: Наука, 1987. 575с.
44. Цыпкин Я.З. Теория линейных импульсных систем. М.: Физматгиз, 1963. 311с.

530
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Автоколебания 179 − − пропорционально-интегральный 75
Адаптивные системы управления 258 − − − − разностный 115
− − − активные 259 − − − − с предисторией 117
− − − аналитические 258, 274 Запас устойчивости 71
− − − интеллектуальные 259, 291 Звено типовое линейное 30
− − − обучающиеся 259, 291 − − − апериодическое второго порядка 33
− − − пассивные 259 − − − − первого порядка 31
− − − поисковые 258, 261 − − − дифференцирующее 38
− − − самонастраивающиеся 259, 274 − − − интегрирующее 37
− − − самоорганизующиеся 259, 288 − − − колебательное 34
− − − экстремальные 259 − − − усилительное 31
− − − − дискретные 265 Нелинейное с гладкой характеристикой 152
− − − − непрерывные 261 − − с многозначной характеристикой 155
− − − − шаговые 265 − − с однозначной характеристикой 152
Алгоритм стохастической аппроксимации 280 − − с релейной характеристикой 174
Алгоритмическая схема 39 − − с симметричной характеристикой 151
Амплитудно-частотная характеристика 26 − полуинерционное 32
− с запаздыванием 104
− − − логарифмическая 102 Идентификация динамических звеньев 282
− − − − желаемая 107 − − − с использованием косвенных методов 286
− − − − исходная 107 − − − − пробных сигналов 283
− − − − корректирующего звена 107 − − − − статистических методов 284
Астатические звенья 38 Частотного метода 282
Изображающая точка 166
База правил 319 Изоклина 171
Белый шум 244 Импульсная система 119
Импульсный фильтр 136
Вариационное исчисление 209 − элемент 137
Вероятностные характеристики случайных функ- Интеграл Дяамеля (свертки) 139,243
ций 238,240 Инференц-процедура 316
Весовая (импульсная переходная) функция 19 Информативные признаки образа 292
Вибрационная линеаризация 196 Искусственный нейрон 298
Воздействия возмущающие 6
− входные 6 Качественные показатели экстремальной системы
− задающие 7 264
− управляющие 6 Квантование по времени 119
Временные характеристики 19 − по уровню 119
Время регулирования 65, 148 Кибернетика 4
− техническая 5
Гармоническая линеаризация 186 Колебания вынужденные 177
Гомеостат Эшби 288 − свободные 178
Графы направленные 43 − собственные 178
Корректирующее устройство 275
Дефазтфикация 316 Коррекция систем управления параллельная 78
Динамическое программирование 221 − − − последовательная 77
Дискретные системы − − − с обратной связью 77
Дисперсия 238 Корреляционная функция собственная 239
− − взаимная 253
Единичная ступенчатая функция 19 Коэффициент гармонической линеаризации
− импульсная функция 19 186,191
− обратная связь 78 − демпфирования 34
− передачи графа 45
Живучесть 288 − передачи (усиления) 31
Кривые разгона 19
Закон необходимого разнообразия 288 Критерий устойчивости алгебраический 57
− регулирования 74 − − Гурвица 58, 144, 190
− − интегральный 73 − − Михайлова 52, 146, 187
− − пропорциональный − − Найквиста 63, 147, 189
− − пропорционально-дифференциальный 76 − − частотные 60, 144

531
− оптимальности аддитивный 204 Ошибка динамическая 65
− − интегральный 205 − статическая 56

Лингвистическая переменная 307 Пандемониум 293


Лингвистический терм 308 Передаточная функция гармонически линеаризо-
Линеаризация вибрационная 196 ванного звена 187
− гармоническая 186 − − замкнутой системы 46
− дифференциальных уравнений 12 − − импульсного фильтра 146
− статистическая 199 − − линейного звена 24
Линии переключения 176 − − разомкнутой системы 41
Логарифмические частотные характеристики 102 Переменные состояния 15
Логарифмический декремент затухания 69 − выходные 6
Логические операции четкие 305 Перерегулирование 65, 149
− − нечеткие 309 Переходная функция 19
Переходный процесс колебательный 55
Метод замороженных коэффициентов 103 − − монотонный 55
− поиска экстремума Гаусса-Зейделя 270 − − расходящийся 55
− − − градиентный 271, 279 − − сходящийся 56
− − − Бокса-Уилсона (крутого восхождения) 271 Перцептрон 295
− − − симплексный 272 Показатели качества переходного процесса 66,
− − − сканированием 273 148
− − − случайный 273 − − постоянная времени 32
− обучения системы на примерах 291 Потери на поиск 264
− потенциальных функций 296 Правило замены 311
− припасовывания 164 Предельный цикл 178
Модальный регулятор 91, 101 Преобразование Лапласа дискретное 129
Модуляция сигналов амплитудно-импульсная 137 − − прямое 22
− − широтно-импульсная 137 − − обратное 24
− − свойство линейности 22
Наблюдаемость 50 − − теорема дифференцирования 23
Наблюдатель состояния 98 − Фурье прямое 25
Нейронные сети многослойные 298 − − обратное
− − радиальные 299 Принцип дуальности 88
Нейросетевое управление параллельная схема 301 − максимума Понтрягина 230
− − последовательная схема 301 − оптимальности Беллмана 221
− − с обратной связью 302 − управления по возмущению
Нечеткая логика (фази-логика) 306 − − по отклонению 7
Нечеткие системы управления функциональная
схема 320 Разностное уравнение 121
− − − передаточные характеристики 322 Регулятор состояния 91
− − − последовательность процедур синтеза 324 Рецептор 293
− − − с нейросетевым управлением 332 Решетчатая функция 121
Нечеткий вывод 310
Нечеткое множество 307 Синглтон 307
Системы распознавания образов 292
Объект управления 6 − подчиненного управления 79
Оператор Заде 314 − управления автоматические 8
− Мамдани 314 − − адаптивные 8, 258
− Сугено 321 − − астатические 67, 75
− преобразования 18 − − дискретные 119
Оптимальный фильтр Винера 253 − − диссипативные 178
− − Калмана 257 − − импульсные 119
Отношения между множествами четкие 312 − − инвариантные 86
− − − нечеткие 313 − − интеллектуальные 288
Оценка качества процесса управления интеграль- − − консервативные 178
ная 69, 150 − − линейные 10
− − − − корневыми методами 68 − − минимально-фазовые 27
− − − − косвенными методами 68 − − многомерные 47
− − − − по частотным характеристикам 71 − − неадаптивные 8
− − − − прямыми методами 65 − − нелинейные 151

216
− − нечеткие 304 Функционал 209
− − оптимальные 203 Функция истинности 311
− − − по быстродействию 230 − переключения 265
− − особые 103 − принадлежности 307
− − релейные 119, 174 − смещения 197
− − с запаздыванием 104
− − с распределенными параметрами 107 Частота сопряжения 103
− − статические 67, 74 − среза 72, 103
Скользящий режим 182 Частотная характеристика (функция) 26
Случайные функции реализации 237 − − вещественная 26
− − сечение 237 − − − типовая 107
− − стационарные 238 − − логарифмическая 102
− − эргодические 239 − − мнимая 26
Соединение нелинейных звеньев параллельное Частотные методы синтеза 107
159 Четкая логика 304
− − − параллельно-встречное 160
− − − последовательное 157 Экстремаль функционала 210
Спектральная плотность 240 Экстремальные системы управления непрерыв-
Средняя квадратическая ошибка 205 ные 261
Статистическая динамика 237 − − − дискретные 265
Статистическое дифференцирование 245 Эргодический случайный процесс 239
− интегрирование 245
Степень устойчивости 68 w - преобразование 43
Структурная схема 39 z - преобразование прямое 129
Структурные преобразования линейных систем − модифицированное 135
41 − обратное 133
− − нелинейных систем 162 − свойства 131
δ -функция 19
Теорема Ляпунова о линеаризованной системе 56
− об n-интервалах 208
− разложения Хевисайда-Карсона 24
− свертывания 39
Типовые звенья 31
− сигналы 19

Узел устойчивости 170


− неустойчивый 170
Ультраустойчивость 90
Управляемость 50
Уравнение Винера-Хопфа 254
− динамического программирования в дискрет-
ной форме 213
− − − в непрерывной форме
− Эйлера 212
Условный экстремум 210
Устойчивость в большом 54
− в малом 54
− систем с запаздыванием 110

Фазовая плоскость 167


− траэктория 166
Фазовое пространство 166
Фазовый портрет 166
Фази-логика 306
Фази-регулятор 312
Фазификация 315
Фокус неустойчивый 169
− устойчивый 169
Формула Мэзона 45
− Парсеваля 246

217
Константин Петрович ВЛАСОВ

ТЕОРИЯ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ

Редактор И. Г. Абраменко

Лицензия ДК № 245 от 16.11.00 г.


Издательство Гуманитарный Центр. 61166, Украина, Харьков, тел. (0572) 195-240, e-
mail: center@bars.net.ua.

Подписано в печать 22.02.2006. Формат145х205. Бумага офсетная. Печать офсетная.


Усл. печ. л. 14,88. Тираж 1500 экз. Заказ 0798-2002.

Отпечатано в типографии ГП ХМЗ ФЭД. 61023, Украина, г. Харьков, ул. Сумская, 132.
Тел./факс (0572) 19-67-82, тел. 40-22-51. E-mail: 39fed@ukr.net.

Вам также может понравиться