Академический Документы
Профессиональный Документы
Культура Документы
ВЛАСОВ
ТЕОРИЯ
АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ
Учебное пособие
3
УДК 62-50 (075.80)
ББК 32-065
Власов К.П. Теория автоматического управления. Учебное пособие. – Х.: Издательство «Гуманитарный центр»,
2006.- с.
Изложены основы современной теории автоматического управления. Дана классификация АСУ по раз-
личным признакам. Рассмотрены методы составления и решения дифференциальных уравнений движения от-
дельных звеньев АСУ, приведены статические и динамические характеристики типовых звеньев, а также прин-
ципы построения структурных схем систем управления. Рассмотрены методы расчета автоматических систем,
позволяющие анализировать их устойчивость и качество переходных процессов в системах. Излагаются основ-
ные методы синтеза систем управления различного класса Приведенный материал охватывает широкий круг
вопросов и методик расчета для линейных и нелинейных, непрерывных и дискретных, оптимальных и адаптив-
ных, нечетких и других автоматических систем управления.
Учебное пособие предназначено для студентов технических вузов, изучающих автоматические системы
управления
2
СОДЕРЖАНИЕ
ПРЕДИСЛОВИЕ………………………………………………………… 7
ВВЕДЕНИЕ………………………………………………………………. 8
РАЗДЕЛ I
ЛИНЕЙНЫЕ АВТОМАТИЧЕСКИЕ СИСТЕМЫ УПРАВЛЕНИЯ…. 14
215
4.3. Параметрический синтез устройств управления……………………...……… 87
4.3. Инвариантные системы…………………………………………………..……... 90
4.5. Синтез модальных регуляторов……………………………….……………….. 95
4.5.1. Синтез регуляторов состояния……………………………….……………... 95
4.5.2. Принципы построения наблюдателей состояния………..………….……….102
4.5.3. Модальный регулятор…………………………………………….…………. 105
4.6. Частотные методы АСУ…..……………………………………….…………….
107
4.6.1. Логарифмические частотные характеристики…..............……….………… 107
4.6.2. Синтез АСУ с помощью логарифмических амплитудно-частотных
характерстик….....................…………………………….…….…………….
112
РАЗДЕЛ II
ОСОБЫЕ ЛИНЕЙНЫЕ АВТОМАТИЧЕСКИЕ СИСТЕМЫ
УПРАВЛЕНИЯ …………………………………………………………………….………
119
РАЗДЕЛ III
НЕЛИНЕЙНЫЕ АВТОМАТИЧЕСКИЕ СИСТЕМЫ
УПРАВЛЕНИЯ……………………………………………………………………………..
165
РАЗДЕЛ IV
СПЕЦИАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ……………........................ 215
217
11.1.1. Непрерывные экстремальные системы………………………………… 272
11.1.2. Дискретные экстремальные системы…………………………………... 276
11.1.3. Методы поиска экстремума в многоканальных экстремальных
системах……………...…………………………………………………………... 281
11.2. Самонастраивающиеся системы управления……………………………... 284
11.2.1. Аналитические самонастраивающиеся системы……………………… 285
11.2.2. Идентификация динамических звеньев системы……………………… 292
11.3. Интеллектуальные системы управления……………………………………. 299
11.3.1. Самоорганизующиеся системы………………………………………….. 299
11.3.2. Обучающиеся системы……………………………………………………. 302
11.3.3 Искусственные нейронные сети………………………………………… 307
218
ПРЕДИСЛОВИЕ
219
ВВЕДЕНИЕ
220
система может ставить себе и такие цели, которые противоречат целям системы более вы-
сокого уровня, и поэтому фатализм следует признать несостоятельным.
Говоря о кибернетике, как о теории автоматизма, мы выделяем другую ее сторону,
примыкающую к практике, – проблему реализации поставленной цели методами управле-
ния объектами. Нужно иметь в виду, что объекты управления можно классифицировать по
самому существенному признаку на живые и неживые. По одну сторону грани стоит че-
ловек вместе с животными и растениями, а по другую автомат – создание рук человече-
ских. Можно долго перечислять, чем отличается человек от автомата, но не к отрицанию
этих различий сводятся идеи кибернетики, а к поиску, исследованию аналогий между жи-
вым организмом и техническим устройством. Заметим, что все попытки человека в точно-
сти скопировать и воспроизвести с помощью технического устройства технологический
процесс, выполняемый живым организмом, были безуспешными: самолет летает не так,
как птица, подводная лодка плавает не так, как рыбы, и т.д. Отсюда следует, что если под
разумом понимать способность учиться и извлекать уроки из опыта, адекватно реагиро-
вать на новые ситуации, то можно утверждать, что разумные управляющие машины могут
быть созданы, но они будут выполнять свои функции не так, как человек. Уже сейчас ав-
томаты во много раз увеличивают интеллектуальные возможности человека, во многом
избавляя его от рутинной работы. Поэтому будущий мир рисуется как содружество авто-
мата и человека. Но надо всегда помнить, что как ни велика разница между обломком
камня и автоматом, она все же меньше, чем между человеком, создавшим этот автомат, и
его предком, впервые взявшим в руки этот камень, так как человек развивается гораздо
быстрее, чем неживая природа.
Учитывая изложенное, уместно напомнить, что, по А.И.Бергу, кибернетика – это
наука об управлении в сложных динамических системах различной природы, где слож-
ность понимается как наличие в системе разнородных элементов (человек, природа, тех-
ника) и разнообразных связей между ними (положительных, отрицательных, прямых, об-
ратных и др.).
В зависимости от класса объекта управления кибернетика подразделяется на тех-
ническую, организационную, экономическую, медицинскую и др.
Техническая кибернетика (или теория автоматического управления) – отрасль
науки, изучающая технические системы с помощью идей и методов кибернетики. Основ-
ная задача управления техническим объектом – найти и реализовать в данных условиях
алгоритм*) управления, при котором выполняются требования, предъявляемые к процессу.
*)
Алгоритм – предписание, определяющее содержание и последовательность операций, переводящих исход-
ные данные в искомый результат. При этом алгоритм должен обладать свойствами определенности, массовости и ре-
зультативности.
221
Выбор наиболее рационального алгоритма управления на основании имеющейся инфор-
мации – ярко выраженная экстремальная задача. Таким образом, анализ информационных
процессов в системе с целью их алгоритмизации и синтез систем управления, реализую-
щих этот алгоритм, и являются задачей теории автоматического управления.
Требованиями, предъявляемыми к управляемому процессу, могут являться: огра-
ничения на входные координаты (например, различного рода допуски, ошибки, погреш-
ности и т.д.); экстремальные условия (например, получение максимальной мощности,
КПД, минимальной себестоимости и т.д.); некоторые показатели качества.
Техническими средствами для реализации систем управления являются средства
получения информации (датчики), ее передачи и обработки и средства регулирования (ре-
гуляторы, исполнительные механизмы, регулирующие органы).
Протекание технологического процесса или поведение технического устройства
характеризуются некоторыми переменными величинами. Если речь идет об управлении,
то процессы и устройства рассматриваются как объект управления (ОУ), желаемое пове-
дение которого должно быть обеспечено. Переменные, которые характеризуют функ-
ционирование объекта управления, называют выходными величинами y (чаще всего, это
физическая величина). Иногда их называют выходными координатами системы (рис.1).
В реальных условиях на объект управления оказывает воздействие внешняя среда.
Все многообразие этого воздействия учесть невоз-
f
можно. Поэтому в поле зрения оставляют лишь вели-
x =u + f
чины, которые оказывают заметное влияние на вы-
222
Суть принципа управления по возмущению (принципа Понселе) состоит в том, что
для уменьшения влияния возмущения f на выходные величины объекта y осуществляет-
ся контроль этого возмущения, и при его изменении управление u меняют так, чтобы
скомпенсировать влияние возмущения. Функциональная схема такой АСУ показана на
рис.2.
Основной недостаток управления по
y* f
возмущению заключается в том, что данная
УУ ЧЭ система является разомкнутой, т.е. текущее
значение величины y не учитывается при
u ИУ ОУ y управлении объектом. Это означает, что харак-
Рис.2 тер управляющих воздействий зависит от
ИУ – исполнительное устройство;
ЧЭ – чувствительный элемент; УУ – устройство функционирования объекта лишь в той степе-
управления
ни, в какой учтено влияние возмущения f и
управления u на выходную величину y . В большинстве случаев полная информация о
таком влиянии отсутствует, в связи с чем разомкнутая система не может обеспечить же-
лаемое поведение системы с достаточной точностью. Достоинством управления по воз-
мущению систем является принципиальная возможность упреждающей компенсации
влияния возмущения f на функционирование объекта за счет соответствующего управ-
ления u . В идеале выходная величина y не зависит от f (инвариантная система).
В случае необходимости изменения выходной величины y в УУ подается дополнитель-
ный сигнал y *, который называется задающим воздействием.
Основным признаком систем, использующих принцип управления по отклонению
управляемой величины y от заданного значения y * (принцип Ползунова – Уатта), явля-
ется наличие обратной связи (ОС), которая обеспечивает зависимость управления u
(входной величины) от управляемой (выходной) величины y (рис.3).
f Отклонение управляемой величины от заданно-
u ИУ ОУ го значения Δ y может быть вызвано разными причи-
у
ЧЭ
ОС нами, в том числе и изменением задающего воздейст-
Рис.3
для изменения управления u до тех пор, пока Δ y не
УС-устройство сравнения
M
снизится до допустимого значения, в частности до ну-
224
Неадаптивные АСУ классифицируются по различным признакам, основные из ко-
торых приведены ниже.
225
Классификация неадаптивных АСУ
1. По принципу действия
Разомкнутые Замкнутые
Комбинированные
(по возмущению) (по отклонению)
Одномерные Многомерные
Непрерывные Дискретные
6. По характеру параметров
226
РАЗДЕЛ I
НИЯ
227
превращаться из одного вида в другой, причем это превращение тоже протекает во време-
ни.
Пример 1.1. Составим математическое описание процесса заполнение ёмкости
жидкостью.
Изменение объёма жидкости в ёмкости dV за время dt можно определить восполь-
зовавшись законом сохранения вещества:
dV = (Qвх − Qвых )dt , (1.1)
При ΔQ>0 уровень жидкости в емкости будет повышаться, а при ΔQ<0 снижаться.
Переписав (1.2) в виде:
dH
= kΔQ ,
dt
где k=1/F – коэффициент пропорциональности, получим дифференциальное уравнение,
описывающее процесс изменения уровня жидкости в емкости.
Пример 1.2. Составим математическое описание системы двигатель - рабочая машина.
В соответствии с законом сохранения энергии имеем:
Aд = Ас + ΔАк , (1.3)
Pд = Pс + ΔPдин ,
228
ω2
Для системы вращающихся тел имеем: Aк = J , где ω – частота вращения двига-
2
k
теля; J = ∑ mi ri2 = mρ 2 – момент инерции; mi – масса i-й частицы тела, удаленной от оси
i =1
k
вращения на расстояние ri, m = ∑ mi ; ρ – приведенный радиус инерции,
i =1
k k
ρ 2 = (∑ mi ri 2 ) ∑m . i
i =1 i =1
Если момент инерции зависит от угла поворота α, т.е. J = f(α), который, в свою оче-
редь, зависит от времени α(t), то
d ⎛⎜ ω2 ⎞ dω ω2 dJ dα
Pдин = J (α) ⎟ = Jω + .
dt ⎜⎝ 2 ⎟⎠ dt 2 dα dt
dω ω2 dJ
M дин = J + .
dt 2 dα
Если J = const, то M дин = Jdω / dt . Тогда с учетом уравнения (1.3) уравнение движе-
ния системы двигатель – рабочая машина можно записать так:
dω
J = Mд − Mс. (1.4)
dt
M с (ω) и J = const. Вид этих зависимостей определяет тип уравнения (1.4), которое может
быть отнесено к линейным или нелинейным. Если нелинейность гладкая, без скачков, и
отклонение от номинального режима работы не очень существенно, то нелинейное урав-
нение можно с определенной погрешностью заменить на линейное. При этом существенно
упрощается анализ динамических свойств системы управления.
229
Замена нелинейного уравнения линейным называется линеаризацией. При этом все
нелинейные функции переменных, входящих в уравнение движения, разлагают в ряд Тей-
лора в окрестностях рабочей точки (установившегося значения переменных). На том ос-
новании, что отклонения малы, в разложении оставляют лишь члены, содержащие откло-
нения в первых степенях, после чего из полученных уравнений вычитают уравнения рав-
новесия (статики) и получают запись линеаризованных уравнений в отклонениях.
В частности, нелинейная функция двух переменных F(x, y) разлагается
в окрестностях рабочей точки (x0, y0) в ряд Тейлора по формуле
∂F ∂F
F ( x, y ) = F ( x0 + Δx, y 0 + Δy ) = F ( x0 , y 0 ) + Δx + Δy +
∂x 0 ∂y 0
n
∞
1⎛ ∂ ∂ ⎞
+ ∑ ⎜ Δx + Δy ⎟ F ( x0 , y0 ).
n = 2 n ! ⎝ ∂x ∂y ⎠
Линейная часть приведенного разложения определяется лишь первыми тремя чле-
нами, остальными слагаемыми можно пренебречь в силу малости Δx, Δy. Эту процедуру
можно интерпретировать как замену уравнения поверхности F(x,y) уравнением плоскости
вида: AΔx + BΔy + C = F ( x, y ) .
В условиях примера 1.2 линеаризация функций M д ( x, ω) , M с (ω) в окрестностях со-
⎧ ∂M д ∂M д
⎪M д ( x, ω ) = M д ( x 0 , ω 0 ) + Δx + Δω ;
⎪ ∂x 0 ∂ω 0
⎨ (1.5)
⎪ M (ω ) = M (ω ) + ∂M c Δω .
⎪ c c 0
∂ω 0
⎩
Подставив соотношения (1.5) в уравнение (1.4) и вычтя из полученного выраже-
ния уравнение равновесия M д ( x0 , ω 0 ) − M с (ω 0 ) = 0 , получим
dω ⎛ ∂M c ∂M д ⎞ ∂M д
J +⎜ − ⎟⎟Δω = Δx .
dt ⎜⎝ ∂ω ∂ω ⎠ ∂x 0
230
ризованное) дифференциальное уравнение первого порядка с постоянными коэффициен-
тами: Т – постоянная времени и k – коэффициент передачи (усиления).
Заметим, что в данном случае мы учитывали только одну энергетическую емкость,
представляющую собой вращающиеся части машины-двигателя, в которых запасается ки-
нетическая энергия. Если число таких емкостей в системе равняется n, то она будет опи-
сываться ДУ n-го порядка. Напомним, что системы, поведение которых описывается ли-
нейными (или линеаризованными) ДУ, относятся к классу линейных.
Пример 1.3. Пусть объект описывается дифференциальным уравнением второго
порядка:
Тогда разложение функции F ( &y&, y& , y, x) в ряд Тейлора без учета слагаемых второго
и высших порядков малости будет иметь вид:
∂F ∂F ∂F ∂F
F ( &y&, y& , y, x) = F0 + Δ &y&+ Δy& + Δ y+ Δx.
∂y& 0 ∂y& 0 ∂y 0 ∂x 0
Воспользовавшись выражением (1.10) и учтя что х0=6; у0=3,1; &y&0 = y& 0 = 0 найдем
значения функции F0 и частных производных, входящих в разложение. Имеем:
231
∂F ∂F
F0 = 5 x0 y 03 − 8 y0 x02 = x0 y0 (5 y02 − 8 x0 ) = 0 ; = 6; = 17 y0 = 52,7;
∂ &y& 0 ∂ y&
∂F ∂F
= 17 y& 0 + 15 y 02 x0 + 8 x02 = 577; = 5 y03 − 16 y0 x0 = −148,6.
∂y 0
∂x 0
232
поведение системы, к системе из n дифференциальных уравнений первого порядка. Запи-
сав эти уравнения в компактной матричной форме, получаем математическую модель сис-
темы в переменных состояниях, которая вполне приемлема для компьютерного анализа.
Именно последнее обстоятельство и делает целесообразным описание динамических сис-
тем в переменных состояния во временной области. C
Проиллюстрируем понятие переменных со-
стояния на примере электрической цепи, питаю-
щейся от источника тока i, приведенной на
рис.1.2.Заметим, что этот ток является входным
Рис воздействием х(t).
Состояние рассматриваемой системы можно полностью охарактеризовать двумя
переменными ν1 и ν2, где ν1 - напряжение uс на конденсаторе С; ν2 – ток iL в катушке ин-
дуктивности L. Выбор этих переменных произведен исходя из того, что общая энергия Е в
цепи RLC зависит именно от них:
E = 0,5( Li L2 + Сu c2 )
Таким образом, переменные ν1(t)= uс(t) и ν2(t)= iL(t) несут информацию о полной
энергии электрической цепи и, следовательно, о состоянии системы в текущий момент
времени t. Подчеркнем, что число переменных состояния равно числу независимых эле-
ментов системы, накапливающих энергию: в элементе L накапливается магнитная энер-
гия, а в элементе С – электрическая.
Используя законы Кирхгофа, можно записать:
ic+iL=i; uL + uR = uc или
du c
С + iL = i ; (1.12)
dt
diL
L + u R = uc . (1.13)
dt
Здесь uR=RiL – выходная переменная системы y(t); R – выходное сопротивление.
Запишем уравнение (1.12) и (1.13) относительно переменных состояния ν1 = uc и
233
системы, в момент времени t=t0, дает возможность найти зависимости ν1(t) и ν2(t) при t>t0,
т.е. определить будущее поведение системы.
Заметим, что принятые переменные состояния uс и iL не являются единственными.
Всегда можно выбрать другой набор переменных, например uс и uL. Тогда новые перемен-
ные состояния ν 1* и ν 2* будут связаны со старыми ν1 и ν2 соотношениями:
ν 1* = u c = ν 1 ,
ν 2* = u L = u c − Ri L = ν 1 − Rν 2 .
Таким образом, в реальной системе всегда можно образовать несколько комбина-
ций переменных состояния, которые определяют энергию, запасенную в системе и, следо-
вательно, описывают ее динамику. Это дает возможность более широкого выбора пере-
менных состояния, в качестве которых обычно принимают физические величины доступ-
ные для измерения тем или иным способом.
Систему уравнений (1.14) с учетом того, что i=x можно записать в матричной фор-
ме:
d ⎡ν 1 ⎤ ⎡ 0 − 1C ⎤ ⎡ν 1 ⎤ ⎡ 1 ⎤
=⎢ ⎥ ⎢ ⎥ + ⎢ C ⎥ ⋅ i. (1.15)
dt ⎢⎣ν 2 ⎥⎦ ⎢ 1 − R ⎥ ⎣ν 2 ⎦ ⎣⎢ 0 ⎦⎥
⎣ L L⎦
Матрица – столбец, состоящая из переменных состояния, называется вектором со-
стояния ν .
Если в общем случае вектор входных сигналов обозначить через х , то дифферен-
циальное уравнение состояния системы запишется в виде:
ν& = Аν + В х , (1.16)
где А – квадратная матрица коэффициентов при переменных состояния νi ( i = 1, n ) раз-
234
у = Сν +D х , (1.17)
где С и D – матрицы соответствующих коэффициентов.
Для рассмотренной цепи RLC уравнение выходной переменной можно записать в
виде:
y=Rν2. (1.18)
Здесь учтено, что у=uR, iL=ν2. В матричной форме уравнение (1.18) можно записать в ви-
⎡ν ⎤
де: y = [0, R ] ⋅ν +[0,0]х , где ν = ⎢ 1 ⎥ .
⎣ν 2 ⎦
y (t ) = y1 (t ) + y2 (t ) ,
235
. y1 (t ) = C e pt (1.20)
a0 p n C e pt + a1 p n −1C e pt + K + a n −1 p C e pt + a n C e pt = 0 ,
a0 p n + a1 p n −1 + K + an −1 p + an = 0 . (1.21)
а б ⎧0 ∀ t < 0;
1(t ) = ⎨
1(t) δ(t) ⎩1 ∀ t ≥ 0.
Единичная импульсная функция (рис.1.4, б) опи-
1
сывается выражением:
t ⎧∞ ∀ t = 0; ∞
δ(t ) = ⎨ при этом ∫ δ(t )dt = 1 .
⎩ 0 ∀ t ≠ 0; −∞
Рис.1.4.
Очевидно, что функции 1(t) и δ(t) связаны между собой соотношением δ(t ) = 1′(t ) . При по-
даче на вход системы типового входного воздействия вида 1(t ) или δ(t ) выходная величи-
на системы будет изменяться во времени тем или иным образом. Это изменение
и является реакцией системы на определенное воздействие.
Если x(t ) = 1(t ) и начальные условия нулевые (система находится в установившемся
состоянии), то реакция системы на это воздействие называется переходной функцией или
236
переходной характеристикой h(t ) . Если x(t ) = δ(t ) и начальные условия также нулевые, то
реакция системы называется импульсной переходной характеристикой или функцией веса
w (t ) .
При этом общее решение имеет тот же вид, что и ранее y1 (t ) = C1 e −t / T ; а частное
решение ищется в той же
а б
y
форме, что и правая часть
x
ДУ, т.е. в виде линейной
kT
tgα = k зависимости y2 (t ) = C2t + C3 .
y (t ) = C1 e −t / T + kt − kT
237
При начальных условиях y(0) = 0 найдем C1 = Tk. Окончательно получим
[ ]
y (t ) = k t − T (1 − e −t /T ) .
0 = С1 + С 2 + 0,26 ⎫
⎬.
0 = −3,8С1 − 26,2С 2 ⎭
Решив полученную систему уравнений, найдем С1= - 0,304; С2= 0,044. Таким обра-
зом, решение ДУ (1.24) при подаче на вход скач-
кообразного единичного возмущения x(t)=1(t)
окончательно примет вид:
y (t ) = h(t ) = 0,26 − 0,304e −3,8t + 0,044e −26, 2t .
На рис.1.7. представлен график переходно-
го процесса, который практически завершается за
Рис. 1.7
1 с.
238
Применение преобразования Лапласа позволяет перейти от решения системы диф-
ференциальных уравнений к решению системы алгебраических уравнений. Кроме того,
отпадает необходимость специального определения постоянных интегрирования, а общее
решение неоднородного ДУ при любой правой части определяется сразу, т.е. исключается
раздельное нахождение общего y1(t) и частного y2(t) решений.
Пусть f (t) – действительная функция действительного переменного t, удовлетво-
ряющая условиям Дирихле (непрерывная и дифференцируемая на рассматриваемом ин-
тервале) и равная нулю при t < 0. Будем называть эту функцию оригиналом. Каждому ори-
гиналу f (t) всегда можно поставить в соответствие функцию F(p) комплексного перемен-
ного p = α ± jω , определенную как интеграл вида:
∞
F ( p ) = L{ f (t )} = ∫ f (t )e − pt dt , (1.25)
0
e − at ∞ ∞
Le{ }= ∫ e
− at − at
e − pt
dt = −
1
p+a
e −( p + a )t =
1
p+a
0 0
ω
e − jωt {
L e − jωt = cos ω t − j sin ω t = } 1
= 2
p
p + jω p + ω
−j 2
2
p +ω2
cos ω t
L{cos ω t } =
p
p +ω2
2
sin ω t ω
L{sin ω t } =
p +ω2 2
tn {}
L tn =
n!
p n +1
239
Рассмотрим некоторые свойства преобразования Лапласа.
1. Свойство линейности. Изображение алгебраической суммы нескольких функций
равно сумме изображений этих функций:
⎧n ⎫ n
L ⎨ ∑ ai f i (t ) ⎬ = ∑ ai L{ f i (t )} . (1.26)
⎩ i =1 ⎭ i =1
L { f ′( t )} = pF ( p ) − f ( 0 ) . (1.27)
(1.27).
{ } n
L f ( n ) (t ) = p n F ( p ) − ∑ p n − k f ( k −1) (0) . (1.28)
k =1
{ }
L f ( n ) (t ) = p n F ( p) .
a0 y(n) + a1 y(n−1) +K+ an−1 y& + an y = b0 x(m) + b1 y(m−1) +K+ bm−1x& + bm x . (1.29)
240
Умножив (1.29) на e − pt после интегрирования его по t в пределах от 0 до ∞ при ну-
левых начальных условиях, получим это уравнение, преобразованное по Лапласу:
(a0 pn + a1 pn−1 +K+ an−1 p + an )Y( p) = (b0 pm + b1 pm−1 +K+ bm−1 p + bm) X ( p) .
Отсюда
b0 p m + b1 p m−1 + K+ bm−1 p + bm B( p)
Y ( p) = n n−1
X ( p) = X ( p) . (1.30)
a0 p + a1 p + K+ an−1 p + an A( p)
1 α + j∞
y (t ) = L−1{Y ( p )} = ∫ Y ( p) e dp .
pt
2πj α − j∞
Y ( p ) = B( p) / A( p ) , где B(p) и A(p) – полином соответственно m-й и n-й степени, причем для
n B ( pk ) p k t
y (t ) = ∑ e , (1.32)
k =1 A′( p k )
*)
Заметим, что наиболее практичным способом нахождения оригинала y(t) по известному изображению Y(p),
является использование теоремы вычетов. Рассматриваемой в теории функций комплексного переменного.
241
Пример 1.6. Пусть ДУ системы уравнения имеет вид
a 0 &y& + a 1 y& + a 2 y = kx .
Y ( p) k
W ( p) = = .
X ( p) a0 p 2 + a1 p + a2
⎧ 1 ⎫ 2 B ( p k ) pk t
w(t ) = L−1 {W ( p )} = L−1 ⎨ 2 ⎬=∑ e . (1.33)
⎩ p + 3 p + 2 ⎭ k =1 A′( p k )
Имеем A(p) = p2 + 3p + 2 = 0; p1 = –1; p2 = –2; A′(p) = 2p + 3; B(p) = k = 1. Тогда,
подставив B(p), A′(p), p1 и p2 в выражение (1.33), получим:
1 1
w (t ) = e−t + e − 2t = e − t − e − 2t .
2( −1) + 3 2( −2) + 3
Рис. 1.8
Графики зависимостей w (t ) и h(t) приведе-
ны на рис.1.8.
242
∞
Ф{ f (t )} = F ( jω) = ∫ f (t ) e − jωt dt .
−∞
Q(ω )
где A(ω ) = W (iω ) = P 2 (ω ) + Q 2 (ω ) ; ϕ (ω ) = arg W (iω ) = arctg .
P(ω )
*)
Более подробно логарифмические частотные характеристики рассмотрены в параграфе 4.6.
243
x * (t ) = a e jωt [ x(t ) = Im x * (t )] , частное решение уравнения (1.34) отыскивается в том же ви-
де, что и входной сигнал x(t): y(t) = A0 sin(ωt + ϕ) или y*(t) = A0 e j(ϕ + ωt).
Подставив x*(t) и y*(t) в уравнение (1.34) и сократив его на e jωt, окончательно по-
лучим A(jω)A0e jϕ = B(jω)a, откуда:
A0 jϕ B( jω )
e = = W ( jω ) . (1.37)
a A( jω )
A0
W ( jω) = ; argW ( jω) = ϕ .
a
1
Геометрическое место концов вектора частотной
функции W(jω) на комплексной плоскости при изменении
частоты от нуля до бесконечности называется годографом
вектора W(jω) (рис.1.9, в).
Заметим, что в общем случае для нахождения
функции действительного переменного t при известной
функции Y(jω) необходимо воспользоваться обратным
преобразованием Фурье:
1 ∞
y ( t ) = Ф −1 {Y ( j ω )} = jω t
∫ Y ( jω) e d ω .
2π −∞
244
Однако при определенных условиях существует однозначная связь между A(ω) и ϕ(ω),
а также P(ω) и Q(ω). Это позволяет упростить исследования систем, ограничиваясь, на-
пример, рассмотрением только A(ω) или P(ω). В теории интегралов Фурье доказывается,
что условие существования однозначной связи заключается в том, чтобы частотная функ-
ция W ( jω ) = B ( jω ) A( jω ) не имела ни нулей, ни полюсов в нижней полуплоскости кор-
ней полиномов числителя и знаменателя (нули – корни полинома B(jω) = 0, следовательно,
при этом W(jω) = 0, а полюса – корни полинома A(jω) = 0, сле-
+j
довательно, W(jω) = ∞).
jω
Системы, которые удовлетворяют этим условиям, назы-
ваются минимально- фазовыми (рис.1.10). Из всех возможных
+
систем с одной и той же АЧХ они дают наименьший сдвиг фаз
–α α
ϕ при любой частоте ω.
Р
Пример1.7. Пусть динамические звенья имеют следующие передаточные функ-
jω − a ω 2 − a 2 2ω a
ции W1(jω) = 1 и W 2 ( j ω ) = = 2 + j 2 , где a = const.
jω + a ω + a 2
ω + a2
Поскольку корень числителя W2(jω) лежит в нижней полуплоскости (ω1 = – ja),
второе звено принадлежит к классу неминально-фазовых, что свидетельствует о неодно-
значности связи между амплитудно- и фазо-частотными характеристиками этого звена.
Убедимся в справедливости сказанного, определив АЧХ и ФЧХ для каждого из
звеньев. Имеем:
ω 2 + a2
A1(ω) = 1; ϕ1(ω)=0, A2 (ω ) = W2 (ω ) = = 1;
ω 2 + a2
Q(ω ) 2ω a
ϕ 2 (ω ) = arctg
= arctg 2 .
P(ω ) ω − a2
Анализ полученных частотных характеристик показывает, что при одинаковых ам-
плитудно-частотных характеристиках звеньев их фазо-частотные характеристики различ-
ны: в то время как ϕ1(ω)=0 при любых ω, ϕ2(ω) отлична от нуля при ω ≠ 0 . Следовательно,
связь между A2(ω) и ϕ2(ω) неоднозначна и эти характеристики необходимо рассматривать
совместно.
245
Основным оператором линейной системы является линейное дифференциальное
уравнение, которое позволяет получить любые другие формы операторов преобразования.
Например, пусть система управления описывается ДУ первого порядка
a 0 y& + a1 y = b0 x . (1.38)
Y ( p) b0
W ( p) = = . (1.39)
X ( p ) a 0 p + a1
Y ( jω ) b0
W ( jω ) = = . (1.40)
X ( jω ) a0 jω + a1
W ( j ω ) = W ( p ) p = jω . (1.41)
Решив ДУ (1.38) при типовом единичном ступенчатом возмущении x(t) = 1(t) и ну-
левых начальных условиях, получим переходную функцию h(t):
b0 ⎛⎜ − 1t ⎞
a
a0 ⎟
y(t ) x (t )=1(t ) = h(t ) = 1− e .
a1 ⎜⎝ ⎟
⎠
246
Воспользовавшись (1.39) и учтя, что L{δ(t)} = 1, получим: Y(p) = W(p) = L{w(t)},
откуда
w(t) = L-1{W(p)} (1.43)
Таким образом, соотношения (1.38) – (1.43) позволяют найти любой оператор пре-
образования сигналов линейной системы [ДУ, W(p); W(jω), h(t), ω (t ) ], если известен хотя
бы один из них.
247
рядок не выше второго, и таким образом, представить реальное звено в виде звеньев 1-5.
Поэтому эти звенья обычно называются типовыми.
Предполагается, что все звенья являются звеньями направленного действия (т.е.
выходная величина не оказывает влияния на входную). Каждое звено характеризуется
уравнением движения (динамики), передаточными и частотными функциями, временны-
ми характеристиками.
(Tp + 1)Y ( p ) = kX ( p ) ,
Y ( p) k
• передаточная функция: W ( p) = = ;
X ( p ) Tp + 1
248
• частотные характеристики:
k k kTω
АФЧХ - W ( jω) = = −j = P(ω) + jQ(ω) ,
Tjω + 1 T ω +1
2 2
T ω2 + 1
2
k
АЧХ - A(ω ) = W ( jω ) = , (рис1.12,б);
T 2ω 2 + 1
Q (ω )
ФЧХ - ϕ (ω ) = arctg = arctg( −ωT ) , (рис.1.12 в);
P (ω )
• временные характеристики:
переходная функция - h(t) = k(1-e–t / T ), (рис.1.12, г);
функция веса - w(t ) = h′(t ) = (k / T ) e −t / T , (рис.1.12, д).
Заметим, что некоторые объекты управления
характеризуются показателями, которые
являются функциями не только времени, но и пре-
образованных координат, и описываются уравне-
ниями в частных производных. Такие объекты
встречаются в различных тепловых, диффузионных и электромагнитных устройствах. В
этом случае зависимость переменных может носить степенной характер и в дифференци-
альном уравнении может появиться слагаемое, содержащее переменную (временную или
пространственную) в дробной степени. Например, если f(t) = tα, где 1 > α > –1, но α ≠ 0, то
изображение этой функции будет
∞ ∞ ∞
Θα −Θ dΘ 1
L{t α } = ∫ t α e − pt dt = ∫ α
e = α +1 ∫ Θα e −Θ dΘ (1.44)
0 0 p
p p 0
Здесь произведена замена переменных pt = Θ, и учтено, что dt = dΘ / p и t = Θ / p .
−
1
π π 1
π π 1
L{t } = 2
= ; L{t 2 } = = ; L {t } =
p −0,5+1 p 2 p 0,5+1 2p p p2
249
h(t) Таким образом, ДУ, содержащее слагаемое в дроб-
ной степени, после преобразования по Лапласу может со-
k
держать p . Тогда передаточная функция примет вид:
1
2 k
W ( p) =
t
A( p )
Рис.1.13 Передаточная функция вида (1.45) называется ир-
рациональной. В частности, при А( p )=Т p +1, получим
k
W(p) = .
T p +1
Звено с такой передаточной функцией иногда называют – полуинерционным.
При этом Y(p) = W(p)X(p) и изображение переходной функции будет
Н(р) = [k /(T p + 1)](1 / p) . Произведя замену переменных p = s , найдем псевдоизображе-
ние H(s) = k/(Ts + 1)s2, которое дает возможность найти оригинал h(t).
На рис.1.13 для сравнения приведены переходные функции инерционного (кривая 1) и по-
луинерционного (кривая 2) звеньев.
− ξ ± ξ 2 −1
корни которого вещественные и отрицательные: p1, 2 = .
T
Разложив правую часть (1.47) на множители характеристическое уравнение звена
можно записать в виде:
(T1 p + 1)(T2 p + 1) = 0 , (1.48)
с корнями р1=-1/Т1; р2=-1/Т2.
Сравнив (1.47) и (1.48) получим: Т2=Т1Т2; 2ξТ=Т1+Т2 следовательно, при известных Т
и ξ можно найти Т1 и Т2 и наоборот.
• передаточная функция
250
Y ( p) k k 1
W ( p) = = 2 2 = ⋅ ,
X ( p ) T p + 2T ξ p + 1 (T1 p + 1) (T2 p + 1)
Таким образом, апериодическое звено второго порядка можно представить в виде двух
звеньев первого порядка.
• частотные характеристики:
k k (1 − T 2ω2 ) 2 ξ Tωk
АФЧХ- W ( jω) = = − j =
2 2
(1 − T ω ) + j 2 ξ Tω 2 2 2
(1 − T ω ) + (2 ξ Tω) 2
(1 − T ω 2 ) 2 + (2 ξ Tω ) 2
2
• временные характеристики:
переходная функция – h(t ) = C1 e p1t + C2 e p 2 t + k
(рис.1.14, г);
весовая функция – w (t ) = C 1 p1 e p1t + C 2 p 2 e p1t
(рис.1.14, д).
Постоянные C1 и C2 находят из начальных
условий h(0) = h′(0) = 0. Окончательно получим
⎛ −
t
−
t ⎞ ⎛ t t ⎞
⎜ T1 T1 T2 T2 ⎟; k ⎜ − T1 − T2 ⎟
h(t ) = k ⎜1 − e + e ⎟ w(t ) = T − T ⎜ e − e ⎟
⎜ T1 − T2 T1 − T2 ⎟ 1 2 ⎜ ⎟
⎝ ⎠ ⎝ ⎠
− ξ ± ξ 2 −1 ξ1− ξ 2
p1, 2 = = −α ± jω; α= ; ω= .
T T T
251
В данном случае звено второго порядка физически нельзя разделить на более про-
стые.
Передаточная функция и частотные характеристики описываются теми же выраже-
ниями, что и в предыдущем случае. При этом амплитудно-частотная характеристика мо-
жет увеличиваться до определенной (резонансной) частоты ωр, а затем снова уменьшаться
(рис.1.15, а).
Переходная функция (рис. 1.15,б) при комплексных корнях характеристического
уравнения (1.47) имеет вид:
h(t ) = k [1 − A e −αt sin(ωt + ϕ )] ,
где A = 1 / 1 − ξ 2 ; ϕ = arcsin 1 − ξ 2 – постоянные интегрирова-
а
ξ=0
ния, определяемые из нулевых начальных условий. A(ω)
0<ξ <1
Из изложенного вытекает, что коэффициент ξ опреде- k
252
k
W ( jω ) = . (1.51)
T ( j ω ) + j 2 ξ Tω + 1
2 2
a) б)
Рис.17
⎛ − 0 , 09 ω ⎞
ϕ (ω ) = arctg ⎜⎜ ⎟,
2 ⎟
⎝ 1 − 0 , 01ω ⎠
приведены на рис. 1.17,а, б (сплошные кривые)
Переходная h(t ) и весовая w (t ) функции определяются в соответствии с выраже-
ниями:
h ( t ) = k [1 − A e − α t sin( ω t + ϕ )] , w(t ) = h′(t ) = k (α 2 + ω 2 )ω −1 e −αt sin ω t
где
ξ 0.45 1− ξ 2 1 − 0.45 2 1
α= = = 4.5 ; ω = = = 8.9 ; k = 0 , 26 ; A = = 1,12 ;
T 0.1 T 0.1 1−0,452
ϕ = arcsin 1 − 0,452 = 1,1 .
Графики h(t ) и w (t ) приведены на рис.1.18, а, б (сплошные линии).
253
Для сравнения на рисунках 1.16, 1.17 приведены частотные, а на рис.1.18 времен-
ные характеристики апериодического звена второго порядка с монотонным переходным
процессом (пунктирные линии), описываемым ДУ: 0 , 01 &y& + 0 , 3 y& + y = 0 , 26 x , (см.
пример 1.5). Здесь при тех же постоянной времени Т=0,1 с и коэффициенте передачи
k=0,26 коэффициент демпфирования ξ=1,5>1, что и обусловливает отсутствие в этом зве-
не колебаний.
2.1.5. Интегрирующее звено
Y ( p) k A(ω)
• передаточная функция: W ( p) = = ;
X ( p) p
• частотные характеристики:
Q(ω) π
ФЧХ - ϕ(ω) = arctg =− ; h(t)
P(ω) 2
tgα = k
• временные характеристики:
α
α
254
t
переходная функция: h (t ) = kt (рис.1.20, сплошная линия);
функция веса: w(t) = h′(t) = k.
Примером интегрирующего звена может служить электродвигатель, на вход кото-
рого подается напряжение, а выходом является угол поворота вала двигателя. При этом
предполагается, что инерционностью двигателя можно пренебречь. В случае ее учета,
уравнение динамики интегрирующего звена запишется в виде: T &y& + y& = kx , а переход-
ная функция, являющаяся решением этого ДУ при х(t)=1(t), будет:
−t
h(t ) = k [t − T (1 − e T )] .
Y(p) = kpX(p).
Y ( p)
• передаточная функция: W ( p) = = kp .
X ( p)
• частотные характеристики:
АФЧХ - W ( jω) = jkω , (рис.1.21, а);
АЧХ - A(ω) = kω, (рис.1.21, б);
ФЧХ ϕ(ω) = π / 2 , (рис.1.21, б).
• временные характеристики:
переходная функция: h ( t ) = k δ ( t ) (рис.1.21, в, сплошная линия).
255
h(t)=(k/T)e-t/T.
График переходной функции h(t) представлен на рис.1.21, в пунктирной линией.
W2(p)
x2
Y(p)=W1(p)⋅X1(p) + W2(p)⋅X2(p)
x1
x1
*)
Заметим, что в звеньях структурных схем могут указываться и другие операторы преобразования сигналов,
dx
например, dt , ∫ xdt , w(t) и др.
256
Рассмотрим основные виды соединения звеньев.
***
3. Параллельно-встречное соединение звеньев (обратная связь ОС) (рис.1.25).
x Δ y Имеем Δ = x – y1 – отклонение текущего значения
W1(p)
ОС управляемой величины от заданного.
y1
WОС(p)
Найдем передаточную функцию по каналу x→y:
Wxy(p).
Рис.1.25
Имеем
Δ(p) = X(p) – Y1(p) = X(p) – WОС(p)Y(p). (1.53)
257
где W1(p), WОС(p) – передаточные функции прямой цепи и цепи обратной связи соответст-
венно
С другой стороны
Y ( p)
Δ( p) =
W1 ( p ) .
f
W3(p) Приравняв правые части уравнений (1.53) и
u Δ
W1(p)
(1.54), окончательно получим
W2(p) y
Y ( p) W1 ( p )
W xy ( p ) = = = W экв ( p )
X ( p ) 1 + W1 ( p )W ОС ( p )
Рис.1.26
4. Передаточные функции замкнутых АСУ (рис.1.26)
Пусть структурная схема системы имеет вид, показанный на рис.1.26. Воспользо-
вавшись приведенными ранее правилами, для данной структурной схемы можно записать:
1. Передаточную функцию разомкнутой системы Wp(p) , под которой понимают
произведение передаточных функций всех звеньев, включенных последовательно в кон-
туре обратной связи. Тогда
Wp(p) = W1(p)W2(p).
2. Передаточную функцию замкнутой системы по управлению u
W1 ( p )W 2 ( p ) Wp ( p)
Wuy ( p ) = =
1 + W1 ( p )W 2 ( p ) 1 + W p ( p ) .
1 W2 ( p )W3 ( p)
W uΔ ( p ) = ; W fΔ ( p ) = −
1 + Wp ( p) 1 + Wp ( p) .
258
Если структурная схема оказывается сложной и содержит много перекрестных свя-
зей, можно попытаться упростить ее с помощью определенных правил. Основной принцип
преобразования структурных схем заключается в том, что выходные величины исходной и
эквивалентной схем должны быть равны. Наиболее распространенные правила преобразо-
вания приведены ниже:
Правила преобра-
Исходная структурная схема Эквивалентная структурная схема
зования
1 2 3
x2 x4 yисх x1 x4 x2 yэкв = yисх
x1
Перестановка сум-
x3 x3
маторов yисх = x1 +x2 + x3 + x4
x3
x1 yисх x3
x1 yэкв = yисх
Перестановка узлов x2
yисх = x1 = x2 = x3
x2
x1 y1 экв = y1 исх
x1 y1 исх W1(p)
W1(p)
Перенос узлов с y2 экв = y2 исх
y2 исх = x1 -1
Y1 исх(p) = W1(p)X1(p) W 1(p)
входа на выход
259
Правила преобра-
Исходная структурная схема Эквивалентная структурная схема
зования
1 2 3
x1 yисх
W1(p)
ОС
Переход к единич-
ной обратной связи W2(p)
W1 ( p)
Yисх ( p) = X 1 ( p)
1 + W1 ( p)W2 ( p)
W1 ( p ) W34 ( p )
W12 ( p ) = ; W34 ( p ) = W3 ( p ) + W4 ( p ) W3456 ( p ) =
1 + W1 ( p )W2 ( p ) ; 1 + W34 ( p )W5 ( p )W6 ( p ) ;
260
Для наглядного изображения прохождения и преобразования сигнала в АСУ поми-
мо структурных схем используют графы, которые, как и структурные схемы, представля-
ют собой запись системы уравнений АСУ в виде рисунка.
Граф состоит из точек (узлов) и линий (ветвей), соединяющих эти точки. Узлам и
ветвям могут быть сопоставлены некоторые величины и операторы. Если ветви графа
имеют стрелки, соответствующие направлению распространения сигнала, то граф называ-
ется направленным. Рассмотрим его свойства.
1. Каждому узлу (вершине), отмеченному на графе точкой или кружочком, соот-
ветствует некоторая переменная рассматриваемой системы.
2. Каждая ветвь (ребро) графа, изображенная в виде линии со стрелкой, имеет узел-
начало x – входная величина и узел-конец y – выходная величина (рис.1.28, а). Выходная
переменная ветви получается как результат преобразования входной величины, осуществ-
ляемый оператором (передачей) ветви: y = kx, где k – оператор (передача) ветви.
3. Если из узла выходят несколько ветвей, то все они име-
ют одинаковую входную величину (рис.1.28, б).
4. Если к одному узлу подходит несколько ветвей, то пе-
ременная, соответствующая этому узлу, получается алгебраиче-
ским суммированием выходных переменных ветвей (рис.1.28,в).
Между структурной схемой и графом прохождения сигна-
ла имеется прямое соответствие. Прямоугольник структурной
схемы соответствует ветви, а линия передачи сигнала соответст-
вует узлу.
261
x4*
PI
*** a 1
Для того чтобы отыскать
PII
любую переменную величину k
x1 b x2 h х4 x6
(x1).
Путем между любыми двумя узлами графа называется непересекающаяся после-
довательность ветвей между этими узлами с одним и тем же направлением стрелки. На-
пример, между узлами x1 и x4 имеется три пути: I- x1 a x4; II- x1 bh x4; III- x1 cdh x4
Передачей пути Pij – называется произведение передач ветвей, входящих в путь
между узлами i и j. В нашем примере передача путей P14 будет следующей: PI = a,
PII = bh, PIII = cdh.
Контуром называется замкнутая непересекающаяся последовательность ветвей, ори-
ентированная в одном и том же направлении. Передачей контура Li называется произведе-
ние передач ветвей, образующих контур. Для нашего примера L1 = m, L2 = fd, L3 = dgr,
L4 = dhnr.
Передачей графа Tij – называется отношение выходной величины xj к входной ве-
личине xi, причем xi есть источник, т.е. величина независимая,
Tij = x j / xi
.
Для нашего случая при j = 4, i = 1 получим x4 = T14 x1.
Передача графа находится по формуле Мезона
262
∑ Ps Δ s
Tij = s
=
{(P1 + P2 + K + Pv )[(1 − L1 )(1 − L2 ) K (1 − Lu )]}*
Δ [(1 − L1 )(1 − L2 ) K (1 − Lu )]* , (1.56)
X4 PI [1 − ( L1 + L2 + L3 ) + L1 L2 ] + PII (1 − L1 ) + PIII (1 − L1 )
T14 = X1
=
1 − ( L1 + L2 + L3 + L4 ) + L1 L2 .
P1 Δ1 W1 ( p)
Txy = Wxy ( p) = =
1 − L1 1 + W1 ( p)W2 ( p) .
263
Этот результат естественно со- а
x 1 2 3 4 y
W1 W3
ответствует полученному ранее для W2
W1W2W3
Wxy ( p) =
1 + W2 (W1W5 + W3W4 ) .
Пример 1.14. Пусть динамическое звено представляет собой цепь RLC (рис.1.2).
Требуется найти передаточную функцию этого звена по каналу x=i → y = uR .
Решение. Так как цепь RLC имеет две энергетические емкости, то оператор пре-
образования может быть представлен передаточной функцией вида:
W xy ( p ) = k
T 2 p 2 + 2T ξ p +1 (1.57)
где k,T и ξ – искомые параметры, зависящие от величин R, L и C. Эти параметры можно
определить, составив граф, отображающий математическую модель электрической цепи в
переменных состояния (1.14):
v&1 = −C −1v2 + C −1 x ⎫
⎪
v&2 = L−1v1 − RL−1v2 ⎬ (1.58)
y = R v2 ⎪
⎭
Граф, отображающий систему уравнений (1.58) изображен на рис.1.33, где 1/р – оз-
начает операцию интегрирования переменной.
264
Воспользовавшись формулой Мезона (1.56), запишем
P1 R / LCp 2 R
W xy ( p ) = = =
1−( L1 + L2 ) 1 + R / Lp + 1/ LCp 2 LCp 2 + RCp + 1 (1.59)
265
q( p) ⋅ y (t ) = r ( p) ⋅ u (t ) + s( p) ⋅ f (t ) , (1.60)
Y ( p) = Wou ( p) ⋅U ( p) + Wof ( p) ⋅ F ( p)
, (1.62)
где Wou ( p); Wof ( p ) – матрицы передаточных функций объекта управления (ОУ) соответ-
ственно для управляющих и возмущающих воздействий (рис.1.35).
Выражение (1.62) позволяет установить связь между управляемыми величинами и
возмущающими и управляющими воздействиями объекта. Так, при m = 3; k = 2 и l = 0
уравнение (1.62) можно записать в виде:
где Wij(p)– передаточная функция объекта управления по каналу ui-yj; i =1,k ; j =1, m.
Если в матрице передаточных функций Wou ( p) или Wof ( p) для каждого элемента
матрицы (частной передаточной функции) найти оригинал, то будет получена так назы-
ваемая матрица Коши (матрица весовых функций). Например, для управляющих воздей-
ствий
k t
y j (t ) = ∑ ∫ ui (τ ) ⋅ w ji (t − τ )dτ
i=1 0 .
266
На рис.1.35 представлена структур-
ная схема замкнутой многомерной системы
управления объектом ОУ. На схеме все ука-
занные символы соответствуют матрицам:
y * (t ) – задающих воздействий; y (t ) –
управляемых (выходных) величин объекта;
Δ (t ) – отклонений для каждой управляемой величины; u (t ) – управляющих воздействий;
Wy ( p) = k ji
точных функций управляющего устройства k ×n , которая определяет исполь-
зуемые законы управления и показывает связь между изображениями управляющих воз-
действий и отклонений:
Wp ( p ) = Wou ( p ) Wy ( p ) .
D( p) = I + Wp ( p) = d ji ( p)
n×n ,
где I – единичная матрица n × n , т.е. матрица, у которой все элементы главной диагонали
равны единице, а остальные – нулю.
Характеристическое уравнение системы получается приравниванием к нулю опре-
делителя характеристической матрицы.
267
Полученные выражения для матриц передаточных функций замкнутой системы по-
⎡ Δ1 ( p) ⎤
Δ( p) = ⎢⎢.... ⎥ = W ( p)Y *( p) + W ( p) F ( p)
⎥ y*Δ fΔ
⎢⎣ Δ m ( p) ⎥⎦
268
составляющих вектора ν не влияет на формирование выхода системы y , то такая система
ненаблюдаема.
Исходные дифференциальные уравнения многомерной системы управления могут
быть представлены в форме Коши в матричной записи:
dν ⎫
= Aν + Bu + E f ;⎪
dt ⎪⎪
y = Cν ; ⎬
⎪
u = Dν , ⎪
⎪⎭
(1.64)
где ν – вектор фазовых координат размерности 1×n (n соответствует порядку дифферен-
A = a ji B = b ji
щающих и задающих воздействий размерности 1×l; n× n ; m× k ;
C = c ji D = d ji E = e ji
m×n ; k ×n ; m ×l – соответствующие матрицы коэффициентов.
269
В случае не полностью управляемой системы ее исходное дифференциальное
уравнение, входящее в систему (1.64) может быть представлено в виде
dν 1
= A11ν 1 + A12ν 2 + Bu,
dt ,
dν 2
= A 22ν 2 ,
dt
ν
1⋅ν ; 2 - то же, но неуправляемой части, размерности 1⋅ (m −ν ) .
Р. Калман показал, что размерность v управляемой части системы, т.е. порядок
первой группы уравнений (1.65), совпадает с рангом следующей матрицы:
U = B, AB , A 2B, ... A n -1B . (1.66)
n × kn
При v = n система полностью управляема, при 0 < v < n – не полностью управляема, при
v = 0 – неуправляема.
dν 1
= A11ν 1 + B1 U;
dt
dν 2
= A 21ν 1 + A 22ν 2 + B 2 U ;
dt
y = C1ν 1 ; u = D1ν 1.
(1.67)
При этом, как показал Калман, порядок v первой группы уравнений (1.67) совпада-
ет с рангом следующей матрицы:
V = CT A T CT ( A T ) 2 CT ... ( AT ) n −1 CT .
n× mn
При v = n система полностью наблюдаема, при 0 < v < n – не полностью наблюдаема; при
v = 0 – ненаблюдаема.
Пример 1.15. Рассмотрим систему, изображенную на рис.1.36, а. Количество пе-
ременных состояния n = 3 (они обусловлены наличием в системе трех энергетических ем-
костей с постоянными времени
а
u2 T1 , T2 , T3 ). В отсутствие управляющего
u1 T1 p + 1 y
1
(T2 p + 1)(T3 p + 1) T1 p + 1
u1 1 y 270
T1 p + 1
T1 p + 1 (T2 p + 1)(T3 p + 1)
б
Рис.1.36
сигнала u2 управление u1 воздействует только на две переменных состояния, обусловлен-
271
3. УСТОЙЧИВОСТЬ И КАЧЕСТВО ФУНКЦИОНИРОВАНИЯ АСУ
272
T 2 &y& + 2Tξ y& + y = kx . (1.68)
p1,2 = ⎛⎜ − ξ ± ξ2 −1⎞⎟ / T .
⎝ ⎠
0 1
Как было показано ранее, решение ДУ (1.68) описы-
–1
ξ < –1 –1 < ξ <0 0<ξ <1 ξ>1 вает переходной процесс y(t), характер которого определя-
–∞←ξ I II III IV ξ → ∞
ется коэффициентом ξ. Возможное расположение корней
+j характеристического уравнения на комплексной плоскости
+j/T
IV V I
III
p1 (ξ = 0)
II
p при различных значениях ξ показано на рис.1.38. Рас-
p1 p1
IV IV ω I I смотрим переходные процессы, соответствующие различ-
p2 p1 p2 p1
–1/T (ξ = 1) 1/T (ξ = –1) ным значениям ξ.
II
III
p2 V
p2 I. ξ < –1. Переходная функция h(t) при подаче на
p2 – j/T (ξ = 0)
III II
–j вход единичного ступенчатого сигнала имеет вид:
h(t ) = c1 e p1t + c 2 e
p2t
Рис.1.38 + k , при этом корни характеристиче-
а б в г д
h(t)
Рис. 1.39
вид:
273
бательным, а система устойчивой (происходит диссипация энергии во внешнюю среду)
(рис.1.39, в).
IV. ξ > 1. Переходная функция h(t) имеет тот же вид, что и в случае I, но p1,2 < 0.
Характеристика системы та же, что и в III случае, но переходный процесс монотонный
(апериодический) (рис.1.39, в). На этом же рисунке показана переходная функция при
ξ = 1 , p1 = p 2 = − ξ T .
V. ξ = 0; p1,2
V
= ±jω, ω = 1 / T , h(t) = k(1 – cosωt). В системе устанавливается перио-
lim y (t ) − y ( 0 ) = ε ,
t→∞
где y(0) – начальное значение управляемой величины; ε = y(∞) − y(0) – установившееся от-
*)
Более подробная классификация колебательных процессов в системах приведена в п. 8.2.4.
274
3. Если характеристическое уравнение линеаризованной системы имеет хотя бы
один нулевой корень или пару чисто мнимых корней, то поведение реальной системы не
может определяться ее линеаризованным уравнением. В этом случае отброшенные при
линеаризации уравнения члены высшего порядка малости определяют поведение системы
и могут превратить ее как в устойчивую, так и в неустойчивую.
Таким образом, анализ устойчивости линеаризованной системы сводится
к нахождению расположения корней на комплексной плоскости, которое однозначно оп-
ределяется коэффициентами характеристического уравнения. Однако не всегда можно
вычислить корни характеристического уравнения в аналитическом виде. В соответствии
с теоремой Абеля, корни уравнения выше четвертого порядка не могут быть найдены ана-
литически в принципе. Поэтому желательно иметь такие критерии, с помощью которых
можно было судить об устойчивости системы непосредственно по коэффициентам харак-
теристического уравнения и определять влияние изменяемых параметров системы на рас-
положение корней характеристического уравнения на два больших класса комплексной
плоскости. Эти критерии называют критериями устойчивости и подразделяются на ал-
гебраические и частотные.
3.1.2. Алгебраический критерий устойчивости Гурвица
*)
Заметим, что впервые задача отыскания алгебраического критерия устойчивости была решена Раусом, но поскольку
этот критерий был сформулирован в виде алгоритма использование его на практике не всегда удобно.
275
a1 a3 a5 K 0
a0 a2 a4 K 0
Δn = 0 a1 a3 K 0 . (1.70)
M M M M M
0 0 0 K an
Определители Гурвица более низкого порядка являются диагональными минорами
Δn. Например, при n = 3
a1 a3 0
a1 a3
Δ 3 = a0 a2 0 ; Δ2 = ; Δ1 = a1. (1.71)
a0 a2
0 a1 a3
Критерий Гурвица формулируется следующим образом: для того, чтобы АСУ бы-
ла устойчива необходимо и достаточно, чтобы все определители Гурвица Δ1, Δ2, …, Δ n
были положительными, и при этом выполнялось условие a0 > 0.
276
a1 a3
Δ3 = a3 Δ2 > 0; Δ2 = = a1a2 − a0a3 > 0 ; Δ1 = a1 > 0; a0 > 0.
a0 a2
1 To2 p 3 + 2Toξ p 2 + p
W xΔ ( p) = = .
1 + W p ( p) To2 p 3 + 2Toξ p 2 + p + k y k o
***
277
Заметим, что для характеристических уравнений высоких степеней (n > 5) анализ
влияния коэффициентов на определитель Гурвица резко усложняется. Свободными от
этого недостатка являются частотные критерии устойчивости.
278
Выражение (1.74) называется кривой Михайлова и +j
(jω – p2) jω ω → +∞
обычно обозначается D(jω) =A(jω). Каждый сомножитель +π (jω – p1)
p2 jω2
выражения (1.74) отображается на комплексной плоскости
вектором, конец которого лежит на мнимой оси (рис.1.41). p2 p1
–α –π α
В основу критерия Михайлова положен принцип ар- (jω – p3) p1
p3 – jω2
p3
гумента: произведение комплексных чисел имеет аргумент, ω → –∞
торы сомножителей (jω – pi), i = 1, n поворачиваются на угол π (рис.1.41). Если корни ле-
жат в левой части полуплоскости, то изменение угла будет положительным, если в пра-
вой, – то отрицательным (вектор (jω – pi) поворачивается против часовой стрелки в левой
полуплоскости и по часовой стрелке – в правой).
Запишем выражение (1.74) в показательной форме. Учтем, что ( jω − pi ) = Ai e jϕi ,
где Ai = jω − pi ; ϕi = arg( jω − pi ) . Тогда
⎡ n ⎤ j ∑ ϕi
D( jω) = A( jω) = a0 A1 e jϕ1 A2 e jϕ 2
K Ai e jϕi
K An e jϕ n
= a0 ⎢∏ Ai ⎥ e i =1 = A e jϕ . (1.75)
⎣ i =1 ⎦
Из (1.75) вытекает, что изменение аргумента вектора Михайлова D(jω) равно сум-
ме изменений аргумента каждого сомножителя выражения (1.75), т.е.
n
Δ arg D ( jω) = Δϕ = ∑ Δϕi .
i =1
279
n=2 +j Годографы кривой Михайлова при изменении ω
n=1 от 0 до ∞ для устойчивых систем при различных значени-
n=3
an
ях n приведены на рис.1.42.
+
ω=0 В соответствии с (1.76) критерий Михайлова
n=4 n=5
формулируется сле-
+j
ω → +∞ n = 5, Н дующим образом: для
–j
Рис.1.42 того, чтобы замкну-
an +
тая система была устойчивой, необходимо и
n = 4, Н
достаточно, чтобы при изменении ω от 0 до ∞ вектор
Михайлова D(jω) повернулся на угол n = 4, У n = 4, ГУ + n(π / 2) .
Bp ( p )
мы; Wp ( p ) = W1 (p) ⋅W 2 (p) = – передаточная функция разомкнутой системы.
Ap ( p )
280
При p = jω, разложив соответствующие полиномы на множители, имеем
n
Ap ( jω) + Bp ( jω) ∏ ( jω − p1i )
1 + Wp ( jω) = = A in=1 ,
Ap ( jω)
∏ ( jω − p2i )
i =1
где p1i и p2i – корни уравнений Ap(jω) + Bp(jω) = 0 и Ap(jω) = 0 соответственно i = 1, n ; A –
вещественный коэффициент.
В соответствии с первой теоремой Ляпунова, замкнутая система устойчива, если
все корни p1i лежат в левой полуплоскости. Если разомкнутая система устойчива, то корни
уравнения Ap(jω) = 0, p2i тоже лежат в левой полуплоскости. Поскольку при делении ком-
плексных чисел их аргументы вычитаются, то при изменении ω от – ∞ до + ∞
Δ arg[1 + Wp(jω)] = 0. Следовательно, чтобы замкнутая система была устойчива, необходи-
мо и достаточно, чтобы годограф вектора {1+ Wp(jω)} не охватывал начало координат при
изменении ω от – ∞ до + ∞. При ω = 0 и при ω → ∞ соответственно 1 + Wp(jω) = const
и 1 + Wp(jω) → 1. Годограф вектора {1 + Wp(jω)} представлен на рис.1.45, а.
Если сместить ось ординат вправо на +1, то начало координат в новой системе
совпадет с началом вектора Wp(jω), а старое начало координат в новой системе совпадет
с точкой (–1; j0) (рис.1.45, б).
Таким образом, критерий Найквиста можно сформулировать следующим образом:
чтобы замкнутая система была устойчива, необходимо и дос ратное утверждение явля-
ется только необходимым, таточно, чтобы АФЧХ разомкнутой системы при изменении
ω от нуля до бесконечности не охватывала точку с координатами (–1; j0). Заметим, что
обно недостаточным условием неустойчивости системы.
Пример 1.18. Определим вид АФЧХ при различных частотных характеристьиках
а
разомкнутой системы.
+j
Решение . 1. Пусть разомкнутая система
является апериодическим звеном второго порядка.
ω = ±∞ Тогда частотную характеристику системы можно
1
0 Wp(jω) ω=0 представить в виде:
k
WP1 ( jω ) = .
1 + Wp(jω) (T1 jω + 1)(T2 jω + 1)
Если T1 = 0, то АФЧХ имеет вид, показанный на
б +j
рис.1.46, а, если T1 ≠ 0, то АФЧХ имеет вид, пока-
занный на рис.1.46, б.
ω=∞
–1; j0 0 Wp(jω) ω=0
281
Рис.1.45
Поскольку АФЧХ разомкнутой системы с частотной функцией WP1 ( jω ) при любых
282
Рис. 1.47
Полученная зависимость позволяет построить годограф WP ( jω ) (рис.1.47). Как
видно из рисунка годограф WP ( jω ) не охватывает точку (-1, j0), пересекая ось абсцисс в
точке (-0,57, j0), что свидетельствует о достаточном запасе устойчивости при принятом
коэффициенте передачи kу=20.
3.2. КАЧЕСТВО ПРОЦЕССА УПРАВЛЕНИЯ
*)
При этом коэффициент передачи k по каналу f →y равен y (∞) . Если f (t ) = A ⋅1(t ) где
А=const, то k = y (∞ ) / A
283
y(t) от установившегося значения y(∞) становится и остается меньше зоны нечувствитель-
ности системы δ = (0,01 ÷ 0,05)y(∞). Этот показатель характеризует скорость протека-
ния переходного процесса. Если кривая переходного процесса монотонна, то этот пока-
затель является единственным.
Время первого согласования tc – время, по истечении которого управляемая вели-
чина первый раз достигает своего установившегося значения. Этот показатель также ха-
рактеризует скорость протекания процесса в начальный период.
Перерегулирование σ max – отношение максимального отклонения управляемой ве-
∞
L{y'(t)} = pY(p) – y(0) или pY( p) = y(0) + ∫ y′(t) e− pt dt . (1.78)
0
p →0 p →0
0
1
y (∞) = Δ (∞) = lim pW ( p ) = lim W ( p) . (1.80)
p →0 p p →0
Пример 1.20. Пусть структурная схема АСУ имеет вид, показанный на рис.1.49.
Передаточная функция объекта задана:
ko
Wo ( p ) = .
T p + 2Toξ p + 1
o
2 2
*)
Взяв предел от правой части выражения (1.79) при p → ∞ , получим математическую формулировку теоремы
о начальном значении:
y (0) = lim pY ( p ) , где y (0) - значение функции y (t ) при t = 0 .
p →0
284
Найти установившуюся ошибку системы для двух различных передаточных функ-
циях устройства управления: W y1 ( p ) = k1 ; W y 2 ( p ) = k 2 / p .
Δ 0 (∞ ) = lim WuΔ1 ( p ) = 1 ≠ 0.
p→0 1 + k 0 k1
Δ 2 (∞ ) = lim Wu Δ1 ( p ) = 0
p→0
285
3.2.2. Косвенные методы оценки качества
1 1
tp = ln ≈ 3Tmax ,
pmin 0,05
286
Наличие комплексных сопряженных корней характеристического уравнения pk =
= - αk ± jωk свидетельствует о существовании колебательной составляющей в уравнении
движения системы (рис.1.51, в):
yk (t ) = A e−α k t sin(ωk t + ϕ) .
В этом случае для оценки скорости затухания колебательного процесса используют
логарифмический декремент*) затухания d:
y1 max A e −α k t1 sin(ωk t1 + ϕ)
d = ln = ln = ln e α k Tk = α k Tk .
y2 max A e − α k (t1 + Tk ) sin(ωk t1 + ωk Tk + ϕ)
При этом Δ(t) = y∞ – y(t) является текущей динамической ошибкой системы (рис.1.52, а).
Для вычисления интеграла (1.82) можно воспользоваться преобразованием Лапласа
∞
для ошибки системы. Имеем L{Δ (t )} = = Δ( p) = ∫ Δ(t ) e − pt dt , откуда
0
∞
lim Δ( p) = ∫ Δ(t )dt = I1 . (1.83)
p →0 0
*)
Декремент – лат. уменьшение, убавление.
287
В нашем случае при y*(t) = 1(t); Y * ( p) = 1/ p имеем
y∞
Δ( p) = L{y∞ − y(t )} = − Y ( p) .
p
Учтя, что Y(p) = W(p)Y *(p)=W(p)/р и y∞ = lim pY ( p) = W (0) , получим
p →0
Недостаток интегральной оценки вида (1.82) состоит в том, что она годится только
для монотонных процессов (рис.1.52, б). Если же имеют место колебания (рис.1.52, в), то
алгебраическое сложение площадей может привести к ситуации, когда при больших коле-
баниях I1 = min.
В целях устранения этого недостатка на практике чаще всего применяют квадра-
тичный интегральный критерий вида
∞
I 2 = ∫ Δ2 (t )dt . (1.84)
0
Этот критерий не зависит от знака Δ(t) и, следовательно, может быть применен как
для монотонных, так и
для колебательных про-
цессов.
Критерии I1 и I2 яв-
ляются функциями пара-
метров системы, изменяя
которые можно миними-
зировать интегральные оценки.
Существуют методы, позволяющие вычислить критерий I2, не решая ДУ системы.
∞
В частности, учитывая, что ⏐Δ(jω)⏐2 = Δ(jω)Δ(–jω) и Δ( jω) = ∫ Δ(t) e− jωt dt , и проинтегриро-
−∞
288
Заметим, что минимизация интегральной квадратичной ошибки вида (1.84) приво-
дит к большим перерегулированиям переходного процесса (до 20 % от установившегося
значения y∞). В связи с этим применяют интегральные критерии, учитывающие не только
величину ошибки, но и скорость ее изменения
∞
I 3 = ∫ [ Δ2 (t ) + γ 2 Δ& 2 (t )] dt ,
−∞
(1.85)
где γ – весовой коэффициент, который определяет значимость второго слагаемого подын-
тегральной функции.
В данном случае помимо ограничения на величину ошибки Δ(t) налагается ограни-
чение на скорость ее изменения Δ& (t ) . В результате чего мы получаем достаточно быстрые
и плавные переходные процессы.
Иногда кроме указанных ограничений учитывают и ограничение на ускорение. То-
гда интегральный критерий принимает вид
∞
I 4 = ∫ [Δ2 (t ) + γ12 Δ& 2 (t ) + γ 22 Δ
&&2 (t )]dt .
−∞
(1.86)
Подчеркнем, что все рассмотренные интегральные оценки являются функцией па-
раметров системы, следовательно, их можно минимизировать, изменяя параметры систе-
мы и прежде всего устройства управления.
3. Частотные критерии качества. Эти критерии базируются на некоторых свой-
ствах частотной функции и, в силу ее связи с временными характеристиками (см.п.1.5),
позволяют судить о качестве переходного процесса. Например, оценка качества этого
процесса по АФЧХ разомкнутой системы производится следующим образом. Пусть
структурная схема системы имеет вид, показанный на рис.1.53, а. Тогда частотная функ-
ция разомкнутой системы
n =3
Wp ( jω) = ∏ Wi ( jω) , где Wi ( jω) = ki /(Ti jω +1)
i =1
Годограф вектора Wp(jω) для устойчивой системы представлен на 1.53, б, где вели-
чина p1 характеризует запас устойчивости замкнутой системы по модулю, а
μ1 = 2π −ψ1 (ωc ) - запас устойчивости по фазе; ωс – частота среза, при которой
⏐W(jωc)⏐=1. В хорошо демпфированных системах (при σ < 5 %) p1 = 0,1÷0,5; μ1 ≥ 30÷60 о.
289
Оценка качества
переходного процесса
может быть также про-
изведена по АЧХ замк-
нутой системы
(рис.1.53, в). Макси-
мальное значение АЧХ
– Mmax, соответствую-
щее резонансной (собственной) частоте ωp, может служить показателем колебательности.
Чем больше Mmax, тем выше склонность системы к колебаниям. В хорошо демпфирован-
ных системах Mmax ≤ 1,1÷1,5. Частота, при которой A(ωc)/A(0) = 1, определяет частоту
среза ωс, которая характеризует полосу пропускания частот. Чем шире полоса пропуска-
ния частот, т.е. чем больше ωс, тем быстрее протекают переходные процессы, поэтому эта
частота может служить мерой быстродействия системы.
Существуют и другие методы оценки качества переходных процессов в системе по
ее частотным характеристикам.*) Например, учитывая, что для минимально-фазовых сис-
тем существует однозначная связь между переходной функцией h(t) и вещественной час-
тотной характеристикой P(ω), можно, анализируя последнюю, получить ряд оценок каче-
ства переходного процесса. В частности, если P(ω) представляет собой положительную
невозрастающую функцию, то перерегулирование σ не превышает 18 %, если dP(ω) / dω
отрицательная, убывающая по модулю, непрерывная функция, то имеет место монотон-
ный переходный процесс.
*)
Более подробно этот вопрос рассмотрен в п.4.6.
290
4. МЕТОДЫ СИНТЕЗА АСУ
УУ ОУ
ния.
В некоторых случаях в устройство
Рис.1.54
управления может подаваться информация о
возмущающих воздействиях f(t) (рис.1.54, пунктирная линия). Тогда закон регулирования
примет вид
291
u(t) = k1Δ(t), и Wу(p) =Wп(р)= k1 , (1.88)
где Wп(р) – передаточная функция пропорционального регулятора.
Если Wo(p) = ko, то передаточная функция замкнутой системы по ошибке
1 1
W ( p) = = ,
y *Δ 1 + Wp ( p) 1 + ko k1
а установившаяся ошибка Δ(∞) при подаче на вход системы со стороны задающего воз-
A .
Δ(∞) = lim pΔ( p ) = lim pW y *Δ ( p )Y * ( p ) =
p →0 *
Y ( p) =
A p →0 1 + k o k1
p
1 p .
Wy * Δ ( p ) = =
1 + k о k 2 / p p + kо k 2
Ap
Тогда при y*(t) = A⋅1(t) получим Δ(∞) = lim *)
=0 .
p →0 p + kо k2
*) B( p)
Заметим, что полученный результат справедлив и при Wo = , где В(р) и А(р) полиномы m-ой и n-ой сте-
A( p )
пени соответственно, при чем n ≥ m .
292
вается склонность системы к колебаниям, что обусловлено снижением быстродействия
регулятора, т.к. после нанесения возмущения в начальный период времени значение инте-
грала мало.
Заметим, что система, астатическая по задающему воздействию y*, может оказаться
статической по возмущению f. Например, при Wof ( p) =−kf / p и f(t) = B⋅1(t) получим:
kf
Wf Δ = и Δ f (∞) = Bk f /(kоk2 ) , т.е. имеет место статическая ошибка по возмущению.
p + ko k 2
3. Пропорционально-интегральный закон регулирования (ПИ-регулятор).
Когда желательно сочетать в установившемся режиме высокую точность интегрального
регулятора с большим быстродействием в переходном режиме пропорционального регулятора,
сигнал управления формируют в соответствии с выражением
t
u (t ) = k1Δ(t ) + k2 ∫ Δ(t )dt . (1.90)
0
k 2 k1 p + k 2
При этом Wу ( p) = WПИ ( р) = k1 + = , а передаточная функция по ошибке при
p p
W0(p)=k0 имеет вид:
p
Wy*Δ ( p) = .
p + ko (k1 p + k2 )
293
Таким образом, Wp(jω) состоит из двух слагаемых, второе из которых
[− j(k2 / ω)Wo ( jω)] поворачивает вектор Wp(jω) по часовой стрелке, приближая его годограф
к точке (–1; j0) и, следовательно, запас устойчивости системы уменьшается как по моду-
лю, так и по фазе (рис.1.55, б).
Подчеркнем, что введение интегрирующего звена в прямую цепь управления дела-
ет систему астатической по заданному возмущению y*, но увеличивает склонность ее к
колебаниям.
4. Пропорционально-дифференциальный закон (ПД-регулятор). Управление по
производной не имеет самостоятельного значения, так как в установившемся состоянии
производная ошибки равна нулю и регулирование прекращается.*) Однако введение про-
изводной играет существенную роль в динамических режимах, поскольку позволяет учи-
тывать не только наличие ошибки, но и тенденцию к ее изменению. Имеем:
dΔ(t )
u (t ) = k1Δ(t ) + k3 . (1.91)
dt
При этом Wу ( p) = WПД ( р) = k1 + k 3 p , а передаточная функция по ошибке при W0(p)=k0
1
имеет вид W ( p) = . В этом случае Δ(∞) ≠ 0, т.е. система относится к классу
y*Δ 1 + k o (k1 + k 3 p)
статических.
Введение в закон регулирования производной позволяет сформировать управляю-
щее воздействие даже при отсутствии ошибки на входе регулятора, что увеличивает быст-
родействие системы. Кроме того, введение производной подавляет колебания в системе и
ускоряет протекание переходных процессов, т.е.
улучшает качество переходного процесса.
Убедимся в сказанном, проанализировав час-
тотные характеристики системы, структурная схема
которой представлена на рис.1.56,а. Имеем
Wp(jω) = Wo(jω)[1 + jk3ω]. Следовательно, как и в
случае ПИ-регулятора, частотная функция Wp(jω)
состоит из двух слагаемых, но при этом второе
слагаемое поворачивает вектор Wp(jω) против ча-
совой стрелки, удаляя годограф этого вектора от
точки (–1; j0) и тем самым увеличивая запас ус-
*)
В связи с этим обратную связь по производной часто называют «гибкой», в отличии от жесткой обратной
связи, при которой существует функциональная зависимость u = f (Δ ) , в частности, в случае применения П-регулятора
u = k1Δ .
294
тойчивости системы (рис.1.56, б).
5. Пропорционально-интегрально-дифференциальный закон (ПИД-регулятор).
Здесь закон управления (1.87) реализуется в полном объеме. При этом передаточная
функция устройства управления запишется в виде:
k2
Wу ( p) = W ПИД ( р) = k1 + + k3 p . (1.92)
p
изменяемой части системы равна Wc(p). В этом случае корректирующее звено с переда-
точной функцией Wk1 ( p) включается последовательно с неизменной частью системы
откуда
Wск ( p )
Wk1 ( p ) = .
Wc ( p )
295
W ( p)
2. Параллельная коррекция (рис.1.58). В этом случае x
c
y
корректирующее звено включается параллельно с неизменной
Wk2 ( p )
частью системы. Тогда можно записать
Рис.1.58
Wск ( p ) = Wc ( p) + Wk 2 ( p) , (1.94)
откуда
Wk 2 ( p) = Wск ( p ) − Wc ( p) .
Рис.1.59 Wс ( p)
Wск ( p) = , (1.95)
1 + Wc ( p)Wk3 ( p)
откуда
Wc ( p) − Wск ( p )
Wk 3 ( p ) = .
Wc ( p)Wcк ( p)
откуда
Wск ( p)
Wk4 ( p) = .
Wc ( p)[1 − Wcк ( p)]
Использование того или иного вида коррекции в основном определяется удобством
технической реализации, поскольку в линейных системах их динамические свойства могут
быть в принципе одинаковыми при любых типах корректирующих устройств.
Для получения формул перехода от корректирующих устройств одного типа к дру-
гому при одинаковых Wск(p) необходимо приравнять правые части соответствующих
уравнений. Например, приравняв правые части уравнений (1.93) и (1.95):
Wс ( p ) 1 − Wk1 ( p )
Wс ( p )Wk1 ( p ) = , найдем Wk3 ( p ) = .
1 + Wc ( p )Wk3 ( p ) Wc ( p )Wk1 ( p )
296
Пример 1.21. Пусть необходимо синтезировать линейные ПД- и ПИ-регуляторы,
используя корректирующие звенья.
Решение: ПД-регулятор можно реализовать на базе П-
Δ u
kу
регулятора с передаточной функцией Wп(p) = = Wc(p) = kу при
помощи охвата усилителя отрицательной обратной связью в ви-
ka
де апериодического звена первого порядка с передаточной Ta p + 1
Ta p + 1 1 Ta
1 / k у , можно пренебречь. Тогда WΔ u ( p ) ≈ = + p = k1 + k 3 p = W ПД ( р ).
ka ka ka
kу k у (Ta p + 1) при kу 1 k
WΔu ( p) = = = = kу + = k1 + 2 = WПИ ( р) .
1 − k у ka /(Ta p + 1) Ta p + (1 − k у ka ) k у ka = 1 Ta p p
297
В качестве кри-
териев качества пере-
ходного процесса Кесс-
лер предложил исполь-
зовать величину перере-
гулирования σ max и
время регулирования tp,
которые желательно
минимизировать. Поскольку эти критерии противоречивы, более корректной будет сле-
дующая формулировка цели управления: достижение максимального быстродействия, т.е.
tp = min, при перерегулировании, не превышающем заданного значения (обычно
σ max ≤ 5 %). Синтез системы, реализующей поставленную цель, производится поконтурно,
начиная с внутреннего контура. Рассмотрим процедуру синтеза на конкретном примере.
Пример 1.22. Определить передаточную функцию устройства управления при
заданной передаточной функции объекта управления, которая бы удовлетворяла сформу-
лированному выше критерию.
УУ ОУ
Структурная схема внутреннего y1
u1 Δ 1 1 k o1
Wу1(p) Tμ 1 p + 1 Tμ 2 p + 1 T o1 p + 1
контура системы имеет вид, пока-
занный на рис.1.62. Здесь объект
управления ОУ представлен тремя
Рис.1.62
последовательно включенными
звеньями, причем предполагается, что звенья, характеризуемые постоянными времени
Tμ1 , Tμ 2 – малоинерционные по сравнению со звеном, характеризуемым постоянной вре-
ko1
Wo1 ( p ) = . (1.97)
(Tμ p + 1)(Tо1 p + 1)
k2 k
Wу1 ( p ) = k1 + = u (Tu p + 1) ,
p Tu p
ku
где k1=ku; k 2 = .
Tu
ku ko1
Wp ( p) = Wу1 ( p)Wo1 ( p) = (Tu p + 1) .
Tu p (Tμ p + 1)(To1 p + 1)
Если принять Тu= To1 , то большая постоянная времени объекта управления To1 будет
Wp ( p) ko1 ku 1
Wu1 y1 ( p) = = = .
1 + Wp ( p) TuTμ p + Tu p + ko1 ku
2
(TuTμ / ko1 ku ) p + Tu /(ko1 ku ) p + 1
2
TuTμ Tu
Обозначим = T 2; = 2ξT , тогда
ko1 ku ko1 ku
1
Wu1 y1 ( p) = .
T p + 2ξTp +1
2 2
Tu Tμ Tu 1 Tu
T= ;ξ= = . (1.98)
k o1 k u 2Tk o1 ku 2 k o1 kuTμ
299
Известно, что при ξ = 2 / 2 = 0,707 максимальное перерегулирование
σ max = 4,3 < 5 %, что соответствует, требованиям к качеству переходного процесса в сис-
теме. Подставив числовое значения ξ = 2 2 (1.98) и учитывая, что Tu = To1 , найдем зна-
Tu To1
ku = = . (1.99)
4ko1Tμξ 2
2ko1Tμ
1 (Tμ p + 1)To1 p
где Wu1Δ ( p) = = - передаточная функция замкнутой системы по
1 + Wp ( p) (Tμ p + 1)Tu p + 1
каналу u1 → Δ .
Таким образом, синтезированная система управления выходной величиной объекта
управления y1 , относится к классу астатических и отвечает всем требованиям сформули-
рованным выше.
Аналогично рассчитывают остальные контуры системы, причем внутренние конту-
ры принимают в качестве объекта управления.
***
300
Заметим, что если в составе объекта управления имеется интегрирующее звено, то
передаточная функция устройства управления для реализации поставленных целей долж-
на содержать только пропорциональную часть, т.е. Wу1(p) = k1, где k1 определяется выра-
жением (1.99).
Wo ( p ) Ty k o p
W f Δ ( p) = = .
1 + Wo ( p )W y ( p ) TyTo2 p 3 + 2TyToξ p 2 + Tp (1 + k y ko ) p + k y ko
При этом изображение ошибки по Лапласу при подаче на вход ступенчатого воз-
мущения f(t)= 1(t) можно записать в виде:
c2 p 2 + c1 p + c0 C ( p)
Δ ( p ) = W fΔ ( p ) F ( p ) = = ,
d 3 p + d 2 p + d1 p + d 0 D ( p )
3 2
(1.101)
301
где С(р), D(р) – алгебраические полиномы m-ой и n-ой степени соответственно (m=2, n=3);
ci, dj – коэффициенты полиномов: с0=Тy k0; с1=с2= 0; d0=kykо; d1=Тy(1+kyk0); d2=2ТyТ0ξ; d3=
ТyТо2.
∞ +∞
1 C ( jω ) ⋅ C ( − jω )
I 2 = ∫ Δ dt =
2
∫ D ( j ω ) ⋅ D ( − j ω ) dω .
0
2π −∞
koTy2ξ
I2 = = ϕ ( K y , Ty ) (1.102)
k y [2Tyξ (1 + k y ko ) p − To k y ko ]
302
ределяется выражением (1.102), и , приравняв к нулю, найдем зависимость Ty = f (k y ) .
Окончательно получим
k y koTo
Ty* =
ξ (1 + k y ko )
редачи пропорциональной части регулятора ky. В связи с этим возникла возможность ав-
тономного определения k y = k *y . Заметим, что из полученного соотношения, определяю-
щего квазиоптимальное значение Ty* , следует, что чем меньше величина коэффициента
демпфирования ξ , т.е. чем больше склонность системы к колебаниям, тем меньше должен
быть коэффициент передачи интегральной части регулятора, уменьшая эту склонность.
ние параметра Ty* = 2.0 0.5 = 4 с. Подставив числовые значения параметров объекта
19.2
I2 I2 =
4k y − 2.4k y2
Зависимость I 2 = f (k y ) представлена на
1
воспользовавшись (1.101) при F ( p) = , получим
p
4.8
Δ( p) = .
16 p + 8 p + 47.2 p + 10.8
3 2
303
Рис.1.65
Взяв от Δ( p ) обратное преобразование Лапласа, найдем переходную функцию
по каналу f → Δ , график которой представлен на рис. 1.65.
*)
Инвариант (неизменяющийся – фр.) – выражение, остающееся неизменным при определенном преобразова-
нии входящих в него переменных.
304
Wo ( p )
где W fy ( p ) = - передаточная функция замкнутой системы по каналу
1 + Wo ( p)Woc ( p)Wи ( p )
kос, так как lim W fy ( p) =0. При этом передаточная функция по каналу y* → у может и не
k →∞ ос
W1 ( p) B1 ( p ) A2 ( p )
Woc ( p) = = , (1.103)
1 − W1 ( p)W2 ( p) A1 ( p ) A2 ( p ) − B1 ( p ) B 2 ( p )
A1 ( p ) A2 ( p ) − B1 ( p ) B2 ( p ) = 0 (1.104)
Заметим, что для выполнения условия инвариантности (1.104) требуются устройства, вы-
полняющие операцию идеального дифференцирования. Небольшая ошибка при этом может при-
вести к появлению в дифференциальном уравнении отрицательных членов и, следовательно, к по-
тере устойчивости. Такие системы, по определению академика Андронова, являются «негрубы-
ми». Таким образом, требования инвариантности и устойчивости противоречивы, и это противоре-
чие появляется вследствие того, что, приближаясь к абсолютно инвариантной, система может стать
«негрубой».
Можно показать, что необходимое условие физической реализуемости абсолютно
инвариантной системы заключается в том, чтобы характеристический полином разомкну-
той системы был не равен нулю, а передаточная функция корректирующего устройства
305
вводимого в систему для достижения условий абсолютной инвариантности имела степень
полинома числителя ниже степени полинома знаменателя.
Как уже отмечалось, для достижения инвариантности y j (t ) относительно f i (t ) не-
Откуда
Wk ( p ) =
[
Wo4 ( p ) 1 + Wo1 ( p )Wo2 ( p ) ].
Wo1 ( p )Wo3 ( p )
306
то корректирующее звено Wk ( p) физически реализуемо. Для компенсации неучтенных
pWo ( p)
Y ( p) = F ( p) .
p + Wo ( p )k
град
Числовые значения параметров звеньев – k1=10; k2=10 ; k3=1в/град; Т=0,02с.
в⋅с
Решение. Найдем передаточную функцию системы по каналу u → Δ . Учтя двух-
канальность подачи входного сигнала u, можно записать:
1 W ( p)W2 ( p)W3 ( p)
WuΔ ( p) = W1uΔ ( p ) + W2uΔ ( p) = − k ,
1 + W p ( p) 1 + W p ( p)
307
где Wp(p)=W1(p)W2(p)W3(p) – передаточная функция разомкнутой системы. Подставив
значения передаточных функций звеньев в полученное выражение, найдем:
Tp 2 + (1 − k2 k3 kk ) p
WuΔ ( p) =
Tp 2 + p + k1k2 k3
(1.105
)
Дифференциальное уравнение системы, преобразованное по Лапласу имеет вид:
Δ( p) = WuΔ ( p)U ( p) или
[ ]
(Tp 2 + p + k1k2 k3 )Δ( p) = Tp 2 + (1 − k2 k3k k ) p U ( p)
(1.106
)
Для того чтобы ошибка системы Δ была инвариантна к скорости изменения управ-
ляющего сигнала u, необходимо, чтобы полином в правой части уравнения (1.106) не со-
держал членов с комплексной переменной р в первой степени, что соответствует отсутст-
вию на входе системы производной du/dt. Это условие выполняется при
1 1
(1 − k2k3kk ) = 0 , откуда k k = = = 0,1c.
k1 k 2 10 ⋅ 1
Числовое значение kk, получено в предположении что корректирующее звено иде-
ально осуществляет операцию дифференцирования. Так как физически такое звено нереа-
лизуемо, то реальная инвариантная система будет работать с точностью до ε . Заметим,
коэффициент передачи kk не зависит от постоянной времени Т, так как эта величина опре-
деляет влияние ускорения d2u/dt2. В случае если была бы поставлена задача устранить
ошибку и по ускорению в корректирующее звено необходимо было бы ввести и вторую
производную от u. Рассмотренная система, как вытекает из (1.105), также инвариантна и к
постоянному управляющему воздействию u, т.е. относится к классу астатических.
308
4.5. СИНТЕЗ МОДАЛЬНЫХ РЕГУЛЯТОРОВ
∗)
Мода - лат. modus – мера, способ
309
Структурная схема объекта управ-
ления ОУ с регулятором состояния РС, со-
ставленная в соответствии с уравнением
(1.109), показана на рис. 1.70.
Проектирование регулятора состоя-
ния заключается в таком выборе матрицы
коэффициентов передачи C , чтобы были
-С
-С
получены желаемые динамические свойст-
Рис 1.70
ва системы. Один из методов синтеза регу-
лятора состояния состоит в достижении желаемого расположения на комплексной плоско-
сти корней характеристического уравнения системы, описываемой уравнением (1.109),
т.е. собственных значений матрицы замкнутой системы A - BC . Этот метод состоит из
следующих этапов.
1. При известном математическом описании объекта управления составляют урав-
нение состояния (1.107).
2. Вычисляют матрицу управляемости объекта (1.66) и проверяют совпадение ран-
га этой матрицы с размерностью системы.
3. Вычисляют характеристический многочлен матрицы по формуле
LA (λ ) = det λ I - A = λ n + a1λ n −1 + K + an −1λ + an , (1.110)
Ci ∗ = bi − ai , i = 1, n .
7. С помощью специальной матрицы преобразования P преобразуют коэффициен-
ты матрицы C∗ из канонического базиса, в котором они определены, в естественный ба-
зис, в котором записаны исходные уравнения состояния, т.е. определяют матрицу
C = C* P . Коэффициенты этой матрицы ci и являются коэффициентами передачи обрат-
ной связи, при которых обеспечивается желаемое поведение системы соответствующее
характеристическому полиному (1.111).
310
Проиллюстрируем применение изложенной методики на конкретном примере.
Пример 1.70. Пусть объект управления представляет собой электропривод состоя-
щий из двигателя постоянного тока с независимым возбуждением Д и безинерционного
тиристорного преобразователя ТП. Принципиальная схема электропривода представлена
на рис. 1.71. Электромеханическая Tм и электромагнитная Tэ постоянные времени заданы:
311
Разделив обе части уравнения (1.114) на R и учтя, что Tэ = L / R , запишем его в ви-
де
kд 1 k
i′ = − ω − i + тп u . (1.115)
RTэ Tэ RTэ
Уравнения (1.113) и (1.115) являются уравнениями состояния рассматриваемого
электропривода в скалярной форме. Обозначив ω = ν 1 ∗) и y = ν 2 , эти уравнения в соответ-
1 1
Обозначив a0 = 1 ; = a1 ; = a2 , запишем
Tэ TэTм
LA (λ ) = a0 λ 2 + a1λ + a2 . (1.118)
Собственные значения матрицы A (корни характеристического уравнения (1.118))
равны:
λ1,2 = − ±
a
2
a12
4
(
− a2 = −Tм ± Tм 2 − 4TэTм / 2TэTм . )
∗)
Заметим, что в данном случае частота вращения ω одновременно является выходной координатой системы
y.
312
Записав, в соответствии с (1.46), характеристический полином объекта в виде
LA (λ ) = T 2 λ 2 + 2ξ T λ + 1 , (1.119)
ν * = Pν или ν = P −1ν * ,
которое преобразует уравнение (1.116) к канонической форме пространства состояний
TмTэ kд
Тогда P1 = 0,1 U −1 = 0.
k тп
313
TмTэ kд
0
P k тп
P= 1 = , (1.123)
P1 A КTэ
0
kтп
0 1 0
A* = ; B* = . (1.124)
− a2 − a1 a0
Lu (λ ) = p 2 + b1 p + b2 . (1.126)
c2* = b2 − a2 = b2 − 1 ; c1* = b1 − a1 = b1 − 1 ,
TмTэ Tэ
314
TмTэ kд
0
P kтп
C = c2 c1 = c c ⋅ 1 = b2 − 1
* *
b− 1 ⋅ =
2 1
P1 A TмTэ 1 Tэ КTэ
0
kтп
kд R
= ( b2TмT − 1) ( b1TэT − 1) . (1.127)
k тп kтп
2
ражение числовые значения T и ξ получим ω0 = = 44, 6 c −1 . При этом
2 0,5 ⋅ 0,1 ⋅ 2 2
R
0
kдTм 0 2
= = . (1.129)
T k −385,5 −63
− м д b2 b1
R
315
Воспользовавшись уравнениями (1.128), (1.129) и учтя, что ν 1 = ω , ν 2 = i , можно
ного процесса.
Рис. 1.72
∗)
Здесь учтено, что характеристические полиномы желаемой и синтезированной системы совпадают.
316
В том случае если измерение всех переменных состояния невозможно, а иногда и
нецелесообразно, используются специальные устройства, получившие название наблюда-
телей состояния. Входными величинами наблюдателя являются входной u (t ) и выходной
y (t ) сигналы*), измеренные на физическом объекте, а выходными – восстановленные с
Рис 1.73
ОУ – объект управления; НС – наблюдатель состояния; РС – регулятор состояния; u з -
задающее воздействие; A, B,C,C0 , K - матрицы преобразования.
*)
Для примера 1.70: u (t ) - управляющий сигнал на входе тиристорного преобразователя; y (t ) - частота
вращения двигателя, ω
317
Если наблюдатель восстанавливает (оценивает) весь вектор состояния ν , то он называет-
ся наблюдателем состояния полного порядка, а если только его часть (например, n − 1 ), то
наблюдателем пониженного порядка или редуцированным*) наблюдателем.
Структурная схема простейшего наблюдателя состояния для объекта с одним вхо-
дом u и одним выходом y представлена на рис. 1.74 (жирные линии). Структурная схема
объекта управления ОУ построена в соответствии с уравнениями (1.130), (1.31) и пред-
ставляет собой абстрактную математическую модель той или иной степени сложности
описывающую (по крайней мере качественно) реальные процессы в объекте. Наблюдатель
состояния НС представляет собой физическое устройство, вырабатывающее оценку νˆ
вектора состояния ν . На вход модели и наблюдателя поступает реально измеренный сиг-
нал u .
Рис 1.74
Таким образом, если начальные условия модели объекта ν 0 и наблюдателя νˆ0 оди-
наковы, то переходные процессы в них будут также протекать одинаково. Необходимость
определения начальных условий объекта ν 0 с последующей передачей их на наблюдатель
является одним из недостатков простейшего наблюдателя. Другим его недостатком явля-
ется функционирование по разомкнутому циклу, что, как известно может привести к су-
щественным ошибкам. Эти недостатки устраняются в асимптотическом наблюдателе со-
стояния, в котором предусмотрена автоматическая оптимизация отклонения νˆ0 от ν ., за
*)
редуцировать – лат. упрощать
318
счет введения отрицательной обратной связи по ошибке Δ y = y − yˆ , которая через матрицу
ошибки Δ y .
∗)
Заметим, что выходной сигнал объекта содержит одну ненулевую переменную состояния ν n , которая может
быть непосредственно подана на вход регулятора состояния. Это позволяет применять наблюдатель пониженного (n-1)
порядка.
319
стояния ν и его оценки νˆ , входящие в уравнения (1.134) и (1.135), однозначно связаны,
то при исследовании динамических режимов в замкнутой системе эти уравнения исполь-
зуются совместно.
Выясним характер свободных движений замкнутой системы, обусловленных нену-
левыми начальными условиями, положив u з = 0 и введя новую переменную Δ y = ν −νˆ .
Уравнение (1.137) получено путем вычитания (1.134) из (1.135). Вектор Δ& ν харак-
320
В заключение заметим, что применение модальных регуляторов целесообразно в
том случае, если можно построить достаточно адекватную модель объекта управления и в
то же время не удается измерить те или иные переменные состояния.
Pвх (ω ) в десять раз имеем Pвых (ω ) Pвх (ω ) = 10 . Тогда учитывая, что мощность сигнала
пропорциональна квадрату его амплитуды и учтя соотношение (1.37), можно записать:
A02 (ω ) a 2 = A2 (ω ) = 10 ,
или после логарифмирования получим:
2 lg A(ω ) = 1 бел.
При этом, в соответствии с (1.140) и с учетом того, что 1 бел=10 дб, получим
L(ω ) = 20 lg A(ω ) = 10 дб.
В случае если Pвых (ω ) Pвх (ω ) = 100 , аналогичным образом можно получить
L(ω ) = 20 дб и т.д.
При построении ЛАХ используется полулогарифмическая сетка: по оси абсцисс
откладывается частота ω в логарифмическом масштабе, а по оси ординат с равномерной
шкалой откладывается величина L(ω ) в дб. Если по оси абсцисс откладывается не сама
321
частота ω , а ее десятичный логарифм, то единица приращения lg ω соответствует одной
декаде (дек), т.е. десятикратному увеличению частоты ω .
Заметим, что использование логарифмических частотных характеристик позволяет
оперировать с более простыми соотношениями. В частности, если частотная функция мо-
жет быть представлена в видепроизведения сомножителей, то результирующая ЛАХ мо-
жет быть найдена путем суммирования ординат, соответствующих отдельным сомножи-
телям. Кроме того, логарифмические кривые выполаживаются, что позволяет с большей
уверенностью производить кусочно-линейную аппроксимацию этих кривых. Например,
для интегрирующего звена имеем: A(ω ) = k ω (гипербола). Тогда
L(ω ) = 20 lg A(ω ) = 20 lg k − 20 lg ω
и, следовательно, ЛАХ представляет собой прямую линию, проходящую через точку с ко-
ординатами lg ω = 0 при ( ω = ω1 = 1 c −1 ), L(ω ) = 20 lg k , и имеющую отрицательный наклон
равный -20 дб/дек. Это вытекает из того, что каждое удесятирение частоты соответствует
увеличению lg ω на одну единицу и, следовательно, уменьшению L(ω ) на 20 дб. Точку
пересечения этой прямой с осью абсцисс можно найти, положив L(ω ) = 0 , что соответст-
вует значению A(ω ) = 1 . Напомним, что частота, при которой выполняется условие
A(ω ) = 1 , называется частотой среза ωc . В рассматриваемом случае ωc = k .
ном − n ⋅ 20 дб/дек, а при A(ω ) = kω n прямая L(ω ) будет иметь положительный наклон
+ n ⋅ 20 дб/дек.
Логарифмическая частотная характеристика апериодического звена первого поряд-
ка имеет вид:
k
L(ω ) = 20 lg A(ω ) = 20 lg . (1.141)
T 2ω 2 + 1
При этом, так называемая, асимптотическая ЛАХ строится следующим образом. В коор-
динатах lg(ω ) , L(ω ) параллельно оси ординат проводится прямая lg ω1 = const , где
322
корнем. Это позволяет в диапазоне частот 0 < ω < ω1 заменить зависимость (1.141) при-
k
(1.141) можно под корнем пренебречь единицей, что позволяет записать: L(ω ) ≈ 20 lg .
ωT
Как было показано выше, это выражение соответствует прямой с отрицательным
наклоном -20 дб/дек, проходящей через точку lg ω = lg ω1 ; L(ω ) = 20 lg k . Кусочно-
линейная зависимость L(ω ) , показанная на рис. 1.75 сплошной линией и является асим-
птотической (приближенной) ЛАХ. Действительная ЛАХ показана на том же рис. Пунк-
тиром.
Для апериодического
звена второго порядка
(1.48) асимптотическая
ЛАХ строится анало-
гично изложенному
выше. Воспользовав-
шись выражением (1.46)
с учетом (1.48), имеем:
L(ω ) = 20 lg A(ω ) = 20 lg
T12ω 2 + 1
, (1.142)
В координатах ω , L(ω ) (рис.1.76,а) проведем вспомогательные прямые ω = ω1 и
ω = ω2 , где ω1 = 1 T 1 , ω2 = 1 T 2 -
сопрягающие частоты. Пусть
T1 > T2 . Тогда при 0 < ω < ω1 вы-
ражение (1.142) можно заменить
приближенным L(ω ) ≈ 20 lg k ;
при ω1 < ω < ω2 -
k
L(ω ) ≈ 20 lg ; при ω2 < ω < ∞
ωT1
k
- L(ω ) ≈ 20 lg . Таким об-
T1T2ω 2
разом, асимптотическая ЛАХ
апериодического звена второго
323
порядка состоит из трех отрезков прямых: с нулевым наклоном, с отрицательным накло-
ном -20 дб/дек, с отрицательным наклоном -40дб/дек. На рис.1.76,а эта характеристика
изображена сплошными линиями. Там же пунктиром показана действительная ЛАХ.
На рис.1.76,б приведена асимптотическая ЛАХ колебательного звена, которое опи-
сывается тем же уравнением (1.46), что и апериодическое звено второго порядка, но при
0 < ξ < 1 . Эта ЛАХ представляет собой две асимптоты с наклоном 0 и -40 дб/дек при со-
прягающей частоте равной ω = ω0 , где ω0 = 1 T - частота свободных колебаний (при
ξ = 0 ).
Аналогичным образом можно построить ЛАХ для объектов, описываемых дробно-
рациональными передаточными функциями более высокого порядка.
Так как для минимально-фазовых систем существует однозначная связь между пе-
реходными процессами и амплитудно-частотной характеристикой системы, то для оценки
качества процесса управления весьма удобным является использование логарифмической
амплитудно-частотной чарактеристики L(ω ) . Проиллюстрируем сказанное на конкретных
примерах.
Пусть имеем систему, состоящую из одного интегрирующего звена с W ( p ) = k p ,
охваченного единичной отрицательной обратной связью. Тогда, как было показано выше,
ЛАХ разомкнутой системы представляет собой прямую, представленную на рис.1.77.
Передаточная функция замкнутой
системы имеет вид
k 1
W ( p) = = , (1.143)
p + k T0 p + 1
где T0 = 1 k = 1 ωc .
Из (1.43) вытекает, что рассмат-
риваемая система представляет собой
апериодическое звено первого порядка с
переходной функцией
t
−
h(t ) = 1 − e T0
.
Таким образом, при пересечении ЛАХ оси абсцисс с наклоном -20 дб/дек переход-
ный процесс протекает монотонно. При этом как показано в параграфе 3.2.2., время регу-
лирования t р составляет примерно 3T0 .
324
k
W р ( jω ) = ,
jω (T1 jω + 1)
а соответствующая ЛАХ запишется в виде:
ω1 = 1 T1 - сопрягающая частота.
Запишем передаточную функ-
цию замкнутой системы:
Wр ( p) 1
W ( p) = = ,
1 + Wр ( p) T0T1 p + T0 p + 1
2
или
1
W ( p) = ,
T p + 2ξ Tp + 1
2 2
1 T0
где T0 = ; T = T0T1 ; ξ = .
k 2 T0T1
Учтя, что ωc = k = 1 T0 ,
ω1 = 1 T1 , можно записать
1 ω1
ξ= . (1.145)
2 ωc
325
В случае если ω1 < 4ωc , имеем ξ < 1 и переходный процесс носит колебательный
величины y (∞) . Как отмечалось ранее, такой переходный процесс обычно считается наи-
более приемлемым (см. пример 1.22).
Таким образом, по расположению ЛАХ на плоскости с координатами lg ω ; L(ω )
можно судить о качестве процесса управления. В частности:
а) для исключения колебательности переходного процесса необходимо (но не дос-
таточно), чтобы частота среза ωc соответствовала участку ЛАХ разомкнутой системы с
наклоном -20 дб/дек. Достаточным условием отсутствия колебательности является соблю-
дение неравенства ω1 > 4ωc , где ω1 - первая сопрягающая частота, следующая за частотой
среза;
б) величина времени регулирования t р определяется неравенством t р > π ωc , из
которого следует, что чем выше частота среза ωc , тем быстрее протекает переходный
процесс.
в) чем шире участок ЛАХ с наклоном -20 дб/дек, пересекающий ось абсцисс, тем
ближе переходный процесс к монотонному;
г) если ЛАХ ра-
зомкнутой системы
имеет произвольный
вид (рис.1.79), то вид ее
низкочастотных и высо-
кочастотных участков
незначительно влияет
на характер переходно-
го процесса. При этом
интервал низких
( 0 < ω < ωн ) , средних ( ωн < ω < ωв ) и высоких ( ωв < ω < ∞ ) частот определяются конкрет-
соответствуют L(ωн ) = 20 lg1 Δ = 26 дб, L(ωв ) = −16 дб, что позволяет выделить искомые
интервалы частот (рис.1.79). При этом вид характеристики в интервале средних частот
определяет запас устойчивости и в значительной мере качество процесса управления.
326
4.6.2. Синтез АСУ с помощью логарифмических амплитудно-частотных характе-
ристик
так как только в этом случае характеристика Lск (ω ) полностью определяет качество про-
цесса управления.
3. По построенным логарифмическим амплитудным характеристикам Lс (ω ) и
ношение для ЛАХ примет вид Lк (ω ) = Lск (ω ) − Lс (ω ) . Таким образом Lк (ω ) можно по-
327
параметрами: ωп – интервал положительности вещественной частотной характеристики
(ВЧХ); χ1 = ω3 ωп , χ 2 = ω1 ω2 – основной и
дополнительный коэффициенты наклона ВЧХ
соответственно; λ = ω2 ωп – основной
коэффициент формы. Как показывают расчеты,
при χ1 ≤ 0,8 , χ 2 ≥ 0, 4 и λ ≥ 0,5 величина
перерегулирования σ max в основном
ляется из выражения ωп = π ⋅ ОА t *р .
(рис.1.81), можно найти допустимые значения Pmax и Pmin = 1 − Pmax , при которы суммарное
328
Таблица 1.2
Pmax σ max ,% tр Число Pmax σ max ,% tр Ч
колебаний n колебани
6π 4π
1,4 ≤ 38 ≤ ≤3 1,2 ≤ 26 ≤
ωп ωп
5π 3π
1,3 ≤ 32 ≤ ≤2 1,0 ≤ 17 ≤
ωп ωп
ской ЛАХ разомкнутой системы Lск (ω ) . При этом обычно придерживаются следующего
порядка.
1. Строится низкочастотная асимптота Lнск (ω ) таким образом, чтобы она имела на-
клон -20 дб/дек, соответствующий астатической системе первого порядка, и пересекала
ось абсцисс в точке ωк = kv , где kv - заданный коэффициент усиления разомкнутой систе-
мы, характеризующий точность ее работы по скорости (рис.1.82). При однократном изло-
ме в точке А первая сопрягающая частота определяется соотношением ω1 = kε kv , где kε
–заданный коэффициент, характеризующий точность работы системы по ускорению; при
двукратном – ω1 = 2kε kv .
2. По известной частоте поло-
жительности ωп , определяется частота
329
L(ω ) = L2 при L2 = L1 (рис.1.82). Значение L1 определяется по расчетной кривой, связы-
вающей величины L1 с σ max *) (рис.183). Например, если необходимо чтобы величина пе-
Lсск (ω ) сопрягаются прямой (или ломаной) линией с наклоном кратным -20 дб/дек. При
этом ранее найденные сопрягающие частоты могут быть несколько скорректированы.
4. Высокочастотный участок асимптотической ЛАХ Lвск (ω ) строится с наклоном
кратным -20 дб/дек таким образом, чтобы он как можно ближе совпадал с ЛАХ нескор-
ректированной АСУ. При частотах в 5-10 раз превышающих ωв влияние сигнала практи-
чески не сказывается на переходном процессе и ЛАХ на этом участке можно не учиты-
вать.*)
5. Строят желаемую ЛАХ Lск (ω ) во всей частотной области. При этом для обеспе-
чения построения используются типовые передаточные функции, приведенные в таблице
1.3. Там же приведены отрицательные наклоны асимптот соответствующих логарифмиче-
ских амплитудных характеристик.
Таблица 1.3
Отрицательные
Тип
Передаточная функция наклоны асимптот в
ЛАХ
дб/дек
k (T2 p + 1)
1 W1 ( p) = 20-40-20-40
p(T1 p + 1)(T3 p + 1)
k (T2 p + 1) 2
2 W2 ( p) = 20-60-20-40
p (T1 p + 1)(T3 p + 1)
k (T2 p + 1)
3 W3 ( p) = 20-40-20-60
p (T1 p + 1)(T3 p + 1) 2
k (T2 p + 1) 2
4 W4 ( p) = 20-60-20-60
p(T1 p + 1)(T3 p + 1) 2
*)
Заметим, что величина σ max определяется значениями Pmax и Pmin (см.табл.1.2), которым соответствуют
определенные значения L(ω ) = L1 . Это обстоятельство позволяет определить для различных значений σ max соответ-
ствующие значения Pmax , Pmin и L1 и в конечном итоге построить зависимость L1 (σ max ) .
*)
Так как ωi = 1 Ti , то область высоких частот ( ω > (5 ÷ 10)ωв ), можно назвать областью малых посто-
янных времени.
330
Передаточные функции и ЛАХ всех четырех типов, приведенных в табл. 1.3, полностью
определяются заданием четырех параметров: k , T1 , T2 и T3 . Последние три параметра оп-
*)
При построении кривой μ (σ max ) используется зависимость между вещественной частотной характеристи-
кой замкнутой системы P(ω ) (см., например, рис.1.80) и частотной функцией разомкнутой системы W ( jω ) , что
позволяет построить кривые, связывающие P(ω ) с амплитудной и фазовой характеристиками разомкнутой системы, и
в конечном итоге, найти зависимость μ (σ max ) .
331
Чтобы окончательно убедиться в приемлемости полученной ЛАХ, можно, определив со-
ответствующую передаточную функцию, построить переходный процесс в системе и про-
верить справедливость неравенств σ max ≤ σ max
*
, t р ≤ t *р .
332
РАЗДЕЛ II
ОСОБЫЕ ЛИНЕЙНЫЕ АВТОМАТИЧЕСКИЕ СИСТЕМЫ
УПРАВЛЕНИЯ
К особым линейным системам, относятся системы, содержащие звенья, динамиче-
ские процессы в которых не описываются обыкновенными линейными дифференциаль-
ными уравнениями с постоянными коэффициентами. К таким звеньям относятся звенья с
запаздыванием, реакция которых на входной сигнал появляется через определенное время
τ; звенья с распределенными параметрам, переходные процессы в которых описываются
дифференциальными уравнениями в частных производных, что физически соответствует
изменению переменных не только во времени, но и в пространстве; импульсные звенья,
преобразующие непрерывное входное воздействие в равностоящие друг от друга импуль-
сы, для математического описания которых используется разностные уравнения. Исследо-
вание систем управления, содержащих такие звенья, имеет некоторые особенности, кото-
рые необходимо учитывать при их анализе и синтезе.
К особым системам обычно относят и системы содержащие звенья описываемые
линейными дифференциальными уравнениями с переменными коэффициентами, завися-
щими от времени. Например, если система управления описывается дифференциальным
уравнением вида
a0 y ( n ) + a1 y ( n−1) + ... + an−1 y& + an y = b0 x ( m ) + b1 x ( m−1) + ... + bm−1 x& + bm x ,
333
нения системы, мало изменят свое значение. Следует отметить, что эффективность рас-
сматриваемого метода также зависит и от правильного выбора фиксированных моментов
времени, для которых производится замораживание коэффициентов. Необходимо так вы-
бирать эти моменты, чтобы охватить все возможные варианты значений коэффициентов,
обратив внимание на «опасные» точки, в которых происходит значительное изменение
величины коэффициента, его знака и т.п.
334
Заметим, что звено с запаздыванием является неминимально-фазовым, так как в
отличие от усилительного звена с A(ω ) = 1 и ϕ (ω ) = 0 звено с запаздыванием имеет сдвиг
фаз, отличный от нуля и пропорциональный времени τ.
Приведенные характеристики пока-
зывают, что при любых частотах сигнал на
входе звена с чистым запаздыванием пере-
дается без искажения (A(ω) = 1), поэтому
понятие полосы пропускания частот в дан-
ном случае отсутствует. Физически такое
звено, как и дифференцирующее звено, не
может быть реализовано. Однако такие элементы как транспортное устройство системы
достаточно хорошо аппроксимируются этими звеньями. Кроме того, с помощью этих
звеньев в ряде случаев удается достаточно точно аппроксимировать объекты, описывае-
мые линейными ДУ высоких порядков.
Если кривая переходной функции h(t), начиная с момента
времени t = τ, мало отличается от экспоненты, а до момента
t = τ ординаты ее достаточно малы (рис.2.3), то соответствую-
щее приближенное значение передаточной функции объекта
можно записать в виде:
k
W ( p) = Wa ( p)Wτ ( p) = ⋅ e − pτ ,
Tp + 1
рис.2.3
а ДУ преобразованное по Лапласу:
(Tp + 1)epτY(p) = kX(p). (2.3)
В выражении (2.3) параметры T и τ определяются по кривой разгона с применени-
ем того или иного метода обработки экспериментальных данных.
Заметим, что при наличии большого числа последовательно включенных звеньев с
малыми постоянными времени Tμ их можно заменить на звенья с запаздыванием при
n
τ = ∑ Tμ i . Действительно, пусть система содержит n последовательно включенных инер-
i =1
335
−τp
−n ⎡ n
⎤
⎛ τp ⎞ ⎛ τp ⎞ τp
lim⎜1 + ⎟ = lim ⎜1 + ⎟ ⎥
⎢ = e − pτ .
n⎠ n →∞ ⎢ n⎠ ⎥
n→∞
⎝ ⎝
⎣ ⎦
α
⎛ 1⎞ n
Здесь учтено, что lim ⎜1 + ⎟ = e . Тогда, обозначив = α , получим результат
α →∞
⎝ α⎠ τp
приведенный выше..
Таким образом, передаточную функцию при достаточно большом числе n
(n > 5÷10), можно аппроксимировать звеном запаздывания с τ = nTμ .
В общем случае передаточная функция линейного звена с запаздыванием имеет
вид:
B ( p ) − pτ
W ( p ) = W л ( p )Wτ ( p ) = e ,
A( p )
а соответствующая частотная функция при Wл (jω) = A(jω)ejϕ(ω) и Wτ(jω)=e-jωτ будет
336
a0 p 2 − a1 p + 1 τ2 τ
Wτ ( p ) = e − pτ = , где a0 = ; a1 = . (2.5)
a0 p 2 + a1 p + 1 12 2
Заметим, что полученная передаточная функция имеет корни числителя в правой
полуплоскости, следовательно, данное звено как и звено с передаточной функцией (2.2) не
является минимально-фазовым.
H* Q*
где h = * , q = * – относительные зна-
H0 Q0
чения напора и расхода соответственно;
H 0* ; Q0* – базовые значения H * и Q * ; а –
скорость распространения звука в трубо-
aQ0*
проводе; γ = ; g – ускорение силы
gFH 0*
тяжести; F – площадь сечения трубопро-
вода.
рис.2.4
Преобразуем уравнения (2.6) по
337
Лапласу при нулевых начальных условиях. Учтя, что
∞
L{h( x, t )} = ∫ h( x, t )e − pt dt = H ( p, x); L{q( x, t )} = ∫ q ( x, t )e − pτ dt = Q ( p, x) , получим:
0
∂H ( p, x) γ
= − pQ ( p, x) , (2.7)
∂x a
∂Q( p, x) p
= − H ( p, x ) . (2.8)
∂x γa
Продифференцируем (2.7) по x и подставим в него (2.8):
∂ 2 H ( p, x ) γ ∂Q ( p, x) p 2
= − p = 2 H ( p, x ) ,
∂x 2 a ∂x a
или
∂ 2 H ( p, x ) p 2
− 2 H ( p, x ) = 0 . (2.9)
∂x 2 a
Аналогично, исключив из (2.8) функцию H(p,x), получим:
∂ 2 Q ( p, x ) p 2
− 2 Q ( p, x ) = 0 . (2.10)
∂x 2 a
Рассматривая координату x как независимую переменную, решим дифференциаль-
ные уравнения (2.9) и (2.10) относительно изображений H(p,x) и Q(p,x). Учтем, что харак-
p2
теристические уравнения ДУ (2.9) и (2.10) одинаковы: k 2 − 2
= 0 *), и имеют два корня:
a
p
k 1, 2 = ± . Тогда решения этих уравнений запишутся в виде суммы двух экспонент:
a
H ( p, x) = A1e k1 x + A2 e k 2 x , (2.11)
∂
*)
Здесь k= - операция дифференцирования по переменной x.
∂x
338
Тогда, при x = 0, получим:
γ
A1 k1 + A2 k 2 = − pQ ( p,0) .
a
Подставив в полученное выражение значения k1 и k2, имеем:
A1 –A2 = -γQ(p,0). (2.15)
Совместное решение уравнений (2.13) и (2.15) и дает искомые постоянные интег-
рирования A1 и A2, подставив которые в выражение (2.14) окончательно получим:
H ( p, l ) = H ( p,0)chτp − γQ( p,0) shτp , (2.16)
e τp + e −τp e τp − e −τp
где chτp = ; shτp = – гиперболические косинус и синус соответствен-
2 2
но.
Аналогично можно получить:
1
Q( p, l ) = Q( p,0)chτp − H ( p,0) shτp . (2.17)
γ
Обычно интересуются зависимостью значений h(l,t) и q(l,t) на выходе трубопрово-
да от напора h(0,t) и относительной степени открытия регулирующей заслонки μ, т.е. рас-
матривают трубопровод как объект с сосредоточенными параметрами*). В этом случае,
исключая переменную Q(p,0) из уравнений (2.16) и (2.17) и учтя, что ch2τp – sh2τp = 1, по-
лучим:
H ( p, l )chτp = H ( p,0) − γQ( p, l ) shτp .
2π −∞
*)
Изменение переменных в пространстве целесообразно рассматривать в случае использования распределенно-
го управления.
339
Совместное решение уравнений (2.19) и (2.20) позволяет определить искомые зна-
чения h(l,t) и q(l,t) в конце трубопровода при известных значениях напора h(0,t) в его на-
чале и положение заслонки μ .
Анализ уравнения (2.19) показывает, что протяженный трубопровод можно заме-
нить усилительными звеньями с запаздыванием (т.к. жидкость, в отличие от газа, несжи-
маема), а произведя линеаризацию выражения (2.20), можно применять методы анализа
линейных систем с запаздыванием.
Структурная схема модели, предназначенная для определения величин h(t ) x=l и
q(t ) x=l , т.е. для определения изменения напора и расхода в точке x=l (рис.2.5), составляет-
340
Критерий Михайлова. Пусть имеем систему
Wл(p) Wτ (p)
(рис.2.26), включающую звено с запаздыванием:
Рис 2.26
Wτ(jω) = e− jωτ , а остальная часть системы описывается обык-
новенными ДУ и имеет передаточную функцию:
B ( jω )
W л ( jω ) = .
A( jω )
Запишем передаточную функцию замкнутой системы по каналу y*→ y:
B( p )e − pτ
Wy * y ( p ) =
A( p ) + B( p )e − pτ
(2.21)
Воспользовавшись (2.21), запишем характеристический полином системы:
D(p) = A(p) + B(p)e-pτ, и, положив p = jω , - уравнение кривой Михайлова:
341
все корни уравнения D (p) = 0 лежат в левой полуплоскости, и, следовательно, система
устойчива. Если годограф A*(jω) не отвечает сформулированным требованиям (рис.2.7,б),
то система с запаздыванием будет неустойчива для любых τ.
При τ = 0 система называется предельной , а кривая Михайлова принимаем вид
D * ( j ω ) = A * ( jω ) + 1 . (2.24)
Из (2.24) вытекает, что годограф Михайлова представляет собой вспомогательную
кривую A * ( jω ) смещенную на комплексной плоскости на единицу враво (рис2.8), что
эквивалентно смещению оси ординат на единицу влево (точка О1). Таким образом, распо-
ложение кривой A * ( jω ) относительно нового начала координат О1 позволяет судить об
устойчивости предельной системы: для того чтобы система была устойчива вспомога-
тельная кривая A * ( jω ) должна охватывать точку О1.
2. Рассмотрим случай, когда предельная система ус-
тойчива, а кривая A*(jω) пересекает окружность единич-
ного радиуса в точке k (рис.2.9,а). Частота ωk, при которой
произошло пересечение двух годографов (e-jωτ и A*(jω)),
называется критической. Если время запаздывания τ = τk
таково, что ωk⋅τk = π–ψk, то, как следует из рисунка,
⏐D*(jωk)⏐ = 0 и система находится на границе устойчиво-
сти. При этом: τ k = π − ψ k , и следовательно, для того, чтобы
ωk
342
изображенного на рис.2.9,б, имеем ψ k 2 > ψ k1 и ω k 2 > ω k1 и следовательно
π −ψ k2
τ k = τk2 = .
min
ωk2
3. Рассмотрим более общий случай, когда B(jω) ≠ const. В этом случае соотношение
(2.22) записывается в виде:
D( jω ) = A(ω )e jϕ A (ω ) + B(ω )e j[ϕ B (ω ) −ωτ ] .
Построив зависимости частотных характеристик A(ω) и B(ω),можно показать, что:
а) если кривые A(ω) и B(ω) (рис.2.10а) не пересекаются, то устойчивость системы
при любых временах запаздывания полностью определяется устойчивостью предельной
системы;
б) если кривые A(ω) и B(ω) пересекаются (рис.2.10б), то система будет устойчивой,
аргументы комплексных чисел A(jω) и B(jω) при частоте ω = ωk, которая соответствует
точке пересечения кривых.
в) если кривые A(ω) и B(ω) пересекаются дважды и в случае устойчивой предель-
ной системы, необходимым и достаточным условием устойчивости является неравенство
τ < τk min, где τk min соответствует ωk max .
Критерий Найквиста. Этот критерий, обобщенный для систем с запаздыванием,
формулируется также как и для линейных систем: для того, чтобы замкнутая система бы-
ла устойчива, необходимо и достаточно, чтобы годограф вектора АФЧХ разомкнутой сис-
темы Wp(jω) при изменении частоты от нуля до бесконечности не охватывал точку (–1;j0).
Пусть частотная функция разомкнутой системы имеет вид:
Wp(p) = Wл(p)e-pτ. (2.25)
В соответствии с критерием Найквиста, для устойчи-
вой предельной системы ( τ = 0 ) годограф вектора час-
тотной характеристики для разомкнутой системы
Wp(jω) = Wл(jω) не должен охватывать точку (–1;j0).
В случае наличия запаздывания (τ > 0 частотная
характеристика разомкнутой системы ), в соответст-
вии с (2.25), получается перемножением частотных
характеристик Wл(jω) и e − jωτ . Эта процедура заключа-
ется в повороте каждого вектора Wл(jω) на угол (-ωτ).
При этом возможны следующие случаи.
343
1. Пусть предельная система устойчива и годограф вектора Wл(jω) не пересекается
с кругом единичного радиуса (рис.2.11,а). В этом случае замкнутая система будет устой-
чива при любом запаздывании, так как никакой поворот любых векторов Wл(jω) на любой
угол не приводит к охвату точки (–1;j0).
2. Если имеет место пересечение упомянутых характеристик (рис.2.11,б), то при
повороте вектора ОК на угол (π – ψk), где ψk = ωk⋅τk, характеристика Wp(jω) = Wл(jω)e-jωτ
попадает в точку (–1;j0), т.е. система окажется на границе устойчивости. Следовательно,
для того, чтобы система была устойчивой, необходимо ввести дополнительное условие
ψk
τ <τk = .
ωk
Заметим, что если частотная функция разомкнутой системы более сложная, чем
(2.25), например:
B1 ( jω )e jωτ + B2 ( jω )e − jωτ
W p ( jω ) = ,
A1 ( jω )e jωτ + A2 ( jω )e − jωτ
рис.2.12
единичного радиуса происходит при критической час-
тоте ω k = 4.6 с-1. Следовательно, для того чтобы замк-
344
ψ k 0.967
τ <τk = = = 0.21 с.
ωk 4.6
W yск ( p ) = Wδ ( p) + Wк ( p ) , (2.27)
345
Для сокращения времени переходного процесса tp и снижения его колебательности
(сокращения числа перерегулирований) скорость нарастания интегральной составляющей
управляющего воздействия u должна уменьшаться с те-
чением времени. В простейшем случае этим требованиям
отвечает корректирующие звено с передаточной функци-
ей
k y ⋅ kк
Wк ( p) = − ⋅ e − pτ к ,
Ty p
из рис.2.13 при t > τ к скорость роста управляющего сигнала снижается, что, как указыва-
лось выше, улучшает качество переходного процесса.
Пример 2.3. Найти параметры ПИР-регулятора, предназначенного для стабилиза-
ции температуры в металлургической печи. Структурная схема АСУ представлена на
рис.2.14. Передаточная функция объекта управления имеет вид
ko
Wo ( p) = ⋅ e − pτ o . (2.31)
To p + 1
Числовые значения параметров (2.31), оп-
ределенные по кривой разгона, составляют
ko=1.0; To =80 c; τo=28 c.
Решение. Соотношение динамических
характеристик объекта τ o To = 0.35 < 0.5 в прин-
ципе позволяет применять стандартный ПИ-
346
регулятор. Для удобства расчетов аппроксимируем передаточную функцию запаздываю-
щего звена рядом Пада (2.5).
a0 p 2 − a1 p + 1 65.3 p 2 − 14 p + 1
e − pτ o = = .
a0 p 2 + a1 p + 1 65.3 p 2 + 14 p + 1
Тогда передаточная функция объекта управления (2.31) запишется в виде
65.3 p 2 − 14 p + 1
Wo ( p) = .
(80 p + 1)(65.3 p 2 + 14 p + 1)
Определим параметры ПИ-регулятора (kу, Tу) с передаточной функцией (2.30) при
k к = 0 , обеспечивающее минимум колебательности переходного процесса, характеризуе-
мой отношением σ 2 σ 1 , где σ 1 , σ 2 - величина пре-
дыдущего и последующего перерегулирования.
Как показали расчеты, наименьшее соотношение
σ 2 σ 1 = 0,16 достигается при значениях парамет-
ров ПИ-регулятора: ky=1,7, Ty=50 c. При этом вре-
мя регулирования tp составляет 350с. Кривая пере-
ходного процесса у(t), полученная на модели при
подаче на вход объекта ступенчатого возмущения
Рис.2.15
f(t)=A ⋅ 1(t), представлена на рис.2.15 (кривая 1).
Дальнейшее улучшение переходного процесса производится путем введения кор-
ректирующего звена (2.29), параметры которого можно определить путем постановки вы-
числительного эксперимента. Обработка полученных результатов позволила найти опти-
мальные значения параметров корректирующих звеньев: kк=0,19; τк=21. Кривая скоррек-
тированного переходного процесса приведена на рис.2.15 (кривая 2). Исследование моде-
ли ПИР-регулятора показывает, что оптимальные его параметры в основном определяют-
ся соотношением τ o To . Сравнение кривых переходного процесса свидетельствуют о том,
что введенное корректирующего звена позволяет существенно улучшить качество пере-
ходного процесса. В частности колебательность процесса уменьшилась примерно на по-
рядок в результате чего переходный процесс практически стал монотонным. Кроме того
реализация ПИР-закона регулирования позволила почти в два раза сократить время регу-
лирования.
* * *
В случае применения пропорционально-интегрального по предыстории закона ре-
гулирования (ПИП-регулятор) передаточная функция корректирующего звена имеет вид
347
⎛ k ⎞
Wk ( p ) = −k y ⎜ k1 + 2 ⎟ ⋅ Wo ( p) = W1 ( p )Wo ( p) , (2.32)
⎜ Ty p ⎟⎠
⎝
⎛ k ⎞
где W1 ( p) = −k y ⎜ k1 + 2 ⎟ ; k1,k2 - параметры настройки корректирующего звена; Wo ( p ) -
⎜ Ty p ⎟⎠
⎝
передаточная функция объекта с запаздыванием.
Передаточная функция скорректированного устройства управления в соответствии
с (2.27) и с учетом (2.28) и (2.32) имеет вид
[ ]
W yск ( р ) = k y 1 − k1Wo ( p ) + (1 / Ty P )(1 − k 2Wo ( p ) ) . (2.33)
t < τ o и плавное снижение этого уровня при t > τ o ( u = u б − u к ). Как и в случае примене-
ния ПИР-регулятора, реализация ПИП закона управления улучшает качество переходного
процесса и увеличивает запас устойчивости по амплитуде и фазе по сравнению с ПИ-
регулятором. Кроме того настройка параметров корректирующего звена k1 и k2, в силу
линейной их связи с пропорциональной и интегральной составляющими выходного сиг-
нала корректирующего звена 3, осуществляется сравнительно просто. К основным недос-
таткам ПИП-регулятора можно отнести необходимость достаточно точного знания мате-
матической модели объекта, что в ряде случаев вызывает определенные затруднения.
Таким образом, введение запаздывающих звеньев в структуру параллельного кор-
ректирующего звена позволяет существенно улучшить качество переходных процессов в
АСУ объектами с существенным запаздыванием.
348
6. ИМПУЛЬСНЫЕ СИСТЕМЫ
349
сываемых обыкновенными линейными дифференциальными уравнениями, содержат зве-
но, реализующее линейное квантование сигнала по времени. Заметим, что цифровые сис-
темы управления при малом шаге квантования по уровню сигнала Δx, соизмеримом с при-
борной погрешностью измерительного устройства, могут рассматриваться как импульс-
ные. Следовательно, к таким системам применимы методы исследования динамических
режимов, разработанные для импульсных систем.
Замечено, что процесс регулирования для инерционных систем существенно об-
легчается, если перемещение регулирующего органа производить не непрерывно, а им-
пульсно (дискретно), наблюдая во время паузы за результатами действия импульса. Изме-
нение параметров импульса приводит к изменению средней скорости перемещения регу-
лирующего органа, что эквивалентно изменению коэффициента передачи этого органа.
Кроме того, импульсные системы позволяют реализовать многоканальные системы
управления, радиолокацию и др. Основной смысл введения импульсного управления за-
ключается в освобождении измерительного устройства регулятора от нагрузки на выходе.
Это позволяет применить более точное и тонкое измерительное устройство с обеспечени-
ем в то же время достаточной мощности управляющего воздействия. Так как в дискрет-
ных системах, по сравнению с непрерывными, в принципе происходит потеря информа-
ции об изменениях сигнала, то можно ожидать снижения точности функционирования
системы. Однако при достаточно малом шаге квантования и при сравнительно медленно
меняющихся сигналах, снижение этой точности несущественно. Кроме того, процедура
дискретизации сигнала сопровождается отфильтровыванием высоких частот, увеличивая
помехозащищенность системы, а применение вместо непрерывных устройств цифровых
преобразователей позволяет существенно снизить приборную погрешность. Таким обра-
зом, суммарная точность функционирования дискретной системы, по сравнению с непре-
рывной, может существенно повысится.
350
Здесь x(nT) – входной сигнал системы, определяемый для дискретных моментов
времени t=nT. Так как Т=const, то функция x(nT) является функцией целочисленного ар-
гумента n и называется решетчатой функцией; y(nT) – выходной сигнал системы, свойст-
ва которого аналогичны х(nT); Ai, Bj – постоянные коэффициенты разностного уравнения;
Δiy(nT) –конечная разность i-го порядка.
Проиллюстрируем сказанное. Пусть, напри-
мер, функция y(t) изменяется так, как показано на
рис.2.20. Первая разность этой функции равна Δy(nT)
= y[(n+1)T] – y(nT), т.е. равна длине отрезка 11′, где
11′ – геометрическая интерпретация первой разности
(см. рис.2.20). Заметим, что при Т → 0 первая раз-
ность функции y(t) стремится к ее дифференциалу.
Вторая разность представляет собой разность
первых разностей:
Δ2y(nT) = Δy [(n+1)T] - Δy[nT] = y[(n+2)T] – y[(n+1)T] – y[(n+1)T] + y(nT) =
= y[(n+2)T] – 2y[(n+1)T] + y(nT), т.е. равно длине отрезка 2′2′′, где 2′2′′ = 11′ - 22′
– геометрическая интерпретация второй разности.
В общем случае i-тая разность (при t=nT) будет равна:
Δiy(nT) = Δi-1y[(n+1)T] – Δi-1y(nT).
Последовательно понижая порядок разности, можно представить разность любого
порядка в виде алгебраической суммы функции y(t) для различных моментов времени.
Можно показать, что в этом случае:
ι
Δ ι y (νΤ ) = ∑ (−1)κ ⋅ Сικ y[(ν + ι - κ )Τ ] , (0.2)
κ =0
i!
где Сik = - число сочетаний из i элементов по k.
k!(i − k)!
Например, воспользовавшись формулой (2.34), определяем вторую разность, поло-
351
Можно показать, что коэффициенты уравнений (0.1) и (0.3) связаны следующим
соотношением:
i
ai = ∑ (−1) i −k Ak C mi −−kk .
k =0
Заметим, что если в уравнении (0.3) коэффициент am=0, то, в отличие от дифферен-
циальных уравнений, можно понизить его порядок, заменив n+1 = k.
Решение однородного разностного уравнения (0.3) при x(t)=0, описывающее сво-
бодное движение импульсной системы, ищется в виде показательной функции
y (t ) = z t . (0.4)
Из выражения (0.8) вытекает, что при модулях комплексных чисел zi меньше еди-
ницы все свободные составляющие затухают, т.е. система устойчива. Таким образом ус-
ловие
z i =mod zi = Ai < 1 (0.9)
352
быть расположены на комплексной плоскости корней zi внутри круга единичного радиуса
(рис.2.21).
В зависимости от вида корней характеристического уравнения (0.6) переходный процесс
может иметь апериодический или колебательный характер.
Пример 2.4. Дано линейное однородное разностное уравнение второго порядка с
постоянными коэффициентами:
x(n+2) + a1x(n+1) + a2x(n) = 0.
(0.10)
Требуется найти его решение.
Решение. Запишем характеристическое уравнение выражения (0.10):
z2 + a1z +a2 = 0.
(0.11)
а а12
Корни уравнения (0.11) равны: z1,2 =− 1 ± − а 2 . Тогда в соответствии с (0.7)
2 4
решение разностного уравнения (0.10) будет иметь вид:
x(n) = C1z1n + C2 z2n,
где C1 и С2 – постоянные величины, определяемые из начальных условий: при t = 0 x(n) =
x(0); x(n+1) = x(1)
Подставив начальные условия в полученное решение, имеем:
z2 х( 0 ) − х( 1 )
x( 0 ) = C1 + C 2 ⎫ С1 = ;
⎪ z2 − z1
⎬, откуда
х( 1 ) − х( 0 )z1
x( 1 ) = C1 z1 + C 2 z 2 ⎪⎭ С2 = .
z2 − z1
Допустим, что корни характеристического уравнения равны: z1=-0,1; z2=-0,5. Пусть
при импульсном возмущении начальные условия будут: x(0)=0; x(1)=0,4. Тогда постоян-
ные величины равны: С1=1, С2= -1, и решение уравнения примет вид:
x(n)=(-0,1)n-(-0,5)n
График изменения решетчатой функции x(n) при объкте управления, описываемом
уравнением первого порядка, представлен на рис.2.22,а.
а) б)
x(n) x(n)
0,4 0,4
0,2
0,2
1 2 3 4
n
0,2
1 2 3 4 n
Рис.2.22
353
При z1=0,1; z2=0,5 и тех же начальных условиях получим: С1=-1, С2= 1. Тогда
x(n)=(0,5)n -(0,1)n и переходный процесс, представленный на рис.2.22,б, носит апериоди-
ческий характер.
Пример 2.5. Решим систему разностных уравнений с правой частью
x(n+1) +x(n) = b01y(n), (0.12)
y(n+1) + a12y(n) = b02x(n). (0.13)
Решение. Исключим переменную х из приведенной системы уравнений. Для чего за-
пишем уравнение (0.13) для n+1 интервала:
y(n+2) + a12y(n+1) = b02x(n+1). (0.14)
Из уравнений (0.13) и (0.14) определим x(n) и x(n+1) и, подставив найденные зна-
чения в (0.12), окончательно получим:
y(n+2) + (1+a12) y(n+1) + (a12 – b01 b02) y(n) = 0. (0.15)
Уравнение (2.47) решается также, как и в предыдущем примере.
Заметим, что если a12 = b01b02, то произведя замену переменных n+1=k, уравнение
(0.15) можно записать в виде: y(k+1) + (1+a12) y(k) = 0. Полученное уравнение является
разностным уравнением первого порядка, т.е. порядок исходного уравнения (0.15) пони-
зился.
Пример 2.6. Рассмотрим импульсную
систему автоматического управления темпера-
турой в печи, функциональная схема которой
представлена на рис.2.23.
Уравнения отдельных звеньев, системы
имеет вид.
1. Уравнение объекта управления (ОУ):
dΘ
To + Θ = − k0 ⋅ ϕ ,
dt
(0.16)
где Θ - отклонение температуры печи Θп от её заданного значения Θп*; ϕ - перемещение
регулирующего органа (РО), управляющего расходом подаваемого энергоносителя q; Тo,
k0 – постоянная времени и коэффициент передачи объекта соответственно.
2. Уравнение регулирующего органа совместно с исполнительным механизмом
(ИМ):
dϕ
= k1 ⋅ U , (0.17)
dt
354
где U – напряжение, подводимое к двигателю исполнительного механизма; k1 – коэффи-
циент передачи.
3. Функционирование импульсного регулятора (ИР), реализующего широтно-
импульсную модуляцию (см.п.6.2), описывается следующими уравнениями:
Значение ϕ( t ) для конца n-го и, следовательно, начала (n+1) периода найдем, под-
ставив (0.19) в (0.22) и учтя, что │signΘ(n)│=+1:
ϕ(n+1)=ϕ(n)+αkиΘ(n). (0.23)
355
t
С учетом того, что t = , уравнение объекта (0.16) можно записать в виде:
T
dΘ T
+ β Θ = − k0 βϕ , где β = . (0.24)
dt To
Известно, что решение уравнений первого порядка с правой частью:
dy − p ( x ) dx ⎡ ∫ p ( x ) dx dx + C ⎤ , где С – постоянная ин-
+ p( x) y = q ( x) , ищется в виде: y = e ∫ ⎢⎣ ∫ q ( x ) e ⎥⎦
dx
тегрирования.
В нашем случае y=Θ; x = t ; р(х)=β; q(х)=-k0βϕ( t ); C=Θ(n). Тогда решение уравне-
ния (0.24) после преобразований примет вид:
t
Θ(t ) = Θ(n) ⋅ е − β ( t − n ) −k 0 βе − β ( t − n ) ∫ е β ( t − n )ϕ (t )d t . (0.25)
n
Вычислим значение Θ( t ) в конце n-го (или начале (n+1) периода). При этом учтем,
вале от (n+γ) до (n+1) – уравнением (0.22). Тогда подставив в (0.25) t =n+1, после интегри-
рования и преобразований окончательно получим:
Θ(n + 1 ) = Θ(n) ⋅ e − β − k 0 ⋅ ( 1 − e − β ) ⋅ ϕ(n) − k o k и ⋅ α ⋅ ( 1 − e − β ) ⋅ Θ(n) . (0.26)
Здесь учтено, что при γ<<1 значение e β ⋅γ ≈ 1 + β ⋅ γ .
[ ]
Θ(n + 1 ) + k 0 ⋅ k и ⋅ α ⋅ ( 1 − e − β ) − e − β ⋅ Θ(n) = − k 0 ⋅ ( 1 − e − β ) ⋅ ϕ(n) . (0.28)
[ ]
z 2 + k0 ⋅ kи ⋅ α ⋅ ( 1 − e − β ) − e − β − 1 ⋅ z + e − β = 0 .
а1 а2
ни z1, 2 = − ± 1 − а2 .
2 4
356
При этом решение уравнения (0.29) запишется в виде: Θ(n)=C1.z1n+C2.z2n , где С1 и
Рис.2.25
357
такие параметры изменяемой части системы (Т, с, γ, kи), при которых она была бы устой-
чивой.
* * *
Рассмотренный метод решения разностных уравнений относится к классическим.
Более эффективным методом решения этих уравнений является метод, использующий так
называемое z-преобразование, играющее для анализа дискретных систем ту же роль, что и
преобразование Лапласа для линейных систем.
6.1.2 Прямое z-преобразование
Запишем последовательность ординат функции x(t) для дискретных моментов вре-
мени t=nT, n= 0, ∞ в виде:
∞ ⎧ 0 , ∀ t ≠ nT
⎪
х*(t) = ∑ х(t)δ(t − nT) , где δ(t − nT) = ⎨ . (0.30)
n =0 ⎪⎩δ(nT), ∀ t = nT
∞
Так как ∫ δ (t − nT )dt = 1
0
по определению, то выражение (0.31) можно записать в
виде:
∞
Х(p) = ∑ x(nT)e − pnT . (0.32)
n =0
Так как правая часть уравнения (0.32) представляет собой дискретную функцию
целочисленного элемента n, то знак дискретности * может быть опущен.
358
Выражение (0.32) введено Я. З. Цыпкиным и носит название дискретное преобра-
зование Лапласа или D-преобразование: X(p) = D{x(nT)}. Заметим, что функция x(nT), как
и в случае преобразования Лапласа, должна тождественно равняться нулю при n<0.
Обозначим pT = q. Тогда eq = z является комплексным числом и выражение (0.32)
можно записать в виде:
∞
∑ x(nT)z
n=0
−n
= Х(z) = Z { x(nT)} . (0.33)
Пр
авая часть полученного выражения представляет собой сумму бесконечно убывающей
геометрической прогрессии со знаменателем z-1. Тогда получим:
1 z
Z{ 1(nT)} = −1
= .
1− z z −1
∞
2. Z{e −αnT } = ∑ e −αnT z − n = 1 +e −αT z −1 + e − 2 αT z − 2 + K + e −αnT z − n + K
n =0
= Tz (1 + 2 z −1 + 3z −2 + K + nz − ( n −1) + K).
−1
359
Выражение в скобках, стоящее в правой части полученного уравнения, представля-
ет собой разложение бинома Ньютона вида (1 – z-1)-2. Тогда можно записать:
Tz
Z {nT } = Тz −1 (1 − z −1 ) −2 =
( z − 1) 2
Заметим, что во всех рассмотренных примерах коэффициенты при общем члене
ряда, представляет собой оригинал решетчатой функции x(nT).
* * *
Сформулируем основные свойства z-преобразования.
1. Свойство линейности, вытекает из определения (0.33).
m m
Z {∑ a j x j (nT )} = ∑ a j Z{x j (nT )} . (0.34)
j =1 j =1
360
позволяет алгебраизировать разностные уравнения и автоматически учесть начальные ус-
ловия.
3. Теорема запаздывания (смещение аргумента в области оригинала в сторону τ = -
mT)
Иногда разностные уравнения записывают, используя смещения в сторону запаз-
дывания. Например, обозначив n+m=k, разностное уравнение, рассмотренное в примере
2.8 (при т=2) можно переписать его в виде: x(k) + a1x(k-1) +a2x(k-2) = 0
В общем случае, учтя, что k – m = n, имеем:
∞
⎡∞ −1
⎤
Z {x[(k − m)Т ]} = ∑ x(nT ) z −k
= z −k = z −m z − n = z − m ⎢∑ x(nT ) z − n + ∑ x(nT ) z − n ⎥ =
k =0 ⎣ n =0 n=− m ⎦
( n=− m)
⎡ m
⎤
= z −m ⎢ Х ( z ) + ∑ x(−nT ) z n ⎥ .
⎣ n =1 ⎦
Так как при nT<0 x(nT)=0 по определению, то второе слагаемое в квадратных скоб-
ках равно нулю. Тогда окончательно получим:
Z{x[(k-m)T]} = z-mX(z). (0.36)
4. Теорема о конечном значении.
Конечное значение функции x(nT) равно:
lim x(nT ) = x(∞) = lim( z − 1) X ( z ) . (0.37)
t →∞ z →1
Приравняв правые части, уравнении (0.38) и (0.39) и взяв от обеих частей предел
при z→1, получим:
k
lim[ ( z − 1) X ( z ) − zx (0 )] = lim{lim ∑ { x[( n + 1)T ] − x ( nT )} z − n =
z →1 z →1 k → ∞
n=0
361
−n
Здесь учтено, что lim z = 1 и произведено сокращение подобных членов в фигур-
z →1
Коэффициент при общем члене ряда (0.41) и является искомой функцией x(nT).
Tz 2
Пример 2.9 Пусть X ( z) = . Необходимо найти x(nT).
( 1 − z)2
Решение. Представим X(z) в виде ряда, для чего z2 поделим на (1-z)2:
362
z2: (z2- 2z+1)= 1+2z-1+3z-2+…+(n+1)z-n+…
Тогда можно записать:
X(z) = T [1 + 2z-1 + 3z-2 + …+ (n+1)z-n + …], откуда x(nT) = (n+1)T.
* * *
3. Общий метод нахождения оригинала базируется на том, что ряд вида (0.41) от-
носится к ряду Лорана. Известно, что коэффициент этого ряда C-n при z-n вычисляется по
формуле:
1
С −n = ∫ X ( z ) z n −1 dz = Z −1 {X ( z )} . (0.42)
2πj
Выражение (0.42) является обратным z-преобразованием, аналогичным обратному
преобразованию Лапласа.
Воспользовавшись (0.42), можно показать, что в случае, если X(z) является дробно-
В( z )
рациональной функцией, т. е. X ( z ) = , где В(z) и A(z) – алгебраические полиномы,
A( z )
причем степень полинома В(z) меньше степени полинома А(z), то оригинал x(nT) можно
найти по формуле:
N
B( z k ) n−1
x(nT ) = ∑ zk , (0.43)
k =1 Az/ ( z k )
где: zk – корни характеристического уравнения A(z)=0; N– общее количество корней того
же уравнения; Az/ ( z ) - производная полинома A(z) по z.
Выражение (0.43) является аналогом теоремы разложения Хевисайда-Карсона ис-
пользуемой для нахождения оригинала в операционном исчислении.
Пример 2.10 Пусть z-преобразование решетчатой функции x(nT) задано в виде, по-
лученном в примере 2.8.
x(0) z 2 + [a1 x(0) + x(1)]z
Z {x(nT )} = . (0.44)
z 2 + a1 z + a 2
Примем, что числовые значения коэффициентов равны: а1 = -1; а2 = 3/16, а на-
чальные условия: x(0) = 0; х(1) = 2 . Найдем решетчатую функцию x(nT).
Решение. Подставим числовые значения параметров в выражение (0.44), получим:
2z
X ( z) = .
z − z + 3 / 16
2
363
Воспользовавшись теоремой разложения (0.43), получим:
2
B( z k ) 2 z1 2z2
x ( n) = ∑ z kn = z1n + z 2n . (0.45)
k =1 z k Az′ ( z k ) z1 (2 z1 − 1) z 2 (2 z 2 − 1)
Здесь коэффициенты при zin представляют собой постоянные величины Cn, которые
после подстановки числовых значений z1 и z2 равны: С1=4, С2=-4. Тогда выражение (0.45)
примет вид:
x(n) = C1 z1n + С2 z 2n = 4[(0,75) n − (0,25) n ] (0.46)
Переходный процесс в системе, построенный в соответствии с выражением (0.46),
представлен на рис.2.28. Здесь кривая 1 представляет собой
график весовой функции w(t) непрерывной системы, описы-
ваемой дифференциальным уравнением второго порядка, а
решетчатая функция 2 – график дискретной весовой функ-
ция w(n) для той же системы.
Заметим, что обычное z-преобразование позволяет
определять значения x(nT) по известному X(z) только для
дискретных моментов времени t=nT, где T=const.
6.1.4 Модифицированное z-преобразование
Если необходимо определять величину x(t) в любой момент времени, то пользуют-
ся модифицированным z-преобразованием, которое имеет вид:
∞
X ( z , ε ) = Z {x[(n + ε )T ]} = ∑ x[(n + ε )T]z -n , (0.47)
n =0
364
Здесь второй сомножитель представляет собой обычное обратное z-преобразование
которое можно найти, воспользовавшись таблицей 2.1. Тогда оригинал выражения (0.48)
запишется в виде дискретной смещенной экспоненты:
x(nT ) = e −αεT ⋅ e −αnT = e −α ( n+ε )T .
Заметим, что в случае запаздывающей функции x(nT–ξT), ее z-преобразование на-
ходится с помощью теоремы запаздывания (0.36). Имеем
x(nT- ξT)=x[(n+ε)T-(k+1)T]. (0.49)
Здесь ξT=τ – время запаздывания; ξ=k+1- ε; k=0,1,2,….
Взяв z-преобразование от левой и правой частей выражения (0.49) с учетом (0.36),
получим:
X ( z , ξ ) = z − ( k +1) X ( z , ε ) ,; k=0,1,2,…. (2.82)
Например, при k=0 и, следовательно, ξ = (1 − ε ) <1, выражение
zе −αεТ
X ( z, ε ) = , то, воспользовавшись таблицей 2.1 и учтя соотношение (0.36), полу-
z − е −αТ
чим:
x[(n − ε )T ] = e −α ( n −ξ )T .
Выражение Ошибка! Источник ссылки не найден., являющееся z-
преобразованием запаздывающей функции x(nT–τ), может быть использовано при анализе
и синтезе дискретных систем, содержащих звенья с запаздыванием.
6.2 ИМПУЛЬСНЫЕ ФИЛЬТРЫ
365
Идеальные ИЭ преобразуют непрерывный сигнал в последовательность импульсов,
типа δ-функции, величина которых (интеграл) пропорциональна непрерывному сигналу
x(t) в момент времени t=nT. В реальных системах ИЭ формируют импульсы разнообраз-
ной формы, которые характеризуются определенными параметрами. Изменение парамет-
ров импульсов в функции входного воздействия x(t) называют импульсной модуляцией.
К основным видам моду- б)
а)
ляции прямоугольных импуль-
сов (рис.2.31) относятся:
1. Амплитудно-
импульсная модуляция (АИМ)
(рис.2.31,а). Этот вид модуляции
Рис.2.31
характеризуется постоянным
периодом квантования T = const и длительностью (шириной) импульса tи=const. Амплиту-
да импульса Н пропорциональна величине входного сигнала x(t) в дискретный момент
времени t=nT, т.е. H=kx(nT), где k - коэффициент пропорциональности.
2. Широтно-импульсная модуляция (ШИМ) (рис.2.31,б). Этот вид модуляции ха-
рактеризуется: постоянными периодом квантования (T=const) и абсолютной величиной
амплитуды импульса H=c⋅sign x(nT); c=const. Ширина импульса tи пропорциональна абсо-
лютному значению входного сигнала x(t) в момент времени t=nT, т. е. tи=k│x(nt)│, где k –
коэффициент пропорциональности
Кроме рассмотренных видов модуляций существует время-импульсная, которая
подразделяется на частотно-импульсную (Т=var) и фазо-импульсную (ϕ=var, где ϕ - сдвиг
импульса относительно начала периода nT). Эти виды модуляции применяются в основ-
ном в радиотехнике.
Классическими представителями импульсных элементов, наглядно иллюстрирую-
щими их функционирование является падающая дужка и ключ.*)
1. Падающая дужка, реализующая АИМ (рис.2.32,а). В результате вращения экс-
центрика 1 с постоянной частотой ω, падающая дужка 2 совершает движение «вверх –
вниз», прижимая на определенное время tи стрелку измерительного прибора 3 к потен-
циометру 4. При этом с вы-
a) б)
хода импульсного элемента x(nT)
ω x(nT)
*)
В современной практике эти импульсные элементы заменены технически более совершенными. Однако про-
стота и наглядность функционирования падающих дужек и ключей делает их рассмотрение методически целесообраз-
ным.
ω
366
Рис.2.32
порциональный положению стрелки относительно нулевого значения величины x(t). По
мере удаления стрелки от нулевого положения амплитуда импульсного сигнала увеличи-
вается. Вращение экцентрика осуществляется синхронным двигателем 5.
2. Ключ, реализующий АИМ (рис.2.32,б). Ключ 6 при вращении эксцентрика 1
2π
замыкается на определенное время tu с периодом повторения T = , где ω – частота
ω
вращения двигателя 5.
3. Падающая дужка, реализующая
ШИМ (рис.2.33). Отличие этого устройства
от устройства представленного на рис.2.32,а
заключается в том, что падающая дужка 2
имеет вырез, а потенциометр заменен двумя
контактными пластинами 4. Благодаря выре-
зу на дужке время замыкания цепи (длитель-
ность импульса tu) будет пропорциональна
отклонению стрелки измерительного прибора 3 от нулевого положения в ту или иную сто-
рону. При этом амплитуда импульса остается постоянной.
Определим математический оператор, связывающий входную x(t) и выходную y(t)
переменные импульсного фильтра (рис. 2.30)
Известно, что входная и выходная переменные в непрерывных системах связаны
между собой интегралом Дюамеля (см.п.10.4.2):
t
y (t ) = ∫ w(θ ) x(t − θ )dθ ,
0
367
∞
F1 ( z ) F2 ( z ) = ∑ f 1 (kT ) z − k F2 ( z ) .
k =0
Z {yn } Y ( z )
W * ( z) = = (0.52)
Z {xn } X ( z )
Выражение (0.52), при условии что x(t) ≡ 0, t<0, представляет собой дискретную
передаточную функцию. В случае подстановки в (0.52): z = epT|p=jω = ejωT, получим дис-
кретную частотную функцию W*(ejωT), позволяющую производить частотный анализ
дискретных систем.
Пример 2.11 Пусть непрерывная часть импульсного фильтра представляет собой
интегрирующее звено с передаточной функцией W(p)=k/p. Требуется найти дискретную
передаточную функцию импульсного фильтра Wф* .
z kz
равной k. Тогда имея в виду, что Z {1(nT )} = , получим Z {k (nT )} = = Wф* (z) . По-
z −1 z −1
лученное выражение и представляет собой искомую передаточную функцию импульсного
368
фильтра, которая является дискретным оператором преобразования двух последовательно
включенных элементов: импульсного элемента и непрерывной части.
Подчеркнем, что дискретная передаточная функция последовательно включенных
непрерывных звеньев не равна произведению дискретных передаточных функций этих
звеньев, т.к. для этого требовалось бы иметь импульсные элементы перед каждым непре-
рывным звеном. Поэтому для нахождения передаточной
ИФ
функции сложной дискретной системы необходимо с x(t) x(nT) y
ИЭ НЧ
помощью структурных преобразований или графов све-
Wф* ( z )
сти всю непрерывную часть в одно непрерывное звено, y*
2.34).
B(z)
личество корней этого уравнения (k = 1, N ) ; = W * ( z ) - дискретная передаточная
A(z)
369
B(z k )
функция системы; Ck = - постоянные величины; n –относительное дискретное
z k Az′(z k )
время.
Как отмечалось выше, из выражения (0.54) вытекает, что для устойчивой системы,
отвечающей требованию (0.53), необходимо чтобы выполнилось условие:
z k = mod zk <1. (0.55)
a1 a12
z1, 2 =− ± − a2 .
2 4
Тогда условия устойчивости для всех трех случаев запишется в виде:
a1 a2
1. z1 = − + 1 − a2 <1, откуда 1 + a1 + a 2 > 0. (0.57)
2 4
a1 a2
2. z2 = − − 1 − a2 >-1 , откуда 1 - a1 + a 2 > 0. (0.58)
2 4
a1 a2
3. При 4 a 2 > a12 , z1, 2 = − ± j a 2 − 1 . Модуль комплексного числа zi (i = 1,2)
2 4
равен:
370
1
⎛ a2 a2 ⎞ 2
−1
mod zi = ⎜ 1 + a2 − 1 ⎟ = a2 2
,
⎝ 4 4 ⎠
1
Тогда в соответствии с условием (0.55), условие устойчивости будет: a2 2 <1 или
1 − a 2 >0. (0.59)
Таким образом, условия (0.57)-(0.59) являются условиями устойчивости импульс-
ной системы второго порядка при любых типах переходного процесса.
6.3.1 w-преобразование.
Так как непосредственный анализ влияния коэффициентов разностных уравнений
на корни характеристического уравнения выше четвертого порядка в принципе невозмо-
жен, а третьего и четвертого порядков достаточно громоздок, то для облегчения решения
задачи целесообразно воспользоваться такими критериями, которые позволяют непосред-
ственно по коэффициентам уравнения судить об устойчивости системы. С этой целью
используютw-преобразование, которое позволяет непосредственно применять известные
критерии устойчивости непрерывных линейных систем.
При применении w-преобразования окружность единичного радиуса на комплекс-
ной плоскости z отображается на мнимую ось комплексной плоскости w (рис. 2.35).
Для этого используется следующая подстановка:
1+ w z −1
z= ; откуда w = . (0.60)
1− w z +1
Выражение (0.60) на границе области устойчивости при z = e jωT = e jω * , где ω*=
ωT, (рис.2.35а), примет вид:
e jω* − 1
w = jω* . (0.61)
e +1
Имея в виду, что
ejω*=cosω*+jsinω*, и умножив числи-
тель и знаменатель правой части вы-
ражения (0.61) на число сопряженное
знаменателю, окончательно получим
j sin ω *
w= = jtg 0,5ω * = jλ . (0.62)
1 + cos ω *
Здесь λ=tg0,5ω* - так называемая относительная псевдочастота (при малых час-
тотах tg0,5ω*≈ 0,5ω*.
371
Из (0.62) вытекает, что при изменении частоты ω* от –π до +π псевдочастота λ про-
бегает все значения от -∞ до +∞, а комплексная величина w движется по оси мнимых от -
j∞ до +j∞. Эта ось, отображающая окружность z = e jω * на плоскости z, и является грани-
цей устойчивости на плоскости w (рис.2.35,б). Заметим, что прямая w=jλ является кон-
формным отображением (образом) окружности z=ejωT. Таким образом, для устойчивой
системы корни ее характеристического уравнения после подстановки в него преобразова-
ния (0.60) должны лежать на комплексной плоскости w слева от оси мнимых. Это и позво-
ляет для w -преобразованных дискретных передаточных функций W*(w) использовать
обычные критерии устойчивости, применяемые для непрерывными линейных систем.
Пример 2.13 Пусть характеристическое уравнение импульсной системы имеет вид
2
z + а1z + а2 = 0. Требуется определить условия устойчивости.
Решение. После подстановки в характеристическое уравнение системы выражения
(2.93), получим:
[(1+w)2/(1-w)]2+ a1 [(1+w)/(1-w)]+ a 2 =0 ,
или после преобразований:
(1- a1 + a 2 )w2+2(1- a 2 )w+1+ a1 + a 2 =0.
В соответствие с критерием Гурвица (п.3.1.2) для устойчивости системы второго
порядка необходимо и достаточно, чтобы все коэффициенты уравнения были положи-
тельны. Тогда имеем:
1- a1 + a 2 >0;
1- a 2 >0;
1+ a1 + a 2 >0.
Эти результаты совпадают с результатами, полученными ранее при непосредствен-
ном (более громоздком) анализе корней характеристического уравнения (пример 2.12).
6.3.2 Частотные критерии устойчивости
Для анализа устойчивости импульсных систем могут быть использованы классиче-
ские частотные методы, применяемые в линейной теории управления.
Ранее было введено обозначение: pT=q и epT=eq=z, что позволяет записать
W*(z)=W*(eq)=W*(q)=В*(q)/A*(q). Тогда для замкнутой импульсной системы (рис 2.34) ха-
рактеристическое уравнение 1 + Wф* ( z ) = 0 , опуская индекс «ф» и учтя, что z= eq , можно
записать в виде
1+W*(eq)=0, (0.63)
где W*(eq) – дискретная передаточная функция разомкнутой ситемы (импульсного фильт-
ра).
372
В соответствии с условием устойчивости |zk|<1, корни уравнения (0.63) qk должны
лежать в левой полуплоскости комплексного переменного q=(α±jω)T=α*±jω*. Это утвер-
8 ∗
ждение вытекает из условия (0.55), имеем z k = e qk = eα k ⋅ e jω k < 1 и, следовательно, для
373
где Δ Li - изменение аргумента комплексной функции D *(q) при обходе контура на участ-
ке Li (i = 1, 4) :
Δ L1 = Δ1 arg D *( jω ) при −π ≤ ω* ≤ +π ;
Так как при обходе контура L1-L4 вектором D*(q) каждой точке на участке контура
L2 с положительным аргументом +φ соответствует точка на участке L4 с отрицательным
аргументом -φ, то, Δ L + Δ L = 0 . Изменение аргумента на бесконечно удаленном участке
2 4
a0eqm.
Тогда при движении по участку контура L3 комплексное число q изменится от значения
* *
α*+jπ до α*–jπ, а аргумент функции D*(q) = a0eqm = a0 eα m e jω m на –2mπ, что и требовалось
доказать.
Так как для устойчивой системы должно выдерживаться условие ΔargD*(q)=0, то с
учетом сказанного можем записать: ΔargD*(q)=ΔargD*(jω*)-2πm =0, или, опуская индекс
«1», получим:
ΔargD*(jω*)=2πm, при –π ≤ ω ≤ +π. (0.67)
Выражение (0.67) и является условием устойчивости импульсной системы, в соот-
ветствии с которым критерий Михайлова можно сформулировать следующим образом:
для того, чтобы замкнутая импульсная система была устойчива необходимо и достаточно,
чтобы годограф вектора D*(jω*) при изменении ω* от 0 до +π, нигде не обращаясь в нуль,
прошел на комплексной плоскости в положительном направлении последовательно 2m
квадрантов.
374
В случае применения w-преобразования характеристический полином замкнутой
системы D*(w) при w=jλ превращается в кривую Михайлова D*(jλ), которая для устойчи-
вой системы при изменении λ от 0 до +∞ последовательно в положительном направлении
проходит m квадрантов (так как λ=ω*/2), т. е. имеем полную аналогию с критерием Ми-
хайлова применяемым для непрерывных систем.
Аналог критерия Найквиста.
Обобщение критерия Найквиста на импульсные системы производится также, как и
для критерия Михайлова. Но при этом рассматривается не кривая Михайлова D*(jω*), а
характеристический полином замкнутой системы 1+W*(jω*). Формулировка критерия
Найквиста для импульсной системы аналогична формулировке этого критерия для непре-
рывных систем: для того, чтобы замкнутая импульсная система была устойчива необхо-
димо и достаточно, чтобы АФЧХ разомкнутой системы W*(jω*) при изменении ω* от 0 до
+π не охватывала точку (–1,j0). В случае использования w-преобразования формулировка
рассматриваемого критерия отличается от приведенного выше тем, что при ω*=jλ псевдо-
частота λ изменяется от 0 до ∞.
Пример 2.14 Пусть дана система автоматического управления структурная схема
которой представлена на рис 2.37. Требуется
проверить устойчивость системы.
Передаточные функции звеньев заданы
и имеют вид:
1. Объекта управления:
k1
W1 ( р ) = .
T1 p + 1
2. Исполнительного механизма:
k2
W2 ( р ) = .
T2 p
3. Импульсного пропорционального регулятора, реализующего АИМ:
Wu ( р) = ku ,
где kи – коэффициент передачи импульсного элемента.
Решение. Запишем передаточную функцию непрерывной части системы
k
W ( p ) = W1 ( p )W2 ( p)Wu ( p) = ; где k = k1k2 ku .
T2 p (T1 p + 1)
Т T
Введя безразмерные величины: β 1 = ; β 2 = ; q = pT , где Т – период кванто-
Т1 T2
вания импульсного элемента, получим:
375
kβ1 β 2 B(q)
W (q) = = .
q(q + β1 ) A(q )
Найдем корни характеристического уравнения разомкнутой системы, решив урав-
нение q(q+β1)=0, откуда q1=0, q2= –β1.
Функцию веса w(t ) = L−1{W (q)} найдем воспользовавшись теоремой разложения:
N =2
B ( q K ) qK t
w(t ) = ∑ e = k β 2 (1 − e − β1t ) .
K =1 Aq′ (qK )
Для оценки качества работы импульсных систем используются как прямые методы,
заключающиеся в непосредственном построении кривой переходного процесса, так и кос-
венные. В первом случае по кривой переходного процесса определяются его параметры. В
частности, в случае колебательного процесса
(рис.2.39) определяются: время регулирова-
ния tp (при заданной зоне нечувствительности
376
± δ ), величина максимального перерегулирования σmax, период колебаний Tk .
Для апериодических процессов основным параметром, характеризующим переход-
ный процесс в системе, является время регулирования tp.
Пример 2.2 Пусть непрерывная часть системы (рис.2.40) представляет собой интегри-
рующее звено. Тогда как было показано ранее (пример 2.11), дискретная передаточная
функция импульсного фильтра (ИФ) будет:
kz
W * ( z) = ,
z −1
где k=kнkи, kн, kи – коэффициенты передачи непре-
рывной части системы и импульсного элемента
соответственно. Требуется найти время регулиро-
вания tp.
Решение. При подаче на вход импульсного фильтра единичной ступенчатой функ-
z
ции y* (n) =1(n), z-преобразование которой имеет вид Y * ( z ) = , можно записать:
z −1
kz 2
Y ( z ) = W * ( z )Y * ( z ) = .
( z − 1) 2
Найдем оригинал y(n), разложив Y(z) в степенной ряд путем деления числителя kz 2
на знаменатель ( z − 1) 2 . Окончательно получим:
[
Y ( z ) = k 1 + 2 z −1 + 3 z −2 + K + ( n + 1) z − n + K . ] (0.68)
Y ( z) = α
k
⋅
(1 − e −α )
⋅
Z
⋅z. (0.69)
e (1 − e ) ( z − e ) ( z − 1)
−α −α
377
⎧⎪ (1 − e −α ) z ⎫⎪
−1 −α n
Z ⎨ ⎬ = 1− e .
⎩⎪ (
z − e ) ( z − 1) ⎪
−α
⎭
k
Тогда учтя, что выражение = 1 ( в чем можно убедиться, подставив в не-
e (1 − e −α )
α
[
Z −1 {Y ( z )} = y (n) = 1 − e −α ( n +1) ] (0.70)
Выражение (0.70) соответствует экспонен-
циальному переходному процессу (рис.2.41), по-
строив который, можно определить время регули-
рования tp при заданной зоне нечувствительности
δ.
* * *
При использовании косвенных методов оценки качества процесса управления,
можно, как и в случае непрерывных систем, ввести понятия запасов устойчивости и сте-
пени колебательности, определяемых на основании анализа расположения частотной ха-
рактеристики разомкнутой системы относительно точки (-1, j0). Можно также пользовать-
ся аналогами интегральных оценок:
∞ ∞
J 1 = ∑ [ y (∞) − y (n)]; J 2 = ∑ [ y (∞ ) − y ( n) ] .
2
(0.71)
n =0 n =0
378
РАЗДЕЛ III
Нелинейные автоматические системы управления
379
а). При однозначной зависимости такие характеристики могут быть представлены сле-
дующим рядом:
∞
y ( x) = ∑ C 2i x 2i ,
i =0
380
значений y несколько (в зависимости от предшествовавшего режима), то характеристика
относится к классу многозначных. При этом число возможных значений y может лежать в
пределах от двух до бесконечности. Примерами однозначных характеристик могут яв-
ляться характеристики, приведенные на рис.3.1. Примеры многозначных звеньев будут
приведены ниже.
Рассмотрим наиболее распростаненные нелинейные звенья, характеристики кото-
рых при некоторых допущениях симметричны относительно начала координат и могут
быть достаточно хорошо представлены кусочно-линейными кривыми. Иногда эти звенья
называют типовыми.
1.Звенья с однозначными непрерывными характеристиками. К ним относятся:
Звено с зоной нечувствительности η . Характеристика такого звена приведена на
рис.3.4, а. Такими характеристиками обладают некоторые электронные, магнитные, гид-
равлические усилители в области сла-
бых входных сигналов |x|<η. Простей-
шей механической моделью зоны не-
чувствительности звена является систе-
ма соединения двух валов с пружинным
возвратом ведомого вала в нейтральное
положение при наличии участка сво-
бодного хода (люфта) в системе передачи (рис.3.4, б)
Формализованную запись характеристики, изображенной на рис.3.4, можно представить
следующим образом.
⎧0 ∀ x ≤ η;
⎪⎪
y = ⎨k ( x − η ) ∀ x > η; (3.3)
⎪k ( x + η )
⎪⎩ ∀ x < −η ;
381
⎧kx ∀ x ≤ xo
y=⎨ . (3.4)
⎩c sign x ∀ x > x
o
⎧ +1 ∀ x ≥ 0
Здесь sign x = ⎨ .
⎩ −1 ∀ x < 0
Звено с ограничением и зоной нечувствительности. Многие нелинейные элементы,
используемые в АСУ, обладают как зоной нечувствительности, так и ограничением вы-
ходного сигнала (рис. 3.6.) и описываются следующим уравнением
⎧0 ∀ x ≤η
⎪
⎪k ( x − η ) ∀ xo > x > η
y=⎨ . (3.5)
⎪k ( x + η ) ∀ − x o > x > −η
⎪c sign x
⎩ ∀ x > xo
⎧c signx ∀ x > η
y=⎨ . (3.6)
⎩0 ∀ x <η
382
может служить характеристика, приведенная на рис.3.8, формализованное выражение ко-
торой может быть записано в виде
y = E ( x − 0.5 sign x) ,
383
мальным или минимальным отклонением у, предшествовавшим рассматриваемому мо-
менту времени.
Характеристиками типа люфт обладают помимо механических систем с зазорами,
механические системы с сухим трением, модель которых представлена на рис.3.10,в .
Здесь вращающий момент x=М уравновешивается моментом пружины MП. При достиже-
нии момента MП величины равной моменту трения МТ (МП=МТ=η), начинается движение
выходного вала у. При изменении направления вращения х движения выходного вала у
начинается после изменения момента пружины на величину 2η. Описанному режиму ра-
боты механической системы с сухим трением соответствует характеристика приведенная
на рис.3.10,б.
Рассмотренные типовые звенья безусловно не исчерпывают разнообразие звеньев
нелинейных систем. Среди звеньев как линейных, так и нелинейных систем особое место
занимает множительное звено. Если на его входы подаются независимые сигналы, то на-
личие такого звена не нарушает линейности системы, так как при этом выполняется прин-
цип суперпозиции. Структурная схема перемножения независимых сигналов у=хх1 пока-
зана на рис.3.11,а. Если сигналы х
и х1 зависимы, то даже при ли-
нейности всех остальных звеньев
система становится нелинейной.
Пример получения нелинейного
звена с четно-симметричной параболической характеристикой у=кх2 показан на
рис.3.11,б, в. Такие характеристики встречаются при исследовании экстремальных систем
управления (гл.11).
С помощью множительного
звена и простых нелинейных звеньев
(типа двухпозиционного релейного)
может быть получено нелинейное
звено, обладающее нечетко-
симметричной параболической ха-
рактеристикой. Структурная схема
такого звена и его характеристика представлены на рис.3.12,а,б. Подобные звенья при-
меняются при реализации систем оптимальных по быстродействию (гл.10) .
Таким образом, применение множительного звена или других функциональных преобразо-
вателей в принципе позволяет получить нелинейные звенья с заданными статическими характери-
стиками.
384
7.2. СОЕДИНЕНИЕ НЕЛИНЕЙНЫХ ЗВЕНЬЕВ.
В нелинейных системах преобразование сигнала описывается в общем случае
дифференциальными или интегральными нелинейными уравнениями и может быть выра-
жено некоторым достаточно сложным оператором преобразования Λ
y (t ) = Λ{x(t )}. (3.9)
В некоторых случаях преобразование сигнала нелинейным звеном может быть
представлено в виде последовательного воздействия линейного динамического оператора,
например, в виде передаточной функции W(р), и нелинейного оператора ψ , описывающе-
го статическое преобразование сигнала нелинейным звеном. В зависимости от последова-
тельности действия линейного и нелинейного а) x(t) x1(t) y1(t)
W(p) ψ(x1)
операторов имеет место различное преобразова-
ние сигналов. Эквивалентные схемы, соответст- [
y1 (t ) = Λ1 {x(t )} = ψ L−1{W ( p) ⋅ L[x(t )]} ]
вующие двум видам преобразования входного б) x(t) x2(t) y2(t)
ψ(x1) W(p)
сигнала х(t), представлены на рис.3.13,а,б.
y 2 (t ) = Λ 2 {x(t )} = L−1 {W ( p ) ⋅ L[ψ [x(t )]]}
В общем случае y1 (t ) ≠ y 2 (t ) , принцип
Рис.3.13
коммутативности (перестановки) не выдержива-
ется и, следовательно, при последовательном соединении нелинейного статического и ли-
нейного динамического звеньев их перестановка недопустима. Исключение составляет
звено с запаздыванием: W ( p) = e − pτ , перенос которого через нелинейное статическое звено
ψ(х) не изменяет свойств нелинейной системы.
При рассмотрении статики нелинейных систем, сигналы х и у не зависят от време-
ни, а линейное звено может рассматриваться как усилительное с коэффициентом усиления
W (0) = k y и объединяться с нелинейным статическим звеном.
385
где ψ i - оператор преобразования i-го
нелинейного звена.
Решая совместно n нелинейных
уравнений вида (3.10), получим для по-
следовательного соединения n звеньев следующую нелинейную функцию, выражающую
характеристику y(x):
y ( x) = ψ 1n ( x) = ψ n {ψ n −1 ... [ψ 1 ( x) ]} .
(3.11)
Определение общей характеристики y(x) может быть сведено к нахождению n-1 раз
эквивалентных характеристик двух последовательно соединенных звеньев и определению
y2(x1), y3(x1), и т.д. до yn(x1)= y(x).
Путем построения эквивалентных характеристик для конкретных случаев можно
убедиться в том, что при изменении последовательности соединений звеньев результи-
рующая характеристика в большинстве случаев изменяется, т.е. в нелинейных системах
принцип коммутативности не выполняется.
Пример3.1. Найдем характеристику последовательно соединенных звеньев, одно
из которых имеет зону нечувствительности y1= ψ1(x1), а другое – ограничение y2=ψ2(x2)
при различной последовательности их соединений (рис.3.15, а,б). Характеристики ψ1(x1) и
ψ2(x2) заданы графически (рис.3.15,в).
386
показано на рис. 3.15,в. При построении используются четыре квадранта: в первых двух
приведены исходные зависимости ψ 1 ( x1 ) и ψ 2 ( x2 ) ; в третьем квадранте приведена вспомо-
гательная прямая (ВП), с помощью которой удобно осуществлять переход от оси y2 во
втором квадранте к такой же оси в четвертом квадранте. В последнем и построена иско-
мая зависимость y2(x1). Аналогичные построения (рис. 3.15,г) выполнены для варианта со-
единения звеньев, приведенного на рис. 3.15, б.
Из приведенных построений видно, что в обоих случаях получили эквивалентное
звено с зоной нечувствительности и ограничением. Однако значения выходной величины
соответствующие ограничению выходной величины yэ и зоне нечувствительности на вхо-
де xэ оказываются различными. В первом случае они совпадают со значениями для исход-
ных нелинейностей: y э = с ; xэ = η , а во втором – существенно отличаются: y э = с − η ;
387
Пример 3.2. Найдем характеристику параллельного соединения двух нелинейных
звеньев с зоной нечувствительности (рис.3.16,а), характеристики которых y1 = ψ 1 ( x) и
y 2 = ψ 2 ( x) приведены на
рис.3.16,б. Здесь η1<η2 и k1<k2.
Решение. На рис.3.16,в по-
строена результирующая характе-
ристика для случая, когда сигналы
y1 и y2 положительны. Уравнение
этой кусочно-линейной характери-
стики (отрезки прямых 1,2,3) мож-
но записать в виде:
⎧0 ∀ 0 ≤ x ≤ η1 ;
⎪⎪
y = ⎨k1 ( x − η1 ) ∀ η1 < x ≤ η 2 ; , (3.13)
⎪kx + d
⎪⎩ ∀ x > η2 ;
где k = k1 + k 2 ; d = −(k1η1 + k 2η 2 ) .
На рис.3.16,г приведена результирующая характеристика для случая, когда сигналы
y1 и y2 имеют разные знаки: y1>0 ; y2 < 0. Уравнение результирующей характеристики
(отрезки прямых 1,2,3) запишется в виде аналогичном (3.13), но при этом величина k=(k1-
k2)<0, а постоянная d=(k2η2-k1η1)>0. Заметим, что при k1=k2 величина k=0 и при x>η2 име-
ем y=d=const, т.е. характеристика соответствует звену с зоной нечувствительности и
ограничением.
3. Параллельно-встречное соединение нелинейных звеньев.
Структурная схема для этого случая представлена на рис. 3.17. Здесь звено с харак-
теристикой ψ1(x1) включено в прямую цепь, а звено ψ2(x2) в
цепь обратной связи, которая может быть отрицательной или
положительной. Соответственные уравнения замкнутой цепи
имеют вид
x1 = x ± y 2 ; y = y1 = x2 . (3.14)
Для построения результирующей характеристики y(x) параллельно-встречного со-
единения звеньев, необходимо уравнение (3.14) рассматривать совместно с характеристи-
ками ψ1(x1) и ψ2(x2).
Пример 3.3 Построим характеристику звена c зоной нечувствительности и ограни-
чением y1=ψ1(x1), охваченного отрицательной или положительной жесткой обратной свя-
388
зью: y2 = ψ 2 ( x2 ) = k2 x2 , где k2 – коэффициент передачи. Структурная схема соединения
аналогична представленной на рис.3.17.
Решение. Результирующая характеристика, построенная графическим путем для
случая отрицательной обратной связи, приведена на рис.3.18, а. Заданные характеристики
звеньев, включенных в прямую и обратную цепи показаны на рисунке пунктирными ли-
ниями.
Для получения зависимости y(x) необходимо в соответствии с (3.14) алгебраически
сложить абсциссы зависимостей ψ 1 ( x1 ) и ψ 2−1 ( y2 ) = x2 = y2 / k2 , где ψ 2−1 - обратный опера-
тор преобразования второго звена. При отрицательной обратной связи построение ре-
зультирующей характеристики y(x) выполнено путем суммирования соответствующих
абсцисс. В случае положительной обратной связи при таких же характеристиках звеньев
для получения зависимости y(x) абсцисса звена ψ 1 ( x1 ) вычитается из абсциссы звена
389
пам и может быть применена для преобразования нелинейных систем. Соответствующие
правила преобразования могут быть сформулированы следующим образом:
1. При переносе узла со входа на выход нелинейного звена необходимо в отходящих от
узла ветвях добавить звено с оператором этого нелинейного звена (рис. 3.19, а).
2. При переносе узла с выхода на вход нелинейного звена необходимо в отходящих от
узла ветвях добавить звено с обратным оператором этого нелинейного звена (рис.
3.19, б).
На основе понятия обратных операторов можно показать, что схема с прямой ψ1
и обратной ψ2 связями (рис. 3.19,в) эквивалентна схеме, построенной из звеньев с об-
ратными операторами ψ1-1, ψ2-1, если звено ψ1-1 включено вместо звена ψ2, а звено ψ2-1
вместо звена ψ1.
а)
y=ψ(x) x y
x
y
y
x y
б)
y=ψ(x)
x
x x=ψ-1(y)
в)x x y1 y
x1 y1= ψ1(x1) ψ2-1(y1)
ψ1(x1) -
- x1
y1=ψ2(y)
x2= y
x2= y ψ1-1(y)
ψ2(y)
Рис. 3.19
получим:
[ ]
y = ψ 2−1 x − ψ 1−1 ( y ) . (3.15)
390
Выражение (3.15) соответствует эквивалентной структурной схеме, приведенной на
рис. 3.19,в.
Таким образом, введение обратных операторов дает возможность сформулировать еще
одно правило преобразования, справедливое как для линейных, так и для нелинейных структур-
ных схем.
3. В системе с отрицательной обратной связью можно менять местами звенья, включен-
ные в цепи прямой и обратной связи, с заменой операторов звеньев на обратные.
Пример 3.4. Для системы, состоящей из прямо-
го и усилительного звена с коэффициентом передачи kу,
охваченного гибкой обратной связью в виде последова-
тельно включенных дифференцирующего звена
Wд ( р) = k д p с и нелинейного звена y1 = ψ ( y 2 ) (рис.
⎧αy1 ∀ y1 ≤ y10
⎪
y 2 = ψ ( y1 ) = ⎨αy10 + β ( y1 − y10 ) ∀ y1 > y10
−1
⎪− αy + β ( y − y ) ∀ y > − y ,
⎩ 10 10 1 10
⎧ y2 / α ∀ y2 ≤ α y10
⎪
y1 = ψ ( y 2 ) = ⎨ y10 + ( y 2 − αy10 ) / β ∀ y2 > α y10
⎪− y + ( y − αy ) / β ∀ y > −α y .
⎩ 10 2 10 2 10
391
8. ТОЧНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ ДИНАМИЧЕСКИХ СВОЙСТВ
НЕЛИНЕЙНЫХ СИСТЕМ
392
Уравнение, описывающее движение замкнутой системы в различных зонах нели-
нейной характеристики (I, II, III), имеет вид:
Ty''+y'=ku.
(0.72)
Тогда для первой зоны (u = 0) это уравнение запишется в виде:
Ty''+y'=0, при –η≤y≤η ,
(0.73)
для второй зоны (u = u0), с учетом отрицательной обратной связи, в виде:
Ty''+y'=-ku0, при y>η ,
(0.74)
для третьей зоны (u = −u0) :
Ty''+y'=ku0, при y<-η.
(0.75)
Решение дифференциального уравнения, соответствующего той или иной зоне, по-
зволит отслеживать изменение выходной переменной у(t) в этой зоне. Как только величи-
на у попадает в другую зону, фиксируется значе-
ние переменных у и у', которые являются конеч-
ными для исследуемой зоны и начальными для
новой зоны, описываемой своим дифференци-
альным уравнением. Решение этого ДУ характе-
ризует движение системы в новой зоне и т.д. до
достижения устойчивого состояния (равновесия
или периодического колебания).
Предположим, что при t=t0 система нахо-
дится в точке «a» и при этом у=уа ; уа'=0
(рис.3.22). Это состояние системы соответствует II-й зоне, следовательно, система описы-
вается уравнением (0.74). Интегрируя это ДУ, получим:
Ty'+y=-ku0t+С1 .
(0.76)
Решение неоднородного дифференциального уравнения (0.76) имеет вид :
y = C 2 e p1t − ku 0 t + C1 ,
(0.77)
где p1 = −1 / T корень характеристического уравнения Тр+1=0; С1, С2-постояные интегри-
рования, которые определяются из начальных условий.
393
При t = t0 =0 имеем:
y = ya = C2 + C1 ⎫
⎬.
y′ = ya′ = p1C2 − ku0 = 0 ⎭
(0.78)
Решение системы (0.78) и дает искомые C1 и C2 . Подставив числовые значения С1
и С2 в (0.77), можно построить переходной процесс y(t) в зоне II (рис.3.22). Попав в точку
«б», находим уб=η и уб'. Эти значения являются конечными значениями для второй зоны и
начальными для первой. Последовательно интегрируя уравнение (0.73) для первой зоны
получим
у=С4 e p1t ерt+С3 .
(0.79)
Подставив в уравнения (0.79) значения уб и у'б при t1=0, найдем постоянные интег-
рирования С3, С4 и строим кривую переходного процесса в зоне I, вплоть до достижения
точки «в» (рис.3.22). В этой точке также фиксируются значения ув и ув', которые являются
начальными для третьей зо,ны описываемой уравнением (0.75). Решение этого уравнения,
найденное аналогично решению уравнения (0.74), позволяет построить кривую переход-
ного процесса для III зоны. Расчеты продолжаются до тех пор, пока зависимость y(t) не
будет удовлетворять условию:
где Сiп – значение i-той постоянной интегрирования в n-ом интервале времени (для приве-
денного примера i=7, n=4). Заметим, что рассмотренный метод исследования динамиче-
ского режима нелинейных АСУ достаточно громоздок и требует большого объема вычис-
лений. Однако применение компьютерных технологий позволяет решить эту проблему.
Этот метод может быть использован для исследования динамических режимов как
линейных, так и нелинейных систем.
Известно, что состояние системы, описываемой дифференциальным уравнением n-
ного порядка, полностью определяется значениями в каждый момент времени управляе-
мой величины у и n-1 ее производных.∗) Это дает возможность представить в некотором n-
мерном пространстве состояние системы отдельной точкой, называемой изображающей
∗)
Напомним, что эти величины являются переменными состояния, рассмотренными в п.1.2.
394
точкой. Процесс изменения состояния системы представляется в этом случае как движе-
ние изображающей точки по некоторой траектории, называемой фазовой траекторией.
Начальные условия системы определяют начальное положение изображающей
точки в n-мерном пространстве, которое называется фазовым пространством или про-
странством состояний. Совокупность фазовых траекторий, найденных для всевозмож-
ных начальных условий, составляет фазовый портрет системы.
В том случае, когда систему можно описывать уравнением второго порядка, фазо-
вое пространство превращается в фазовую плоскость с координатами у и у' , на которой
можно наглядно изобразить фазовые траектории y′ = f ( y ) и проанализировать поведение
системы.
395
1. Коэффициент демпфирования ξ = 0 . Тогда корни характеристического уравне-
ния (0.81) будут мнимыми, p1,2=±jω, ω=1/T и решение однородного уравнения (0.80) бу-
дет:
⎧ y = A sin(ωt + ϕ )
⎨
⎩ y′ = z = Aω cos(ωt + ϕ ),
(0.83)
где А и ϕ постоянные интегрирования, определяемые из начальных условий.
Система (0.83) представляют собой уравнения фазовой траектории в параметриче-
ской форме, где параметром является переменная t. Для получения уравнения фазовой
траектории в явном виде необходимо исключить параметр t. Возведя уравнения (0.83) в
квадрат, а затем просуммировав их, окончательно получим:
y2 z2
+ =1.
A 2 A 2ω 2
(0.84)
Уравнение (0.84) является уравнением фазовой траектории в явном виде и пред-
ставляет собой семейство эллипсов, величина полуосей которых равна А и Аω, т. е. опре-
деляется начальными условиями (рис.3.23,а).
В рассматриваемом случае производная dz/dy для всех точек фазовой плоскости
имеет вполне определенное значение, которое вычисляется в соответствии с уравнением
(0.82) при ξ=0:
dz y
=− 2 .
dy T z
(0.85)
В точке у=0, z=0 производная dz/dy представляет собой неопределенность. Эта
точка называется цен-
тром, который охватыва-
ется замкнутыми фазо-
выми траекториями. Эти
траектории позволяют
построить зависимость
y(t) и оценить характер
свободной составляющей переходного процесса (рис.3.23,б).
Отметим следующие свойства фазовых траекторий: а) направление движения изо-
бражающей точки по фазовой траектории должно соответствовать знаку скорости изме-
нения управляемой величины у. При dy/dt>0 движение изображающей точки всегда будет
396
происходить в сторону увеличения y, т.е. слева направо а при dy/dt<0 - справа налево; б)
касательные к фазовым траекториям в точке с ординатой z=0 пересекает ось абсцисс под
π
прямым углом, т. к. из уравнения (0.85) имеем: dz/dy|z=0= ∞ , следовательно tgψ=∞, ψ =
2
(рис.3.23,а).
2. Корни характе-
ристического уравнения
(0.81) комплексные со-
пряженные с отрица-
тельной вещественной
частью (0<ξ<1) имеем:
ξ j 1−ξ 2
p1, 2 =− ± = −α ± jω
T T
ξ1− ξ 2
; α= ; ω= .
T T
В этом случае решение однородного уравнения (0.80) имеет вид:
⎧ y = Ae −αt sin(ωt + ϕ )
⎪
⎨ dy
⎪ y′ = z =
⎩ dt
(0.86)
Уравнения (0.86) являются уравнениями искомой фазовой траектории в параметри-
ческом виде. Можно показать, что уравнение фазовой траектории в явном виде представ-
ляет собой логарифмическую спираль, наматывающуюся на начало координат. Изменяя
начальные условия, можем получить семейство фазовых траекторий (рис.3.24,а) и по-
строить переходный процесс (рис.3.24,б). Особая точка, лежащая в начале координат
dz/dy, в которую сходятся все фазовые траектории, носит название устойчивого фокуса
(точка равновесия).
3. То же, что и вариант 2, но вещественная часть корней положительна (–1<ξ<0):
p1,2=+α ± jω.
В этом случае уравнения фазовой траектории в параметрической форме имеют вид:
⎧ y = Aeαt sin(ωt + ϕ )
⎪
⎨ dy
⎪ y′ = z =
⎩ dt
(0.87)
397
Фазовые траектории, построенные по уравнениям (0.87) для различных начальных
условий, представляют со-
бой выходящие из начала
координат разматываю-
щиеся логарифмические
спирали (рис.3.25,а). Соот-
ветствующий расходящий-
ся переходный процесс
представлен на рис.3.25,б.
Особая точка, лежащая в
начале координат называ-
ется неустойчивым фокусом.
4. Корни характеристического уравнения (0.81) вещественные отрицательные,
ξ ξ 2 −1 ξ 2 −1
(ξ>1): p1,2 = − ± = −α ± β < 0 ; β = .
T T T
В этом случае решение однородного уравнения (0.80) имеет вид:
⎪⎧ y = C1e 1 + C 2 e 2
pt p t
⎨ .
⎪⎩ y ′ = C1 p1e p1t + C 2 p 2 e p2t
(0.88)
Как и в предыдущих случаях, уравнения
(0.88) являются уравнениями фазовой траектории в
параметрическом виде. Можно показать, что поми-
мо уравнений (0.88) решениями уравнения (0.82)
является уравнения z = p1 y , z = p2 y . Тогда фазо-
вый портрет имеет вид, представленный на рис.3.25.
Анализ фазового портрета показывает, что все фа-
зовые траектории стягиваются к началу координат,
что соответствует сходящемуся монотонному переходному процессу. В отличие от точек
центра и фокуса в данном случае производные dz/dy в точке равновесия имеют вполне оп-
ределенное значение, равное p1 = −(α + β ) . Эта точка носит название устойчивого узла.
5. То же, что и вариант 4, но при ξ<–1. Тогда получим p1, 2 = (α − β ) > 0 и решение
398
⎧⎪ y = C1e p1t + C 2 e p2t
⎨
⎪⎩ y ′ = C1 p1e p1t + C 2 p2 e p2t
(0.89)
Фазовые траектории в данном случае выходят из начала координат (рис.3.26), что
соответствует расходящемуся монотонному переходному процессу. Точка в начале коор-
динат соответствует точке неустойчивого равновесия и называется неустойчивым узлом.
Общие выводы
Фазовый портрет дает возможность произвести
анализ поведения системы, получив следующие данные:
1) тип переходного процесса – колебательный (случаи 2,
3), монотонный (случаи 3, 4);
2) в случае колебательного процесса - величину и
количество перерегулирований;
3) сведения об устойчивости системы: при фазо-
вых траекториях сходящихся в начало координат система
устойчива, при расходя-
щихся – неустойчива.
Для получения более
полных сведений о дина-
мических режимов работы
системы может быть по-
строена кривая переходно-
го процесса y(t), например
следующим образом. Из-
вестно,
t t i +1
координаты y на величину Δyi будет Δt i = Δy i / z cpi . Зная Δti и соответствующее ему Δyi
(i=1,2, …) можно построить переходной процесс (рис.3.27,б). Чем меньше шаг Δyi, тем
точнее построение.
399
8.2.2. Анализ нелинейных систем с помощью метода фазовой плоскости
Запишем уравнение движения нелинейной системы в неявном виде: y''=F(y,y'), или,
учтя, что y'=z в виде системы уравнений первого порядка:
z'=F(y,z).
(0.90)
y'=z .
(0.91)
Здесь - F- нелинейная функция.
Поделив (0.90) на (0.91) получим:
dz/dy=F(y,z)/z=M1(y,z)/M2(y,z)
(0.92)
Уравнение (0.92) является дифференциальным уравнением фазовой траектории в
неявном виде. Если правая часть этого уравнения заданна аналитически и интеграл берет-
ся, то найдя зависимость z=f(y) получаем уравнение фазовой траектории в аналитическом
виде. Если нет, то пользуемся теми или иными приемами графического интегрирования.
Одним из таких приемов является метод изоклин, сущность которого заключается в по-
строении кривых (изоклин), представляющих собой геометрическое место точек фазового
портрета, на котором угол наклона касательных к фазовым траекториям постоянен. При-
мером изоклины может служить ось абсцисс, которую фазовые траектории пересекают
под прямым углом. Заметим, что в выражении (0.92), характеризующем наклон касатель-
ной к фазовой траектории в данной точке, присутствуют три неизвестных: y, z, zy'=dz/dy.
Тогда, задавшись определенным значением zy', например, zy'=N, получим уравнение с
двумя неизвестными, что на фазовой плоскости yОz и дает искомую изоклину. Эта изо-
клина пересекается фазовыми траекториями с постоянным углом наклона ψ равным:
ψ=arctgzy'=arctgN=const.
Задаваясь различными значениями N можно построить семейство изоклин для кон-
кретного уравнения фазовой траектории, заданного в дифференциальном виде (0.92). Ин-
тегральная кривая z=f(y) фазовой траектории для заданных начальных условий строится с
помощью отрезков прямых, направленных в соответствие с наклоном определяемым изо-
клинами.
Пример 3.5. Пусть имеем консервативную систему (ξ =0), описываемую уравнени-
ем
Т2y” +y = 0.
Требуется построить фазовый портрет системы с помощью метода изоклин.
400
Решение: Воспользовавшись (0.82), запишем уравнение фазовой траектории в
y y
N =− или z = − 2
.
2
T z Т N
Таким образом, изоклины в данном случае представляют собой семейство прямых
с угловым коэффициентом, зависящим от
принятого N=z'y. При N=0 и N=±∞ изоклины
совпадают с осями координат z и у соответст-
венно (ψz =0; ψу=π/2). Построив для разных N
семейство изоклин, можно построить фазо-
вые траектории для различных начальных ус-
ловий, которые будут представлять собой се-
мейство эллипсов вложенных друг в друга (рис.3.28).
Пример 3.6. Пусть система описывается нелинейным уравнением y''+yy'+y=0. Тре-
буется построить фазовый портрет системы.
Решение: Учтя, что y' = z перепишем уравнение системы в виде:
dz dz
+yz+y=0, откуда =-(z+1)y.
dt dt
dz dz
Произведя замену = ⋅ z , запишем уравнение фазовой траектории в диффе-
dt dy
ренциальной форме:
dz ( z + 1) y
=− .
dy z
Для построения фазовой траектории воспользуемся методом изоклин. Уравнение
изоклины найдем, положив dz/dy = N. Тогда можно записать:
( z + 1) y y Nz
N =− , откуда z = − , y=− .
z y+N z +1
Таким образом, изоклина представляет собой гиперболу со смещенными асимпто-
тами (рис.3.29). При у→ −N получим:
⎡ y ⎤
lim z = lim ⎢ − ⎥ = ±∞
y →− N y →− N
⎣ y+N⎦
и, следовательно, уравнение первой асимптоты гиперболы запишется в виде: у = −N.
⎡ zN ⎤
При z → − 1 имеем lim y = lim ⎢ − = ±∞
z →−1 z →−1
⎣ 1 + z ⎥⎦
401
И уравнение второй асимптоты будет: z = − 1.
На рис.3.29 построены изоклины для некоторых числовых значений N. Так как
dz/dy= N = const, то любая фазовая траектория пересекает изоклину в любой точке под од-
ним и тем же углом, ψ = arctgN . Например, любая фазовая траектория при N =1 будет пе-
y
ресекать изоклину z = − под углом 450.
y +1
Построение фазовых траек-
торий для заданных начальных
условий производится следующим
образом. Пусть начальная изобра-
жающая точка лежит на опреде-
ленной изоклине, которую фазовая
траектория пересекает под углом
ψо, а ближайшую изоклину - под
углом ψ1. Тогда отрезок фазовой
траектории между изоклинами
можно приближенно заменить
прямой выходящей из начальной
точки со средним углом наклона:
ψср = (ψо +ψ1)/2 до пересечения с
упомянутой ближайшей изокли-
ной. Точка пересечения принима-
ется за начальную и аналогично
описанному выше строится сле-
дующий отрезок прямой и т.д. По-
строение будет тем точнее, чем
большее количество изоклин нане-
сено на фазовой плоскости.
Заметим, что при начальных условиях z0>–1, переходный процесс y(t) представляет
собой незатухающие колебания, а при z<–1 – убывающую монотонную кривую:
lim y (t ) = −∞ . При z=–1 фазовая траектория сливается с асимптотой и переходной процесс
t →∞
402
8.2.3. Исследование релейных АСУ
Эти системы относятся к классу существенно нелинейных и обычно исследуются
методом фазовой плоскости. При использовании этого метода структурная схема системы
разбивается на линейную и нелинейную части, причем предполагается, что линейная
часть системы удовлетворительно описывается дифференциальным уравнением второго
порядка. Проиллюстрируем сказанное на конкретном примере.
Пусть имеем автоматическую систему стабилизации температуры в сушильном
шкафу, передаточную функцию которого можно представить в виде: Wо=kо/(Tp+1). Изме-
рение температуры производится с помощью чувствительного элемента, например, тер-
мопары с передаточной функцией: Wчэ(p)=kчэ.. Регулирование температуры достигается за
счет изменения подачи воздуха в сушильную камеру, путем изменения положения заслон-
ки, приводимой в движение исполнительным механизмом с электроприводом, передаточ-
ная функция которого имеет вид: Wим(p)=kим/p.
Структурная схема системы приведена на рис.3.30.
На схеме приняты следующие обозначения: uθ - текущее
напряжение пропорциональное температуре θ в сушильном
шкафу; u* - напряжение пропорциональное заданному зна-
чению температуры; uд – напряжение, подводимое к двига-
телю исполнительного механизма.
Запишем передаточную функцию линейной части
(ЛЧ) системы:
Wлч(р)=k/(Tp2+p), где k=kokчэkим.
Соответствующее дифференциальное уравнение в операторной форме будет;
U(p)=Wлч(р)Uд(p) или (Tp2+p)U(p)=kUд(p),
а в области вещественного переменного это уравнение примет вид:
Tu''+u'=kuд
(0.93)
Запишем уравнение нелинейной части (НЧ), представляющей собой трехпозици-
онное релейное устройство, выполняющее функцию регулятора:
⎧0, ∀ u ≤η
⎪
uд=F(u)= ⎨u0 , ∀ u >η .
⎪− u , ∀ u < −η
⎩ 0
(0.94)
При замыкании системы отрицательной нелинейной обратной связью уравнение
движения замкнутой системы можно получить, подставив (0.94) в (0.93):
403
Tu''+u'= − kF(u)
(0.95)
Знак «минус» в правой части (0.95) учитывает отрицательную обратную связь.
Воспользовавшись выражением (0.94), уравнение (0.95) можно представить в виде
трех уравнений (см. п. 8.1)
I. Tu''+u'=0, при |u|≤ η;
II. Tu''+u'+ku0=0, при u>η;
III. Tu''+u'-ku0=0, при u<-η.
Обозначив y=u, dy/dt=z, построим фазовый портрет системы в координатах z,у с
помощью метода изоклин (рис.3.31).
404
Таким образом, фазовые траектории в области I представляют собой семейство па-
раллельных прямых с углом наклона ϕ = arctg (−1/ T ) . Следовательно, вся область I пред-
ставляет собой изоклину, так как угол наклона любых фазовых траекторий здесь одина-
ков.
Для области II в соответствии с уравнением II имеем:
Tz'+z+ku0=0, откуда dz/dy=-(z+ku0)/Tz .
(0.97)
При dz/dy=N получим уравнение изоклины:
z= − ku0/(1+TN) .
(0.98)
Правая часть уравнения (0.98) постоянна и зависит от принятой величины N. Таким
образом, изоклины представляют собой семейство прямых, параллельных оси абсцисс.
Для нахождения угла наклона фазовых траекторий при пересечении их с изоклина-
ми проанализируем уравнение (0.98). Для II области имеем: 1) при N=0, ψ= аrсtgN = 0 и
уравнение изоклины z= − ku0 совпадает с уравнением фазовой траектории; 2) при N=±∞,
ψ= ±π/2 и изоклина z=0 совпадает с осью абсцисс; 3) при N>0, 0 <ψ< π/2 и фазовые
траектории пересекают изоклины z=C=cоnst (0 >C >−ku0 , при у >η) с положительным ко-
эффициентом наклона; 4) при N<0 0>ψ>−π/2 и фазовые траектории пересекают изокли-
ны z=C=cоnst (C>0 и С <−кu0 при у >η) с отрицательным коэффициентом наклона.
Аналогичным образом находится уравнение изоклины для области III:
z=ku0/(1+TN) и строятся соответствующие траектории для этой области (рис.3.31).
Для рассматриваемого случая уравнение фазовой траектории можно получить и
аналитически, решив уравнение (0.97) путем разделения переменных и последующего ин-
тегрирования. Для области II имеем:
zdz ( z + ku0 − ku0 )dz
dy = −T = −T .
z + ky0 z + ku0
После интегрирования этого уравнения получаем уравнение фазовой траектории:
ku0 dz
y = −T ∫ dz + T ∫ = T {ku0 ln z + ku0 − z} + С2 .
z + ku0
(0.99)
Аналогично, можно найти уравнение фазовой траектории для области III.
y = −T {ku0 ln z − ku0 + z} + С3 .
(0.100)
405
Постоянные интегрирования С2 и С3 определяются из начальных условий. Напом-
ним, что при переходе фазовой траектории из одной зоны в другую, конечное состояние
системы в момент переключения (y=± η) для предыдущей зоны является начальным ус-
ловием для последующей.
Найденные в явном виде уравнения фазовых траекторий(0.96), (0.99) и (0.100) дают
возможность построить фазовый портрет системы аналитическим методом.
406
В случае возникновения периодического колебательного процесса изображающая
точка на фазовой плоскости перемещается по одной и той же замкнутой кривой. Напри-
мер, при линейной системы при ξ=0 этой кривой является эллипс (рис.3.23,а). Характер
движения и фазовый портрет нелинейных систем гораздо разнообразней, чем линейных.
Здесь возможно наличие одного или даже нескольких замкнутых контуров, которые назы-
ваются предельными циклами. Как и точка равновесия линей-
z Неустойчивый
ных систем (фокусы, узлы), предельные циклы могут быть ус- предельный цикл
тойчивы и неустойчивы. В первом случае фазовая траектория
навивается на предельный цикл, во втором – свивается.
Примером нелинейной системы с так называемым же- y
407
Рассмотрим случай, когда в качестве управляющего устройства системы рассмот-
ренной выше (рис.3.30), используется реле, с двухпозиционной петлевой релейной харак-
теристикой (рис.3.33).
Фазовый портрет системы строится с помощью уравнения (3.37), которое в данном
случае можно представить в виде двух уравнений для II и III зоны: II. Tu''+u'+ku0=0 и III.
Tu''+u'-ku0=0 уравнение для I зоны отсутствует, так как отсутствует
зона нечувствительности.
В соответствии с характеристикой реле (рис.3.33) его пере-
ключение производится: а) при движение
слева направо на прямой у=η; z>0; б) при
движении справа налево на прямой у= –η;
z<0. На фазовой плоскости (рис.3.34) линии
переключения нанесены пунктиром. Фазовый портрет системы
имеет расходящиеся траектории при малых начальных значени-
ях координат z, у и сходящиеся - при больших. Границей сходя-
щихся и расходящихся траекторий является замкнутый контур
(предельный цикл). Равновесное состояние системы z=y=0 неус-
тойчиво. Колебательный процесс устойчив, т.е. система работает в режиме автоколеба-
ний.
Рассмотрим случай, когда управляющим устройством является трехпозиционный
релейный элемент с петлей возврата (рис.3.35,а).
Здесь, в зависимости от соотношений параметров системы η и m, (0<m<1), пере-
ходной процесс в ней может носить либо характер затухающих колебаний, обусловлен-
ных наличием зоны нечувствительности, либо автоколебаний, обусловленных петлей воз-
врата. То значение коэффициента m, при котором возникает предельный цикл, называется
критическим (m=mk). Воспользовавшись уравнением фазовых траекторий для соответст-
вующих зон(0.96), (0.99) и (0.100) можно построить эти траектории для начальных усло-
вий у=+ η, z=0 и у = - η, z = 0 (рис.3.35,б). Абсцисса пересечения фазовых траекторий для
II-й и I зоны (или III и I) и дает искомое значение mkη.
В случае идеального двухпозиционного реле условие равновесия физически невы-
полнимо и в окрестностях точки z=y=0 возникнут
колебания с бесконечно малой амплитудой и бес-
конечно большой частотой. В реальных системах
и тот, и другой параметры колебаний конечны,
что обусловлено идеализацией дифференциаль-
408
ного уравнения движения системы. Здесь определяющую роль играют отброшенные про-
изводные более высокого порядка (третьего и выше). Поэтому анализ поведения такой
системы с помощью метода фазовой плоскости непригоден, и для ее исследования приме-
няют другие методы, в частности, метод гармонической линеаризации.
dz dz F ( y ) − z
z + z = F ( y) или = .
dy dy z
После разделения переменных и интегрирования получим:
z + F ( y) − F ( y)
y=∫ dz = –z–F(y)ln|z-F(y)|+С1 .
F ( y) − z
(0.102)
Для точки В(η,s) (рис.3.46) при t=0, имеем:
η=-s-F(y)ln|s-F(y)|+С1 .
(0.103)
Определив из (0.103) постоянную интегрирования С1 и подставив ее в (0.102), по-
лучим:
s − F ( y)
y=η+s-s+F(y)ln .
z − F ( y)
(0.104)
Уравнение (0.104) и есть уравнение фазовой траектории в явном виде. Запишем это
уравнение для точки А (-η, -v), :
409
1+ s 1+ s
−η = η + s + υ − ln , или ln =2 η +s+υ .
1−υ 1 −υ
(0.105)
Выражение (3.49) задает положение точки А в зависимости от положения точки В.
Зная s можно вычислить v. Заметим, что если s=|v|, то имеем замкнутый цикл (рис.3.36),
т.е. система находится в режиме автоколебаний. Параметры автоколебаний могут быть
вычислены путем решения уравнения (0.105). После потенцирования уравнения (3.48)
имеем:
e2η+s+υ=(1+s)/(1- v) или (1- v)eυe2 η
=(1+s)e-s
(0.106)
Обозначим правую и левую части полученного уравнения
соответственно ψ 1(s) и ψ 2(s). Эти функции называются функ-
циями точечного преобразования.
Уравнение (0.106) обычно решается графически. Если гра-
фики функции ψ 1(s) и ψ 2(s). имеют точки пересечения, т.е. есть
решение, то в системе имеют место колебания с амплитудой ymax.
Для качественного исследования функции ψ 1 и ψ 2 определим их
граничные значения для v =s=0 и v =s=1. Имеем: ψ 1(0)=e2η>1;
ψ 2(0)=1; ψ 1(1)=0; ψ 2(1)=2e-1≈ 0.73.
Отсюда вытекает, что графики кривых ψ 1(v) и ψ 2(s) обязательно пересекутся
(рис.3.37). При этом в точке пересечения кривых «о» s = v, т.е. имеем замкнутый цикл и,
следовательно, в системе существуют колебания.
Для выявления их устойчивости возьмем точку «а»
на кривой ψ 2(s). Через полуколебание имеем
z= v1<s1, т.е. колебания затухают, следовательно,
колебания – сходятся к предельному циклу. Для
точки «б» – колебания будут расходиться к этому
циклу (v2>s2). Таким образом предельный цикл ус-
тойчив и колебания системы представляют собой
автоколебания, параметры которых можно найти следующим образом.
Амплитуду автоколебаний ymax можно получить, воспользовавшись уравнением
(0.104). Например, при F(y)=1 и y=ymax , z=0 (см. рис.3.36) с учетом начальных условий в
точке В: у(0)=η; z(0)=s=zmax, окончательно получим: ymax=η+zmax+ ln|zmax-1|.
410
Период автоколебаний Та находится путем решения исходного дифференциального
уравнения движения системы (0.101) например при T=k=F(y)=1 имеем:
у''+у'+1=0, или zt'+z= –1.
После интегрирования получим: z=С2e-t-1. Учтя, что при t = 0, z= zmax определим
постоянную интегрирования С2=zmax+1. Окончательно получим:
z=(zmax+1)e-t − 1.
Так как при t=Ta/2 величина z= − zmax, можно записать:
− zmax=(zmax+1)e-Ta/2-1, или (1 − zmax)/(1+zmax)=e-Ta/2.
Логарифмируя последнее выражение окончательно получим:
1 + z max
Ta = 2 ln .
1 − z max
411
В соответствии с урав-
а) z б) z в) z нением (0.108) фазовые траек-
III II III I II III I II
тории будут замкнутыми кри-
выми, образованными отрез-
y −η η y −η η y
ками парабол, вершины кото-
рых перемещаются на оси абс-
цисс в зависимости от началь-
Рис.3.39
ных условий (рис.3.39,а).
При наличии зоны нечувствительности: F1(y1)=0, при |y1|<η величина z в этой зоне
равна z = 2C1 = const , т.е. фазовые траектории на бесконечной полосе фазовой плоско-
412
Переключение реле, как и ранее будет производиться при у1= у+k2, z = 0, и, следо-
вательно, уравнение линии переключения будет z = − y / k2 , т.е. эта линия не будет совпа-
дать с осью ординат. Уравнение фазовой траектории при этом остается прежним (0.108),
но вследствие упреждающего переключения
процесс будет затухающим. Например, при
движении системы из точки 1 (рис.3.40) пе-
реключение происходит в точке 2, т.е. при
скорости изменения координаты y меньшей,
чем при переключении, происходящем при у
= 0, и эта скорость продолжает уменьшаться.
При попадании изображающей точки на от-
резок линии переключения АВ фазовые тра-
ектории будут подходить к ней с обеих сто-
рон (точка 3) и, следовательно, изображаю-
щая точка не может уйти с этой линии. Но она не может и остаться на ней, т.к., например,
для точки 3, z<0, и, следовательно, изображающая точка будет двигаться влево, но уже не
по фазовой траектории, а по линии переключения. Этот режим работы получил название
скользящего. Так как переключение реле не могут производиться мгновенно, скользящий
режим реализуется не в виде плавного скольжения по линии переключения, а в виде виб-
раций малой амплитуды и большой частоты вокруг линии переключения.
Учтя z = y′ , перепишем уравнение линии переключения в виде: k2y'+y=0. Решение
этого уравнения y = C2 e − p1t при p1=-1/k2, характеризует процесс движения по линии пере-
ключения, определяемый только коэффициентом передачи корректирующего звена k2.
Подчеркнем, что в рассматриваемом случае линия переключения не являются фа-
зовой траекторией. Если же на входе релейного элемента сформировать сигнал так, чтобы
линия переключения совпадала с фазовой траекторией аОб, движение по которой проис-
ходит в направлении точки равновесия О, то скользящий режим исключается. Можно по-
казать, что при этом время переходного процесса минимизируется. (см. главу 10).
413
9. ПРИБЛИЖЕННЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ ДИНАМИЧЕСКИХ СВОЙСТВ
НЕЛИНЕЙНЫХ СИСТЕМ
414
(рис.3.42), то при подаче на его вход гармонического сигнала на выходе получаем прямо-
угольные импульсы той же частоты но со сдвигом на время τ, величина которого зависит
от ширины петли η .
Разложим выходную переменную нелинейного элемента, x(t), являющуюся перио-
дической функцией времени в ряд Фурье.
n
x(t ) = ∑ ( Ak sin kωt + Bk cos kωt ) ,
k =0
(0.111)
где ω – частота первой гармоники
Коэффициенты гармонического ряда (0.111) определяются по формулам:
2π 2π 2π
1 1 1
B0 =
2π ∫
0
x(ω t )dω t ; Ak =
π ∫
0
x(ω t ) sin kω dω t ; Bk =
π ∫ x(ωt ) cos kω tdω t .
0
415
Преобразуем (0.112) по Лапласу, получим:
⎡ q (a ) ⎤
X ( p ) = ⎢q (a ) + 1 ⋅ p ⎥Y ( p).
⎣ ω ⎦
(0.113)
Заметим, что выражение в квадратных скобках уравнения (0.113) можно трактовать
как передаточную функцию нелинейного гармонически линеаризованного звена. Тогда
можно записать:
⎡ q (a) ⎤
Wн ( p, a,ω ) = ⎢q (a) + 1 p⎥ .
⎣ ω ⎦
(0.114)
При замыкании системы отрицательной обратной связью в соответствии с уравне-
ниями(0.109), (0.113) и (0.114) получим:
Y(p)=Wл(p)X(p)= Wл(p)Wн(p,a,ω)Y(p),
С учетом того, что Wл(p)=В(р)/А(р), уравнение движения замкнутой системы (при
отсутствии внешних воздействий) примет вид:
[A(p)+B(p)Wн(p,a,ω)]Y(p)=0 .
(0.115)
Воспользовавшись выражениями (0.114), (0.115), можно записать характеристиче-
ское уравнение системы:
⎡ q (a) ⎤
D(p) = A(p) + B(p)⎢q(a) + 1 p ⎥ = 0 .
⎣ ω ⎦
(0.116)
416
проходит через начало координат (кривая 1, рис.3.43). В частности для системы, движение
которой описывается выражением (0.115), уравнение кривой Михайлова имеет вид:
⎡ q (a) ⎤
D( jω) = A(jω) + B(jω) ⎢q(a) + 1 jω⎥ .
⎣ Ω ⎦
(0.117)
где: ω- текущее значение частоты; Ω - искомая частота колебаний замкнутой системы.
Представим выражение (0.117) как сумму вещественной и мнимой частей:
D(jω) = P(ω,a, Ω ) + jQ(ω,a, Ω) .
(0.118)
Из (0.118) следует что для того чтобы характеристическое
уравнение системы имело чисто мнимые корни, т.е. кривая Михай-
лова D(jω) проходила на комплексной плоскости через начало ко-
ординат, должны одновременно выполняться следующие условия.
P(ω , a, Ω) = 0; Q(ω , a, Ω) = 0.
Учитывая, что текущее значение частоты в начале координат
ω совпадает с частотой колебаний системы Ω и обозначив обозначив амплитуду колеба-
ний a = A , условия (0.119) можно записать в виде:
P( A, Ω) = 0; Q( A, Ω) = 0.
(0.120)
Соотношения (0.120) дает возможность установить факт отсутствия или наличия
колебаний и в последнем случае найти числовые значения искомых величин A и Ω . Если
система уравнений (0.120) имеет решение в положительных вещественных числах, то в
физической системе существует периодическое движение. Если такое решение отсутст-
вует, то периодическое движение не возникает.
Для исследования устойчивости колебательного процесса, т.е. для установления
факта возникновения автоколебаний, поступают следующим образом: увеличивают ам-
плитуду А на величину Δа. Тогда кривая Михайлова вследствие изменения параметров
уравнения (0.117) отклонится от начала координат в ту или иную сторону. Если она от-
клонится в положение 2 (рис.3.43), то попадаем в устойчивую зону и колебания будут за-
тухать, если в положение 3 – расходиться. Таким образом, в первом случае система воз-
вращается в первоначальное положение, а во втором – нет. Следовательно для возникно-
вения устойчивого периодического движения необходимо, чтобы при увеличении ампли-
туды колебаний (А+Δа) кривая Михайлова отклонялась в положение 2. Аналогичным об-
разом можно показать, что при уменьшении амплитуды колебаний (А-Δа) устойчивые ко-
417
лебания в системе возникают при смещении кривой Михайлова в положение 3. Это гео-
метрическое условие можно выразить и в аналитическом в виде:
∂P ∂Q ∂P ∂Q
⋅ | − ⋅ | >0.
∂a ∂ω A,Ω ∂ω ∂a A,Ω
Здесь в частные производные, взятые от выражений P(a,ω) и Q(a,ω) берутся в точке
a=A и ω=Ω.
Применение критерия Найквиста
Воспользовавшись соотношениями (0.109) и (0.114), запишем выражения для час-
тотных характеристик линейной и нелинейной частей системы, представленной на
рис.3.41.
B( jω) q1 (a)
Wл ( jω) = ; Wн ( jω , ja ) = q(a) + jω .
A( jω) Ω
(0.121)
Так как критерий Найквиста использует частотные функции разомкнутой системы,
то частоты внешних возмущений ω и искомая частота колебаний Ω совпадают, что позво-
ляет в выражении (0.121) их сократить. Тогда АФЧX разомкнутой системы примет вид:
B ( jω )
Wp(jω,a) = Wл(jω) Wн(a)= ⋅ [q(a) + jq1(a)].
A( jω )
В соответствии с критерием Найквиста колебательный процесс в системе возникает
в случае, если годограф вектора Wp(jω,a) пройдет через точку (-1, j0). Запишем это усло-
вие в виде:
Wл(jω) Wн(a) = − 1
(0.122)
Условие (0.122) можно переписать в виде:
1
Wл (j,ω) = −
Wн (a)
(0.123)
Уравнение (0.123), предложенное Гольдфарбом, позволяет определить искомые А и
Ω. В частности, построив отдельно частотную характеристику линейной части Wл(jω) и
обратную частотную характеристику ее нелинейной части с отрицательным знаком
(рис.3.44,а) можно найти точку их пересечения на комплексной плоскости, которая дает
искомые значения ω=Ω; a=A. Значения Ω и А определяются по отметкам ωi и aj на соот-
ветствующих кривых. Если кривые не пересекаются, то периодическое решение отсутст-
418
вует и, следовательно, колебание в системе не возникают. Заметим, что в случае, если
q1(a)=0 , характеристика − 1 / Wн(a) сливается с осью абсцисс (рис.3.44,б).
419
Для гармонической линеаризованной системы коэффициенты ее характеристиче-
ского уравнения зависят от частоты ω и амплитуды а колебаний. Тогда при прочих посто-
янных параметрах условие возникнавения колебаний в системе можно записать в виде
Δn-1(а,ω) = 0
(0.124)
Таким образом необходимо найти а и ω удовлетворяющие условию (0.124). Так как
имеем два неизвестных, то для решения задачи необходимо иметь второе уравнение, ко-
торое можно получить, представив характеристическое уравнение стстемы в виде соот-
ветствующем наличию пары чисто мнимых корней (периодический режим).
Например, пусть дано характеристическое уравнение для системы третьего поряд-
ка:
а0р3 + а1р2 + а2р + а3 = 0.
При p1, 2 = ± jω это характеристическое уравнение можно записать в виде:
420
Пусть на вход релейного элемента подается гармонический сигнал: y = a sin ωt . То-
гда, в соответствии с рис.3.46, имеем: η = a sinα1; mη = a sinα2 = a sin(π - α2). Откуда:
sin α1 = η / a ⎫
⎬
sin(π − α 2 ) = mη / a.⎭
(0.126)
Коэффициент гармонической линеаризации q(a) находится следующим образом.
2π α
А1 1 2 2
q (a ) = =
а πa ∫
0
x (ω t ) sin ω td ω t =
π a α∫1
c sin ω td ω t =
−2c 2c
= [ cos α 2 − cos α1 ] = [cos(π − α 2 ) + cos α 1 ].
πa πa
Учтя, что cosα = 1 − sin 2 α , и воспользовавшись соотношениями (0.126), полу-
чим:
2с ⎛⎜ m2η2 η 2 ⎞⎟
q(а) = 1− 2 + 1− 2 .
πа ⎜⎝ а а ⎟⎠
(0.127)
Выражение (0.127) позволяет определить коэффициент гармонической линеариза-
ции q(a) для различных релейных характеристик. Например при η = 0 релейная характе-
ристика, представленная на рис.3.46 принимает вид показанный на рис.3.47,а. При этом
коэффициент гармонической линеаризации
4с
q(a) = .
πа
При m =± 1 характеристики релей-
ных элементов представлены на
рис.3.47,б,в. Коэффициенты гармониче-
ской линеаризации q(a) для обоих случа-
ев одинаковы и равны
4с η2
q(a) = 1− 2 .
πа а
Аналогично найдем второй коэффициент гармонической линеаризации нелинейно-
сти, представленной на рис. 3.46,q1(a). Имеем:
2π α
B1 1 2 2 2c
q1 (a) = = ∫ x(tω ) cos ωt ⋅ dωt = ∫ c ⋅ cos ωt ⋅ dωt = [sin α 2 − sin α 1 ] .
a πa 0 πa α1 πa
421
2сη
q1(a) = (m − 1 ) .
πа 2
(0.128)
Воспользовавшись выражением (0.128) можно определить значение коэффициента
q1(a) для других релейных характеристик. В частности, для релейного элемента с петле-
вой двухпозиционной характеристикой (рис.3.47,в) получим
4сη
q1(а) = − .
πа 2
Для релейных элементов с характеристиками представленными на рис.3.47,а,б ко-
эффициент q1(a) = 0 . Заметим, что коэффициент q1(a) < 0 в том случае когда характери-
стика релейного элемента имеет петлю возврата, обуславливающую запаздывание в этом
элементе.
Подставив полученные q(a) и q1(a) в выражение передаточной функции соответст-
вующих релейных элементов, получим конкретное выражение этой функции.
422
Х(p) = Wн (p,ω,a) Y(p), (0.130)
⎡ q (a) ⎤
где: Wн ( p, ω , a) = ⎢ q(a) + 1 p ⎥ – передаточная функция нелинейной части (НЧ) системы.
⎣ ω ⎦
Учитывая, что в нашем случае q1(a)=0, имеем:
4с η2
Wн (а) = q(a) = 1− 2 . (0.131)
πа а
Воспользовавшись выражениями (0.129)-(0.131), запишем уравнение замкнутой
системы с отрицательной обратной связью:
[Т0p2 + p + kq(a)] Y(p) = 0.
В соответствии с алгебраическим критерием устойчивости Гурвица.
Δn-1 = Δ1 = a1 = 1 > 0; а0 = Т02 > 0.
Таким образом, в рассматриваемой системе, описываемой уравнением второго по-
рядка, колебания возникнуть не могут, что обусловлено наличием зоны нечувствительно-
сти элемента. Этот вывод совпадает с полученным в главе 8.
Учтем инерционность исполнительного механизма. Тогда передаточная функция
ИМ примет вид:
kи 1
Wим (р) = ⋅ ,
р Ти р + 1
где: Tu – электромеханическая постоянная времени серводвигателя.
При этом уравнение линейной части будет:
[T0Tиp3 + (T0 + Tи)p2 + p] Y(p) = kX(p).
Замкнув систему отрицательной обратной связью, и обозначив T0Tи=T2, T0+Tи=Т1,
запишем характеристическое уравнение замкнутой системы системы:
T2p3 + T1p2 + p + kq(a) = 0.
(0.132)
Предпоследний определитель Гурвица:
а1 а3 Т 1 kq
Δn−1 = Δ2 = = = Т 1 − Т 2 kq(a) ,
а0 а2 Т 2 1
4с η2
Т1 = Т 2 k ⋅ 1− 2 . (0.134)
π а
423
Из полученного выражения найдем амплитуду колебаний а. Обозначив
4cT2 k / π = b и возведя в квадрат обе части уравнения (0.134), получим биквадратное
уравнение:
T1a4 – b2a2 + b2η 2 = 0,
решив которое, имеем:
b 2 ± b4 − 4Т 12 b 2η 2
а =
2
. (0.135)
2Т 12
Как вытекает из (0.135), найденное решение имеет физический смысл только при
условии: b>2T1η, которое можно записать
2Т 2 kc
Т1 < . (0.136)
πη
Полученное неравенство (0.136) и есть условие возникновения колебаний с ампли-
тудой а=А.
Частота колебаний ω определяется из уравнения: an − 2ω 2 = an , или в нашем случае
при n=3 имеем: ω2 = a3 /a1, где в соответствии с (0.132): a1 = T1; a3 = kq(a). Тогда с уче-
том (0.131), получим:
а3 k 4с η2
ω2 = = ⋅ 1− 2 . (0.137)
а1 Т 1 πа а
424
ся отрицательным, что свидетельствует о наличии расходящихся колебаний; 2) если а= а1-
Δа, то величина q(a) уменьшится, следовательно, Δ2 > 0 , и колебания будут затухать. Сле-
довательно, решение А=а1, характеризует режим неустойчивых колебаний. Аналогичный
анализ показывает, что решение А=а2 (точка 2) характеризует режим устойчивых колеба-
ний, что свидетельствует о наличии в системе автоколебаний, амплитуда которых равна
а2. Подставив найденное А=а2 в (0.137) найдем частоту автоколебаний ω = Ω. Таким об-
разом, при выполнении условия (0.136) в системе имеют место автоколебания.
Выражение (0.136) позволяет находить соотношение параметров рассматриваемой
системы, при которых возникают автоколебания. Учтя, что T2=T0Tи и Т1=Т0+Ти запишем
(0.118) в виде:
2TиT0 kс πT0η
(Т и + Т 0 ) < или Т и > (0.138)
πη 2T0 kс − πη
Тогда условие отсутствия автоколебаний в системе третьего порядка (n=3) при релейном
управляющем устройстве с трехпозиционной идеальной релейной характеристикой можно
записать, поменяв знак неравенства в выражении (0.138).
425
9.2. ВИБРАЦИОННАЯ ЛИНЕАРИЗАЦИЯ НЕЛИНЕЙНОСТИ
В случае воздействия на нелинейную часть системы, работающей в режиме автоко-
лебаний с частотой ω=Ω и амплитудой а=А внешних медленно меняющихся сигналов y0(t),
под которыми понимают сигналы удовлетворяющие условию: y0 (t + Ta ) − y 0 (t ) << y 0 (t ) , в
системе возникают несимметричные автоколебания и в разложении функций х(t) в ряд
Фурье, появляется постоянная составляющая В0 , отличная от нуля (рис.3.50)*).
Так как внешний сигнал изменяется медлен-
но, то в течение одного периода автоколебаний
Ta его можно считать постоянным и равным y0 . То-
гда уравнение нелинейной части системы можно
записать в виде:
q1(а) dy а
х(t) = В0 + q(a)yа + ⋅ ,
ω dt
где: yа = y – y0 =а sinωt - периодическая состав-
ляющая входного сигнала y(t); y0 - квазипостоян-
ная составляющая этого сигнала; а, ω – амплитуда и частота автоколебаний.
Коэффициенты гармонической линеаризации q(a) и q1(a) определяются аналогично
рассмотренному выше (п. 9.1.3) Можно показать, что для нелинейного элемента с трехпо-
зиционной релейной характеристикой с петлей возврата коэффициент q1(a) не зависит от
величины y0 и определяется по формуле (0.128), а коэффициент q(a) определяется сле-
дующим выражением:
c ⎡⎢ (η + y0 ) 2 (η − y0 ) 2 (mη + y0 ) 2 (mη − y0 ) 2 ⎤
⎥
q(a) = 1− + 1 − + 1 − + 1 − .
πa ⎢ a2 a2 a2 a2 ⎥
⎣ ⎦
(0.139)
В рассматриваемом примере (рис.3.50, η = 0 ) эти коэффициенты равны:
4c y2
q(a) = 1 − 02 ; q1(a) = 0.
πa a
(0.140)
Величина постоянной составляющей на выходе релейного элемента В0 (рис.3.50)
определяется из следующего соотношения:
*)
Заметим, что в случае несимметрии нелинейной характеристики x=F(y) относительно начала координат не-
симметричные автоколебания могут возникнуть и при отсутствии внешних воздействий. Однако этот случай не пред-
ставляет практического интереса и в дальнейшем не рассматривается.
426
с ⎡1 ⎤ с
2π α α2 2π
1
В0 =
2π ∫0 x (ω t )d ω t =
2π ⎣⎢ ∫0
⎢ d α − ∫0 d α + ∫ ⎥⎥ = π [α1 − α 2 + π ] ;
d α
α2 ⎦
y0
Учтя, что y0=asinα1 (рис.3.50) получим α1 = arcsin . Аналогично:
a
y0
π − α 2 = arcsin . Тогда:
a
2с y
В0 = arcsin 0 = Ф(y0 ) ,
π а
(0.141)
Φ(y0)=x0 где Ф(y0) – так называемая функция смещения.
c
Таким образом, если рассматриваемый релейный элемент
ψ
y0 находится в режиме автоколебаний, то при подаче на его вход мед-
-c ленно меняющегося сигнала y0(t) на выходе получаем составляю-
Рис. 3.51
щую сигнала x(t) в виде x0=В0=Ф0(y0), изменяющуюся в соответст-
вии с (0.141)(рис.3.51).
Функция Ф(у0) является достаточно гладкой кривой и пред-
ставляет собой квазистатическую характеристику релейного эле-
мента по каналу у0→x0, которую можно подвергнуть обычной ли-
неаризации. В результате этого нелинейное звено можно предста-
вить в виде усилительного звена с коэффициентом усиления kн, равным:
dФ(y0 )
k н = tgψ = .
dy0 y =0
0
(0.142)
При этом уравнение движения системы относительно медленно меняющегося воз-
действия можно записать в следующем виде:
[A(p) + B(p)kн]Y0(p) = kн A(p)F(p),
где: Wл(p) = B(p) / A (p) – передаточная функция линейной части системы; F(p) = L{f(t)};
f(t) – внешнее медленно меняющееся воздействие, приложенное к замкнутой системе.
Структурная схема системы может иметь вид, показанный на рис.3.52. Здесь внешнее воз-
действие f(t) приложено со стороны задания f(t)=y*(t). Переменная на выходе линейного
звена содержит помимо медленно меняющегося сигнала y0(t) высокочастотную состав-
ляющую yа=аsinωt, которая отфильтровывается линейной частью системы. Таким образом
можно считать, что медленно меняющиеся сигналы проходят через релейный элемент с
коэффициентом передачи равным kн, в то время как для автоколебательного контура пере-
427
q1 (a)
даточная функция этого элемента равна WН (a, ω, p ) = q (a ) + p . Здесь величины, q(a)
ω
и q1(a), kн для идеального трехпозиционного релейного элемента (рис.3.50), определяется
соотношениями (0.140),(0.142).
Аналогичным образом определяется функция смещения Ф(у0) для других типов не-
линейностей. Например, для нелинейности с зоной нечувствительности (рис.3.53,а) функ-
ция смещения имеет вид показанный на рис.3.35,б.
Анализ зависимостей, приведенных на
а) x x
рис.3.51 и 3.53,б показывает, что для медленно ме-
y α3 ωt
-η η α1 α2 α4
няющегося сигнала y0(t) эффект сглаживания су-
щественен. При этом значительно повышается
y0
точность работы системы. Можно показать, что
α1 y б) Ф(y0)
α3 α2 аналогичный эффект имеет место и при других ти-
α
α4 -(η+a)
пах нелинейных характеристиках
η+a
Этот эффект называется вибрационной ли-
ωt
Рис. 3.53 неаризацией или вибрационным сглаживанием не-
линейностей при помощи возбуждения автоколебаний в системе. Поэтому функцию Ф(у0)
иногда называют сглаженной нелинейной характеристикой. Заметим, что эффект сглажи-
вания нелинейности можно получить и при вынужденных колебаниях, но при этом возни-
кает необходимость иметь специальный генератор колебаний.
Изложенное позволяет сформировать необходимое условие возникновения эффекта
вибрационного сглаживания нелинейностей:
ωa >> ω0 max ,
(0.143)
где ω a - частота автоколебаний в нелинейной систем; ω 0 max - максимальная частота внеш-
него сигнала f (t ) .
Для проверки выполнения условия (0.143), а также для оценки уровня вибраций,
возникающих с системе обязательно определяются числовые значения частоты ω a и ам-
плитуды а автоколебаний. При этом используется один из методов рассмотренных ранее.
Эффект вибрационного сглаживания нелинейностей используется при
проектировании высокоточных систем с целью исключения отрицательного влияния на
качество работы системы таких негативных факторов как наличие зоны
нечувствительности, люфта, петли и т.п.
428
В качестве иллюстрации, рассмотрим систему управления штурвалом самолета, в
которой, для уменьшения
влияния сухого трения в
приводе штурвала, приме-
нен релейный усилитель,
возбуждающий автоколе-
бания в локальной системе.
Функциональная схема
системы приведена на
рис.3.54, на котором пунк-
тиром выделена упомянутая локальная система.
Амплитуда а и частота ω автоколебаний переменной в локальной системе подбира-
ется такой, чтобы они не воспринимались корпусом самолета. Приведенная система мо-
жет рассматриваться как следящая за произвольно медленно меняющимся внешними сиг-
налами f (t ) , вызывающими отклонение самолета от заданного курса у* . В соответствии с
методикой изложенной выше, для данной системы находят значения а, ω и Ф(Δ). Далее
производят обычную линеаризацию функции смещения, т.е. заменяют нелинейную глад-
кую зависимость Ф(Δ) линейной: Ф(Δ)=kн Δ. К полученному уравнению присоединяют
уравнения всех остальных звеньев системы (самолета, штурвала и др.) и рассчитывают
всю систему как линейную. При этом уже не обращают внимания на наличие автоколеба-
ний в локальном контуре, так как они учтены при определении эквивалентного коэффи-
циента усиления этого контура kн.
*)
Более подробно статистические характеристики рассмотрены в главе 10 п.10.4.1.
429
Постановка задачи поясняется схемой (рис.3.55)
для случая безинерционного нелинейного элемента НЭ
Требуется определить эквивалентный коэффициент пере-
дачи этого элемента kсэ .
DΔ = M [Δ 2 ] = M [( y *) ] − 2kсэ M [ y *ϕ ] + kсэ2 M [ϕ 2 ] =
2
T ∞
1
= lim
T →∞ 2T ∫ y *(t )ϕ (t )dt = ∫ F (ϕ )ϕP(ϕ )dϕ = r
−T −∞
y*ϕ - корреляционный момент случайных вели-
чин y* = F (ϕ ) и ϕ .
Найдем экстремум DΔ , взяв производную по k сэ от выражения (0.144):
∂DΔ
= −2 R y*ϕ (0) + 2k сэ Rϕ (0) = 0 ,
∂k сэ
откуда статистически эквивалентный коэффициент усиления будет:
R y *ϕ (0)
k сэ = . (0.145)
Rϕ (0)
∂ 2 DΔ
Так как > 0 , то найденное значение k сэ дает минимум дисперсии DΔ .
∂k сэ2
R y2*ϕ (0)
DΔ min = R y* (0) − .
Rϕ (0)
430
Требуется определить дисперсию выходной величины y , обусловленную влияни-
1
ем помехи f , имеющей спектральную плотность S f (ω ) = . При этом полагаем
1 + T 2ω 2
u=0.
Решение. В статистической динамике f
u φ F y* k 1 y
доказывается, что любой закон распределения ϕ Tjω + 1 jω
⎛ ⎞ ϕ2
2
ϕ
∞
1 − 2
2c
∞ −
2σ ϕ2 ⎛ ϕ ⎞
2
2cσ ϕ ∞ − z ϕ2
⎜ 2σ ϕ
⎟ ϕ dϕ =
2π σ ϕ ∫0 2π ∫0
Ry*ϕ (0) = ∫ c sign ϕ e e d ⎜
⎜ 2 ⎟⎟ = e dz , где z = .
⎜ 2πσ ϕ ⎟ ⎝ ⎠ 2σ ϕ2
−∞
⎝ ⎠
∞
∞
Так как ∫ e − z dz = − e − z = 1 , то получим:
0
0
2
R y*ϕ (0) = cσ ϕ .
π
Учтя, что Rϕ (0) = σ ϕ2 и воспользовавшись (0.145), найдем статистически эквива-
431
Для нахождения дисперсии выходной величины y (t ) можно воспользоваться фор-
мулой Парсеваля (4.86). Тогда, учтя соотношение между спектральными плотностями
выходного сигнала y и помехи f (4.84), получим:
∞ ∞ ∞
1 1 2 1 dω
σ = ∫−∞S y (ω )dω = 2π ∫−∞W fy ( jω ) S f (ω )dω = 2π ∫ T ( jω ) = I2
2
2π
y 2
−∞
2
+ jω + kk сэ
2π
σy =
4kc
* * *
Статистическая линеаризация безынерционных нелинейных элементов может быть
основана не только на минимизации дисперсии ошибки Δ = y * − y (рис.3.55), но и на дру-
гих критериях. В частности, находит применение линеаризация, основанная на выполне-
нии равенства математических ожиданий и дисперсии истинной и аппроксимирующей
случайных функций.
В этом случае
σ y*
k сэ = (0.147)
σϕ
Замечено, что лучшее приближение получается в случае, если в качестве величины
k сэ взять среднее арифметическое величин k сэ вычисленных по формулам (0.145), (0.147).
Для линеаризации инерционных нелинейных элементов могут быть использованы
приближения с помощью более простых линейных преобразований для нормально рас-
пределенного сигнала или для сигнала и его производной.
432
РАЗДЕЛ IV
СПЕЦИАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
Под оптимальной системой управления понимается система, которой тем или иным спо-
собом приданы наилучшие качества в каком-либо определенном смысле.
Вообще говоря, любая научно обоснованная система является оптимальной, так как, вы-
бирая ту или иную систему, мы тем самым предпочитаем ее другим. Оценка функциони-
рования системы производится с помощью вполне определенных и всегда наличествую-
щих критериев оптимальности, без которых обоснованный выбор системы был бы не-
возможен.
Задачей теории оптимальных систем управления является определение в общем
виде законов управления объектом, дающих возможность судить о том, что можно и чего
нельзя достигнуть в реальных условиях. Классической постановкой такой задачи является
задача определения оптимального в определенном смысле алгоритма управления при на-
личии полной априорной информации (математическое описание, включая ограничения,
накладываемые на любые координаты системы) об объекте управления, а также достаточ-
но строгой математической формулировки цели управления.
433
ляемой мощности (компенсация реактивной мощности – это дополнительные заботы), то
производителю необходимо учитывать и реактивную ее составляющую (так как она влия-
ет на величину потерь электроенергии в сетях). Поэтому в качестве одного из кон-
тролируемых показателей, по которым производятся расчеты за электроэнергию, обяза-
тельно используется коэффициент мощности.
В общем случае при поиске формализованного (математического) выражения для крите-
рия оптимальности обычно руководствуются следующими соображениями:
• Критерий, прежде всего, должен отражать экономические показатели или величины с
ними связанные.
• Для конкретной системы должен учитываться только один критерий. В случае много-
критериальной задачи целесообразно синтезировать глобальный критерий как определен-
ную функцию от частных критериев.
• Критерий должен быть связан с управляющими воздействиями, в противном случае он
бесполезен.
• Критериальная функция должна иметь подходящую форму. Желательно пользоваться
критериальной функцией, имеющей один экстремум. К нежелательным формам критери-
альной функции относятся неоднозначные функции, имеющие разрыв, локальные экстре-
мумы и т.п.
• Информация, необходимая для формирования критерия, не должна быть избыточной.
Это позволяет максимально упростить систему измерительных устройств и повысить на-
дежность функционирования системы в целом.
Если целью управления является достижение максимальной точности (например,
стабилизации, слежения), критерием может служить средняя квадратическая ошибка управ-
ления в виде
T
Q = ∫ y 2 (t )dt , (4.1)
0
434
u ∈ Ω(u ) ( u принадлежит области допустимых управлений), и соответствующее движение
y (t ) , чтобы при переходе системы из состояния y0 в состояние yT минимизировалось вы-
ражение (4.3), в котором векторы y* и f полагаются неизменными и поэтому не учиты-
ваются. В частном случае, при F = 1 получим Q = T . Тогда, если требуется реализовать
цель Q = min, получаем задачу о максимальном быстродействии.
где i (t ) = i∞ (1 − е −t / T ) ; i∞ = U 0 / R ; T = L / R .
С другой стороны, количество энергии А, запасенной в индуктивности L, равно
Li∞2 U U
A= = Ti∞ 0 = 0 S1 .
2 2 2
Так как U0 = const , то величина А пропорциональна площади S1. При этом площадь S 2 про-
порциональна полезной работе, совершаемой на активном сопротивлении R .
435
Форсировку переходного процесса можно по-
лучить, увеличивая подводимое напряжение
(управляющее воздействие) до U = U max
(рис.4.2, а). Если в момент достижения y = y∞
уменьшить U до U 0 , то управляемая координа-
та y сразу примет установившееся значение
y∞ (рис.4.2, б). Это обусловлено тем, что коли-
чество энергии, запасенное к моменту времени
t1 , равно тому, которое необходимо для работы
в установившемся режиме y = y∞ , так как мож-
но доказать, что S3 = S1 . По истечении интервала t1 управление прекратить нельзя, его
нужно поддерживать на уровне U 0 , чтобы удерживать y = y∞ .
U
а) 2 3 1
Umax
4
U0
– Umax
б) y
ymax
1
S3
3
y∞
S1
2 4
t2 t1 t
Рис.4.3
В случае, если объект является апериодическим звеном второго порядка (например, элек-
трическая цепь R − L − C ), то описанный порядок управления (рис.4.3, а, ступенчатая
функция 1) не приводит к равенству площадей S1 и S3 (рис.4.3, б кривая 2). Можно пока-
зать, что при любых параметрах объекта S3 > S1 . Это приводит к избытку запасенной
энергии, а переходной процесс будет происходить с перерегулированием (рис.4.3,б кри-
вая 1). В случае, если производить переключение несколько ранее, в момент t2 , соответ-
ствующий равенству S1 = S3 , то при этом координата y < y∞ и переходной процесс будет
продолжаться (рис.4.3, кривая 2). Траектории 1 и 2 не являются оптимальными, хотя и
436
обеспечивают большее быстродействие по сравнению с переходным процессом, получен-
ным при отсутствии форсировки (кривая 4).
Управление координатой y можно осуществить и другим путем. Дадим объекту запас
энергии несколько больший, чем требуется при режиме y = y∞ . При подходе к y∞ отни-
мем этот излишек путем подачи отрицательного управления U = −U max . К моменту окон-
чания управления энергия и координата должны быть равны заданным значениям (рис.4.3,
кривая 3). При этом переходной процесс является оптимальным и заканчивается за конеч-
ное время. Таким образом, для оптимального управления объектом, описываемым диффе-
ренциальным уравнением второго порядка, управление должно один раз менять знак.
Продолжая аналогичные рассуждения для объектов, описываемых линейными уравне-
ниями более высокого порядка, придем к выводу: количество смен знака управляющего
воздействия зависит от порядка дифференциального уравнения и равно n − 1 , где n - по-
рядок уравнения. Это положение носит название теоремы об n интервалах или ( n − 1 )
переключениях. Отыскание моментов переключения управлений и является задачей, ко-
торую необходимо решить для создания системы, оптимальной по быстродействию.
Заметим, что если характеристическое уравнение системы имеет комплексные корни, то
число переключений управления зависит от начальных условий и может быть большим,
чем n − 1 .
437
В общем случае зависимость, характерную для функционалов, можно сформулировать
следующим образом: функции y(x) соответствует число v, определяющее значение
функционала. Напомним, что для обычной функции y(x) числу x соответствует число y,
определяющее значение функции.
Вариационное исчисление изучает методы исследования функционалов на максимум и
минимум. Соответствующие задачи называются вариационными. К ним, прежде всего, относятся
три классические задачи.
1. Задача о брахистохроне (см. пример 4.1).
2. Геодезическая задача, в которой требуется определить линию наименьшей дли-
ны l, соединяющую две заданные точки на некоторой поверхности
ϕ ( x, y, z) = 0 .
3. Изопериметрическая задача, в которой требуется найти уравнение замкнутой
линии заданной длины L, ограничивающей максимальную площадь S. Эта ва-
риационная задача была решена еще в Древней Греции: такой замкнутой лини-
ей оказалась окружность.
Заметим, что в последних двух задачах экстремум функционала ищется при определенных
условиях {ϕ ( x , y , z ) = 0, L = const } . Поэтому такие задачи называются задачами на услов-
ный экстремум.
Методы решения вариационных задач весьма сходны с методами исследования функции
на максимум и минимум. В частности, если функционал, например, Q{y(t)}, достигает экс-
тремума при y(t) = yэ(t), то вариация функционала δQ , под которой понимают линейную
часть его приращения по отношению к приращению функции y(t), равна нулю, то есть
δQ{ yэ (t )} = 0
Здесь yэ(t) – это функция, принадлежащая к некоторому классу функций, при которой зна-
чение функционала Q достигает экстремума. Именно поэтому функция yэ(t) называется
экстремалью функционала Q{y(t)}.
В теории вариационного исчисления доказывается, что если функционал задан в виде
t1
∂F d ∂F dF& y&
− =0 или F& y − =0 (4.5)
∂y dt ∂y& dt
Проиллюстрируем методику решения вариационных задач на одном классическом приме-
ре.
Пример 4.1. В 1696 г. Я.Бернулли опубликовал задачу
о линии быстрейшего ската (задача о брахистохроне),
которая формулируется следующим образом: опреде-
лить уравнение траектории, соединяющей две заданные
точки А (0,0) и В ( x1, y1 ), не лежащие на одной верти-
кальной прямой (рис.4.4) и обладающие тем свойством,
что материальная точка, помещенная в точку А, скатит-
ся по этой траектории в точку В за кратчайшее время t .
Решение. Известно, что скорость движения материальной точки при свободном падении
438
dS
= 2 gy , (4.6)
dt
где S – путь; g – ускорение свободного падения.
( dx ) + ( dy )
2 2
Интегрируя (4.6) и учтя, что dS = , получим
x1
dS 1 1 + y& 2
t [ y ( x) ] = ∫ = ∫ dx (4.7)
∪ AB 2 gy 2g 0 y
при граничных условиях y (0) = 0; y ( x1 ) = y1 .
Сравнивая правые части уравнений (4.4) и (4.7), можно записать
F = 1 + y& 2 y.
Подставив найденное значение F в (4.5), после преобразований и интегрирования полу-
чим первый интеграл Эйлера в виде
y (1 + y& 2 ) = C1 .
d F& y& i
F& yi − = 0; i = 1, n . (4.9)
dt
Решение системы уравнений (4.9) дает семейство искомых экстремалей yi (t ) .
439
Вариационная задача обобщается также и на случай, когда в подынтегральную функцию
входят производные высших порядков, т.е. функционал Q имеет вид:
t1 . ..
Q = ∫ F ( y, y, y,..., y ( l ) , t )dt (4.10)
t0
440
Первое слагаемое подынтегрального выражения (4.16) запрещает длительное существова-
ние отклонения выходной координаты от заданного значения, а последующие – длитель-
ное существование больших значений производных. Поэтому минимуму интеграла (4.16)
соответствуют достаточно быстрые и плавные переходные процессы. Заметим, что в слу-
чае необходимости минимизации мощности управления в подынтегральное выражение
(4.16) вводят квадратичные члены вида γ i u 2 .
Синтезируем оптимальную систему в смысле минимума критерия Q.
Решение. Для нахождения экстремали функционала вида (4.16) составим и решим урав-
нение Эйлера – Пуассона (4.11). При F = y 2 + γ 1 y& 2 + γ 2 &y& 2 имеем
441
где α – любое отличное от нуля число.
Из (4.21) следует, что Wy* ( p) должна представлять собой полином первого порядка. Тогда
1 1
Wy ( p ) = = .
Wy* ( p) a0 p + a1
0 0
∂F d ∂F
− = 2( y − γ 1 &y&) = 0 , или
∂y dt ∂y& koc
y − γ 1 &y& = 0 .
Характеристическое уравнение получен- Рис.4.6
ного дифференциального уравнения бу-
442
дет
1 1
H ( p) = 1 − γ 1 p 2 = (1 + γ 1 2 p)(1 − γ 1 2 p) = 0 .
Исходя из требований устойчивости при нахождении экстремума учитываем корни только
−1 / 2
первого сомножителя. Тогда p1 = −γ 1 и уравнение экстремали имеет вид:
y1 (t ) = C ⋅ e p1t , (4.22)
где С – постоянная интегрирования.
Заметим, что уравнение экстремали соответствует решению ДУ вида Ty& + y = 0 с
характеристическим уравнением Tp + 1 = 0 , где T – постоянная времени. Таким образом
экстремалью функционала Q1 является экспонента с постоянной времени T = γ 11/ 2 .
Уравнение экстремали функционала Q2 получим, положив в (4.22) γ 1 =0. Тогда, приняв
начальное значение координаты y(0)=1, можно записать
С ∀ t< 0
y2(t) =
0 ∀ t≥ 0.
Так как объект управления описывается дифференциальным уравнением второго порядка
переходные процессы минимизирующие функционалы Q1 и Q2 физически нереализуемы.
Поэтому можно лишь определить величины изменяемых параметров системы (в нашем
случае koc), при которых переходной процесс максимально приближался бы к оптималь-
ному. Для решения этой задачи запишем дифференциальное уравнение системы. Имеем
W р ( p) k1 k
W ( p) = , где W р ( p) = ⋅ 2 .
1 + W р ( p) Tp + 1 + k1k ос p
Тогда дифференциальное уравнение системы примет вид:
T&y& + (1 + k1k oc ) y& + k o y = k o u , где ko=k1k2.
Пусть входной сигнал меняется скачком от u до 0, тогда, полагая y (0) = 1 ; y& (0) = 0 и обо-
значив a1 = (1 + k1 k oc ) / k o и a0 = T / k o , получим:
a0 &y& + a1 y& + y = 0 . (4.23)
Определим значения Q1 и Q2 через коэффициенты дифференциального уравнения. Для
этого умножим (4.23) поочередно на y и y& . Тогда получим
a0 &y&y + a1 y& y + y 2 = 0 ⎫⎪
⎬. (4.24)
a0 y&&y& + a1 y& 2 + y& y = 0⎪⎭
Вычислим следующие интегралы, учтя при этом, что y(∞)= y& (∞)=0
∞ ∞
∞
∫ y&y&dt = yy&
0
0
− ∫ y& 2 dt = − y0 y& 0 − Q11 = −Q11 ;
0
∞ y∞ 2 ∞ y∞
y0 1 y& 0 2
∫ yy&dt =
0
∫ ydy = −
y0
2
=− ;
2 ∫ yydt
0
&&& = ∫
y0
& &=−
ydy
2
= 0.
443
∞
1 (1 + k1k oc ) 2 + (a0 + γ 1 )k 02
Q1 = ∫ ( y 2 + γ 1 y& 2 )dt = Q2 + γ 1Q11 = (a1 + a0 + γ 1 ) =
2
.
0
2a1 2k 0 (1 + k1k oc )
Для нахождения koc1 , соответствующего Q1=min, запишем:
∂Q1 1 (a + γ 1 )ko
= − 0 = 0.
∂k oc k o (1 + k1k oc ) 2
Отсюда оптимальное значение koc2 :
1
(k 0 a0 + γ 1 − 1).
k oc1 =
k1
Коэффициент koc , соответствующий Q2=min (при γ 1 =0) , будет
1
k oc 2 = (k 0 a0 − 1).
k1
T 0.5
Пусть T=0.5c; k1=200; k2=0.25 1/c; k0= k1 ⋅ k 2 =50 1/c; a0 = = = 0.01 c2.
k 0 50
Оценку Q1 находим, задаваясь γ 1 . Потребуем, чтобы переходной процесс приближался к
экспоненте с постоянной времени 0,1 с, тогда γ 1 =0,01 с2, а
1
k oc1 = (50 0.02 − 1) = 0.03.
200
Для оценки Q2 получим
1
k oc 2 = (50 0.01 − 1) = 0.02.
200
Качество переходного процесса определяется коэффициентом демпфирования ξ, который
в нашем случае равен
a 1 + k1k oc
ξ= 1 = .
2 a0 2 k 0T
Подставляя числовые значения koc , имеем для первого случая ξ1=0,7, а для второго ξ1=0,5.
Перерегулирование при ξ=0,7 не превышает 5%, а при ξ=0,5 достигает 20 %, т.е. выбор koc
по критерию Q1 дает меньшее перерегулиро-
вание, чем по Q2. Дальнейшее увеличение γ 1
еще больше увеличивает koc1 и, следовательно,
ξ. При этом уменьшается перерегулирование,
но увеличивается время переходного процесса
(рис.4.7).
Таким образом, при заданной структуре объ-
екта мы не можем реализовать оптимальный
переходной процесс в чистом виде, миними-
зирующий критерий Q1 и Q2, при любых koc.
Это обусловленно инерционностью объекта
управления, что оставляет возможность реа-
лизации процесса лишь близкого к оптималь-
ному.
***
Пример 4.4. Найти оптимальную по быстродействию кривую изменения частоты враще-
ния двигателя постоянного тока независимого возбуждения при отработке заданного пе-
T T
ремещения ϕ0 = ∫ ωdt и ограничениях, наложенных на нагрев двигателя: q = ∫ Ri 2 dt ≤ A .
0 0
444
Здесь T – время перемещения двигателя; ω – частота вращения; A – допустимые тепло-
вые потери; i и R – ток и сопротивление якоря.
Решение. Математически поставленная задача формулируется следующим обра-
зом: найти экстремаль функционала
T
Q1 = ∫ dt = min (4.25)
0
Таким образом, имеем задачу на условный экстремум, для решения которой составим
вспомогательную функцию
F * = F + λ 2 F2 + λ 3 F3 = 1 + λ 2 Ri 2 + λ 3ω . (4.27)
Запишем уравнение движения двигателя при неизменном потоке возбуждения Ф = const и
отсутствии момента сопротивления M c = 0 :
dω J
J = M д = KM i ; i= ω& . (4.28)
dt KM
Здесь J – момент инерции, приведенный к валу двигателя; M д – момент двигателя;
K M = CM Ф ; CM – электромашинная постоянная.
Тогда (4.27) можно записать в виде:
F * = 1 + λ2 K ω& 2 + λ3ω ,
где K = J 2 R / K M2 .
Экстремаль функционала (4.25) с учетом (4.26) находят, решая уравнение Эйлера
∂F * d ∂F *
− = λ3 − 2λ2 K ω&& = 0
∂ω dt ∂ω&
Откуда
λ3 1
ω&& = = ; (4.29)
2λ2 K 2λ0 K
где λ 0 = λ 2 / λ 3 .
Интегрируя (4.29), найдем уравнение экстремалей
1 1
&=
ω t + C1 ; ω= t 2 + C1t + C2 . (4.30)
2λ0 K 4λ0 K
С учетом уравнения (4.28) запишем
J J J
i= ω& = t+ C1 . (4.31)
KM 2λ0 KK M KM
Таким образом, оптимальное в смысле быстродействия управление двигателем при вы-
полнении условий (4.26) осуществимо при линейном законе изменения тока и изменении
ω по параболическому закону.
Постоянные интегрирования C1 и C2 и постоянный множитель λ 0 определяют из гранич-
ных условий
445
ω(0) = 0; ω(T ) = 0; i (0) = i0 ; i (T ) = −i0 , (4.32)
соответствующих началу разгона и окончанию торможения. Подставив (4.32) в (4.30) и
(4.31) окончательно запишем
KM JT
C1 = i0 ; C2 = 0; λ0 = − . (4.33)
J 4i0 KK M
Подставив (4.33) с учетом (4.36) в (4.30) и (4.31), найдем в окончательном виде закон из-
менения тока i (t ) и скорости ω (t ) при оптимальном режиме в функции времени (рис.4.8).
Так как управление двигателем постоянного тока обычно производится изменением на-
пряжения на зажимах якоря U я , то воспользовавшись вторым законом Кирхгофа для
якорной цепи двигателя
U я = Ri + K e ω (4.37)
и уравнениями i (t ) и ω (t ) , можно найти зависимость U я (t ) . Так как зависимость i (t ) ли-
нейная, а ω (t ) параболическая, то U я (t ) тоже будет
изменяться по параболе (рис.4.8).
Если управлять двигателем, контролируя выходные
координаты ϕ и ω , то, исключив из уравнений i (t ) и
ω(t ) переменную t , получим зависимость i (ω) , под-
ставив которую в (4.37), найдем зависимость U я (ω) .
Кроме того, для учета знака i необходимо также про-
изводить непрерывное измерение угла поворота ϕ.
Окончательно
U я ( ω, ϕ ) = B1 ( B 2 − 2 ω) sign( ϕ 0 − 2 ϕ ) + K e ω ,
(4.38)
1/ 3
где RA ; ⎛ 9 AK M2 ⎞ .
B1 = B 2 = ⎜⎜ ⎟
⎟
ϕ0 ⎝ 4 ϕ 0 RJ
2
⎠
Как вытекает из (4.38), для реализации оптимального алгоритма требуется нели-
нейный регулятор.
Динамическое программирование
В основе метода динамического программирования лежит принцип оптимальности, сфор-
мулированный Р. Беллманом для широкого круга задач. Согласно этому принципу, опти-
мальная стратегия управления не зависит от «предыстории» системы, а определяется ее
состоянием в настоящий момент времени и целью управления.
446
Поясним метод динамического программирования на простом примере управления объек-
том, движение которого характеризуется уравнением первого порядка
dy
= f 0 ( y, u ) , (4.39)
dt
где u и y – единственные управление и координата системы, причем на u наложено ог-
раничение в виде u ∈ Ω(u ) . Предполагается, что при этом координата y также не выходит
за границы допустимых значений.
Пусть заданы граничные условия y (0) = y0 ; y (T ) = yT и требуется минимизировать функ-
ционал вида
T
Q = ∫ F0 ( y, u , t )dt . (4.40)
0
где F ( yk , uk ) = F0 ( yk , uk )Δ .
В выражении (4.42) выделено последнее слагаемое суммы ϕ( y N ) при k = N , так как оно не
зависит от управления, ибо при t = T процесс управления заканчивается и u N = 0 .
Теперь задача состоит в определении последовательных значений управляющих воздейст-
вий uk ( k = 0, N − 1 ), минимизирующих сумму (4.42) при условии (4.41) и ограничении
u ∈ Ω(u ) . Таким образом, вариационная задача свелась к задаче нахождения минимума
функции многих переменных.
Метод динамического программирования дает возможность свести эту операцию к после-
довательности минимизаций функции одной переменной. Для этого применяется прием,
заключающийся в движении от конца процесса (t = T ) к его началу (t = 0) .
Допустим сначала, что рассматривается момент времени t N - 1=Δ(N–1). Все значения uk,
кроме последнего, уже каким-то образом были осуществлены и при этом получили опре-
деленные значения y N −1 , соответствующие моменту времени tN-1. Согласно принципу оп-
тимальности, воздействие u N −1 не зависит от «предыстории» системы и определяется
лишь состоянием системы, характеризуемым величиной y N −1 и целью управления. На по-
следнем участке траектории (от t N −1 до t N ) величина t N −1 влияет на те члены суммы
(4.42), которые относятся к этому участку, т.е.
Q N −1 = F ( y N −1 , u N −1 ) + ϕ ( y N ).
Пользуясь (4.41) при k = N–1, запишем полученное выражение в виде
Q N −1 = F ( y N −1 , u N −1 ) + ϕ[ y N −1 + f ( y N −1 , u N −1 )] . (4.43)
447
Так как целью управления является минимизация Q, то это условие необходимо выдер-
жать и для рассматриваемого участка. Обозначим min QN −1 = S N −1 . Как видно из (4.43),
uN ∈Ω (u )
−1
= min {F ( y N −1 , u N −1 ) + ϕ [ y N −1 + f ( y N −1 , u N −1 )]} .
u N −1∈Ω (u )
Минимизация здесь производится также по одному переменному uN –2. При этом опреде-
ляются оптимальное значение управления u*N –2 и минимум функции QN –2, равный SN –2.
Значение SN –2 заносится в память компьютера, а SN –1 стирается. Как u*N –2, так и SN –2 явля-
ются функцией y N − 2 . Продолжая аналогичным образом, получим рекуррентную формулу
вида
S N − k ( y N − k ) = min { F ( y N − k , u N −k ) + S N − k +1 [ y N − k + f ( y N − k , u N − k ) ] }. (4.46)
u N − k ∈Ω ( u )
448
Учитывая, что левая часть выражения (4.46) не зависит от управления, величину S N – k
можно перенести в правую часть под знак минимума. Тогда (4.46) можно записать в виде
⎧ S N − k +1 − S N − k ⎫
min ⎨ F ( y N −k , u N −k ) + Δy ⎬ = 0 (4.47)
u N − k ∈Ω ( u ) ⎩ Δy ⎭
Произведя предельный переход при Δy → 0 и учтя, что Δy = f ( y, u ) , запишем (4.47) в не-
прерывной форме:
⎡ dS ( y ) ⎤
min ⎢ F ( y , u ) + f ( y, u )⎥ = 0 . (4.48)
u∈Ω ( u ) ⎣ dy ⎦
Для получения минимума выражения, стоящего в квадратных скобках, в уравнении (4.48),
его нужно продифференцировать по управлению. Тогда условие минимума (4.48) можно
заменить системой уравнений
dS ( y )
F ( y, u ) + f ( y, u ) = 0 ;
dy
(4.49)
∂F ( y, u ) ∂f ( y, u ) dS ( y )
+ = 0.
∂u ∂u dy
Решение системы (4.49) позволяет найти зависимость u = ϕ( y ), при которой реализуется
оптимальное управление в смысле минимизации критерия (4.40). Для этого сначала из
второго уравнения системы (4.49) определяется величина dS ( y ) / dy, а затем искомая за-
висимость u = ϕ( y ).
В случае, если система имеет n выходных координат y = y1 ,... yn и r управлений
u = u1 ,...u r , имеем
⎧
( ) ∂S ( y ) ⎫
n
min ⎨ F y, u + ∑ f i ( y, u ) ⎬ = 0 . (4.50)
u∈Ω ( u ) ⎩ i =1 ∂yi ⎭
или
( ) ∂S ( y )
n
F y, u + ∑ fi ( y, u ) = 0 ;
i =1 ∂yi
(4.51)
∑
r ( )
∂F y , u
+∑∑
n ∂ S ( y ) ∂f i ( y , u )
r
=0.
j =1 ∂u j i =1 j =1 ∂ y i ∂u j
449
Δ
N1 − 3 N1 − 2 N1 −1
N Т
38 13 25 15 10 10
14 12 18 8 Δ
N2 − 4 N2 − 3 N2 − 2 N2 −1
46 9 37 16 26 18 8
10 7 11 16
N3 − 5 N3 − 4 N3 −3 N3 − 2
53 9 44 9 37 16 24
8 8 17 15
N4 − 6 N4 − 5 N4 −4 N4 − 3
59 7 52 11 54 18 39
O
Рис. 4.9
Решение задачи начинаем с конечного пункта Т (точка N). В точку N можно попасть за
один последний шаг либо из точки N1–1 либо из N2 –1. Заметим, что из каждой из этих то-
чек можно попасть в точку N только одним способом, т.е. на последнем шаге имеем
единственное управление uN –1. Примем, что в связи с окончанием строительства в точке N
затраты в этой точке минимальны и равны нулю, т.е. ϕ ( y N) = 0. Тогда в соответствии с
(4.43) получим
S N i −1 = min QNi −1 = min FNi −1 ( y Ni −1 ) = FNi −1 ( y Ni −1 ), i = 1,2 .
u N i −1∈Ω ( u ) u N i −1∈Ω ( u )
⎧⎪18 + 10 = 28⎫⎪
S N2 −2 = min {F ( y N2 − 2 , u N2 − 2 ) + S N1 −1[ y N2 − 2 + f ( y N2 − 2 , u N2 − 2 )]} = min ⎨ ⎬ = 26 .
u N 2 −2∈Ω ( u ) u N 2 − 2 ∈Ω (u ) ⎪18 + 8 = 26 ⎪
⎩ ⎭
Полученные результаты заносятся в память компьютера. Заметим, что путь из точки N2 –2
в точку N, минимизирующий затраты QN −2 , соответствует управлению, при котором тру-
бопровод прокладывается в точку N2 –1, а путь через точку N1 –1 исключается из дальней-
шего рассмотрения.
Аналогично, переходя к последующим точкам, минимизируем на каждом шаге величину
QN – k, отбрасывая неоптимальные траектории. Попав, наконец, в точку О и двигаясь от нее
к точке N, найдем траекторию, оптимальную для всего трубопровода (на рис.4.9 выделена
сплошной линией).
Исключение неоптимальных траекторий по мере движения от Т к О существенно упроща-
ет расчет по сравнению с методом простого перебора траекторий (в нашем случае количе-
ство арифметических операций уменьшается более чем на порядок).
450
Пример 4.6. Пусть объект управления описывается уравнением вида
dy
= by + mu = f ( y, u ).
dt
Найти управление u, при котором минимизируется функционал
∞ ∞
Q = ∫ F ( y, u )dt = ∫ ( y 2 + γu 2 )dt .
0 0
⎧ n ∂S ( y ) ⎫
min ⎨∑ ⋅ f i ( y, u )⎬ = 0, (4.53)
u∈Ω ( u )
⎩ i =0 ∂yi ⎭
где ∂S ( y ) / ∂y0 = 1.
451
Учтем, что max(– y ) = –min( y ) . Тогда (4.53) примет вид
⎧ n ∂S ( y ) ⎫
max ⎨∑ − f 0 ( y , u ) ⎬ = 0. (4.54)
u∈Ω ( u )
⎩ i =0 ∂yi ⎭
Обозначим ψ i = − ∂S ( y ) ∂yi , тогда
∂S ( y ) ∂S ( y )
ψ = − 1, − ,K , − = ψ 0 ,ψ1,K ,ψ n
∂y1 ∂y n
dψ i ∂H
= − . (4.58)
dt ∂yi
n n
dyi
Учитывая, что H = ∑ ψ i fi = ∑ ψ i , и взяв производную от H по ψi, можно записать
i =0 i =0 dt
dyi ∂H
= . (4.59)
dt ∂ψ i
452
Таким образом, функцию H можно интерпретировать как энергию (или мощность) систе-
мы, которая вводится в нее с помощью управления u , а функции ψi – как импульсы, за-
дающие направление движения.
Отметим, что при выводе принципа максимума из уравнений Беллмана предположение о
непрерывности и дифференцируемости функции S ( y ) остается в силе. Однако если усло-
вие ψ0 = –1 заменить более слабым условием ψ0 ≤ 0 , то принцип максимума, как это сде-
лал Понтрягин, можно вывести без каких-либо предположений о функции S ( y ) , что зна-
чительно расширяет круг задач, решаемых с помощью этого принципа.
В общем случае принцип максимума формулируется следующим образом: для получения
оптимальной системы управления в смысле достижения минимума функционала Q необ-
ходимо существование таких ненулевых непрерывных функций ψ0(t), ψ1(t), ..., ψn(t), яв-
ляющихся решением системы сопряженных уравнений (4.58), что при любом t, находя-
щемся в заданном интервале 0 ≤ t ≤ Т, величина H как функция переменных u1, ..., ur в за-
данной области их допустимых значений достигает максимума согласно условию (4.57).
Синтез систем, оптимальных по быстродействию
Для синтеза систем, обеспечивающих максимальное быстродействие, наиболее целесооб-
разно применять принцип максимума. Сформулируем задачу в общем виде.
В n-мерном пространстве в момент времени t = 0 задан вектор состояния объекта y 0 и его
конечное состояние y T при t = T. Объект описывается линейными дифференциальными
уравнениями:
dyi
= f i ( y, u ); i = 0, n.
dt
На управления наложены ограничения u j ≤ u j max , j = 1, r.
Критерий оптимальности по быстродействию, т.е. при F ( y, u ) = 1 , имеет вид
T
Q = ∫ 1 ⋅ dt = T .
0
Требуется найти такое управление u (t ) , при котором время перехода объекта T из состоя-
ния y 0 в y T минимально.
Предполагается, что fi ( y, u ) определены для любых значений y ∈ Ω( y ) , соответствующих
области управления u ∈ Ω(u ) . Кроме того, функции fi ( y, u ) непрерывны и дифференци-
руемы по всем переменным y i. Управление может принадлежать к классу кусочно-не-
прерывных функций, содержащих разрывы первого рода.
Так как F = f0 = 1, то с учетом того, что в общем случае ψ0 ≤ 0, первое слагаемое суммы в
уравнении (4.55) ψ0 f0 ≤ 0. Тогда уравнение (4.55) для рассматриваемой задачи можно
представить в виде
n
max
u ∈Ω ( u )
∑ψ
i =1
f ≥0
i i или max H ( ψ , y, u ) ≥ 0 .
u ∈Ω ( u )
(4.60)
453
ной или нескольких составляющих вектора ψ . При этом для достижения положительного
максимума H необходимо, чтобы
u j = u j max sign ψ i (t ) , (4.61)
где
⎧+ 1 ∀ ψ i > 0;
sign ψ i (t ) = ⎨
⎩ − 1 ∀ ψ i < 0.
Таким образом, в данном случае управляющее воздействие при смене знака ψi (0) изменя-
ется скачкообразно от + umax до − umax или наоборот. Момент смены знака называется мо-
ментом переключения.
3. Для нахождения вспомогательной функции ψi (t), определяющей управление, в частно-
сти согласно (4.61), составляют и решают систему сопряженных уравнений (4.58).
4. В случае замкнутой системы ищут зависимость управления от контролируемых коор-
динат системы, соответствующих оптимальной траектории: u = ϕ( y ) . При этом моменты
переключения определяются автоматически при отклонении фактической траектории от
оптимальной. В случае разомкнутой системы устанавливают количество изменений знака
ψi (t), т.е. число корней функции ψi (t). Моменты переключения могут быть найдены мето-
дом стыковки решений дифференциальных уравнений со знакопеременной правой час-
тью. При этом в конечном итоге получают систему n трансцендентных уравнений с n не-
известными моментами переключения ti (i = 1, n) , решение которой возможно только чис-
ленными методами. Исключение составляют системы, характеристическое уравнение ко-
торых имеет кратные нулевые корни.
Пример 4.7. Пусть объект управления задан следующими уравнениями:
d 2 y1 dy1 dy2
=u или = y2 = f1; = u = f2. (4.62)
dt 2 dt dt
Если положить, что y1 = ℓ, y2 = v, u = F, то приведенная система уравнений описывает
движение материальной точки с массой m = 1, свободно и без трения движущейся по го-
ризонтальной прямой (с координатами ℓ – путь, v – скорость) и снабженной двигателем,
развивающим силу F = ma, где a = y& 2 .
Найти оптимальное управление u*, обеспечивающее максимальное быстродействие сис-
темы при переходе ее из произвольного начального состояния y 0 в конечное равновесное
состояние yT . На управление наложено ограничение |u| ≤ umax.
Решение. Составим функцию Гамильтона:
454
Поскольку функция ψ2(t) обращается в нуль один раз при t1 = C2 / C1 , то управление
*
u имеет одну перемену знака (два интервала управления). Так как начальные условия для
функций ψi (t), а следовательно, и постоянные C1 и C2 неизвестны, то использование
принципа максимума дает только качественное представление об изменении управляюще-
го воздействия – одно переключение. Для определения количественных характеристик
необходимо определить моменты переключения t1 и окончания управления T. Для этого
необходимо решить уравнения системы (4.62), правая часть которых в соответствии с
(4.63) знакопеременная:
&y&1 = ±u max . (4.64)
Интегрируя (4.64), получим
y2 = y&1 = ±umaxt + C1;
umax 2 (4.65)
y1 = ± t + C1t + C2.
2
455
ным ( y2 растет), а в области II – отрицательным ( y2 падает). Линия переключения и явля-
ется границей, разделяющей области I и II. Зная уравнение этой линии и состояния систе-
мы y1 и y2 , можно определить знак управления.
Запишем уравнение линии переключения (4.66) в виде
Из (4.67) следует, что если начальные значения y1 и y2 таковы, что изображающая точка
не лежит на линии переключения, то для области I ϕ ( y1 , y2 ) < 0, а для области II ϕ ( y1 ,
y2 ) > 0. Тогда в случае замкнутой системы уравнение управляющего устройства примет
вид
Таким образом, реализация даже такой простейшей замкнутой системы требует наличия
функционального преобразователя, вычисляющего в соответствии с (4.67) величину ϕ ( y1 ,
y2 ), и релейного исполнительного элемента, выдающего управляющий сигнал в соответ-
ствии с (4.68).
В случае разомкнутой системы моменты переключения находятся методом припасовыва-
ния решений дифференциальных уравнений. Воспользовавшись граничными условиями
y1 (t0) = – y10 ; y2 (t0) = 0 и y1 (T) = y2 (T) = 0, запишем уравнения (4.65) в виде
u max 2
y1 (t0 ) = + t0 + C11t 0 + C21 = − y10 ;
2
y2 (t0 ) = +umaxt0 + C11 = 0;
(4.69)
u
y1 (T ) = − max T 2 + C12T + C 22 = 0;
2
y2 (T ) = −u maxT + C12 = 0 .
где C11, C12 и C21, C22 – постоянные интегрирования на первом (разгон) и втором (тормо-
жение) интервалах управления.
Так как координаты системы y1 и y2 непрерывны, можно произвести стыковку решений
на границе первого и второго интервалов управления:
u max 2 u
t1 + C11t1 + C 21 = − max t12 + C12 t1 + C 22 ;
2 2 (4.70)
u max t1 + C11 = −u max t1 + C12 .
Решая совместно систему уравнений (4.69) и (4.70), можно определить постоянные интег-
рирования и моменты времени t1 и T. Окончательно получим C11 = 0; C21 = –y10;
u max 2
C12 = umaxT; C22 = − T ; T = 2t1; t1 = y10 umax . Таким образом, управление объектом
2
можно осуществлять с помощью программного устройства, подающего команду на измене-
ние знака управления в момент времени t = t1.
Пример 4.8. Для условий примера 4.4 учесть ограничения по току двигателя i ≤ imax .
Решение. Так как на координату системы оптимальной по быстродействию наложены ог-
раничения, то для нахождения алгоритма оптимального управления двигателем целесооб-
разно применять принцип максимума. Представим уравнение движения двигателя (4.28) в
виде
dω / dt = Kмi / J = ki = f1; k= Kм/ J ; d ϕ / dt = ω = f2; ϕ = y2 .
456
К этим уравнениям добавим условие ограничения на нагрев (4.26), которому соответству-
ет уравнение вида
dQ2
= Ri 2 = f 3 .
dt
Заметим, что величины ω , ϕ , Q2 являются координатами системы yi ( i = 1,3 ), а сила тока i
– управляющим воздействием u.
Составим функцию Гамильтона для рассматриваемой системы:
H = ψ1 f1 + ψ2 f2 + ψ3 f3 = ψ1ki + ψ2ω + ψ3 Ri 2. (4.71)
Для нахождения вспомогательных переменных ψi запишем сопряженные уравнения
dψ 1 ∂H dψ 2 ∂H dψ 3 ∂H
=− = −ψ 2 ; =− = 0; =− = 0.
dt ∂ω dt ∂ϕ dt ∂y3
Интегрируя эти уравнения, получим
ψ3 = C3; ψ2 = C2; ψ1 = C1 – C2t. (4.72)
2
Так как ψ3 = const, а Ri – существенно положительная величина, то согласно принципу
максимума значение ψ3 может быть в частности принято равным ψ3 = +1. Тогда (4.71)
примет вид
H = ψ1ki + ψ2ω + Ri2.
Для определения зависимости i(t), при которой максимизируется величина H, решим урав-
нение ∂H / ∂i = ψ 1k + 2 Ri = 0 , откуда
ψ 1k
i=− . (4.73)
2R
Подставив (4.72) в (4.73), получим
i=
( C1 − C2t ) k = C4 − C5t , (4.74)
2R
где C4 = C1k / 2R; C5 = C2k / 2R.
Таким образом, управление u = i является, как и ранее, линейной функцией времени
(4.74). Однако в нашем случае необходимо учесть ограничение, накладываемое на ток
двигателя. Тогда закон изменения управления примет вид
⎧C4 − C5t ∀ i (t ) < imax ;
⎪
i (t ) = ⎨+ imax ∀ i (t ) ≥ imax ; (4.75)
⎪− i ∀ i (t ) ≤ −imax ,
⎩ max
где i(t) – ток, определяемый в соответствии с (4.74). i, u, ω
Заметим, что в связи с ограничением тока двигателя для i ω
imax
полного использования машины по нагреву можно увели- ω1
чить угол наклона прямой i(t) по сравнению с прямой i1(t), ϕ0
ϕ0 ϕ
рассчитанной методом вариационного исчисления без уче- 2
t1 T t1′ = T − t1 T t
та ограничений по току (рис.4.11). При незначительных 2
углах поворота вала двигателя ограничение по нагреву
– imax
можно вообще не учитывать, и тогда закон изменения тока i1
будет носить релейный характер: Рис.4.11
i(t) = imax signψ1 (t) .
Для расчета конкретного алгоритма управления необходимо определить числовые значе-
ния моментов времени t1 и T (рис.4.11). С этой целью к системе сопряженных уравнений
присоединяют уравнение объекта с учетом закона изменения тока (4.75) и уравнений свя-
457
зи, учитывающих ограничения по нагреву Q2 ≤ A при заданном перемещении ϕ 0 . Интег-
рируя полученную систему уравнений, можно найти неизвестные t1 и Т, что позволяет по-
строить оптимальные законы изменения тока и частоты вращения двигателя.
***
459
T
1
Rx ( 0 ) = lim ∫ x& ( t ) dt .
2
T →∞ 2T
−T
(4.78)
Пример 4.9. Предположим, случайная функ-
ция X(t) задана совокупностью двенадцати
реализаций, приведенных на рис. 4.14. Там
же приведена зависимость математического
ожидания mx(t), вычисленного как среднее
значение случайной величины X в соответст-
вующем сечении. Требуется найти корреля-
ционную функцию случайного процесса.
Рис. 4.14
Решение. Анализ экспериментальных экспе-
риментально снятых реализаций (рис. 4.14)
показывает, что математическое ожидание mx и дисперсия Dx меняются незначительно,
что позволяет, учитывая ограниченное число реализаций, отнести рассматриваемую слу-
чайную функцию к классу стационарных с mx = -0,02 и Dx = 0,236. Для построения корре-
ляционной функции случайного процесса найдем корреляционные моменты K ij между i-м
и j-м сечениями случайной функции X(t) по формуле
∑ (xi − mx )(x j − mx )
i, j
K ij = ; i = 1,6 ; j ≥ i .
n −1
Вычислив значение корреляционного момента для раз-
личных τ ij = t j − t i и осредняя полученные значения K ij
для одинаковых τ получим числовые значения корреля-
ционной функции Rx(τ) для стационарного случайного
процесса X(t) (рис. 4.15). Найденные дискретные значения
корреляционной функции можно аппроксимировать ка-
ким-либо аналитическим выражением. Обычно в качестве
аппроксимирующей зависимости выбирается функция
вида
к
Rx (τ ) = Dx ∑ e
−α i τ
cos β iτ ,
i =1
∫ R (τ ) e
− jωτ
S x (ω ) = x dτ . (4.79)
−∞
Подставив в (4.79) значение корреляционной функции, определяемой выражением (4.77),
найдем:
∞ T T ∞ o
1 o o 1 o
S x (ω ) = ∫ e − jωτ dτ lim ( ) ( ) ( ) x(t + τ )e − jω ( t +τ ) dτ =
T →∞ 2T ∫ T →∞ 2T ∫ ∫
j ωt
x t x t + τ dt = lim x t e dt ⋅
−∞ −T −T −∞
2
1 X ( jω )
= lim X (− jω ) ⋅ X ( jω ) = lim
T →∞ 2T T →∞ 2T
460
Таким образом, спектральная плотность случайного процесса S x (ω ) является функцией
частоты и пропорциональна мощности (квадрату амплитуды) случайного сигнала. Поэто-
му ее часто называют энергетическим частотным спектром.
Для определения Rx(τ) по известной S x (ω ) можно воспользоваться обратным преобразо-
ванием Фурье
∞
1
R x (τ ) = ∫ S x (ω ) e jωτ d ω . (4.80)
2π − ∞
Выражения (4.79) и (4.80) свидетельствуют об однозначной связи между Rx(τ) и S x (ω ) .
Поэтому для характеристики случайного процесса достаточно знать одну из этих функ-
ций.
Пример 4.10 Построить график спектральной плотности стационарного случайного про-
цесса X(t), если его корреляционная функция R x (τ ) = N ⋅ δ (τ ) .
Решение. Найдем S x (ω ) , воспользовавшись (4.79):
∞
S x (ω ) = ∫ Nδ (τ ) e
− jωτ
dτ = N .
−∞
∞
Здесь учтено, что e − jωτ |τ =0 = 1 и ∫ δ (τ )dτ = 1 . График S
−∞
x (ω ) представляет собой прямую,
461
Таким образом требуемая мощность источника энергии случайного сигнала X(t), спек-
тральная плотность которого представлена на рис. 4.16, б ограничена полосой пропуска-
ния частот ωmax.
Выражения (4.81) и (4.82) представляют собой различные формы записи интеграла Дюа-
меля или свертки функций w(t) и x(t).
k −t
Пример 4.11. Найти реакцию объекта (рис.4.18, а) с весовой функцией w(t ) = e T на
T
прямоугольный импульс длительностью Tu и амплитудой Au =1 (рис.4.18,б).
Решение. Реакцию объекта y(t) можно найти, воспользовавшись выражением (4.81). При
0 ≤ t ≤ Tи имеем
t ( t −τ )
k −
⋅ 1(τ )dτ = k ⎛⎜1 − e T ⎞⎟ .
−t
y (t ) = ∫ e T
0
T ⎝ ⎠
Аналогичным образом найдем y(t) при t ≥ Tu:
⎛ Tu ⎞ −t
y (t ) = k ⎜ e T − 1⎟ e T
⎝ ⎠
Таким образом, при подаче импульсов на вход объекта, представляющего собой аперио-
дическое звено, на его выходе получаем пилообразный сигнал. (рис.4.18, в)
а б x в y
x(t) y(t) 1 y(Tи)
w (t)
462
Tu Tu t
Рис.4.18
* * *
В общем случае при подаче на вход линейного объекта случайного сигнала x(t) с корреля-
ционной функцией Rx(τ) соотношения (4.81) и (4.82) дают возможность определить связь
между корреляционными функциями выходного y(t) и входного x(t) сигналов.
Пусть x(t) представляет собой стационарный эргодический случайный сигнал. В силу ли-
нейности преобразования сигнал y(t) будет обладать теми же свойствами. Так как для ус-
тановившегося режима (t = ∞ )
∞
y (t ) = ∫ w(θ) x(t − θ)dθ
0
и при t < 0 w(θ) = 0, то в соответствии с соотношением (4.77), запишем
1 T 1 T ∞
R y (τ) = lim ∫ y (t ) y (t + τ)dt = lim ∫ dt ∫ w(θ) x(t − θ)dθ ×
T → ∞ 2T −T T →∞ 2T −T − ∞
∞ ∞ ∞
× ∫ w(η) x(t + τ − η)dη = ∫ ∫ w(θ) w(η) Rx (τ + θ − η)dθ dη . (4.83)
−∞ −∞ −∞
∞ ∞ ∞
= ∫ w(θ) e jωθ dθ ∫ w(η) e − jωη dη ∫ Rx (τ + θ − η) e − jω( τ+ θ−η) dτ =
−∞ −∞ −∞
Окончательно
Sy(ω) = | W(jω) |2 Sx(ω). (4.84)
Таким образом, по известным Rx(τ) и Sx(ω), а также известным динамическим характери-
стикам объекта с помощью соотношений (4.83) и (4.84) можно найти характеристики слу-
чайной функции на выходе системы (задача анализа). Эти соотношения в принципе по-
зволяют также выбрать параметры динамической системы таким образом, чтобы миними-
зировать влияние случайных воздействий на функционирование систем (задача синтеза
оптимальной системы).
Рассмотрим два важных случая прохождения случайного сигнала через линейную систе-
му.
1. Статистическое дифференцирование. При поступлении случайного сигнала на вход
дифференцирующего звена с частотной функцией W(jω) = jω имеем
Sy(ω) = ω2 Sx(ω).
В случае двойного дифференцирования Sx(ω) умножается на ω4 и т.д. Таким образом, вы-
сокочастотные составляющие, содержащиеся в случайном сигнале, в данном случае уси-
ливаются значительно сильнее, чем низкочастотные. Это всегда нужно иметь в виду при
вводе в систему корректирующего дифференцирующего звена. В случае существенного
уровня высокочастотных помех ввод этого звена может не привести к улучшению дина-
мических свойств системы, а, наоборот, даже ухудшить их.
2. Статистическое интегрирование. При поступлении сигнала на вход интегрирующего
звена с частотной функцией W(jω) = 1/jω спектральная плотность сигнала на его выходе
463
S y (ω) = S x (ω) / ω2 .
Так как при τ = 0 корреляционная функция случайного сигнала равна его дисперсии, т.е.
RΔ(0) = DΔ , то в соответствии с (4.85) можно записать
∞
1
2π −∫∞
DΔ = S Δ (ω) dω . (4.86)
− W0 ( jω )W y ( jω )
W fΔ ( jω ) = .
1 + W0 ( jω )W y ( jω )
464
∞
1 ⎡ W ( jω) 2 S (ω) + W ( jω) 2 S (ω) ⎤ dω .
= ∫
2π − ∞ ⎢⎣
uΔ u fΔ f ⎥⎦
В случае, если y (t) и f(t) коррелированы, то можно показать, что подынтегральное выра-
жение в формуле для σ 2Δ примет вид
2 2
S Δ (ω ) = WuΔ ( jω ) S u (ω ) + W fΔ ( jω ) S f (ω ) +
где Suf (ω) и S fu (ω) – взаимные спектральные плотности управляющего u(t) и возмущающего f(t)
сигналов.
Достижения цели (4.89) можно добиться, определив либо оптимальные параметры систе-
мы при заданной ее структуре (параметрический синтез), либо не только параметры, но и
структуру системы (структурно-параметрический синтез).
Параметрический синтез системы. В этом случае обычно принимают следующий поря-
док расчета:
1. По экспериментально снятым реализациям u (t ) и f (t ) определяют корреляционные
функции полезного сигнала и помехи Ru(τ) и Rf (τ), а затем, с помощью преобразования
Фурье, находят соответствующие спектральные плотности. В частности,
∞
∫ Ru (τ) e
− jωτ
Su (ω) = dτ
−∞
или, учитывая, что Ru(τ) четная функция, а e-jωτ = cos ωτ – jsinωτ, получим
∞
S u (ω) = ∫ Ru (τ) cos ωτdτ .
−∞
∂DΔ = 0,
∂α j
465
6. Подставив значения найденных параметров в выражение DΔ (α1 ,..., α i ,..., α n ) , получают
минимальное значение дисперсии DΔ min и средней квадратической ошибки σ Δ min = DΔ min .
Если σΔ min ≤ σΔ доп, то задача синтеза решена. Если это условие не выполняется, то следует
изменить структуру управляющего устройства, т.е. решить задачу структурно-
параметрического синтеза.
Пример 4.12. Система слежения за движущейся целью, работает по функциональной схе-
ме, представленной на рис.4.20. В случае отклонения цели от линии визирования возрас-
тает рассогласование θ = θ1 – θ2, которое подается на вход усилителя У и далее через
фильтр Ф на тахометрический привод ТП. Последний разворачивает визир В с датчиком
(фотоэлемент, локатор) до совпадения с направлением на цель.
Тахометрический привод состоит из усилителя У1, двигателя Д, редуктора Р и тахогенера-
тора ТГ с передаточными функциями соответственно Wy1 (p) = ky, Wд(p) = kд /(Тд + 1),
Wр(p) = kр /р и Wтг(p) = kтг. Передаточная
функция этого привода имеет вид
k у kр kд
Wтп ( p) = W3 ( p) =
p(Tp + 1) + pk у kд k тг
.
При достаточно сильной обратной связи
по скорости двигателя (kу → ∞) можно
записать
kp k3
W3 ( p) ≈ = ,
k тг р р
где k 3 = k p / k тг .
Передаточные функции усилителя У и фильтра Ф можно представить в виде
W1(p) = k1 и W2(p) = k2 /(Т2р + 1) соответственно.
Определим значение коэффициента усиления системы, при котором минимизиру-
ется ошибка слежения в соответствии с (4.89). Все остальные параметры системы заданы.
Решение. Найдем статистические характеристики входных сигналов θ(t) и ϕ(t), необходи-
мые для решения задачи, из следующих соображений. Пусть цель движется со скоростью,
изменяющейся по случайному закону (рис.4.21). Подобный сигнал иногда называют типо-
вым входным сигналом следящей системы. 3десь Ω – угловая скорость движения цели,
которая сохраняет постоянное значение в течение некоторых интервалов времени ti. За-
метим, что рассматриваемый сигнал Ω (t) соответствует кусочно-линейной аппроксима-
t
ции кривой θ1 (t ) = ∫ Ω(t )dt . Корреляционная функция подобного сигнала при заданных ма-
0
466
Рис.4.21
одном интервале равна p1, а в разных интерва-лах p 2 = 1 − p1 , то
R(τ) = p1R1(τ) + p2R2(τ) = p1R1(τ).
В соответствии с законом распределения Пуассона вероятность отсутствия перемены зна-
ка скорости (к = 0) на интервале τ
(λτ ) k − λτ
p1 = P(k ) = е k =0 = е − λτ ,
k!
где λ – среднее число перемен знака скорости в единицу времени; λ = 1/T; T = M [ti ] .
Следовательно,
τ
−
R(τ) = p1 R1 (τ) = DΩ е T .
Воспользовавшись преобразованием Фурье, имеем
∞ τ
− 2ТDΩ
S Ω (ω) = ∫ DΩ е T е − jωτ dτ =
1 + Т 2 ω2
.
−∞
Однако так как рассматриваемая система является астатической, то она инвариантна к ве-
личине возмущения и имеет ошибки только по скорости и более высоким производным,
относительно которых процесс стационарен. Это позволяет использовать полученную
спектральную плотность при расчете динамической ошибки системы.
В качестве помехи рассмотрим шумовое напряжение датчика со средним квадратическим от-
клонением M [ϕ2] = Dϕ в полосе частот Δfφ = 2fc, где fc – частота среза. Спектральная плот-
ность в этой полосе соответствует помехе типа белого шума Sϕ(ω) = N. Величину N можно
найти из соотношения
ω fc
1 с
2π −∫ωс
Dϕ = Ndω = ∫ Ndf = N 2 f c ,
− fc
откуда N = Dϕ / Δf ϕ .
Считая, что полезный сигнал θ1(t) и помеха ϕ (t) не коррелированы, спектральная плот-
ность ошибки в соответствии с (4.88)
2
S θ1 (ω) W ( jω)
S θ (ω) = + S ϕ (ω) = S θθ1 (ω) + S θϕ (ω) , (4.90)
1 + W ( jω)
2
1 + W ( jω)
Sθθ1 (ω ) =
[
2TDΩ − T22 ( jω ) 2 + 1 ] .
2
TT2 ( jω ) 3 + (T + T2 )( jω ) 2 + (1 + kT ) jω + k
Проинтегрировав Sθθ1(ω) по всем частотам, найдем дисперсию ошибки, вызванную полез-
ным сигналом:
1 ∞
Dθθ1 = ∫ S θθ (ω)dω = 2TDΩ I 3 ,
2π − ∞ 1
∞
1 G ( jω )
где I3 – интеграл вида I n =
2π ∫ A( jω )
−∞
2
dω ; A(jω) = a0(jω)n + + a1(jω)n-1 + ... + an;
2n – 2 2n – 4
G(jω) = b0(jω) + b1(jω) + ... + bn.
Интегралы In табулированы. В нашем случае при n = 3 имеем
a0 a1b2 a 3−1 − a0b1 + a2b0 T + T2 + kT22
I3 = = ,
2a0 (a1a2 − a0 a3 ) 2k (T + T2 + kT 2 )
где a0 = TT2; a1 = T + T2; a2 = 1 + kT; a3 = k; b0 = 0; b1 = –T22; b2 = 1.
Тогда
TDΩ (T + T2 + kT22 )
Dθθ1 = .
k (T + T2 + kT22 )
Рассмотрим теперь слагаемое Sθφ(ω). После подстановки Sφ(ω) и W(jω) во второе слагае-
мое уравнения (4.90) получим
k 2N
Sθϕ (ω ) = 2
.
T2 ( jω ) 2 + jω + k
a0b1a2−1− b0
где I 2 = ; a0 = T0; a1 = 1; a2 = k; b0 = 0; b1 = 1.
2a0 a1
Тогда
1 kN
Dθϕ = k 2 N = .
2k 2
Из полученной формулы вытекает, что k/2 численно равно эквивалентной полосе пропуска-
ния частот Δfэ при подаче на вход рассматриваемой системы помехи типа белого шума.
Обычно Δfφ > Δfэ, что позволяет производить интегрирование Sθφ(ω) по всем частотам.
Таким образом, суммарная дисперсия ошибки
TDΩ (T + T2 + kT22 ) kN
Dθ = Dθθ1 + Dθϕ = + .
k (T + T2 + kT 2 ) 2
468
Для получения оптимального значения коэффициента усиления необходимо исследовать
полученное выражение на минимум.
Пусть имеем следующие значения параметров: DΏ = 4 град2/с2; T = 5 с; T2 = 0,1 с;
k2 = 34,4; k3 = 0,035 град/(В·с); Δfφ = 500 Гц; σφ = 0,167 град;
Sφ(ω) = N = Dφ /Δfφ = 0,1672 /500 = = 5,6·10-5 град2/Гц. В нашем случае Т >> Т2 , что позво-
ляет пренебречь малыми величинами и записать
DΩ kN
Dθ ≈ Dθ* =
+ .
k2 2
Дифференцируя это выражение по k и приравняв полученный результат нулю, получим
∂Dθ* 2D N
= − 3Ω + = 0 ,
∂k k 2
откуда
4 DΩ 4⋅4
kопт = 3 =3 −3
= 66 c−1 .
N 5, 6 ⋅10
При этом Δfэ = 66/2 = 33 Гц < 500 Гц = Δfϕ .
Значения средней квадратической ошибки по углу, вычисленные по точной и при-
ближенной формулам, соответственно
4 66 ⋅ 5, 6 ⋅10−5
(σθ* ) = Dθ* =
2
+ = 0,0027; σθ = 0,0525°,
662 2
практически совпадают, что свидетельствует о корректности принятых допущений. Учи-
тывая, что коэффициент усиления разомкнутой системы k = k1k2 k3 , найдем оптимальное
значение коэффициента усиления усилителя k1
k опт 66
k1 = = = 55 В/град.
k 2 k 3 34,4 ⋅ 0,035
***
Структурно-параметрический синтез системы (задача оптимальной фильтрации Ви-
нера). В данном случае перед системой ставится задача преобразовать входной сигнал u(t)
так, чтобы на ее выходе воспроизводилась величина y*(t), связанная с u(t) некоторой фор-
мулой преобразования
L{y*(t)} = H(p) L{u(t)}, (4.91)
где L{y*(t)} и L{u(t)} – преобразованные по Лапласу функции y*(t) и u(t); H(p) – оператор
преобразования.
При H(p) = 1/p, например, имеем задачу интегриро- u (t ) y * (t )
вания входного сигнала, при H(p) = p – задачу диф- I H ( p)
pτ Δ (t )
ференцирования, при H(p) = e – задачу упреждения
(предсказания), при H(p) = 1 – задачу воспроизведе- u (t ) + f (t ) = ϕ(t ) y (t )
ния (обычная следящая система). II Wопт ( p)
Постановка задачи поясняется рис.4.22. Здесь
I канал – желаемое преобразование u(t) согласно Рис.4.22
(4.91); II канал – преобразование u(t) оптимальной системой Wопт(jω) при наличии помех
f(t). При этом ошибка системы Δ(t) = y (t) – y*(t) должна удовлетворять цели управления
469
(4.89). Эта задача иногда носит название оптимальной фильтрации входного сигнала φ(t),
т.е. систему можно рассматривать как оптимальный фильтр помех, поступающих на ее
вход.
Прежде чем решать поставленную задачу, найдем связь между корреляционными функ-
циями входного x(t ) и выходного y (t ) сигналов, действующих в линейной динамической
системе. Запишем выражение для взаимной корреляционной функции этих сигналов:
Т
1 *)
R yx (τ) = lim
T →∞ 2T ∫ y (t ) x (t − τ)dt . (4.92)
−Т
Произведем замену переменной θ–η= λ и учтем, что ϕ (t) = u(t) + f(t). Тогда
*)
Заметим, что Ryx (τ ) = Ryx (−τ ) , т.е. взаимная корреляционная функция несимметрична относительно от
ординат.
470
∞
R y*ϕ (θ) = ∫ wопт (η) Rϕ (θ − η) dη . (4.96)
−∞
В этом случае, как показал Винер, реализуемая оптимальная передаточная функция имеет
вид
B ( jω)
Wопт ( jω) = , (4.98)
ψ ( jω)
где
∞
1
∞ S
y *ϕ
(ω)
B ( jω) = ∫ β(t ) e − j ω t dt ; β(t ) = ∫
2π −∞ ψ (− jω)
e j ω t dω .
−∞
1 + c 2 + jωc 1 + c 2 − jω c
Sϕ (ω ) = ψ ( jω )ψ (− jω ) = ⋅
1 + jω 1 − jω
471
и вычислим в соответствии с (4.93):
1
∞ S y*ϕ (ω ) 1
∞
(1 − jω ) e jω t d ω
β (t ) =
2π ∫
−∞
ψ (− jω )
e jω t dω =
2π ∫ (1 + ω
−∞
2
)( 1 + c 2 − jω c)
=
∞
1 e jω t dω
=
2π −∞
∫ (1 + jω )( 1 + c 2 − jω c )
.
1
∞ ⎡ 1 c ⎤
β (t ) =
2π ∫
−∞
⎢ + ⎥ e jω t dω .
⎢⎣ (c + 1 + c ) (1 + jω ) (c + 1 + c )( 1 + c − jω c) ⎥⎦
2 2 2
(4.99)
или
k опт
Wопт ( jω ) = ,
Tопт jω + 1
где
1 c
K опт = ; Tопт = .
2 2
(с + 1 + с ) 1 + с 1 + c2
Таким образом, оптимальный фильтр в данном случае представляет собой апериодическое
звено первого порядка.
***
В заключение заметим, что решение задачи оптимальной фильтрации может быть также
произведено с помощью фильтра Калмана. При этом предполагается, что на вход системы
поступает аддитивная смесь управляющего воздействия u(t), являющегося гауссовским
марковским случайным процессом, и помеха f(t), представляющая собой гауссовский «бе-
лый» шум, не коррелированный с сигналом u(t). Физически реализуемый линейный опе-
ратор замкнутой системы, при котором процесс y(t) на выходе системы является опти-
мальным по критерию минимума средней квадратической ошибки, находится по специ-
ально разработанному алгоритму. Этот алгоритм достаточно громоздок и, в частности,
связан с решением дифференциального уравнения Риккати, для чего, как правило, требу-
ется применять численные методы с использованием компьютерных технологий. В ко-
нечном итоге, алгоритм Калмана дает тот же результат, что и алгоритм Винера, но, в от-
личие от последнего, позволяет синтезировать оптимальные фильтры не только для уста-
новившегося, но и для переходного режимов при нестационарных входных воздействиях.
472
В большинстве случаев проектирование системы управления производится в предположе-
нии, что статические и динамические свойства объекта управления и всех элементов сис-
темы известны, не зависят от изменений внешних условий и постоянны во времени. Одна-
ко в действительности характеристики объекта и некоторых элементов системы бывают
известны лишь приближенно, так как они изменяются в результате физического старения
и под действием внешних условий. Благодаря запасам устойчивости система управления,
спроектированная для определенных расчетных характеристик, может удовлетворительно
управлять объектом и в том случае, когда его фактические характеристики несколько от-
личны от расчетных. Однако если статические и динамические свойства системы изменя-
ются в широком диапазоне, то управление объектом с помощью простейшей системы с
постоянными параметрами и структурой может оказаться неудовлетворительным либо
вообще невозможным вследствие потери устойчивости. Для таких случаев необходимы
системы управления с изменяющимися свойствами.
Процесс изменения свойств системы, позволяющий ей достигнуть наилучшего или, по
крайней мере, удовлетворительного функционирования в изменяющихся условиях, назы-
вается адаптацией. Системы, осуществляющие процесс адаптации, называются адаптив-
ными (самоприспосабливающимися) системами.
Характерным признаком адаптивных систем является отсутствие полной априорной ин-
формации об объекте управления, внешних возмущениях и граничных условиях, т.е. адап-
тивной системе присущ индетерминизм (неопределенность). Функционирование системы
направлено на раскрытие неопределенности, т.е. на нахождение такого состояния, при ко-
тором реализуется цель управления. Раскрытие неопределенности может обеспечиваться
благодаря: избыточности системы, логичности ее действий, прогнозированию ее состояния
и анализу накапливаемой информации с целью самообучения.
Оптимальное, в известном смысле, функционирование адаптивной системы может
рассчитываться на основе информации о состоянии системы. Такие системы называются
аналитическими. Если же оптимальный режим работы определяется в результате поиска
условий экстремума критерия эффективности, то системы называются поисковыми. В
этом случае система как бы ставит серию экспериментов и извлекает из них данные, необ-
ходимые для улучшения своего поведения.
Изменение состояния системы можно производить за счет контролируемых изменений
управляющих воздействий, параметров и структуры системы.
Адаптивные системы классифицируются в зависимости от объема этих изменений на:
• экстремальные – только управляющие воздействия;
• самонастраивающиеся – управляющие воздействия и параметры системы;
• самоорганизующиеся – управляющие воздействия, параметры и структура систе-
мы;
• обучающиеся – управляющие воздействия, параметры и структура системы, алго-
ритм функционирования, а в случае самообучения и целевая функция.
Два последних класса систем, обладающих способностью к обучению и использо-
ванию человеко-машинного интерфейса*) в какой-то мере имитирует поведение человека,
и поэтому часто называются интеллектуальными.
*)
Интерфейс – система связей, предназначенная для обмена информацией между структурами.
473
По способу осуществления контролируемых изменений адаптивные системы под-
разделяются на пассивные, в которых эти изменения осуществляются по заранее разрабо-
танной программе, и активные, в которых контролируемые изменения заранее не опреде-
лены, а диктуются сложившейся ситуацией.
Наконец, как и любые другие автоматические системы, адаптивные системы могут рабо-
тать по замкнутому и разомкнутому циклам. В первом случае производится анализ дей-
ствия контролируемых изменений, а во втором – не производится.
Заметим, что наиболее совершенными являются аналитические активные замкну-
тые обучающиеся системы.
Рис.4.25
пропорционально его количеству G , а с другой – падает за счет ухудшения качества K
n
(рис.4.25). Результирующая кривая QΣ = C1G − C2 K (здесь C1 , C2 – весовые коэффициен-
ты; n – показатель степени) имеет явно выраженный экстремум.
Экстремальные системы можно классифицировать по различным признакам, в частности:
по характеру сигналов ЭСУ подразделяются на непрерывные и дискретные (шаговые); по
числу управляющих воздействий – на одно-, двух- и многоканальные; по способу форми-
рования поискового сигнала – с непосредственным измерением производной, с запомина-
нием экстремума, с внешним поисковым сигналом и др.
Остановимся на принципах построения и функционировании некоторых ЭСУ.
11.1.1. Непрерывные экстремальные системы.
Наиболее широкое применение получили поисковые одноканальные экстремальные
системы, которые используют одно управляющее воздействие. Это, помимо относительной
простоты реализации, позволяет значительно улучшить динамические показатели качества
работы системы, и значительно расширить класс объектов, для которых применение ЭСУ яв-
ляется эффективным.
Достаточной информацией для функционирования таких ЭСУ является знание величины
dQ
или, по крайней мере, знака производной , где Q=f(u), экстремальная статическая ха-
du
рактеристика объекта управления.
В качестве примера рассмотрим систему дизель – генератор (Д – Г), работающую парал-
лельно с энергосистемой. Целью управления этой установкой является максимизация ее
КПД (Q = η → max) в условиях нестабильности зависимости η = f (q) , где q = u – расход
топлива, подаваемого к дизелю. Какой бы ни была функция η = f (q) , экстремальное зна-
dη
чение η будет достигнуто при = 0 . Поэтому для обеспечения цели управления необхо-
dq
димо вычислить текущее значение η и η′q и осуществлять управление так, чтобы величи-
на производной η′q стремилась к нулю.
Возможный вариант функциональной схемы ЭСУ представлен на рис.4.26. Информация о
q входной мощности Pвх , пропорциональной расходу топ-
Д Г
Рг
лива q , и о выходной мощности генератора Pг дает воз-
V
Рвх = ky q можность непрерывно измерять КПД установки
ИМ У η = Pг / Pвх . Дифференцирование величин η и q по вре-
мени с помощью дифференцирующих звеньев (ДЗ) и по-
ДЗq Рг /Рвх следующим делением производных η′t и qt′ дает величи-
η′q
q′ ну, пропорциональную η′q ,
t
η′t / qt′ ДЗη которая подается на ис-
η η η′q =0
η′t
полнительный механизм *
η
Рис.4.26 (ИМ). Последний в соот-
ветствии со знаком и величиной η′q изменяет расход подво-
димого топлива до тех пор, пока не будет достигнуто равен- η′q > 0, η′q < 0,
ство η′q = 0 (рис.4.27). В рассматриваемой системе скорость v>0 v<0
изменения величины q пропорциональна величине η′q , т.е.
u* q
v = qt′ = k иη q′ , (4.100) Рис.4.27
475
где k è – коэффициент передачи исполнительного механизма.
В том случае, если определяется только знак производной η′q , исполнительный механизм
движется в ту или другую сторону с постоянной скоростью v 0 , т.е.
v = ±v 0 = v 0U , (4.101)
где U = sign ϕ = sign{η′q + δsign v } – функция переключения; sign ϕ – единичная функция, знак
которой определяется знаком функции ϕ; δ – зона нечувствительности экстремального
регулятора.
Пример 4.14 В функциональной схеме ЭСУ (рис.4.28) объект управления ОУ можно
представить в виде двух последовательно соединенных звеньев: нелинейного безынерци-
онного звена (НЗ), уравнение которого приближенно можно записать в параболической
форме
Q = −k 0 u 2 , (4.102)
и линейного звена (ЛЗ), дифференциальное уравнение
которого имеет вид:
dθ
T0 +θ=Q, (4.103)
dt
где k 0 и T0 – коэффициент усиления и постоянная вре-
мени объекта управления.
Исполнительный механизм системы ИМ представляет собой интегрирующее звено, опи-
сываемое уравнением
du
= kиv . (4.104)
dt
Экстремальный регулятор ЭР функционирует на основании информации о знаке
производной в соответствии с выражением (4.101).
Определить динамические показатели работы системы.
Решение. Перепишем (4.103) с учетом (4.102) в виде
dθ du
T0 + θ = −k 0 u 2 .
du dt
Тогда с учетом (4.104) и (4.101) имеем
dθ
± T0 k и v 0 + θ = −k 0u 2 .
du
1 K0
Обозначив = a; = b , получим
T0 K и v 0 T0 K и v 0
dθ
± aθ = mbu 2 . (4.105)
du
Заметим, что полученное уравнение представляет собой уравнение фазовой траектории в
координатах u , θ .
Общее решение уравнения вида (4.105) при v = +v 0 ищется в виде
θ = e ∫ ⎡⎢ ∫ ( −bu 2 ) e ∫ du + C ⎤⎥ ,
− adu adu
⎣ ⎦
где С – постоянная интегрирования.
476
После двойного интегрирования по частям выражения, стоящего в квадратных скобках,
получим, уравнение фазовой траектории θ (u ) в явном виде.
b 2b 2b
θ = C e − au − u 2 + 2 u − 3 , (4.106)
a a a
где С определяется из начальных условий u (0) = u 0 и θ(0) = θ0 :
⎛ b 2b 2b ⎞
C = ⎜ θ 0 + u 02 − 2 u 0 + 3 ⎟ e au0 . (4.107)
⎝ a a a ⎠
В соответствии с (4.106) на рис.4.29 построена фазовая траектория, характеризующая
движение системы на фазовой плоскости с координатами θ, u . После пересечения фазовой
траекторией θ (u ) , обозначенной на рис.4.29
пунктирными линиями, статической характери-
стики Q(u ) координата θ начинает уменьшаться
dθ
и, следовательно, знак производной станет
du
отрицательным. При θ′u > δ sign v (точка u01 , θ01 )
функция переключения U = sign {Qu′ + δ signv}
меняет свой знак на противоположный и экстре-
мальный регулятор в соответствии с (4.101) подает команду на реверс исполнительного ме-
ханизма. Уравнение фазовой траектории сохраняет тот же вид, но так как в данном случае
v0 < 0 , то коэффициенты a и b в уравнениях (4.106) и (4.107) меняют свой знак, а в уравне-
ние (4.107), кроме того, вместо θ0 и u0 следует подставить θ 01 и u01 . В точке u02 , θ02 снова
произойдет реверс и так далее. Предельный цикл, показанный на рис.4.29 сплошными ли-
ниями, характеризует установившиеся симметричные автоколебания в системе.
Имея фазовую траекторию и предельный цикл, можно определить качественные показа-
тели работы системы, к которым относятся потери на поиск*), время выхода в зону экс-
тремума и параметры автоколебаний. В последнем случае помимо периода автоколебаний
Ta определяется размах колебаний как управляющего воздействия Δи (зона поиска на вхо-
де), так и показателя качества Δθ (зона поиска на выходе). Из рис.4.29 видно, что
Δu = u1 + u2 и Δθ = θ 2 − θ1 . Так как скорость исполнительного механизма в соответствии
с уравнением (4.104) равна k u v , где v = ±v0 , то период автоколебаний можно найти по
формуле:
Δu
Ta = .
kиv 0
Потери на поиск P определяются как разность между экстремальным Q* (в нашем случае
Q* = 0 ) и средним Qср значениями критерия на выходе объекта и характеризуют точность
работы ЭСУ. Так как автоколебания симметричны, то величина потерь P = 0,5( θ1 + θ 2 ) .
Время выхода в зону экстремума Tв определится как сумма времен, за которые система
проходит определенные участки фазовой тра-
ектории:
N
u + u0i +1
Tв = ∑ Δti ; Δti = 0i ,
i =1 kи v 0
*)
Иногда потери на поиск, обусловленные автоколебаниями в зоне экстремума, называют потерями на рыска-
ние.
477
где N – количество участков фазовой траектории до выхода на предельный цикл.
Заметим, что аналогичные результаты можно получить, определяя поведение выходной
координаты во времени. Учитывая, что в соответствии с (4.104) un = ± kиv 0t + u0 , и под-
ставляя это выражение в (4.106), получим зависимость θ(t ) , которая также позволяет ус-
тановить качественные показатели работы системы (рис.4.30).
478
пример, по алгоритму (4.108). При этом на каждом шаге квантования Δt импульсный эле-
мент ИЭ подает импульсный сигнал на вход исполнительного механизма ИМ, который
изменяет управление на величину Δu в ту или иную сторону. Изменение координат Q(t) и
u(t) безинерцонной ЭСУ, работающей в соответствии с алгоритмом (4.108), показано на
рис.4.32.
479
Решение. Введем новую переменную θ=θ1 - θ*, где θ* - величина промежуточной пере-
менной θ, при которой достигается экстремум критерия эффективности Q . Эта величина
∂Q(u, t )
определяется из выражения = a1 + 2a 2θ * = 0 , откуда
∂θ
a
θ* = − 1 . (4.110)
2a 2
Подставив (4.110) в (4.109), окончательно получим
Q = b0 + b2θ 2 , (4.111)
2
a
где b0 = a0 − 1 ; b2 = a2.
4a 2
Найдем зависимость θ(t) за время Δt = t n − t n−1 , где tn, tn-1 – текущее время в конце и начале
n-го шага соответственно.
Пусть в конце (n-1)-го шага координаты объекта управления равны: u = un-1, θ = θn-1 (рис
4.34). В течение времени запаздывания τ зависимость θ(t) определяется из уравнения
Tθ& + θ = u n −1 . (4.112)
Решение (4.112) при ненулевых начальных условиях θ(0)= θn-1 имеет вид
⎛ −t
⎞ −t
θ (t ) = u n −1 ⎜⎜ 1 − e T ⎟ + θ n −1 e T
⎟ (4.113)
⎝ ⎠
Подставив в (4.113) t=τ можем записать
−τ
⎛ ⎞
θ (τ ) = θ n −1 + ( un −1 − θ n −1 ) ⎜1 − e T ⎟ = θ n −1 + Δθ nI ,
⎝ ⎠
где Δθ n - приращение координаты θ за время τ
I
(рис.4.34)
Аналогичным образом определяется зависимость
θ(t) для промежутка времени (Δt − τ ) :
⎧⎪ ⎛ −t
⎞⎫
θ (t ) = (θ n−1 + Δθ I
n ) [ (
+ ⎨ u n − θ n −1 + Δθ nI )] ⎜1 − e T ⎟⎪⎬ ,
⎜ ⎟⎪
⎪⎩ ⎝ ⎠⎭
(4.114)
где u n = u n−1 + Δu
Приращение координаты θ за время t = (Δt − τ ) оп-
ределяется вторым слагаемым правой части урав-
нения (4.114) и обозначено на рис.4.34 Δθ nII .
Полученные соотношения позволяют построить
кривую переходного процесса в системе и опреде-
лить потери на поиск.
Пусть параметры объекта управления имеют следующие значения T=300c, τ =420с;
b0=2,2; b2= –0,05. Параметры экстремального регулятора выбираются из следующих сооб-
ражений. Величина шага квантования по уровню управляющего воздействия Δu принима-
ется из условий надежного измерения приращения критерия ΔQ при допустимых потерях
на поиск. Например, при Δu=1,5 минимальное изменение критерия Q в зоне экстремума
при статическом режиме (Δu=Δθ и Q*=b0) составит ΔQ=Q*-Q(Δu)=0.11, что удовлетворя-
ет требованиям сформулированным выше. Шаг квантования по времени Δt выбирается
исходя из обеспечения устойчивости движения системы в области экстремума, для чего
480
должно выполняться неравенство Δt > τ . Для обеспечения надежного изменения выход-
ной координаты θ шаг квантования определяется по формуле:
Δt = τ + cT ,
где с – коэффициент, обычно с=1÷2. Положив с= 1,5, получим Δt= 420+1,5⋅300=870с.
Зона нечувствительности экстремального регулятора δ зависит от характеристик техниче-
ских средств, реализующих регулятор, и в нашем случае принимается равной 0,05.
Воспользовавшись соотношениями (4.110), (4.111), (4.113), и (4.114) можно построить
зависимость u(t) и Q(t) (рис.4.35) , характеризующую процесс выхода системы в зону экс-
тремума при заданных начальных условиях u(0)=-12.8. При этом, как видно из рис.4.35,
время выхода в зону экстремума (до первого отрицательного приращения критерия ΔQ за
время Δt) составляет Тв= 7.8⋅103 с.
Потери на поиск Р в
зоне экстремума
(режим
481
1. Метод Гаусса-Зайделя, или метод покоординатного восхождения (спуска), заключается
в последовательном приближении к экстремуму путем поочередного варьирования каж-
дого управляющего воздействия до тех пор, пока не будет достигнут экстремум критерия
Q. Характерная особенность метода – необходимость стабилизации всех входных пере-
менных, кроме варьируемого. Процесс поиска экстремума по методу Гаусса-Зайделя в
случае зависимости критерия Q от двух управляющих воздействий иллюстрируется рис.
4.36 (траектория 1). Функция Q = f (u1 , u 2 ) представлена здесь линиями равных значений
критерия Q = const . Движение, параллельное осям координат, происходит до тех пор пока
не будет достигнут частный экстремум, при котором
u2
∂Q / ∂u i = 0 . Это условие выполняется в точке каса- O3
3
Q j+1 < Q
ния прямой, параллельной оси координат, с одной из j
482
на знака ΔQi свидетельствует о прохождении частного экстремума критерия эффек-
тивности по выбранному управлению и необходимости смены варьируемого управления.
Далее процедура повторяется до достижения зоны экстремума.
При поиске экстремума функции Q (u1 , u 2 ) с помощью метода градиента градиент этой
функции должен определяться на каждом шаге квантования факторов Δu . Это требует
определения, хотя бы в первом приближении, зависимости Q = f (u1 , u 2 ) например, в виде
линейного полинома: Q = b0 + b1u1 + b2 u 2 . При этом, коэффициенты b1 и b2 являются со-
ставляющими градиента, определяющими направление движения.
При применении метода Бокса - Уилсона процесс поиска отличается от описанного выше
тем, что движение изображающей точки в направлении вектора градиента O3 O4 про-
должается вплоть до смены знака приращения критерия Q . Затем определяется новое
направление движения, и процесс повторяется до выхода в зону экстремума.
При практической реализации классические методы поиска экстремума, рассмотренные
выше, претерпели существенные изменения.
Одним из специальных методов является симплекс-метод*). Напомним, что под симплек-
сом понимают простейший выпуклый многогранник в k-мерном пространстве. Правиль-
ным k-мерным симплексом называется многогранник, у которого все вершины находятся
на одинаковом расстоянии от центра, а длина всех ребер одинакова. В двухмерном про-
странстве симплекс это равносторонний треугольник. Рассмотрим применение симплекс-
метода при поиске экстремума в объекте с двумя управляющими воздействиями u1 и u 2
(рис. 4.37). Пусть точка А - исходная точка поиска. Делаются пробные движения с таким
расчетом, чтобы проекция симплекса на плоскость u1Ou 2 образовала правильный тре-
угольник аbс. В каждой вершине треугольника измеряются значения экстремального па-
раметра, которые затем сравниваются между собой. Пусть, например Qa < Qc < Qb . В
этом случае на стороне треугольника bс, противоположной вершине а, строится новый
треугольник а'bс при помощи только одного шага, сделанного по направлению перпенди-
куляра, опущенного из точки а на сторону bc. Далее снова происходит сравнение значе-
ний Q . Если Qc < Qb < Qa , то происходит движение по направлению к с' и т.д. По своей
идее этот метод близок к методу градиента, но не требует вычисления производной в каж-
дой точке траектории, что значительно уменьшает время поиска. Для уменьшения ампли-
туды автоколебаний вокруг экстремальной точки можно уменьшить величину шага при
приближении к точке экстремума.
Все рассмотренные методы поиска экстремума относятся к классу детерминированных.
При сложной зависимости критерия эффективности от управляющих воздействий («овра-
ги», «гребни», «ямы» и т.п.) поиск глобального экстремума этими методами может быть
затруднен. Плодотворными оказываются случайные методы поиска, основанные на алго-
ритмах, в которых порядок вычисления частных производных случаен.
К случайным методам поиска можно отнести ал-
горитм перебора всех возможных значений
управляющих воздействий (метод сканирова-
ния), когда каждое последующее положение ра-
бочей точки выбирается случайно. Все положе-
ния, в которых система уже побывала, исключа-
ются из рассмотрения, и запоминаются только
управляющие воздействия, соответствующие
наилучшему значению критерия Q. К основным
*)
Заметим, что этот метод разработан и теоретически применен для решения задач линейного программирова-
ния. Его обобщения допустимы при возможности корректной линеаризации целевой функции и (или) учета ограниче-
ний, налагаемых на переменные
483
недостаткам этого метода относится возможность возникновения аварийной ситуации, а
также большая длительность поиска. Например, для r управляющих воздействий с m
уровнями квантования существуют m r возможных состояний. Для ряда случаев число
этих состояний, а, следовательно, и время поиска весьма велики.
Несколько совершеннее метод чисто случайного поиска, впервые нашедший свое прило-
жение в гомеостате Эшби, устройство которого рассмотрено ниже. Система из начального
состояния совершает случайное пробное движение, направление которого равновероятно
с любым другим. В запоминающем устройстве хранится значение критерия Q, соответст-
вующее начальному состоянию системы. Далее производится сравнение критерия в новом
положении с исходным. Если случайное перемещение привело к успеху (в смысле при-
ближения к экстремуму), то осуществляется рабочий шаг в том же направлении и случай-
ный поиск производится из нового положения. Если положение ухудшилось, то пробное
движение начинают снова из исходного положения. Для увеличения быстродействия сис-
темы применяется сочетание метода случайного поиска с методом крутого восхождения.
При этом из исходной точки совершают не одно, а несколько случайных пробных движе-
ний, по которым находят приближенное значение градиента. Затем осуществляется дви-
жение в направлении градиента до изменения знака приращения и вновь производится
несколько случайных пробных движений, вычисляется новое значение градиента и т.д.
до выхода в зону экстремума.
Заметим, что методы случайного поиска особенно эффективны для многоканальных (три
и более управлений) ЭСУ.
484
ройства управления без учета связи между параметрами управляющего устройства и
внешними и внутренними изменениями системы составляют так называемую задачу пер-
вичной оптимизации. В результате решения этой задачи определяется оптимальная или
идеальная модель системы (структура и параметры идеального управляющего устройст-
ва). Примерами решения таких задач могут служить задачи синтеза оптимальных систем,
рассмотренные в предыдущей главе.
Контур самонастройки включает в
себя элементы основного контура (в
частности, звено объекта управления
I, динамические характеристики ко-
торого подвержены заранее непред-
сказуемым изменениям) и корректи-
рующее вычислительное устройство
(КУ), вырабатывающее управляю-
щее воздействие uс (t ) в виде изме-
нения параметров устройства управ-
ления (УУ) или введения дополни-
тельного воздействия u (t ) в цепь ос-
новного контура. Управление uс (t )
вырабатывается на основе имею-
щейся априорной и текущей инфор-
мации о внешних и внутренних условиях работы системы, критерия эффективности, опре-
деляющего цель управления, и критерия самонастройки, характеризующего отклонение
действительных характеристик системы от заданных.
Корректирующее устройство может состоять из следующих функциональных элементов:
анализаторов внешних и внутренних условий 1 и 2, определяющих соответственно текущие
характеристики внешних воздействий f 0 (t ) и изменяемой части системы, и вычислителей 3
и 4. Первый вычислитель решает задачу первичной оптимизации, второй – вырабатывает
управляющие воздействия в контуре самонастройки.
Работа КУ организована следующим образом. Вычислитель 3 по выбранному критерию
эффективности, заданным ограничениям и информации, поступающей на его вход от ана-
лизаторов 1 и 2, определяет оптимальные динамические характеристики системы и вы-
бранные для их количественного описания параметры и управления. Оптимальные значе-
ния параметров сравниваются с текущими их значениями, которые выдает анализатор 2.
Получаемые при этом сигналы рассогласования, характеризующие отклонения действи-
тельных характеристик системы от оптимальных, поступают в вычислитель 4, вырабаты-
вающий управляющий сигнал uс (t ) , который воздействует на УУ, стремясь изменить ди-
намические характеристики основного контура так, чтобы они, с точки зрения принятого
критерия самонастройки, незначительно отличались от оптимальных. Тут решается так
называемая задача вторичной оптимизации. Если действительные характеристики не от-
личаются от оптимальных, сигналы рассогласования равны нулю и контролируемые из-
менения в системе не производятся.
Таким образом, в аналитической СНС (рис.4.38) контур самонастройки вырабатывает
управляющее воздействие uс (t ) в зависимости от внешних и внутренних условий работы
системы.
Некоторые СНС используют информацию только о внешних воздействиях (рис.4.39). В
этом случае анализатор 2 отсутствует и настройка производится по разомкнутому циклу.
В процессе работы под влиянием внешних воздействий свойства объекта изменяются, в
связи с чем его передаточная функция W0 ( p ) бу-
дет отличаться от исходной W0u ( p) . Если СНС 4 1 f (t)
предназначена для стабилизации динамических u с (t) КУ
u (t) y(t)
УУ ОУ
485
Рис.4.39
свойств системы, то должно выполняться условие
Wy ( p)W0 ( p)
W ( p) = = const , (4.115)
1 + Wy ( p)W0 ( p)
где W ( p) – передаточная функция замкнутой системы; Wy ( p ) – передаточная функция
управляющего устройства.
Для выполнения условия (4.115) необходимо, чтобы
Wy ( p )W0 ( p ) = Wyu ( p )W0u ( p ) .
Тогда
Wyu ( p )W0u ( p )
Wy ( p ) = . (4.116)
W0 ( p )
Условие (4.116) выполняется приближенно, поскольку задача получения полной инфор-
мации о возмущающих воздействиях и определения их влияния на параметры объекта в
полном объеме практически решена быть не может. Подобные системы применяются в
некоторых автопилотах, учитывающих изменение таких внешних воздействий, как давле-
ние и температура окружающего воздуха, скорость и КУ
4 2
направление ветра и др.
f (t)
Примером системы, самонастраивающейся по дина- uс(t)
мическим характеристикам объекта, может служить u (t)
УУ
y(t)
М ОМ ОУ
СНС (рис.4.40), в которой управляющее устройство,
включенное в основной контур системы, представляет
собой последовательное соединение желаемой модели
прямой цепи (М) и обратной модели объекта управле- Рис.4.40
ния (ОМ) с передаточными функциями WM ( p ) и WOM ( p) . Задача цепей самонастройки со-
стоит в том, чтобы, вычислив текущие динамические характеристики объекта (анализатор
2), найти и затем ввести в управляющее устройство параметры обратной модели (вычис-
литель 4). При этом передаточная функция прямой цепи основного контура
W ( p) = WM ( p )WOM ( p)W0 ( p ) ,
Рис.4.43
ны нулю ( grad Q = 0 ). Если это не так, то значение bi должно изменяться до тех пор, пока
∂Q
условие = 0 не будет выполнено. В простейшем случае уравнение, определяющее из-
∂bi
менение настраиваемого параметра во времени, может быть записано в виде
dbi ∂Q(bi , t )
=k , (4.120)
dt ∂bi
Wy ( p )W0 ( p)
W ( p) = . (4.121)
1 + Wy ( p)W0 ( p)
Тогда
y (t ) = L−1{W ( p)U ( p)} . (4.122)
Имея в виду, что Wy ( p), y (t ) и ε(t ) зависят также от величин настраиваемых параметров
bi , и учтя (4.119), найдем
∂y (bi , t ) ⎧ ∂W ( p, bi ) ⎫
= L−1 ⎨ U ( p)⎬ . (4.124)
∂bi ⎩ ∂bi ⎭
Воспользовавшись (4.121), получим
∂W ( p, bi ) W0 ( p ) ∂W y ( p, bi )
Wb′i ( p, bi ) = = . (4.125)
∂bi [1 + W y ( p, bi )W0 ( p )]2
∂bi
488
При наличии в системе существенных случайных помех f (t ) для нахождения экстремума
целевой функции Q применяют помехозащищенные алгоритмы поиска, в частности, ал-
горитм стохастической аппроксимации. При этом термин аппроксимация означает, что
параметры bi находят приближенно. Как и в методе градиента, условием экстремума це-
левой функции Q будет grad Q(bi ) = 0 , но так как Q(bi ) определяется в обстановке помех,
то значению bi = bi* должно соответствовать условие M {grad Q} = 0 , где M – математиче-
ское ожидание.
Идея этого метода может быть проиллюстрирована на простейшем примере вычисления
какой-либо величины z с помощью реального прибора, имеющего погрешность. Пусть z*
– истинное значение измеряемой величины, zi – последовательность измеренных значений
величины z , fi – ошибка измерения (аддитивная помеха). Тогда zi = z* + fi и задача стохас-
[ ]
тической аппроксимации формулируется в виде M z − z * = 0 . Известно, что наилучшим
1 n
приближением к величине z * является среднее арифметическое n измерений: zn* = ∑ zi .
n i =1
Перепишем это выражение в виде
n − 1 ⎛ 1 n −1 ⎞ 1 n −1 * 1
z n* = ⎜ ∑ zi ⎟ + z n =
n ⎝ n − 1 i =1 ⎠ n n
z n −1 + z n ,
n
(4.127)
где zn = zn* + f n .
Из (4.127) видно, что предыдущая оценка измеряемой величины zn* −1 входит в оценку zn* с
весом (n − 1) / n , а новое измеренное значение zn имеет вес 1 / n , т.е. с ростом числа измере-
ний влияние новой информации уменьшается. Это основная идея, которой руководству-
ются при работе системы в условиях помех: чем больше накоплено данных, тем меньшие
изменения в окончательный результат должны вносить новые измерения. С учетом ска-
занного уравнение, определяющее скорость изменения настраиваемого параметра, можно
записать в виде
dbi ⎡ ∂Q(bi , t ) ⎤
= k (t ) ⎢ + f (t )⎥ . (4.128)
dt ⎣ ∂bi ⎦
Выражение (4.128) носит название алгоритма стохастической аппроксимации и отличает-
ся от детерминированного градиентного алгоритма (4.120) только тем, что коэффициент
k должен быть убывающей функцией времени (например, k (t ) = 1 / t при t ≥ 1 ). Это приво-
дит к тому, что с течением времени, т.е. с приближением к точке экстремума, скорость
изменения параметра bi уменьшается даже при наличии существенного уровня помех.
Можно показать, что при t → ∞ алгоритм (4.128) с вероятностью p = 1 обеспечивает дви-
жение bi к bi* . Для контроля дрейфа статической характеристики Q(bi ) после достижения
экстремума производят непрерывное (или дискретное) измерение частных производных
∂Q
, естественно, с помехами. При существенном их значении, превышающем зону не-
∂bi
чувствительности, вновь начинается поиск экстремума функции Q(bi ) и т.д.
489
нимают установление соответствия распознаваемого предмета (объекта) своему образу
(математическому описанию). Совершенным средством получения уравнений статики яв-
ляются экспериментальные методы, основанные на обработке опытных данных (напри-
мер, по методу наименьших квадратов), собранных непосредственно на действующем
объекте. Динамические свойства линейного объекта, описываемые временными или час-
тотными характеристиками, определяются также по экспериментальным данным.
Принципиально наиболее простой является идентификация объекта, основанная на физи-
ческой сущности частотного метода. Известно, что при подаче на вход линейного объ-
екта гармонических воздействий, представленных рядом
n
x(t ) = ∑ Bк sin кω t , (4.129)
к =1
на выходе формируется сигнал y (t ) , который можно представить аналогичным рядом
n
y (t ) = ∑ Bк A(кω ) sin[кω t − ϕ (кω )] . (4.130)
к =1
490
альный анализ полученных временных характеристик обычно позволяет в первом приближении
найти форму записи дифференциального уравнения объекта. Например, наличие колебательной
составляющей во временной функции свидетельствует о том, что характеристическое уравнение
имеет, по крайней мере, два комплексных корня, а если после окончания переходного процесса
скорость изменения выходной величины отлична от нуля, то объект обладает интегрирующими
свойствами.
Весовая функция w(t ) в принципе может быть найдена и при произвольных сигналах на
входе и выходе объекта. Тогда задача сводится к решению интегрального уравнения вида (4.131).
Однако при наличии шумов это выражение малопригодно для определения функции веса, так как
основанные на нем методы вычисления w(t ) не удовлетворяют условиям помехоустойчивости.
Действительно, пусть к объекту приложено не только входное воздействие x(t ) , но и по-
меха f (t ) . Тогда, воспользовавшись (4.131) и используя принцип суперпозиции, имеем
t t
y (t ) = ∫ x(t − θ ) w x (θ )dθ + ∫ f (t − θ ) w f (θ )dθ . (4.132)
0 0
*)
Величину Δ обычно выбирают исходя из теоремы Котельникова, согласно которой всякая непрерывная
функция с частотным спектром, ограниченным значением ω макс , может быть восстановлена по ее дискретным значе-
ниям, взятым через интервал аргумента, равный Δ = π / ω max
491
Определение весовой функции значительно упрощается, если на вход объекта подать ис-
кусственный сигнал типа белого шума, корреляционная функция которого имеет вид
R x (τ ) = Nδ (τ ) . Подставив это выражение в уравнение (4.133), запишем
∞
R yx (τ ) = ∫ Nδ (τ − θ ) w(θ )dθ = Nw(τ ) .
0
Из приведенного соотношения следует, что при подаче на вход объекта сигнала типа бело-
го шума функция веса w(t ) с точностью до постоянного множителя совпадает со взаимной корре-
ляционной функцией R yx (τ ) .
Если корреляционные функции заданы в виде аналитических выражений, то можно вос-
пользоваться соотношением (4.94)
S yx (ω ) = W ( jω ) S x (ω ) . (4.135)
∞
Здесь S yx (ω ) = ∫R
−∞
yx (τ )e − jωτ dτ – взаимная спектральная плотность между выходным и
∞
∫ w(t )e
− jωτ
входным сигналами; W ( jω ) = dt – частотная характеристика объекта;
−∞
∞
S x (ω ) = ∫R
−∞
x (τ )e − jωτ dτ – спектральная плотность входного сигнала.
P (ω ) =
[
Re S yx (ω ) ]; Q(ω ) =
[
Im S yx (ω ) ].
S x (ω ) S x (ω )
Из всех рассмотренных методов идентификации объектов исследования наиболее распро-
страненными в силу простоты реализации являются методы определения временных характери-
стик h(t ) и w(t ) . Однако, когда активное вмешательство (подача импульсного и единичного
входного сигнала) в ход процесса невозможно или недопустимо, привлекают статистические ме-
тоды, базирующиеся на решении интегрального уравнения (4.133). При этом необходимой и дос-
таточной информацией для определения весовой функции объекта w(t ) является знание корреля-
ционных функций R x (τ ) и R yx (τ ) .
Остановимся еще на одном вопросе. Оптимизация динамического состояния системы при
полной идентификации объекта неизбежно приводит к затягиванию процесса самонастройки. По-
этому для повышения быстродействия стремятся использовать частичную информацию, которая,
несмотря на свою неполноту, дает достаточное представление об изменении динамики системы.
Методы определения таких частичных характеристик получили название методов косвенной
идентификации. Известны, например, методы косвенной оценки коэффициента демпфирования ξ
через частоту колебаний ω . В частности для затухающих колебательных процессов можно ис-
1
пользовать зависимость ω = 1 − ξ 2 , причем частоту ω можно подсчитывать через число пе-
T
ремен знака весовой функции за определенный постоянный интервал времени Δt (рис. 4.44). Ин-
тервал Δt подбирается так, чтобы при заданном значении коэффициента демпфирования ξ в него
укладывался бы один период колебаний, что соответствует двум переменам знака весовой функ-
ции.
Уменьшение или увеличение числа перемен знака приводит в действие управляющее уст-
ройство, которое подстраивает те или иные параметры системы (обычно коэффициент усиления)
таким образом, чтобы восстановить две перемены знака за время Δt .
492
Более эффективным с точки зрения быстродействия является способ оценки ξ с помощью
подсчета числа переходов через уровни Δy выходного сигнала y (t ) за заданный интервал време-
ни Δt1 (рис. 4.44).
В качестве косвенной оценки динамических свойств системы может также служить вели-
чина амплитуды автоколебаний на выходе системы, зависящая от коэффициента усиления ра-
зомкнутой системы. Отклонение амплитуды от заданного значения служит сигналом рассогласо-
вания, который обрабатывается системой.
Как уже упоминалось во многих случаях, для нормального функционирования самона-
страивающихся систем необходимо знание характеристики внешних воздействий. Так
как эти воздействия, поступающие на вход системы, обычно являются заранее непредска-
зуемыми функциями времени, то для возможности самонастройки в таких условиях необ-
ходимо выполнение условия квазистационарности характеристик воздействия, т. е. эти
характеристики должны изменяться незначительно за время, необходимое для их вычис-
ления.
Анализ характеристик внешних воздействий обычно производится на основе одного из
двух предположений.
1. Это воздействие может рассматриваться как заданная аналитическим выражением
функция времени. Например, если внешнее воздействие x(t ) аппроксимируется полино-
мом m-го порядка вида
m
x(t ) = ∑ ai t n ,
n =1
то в системе должны быть предусмотрены устройства автоматического определения ко-
эффициентов полинома ai . Обычно эти коэффициенты подбираются по методу наимень-
ших квадратов.
2. Внешнее воздействие является случайной функцией времени с определенными стати-
стическими характеристиками: корреляционной функцией, спектральной плотностью и
др., которые в подавляющем большинстве случаев находятся путем обработке экспери-
ментально полученных реализаций, в частности, по методике рассмотренными в примерах
4.9 и 4.12.
В заключение подчеркнем, что знание текущих статических и динамических свойств объ-
екта управления позволяет внести необходимые коррективы в эталонную модель и более
обоснованно решать задачи первичной и вторичной оптимизации.
493
11.3 ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ
К интеллектуальным системам относятся системы, способные к «пониманию» пове-
дения объектов управления, работающих в изменяющихся условиях. Главным отличитель-
ным признаком интеллектуальных систем является использование современных информа-
ционных технологий для получения, хранения и системной обработки знаний с целью реа-
лизации своих функций при управлении сложными объектами. Характерными особенно-
стями сложных объектов управления, в частности, являются: отсутствие математической
модели, связывающей входные и выходные переменные объекта; нестационарность, стохас-
тичность и распределенность параметров.
Интеллектуальные системы управления (ИСУ) технологическими объектами долж-
ны обладать, помимо способности к обучению и адаптации, умением эффективно функцио-
нировать в составе человеко-машинных систем с гибкой структурой и иметь высокую ус-
тойчивость к повреждениям и неполадкам, т. е. обладать так называемой живучестью. В
известной мере к этим системам можно отнести самонастраивающиеся системы, корректи-
рующие устройства которых можно рассматривать как структуру, выполняющую роль
«учителя» управляющего устройства, включенного в основной контур (рис. 4.38). Ещё с
большей уверенностью к интеллектуальным системам можно отнести самоорганизующиеся
и обучающие системы, обладающие большой изменчивостью основных характеристик. Рас-
смотрим принципы построения этих систем.
11.3.1. Самоорганизующиеся системы
По своей первоначальной структуре самоорганизующаяся система может представ-
лять набор элементов, связанных случайным образом. В дальнейшем при внешних возмуще-
ниях в них образуются устойчивые отрицательные и положительные обратные связи, подобно
тому, как в природе происходит приспособление живых организмов к различным внешним ус-
ловиям.
Классическим примером технического устройства, имитирующего адаптационные
свойства живых организмов, служит гомеостат Эшби. Он представляет собой совокуп-
ность четырех одинаковых блоков Б1 – Б4 (рис.4.45), каждый из которых содержит под-
вижный электромагнит, поворачивающийся под действием токов, протекающих по его
четырем обмоткам. Угол поворота каждого из электромагнитов от некоторого нулевого
положения является выходной координатой z i соответствующего блока. На магнитах же-
стко закреплены указательные стрелки, которые одновременно являются движками по-
тенциометров, что позволяет преобразовывать механические перемещения магнитов в
электрический сигнал. Каждый из полученных электрических сигналов передается на об-
мотки остальных трех магнитов через потенциометры с коэффициентами передачи aij так,
что передаваемый сигнал может изменяться по величине и по знаку. Кроме того, каждый
блок имеет цепь собственной обратной связи, коэффициент передачи aii которой также
может меняться по величине и знаку. Таким образом, гомеостат характеризуется наличи-
ем всех возможных связей между блоками. Поведение а11 а22
такой системы можно представить уравнениями:
а21
z&1 = a11 z1 + a12 z 2 + a13 z 3 + a14 z 4 ; Б1
а12
Б2
z& 2 = a 21 z1 + a 22 z 2 + a 23 z 3 + a 24 z 4 ;
а24 а31
z&3 = a31 z1 + a32 z 2 + a33 z 3 + a34 z 4 ; а41 а32
а14 а23
а13 а42
z& 4 = a 41 z1 + a 42 z 2 + a 43 z 3 + a 44 z 4 .
Б4 а43 Б3
а34
494
а44 а33
Рис.4.45
Здесь коэффициенты aij определяют долю выходного сигнала j-го блока, передаваемого на
вход i-го блока, причем aij ≤ 1 .
Цель работы гомеостата заключается в автоматическом поиске устойчивого со-
стояния, т.е. такого положения подвижных электромагнитов, при котором ни одна из свя-
занных с ним стрелок не достигает крайнего положения. При нарушении устойчивости по
любой причине (изменение параметров системы и даже обрыв какой-нибудь цепи) вклю-
чается устройство управления, которое изменяет коэффициенты передачи aij до тех пор,
пока не будет найдена такая их комбинация, при которой ни одна из подвижных систем не
будет достигать своих крайних положений. Заметим, что при aij = 0 изменяется также
структура системы.
Гомеостат Эшби имеет ряд принципиальных особенностей, которые существенно
отличают его от других систем. В первую очередь, следует отметить избыточность струк-
туры гомеостата, достигаемую за счет того, что каждый из настраиваемых коэффициентов
aij может принимать несколько значений и общее количество всех возможных комбина-
ций коэффициентов достигает четырёхсот тысяч. Исследования гомеостатических систем,
проведенные Эшби, позволили ему сформулировать так называемый закон необходимого
разнообразия, который гласит, что разнообразие состояний управляющей системы должно
быть не меньше разнообразия состояний управляемого объекта. Иными словами, размер-
ность множества состояний объекта должна быть меньше размерности множества состоя-
ний устройства управления. Только в этом случае самоорганизация системы может при-
вести к желаемому результату. Закон необходимого разнообразия указывает общую тен-
денцию решения задачи так же, как, например, утверждение, что сложные задачи просто
не решаются или сложные объекты требуют сложного управления и т.п.
Другая важная особенность гомеостата состоит в случайном характере поиска ус-
тойчивого состояния. Скачкообразное изменение автоматически настраиваемых коэффи-
циентов aij осуществляется до тех пор, пока не будет достигнута устойчивость рассмат-
риваемой системы. Случайный поиск придает гомеостату важнейшее свойство – способ-
ность целенаправленно добиваться нужного результата при отсутствии априорной инфор-
мации о свойствах системы и условиях ее работы. Поскольку целью в данном случае яв-
ляется отыскание устойчивых состояний, то свойство целенаправленного поведения сис-
темы назвали ультраустойчивостью.
Экспериментальные исследования, проведенные на моделях, подтвердили универ-
сальность и исключительно высокую надежность (живучесть) гомеостатических систем.
Например, гомеостат Эшби находил устойчивое состояние и при различных дополнитель-
ных условиях, не предусмотренных при его конструировании. В частности, устойчивое
состояние было найдено при жестком соединении двух подвижных магнитов друг с дру-
гом, т.е. при изменении первоначальной структуры системы.
Гомеостатические системы были применены для автоматизации процессов конст-
руирования автоматических систем управления. Как правило, часть структуры и парамет-
ров проектируемой системы строго детерминирована и не подлежит изменению (напри-
мер, характеристика объекта управления, исполнительного двигателя и т.п.). Поэтому за-
дача проектировщика сводится к синтезу стабилизирующих и корректирующих уст-
ройств, которые в совокупности с детерминированной частью системы должны обеспе-
чить заданные статические и динамические свойства. Задача определения передаточной
функции стабилизирующих и корректирующих звеньев может быть решена компьютер-
ным методом с помощью гомеостатической системы, автоматически подбирающей пара-
метры этих звеньев в соответствии с поставленными требованиями.
495
Пример 4.17. Определить передаточную функцию Wk ( p) корректирующего уст-
ройства, предназначенного для подавления автоколебаний в релейной системе, структур-
ная схема которой представлена на рис.4.46. Передаточные функции отдельных звеньев
системы заданы:
k1 k2 k3
W1 ( p ) = ; W2 ( p ) = ; W3 ( p ) = ,
T1 p + 1 T2 p + 1 T3 p + 1
496
людей, технические устройства и их комплексы, природные компоненты и т.п., и с разным
качеством связей: прямые, обратные, положительные, отрицательные, жесткие, гибкие и
др.
Обучение решению задач может осуществляться двумя существенно различными
методами. Первый состоит в сообщении обучаемому алгоритма решения задачи. Можно
считать, что человек, определяя структуру автомата или разрабатывая программу для
управляющей машины, обучает ее решению задачи указанным методом. К задачам этого
типа можно отнести задачи, например, отыскания наиболее эффективного алгоритма по-
иска экстремума показателя качества посредством перебора ряда заранее заданных алго-
ритмов и выбора того из них, который при данной ситуации дает максимальный эффект.
Этот метод бесполезен для задач, которые мы умеем решать интуитивно, хотя алго-
ритм решения нам неизвестен. Например, мы можем отличать женское лицо от мужского,
буквы, написанные разным почерком, и т.п. В этом случае эффективен второй метод, кото-
рый основан на обучении с помощью примеров. Типичным представителем систем, обу-
чающихся этим методом, являются системы распознавания образов. Заметим, что, усвоив
некоторое ограниченное число распознаваемых объектов, обучающаяся система приобрета-
ет способность правильно распознавать и новые объекты того же класса.
Рассмотрим некоторые принципы построения систем распознавания образов. На-
блюдаемую в данный момент ситуацию будем называть объектом. Группа различных объ-
ектов, характеризуемая определенной совокупностью признаков, свойственных объектам
только данной группы, называется образом. Так, если к признакам, по которым устанав-
ливается образ, отнесены черты человеческого лица, то образом для группы лиц может
быть женское или мужское лицо, лицо ребенка или взрослого, русского или грузина, но,
например, не образ группы лиц, живущих в данном доме.
Признаки, по которым устанавливается образ, называются информативными. По-
мимо информативных, любой объект имеет множество других признаков, не существен-
ных для опознания образа. Так, для выделения мужского лица не информативны цвет во-
лос, глаз и т.д., но для выделения лица блондинов, брюнетов и т.д. эти признаки информа-
тивны. Одна из основных трудностей при распознавании образов состоит в том, что очень
часто информативные признаки не могут быть полно и точно описаны на математическом,
логическом или каком-либо другом подобном языке, хотя известно, что они существуют,
так как наблюдатель достаточно уверенно и с малой вероятностью ошибки их обнаружи-
вает.
Распознавание образов при обучении показом основано на преобразовании данных
наблюдения над объектами в совокупности чисел и на обработке этих чисел по специаль-
ным алгоритмам. Для этих операций полезным оказывается понятие метрического про-
странства. Каждому признаку (не только информативному) можно приписать некоторое
число, не совпадающее с числами, приписанными другим признакам. Тогда всей совокуп-
ности N признаков объекта будет соответствовать совокупность чисел, которые можно
рассматривать как координаты некоторой точки в N-мерном пространстве признаков. Та-
497
ким образом, каждый объект в данном пространстве отображается точкой, а образ – сово-
купностью точек, обладающих общими информативными признаками. Если удалось вы-
полнить отображение признаков в пространстве так, что различным образам соответству-
ют непересекающиеся области, внутри которых точки расположены достаточно близко
друг к другу, и между этими областями могут быть проведены разделяющие их гиперпло-
скости, то решение задачи распознавания образа облегчается.
К сожалению, проблема построения пространств признаков, в которых гипотеза
разделимости образов поверхностями оказывается справедливой, не имеет общего реше-
ния. Во многих же задачах образы взаимно проникают друг в друга, делая невозможным
построение гиперповерхности. Но тем не менее на основе гипотезы разделимости удалось
построить алгоритмы для опознания букв, цифр и других символов.
Рассмотрим один из известных алгоритмов распознавания – пандемониум. Это од-
на из первых машин, построенных для распознавания образов. Согласно упрощенной схе-
ме пандемониума (рис.4.48), образ Ai характеризуется совокупностью величин
x = ( x1 , ..., x N ) в пространстве
х1 y1
признаков Х, воспринимае-
Д1 ВУ1 k1 мых системой датчиков Д
(рецепторов). Области, со-
ответствующие двум образ-
хi ам, могут оказаться разде-
yi
Дi ВУi ki S ленными сложной поверх-
Σ РБ ностью (рис.4.49, а), что за-
трудняет построение алго-
хN ритма распознавания. По-
yN этому предварительно
ДN ВУN kN
с помощью вычислитель-
k0
ных устройств ВУi ( i = 1, N )
производят построение
УУ
спрямляющего пространст-
Рис.4.48 ва Y , на которое отобража-
ется пространство призна-
ков Х. С этой целью вычислительные устройства вырабатывают некоторые функции со-
стояния датчиков yi = f i ( x1 , x2 , ... , x N ) , причем функции f i выбираются так, чтобы множе-
ство точек yi ∈ Y в пространстве Y , соответствующих одному образу, попало в область B1 ,
а соответствующих другому образу – в область B2 (рис.4.49, б), и между областями B1 и
B2 можно было бы провести разделяющую гиперплоскость
N
S = k0 + ∑ ki yi .
i =1
Если такая гиперплоскость существует и построена, то для любой точки B1 линей-
ная форма S будет иметь один знак, а для области B2 – противоположный. По этому зна-
ку можно судить, к какому из двух классов образов принадлежит показанный объект.
б Функция S образуется
а
путем суммирования выходов
х1 S y1
S усилителей с переменными ко-
А1 эффициентами усиления ki
B1 (рис. 4.48), а затем поступает в
А2
B2 решающий блок РБ, выявляю-
щий знак S и выдающий в со-
хi yi ответствии с этим знаком код
Рис.4.49 образа. Этапу распознавания
498
предшествует этап обучения, который заключается в том, что оператор показывает панде-
мониуму серию образов и контролирует правильность его ответов. Если пандемониум
ошибся, то оператор подает сигнал на управляющее устройство УУ. Число ошибок за не-
который промежуток Т представляет собой некоторую функцию F (k0 , k1 , ..., k N ) . Предпо-
лагается, что эта функция имеет минимум в пространстве K. Так как функция F заранее
неизвестна, то УУ осуществляет поиск ее экстремума, т.е. УУ, по существу, является мно-
гоканальной экстремальной системой.
Заметим, что пандемониум действует, исходя из того, что задача построения про-
странства признаков Х, в котором справедлива гипотеза разделимости образов, решена. На
практике, однако, воспринимаемые рецептором входные величины не вполне соответст-
вуют информативным признакам и, следовательно, не гарантируют выполнения гипотезы
разделимости.
Примером попыток преодоления этой трудности является построение в 1958 г. Ро-
зенблатом классифицирующей машины, названной им перцептрон (лат. – восприятие).
Перцептрон был задуман как модель восприятия изображений системой зрения живого
организма. Подобно тому, как зрительный образ воспринимается по элементам рецепто-
рами сетчатки глаза, в перцептроне восприятие объекта осуществляется группой элемен-
тов S, называемых также рецепторами (рис. 4.50). Каждый из рецепторов может находить-
ся в возбужденном либо невозбужденном состоянии. Для преобразования пространства
рецепторов в перцептрон введена группа ассоциативных элементов А. Так как для по-
строения разделяющих поверхностей требуемый закон преобразования неизвестен, то свя-
зи между рецепторами и А-элементами устанавливаются случайно. Каждый из рецепторов
может быть подключен к данному А-элементу или со знаком плюс (возбуждающая связь)
или со знаком минус (тормозящая связь) или вообще не подключен. А-элемент работает
как сумматор с порогом: он возбуждается, если сумма сигналов, поступающих к нему от
рецепторов, превысит некоторую величину. Выходы А-элементов через усилители У с пе-
ременными коэффициентами λ передаются в сумматор ∑ . Значения λ устанавливаются
в процессе обучения.
Разобьем все рецепторы на две группы – возбуждающую и тормозную в зависимо-
сти от знака связи с А-элементами. Если в первой группе l элементов, а во второй m , то в
некоторый дискретный момент времени n имеем:
l m
σ (n) = ∑ λ1i (n) x1i (n) − ∑ λ 2 j (n) x 2 j (n) = ∑1 −∑2 , (4.136)
i =1 j =1
499
Исследования показали, что возможности перцептрона весьма ограничены. Напри-
мер, при различении прямоугольников вытянутых а горизонтальном и вертикальном на-
правлениях, количество ошибок достигало 6%, при различении произвольно расположен-
ных окружностей и прямоугольников разных размеров – 33%, а при различении прямо-
угольников и эллипсов – 50%. Иными словами, первая задача решалась удовлетворитель-
но, вторая – плохо, а при решении третьей перцептрон практически не работал.
Рассмотренные распознающие устройства – пандемониумы и перцептроны отно-
сятся к классу специализированных систем, которые, вообще говоря, являются малоэф-
фективными. Однако, дальнейшее их развитие привело к созданию так называемых ней-
ронных сетей, которые решают подобные задачи значительно эффективнее.
Поиски эффективных способов обучения систем распознавания образов привели к
разработке целого ряда оригинальных методик, из которых особый интерес представляет
метод потенциальных функций. Здесь
при показе некоторой точки x , принад- F(х1, x2)
лежащей к образу X , компьютер строит II
I
поверхность, соответствующую некото-
рой функции F,
Для всех показанных точек, при-
надлежащих одному образу, строятся та-
кие функции и затем суммируются. В ре-
зультате для каждого из образов получа- х1
Образ 1 Образ 2
ют потенциальные поверности, каждая из
которых имеет вершину над областью,
принадлежащей соответствующему обра-
х2
зу. Геометрическая интерпретация по-
Рис.4.51
строения функций при двух признаках x1
и x2 иллюстрируется рис.4.51. При показе новой точки после сравнения значений ее по-
тенциальных функций, определяемых поверхностями I и II, точку относят к тому образу,
для которого значения потенциальной функции оказались большими. Заметим, что метод
потенциальных функций, предложенный в 60-х годах прошлого столетия, по существу яв-
ляется предшественником нечеткой логики, основные положения которой рассмотрены в
следующей главе.
Из изложенного выше следует, что распознавание образов представляет собой пер-
вую и важную ступень обработки информации, получаемой нами при помощи органов
чувств и приборов. Вначале мы распознаем предметы, затем – отношения между предме-
500
тами, а также между предметами и нами, т. е. ситуации. Наконец, мы распознаем измене-
ния этих ситуаций, т. е. явления. Именно это дает возможность обнаружить закономерно-
сти и прогнозировать на их основе дальнейший ход явлений и их развитие, что сущест-
венно облегчает задачу управления сложными системами.
*
По аналогии с функционированием живых организмов возник и термин «генетическое программирова-
ние», под которым понимают методику создания компьютерных программ для задач, алгоритм решения
которых априори неизвестен, например, для задачи нахождения глобального экстремума функции несколь-
ких переменных, к которой сводятся многие задачи синтеза АСУ.
501
Заметим, что нейроны входного слоя сети (синапсы), служащие лишь для размножения
сигналов, при определении числа слоев не учитываются.
Чтобы нейронная сеть могла решить поставленную задачу ее необходимо предварительно
обучить. Сущность обучения состоит в настройке весовых коэффициентов нейронов при
показе примеров из обучающей выборки. Эффективность использования нейронных сетей
устанавливается так называемыми теоремами о полноте, смысл которых сводится к тому,
что любая непрерывная функция на замкнутом неограниченном множестве может быть
приближенно выражена функциями, полученным нейронными сетями. Таким образом НС
являются универсальными аппроксиматорами.
Основным алгоритмом обучения
многослойных перцептронов
(МСП), используемых в системах
управления, является алгоритм об-
ратного распространения. При
этом НС обучается воспроизво-
дить зависимость, заданную набо-
( )
ром из N пар точек xi , yi ; i = 1, N ,
с минимизацией средней квадра-
тической ошибки:
σ 2 = ∑ ( yi − y pi )2
N
i =1
(4.139)
где y pi - выход НС при поступле-
нии на ее вход xi ( i = 1, N ), рас-
считанный в соответствии с при-
нятой активационной функцией нейрона, например, вида (4.138), при а = γ i .
Наиболее распространенным алгоритмом обучения, является алгоритм, реализующий гра-
диентный метод поиска минимума выражения (4.139). При этом оптимизируемыми пере-
менными являются весовые коэффициенты γ ijk – i-ый коэффициент j -го нейрона в k -ом
слое. Помимо градиентного метода разработан ряд более эффективных, в смысле быстро-
действия, алгоритмов поиска экстремума функции (4.139). Однако, все они предназначены
для поиска локального экстремума, в связи с чем, для увеличения вероятности нахожде-
ния глобального экстремума необходимо проводить обучение несколько раз с разными
начальными весами нейронов или пользоваться специальными алгоритмами, предназна-
ченными для решения задач глобальной оптимизации.
Кроме многослойных перцептронов в системах управления находят применение двух-
слойные радиальные нейронные сети (РНС), представляющие собой двухслойную ней-
ронную сеть. Первый слой этой сети состоит из так называемых радиальных нейронов,
описываемых соотношением:
⎛ x −cj ⎞
z j = ϕ⎜ ⎟, (4.140)
⎜ bj ⎟
⎝ ⎠
где z j - выходной сигнал j -го нейрона; x - входной сигнал сети, подаваемых на каждый
нейрон рассматриваемого слоя; b j , c j - постоянные параметры, которые могут настраи-
ваться в процессе обучения.
Часто в качестве функции (4.140) используется функция Гаусса.
s2
−
ϕ ( s) = e 2
. (4.141)
502
Второй слой РНС осуществляет преобразование выходных сигналов. В частности, если
выходной сигнал сети скалярная величина, то этот слой состоит из одного нейрона, осу-
ществляющего вычисление средневзвешенного значения выходных сигналов первого слоя
n N
zi = ∑ γ j z j ∑z j , (4.142)
i =1 i =1
503
ОУ, так и для обучения управляющей НС.
2. Параллельная схема нейросетевого управления приведена на рис.4.57 (сплошные ли-
нии). В данном случае НС исполняет роль корректора выходного сигнала управляющего
устройства u y . При этом на вход ОУ подается скорректированный сигнал u = u y + u HC .
Обучение НС может производиться по схеме с обратной связью (рис.4.57, пунктирная ли-
ния). После завершения обу-
чения нейронная сеть прини-
мает участие в управлении
объектом вплоть до нового
цикла обучения.
3. Схема нейросетевого
управления с обратной связью
представлена на рис.4.58.
Здесь нейронная сеть выпол-
няет функцию управляющего
устройства в замкнутой сис-
теме. Достоинством этой системы является способность обес-
печивать высокое качество управления при нестационарности
ОУ.
Для обучения НС, функционирующих в замкнутых системах
могут быть применены системы с эмулятором.
Пример 4.18. Пусть объект управления представляет собой технологический аппарат,
производящий разделение исходного продукта на отдельные компоненты, различаемые по
определенному признаку. В частности, для разделения угольной мелочи на низкозольные
(концентрат) и высокозольные (отходы) конечные продукты обычно используется флота-
ционная машина, на вход которой поступает угольная пульпа*), характеризующаяся сле-
дующими контролируемыми переменными: производительностью Qп , концентрацией
твердого компонента Сп , зольностью исходного угля Aиd . Разделение угольных частиц на
концентрат и отходы происходит благодаря свойству одних частиц (концентрата) прили-
пать к воздушным пузырькам и всплывать на поверхность, а других (отходов) – оставать-
ся в воде. Этот процесс и называется флотацией. (англ. всплытие), на ход которого ре-
шающее влияние оказывают реагенты вспениватель и собиратель., добавляемые в пульпу.
Меняя расходы этих реагентов ( qв , qc ) можно управлять процессом разделения исходного
угля на концентрат и отходы. В качестве выходных переменных, характеризующих ко-
нечные продукты разделения. Обычно принимается зольность концентрата Aкd и отходов
Aоd .
Помимо перечисленных входных переменных ( Qп , Сп , Aиd ) на разделительный процесс
существенное влияние оказывает целый ряд параметров (например, фракционный и гра-
нулометрический составы исходного угля), учесть которые не представляется возмож-
ным. Это обуславливает индетерминизм объекта и делает создание достаточно точной его
математической модели. Практически неразрешимой задачей. Именно в этом случае эф-
фективно применение нейросетевых систем управления, например, использующих эмуля-
тор для выполнения имитационного моделирования объекта управления (рис.4.56). При
этом адекватность модели устанавливается по реализациям входных x(t ) и выходных
y (t ) переменных процесса. Реализуем имитационную модель объекта с помощью допол-
нительной нейронной сети (НСэ), используя данные промышленного эксперимента.
*)
Жидкость (вода) с находящимися в ней во взвешенном состоянии твердыми частицами (мелким углем разме-
ром до 0,5 мм).
504
Решение. Так как теоретическое обоснование выбора необходимых и достаточных
свойств нейронной сети при решении задачи управления конкретным объектом пока от-
сутствуют, что практически единственной возможностью получения результата является
испытание различных сетей и сравнения результатов моделирования. В ходе проведения
вычислительных экспериментов было исследовано около ста тысяч различных вариантов
конфигурации сети. В результате установлено, что наиболее точная модель получается
при реализации эмулятора трехслойной сетью с 5 входами ( Qп , Сп , Aиd , qв , qc ). При этом
количество перцептронов в первом слое равно восьми, во втором – пяти, в третьем – од-
ному. Каждый перцептрон реализует скалярную функцию векторного аргумента вида
(4.137) с функцией активации вида (1.138). Структурная схема сети приведена на рис.
4.59.
Рис. 4.59
Для обучения нейронной сети эмулятора (выбора значений весовых коэффициентов γ i ,
i = 1,5 ) лучшим оказался градиентный метод, использующий алгоритм обратного распро-
странения ошибки. В качестве последней была принята ошибка имеющихся эксперимен-
тальных данных.
Адекватность модели оценивалась параметрами регресии, определяющими наклон α и
смещение β линии регрессии в координатах эксперимент xэ - модель xм ( xм = α xэ + β ), а
также тесноту линейной связи, характеризуемую коэффициентом корреляции r . При точ-
ном совпадении выходов ( Aкd , Aоd ) эксперимента и модели значения параметров составля-
ют: α = 1 , β = 0 (рис. 4.60, пунктирная линия). В нашем случае были получены следую-
щие расчетные значения параметров регрессии: α = 0,94 , β = 0, 43 , r = 0,97 (рис.4.60,
сплошная линия), что указывает тесную связь выходами модели и объекта.
Таким образом малые изменения выходов объ-
екта адекватно отражаются в выходах нейрон-
ной сети, что яввляется доказательством ее вы-
сокого качества.
***
505
в процессе обучения; 3) отсутствие достаточно полной теоретической базы, позволяющей
обоснованно выбрать тип и структуру НС, что обуславливает необходимость применения
алгоритмов самоорганизации и, следовательно, к дополнительным затратам времени. От-
меченные недостатки в ряде случаев приводят к нежелательному увеличению времени
обучения. В связи с этим разработка компьютерных технологий, повышающих быстро-
действие нейросетевых управляющих устройств является актуальной задачей.
В качестве иллюстрации применения нейронных сетей для целей управления рассмотрим автома-
тическую систему управления ориентированием подвижного промышленного робота в простран-
стве. Подвижный робот используется для выполнения некоторых технологических операций в тех
местах, где по каким-то причинам не могут работать люди (высокие температуры, загазован-
ность, запыленность и т.п.). Робот перемещается на колесах, приводимых в движение электро-
двигателями, и имеет возможность поворачивать в любую сторону и разворачиваться на месте.
Для обеспечения перемещений робота по промышленному помещению он оборудован систе-
мой навигации, построенной на основе распознавания образов различных участков помеще-
ния. На теле робота установлено около двух де-
сятков лазерных датчиков, определяющих рас-
стояние до объектов на пути робота. Датчики
ориентированы в пространстве под углом 15° от-
носительно друг друга, охватывая угол примерно
в 270° относительно передней части робота.
Любое промышленное помещение, в котором
перемещается робот, может быть разделено на
ряд типовых объектов (рис.4.61): коридор (КО),
перекресток (ПР), Т-образный перекресток
(ТПР), левый поворот (ЛП), правый поворот (ПП), тупик (ТП), левый угол (ЛУ), правый
угол (ПУ). Для распознавания образов объектов промышленного помещения в системе нави-
гации робота используется трехслойная нейронная сеть. Первый слой (входной) ивторой
(внутренний) имеют количество нейронов, соответствующее числу датчиков на теле робота.
Третий (выходной) слой имеет число нейронов соответствующее числу образов, которые дол-
жен распознавать робот ( в нашем случае восемь).
Согласно схеме системы навигации робота (рис.4.62) сигналы с лазерных датчиков, ха-
рактеризующие расстояния до ближайших объектов, нормируются и подаются на входной
слой нейронной сети. Далее сигналы проходят по слоям сети, преобразуясь в соответствии
с функциями переключения нейронов. В результате на нейронах выходного слоя появляет-
ся некоторая комбинация сигналов, которая расшифровывается декодером, принимающим
решение об опознании полученного образа
того или иного объекта.
Описанная нейронная сеть обучается при по-
мощи специальных тестов, во время которых
производится сравнение выдаваемых нейрона-
ми комбинаций сигналов с требуемыми для
правильного распознавания образов. После того
как количество получаемых ошибок сводится к
минимуму, нейронная сеть готова к работе в со-
ставе системы навигации робота.
Центральная система управления робота,
имеющая задание на произведение каких-
либо действий в той или иной части промыш-
ленного помещения, на основании информа-
ции о местонахождении робота, получаемой
от системы навигации, принимает решение о
направлении движения и подает управляющие сигналы на электродвигатели колес робота.
506
В результате обеспечивается возможность перемещения робота по производственному по-
мещению без участия оператора, который только дает роботу задание на выполнение тех
или иных операций.
507
внутреннего содержания самого суждения. Функциональные построения, связанные с четкими
логическими операциями над суждениями, служат предметом булевой алгебры, базовыми логиче-
скими операциями которой являются:
1. Отрицание – это суждение С, которое истинно тогда и только тогда, когда посылка А
508
⎧1, ∀ х ∈ М
μМ ( х ) = ⎨ (4.144)
⎩0, ∀ х ∉ М .
Если под переменной x понимать, например, температуру воздуха, а под множеством М
отрицательные числа, то единичная ступенчатая функция будет характеризовать четкое множест-
во отрицательных температур М, которое условно можно назвать «мороз» и графически изобра-
зить в виде зависимости μ1 ( x) (рис.4.63).
Нечеткое множество, в отличие от четкого, ха-
рактеризуется непрерывной функцией принад-
лежности μ 2 ( x) , которая может принимать лю-
бые промежуточные значения от 0 до 1, отобра-
жая все значения базисного множества Х в этом
интервале и устанавливая каждому значению х
степень его принадлежности к нечеткому множе-
ству М, которое в общем случае может быть за-
писано в виде:
М = {[х, μ М ( х )] х ∈ Х }.
Для рассматриваемого случая множество М можно представить как нечеткое множество
температур в пределах [− 5, 5], которое можно назвать размытым термином «холод».
Функции принадлежности, характеризующие нечеткие множества, могут быть заданы
аналитически или графически и чаще всего носят нелинейный характер, но на практике
аппроксимируется кусочно-линейными зависимостями, основные из которых представле-
ны на рис.4.64.
Последняя функция принадлежности, описывающая четкое множество содержащее всего
одну пару: {х1 , μ М ( х1 )} , где μ М ( х1 ) = 1 , называется синглтоном.
509
12.2.2. Основные операции с нечеткими лингвистическими переменными
Для определения логических операций с лингвистическими переменными может быть ис-
пользована таблица истинности, описывающая операции над четкими логическими пере-
менными (табл. 4.1). Анализ данных этой таблицы позволяет записать следующие соот-
ношения для базовых четких логических операций и их схемные аналоги (рис.4.66).
1. Отрицание А = 1 − μ А ; μ А = {0, 1}. Здесь лампа Л
тухнет при включении реле размыкании контакта
А (рис.4.66,а).
б)
2. Конъюнкция А ∧ В = min{μ A , μ В } . Здесь лампа за-
горается при включении двух реле ( μ А = μ В = 1 ) и
одновременном замыкании двух контактов А и В в)
(рис.4.66,б).
3. Дизъюнкция, А ∨ В = max{μ A , μ B } . Здесь лампа
загорается при включении одного из двух реле или обоих вместе ( μ А = 1, μ В = 0 ;
μ А = 0, μ В = 1 , μ А = μ В = 1 ) и соответственно замыкания контакта А или В или
обоих вместе (рис.4.66,в).
По аналогии с рассмотренными четкими логическими операциями для нечеткой логики
можем записать:
1. Нечеткое отрицание (фази-дополнение) терма А в виде:
μ А ( х ) = 1 − μ А ( х ), х ∈ Х . (4.145)
Функции принадлежности термов А и
А могут иметь вид, представленный
на рис.4.67 сплошной и пунктирной
линиями соответственно.
2. Нечеткую конъюнкцию (фа-
зи-пересечение) двух лингвистиче-
ских термов А и В, заданных функ-
циями принадлежности μ А ( х ) и μ В ( х )
(рис.4.68), в виде нечеткого терма С, функция принадлежности которого определяется вы-
ражением:
510
μС ( х ) = μ А∧ В ( х ) = min {μ А ( х ) , μ В ( х )} , х ∈ Х . (4.146)
Заметим, что понятие нечетких операций может быть распространено и на случай не-
скольких исходных лингвистических термов.
Главной операцией нечеткой логики является процедура нечеткого вывода с помощью
которой из нечетких условий получают приближенное решение. Эта процедура основана
на операции импликации, используемой в четкой логике (табл.4.1) и образующей сложное
высказывание из двух высказываний посредством логической связки, соответствующей
союзу «ЕСЛИ …, ТО …». Из таблицы истинности вытекает, что А → В = А ∨ В . Учтя,
что А = 1 − А , получим: А → В = (1 − А) ∨ В .
Полученные выражения можно применить и для нечетких множеств, но при этом они
должны быть записаны в виде функций принадлежности: μ А→ В ( х ) = {[1 − μ A ( x )] ∨ μ B (x )} . Из
выражения (4.146) следует, что операция дизъюнкции соответствует правилу максимиза-
ции и, следовательно, имеем:
μ А→ В ( х ) = max{[1 − μ A (x )] ; μ B ( x )}. (4.148)
Из таблицы истинности 4.1 также вытекает, что если посылка А и сама импликация
А → В истинны, то и вывод В истинен. Эта логическая связь выражается с помощью пра-
вила замены, позволяющего перейти от истинной посылки А и истинного высказывания:
«ЕСЛИ…, ТО…» к истинному значению вывода В. При этом А рассматривается как малая
посылка, а высказывание А → В («ЕСЛИ А, ТО В») как большая.
Таким образом, логическая функция, описывающая правило замены, может быть пред-
ставлена в виде:
В = А ∧ ( А → В) = А ∧ ( А ∨ В) . (4.149)
Заметим, что функция истинности выражения (4.149) совпадает с четкой логической
конъюнкцией: А ∧ В (табл.4.1).
Пример 4.19. Пусть имеем следующие высказывания: А : ( х > 4 ) и В : ( х > 2 ) , где х – це-
лые, положительные нечетные числа. Найти значения х, при котором выход В истинен.
Решение. Объединим приведенные выражения их истинной импликацией:
«ЕСЛИ х > 4, ТО х > 2 ».
Используя выражение (4.149), можно убедиться в том, что для х =1 и х =3 истинность вы-
вода В : ( х > 2 ) равна нулю (то есть В ложно, так как ложно А), а для х ≥ 5 - единице (то
511
есть В истинно, так как А и А → В – истинны). Таким образом, правило замены (4.149)
устанавливает истинность вывода В лишь в случае истинности посылки А и импликации
( А → В ) . Поэтому, умозаключение, полученное с помощью правила (4.149) является бо-
лее осторожным, чем простая импликация А → В . В этом можно убедиться, сравнивая
функции истинности импликации ( А → В ) и конъюнкции ( А ∧ В ) (табл.4.1) и учтя, что
функции истинности конъюнкции и правила замены совпадают.
***
Изложенное выше позволяет сформулировать следующее правило четкого логического
вывода: функция истинности вывода В равна максимальному значению функции истин-
ности конъюнкции посылки А и импликации ( А → В ) . Тогда, учтя, что операция конъ-
юнкции соответствует правилу минимизации, можем записать:
μ В = max{μ А∧ А→ В } = max{min[μ А , μ А→ В ]}. (4.150)
А А
Распространение алгоритма логического четкого вывода (4.150), полученного для выска-
зывания А → В , на нечеткие множества сталкивается с определенными трудностями.
Сложность формализации словесного правила «ЕСЛИ …, ТО …» применительно к нечет-
ким множествам заключается в том, что множества А и В, фигурирующие в импликации,
определены для большинства случаев на разных базисных множествах. Например, в зада-
чах управления подмножество больших значений управляемой величины А может при-
надлежать базисному множеству Y всех значений этой величины, а подмножество малых
значений управляющего воздействия В – базисному множеству U всех значений этих
воздействий (Рис.4.70).
512
В общем случае четкое отношение R между четкими множествами А и В может быть запи-
сано так:
{
R = ⎡⎣( y, u ) , μ R ( y, u ) ⎤⎦ y ∈ А, u ∈ В , }
где μ R ( y, u ) = {1, 0} - функция принадлежности пар ( y; u ) ∈ P = A × B к подмножеству R, обра-
зованному по определенному правилу R yu . В нашем случае Ryu = { y ≥ u} .
***
Между четкими множествами могут быть не только четкие, но и нечеткие отношения.
Например, нечеткое отношение (множество) пар реальных чисел ( y, u ) , которые приблизительно
равны между собой, можно представить с помощью следующей непрерывной функции принад-
лежности:
1
μ R ( y, u ) = .
1 + (y − u)
4
μ А (y) μ B (u )
0.5 0.5
y*=y3
y1 y2 y3 y u1 u2 u3 u
Рис.4.71
Решение. Составим декартово произведение P = Y × U , воспользовавшись данными, при-
веденными на рис.4.69.
( y1 u1 ) ( y 2 u1 ) ( y3 u1 )
Р = ( y1 u 2 ) ( y 2 u 2 ) ( y 3 u 2 ) .
( y1 u 3 ) ( y 2 u 3 ) ( y3 u 3 )
Применив оператор Мамдани (4.154) к каждой паре ( y i u i ) множества Р, можно найти
числовые значения μ R ( y, u ) . При этом необходимо учесть, что для конкретного значения
управляемой величины y=y*, оператор (4.154) ограничивает μ В (u ) сверху на уровне
μ А (y * ) . Например, пусть y*=y3. Тогда μ А ( y * ) = 0,5 (рис.4.69) и, следовательно, величина
μ В (u ) будет ограничена сверху величиной 0,5, что соответствует правилу замены
[ В = А ∧ ( А → В)] , то есть истинность вывода В не может превышать истинности посылки
А. В соответствие с изложенным искомая функция принадлежности будет:
μ R ( y * , u ) = 0.25; 0.5; 0.5 .
В общем случае:
0.25 0.25 0.25
μ R ( y, u ) = 0.75 1.0 0 .5 . (4.156)
0 .5 0 .5 0 .5
Если воспользоваться правилом Геделя (4.143), функция принадлежности примет вид:
0.25 0.25 0.25
μ R ( y , u ) = 1 .0 1 .0 1 .0 . (4.157)
0 .5 0 .5 1 .0
Сравнение матриц (4.156) и (4.157) показывает, что в последнем случае размытость ситуа-
ции несколько уменьшается.
514
ей принадлежности μ А ( y ) переходим к нечеткой зависимости μ А ( y * ) и далее к нечеткому
множеству U с функцией принадлежности μ B* (u ) . Функция μ В* (u ) дает возможность най-
ти тем или иным способом конкретное значение управляющего воздействия u*=u, т.е. пе-
рейти от нечеткого множества U к четкому значению u*. Эта процедура называется дефа-
зификацией и может быть выполнена, например, по методу центра тяжести по формуле:
u* =
∫ u ⋅ μВ* ( u ) du . (4.160)
∫ μB* ( u ) du
Процедура определения функции принадлежности нечеткого правила: «ЕСЛИ…, ТО…»,
например, по формуле (4.159), и объединение нескольких таких правил, связанных союзом «ИЛИ»
называется инференц-процедурой и осуществляется согласно фази-объединению (4.147) путем
максимизации функций принадлежности объединяемых правил. Тогда результирующая функция
принадлежности примет вид:
Р j
{ *
j
} j
{
μ В ( u ) = max μ В ( u ) = max min μ A ( y* ) , μ B ( u ) ,
j j
} (4.161)
ТО С = u, μ ВР (u ) »
Решение. Применим инференц-процедуру, воспользовавшись выражением (4.161), т. е.
используя процедуру максимина. На рис.4.73,а, б показаны процедуры минимизации двух
конъюнкций, ограниченных сверху. В результате получены две функции принадлежности
μ А* ∧ В (u ) и μ А* ∧ В (u ) . Для получения результирующей функции принадлежности μ ВР (u )
1 H 2 П
*)
Заметим, что так как функции принадлежности обычно трактуются как вероятности принадлежности лингвистической
переменной к тому или иному терму, то целесообразно, чтобы эти функции для соседних термов удовлетворяли усло-
вию: μ i + μ i +1 = 1 .
515
Рис. 4.73
Пример 4.23. Пусть на вход устройства управления поступает сигнал рассогласования
Δ(t ) = Δ1 и какая-либо его характеристика Δ 2 (скорость, ускорение и т. п.). При этом Δ1 и
Δ 2 (Δ ⊂ A) представлены функциями принадлежности μ A (Δ l ), l = 1, 2 , приведенными на
рис.4.74,а, б. Здесь термы О, Н, П имеют то же содержание, что и в предыдущем примере.
Так как функции принадлежности μ A j (Δ*1 , Δ*2 ) заданы конкретными числовыми значения-
ми (0,4; 0,6; 0,3; 0,6), которые меньше единицы, то операции минимизации соответствуют
усеченные исходные функции принадлежности μ B* (u ) (рис.4.73,а). Таким образом, про-
i
ражением (4.161):
Р j
{
μ В ( u ) = max μ B ( u ) .*
j
}
Например, посылки «ЕСЛИ …» правил 1 и 3 можно объединить союзом «ИЛИ», так как
выводы этих правил аналогичны (u=П). При этом результирующая функция принадлеж-
ности μ BP , найденная путем максимизации функций μ B* и μ B* , представлена на
1 3
нулю.
517
Рис. 4.76
В блоке нормирования фиксированные значения составляющих векторного сигнала
ошибки Δ* = y* − y нормируются умножением на соответствующий масштабный коэф-
фициент: Δ*н = kΔ ⋅ Δ* . Блок фазификации выдает значения функции принадлежности по-
сылок μ A ( Δ*н ) , соответсвующих фиксированным значениям всех составляющих векторно-
го сигнала ошибки Δ* .
Основным блоком устройства управления является блок инференц-процедуры, в котором
вырабатываются нечеткие логические выводы в соответствии с исходными правилами,
сформулированными экспертами с помощью союзов «И», «ИЛИ», т. е. с помощью опера-
ций минимизации и максимизации соответственно. При этом частные посылки объединя-
ются в общую посылку, затем для каждого правила по алгоритму Мамдани определяется
истинность заключения, которая не может быть больше результирующей истинности об-
щей посылки данного правила. В этом же блоке с помощью операции максимизации про-
изводят объединение частных выводов в общий вывод, которому соответствует результи-
рующая функция принадлежности μ ВР ( uн ) .
В блоке дефазификации по методу центра тяжести вычисляется фиксированное значение
нормированного управляющего воздействия uн* , которое затем денормируется путем ум-
ножения его на соответствующий масштабный коэффициент.
Помимо управляющего устройства, реализующего концепцию Мамдани, используются
УУ, реализующие концепцию Сугено. В этом случае конкретные значения управляющего
воздействия u j вычисляются как алгебраические функции входных переменных:
Δ l , l = 0, m .
u j = c0 j + c1 j ⋅ Δ1 + c2 j ⋅ Δ 2 + ...clj ⋅ Δ l + ... + cmj ⋅ Δ m , j = 1, k , (4.162)
где clj - постоянные коэффициенты, устанавливаемые экспертами для вывода каждого j-го
правила, сформулированного не для лингвистических переменных (например О, Н, П), а в
виде полинома (4.162). При этом исключается необходимость дефазификации по методу
центра тяжести, а четкое значение результирующего управляющего воздействия u * , соот-
ветствующее фиксированным значениям Δ*l , вычисляется как средневзвешенная величи-
на:
518
n
∑u
j =1
j ⋅ μ A*
j
u =
*
n
, (4.163)
∑μ
j =1
A*j
где μ A* = μ A (Δ*l ) - значение функции принадлежности всей посылки j-ого правила, соот-
j j
Рис. 4.77
База правил сформулирована следующим образом:
1. ЕСЛИ Δ=ОБ, ТО u1 = c01 = −5 ;
2. ЕСЛИ Δ=ОМ, ТО u2 = c02 = −2.5 ;
1. ЕСЛИ Δ=Н, ТО u3 = c03 = 0 ;
519
2.5 ⋅ 0.8 + 5 ⋅ 0.2
u* = = 3.
0.8 + 0.2
Рис. 4.78
Передаточные свойства фази-регулятора, без динамических составляющих можно описы-
вать с помощью нелинейных статических характеристик. Например, пусть линейный про-
порциональный регулятор с коэффициентом передачи k1 : u (t ) = k1 ⋅ Δ (t ) , можно прибли-
женно заменить в виде следующих пяти правил:
1. ЕСЛИ Δ = ОБ, ТО u = ОБ;
2. ЕСЛИ Δ = ОМ, ТО u = ОМ;
3. ЕСЛИ Δ= Н, ТО u = Н;
(4.165)
4. ЕСЛИ Δ = ПМ, ТО u = ПМ;
5. ЕСЛИ Δ = ПБ, ТО u = ПБ.Рис.
Если предположить, что входная переменная Δ при-
нимает только четкое значение (синглтоны), то базе
правил (4.165), связывающей u и Δ, будет соответ-
ствовать нелинейная статическая характеристика u
= f( Δ ) пятипозиционного реле (рис.4.77, кривая 1).
Если же правила (4.165) реализуются в фазе-
регуляторе с выполнением процедур фазификации,
то статическая характеристика u = f (Δ ) принимает
более плавный вид (рис.4.77, кривая 2). Причем
форма характеристики зависит как от формы и вза-
имного расположения функций принадлежности
520
входной переменной Δ , так и от конкретных методов инференц- процедуры и дефазифи-
кации.
521
Рис. 4.80
Подогрев воды производится водонагревателем ВН, снабженным источником тепла Н (на-
греватель). В смеситель С поступает горячая и холодная вода, температура смеси которой θ
должна поддерживаться на заданном уровне θ* с помощью регулирующего органа З (заслонки),
перемещаемого исполнительным механизмом ИМ. Требуется определить базу правил нечеткой
системы управления температурой воды, на выходе смесителя.
Решение. Примем в качестве входной величины фази-регулятора ФР сигнал рассогласо-
вания Δ = θ * − θ , а в качестве управляющего воздействия u - скорость перемещения за-
dL
слонки . Входную Δ и выход-
dt
ную u величины будем характе-
ризовать функциями принадлеж-
ности μ A (Δ ) , μ B (u ) графики ко-
торых показаны на рис.4.81,а,б.
Обозначения термов на этом ри-
сунке такое же, как и на рис.4.77
(термы «ОС» и «ПС» означают
средние отрицательное и положи-
тельное отклонения соответст-
венно). Количество термов, фор-
ма и взаимное расположение
функций принадлежности опре-
деляется экспертами. В данном
случае для улучшения точности и
динамических показателей систе-
мы плотность расположения
функций принадлежности в сере-
дине диапазона изменений Δ вы-
брана большей, чем по краям.
Стратегию управления объ-
ектом можно сформулировать в ви-
де следующей базы правил.
522
Из-за наличия инерционности объекта в системе управления могут возникать нежелатель-
ные колебания, которые особенно существенны при малых расходах воды q. С целью
демпфирования колебаний можно использовать дополнительный входной сигнал пропор-
циональный q, подав его на вход фази-регулятора. При этом расширенную базу правил
можно представить в виде таблицы 4.3 , где расход q описывается четырьмя термами
(термы ОМ, ОС, ОБ отсутствуют, так как направление потока воды не меняет свой знак),
функции принадлежности которых μ A (q ) представлены на рис.4.81,а (пунктиром).
Таблица 4.3
523
атмосферу цеха, что недопустимо с точки зрения экологии и охраны труда. Избыток газа
сбрасывается через газоход 4 в атмосферу. Таким образом, имеется следующая задача
управления: поддерживать разрежение в газовом тракте конвертера на уровне, исклю-
чающем как чрезмерное разбавление газов подсасываемым воздухом, так и выбивание га-
зов из-под напыльника в помещение цеха.
Количество газов, образующихся в ванне конвертера, определяется расходом воздуха, по-
даваемого в конвертер. Расход дутья V непрерывно измеряется, так же, как и разрежение
в газовом тракте конвертера P.
Сложность управления газовым режимом конвертера заключается в том, что не сущест-
вует технических средств, позволяющих зафиксировать и количественно оценить факт
выброса газов в атмосферу или подсоса воздуха под напыльник. Данные явления могут
быть зафиксированы лишь визуально и описаны лингвистическими оценками типа «силь-
но», «слабо» и т.п.
Указанная проблема может быть решена применением системы нечеткого управления,
позволяющей оперировать экспертными оценками. Характер газоудаления Y можно опи-
сать пятью термами: конвертер сильно выбрасывает газы СГ; конвертер выбрасывает газы
Г; нормальное газоудаление Н; подсос воздуха П; сильный подсос воздуха СП, – ставя им
в соответствие конкретные количественные оценки измеряемых параметров: расхода ду-
тья V и разрежения в газовом тракте P . Будем считать, что режиму нормального газоуда-
ления соответствуют некоторые оптимальные значения ( Vопт и Pопт ). Разбив интервал воз-
можного изменения параметров на пять термов, получим функции принадлежности, пред-
ставленные на рис.4.83.
а б
μ(Р) μ(V)
ОБ ОМ Н ПМ ПБ ОБ ОМ Н ПМ ПБ
«ЕСЛИ V = ПБ И Р =Н
«ЕСЛИ V = ПМ И Р = ОМ
«ЕСЛИ V=Н И Р = ОБ
«ЕСЛИ V = ПБ И Р = ПМ , ТО Y = Г»;
«ЕСЛИ V = ПМ И Р=Н
«ЕСЛИ V=Н И Р = ОМ
«ЕСЛИ V = ОМ И Р = ОБ
«ЕСЛИ V=Н И Р=Н
«ЕСЛИ V = ОБ И Р = ОБ
«ЕСЛИ V = ПБ И Р = ПБ , ТО Y = Н»;
«ЕСЛИ V = ОМ И Р=ОМ
«ЕСЛИ V = ПМ И Р=ПМ
«ЕСЛИ V = ПМ И Р = ПБ
«ЕСЛИ V = Н И Р = ПМ
«ЕСЛИ V = ОМ И Р = Н
524
«ЕСЛИ V = ОБ И Р =ОМ , ТО Y = П»;
«ЕСЛИ V = Н И Р = ПБ
«ЕСЛИ V = ОМ И Р = ПМ
«ЕСЛИ V = ОБ И Р = Н
«ЕСЛИ V = ПБ И Р = ОБ
«ЕСЛИ V = ПБ И Р = ОМ , ТО Y = СГ»;
«ЕСЛИ V = ПМ И Р = ОБ
«ЕСЛИ V = ОБ И Р = ПБ
«ЕСЛИ V = ОМ И Р = ПБ , ТО Y = CП»,
«ЕСЛИ V = ОБ И Р =ПМ
Приведенные правила логического вывода можно представить в виде таблицы базы правил
(табл.4.4).
Таблица 4.4
V * − V−1
μ ОМ (V ) = 1 −
*
;
Vопт − V−1
(4.167)
V − V−1
*
μ Н (V * ) = ,
Vопт − V−1
где V * – измеренное значение параметра.
Выражения, подобные (4.167), записываются для всего диапазона изменения расхода ду-
тья и разрежения в газовом тракте конвертера.
Фазификацию произведем по методологии, изложенной выше. Используя выражение: μi
(V *; Р *) = min {μi (V *); μi (Р *)}, получим пять функций принадлежности для различных оценок
характера газоудаления. Истинной оценкой считаем ту, которой соответствует максимальная
функция принадлежности
μ*(Y) = max{μ (V *; Р *)}.
525
Значение управляющего воздействия определим воспользовавшись алгоритмом Сугено
нулевого порядка (4.164). Предусмотрим пять фиксированных вариантов управления
(рис.4.81):
• при сильном подсосе уменьшить разрежение на ΔP− 2 (u сп
*
= − ΔP− 2 ) ;
• при подсосе уменьшить разрежение на ΔP−1 (u п* = −ΔP−1 ) , причем ΔP−1 < ΔP−2 ;
• при нормальном газоудалении разрежение не менять ( uн* = 0 );
∑u
j =1
*
j ⋅ μ j (V * , P * )
u* = 5
.
∑μ
j =1
j
* *
(V , P )
526
Слой 1 осуществ-
ляет процедуру фазифика-
ции. Функции принадлеж-
ности μij ( x j )
(i = 1, m; j = 1, n) соответ-
ствуют посылкам i-ых не-
четких правил для j-го
входного воздействия, а
настраиваемыми парамет-
рами этого слоя являются
параметры упомянутых
функций принадлежности.
Слой 2 производит
вычисление функции при-
надлежности для всех по-
сылок нечетких правил.
Этот слой не имеет на-
страиваемых параметров.
Слой 3, состоящий
из нейронов, осуществляет
взвешенное суммирование
S1 и суммирование S2 вы-
ходных сигналов fj слоя 2.
Настраиваемыми парамет-
рами этого слоя являются
весовые коэффициенты C j .
Слой 4 реализует процедуру дефазификации, вычисляя выходную величину сети
y = S1 / S2 , которая, в частности, может представлять собой управляющее воздействие, подавае-
мое на вход объекта управления.
В процессе обучения нечеткой нейронной сети определяются оптимальные значения изме-
няемых (настраиваемых) параметров. При этом в качестве критерия оптимальности чаще всего
используется средняя квадратическая ошибка, минимальное значение которой можно найти вос-
пользовавшись одним из методов поиска экстремума многих переменных, например, например,
методом градиента.
Следует отметить, что в том случае, если выбор исходных правил функционирования не-
четкой нейронной сети неадекватно описывает поведение исследуемой системы, процесс обучения
не приведет к желаемому результату. В этом случае применяются адаптивные нечеткие системы,
корректирующие исходный набор правил в процессе работы системы, т.е. реализующих режим
самообучения нечетких нейронных систем.
Подчеркнем, что нечеткие системы, вообще, и нечеткие нейронные сети, в частности, це-
лесообразно применять для управления сложными и большими объектами, полную информацию о
состоянии которых по тем или иным причинам получить не удается. Если это не так, то более
предпочтительным оказывается реализация традиционных систем управления.
527
РЕКОМЕНДАТЕЛЬНЫЙ БИБЛИОГРАФИЧЕСКИЙ СПИ-
СОК
1. Александров А.Г. Оптимальные и адаптивные системы. М.: Высшая школа, 1989.
262c.
2. Бесекерский В.А. Теория систем автоматического управления / В.А. Бесекерский,
Е.П. Попов. М.: “Профессия”, 2004. 747с.
3. Вентцель Е.С. Теория вероятностей. М.: Высшая школа, 1998. 564с.
4. Власов К.П. Специальный курс по теории автоматического управления. Х.: Харь-
ковский политехнический институт, 1974. 198с.
5. Власов К.П. Теория автоматического управления / К.П. Власов, А.С. Анашкин. С.-
Пб.: Санкт- Петербургский горный институт, 2003. 103с.
6. Власов К.П. Теория автоматического управления (особые, дискретные и нелиней-
ные системы) / К.П. Власов, М.К. Аникин. СПб.: Санкт- Петербургский горный ин-
ститут, 2005. 105с.
7. Власов К.П. Теория автоматического управления (специальные методы) / К.П. Вла-
сов, А.С. Анашкин. СПб.: Санкт- Петербургский горный институт, 2001. 119с.
8. Воронов А.А. Основы теории автоматического управления. М. – Л.: Энергия, 1965,
Ч.1, 423с. 1966, Ч.2, 372с. 1970, Ч.3, 328с.
9. Галушкин А.И. Теория нейронных сетей. Кн.1. М.: ИРПЖР, 2000. 415с.
10. Голубь А.П. Системы управления электроприводами / А.П. Голубь, Б.Н. Кузнецов,
И.А. Опрышко, В.П. Соляник. К.: УМК ВО, 1992. 376с.
11. Гусев А.Н. Основы теории автоматического управления / А.Н. Гусев, В.А. Вьюжа-
нин, В.Д. Закаблуковский. Самара: Самарский аэрокосмический университет, 1966.
110с.
12. Заде Л. Понятие лингвистической переменной и его применение к принятию при-
ближенных решений. М.: Мир, 1976. 368с.
13. Зайцев Г.Ф. Теория автоматического управления и регулирования. 2-е издание пе-
рераб. и дополн. Киев: Высшая школа, 1988. 430с.
14. Иващенко Н.Н. Автоматическое регулирование. Теория и элементы систем. М.:
Машиностроение, 1973. 606с.
15. Интеллектуальные системы автоматического управления / под ред. И.М. Макарова,
В.М. Лохчена. М.: Физматлит, 2001. 576с.
16. Кочетков В.П. Основы теории автоматического управления. Учебное пособие. Ха-
касия.: Хакасский государственный университет, 2001. 264с.
528
17. Круглов В.В. Нечеткая логика и искусственные нейронные сети / В.В. Круглов,
М.И. Дли, Р.Ю. Годунов. М.: Физматлит, 2001. 224с.
18. Лукас В.А. Основы фази–управления. Екатеринбург: Уральская горно-
геологическая академия, 2000. 76с.
19. Лукас В.А. Теория автоматического управления. М.: Недра, 1990. 416с.
20. Математические основы теории автоматического регулирования / под ред. Б.К. Че-
моданова. М.: Высшая школа, 1971. 807с.
21. Методы исследований и организация экспериментов / под ред. К.П. Власова. Х.:
Гуманитарный центр, 2002. 256с.
22. Мирошник И.В. Теория автоматического управления. Линейные системы. СПб:
“Питер”, 2005. 333с.
23. Михайлов В.С. Теория управления. Учебное пособие для ВУЗов. Киев: Высшая
школа, 1988. 309с.
24. Олейников В.А. Основы оптимального и экстремального управления / В.А. Олей-
ников, Н.С. Зотов, А.М. Пришвин. М.: Высшая школа, 1969. 331с.
25. Пантелеев А.В. Теория управления в примерах и задачах / А.В. Пантелеев, А.С.
Бортаковский. М., Высшая школа, 2003. 583с.
26. Первозванский А.А. Курс теории автоматического управления. М.: Наука, 1986.
615с.
27. Попов Е.П. Теория линейных систем автоматического регулирования и управле-
ния. М.: Наука, 1989. 496с.
28. Попов Е.П. Теория нелинейных систем автоматического регулирования и управле-
ния. М.: Наука, 1988. 255с.
29. Поспелов Д.А. Логико-лингвистические модели в системах управления. М.: Энер-
гоатомиздат, 1981. 231с.
30. Ройтенберг Я.Н. Автоматическое управление. Учебное пособие. 3-е издание пере-
раб. и дополн. М.: Наука, 1992. 576с.
31. Ротач В.Я. Расчет динамики промышленных автоматических систем регулирова-
ния. М.: Энергия, 1973. 440с.
32. Солодовников В.В. Основы теории и элементы систем автоматического регулиро-
вания / В.В. Солодовников, В.Н. Плотников, А.В. Яковлев. М.: Машиностроение,
1985. 536с.
33. Солодовников В.В. Статистическая динамика линейных систем автоматического
управления. М.: Физматгиз, 1960. 213с.
529
34. Справочник по теории автоматического управления / под ред. Красовского А.А.
М.: Наука, 1987. 711с.
35. Теория автоматического регулирования. Учебное пособие для вузов / под ред.
Ю.М. Соломенцева. М.: Машиностроение, 1992. 286с.
36. Теория автоматического управления / под ред. А.В. Нетушила. М.: Высшая школа,
1972. 432с.
37. Теория автоматического управления. Учебное пособие / под ред. А.А. Воронова.
Ч.1. М.: Высшая школа, 1987. 367с.
38. Тэрано Т. Прикладные нечеткие системы / Т. Тэрано, К. Асаи, М. Сучено. М.: Мир,
1993. 368с.
39. Усков А.А. Интеллектуальные системы управления на основе методов нечеткой
логики / А.А. Усков, В.В. Круглов. Смоленск: Смоленская городская типография,
2003. 177с.
40. Фельдбаум А.А. Основы теории оптимальных автоматических систем. М.: Наука,
1966. 539с.
41. Филипс Ч. Системы управления с обратной связью / Ч. Филипс, Р. Харбор. М.: Ла-
боратория базовых знаний, 2001. 616с.
42. Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990. 292с.
43. Цыпкин Я.З. Релейные автоматические системы. М.: Наука, 1987. 575с.
44. Цыпкин Я.З. Теория линейных импульсных систем. М.: Физматгиз, 1963. 311с.
530
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Автоколебания 179 − − пропорционально-интегральный 75
Адаптивные системы управления 258 − − − − разностный 115
− − − активные 259 − − − − с предисторией 117
− − − аналитические 258, 274 Запас устойчивости 71
− − − интеллектуальные 259, 291 Звено типовое линейное 30
− − − обучающиеся 259, 291 − − − апериодическое второго порядка 33
− − − пассивные 259 − − − − первого порядка 31
− − − поисковые 258, 261 − − − дифференцирующее 38
− − − самонастраивающиеся 259, 274 − − − интегрирующее 37
− − − самоорганизующиеся 259, 288 − − − колебательное 34
− − − экстремальные 259 − − − усилительное 31
− − − − дискретные 265 Нелинейное с гладкой характеристикой 152
− − − − непрерывные 261 − − с многозначной характеристикой 155
− − − − шаговые 265 − − с однозначной характеристикой 152
Алгоритм стохастической аппроксимации 280 − − с релейной характеристикой 174
Алгоритмическая схема 39 − − с симметричной характеристикой 151
Амплитудно-частотная характеристика 26 − полуинерционное 32
− с запаздыванием 104
− − − логарифмическая 102 Идентификация динамических звеньев 282
− − − − желаемая 107 − − − с использованием косвенных методов 286
− − − − исходная 107 − − − − пробных сигналов 283
− − − − корректирующего звена 107 − − − − статистических методов 284
Астатические звенья 38 Частотного метода 282
Изображающая точка 166
База правил 319 Изоклина 171
Белый шум 244 Импульсная система 119
Импульсный фильтр 136
Вариационное исчисление 209 − элемент 137
Вероятностные характеристики случайных функ- Интеграл Дяамеля (свертки) 139,243
ций 238,240 Инференц-процедура 316
Весовая (импульсная переходная) функция 19 Информативные признаки образа 292
Вибрационная линеаризация 196 Искусственный нейрон 298
Воздействия возмущающие 6
− входные 6 Качественные показатели экстремальной системы
− задающие 7 264
− управляющие 6 Квантование по времени 119
Временные характеристики 19 − по уровню 119
Время регулирования 65, 148 Кибернетика 4
− техническая 5
Гармоническая линеаризация 186 Колебания вынужденные 177
Гомеостат Эшби 288 − свободные 178
Графы направленные 43 − собственные 178
Корректирующее устройство 275
Дефазтфикация 316 Коррекция систем управления параллельная 78
Динамическое программирование 221 − − − последовательная 77
Дискретные системы − − − с обратной связью 77
Дисперсия 238 Корреляционная функция собственная 239
− − взаимная 253
Единичная ступенчатая функция 19 Коэффициент гармонической линеаризации
− импульсная функция 19 186,191
− обратная связь 78 − демпфирования 34
− передачи графа 45
Живучесть 288 − передачи (усиления) 31
Кривые разгона 19
Закон необходимого разнообразия 288 Критерий устойчивости алгебраический 57
− регулирования 74 − − Гурвица 58, 144, 190
− − интегральный 73 − − Михайлова 52, 146, 187
− − пропорциональный − − Найквиста 63, 147, 189
− − пропорционально-дифференциальный 76 − − частотные 60, 144
531
− оптимальности аддитивный 204 Ошибка динамическая 65
− − интегральный 205 − статическая 56
216
− − нечеткие 304 Функционал 209
− − оптимальные 203 Функция истинности 311
− − − по быстродействию 230 − переключения 265
− − особые 103 − принадлежности 307
− − релейные 119, 174 − смещения 197
− − с запаздыванием 104
− − с распределенными параметрами 107 Частота сопряжения 103
− − статические 67, 74 − среза 72, 103
Скользящий режим 182 Частотная характеристика (функция) 26
Случайные функции реализации 237 − − вещественная 26
− − сечение 237 − − − типовая 107
− − стационарные 238 − − логарифмическая 102
− − эргодические 239 − − мнимая 26
Соединение нелинейных звеньев параллельное Частотные методы синтеза 107
159 Четкая логика 304
− − − параллельно-встречное 160
− − − последовательное 157 Экстремаль функционала 210
Спектральная плотность 240 Экстремальные системы управления непрерыв-
Средняя квадратическая ошибка 205 ные 261
Статистическая динамика 237 − − − дискретные 265
Статистическое дифференцирование 245 Эргодический случайный процесс 239
− интегрирование 245
Степень устойчивости 68 w - преобразование 43
Структурная схема 39 z - преобразование прямое 129
Структурные преобразования линейных систем − модифицированное 135
41 − обратное 133
− − нелинейных систем 162 − свойства 131
δ -функция 19
Теорема Ляпунова о линеаризованной системе 56
− об n-интервалах 208
− разложения Хевисайда-Карсона 24
− свертывания 39
Типовые звенья 31
− сигналы 19
217
Константин Петрович ВЛАСОВ
Редактор И. Г. Абраменко
Отпечатано в типографии ГП ХМЗ ФЭД. 61023, Украина, г. Харьков, ул. Сумская, 132.
Тел./факс (0572) 19-67-82, тел. 40-22-51. E-mail: 39fed@ukr.net.