Согласовано Утверждаю
_______________________ ______________________
Руководитель ООП Зав. кафедрой АТПП
по направлению 220700 доц. А.А. Кульчицкий
доц. А.А. Кульчицкий
Конспект лекций
«СОВРЕМЕННЫЕ ПРОБЛЕМЫ
АВТОМАТИЗАЦИИ И УПРАВЛЕНИЯ»
Направление подготовки:
220700 Автоматизация технологических процессов и производств
Профиль подготовки:
Автоматизация технологических процессов и производств в
нефтегазопереработке
Квалификация (степень) выпускника: магистр
Форма обучения: очная
САНКТ-ПЕТЕРБУРГ
2014
2
УДК 669.02.001.57 (075.8)
ББК 34.33.В6.Я7
Ш259
ISBN 5-85574-120-6
Шариков Ю.В.
Ш259. Современные проблемы автоматизации и управления. Ю.В. Шариков, Санкт-
Петербургский государственный горный университет. СПб, 2012. с.
ISBN 5-85574-120-6
© Ю.В. Шариков,
2012
3
«СОВРЕМЕННЫЕ ПРОБЛЕМЫ АВТОМАТИЗАЦИИ И УПРАВЛЕНИЯ».........................................................1
1. Оптимальные системы управления.....................................................................................................................5
1.1. Постановка задачи.....................................................................................................................................5
1.2. Формализация цели управления, Основные виды критериальных функций оптимизации..........................6
2. Математические методы решения оптимальных задач..................................................................................14
2.1. Методы исследования функций классического анализа.....................................................................15
2.1.1.Экстремумы функций одной переменной...................................................................................................15
Если же в этой точке d3R/dx3=0, то вычисляют следующую производную d4R/dx4 и т.д............................16
2.1.2. Экстремумы функций многих переменных...............................................................................................17
2.1.3. Примеры решения задач оптимизации теплообменников с использованием методов классического
анализа функций.....................................................................................................................................................20
2.2. Метод множителей Лагранжа................................................................................................................27
2.2.1. Оптимальное распределение потоков сырья между параллельно работающими производствами.....31
2.2.2. Определение минимального реакционного объема в каскаде реакторов идеального перемешивания.
..................................................................................................................................................................................35
Раздел 2.3. Классические вариационные задачи и методы их решения................................................................40
A......................................................................................................................................................................44
2.4. Динамическое программирование.....................................................................................................................50
2.5. Принцип максимума Понтрягина......................................................................................................................57
Синтез систем, оптимальных по быстродействию..............................................................................................63
Пример.3. Определение оптимального температурного профиля для системы параллельно
последовательных реакций в реакторе идеального вытеснения........................................................................68
2.6. Методы поиска экстремума функций................................................................................................................77
1.6.1.Методы поиска экстремума функции одной переменной.........................................................................77
Метод деления интервала......................................................................................................................................77
Метод золотого сечения.........................................................................................................................................77
Метод поиска с использованием чисел Фибоначчи............................................................................................79
2.6.2. Методы поиска экстремума функции многих переменных.....................................................................80
Метод поочередного изменения переменных......................................................................................................80
Градиентный метод поиска экстремума функций многих переменных...........................................................81
Метод наискорейшего спуска................................................................................................................................81
Метод релаксации...................................................................................................................................................81
Метод сканирования...............................................................................................................................................84
2.6.3 Пример использования метода нелинейного программирования для поиска экстремума функции
многих переменных................................................................................................................................................86
2.6.4. Определение оптимального температурного профиля методами нелинейного программирования.. .91
Раздел 2.7 Адаптивные системы управления...........................................................................................................95
2.7.1. Назначение. Классификация........................................................................................................................95
2.7.2.Экстремальные системы управления..............................................................................................................97
4
Динамические характеристики ЭСУ.....................................................................................................................101
Раздел 3. Большие и сложные системы..................................................................................................................106
3.1. Основные характерные черты больших и сложных систем......................................................................106
3.2. Декомпозиция систем и иерархическая структура системы управления................................................107
3.3.Особенности системы «Человек-машина».....................................................................................................111
3.4.Режимы работы системы «Человек-Машина».................................................................................................115
3.5.Разработка алгоритмов управления большими системами с использованием различных методов......117
3.5.2.Применение метода статистических испытаний......................................................................................121
3.5.4. Применение теории игр.................................................................................................................................127
Раздел 4. Нечеткие системы управления на базе теории нечетких множеств....................................................130
4.1.Подходы, применяемые в фаззи – технологии для синтеза систем управления......................................130
4.2. Элементы теории нечетких множеств.........................................................................................................132
4.3.Основные понятия нечеткой логики.............................................................................................................140
Нечеткая логика изучает логические операции над высказываниями типа...............................................140
4.4. Применение теории нечетких множеств и фаззи-логики в задачах управления.....................................142
Раздел 5. Предсказывающие системы управления................................................................................................151
Литература.................................................................................................................................................................157
Основная.....................................................................................................................................................................157
Дополнительпая......................................................................................................................................................158
1. А.В. Беспалов, Н.И. Харитонов, Задачник по системам управления химико-технологическими
процессами. Учебное пособие для вузов М., ИКЦ «Академкнига», 2005 г.......................................................158
2. Е.А. Дубовик, А.Е. Дубовик, Численные методы и алгоритмы диспетчеризации вычислений с
динамически изменяющимися приоритетами. М., СИНТЕГ, 2006, 120 с. (Серия «Информационные
технологии)...............................................................................................................................................................158
5
1. Оптимальные системы управления
S c ST S п
1 (1.2)
s пр
B
S с
B s (1 ) s B s'
c от от
(1.3)
(1.5)
Где: sпоб.,i – стоимость от реализации единицы i-го побочного продукта,[ден.ед/ед.пр.]
i – коэффициент, показывающий сколько единиц i-го побочного продукта образуется на
единицу основного продукта процесса, n-число реализуемых побочных продуктов.
Коэффициенты i , также как и , при решении задачи,можно считать переменными величинами.
Переменные расходы ST. Эта часть стоимости производства продукции включает в себя
стоимость электроэнергии, пара, охлаждающей воды, вспомогательных материалов, например,
ингибиторов коррозии, катализаторов и т.д.. Эта часть принимается пропорциональной
производительности процесса
(1.6)
S T
B sT
8
Коэффициент sT представляет собой объем переменных расходов на единицу продукции и
определяется сложившейся для данного производства стоимостью вспомогательных материалов.
Расчет коэффициента sT может быть выполнен по формуле
m (1.7)
s T
s э,i q
i
i 1
Где sэ,i – стоимость единицы энергетического потока (электроэнергии, пара, воды и т.д.) или
единицы вспомогательного материала, [ден.ед/ед.пр.],
qi – количество единиц i-го энергетического потока или вспомогательного материала ,
необходимых для производства единицы основной продукции [ед/ед.пр.]. В переменные расходы
иногда можно включать и заработную плату обслуживающего персонала. При этом выражение
(1.7)можно представить в следующем виде:
m (1.8)
s T
s э,i q s з
i
i 1
Где sз- основной заработок или доплата к основному окладу обслуживающего персонала за
единицу выпускаемой продукции, [ден.ед/ед.пр.].
Постоянные расходы Sп. Эта часть расходов не зависит от объема выпускаемой продукции В и
определяется объемом капитальных вложений в основные фонды производства, стоимостью
планового и профилактического ремонтов оборудования и уровнем заработной платы
обслуживающего персонала.
Рассмотрим более детально составляющие части постоянных расходов.
Амортизационные отчисления Sa. Амортизация – это процесс постепенного изнашивание
основных фондов и перенесения их стоимости на стоимость производимого продукта, чтобы
иметь средства для замены основных фондов при их износе или выходе из строя. Важнейшим
элементом расчета амортизации является срок службы основных фондов Т, который определяется
с учетом интенсивности использования оборудования, его физического износа и морального
устаревания. Размеры амортизационных отчислений определяются на основе нормы амортизации
На, выраженной в процентах от первоначальной стоимости капитальных вложений в процесс. При
этом учитываются также затраты на капитальные ремонты оборудования Р в течение срока его
службы и ликвидационная стоимость основных фондов Л после истечения срока амортизации.
Тогда Норма амортизации составит величину:
9
ФРЛ (1.9)
На 100%
Ф Т
и амортизационные отчисления составят величину
ФНа Ф Р Л (1.10)
Sа
100 Т
С учетом выполненного анализа выражение для себестоимости (1.2) может быть записано
в виде:
Ф Р Л S p Sз (1.12)
s пр s 'c sT
Ф Т B
10
является норма прибыли Нп , которая представляет собой выраженное в процентах отношение
разности между рыночной ценой и себестоимостью, отнесенное к себе стоимости:
s s ц пр
(1.14)
Н
s п
пр
sпр
Sпр,min
В
Вопт
11
Рис.1.1 Зависимость себестоимости продукции от
производительности
Кривую sпр(В) можно построить на основании экономического анализа процесса, после чего
расчет оптимальной производительности процесса можно выполнить очень просто. В точке
оптимума должно выполняться условие
s пр
0
(1.16)
B
Прибыль в качестве критерия оптимальности. Оптимальное значение производительности
при применении прибыли в качестве критерия оптимальности можно найти решением уравнения,
получаемого путем приравнивания нулю производной от правой части уравнения (1.13) по В.
П
sц sпр В
sпр (1.17)
В B
Приравнивая нулю (1.17) ,находим выражение для производной в точке экстремума.
s пр
s s ц пр
(1.18)
B B
Поскольку величина производительности В всегда положительна, то знак производной
sпр / B всегда определяется знаком разности, между рыночной ценой продукции и ее
12
tg ( )
s s ( B'
ц пр опт
) (1.19)
В опт
sпр
S
w
BM
B
П Bm Вопт B’опт
13
1 sпр
(1.20)
Нп
2 0
В s В
пр
Из уравнения видно, что выполнение условия (1.20) возможно лишь при равенстве нулю
производной sпр/В, т.е. при соблюдении условия (1.16). Это означает, что оптимальное значение
производительности Bопт, рассчитанное из условия максимизации нормы прибыли (1.14),
совпадает с оптимальным значением В опт, которое определено из условия минимизации
себестоимости. Следовательно, максимум нормы прибыли достигается при производительности,
обеспечивающей минимальную себестоимость продукции.
M
M
M
m m m
x1 x2 x x2
x1 x2 x x1 x
Когда порядок первой, не обращающейся в нуль производной в точке xk, для которой
dR/dxx=xk=0, нечетный, то в этой точке функция R(x) не имеет ни максимума, ни минимума, т.е.
точка xk не является точкой экстремума функции R(x). Если же порядок первой, не
обращающейся в нуль производной в точке xk четный, то в данной точке есть экстремум
функции R(x), который будет максимумом или минимумом в зависимости от того,
отрицательна или положительна эта производная.
Способ исследования знаков производных требует довольно громоздких вычислений,
поэтому гораздо проще воспользоваться одним из двух первых способов
17
При решении задачи оптимизации необходимо найти не какой-либо экстремум
оптимальной функции, но требуется найти условия, при которых функция R(x) принимает
наибольшее или наименьшее значение. Точки наибольшего, или наименьшего значения функции
R(x) называют обычно глобальными экстремумами, в отличие от остальных экстремумов, которые
в этих случаях называют локальными.
Для поиска глобального экстремума необходимо найти все локальные экстремумы в
заданной области оптимизации, а затем выбрать среди них наибольший ( или наименьший) Это
довольно громоздкая процедура, для упрощения которой используют целый ряд эмпирических
правил.
18
Для этого применяют обычно вычисление приращения функции в окрестности точки
предполагаемого экстремума, применяя разложение функции R=R(x1,x2,...,xn) в ряд Тейлора в
окрестности точки и вычисляя приращение в сле дующем виде:
2 (2.1.4)
1 n
R R ( x ) R ( x
(k )
)
2
x i R( x
(k )
)
i 1 x i
aij x x x x ji
, i, j 1,..., n
i j j i
Квадратичная форма называется положительно определенной, если для любых значений zp она
сохраняет положительное значение, за исключением точки zp = 0 (p=1,…,n), в которой она
обращается в нуль. Для того чтобы найти , является ли данная квадратичная форма
19
положительно определенной можно воспользоваться теоремой, которая формулируется
следующим образом. Для положительной определенности квадратичной формы (2.1.5)
необходимо и достаточно, чтобы выполнялись условия Сильвестора:
a11 a12 0; ...
(2.1.7)
1 a 11 0; 2
a21 a22
a11 a12 ... a1n
a21 a22 ... a2 n 0
n
.......... ........
an1an 2 ... ann
[ A] a ... 2n a 22 a 2 n
...................
a n1 a n2
... a nn
20
R=sxvx+sFF (2.1.9)
Где: sx –стоимость единицы объема хладагента; sF- стоимость единицы поверхности
теплообмена, исчисляемая с учетом амортизации теплообменника. Критерий (2.1.9) представляет
собой суммарные затраты на эксплуатацию теплообменника в единицу времени. Чтобы получить
возможность использовать критерий оптимальности (2.1.9) для выбора оптимальной поверхности
Fопт и оптимальной величины расхода хладагента vх,опти, необходимо найти связь между F и vx,
которую дают уравнения математического описания теплообменника. Рассмотрим простейшую
схему теплообмена, которая соответствует теплообмену в двух аппаратах смешения через
теплообменную поверхность, как изображено на рис.2.2.
Стационарный режим работы такого теплообменника может быть описан системой уравнений
теплового баланса по каждому потоку:
v cp T T K F T Tx 0
( 0) (k )
T
(k ) (k )
(2.1.10)
vx c p,x Tx Tx K F T Tx 0
( 0) (k )
T
(k ) (k )
(2.1.11)
21
Эта система уравнений может быть разрешена относительно любых двух параметров, входящих в
эти уравнения. В частности, для выходных температур теплоносителя T(k) и хладагента Tx(k)
можно получить следующие выражения:
1 ( 0)
1
1 KT F Tx( 0)
v c v cp
(k ) ( 0) x p,x T
T T 1
(2.1.12)
1
1 KT F
v c v cp
x p,x
( 0) 1
1 K T F T ( 0)
1
v cp
x c px v
Tx
(k ) ( 0)
Tx Tx 1
(2.1.13)
1
1 KT F
v c v cp
x p,x
При расчетах теплообменников обычно задают тепловую нагрузку на теплообменник Q, т.е. то
количество тепла, которое нужно передать от теплоносителя к хладагенту в единицу времени. Для
определенного расхода теплоносителя, известной его теплоемкости и заданной входной
температуры это эквивалентно заданию выходной температуры теплоносителя, поскольку
Q vc T p
(0)
T
k
Задача расчета теплообменника ставится как задача определения величины поверхности
теплообмена при заданных параметрах хладагента.
Конечная температура хладагента вычисляется из уравнения теп лового баланса
vc T
p
( 0)
T v c Tx
k
x px
( 0)
Tx 0
k (2.1.14)
22
и равна следующей величине:
(2.1.15)
v cp
Tx Tx
(k ) (0) (0) (k )
(T T )
v c x px
Подставляя в уравнение (2.1.10) или в (2.1.11) выражение для выходной температуры хладагента
(2.1.15) и решая полученное уравнение относительно поверхности теплообмена F, найдем для F
следующее выражение:
F
v c x px
(2.1.16)
v c
K v 1
x px
T
c
p
где:
(k ) ( 0) (2.1.17)
Tx
T ( 0) (k )
T T
vx
c(2.1.18)
px
1
v vp
F F (v ) x
(2.1.19)
dF
c px 1
(2.1.21)
d vx KT
2
v x c px
v c p 1
Подстановка (2.1.21) в (2.1.20) дает следующее уравнение:
24
2 (2.1.22)
v x c px s c
v c p 1 s K
F px
0
x T
v c p
(2.1.25)
v
x3
c px
v cp (2.1.26)
v x
c px
0.5
v cp s xK T
F опт 1 (2.1.28)
K T s F c px
Как следует из уравнений (2.1.27) и (2.1.28) оптимальные значения vx и F зависят от величины
безразмерного комплекса
26
z sx
KT
(2.1.29)
sF c px
в который входят стоимостные коэффициенты критерия оптимальности sx и sF. На рис. 2.3 показан
вид зависимостей (2.1.27) и (2.1.28) от величины безразмерного комплекса z для теплообменника
типа «смешение-смешение»
vx,F
Fопт
Vх,опт
27
2.2. Метод множителей Лагранжа.
Эти методы применяются для решения задач оптимизации, в которых на независимые
переменные наложены ограничения типа равенств. Типичными примерами подобных задач
служат задачи, в которых требуется оптимальным образом распределить заданное количество
ресурсов, чтобы принятая оценка эффективности процесса имела при этом максимальное или
минимальное значение.
Для решения экстремальных задач с такими ограничениями в классическом анализе
разработан и используется метод неопределенных множителей Лагранжа, сводящий задачу с
ограничениями к обычной экстремальной задаче без ограничений, что позволяет применять для её
решения приемы, рассмотренные ранее в предыдущем разделе курса.
Метод множителей Лагранжа часто применяется и при использовании других методов
оптимизации в качестве вспомогательного средства, позволяющего упростить решение более
сложных задач оптимизации.
Рассмотрим суть этого метода. Пусть требуется найти экстремум функции
R=R(x1,x2,…,xn) (2.2.1)
которая зависит от n переменных xi (i=1,2,…,n), связанных в свою очередь соотношениями:
k(x1,x2,…,xn)=0, k=1,…,m (2.2.2)
28
уравнений (2.2.2) можно выразить m независимых переменных xi как функции остальных n-m
переменных, т.е. представить ограничения (2.2.2) в виде:
xk=fk(x1,x2,…,xn-m) (2.2.3)
Подставляя полученные соотношения (2.2.3) в выражение (2.2.1), получим функцию R*, которая
будет зависеть только от n-m переменных, не связанных дополнительными условиями:
R*=R*(x1,x2,…,xn-m) (2.2.4)
Таким образом, устраняя ограничивающие условия (2.2.2), удалось и уменьшить
размерность исходной оптимальной задачи. Однако, практически почти невозможно аналитически
решить систему уравнений (2.2.2) и представить ограничения в форме (2.2.3). Поэтому для
решения таких задач чаще всего используют метод неопределенных множителей Лагранжа, суть
которого заключается в следующем.
(0)
(x
( 0) (0)
Предположим, что в некоторой точке x(0) , x 2 ,..., x n ) функция R (2.2.1)
1
имеет условный экстремум. Это означает, что система ограничивающих условий (2.2.2) в данной
точке также выполняется. Как известно, необходимым условием экстремума функции многих
переменных является равенство нулю дифференциала этой функции в экстремальной точке.
n R ( x (0))
d x 0 (2.2.5)
i 1 xi
i
При этом дифференциалы переменных dxi (i=1,…,n) в выражении (2.2.5) не все являются
независимыми, поскольку на указанные переменные наложены дополнительные условия (2.2.2).
Продифференцируем эти условия в точке x(0), в результате чего получим систему равенств:
( x )
(0)
n
i 1
k
xi
d xi 0, k 1,..., m (2.2.6)
n R( ( 0) )
x 1 ( x
(0)
) ( x
(0)
)
k m
d xi 0 (2.2.7)
xi xi xi
i 1 1
Среди дифференциалов dxi независимыми являются только n-m, тогда как остальные m
дифференциалов зависят от первых. Поэтому в соотношении (2.2.7) независимым образом можно
29
изменять лишь n-m дифференциалов, например, dxi (i=1,…,n-m). Для того, чтобы исключить m
зависимых дифференциалов dxi (i=n-m+1,…,n) из выражения (2.2.7), выберем m множителей k
(k=1,…,m) так, чтобы коэффициенты при этих превратились в нуль.
Для этого определим k из системы уравнений:
( x ) ( x )
(0) (0) ( 0)
R( x )
1 1
m
0
xi xi xi (2.2.8)
i n - m 1,..., n
Тогда в соотношении (2.2.7) останется только n-m слагаемых с независимыми дифференциалами
dxi (i=1,…,n-m) и оно может быть переписано в виде:
n m R( ( 0) )
x 1 x
(
( 0)
) m x
(
(0)
)
d xi 0 (2.2.9)
xi xi xi
i 1 1
Для того чтобы соотношение (2.2.9) выполнялось при любых значениях независимых
дифференциалов dxi (i=1,…,n-m), необходимо равенство нулю коэффициентов при этих
дифференциалах, что дает систему уравнений
R( ( 0))
x 1 x
(
(0)
) m x
(
( 0)
)
1 m 0
xi xi xi (2.2.10)
i 1,..., n - m
аналогичную системе (2.2.8). Объединяя системы уравнений (2.2.8) и (2.2.10), окончательно
получим:
( x ) ( x )
(0) ( 0) ( 0)
R( x )
1 1
m m
0
xi xi xi (2.2.11)
i 1,..., n i 1,..., n
Системе (2.2.11) должны удовлетворять как величины k (k=1,…,m), так и значения
переменных xi (i=1,…,n), при которых функция R имеет условный экстремум. Кроме системы
30
(2.2.11), переменные xi должны также удовлетворять системе условий (2.2.2). Таким образом,
получим всего n+m уравнений (системы (2.2.2) и (2.2.11)), из которых можно найти n значений
переменных xi (i=1,…,n), соответствующих условному экстремуму функции R и m значений
множителей k (k=1,…,m).
Чтобы представить полученные результаты в более компактной форме, введем
вспомогательную функцию Лагранжа, которую определим соотношением:
m
( x, ) R ( x ) k ( x ) (2.2.13)
k
k 1
С помощью функции систему уравнений (2.2.11) можно записать в виде:
( x, )
0 i 1,..., n (2.2.14)
xi
Итак, для решения задачи отыскания условного экстремума функции R (2.2.1) при ограничениях
на переменные (2.2.2) необходимо решить систему уравнений (2.2.13), где функция
определяется уравнением (2.2.12), совместно с системой ограничивающих условий (2.2.2).
Можно пойти дальше по пути обобщения и обозначить неопределенные множители как
новые вспомогательные переменные
k = xn+k k=1,…,m. (2.2.15)
Тогда формально задача нахождения условного экстремума функции R (2.2.1) сведется к
нахождению безусловного экстремума функции (xi), где i=1,…, n+m), поскольку при
дифференцировании функции (xi) по вспомогательным переменным в результате
приравниваания нулю получаемых производных находится система ограничений (2.2.2).
Следует отметить, что метод множителей Лагранжа позволяет найти лишь необходимые условия
существования условного экстремума для непрерывных функций, имеющих к тому же
непрерывные производные. Полученные в результате поиска экстремальные условия необходимо
точно также проверять на тип экстремума, как это было изложено ранее.
v1 r2
2
v2
vm
i ri
v1 r2
2
v2
vm
32
i ri
N rN
N rN
r (v
(1) (2) (N ) (i )
R (v ,v ,..., v ) i
) (2.2.20)
i 1
Поставим задачей оптимизации отыскание такого распределения потоков сырья между
отдельными процессами, при котором критерий оптимальности производства в целом (2.2.20)
имел бы минимальное значение при любой заданной совокупности значений величин u(i) (i=1,
…,N). Такая задача может возникнуть, например, при решении вопросов управления
распределением сырья в производстве, когда оптимальный режим каждого процесса в отдельности
уже обеспечивается локальной системой оптимизации с помощью параметров u(i)k, доступных для
целенаправленного изменения. Поскольку величина любого потока сырья Vk, поступающего в
производство, задана, выбор оптимальных значений v(i)k должен производиться с учетом условий
N
v
(i )
k
V k k 1,..., m (2.2.21)
i 1
которые представляют собой ограничения типа равенств на независимые переменные v(i)k и
позволяют использовать для решения поставленной оптимальной задачи метод множителей
Лагранжа.
Перепишем уравнение (2.2.21) в следующую форму:
V k vk 0
(i )
(2.2.22)
i 1
Составим функцию Лагранжа для поставленной задачи в соответствии с ранее полученным
уравнением (2.2.13).
N m
N
(i )
ri (v k V k v k (2.2.23)
(i )
i 1 k 1 i 1
или
m N
m
(i )
k V k ri (v ) k v k (2.2.24)
(i )
k 1 i 1 k 1
34
В последнем уравнении каждое слагаемое второй суммы зависит от тех величин vk(i) (k=1,…,m),
которые определяют нагрузку по сырью лишь i-го процесса.
Дифференцируя выражение (2.2.24) по vk(i), найдем соотношение
(i )
r i (v )
(i )
(i )
k (2.2.25),
vk vk
с учетом которого система уравнений (2.2.14) может быть представлена как
(i )
ri (v )
(i )
k k=1,…,m; i=1,…,N (2.2.26)
vk
Параметры k можно исключить из уравнений системы (2.2.26), после чего получим:
(1) ( 2) (N )
r1 (v ) r 2 (v ) r n (v )
(1)
( 2)
(1)
k 1,..., m (2.2.27)
vk vk vk
Отсюда следует, что при оптимальном распределении потока k-го сырья, производные
dri/dvk(i) (i=1,…,N) от критериев оптимальности всех процессов, на которые это сырье
распределяется, должны быть равны между собой. Система уравнений (2.2.27) включает уже
m(N-1) равенств. Добавляя к этой системе m условий (2.2.22), получим систему mN уравнений
относительно mN неизвестных величин vk(i). Следует отметить, что решение системы уравнений
(2.2.27) и (2.2.25) на практике может оказаться достаточно сложным.
Однако вывод, сделанный относительно равенства производных (2.2.27) при оптимальном
распределении потоков сырья представляет практический интерес и может быть использован для
организации управления производством.
i
V i (i=1,2,3) ( 2.2.28)
v
Где Vi – объем i-го реактора в каскаде, м3; v- объемный расход реакционной смеси через каскад
реакторов.
Обозначим через x степень превращения исходного реагента в продукты реакции
c cA
xA
A, 0
(2.2.29)
c A, 0
Где сА,0 – концентрация исходного реагента на входе в реактор, [кмоль/м 3]; сА- концентрация
исходного реагента на выходе их реактора, [кмоль/м 3].
При заданной производительности каскада реактора, минимальный суммарный объем реактора
соответствует минимальному времени контакта в каждом реакторе.
c
A,i 1 c ; c ; c
c 1 k c 1 k c 1 k c
A, 0 A,1 A, 2
; ;
A,i
i i
A,1
i 1
A, 2
i 2
A, 3
1 k
i 3
36
Вычисляя последовательно концентрации на выходе из 1-го реактора и подставляя полученное
значение в выражение для вычисления концентрации в последующем реакторе, мы получим
c
c A, 0
следующее выражение: .
A, 3
(1 k ) (1 k ) (1 k )
1 1 2 2 3 3
Подставляя полученное выражение в уравнение (2.2.29) для степени превращения, получим
следующее выражение:
:
3
1
x A , k 1
(2.2.30)
i 1 (1 i k i
)
Для случая 3-х реакторов в каскаде, работающих в изотермических условиях, выражение (2.2.30)
принимает вид:
1
x А,k (1 ) (1
1 (2.2.31)
k 1 k 2) (1 k 3)
Таким образом, критерий оптимизации для рассматриваемой задачи будет иметь вид:
R ( 1 2 3) min ( 2.2.32)
При выполнении ограничения
1
f x A , k 1
зад
(2.2.33)
(1 k ) (1 k ) (1 k )
1 2 3
Запишем выражение для вспомогательной функции Лагранжа в соответствии с уравнением
(2.2.13):
R f 1 2 3
зад 1 (2.2.34)
x A , k 1
(1 k 1) (1 k 1) (1 k 1
)
Продифференцируем функцию Ф по переменным 1, 2, 3, и приравняем нулю полученные
производные:
37
k
1 0
1
2) (1 k 3) (1 k 1)
2
(1 k
k
1 0
2
) (1 k ) (1 k 2)
2
(1 k 1 3
(2.2.35)
k
1 0
3
) (1 k ) (1 k 3)
2
(1 k 1 2
зад 1
x 1 0
(1 k 1) (1 k 2) (1 k 3)
A,k
1 _
x yz 1 k ,
1 x A,k
зад
(2.2.40)
1
1 3 зад
_ 1 x A,k
откуда
k
Рассмотрим численный пример использования метода множителей Лагранжа для
определения оптимальных условий, обеспечивающих использование минимального реакторного
объема для достижения заданной конечной степени превращения при заданной
производительности реакторного узла. Пусть задана производительность реакторного узла по
реакционной смеси – v= 2 м3/час. Заданная конверсия в конце каскада из трех реакторов равна
xA,kзад=0.936. В реакторах происходит реакция превращения исходного реагента с константой
скорости k=0.35 час-1.
В соответствии с уравнением (2.2.40 рассчитаем
1
1 3 =4.2 часа Зная объемный расход можно рассчитать объем реактора
_
1 0.936
k
_
Vсум=8.43=25.2 м3.
40
Раздел 2.3. Классические вариационные задачи и методы их решения.
Рассмотренные в предыдущих разделах методы решения задач
оптимизации применимы к объектам с сосредоточенными параметрами, динамика
которых описывается обыкновенными дифференциальными уравнениями, и когда
искомыми управлениями являются переменные. Для объектов с распределенными
параметрами, динамика которых описывается дифференциальными уравнениями в
частных производных, управлениями являются не переменные, а функции.
В этом случае критерий оптимизации будет уже формироваться не как
функция управляющих переменных, но уже как функция от управляющих
функций.
Эта величина называется функционал:
I I [ x (t )] (1.3.1)
Решением задачи отыскания экстремума функционала I служат одна или несколько
функций xj (t) (j=1,…,q), при подстановке которых в выражение (1.3.1) для
функционала его величина принимает экстремальное значение. Такие функции
называются экстремалями.
Предположим, что задача оптимизации сведена к задаче отыскания экстремума
функционала
(k )
t
I (t , x, x ' , )dt (1.3.2)
(0)
t
41
Поскольку x(t) является экстремалью функционала I, величина I(), определяемая
соотношением (1.3.6) должна иметь экстремум при =0, и, следовательно, её
производная dI()/d должна обращаться в нуль как производная функции одной
переменной в точке экстремума. Продифференцируем (1.3.6) по для нахождения
этой производной:
dI ( )
(k )
t
(t , x, x ' ) (t , x, x ' )
I ' ( ) ( 0) x w w' dt (1.3.7)
d 0 t
x'
и преобразуем второй член в подынтегральном выражении с помощью
интегрирования по частям
(k ) (k )
t t d
( 0 ) x' w 'dt
x '
w
(0)
w dt (1.3.8)
dt x '
t t
тогда выражение (1.3.7) перепишется в виде:
(k )
t
(k)
t d
I ' ( 0) w w dt (1.3.9)
x dt x '
x' t ( 0)
t
(0)
42
(k )
t d
I ' ( 0) w x
( 0)
dt (1.3.10)
dt x '
t
Для экстремали необходимо, чтобы I’(0) =0. Это требует равенства нулю интеграла
в правой части уравнения (1.3.9). Поскольку функция w(t) произвольна, для
обращения в нуль интеграла необходимо равенства нулю выражения в квадратных
скобках на всем интервале интегрирования. Отсюда следует, что если функция x(t)
является экстремалью функционала (1.3.2), она должна удовлетворять уравнению
d
0 (1.3.11).
x dt x '
Это уравнение называют обычно уравнением Эйлера.
Величина I, равная произведению I’(0) представляет собой дифференциал
функции I() при =0, который в вариационном исчислении называют первой
вариацией функционала I. Полагая, что w(t)=(x), можно записать для первой
вариации следующее выражение:
(k )
t
(k )
t
d
I I ' (0) x w ( 0 ) w x x ' x dt (1.3.12),
x' t (0) dt
t
где х является вариацией функции x(t).
Теперь условие того, что функция x(t) есть экстремаль функционала I может быть
сформулировано как требование равенства нулю первой вариации функционала I,
откуда следует также и уравнение Эйлера. Понятие вариации функционала в
вариационном исчислении аналогично понятию дифференциала в обычном
анализе. Подобно тому, как в анализе дифференциал функции характеризует
приращение функции x(t) при изменении независимой переменной t на бесконечно
малую величину dt, первая вариация функционала I определяет приращение
функционала I при бесконечно малом варьировании х функции x(t).
Уравнение Эйлера является обыкновенным дифференциальным уравнением
второго порядка относительно функции x(t). Решение этого уравнения содержит
две произвольные постоянные, которые должны быть определены из граничных
условий, например,
x(t(0))=x(0) x(t(k))=x(k) (1.3.13)
Уравнение Эйлера получено для случая, когда аргументом функционала
является только одна функция. Если функционал зависит от нескольких функций
одной переменной и описывается выражением вида:
43
(k )
t
I ( x1 , x 2 ,..., x m ) (t , x ,..., x , x
(0)
1 m 1
' ,..., x'm ) dt (1.3.14)
t
то, проводя аналогичные рассуждения можно получить систему уравнений Эйлера,
которой должны удовлетворять эти функции, чтобы функционал (1.3.14) имел
экстремальное значение:
d
xi dt xi 0, i 1,..., m (1.3.15)
Таким образом, в вариационном исчислении задача отыскания экстремума
сводится к решению системы дифференциальных уравнений с краевыми
условиями.
Аналогично тому, как в классическом анализе функций равенство нулю
производной обеспечивают только необходимое условие экстремума, так и в
вариационном исчислении уравнения Эйлера обеспечивают также только
необходимые условия экстремума. Если искомой является только одна функция,
проверка типа экстремали может быть выполнена относительно просто. Так, когда
экстремаль функционала (1.3.2) является минималью, для любой ее точки должно
соблюдаться условие:
A
x,x’(t,x,x’) 0 (1.3.16)
Если же экстремаль функционала
A есть максималь, то:
x,x’(t,x,x’) 0 (1.3.17)
Соотношения (1.3.16) и (1.3.17) называются, обычно, условиями Лежандра. Они
соответствуют обычным условиям на вторую производную, используемым в
анализе. A
Рассмотрим пример использования вариационного исчисления для нахождения
оптимального управления.
A
Пусть в реакторе идеального вытеснения протекают параллельные реакции
P
Q
P
A Q
d xA
1 k 2 (1.3.20)
d x P k 1
Обозначим через Т0 такую условную температуру, при которой константы скорости
основной и побочной реакции будут равны k1(T0)=k2(T0)=k0 и введем
вспомогательную величину z, определяемую соотношением:
45
E 1 1 1
z exp (1.3.21)
Rг T 0 T
Применяя эту зависимость, можно записать выражения для констант скорости в
следующем виде:
k 1 k 0 z k k 0 z E 2 E1
/
(1.3.21)
2
C учетом уравнения (1.3.21) уравнение (1.3.20) может быть записано в следующем
виде:
d xA
d xP
x'A 1 z E 2 E 1 или z
/ 1
- x'A 1
E1
E 2 E1 (1.3.22)
1 xP d x
(k ) P
( 1.3.23)
k E1
x A ( x' A 1) 2 E1
0 0
E
или после замены обозначений:
m E 1
; x x A ; t x P ; I k 0
(k )
E E 2 1
(k ) (1.3.24)
t dt
I
t x ( x'1)
m
(0)
46
Пример. Найти оптимальную по быстродействию кривую изменения скорости
двигателя постоянного тока независимого возбуждения при отработке заданного
T
Q
1
dt min (1.3.25)
0
при наличии уравнений связи в виде:
T T
Q R t dt A ; Q dt (1.3.26).
2
2 3 0
0 0
Таким образом, мы имеем задачу на условный экстремум, для решения
которой составим вспомогательную функцию
F* F 2 F 2 3 F 3 1 2 R i 3
2
(1.3.27)
Запишем уравнение движения двигателя при неизменном потоке возбуждения
=const и отсутствии момента сопротивления Мс=0:
d J
J M д K M i; i ' (1.3.28)
dt KM
Здесь J – момент инерции; Мд – момент двигателя; КМ=СМ;
CМ- электромашинная постоянная. Тогда уравнение (1.3.27) можно записать в виде:
F * 1 2 K ' 3
2
, где К=J2R/KM2
Для нахождения экстремали уравнения (1.3.25), запишем уравнение Эйлера с
учетом выражений (1.3.26):
F * d F *
dt ' 3
2 2 K ' ' 0 , откуда
47
'' 13
(1.3.29)
2 K 2 K
2 0
где 023.
Интегрируя уравнение (1.3.29) найдем уравнение для экстремалей в следующем
виде:
1 1 2
' t C1 ; t C1 t C2 (1.3.30)
2 0 K 4 0 K
С учетом уравнения (1.3.28) запишем выражение для тока:
J J J
i ' t C1 (1.3.31)
K M
2 0 K K M KM
Таким образом, оптимальное в смысле быстродействия управление
двигателем при выполнении условий (1.3.26) осуществляется при линейном
изменении тока и изменении по параболическому закону.
Постоянные интегрирования С1 и С2 и постоянный множитель 0 можно
определить из граничных условий
(0)=0; (T)=0; i(0)=i0; i(T) = -i0 (1.3.32),
соответствующих началу разгона и торможения двигателя.
Подставив (1.3.32) в (1.3.30) и (1.3.31) окончательно запишем выражения для
постоянных интегрирования и постоянного множителя в следующем виде:
KM ; J T
C1 i0 J
C2 0; 0 4 i0 K K M
(1.3.33)
48
2
dt K i T
T
0
M
6 J
0
(1.3.35)
0
Решив совместно уравнения (1.3.34) и (1.3.35) можно определить выражения для
времени и начального тока:
12 R J 6 J
2 2
T 3 0
A K M
2
; i0 0
2
(1.3.36)
K TM
Подставляя (1.3.33) с учетом (1.3.36) в (1.3.30) и (1.3.31) найдем в окончательном
виде закон изменения тока и скорости при оптимальном режиме в функции
времени (рис. 1.3.1). Так как управление двигателем постоянного тока обычно
производится изменением напряжения на зажимах якоря Uя, то воспользовавшись
уравнением якорной цепи
Uя=Ri+Kc (1.3.37)
и уравнениями i(t) и (t) , можно найти зависимость Uя(t). Так как зависимость i(t)
линейна, а (t) параболическая , то Uя(t) тоже будет изменяться по параболе
(рис.1.3.1).
Если управлять двигателем, контролируя выходные координаты и , то,
исключив переменную t, получим зависимость i(), подставив которую в (1.3.37),
найдем зависимость Uя(). Кроме того, для учета знака i необходимо также
производить непрерывное измерение угла поворота . Окончательно получим:
U я
( , ) B (B
1 2
2 ) sign( 2 ) K e (1.3.38)
0
где
1/ 3
R A 9 A K 2M
B1
; B2
4 R J 2
0
0
Как следует из уравнения (1.3.38), для реализации оптимального алгоритма
управления требуется нелинейный регулятор, который проще всего реализовать с
помощью вычислительного устройства.
49
i,Uя,
i0
U0
U
T
я
t
i 0
0/2
U0
i0
50
2.4. Динамическое программирование.
Динамическое программирование хорошо приспособлено для решения задач оптимизации
многостадийных процессов. При этом эта многостадийность может рассматриваться как
распределенной во времени, например по отдельным участкам времени, так и в пространстве,
например по отдельным аппаратам, в которых происходит последовательная обработка сырья,
либо по отдельным элементам одного аппарата, например по отдельным тарелкам
ректификационной колонны, либо по отдельным аппаратам каскада реакторов. Для
многостадийного процесса предполагается известным математическое описание, учитывающее
возможность выделения управляющих воздействий на каждой стадии:
x k(i)= k(i)(x1(i-1),…,xm(i-1),u1(i),…, ur(i)) (1.4.1)
k=1,…,m; i=1,…N
Здесь, i – номер стадии. Математическое описание связывает выходные переменные i-й стадии с
ее входными переменными и управляющими воздействиям на этой стадии.
В векторной форме уравнение математического описания многостадийного процесса можно
записать в следующем виде:
(i ) (i ) ( i 1) (i )
x (x , u ) (1.4.2)
Где x(i) – вектор совокупности переменных состояния, i=1,…,m;
u(i) – вектор совокупности управляющих воздействий ( управление ) на i-й
стадии.
Размерности векторов состояния и векторов управления на каждой стадии в общем случае
могут быть различными для разных стадий процесса. Однако далее, не нарушая общности, можно
принять, что размерности m и r векторов состояния и управления для всех стадий процесса
одинаковы. В реальных процессах на значения переменных состояния и управления можно
наложить ограничения, определяющие диапазон изменения или взаимосвязь указанных
переменных. Это можно выразить либо соотношениями типа
Fj(x(1),…, x(N), u(1),…, u(N) ) 0 (1.4.3)
Либо соотношениями типа
(i ) (i )
x X, u U (1.4.4),
означающими, что значения переменных x(i) и u(i) принадлежат к допустимым областям их
изменения X и U, ограниченным соотношениями (1.4.3).
Предположим, что эффективность каждой стадии процесса оценивается некоторой величиной:
ri=ri*(x(i),u(i)) (1.4.5)
заданной в виде функции от переменных состояния стадии x(i) и применяемого на ней управления
u(i).
51
С учетом математического описания (1.4.2), можно записать уравнение (1.4.5), выразив
переменные состояния на данной стадии через ее входные переменные и управление.
ri=ri (x(i-1),u(i)) (1.4.6)
Результирующая оценка эффективности многостадийного процесса в целом определяется как
аддитивная функция результатов, получаемых на каждой стадии:
N
r (x
( i 1) (i )
R N
i
, u ) (1.4.7)
i 1
Естественно, что значение критерия оптимальности зависит от совокупности всех управляющих
воздействий на всех стадиях процесса, которая представляет собой набор значений векторов u(i)
для каждой стадии:
_
(1) (2) (N )
u N
(u , u ,..., u ) (1.4.8)
_
Совокупность управлений для всех стадий процесса
u N
будем называть стратегией
_
(1) (2) N
u Nопти
(uопт , uопт ,..., uопт) (1.4.9)
u(i) u(N)
u(1) u(2)
u(i) u(N)
u(1) u(2)
r (x
( i 1) i
R N 1 i
, u ) (1.4.9.)
(i 2
оптимальное значение.
Таким образом, если известна оптимальная стратегия управления ữ N-1 для любого
возможного состояния х(1) первой стадии N – стадийного процесса, то уже не составляет труда
выбрать оптимальное управление и на первой стадии u(1)опт, поскольку на последующих стадиях
оно определяется выходом первой стадии
ữN-1= ữN-1(x(1) ) (1.4.10)
Процедура применения принципа оптимальности для оптимизации N-стадийного процесса должна
начинаться с последней стадии процесса, для которой не существует последующих стадий, могущих
повлиять согласно принципа оптимальности на выбор управления uопт(N) на этой стадии. После того как
оптимальное управление u(N)опт. найдено для всех возможных состояний входа последней стадии x(N-1)X,
можно приступить к определению оптимального управления для предыдущей (N-1) стадии, для которой
оптимальная стратегия управления на последующих стадиях (т.е. на последней N-й стадии) известна, и т.д.
В результате может быть найдена оптимальная стратегия управления для всего многостадийного
процесса, являющаяся функцией начального состояния процесса uN(х(0)). Если начальное состояние х(0)
известно ( задано или выбрано из условия оптимума критерия R), то его значение определяет оптимальные
управления для всех стадий процесса.
53
Рассмотрим более детально процедуру нахождения оптимального управления многостадийным процессом
Пусть величина критерия оптимальности многостадийного процесса определяется выражением:
N
ri( x
i 1 i
R N
, u ) (1.4.11)
i 1
Величина этого критерия зависит только от состояния 1-й стадии х(0), т.е.
RN=RN(x(0)) (1.4.12)
Критерий оптимальности RN-1, определенный также для N-1 последних стадий N-стадийного
процесса выражением (1.4.9), может рассматриваться как функция состояния выхода первой
стадии х(1):
RN-1=RN-1(x(1)) (1.4.13)
Предположим, что задача оптимизации состоит в нахождении оптимальной стратегии управления
uN,опт= (uопт(1), uопт(2),…, uопт(N),) (1.4.14)
максимизирующей величину RN. Обозначим через fN максимальное значение RN, которое может
быть получено при использовании оптимальной стратегии управления uN,опт. Значение fN также
зависит от состояния входа первой стадии x(0) и может быть определено как
f N ( x (0)) max R N ( x (0))
u (i ) U (1.4.15)
i 1,..., N
где максимизация производится по всем возможным управлениям u(i), принадлежащим области
допустимых значений U на всех стадиях процесса.
Соотношение (1.4.15) является математической формулировкой задачи оптимизации
N-стадийного процесса и не содержит указаний как именно нужно максимизировать критерий RN,
чтобы получить оптимальную стратегию (1.4.14).
Критерий оптимальности N-стадийного процесса является аддитивной величиной критериев
оптимальности отдельных стадий многостадийного процесса:
RN(x(0))=r1(x(0),u(1))+RN-1(x(1)) (1.4.16)
Подставим теперь уравнение (1.4.16) в уравнение (1.4.15). В итоге получим:
f N ( x (0)) max
r1( x (0),u (1) R N 1( x (1))
u (i ) U (1.4.17)
i 1,..., N
Соотношение (1.4.17) может быть выражено как
54
f N ( x (0)) r ( x ( 0) ,u (1) max R ( (1)
)
max 1 N 1 x
u (i )U
(1.4.18)
u (1)U
i 2,..., N
где максимизация первого слагаемого r1(x(0),u(1)) проводится только по управлению u(1), а второе
слагаемое максимизируется выбором управлений на всех стадиях u(i) (i=1,…N), поскольку
значения x(1) зависит от управления u(1). Разумеется, что в выражении, заключенном в квадратные
скобки, каждое слагаемой нельзя максимизировать в отдельности, так как величины обоих
слагаемых зависят от управления u(1). Причем на первое слагаемое управление u(1) влияет прямо, а
на второе это влияние сказывается косвенно, через изменение значения x(1). Рассмотрим задачу
максимизации 2-го слагаемого в соотношении (1.4.18). Эта задача может рассматриваться как
задача оптимизации для (N-1)-стадийного процесса с критерием оптимальности RN-1(x(1)).Этот
критерий оптимизируется выбором управлений u(i) (i=2,…,N). Принимая во внимание, что
оптимальная стратегия управления
uN-1,опт= (uопт(2), uопт(3),…, uопт(N),) (1.4.19)
максимизирует значение критерия оптимальности RN-1,найденного для N-1 последних стадий,
можно записать соотношение, которое аналогично выражению (1.4.15):
(1.4.18), получим:
55
f N ( x (0))
max r1( x ,u ) f
( 0) (1)
1( x (0),u (1))]
N 1[
u (1)U
(1.4.24)
Уравнение (1.4.24) является математической формулировкой принципа оптимальности. Оно
позволяет, зная оптимальную стратегию управления (1.4.19) для N-1 последних стадий процесса
стадии fN-1(x(1)), определить оптимальное управление на первой стадии uопт.(1). Выражение (1.4.24)
функций:
Последняя из этих функций fN(x(0)) отвечает искомому решению оптимальной задачи, поскольку
значение fN(x(0)) равно максимальному значению критерия оптимальности RN(x(0)). При этом в
Очевидно, что для начала расчетов по рекуррентному соотношению (1.4.24) необходимо задаться
f0(xN) = 0 (1.4.26)
56
Это соответствует отсутствию процесса за пределами последней стадии.
57
2.5. Принцип максимума Понтрягина.
При решении вариационных задач классическими методами возникают серьезные
трудности в тех случаях, когда отыскиваемые управляющие воздействия не принадлежат к классу
непрерывных функций или когда на переменные наложены ограничения типа неравенств. Для
решения таких задач может быть использован метод, сформулированный и доказанный в работах
Л.С. Понтрягина и его учеников, который получил название принципа максимума. Этот принцип
сформулирован и доказан как необходимое и достаточное условие оптимальности для процессов
описываемых линейными и нелинейными дифференциальными уравнениями.
Рассмотрим процесс, описываемый системой нелинейных дифференциальных уравнений:
d x ( , ,..., , ,..., )
dt
i
x x x u u i 1 2 m 1 r
(1.5.1)
(k ) (k ) (k ) (k )
x (t i
) x i
i 1,..., m или x (t ) x (1.5.4)
определяющие заданные значения всех или только некоторых переменных состояния х i для двух
значений независимой переменной t(0) и t(k). Состояние процесса при t=t(0) будем называть
начальным, а состояние процесса при t=t(k) конечным состоянием. Это позволяет
интерпретировать поведение процесса в фазовом пространстве переменных состояния как переход
из начального состояния х(0) в конечное состояние х(k) (рис1.5.1), или из начальной области в
конечную область (рис.1.5.2).
58
x(k)
x(k)
x(0)
F1(k)(x)=0
x(k)
F (0)(x)=0
F2(k)(x)=0
x(0)
59 F1(k)(x)=0
x(k)
F (0)(x)=0
F2(k)(x)=0
x(0)
Как было показано Л.С. Понтрягиным и его учениками, если ввести Гамильтониан Н и
вспомогательные переменные (t), связанные с переменными состояния и уравнениями движения
следующим образом:
m
H ( x1 ,..., x m , u1 ,..., u r ) (t ) (1.5.6)
i i
i 1
60
d H d xi H
i
(1.5.7)
dt xi dt
i
Анализ полной производной от функции Н по независимой переменной t имеет вид:
dH H dψ H dx H du
(1.5.8)
dt ψ dt x dt u dt
Принимая во внимание соотношения (1.5.7), получаем
dH H du
(1.5.9)
dt u dt
Как было показано, если оптимальное значение вектора управления uопт. находится внутри
допустимой области управления U, то максимальное значение функции Н соответствует точке
экстремума этой функции, для которой выполняется условие:
H H
0 или в обычной записи 0 , j 1,..., r (1.5.10)
u uj
Если же оптимальное управление находится на границе области управления U, заданной системой
неравенств
aj uj bj j=1,…, r (1.5.11)
то выполняется условие
du
0 (1.5.12)
dt
В любом из отмеченных случаев полная производная по t от функции Н, определяемая
соотношением (1.5.10) равна нулю. Это значит, что функция Н на оптимальной траектории имеет
постоянное значение.
Итак, принцип максимума утверждает, что если управляемый процесс описывается
системой дифференциальных уравнений, при использовании оптимального управления uопт.(t)
процесс переводится из начального состояния в конечное за минимально возможное время и
функция Н принимает на оптимальной траектории максимально возможное значение, т.е.
H [ψ(t ), x(t ), uопт. (t )] max [ψ(t ), x(t ), u (t )] (1.5.13).
uU
При этом, как было показано, это значение постоянно и неотрицательно вдоль всей траектории
процесса
61
(k ) (k ) (k )
H [ ψ(t ), x (t ), uопт. (t )] H [ ψ(t ), x (t ), uопт. (t )] 0 (1.5.14).
xi(t(0))=xi(0) i=1,…,m
xi(t(k))=xi(k) i=1,…,p (1.5.15)
i(t(k))=qi i=1,…, p
i(t(k))=0 i=p+1,…, m
где qi – некоторые произвольные постоянные, задаваемые в зависимости от постановки
оптимальной задачи.
E1 E2
k 1 k 01 e RгT
k 2 k 02 e RгT
- константы скорости основной и побочной реакций.
d H
1
( ) k 1 (T )
dt x1 1 2
(1.5.17)
d H
2
k 2 (T )
dt x2 2
Граничные условия : (t ) 0, (t
(k ) (k )
) 1
1 2
Таким образом, для решения оптимальной задачи необходимо решать систему дифференциальных
уравнений (1.5.16) и (1.5.17), образующих краевую задачу, поскольку граничные условия заданы
на разных концах интервала интегрирования, т.е. необходимо подбирать начальные условия для
вспомогательных переменных таким образом, чтобы выполнялись заданные конечные условия для
63
этих переменных. При этом на каждом шаге интегрирования определять оптимальное значение
температуры из допустимой области температур:
Tmin T(t) Tmax (1.5.18)
Для данной постановки оптимальной задачи можно получить аналитическое выражение для
оптимальной температуры, если взять производную от функции Н по температуре и приравнять ее
нулю:
H k 1
x1 ( ) k 2 x 2 0
T T 2 1 T 2
ki
k i (T ) E i 2 ; i 1,2
T Rг T
(T ) E1 ( ) k (T ) E x
(1.5.19)
k1 x 2
0
R г T 2
1 2 2 2
2
R T
1
г
2
k 1(T ) E1 x ( ) k (T ) E x 0
1 2 1 2 2 2 2
k 1(T ) E1 x ( ) k (T ) E x
1 2 1 2 2 2 2
После логарифмирования и разрешения полученного равенства относительно температуры найдем
следующее выражение для оптимальной температуры:
E E
T опт. (t ) 1
E k x ( )
2
(1.5.20)
R ln
1 01 1 2 1
E k x
г
2 02 2 2
При вычислении оптимальной температуры с использованием (1.5.20) возникают
трудности при вычислении температуры в начальный момент времени, когда х 2=0. Но эту
трудность легко преодолеть, подставляя в начальный момент времени в качестве температуры
Тmin. При интегрировании полученной системы уравнений на каждом шаге интегрирования
полученное по уравнению значение оптимальной температуры проверяется на принадлежность
64
заданной области допустимых управлений путем проверки неравенства (1.5.18). Если оптимальная
температура, вычисленная по уравнению (1.5.20) выходит за пределы допустимой области, то в
качестве текущего значения оптимальной температуры принимается Т min или Tmax, в зависимости
от того, какую границу нарушило вычисленное значение температуры. Если число управляющих
переменных более одного, или решение уравнения H/ T не допускает аналитического
выражения для оптимального управления, применяются методы нелинейного программирования
для определения управления, обеспечивающего максимальное значение Гамильтониана Н.
65
n
max i f i
0 или max H ( ψ, y, u) 0 (1.5.26)
i 1 u ( u )
u ( u )
Порядок решения задачи следующий:
1. Составляют функцию Гамильтона Н равную скалярному произведению векторов f и , т.е.
n
H f .
i i
i 1
2. Берут частные производные Н по uj, которые приравнивают нулю. Из полученной системы
уравнений находят uj, которые максимизируют функцию Н согласно уравнению (1.5.26). В
случае линейной зависимости Н от uj частная производная Н/uj является функцией одной
или нескольких составляющих вектора . При этом для достижения положительного
максимума Н необходимо, чтобы
uj=uj maxsign i(t) (1.5.27)
где
1 при 0
sign
(t ) i
i
1 при i
0
Таким образом, в данном случае управляющее воздействие при смене знака i(0)
изменяется скачкообразно от +umax до –umax или наоборот. Момент смены знака называется
моментом переключения.
3. Для нахождения вспомогательной функции i(t), определяющей управление, в частности
согласно (1.5.27) составляют и решают систему вспомогательных переменных согласно
уравнению (1.5.7)
d H
i
dt y
i
4. В случае замкнутой системы ищут зависимость управления от контролируемых координат
системы, соответствующих оптимальной траектории u=(y). При этом моменты переключения
определяются автоматически при отклонении фактической траектории от оптимальной. В
случае разомкнутой системы устанавливают количество изменений знака i(t), т.е. число
корней функции i(t). Моменты переключения могут быть найдены методом стыковки
решений дифференциальных уравнений со знакопеременной правой частью. При этом в
конечном итоге получают систему n трансцендентных уравнений с n неизвестными
моментами переключения ti (i=1,…,n), решение которых возможно только численными
66
методами. Исключение составляют системы, характеристическое уравнение которых имеет
кратные нулевые корни.
Пример: Пусть объект задан следующими уравнениями:
d y y y
2
d d
2
1
u или
dt
1
y f ;
dt
1
u f (1.5.28)
dt 2 1 2
Если положить, что y1=l, y2=v, u=F, то приведенная система описывает движение материальной
точки с единичной массой m=1, свободно и без трения движущейся по горизонтальной прямой с
координатами l – путь, v – скорость и снабженной двигателем, развивающим силу F=ma, где a=y2.
Требуется найти оптимальное управление u*, обеспечивающее максимальное
быстродействие системы при переходе ее из произвольного начального состояния y0 в конечное
равновесное состояние yT. На управление наложено ограничение uumax.
Решение. Составим функцию Гамильтона:
H=f11+f2 2 (1.5.29)
Так как функция Н линейна относительно u, то в соответствии с условиями максимума, имеем:
u*=umaxsign2 (1.5.30)
Для определения 2, а следовательно и u*, составим и решим систему уравнений для
сопряженных переменных:
d H d H
1
0; 2
(1.5.31)
dt y dt y 1
1 2
Интегрируя эти уравнения, найдем:
1=С1; 2=С2 – С1t (1.5.32)
где С1 и С2 – постоянные интегрирования. Поскольку функция 2 имеет один корень
t= C2/C1, то управление u* имеет одну перемену знака ( два интервала управления). Так как
начальные условия для функций i(t) неизвестны, постоянные интегрирования С 1 и С2 не могут
быть определены, то использование принципа максимума дает только качественное представление
об изменении управляющего воздействия – одно переключение. Для определения количественных
характеристик управления необходимо определить моменты переключения и продолжительность
управления Т. Для этого необходимо решить уравнения системы (1.5.28), правая часть которых в
соответствии с уравнением (1.5.30) знакопеременная.
67
d y
2
2
1
u max (1.5.33)
dt
Интегрируя (1.5.33), получим:
d y
y y u2 t C t C
2
1
umax t C1 ; max
1 2
(1.5.34)
2 dt 1
Исключив из уравнения (1.5.34) время t найдем уравнение фазовой траектории движения системы
y1=(y2)
2
y y (2 C 1) C
y
1
2
u
2
C
1 1
2
max
Пусть, например, точка при t=t0=0 находится в точке В.(рис1.5.3). Для быстрейшего
перемещения ее из этой точки в точку О необходимо вначале разогнаться с максимальным
ускорением (u=+umax), а затем затормозить с максимальным замедлением (u= - umax).
Соответствующие траектории ВА и ОА приведены на рис1.5.3. Заметим, что при любых
координатах точки В управление должно обеспечивать попадание материальной точки на фазовую
траекторию, входящую в начало координат (АОА). Именно на этой траектории происходит смена
знака управления, и поэтому она носит название линии переключения.
68
Рис. 1.5.3. Фазовые траектории движения точки при оптимальной траектории.
Уравнение этой линии при подходе материальной точки в точку О (t=T) слева и справа от
оси ординат находится из уравнения (1.5.34) и имеет следующий вид:
2
y
y 2
2 (1.5.35)
1
u max
Здесь при определении постоянных интегрирования С 1 и С2 учтено, что в точке О (при t=T)
координаты системы y1(t) и y2(t) равны нулю. Знак минус ставится при y2>0, знак плюс при y2<0.
Выражение (1.5.35) является уравнением параболы, лежащей в разных квадрантах в зависимости
от знака y2. Уравнение фазовой траектории для режима разгона также является параболой, но с
постоянными С1 и С2, зависящими от начальных условий y1(t0) и y2(t0). В общем случае фазовый
портрет системы представляет собой семейство парабол, различающихся произвольными
постоянными (рис.1.5.3).
Таким образом, для перемещения материальной точки из точки В в точку О необходимо
осуществить движение по траектории ВАО ( разгон – смена знака управления – торможение). Как
видно из фазового портрета в области I управление должно быть положительным С а в области II
отрицательным (y2 падает). Линия переключения и является границей, разделяющей области I и II.
Зная уравнение этой линии и состояние системы y1 и y2 , можно определить знак управления.
Запишем уравнения переключения (1.5.35) в виде:
2
( y1 , y 2 ) 2 u max y 1
y 2
sign y 2
0 (1.5.36)
Из (1.5.36) следует, что если начальные значения у 1 и у2 таковы, что изображающая точка не лежит
на линии переключения, то для области I (у1,у2)<0, а для области II (у1,у2)>0. Тогда уравнение
управляющего устройства примет вид:
u= umax sign (у1,у2) (1.5.37)
Таким образом, реализация даже такой простейшей замкнутой системы требует наличия
функционального устройства, вычисляющего функцию (у1,у2), и релейного исполнительного
элемента, выдающего управляющий сигнал в соответствии с уравнением (1.4.37).
В случае разомкнутой системы моменты переключения находятся методом
припасовывания дифференциальных уравнений. Воспользовавшись граничными условиями y1(t0)=
- y10; y2(t0)=0 и у1(Т)= у2(Т)=0, запишем уравнение (1.5.34) в виде:
69
y (t ) u2 t C t C y
max 2
1 0 0 11 0 21 10
y (t ) u t C 0
2 0 max 0 11
(1.5.37)
y(T ) u2 T C T C 0
1
max 2
0 12 0 22
y (T ) u T C 0
2 max 12
где С11, С12, С21, С22 – постоянные интегрирования на первом (разгон) и втором (торможение)
интервалах управления.
Так как координаты системы у1 и у2 непрерывны, можно произвести стыковку решений на
границе первого и второго интервала управления:
2 2 (1.5.38)
u max T
2
С11=0; С21=у10; С12=у10 С12=umaxT;
C 22
2
T=2t1;
t 1
y /u10 max
Таким образом, управление можно осуществлять с помощью программного
устройства, подающего команду на изменение знака управления в момент времени t=t1.
С помощью принципа максимума Понтрягина можно осуществлять последовательный
синтез различных систем управления, получая достаточные условия оптимальности, Однако
довести решение до числовых результатов не всегда удается. В большинстве случаев этот метод
ограничивается синтезом оптимальных систем управления, когда Гамильтониан позволяет в явном
виде получить частные производные по управляющим переменным и выразить их как явные
функции переменных состояния и сопряженных переменных. Однако сочетание принципа
максимума Понтрягина с нелинейными методами поиска экстремума позволяет очень строго о
корректно решать большой класс задач синтеза оптимального управления.
70
Пример.3. Определение оптимального температурного профиля для системы
параллельно последовательных реакций в реакторе идеального вытеснения
1.A+BP+B
2.A+CD+C
3.A+DF+D
P
T(t)
T
71
x3-расход окиси этилена на образование 1-го побочного продукта (этиленгликолей)
x4-расход окиси этилена на образование 2-го побочного продукта (политэтиленгликолей).
Задача оптимизации может быть сформулирована следующим образом:
Найти такое оптимальное изменение температуры реакции T* p(t), которое бы позволило за
некоторое заданное время контакта tk получить продукт с заданным содержанием целевого
продукта –x2(tk)=x2зад при минимальном общем расходе окиси этилена.
При такой постановке оптимальной задачи критерий оптимизации будет иметь следующий вид:
tk
x 0 ( x 2 x3 x 4) dt (5.3.2)
0
Запишем функцию Понтрягина (Гамильтониан) для системы (5.3.1) и (5.3.2)
H ( x 2 x 3 x 4) K 1 K 2 K 3 x 3 (5.3.3)
0 1 1 3
где i –вспомогательные переменные, уравнения для которых имеют следующий вид:
d H
1
dt x1 0
d H
2
K 3 (5.3.4)
dt x3 0 3
d H
3
dt x4 0
Краевые условия для системы уравнений для основных и вспомогательных переменных будут
иметь следующий вид в соответствии с условиями поставленной задачи:
x ( 0) 0
2 x (t ) 0.9
2 k
x ( 0) 0
3 (t ) 0
2 k (5.3.5)
x ( 0) 0
4 (t ) 0
3 k
Так как мы разыскиваем оптимальное управление из заданной области:
72
Тmin T*p(t) Tmax (5.3.6)
Обеспечивающее минимум критерия оптимальности, то в соответствии с условиями
трансверсальности вспомогательная переменная
0= 1 (5.3.7)
С учетом уравнения (5.3.7) систему (5.3.4) можно переписать в следующем виде:
d
1
1
dt
d
2
1 K 3 (5.3.8)
dt 3
d
3
1
dt
Уравнения (5.3.8) позволяют проанализировать вид зависимости вспомогательных переменных от
времени и сделать качественные выводы о характере оптимального управления.
Поскольку для 3-го уравнения системы (5.3.8) заданы граничные условия для вспомогательной
переменной, мы можем непосредственно получить решения для этой переменной. Оно имеет
следующий вид:
3(t)=tk-t (5.3.9)
откуда следует, что 3 монотонно возрастает от –tk при t=0 до нуля при t=tk.
Функция 2(t) также есть монотонная функция времени,, которая изменяется от некоторой
отрицательной величины при t=0 до нуля при t=t k. 1(t), так же как и 3(t) является уравнением
прямой, но поскольку ее значение на границах интервала не задано, она может либо целиком
расположена в отрицательной области, либо в положительной, либо переходить из одной области
в другую и менять знак в некоторой точке t s. Согласно принципа максимума Понтрягина
управление Тр(t) должно таким образом выбираться из допустимой области управления, чтобы
функция H(Tp) была бы максимальной. Из уравнения (5.3.3) видно, что H(T p) есть монотонно
возрастающая функция температуры. Следовательно, оптимальной температурой для этого
процесса будет максимально допустимая температура T max. Однако, выбор температуры должен
быть таким, чтобы выполнялось заданное граничное условие в конце процесса x 2(tk)= x2зад Анализ
показывает, что температура должна быть ступенчатой функцией времени, имеющей одну точку
переключения с одного допустимого уровня на другой. Точку переключения, в которой и
происходит изменение знака переменной 1(t), можно легко определить из решения 1-го
уравнения системы (5.3.1)
73
зад
K 1 (T max) t k x2
t (5.3.10)
s
K 1 (T max) K 1 (T min)
Из выражения (5.3.10) видно, что значение t s линейно зависит от заданного времени контакта t k и
заданного содержания целевого продукта. Значение критерия оптимальности может быть
рассчитано из решения системы (5.3.1) при выбранном оптимальном температурном режиме.
K (T
Выражение для критерия оптимальности имеет вид:
x 0
1 p2
) K 2 (T p 2) K 3 (T p 2) t s ( K 2 (T p 2) K 2 (T p1)) (t k t s )
1 1
K 2 (T p 2 ) K 3 (T p 2) (t k t s ) ( K (T p1) K 2 (T p1)) t s K 2 (T p1) K 3 (T p1)
2 2
2 1 2
(5.3.11)
Здесь Тр1 и Тр2 – температуры на участках 0-t s и ts-tk. Причем оказалось, что значение критерия
оптимальности не зависит от того, будет ли вначале температура минимальной (Т р1=Tmin) а затем
максимальной (Тр2=Tmax), или наоборот. Расчеты показали, что при t k=1.55 часа ts=0, т.е. все время
темпратура должна поддерживаться максимальной, а при t k=4.75 часа ts= tk весь процесс должен
проходить при минимальной температуре. При этом критерий оптимальности х 0 в первом случае
принимает минимальное значение, а во втором- максимальное. Однако проводить весь процесс
при времени tk=1.55 часа невыгодно по следующим соображениям:
1. Нужно было бы в начале нагреть смесь до температуры T p=Tmax, а затем интенсивно охлаждать
реакционную смесь для поддержания заданной температуры, так как процесс высоко
экзотермичен. Это потребует дополнительных затрат как на организацию дополнительного
подогрева, так и на более интенсивное охлаждение реактора. Выигрыш в эффективности
процесса при уменьшении времени от 2.5 часов до 1часа 50 минут небольшой.
2. Чувствительность процесса к колебаниям параметров процесса с повышением температуры
также увеличивается. Это повышает требования к системе автоматического регулирования
реакторного узла.
Более выгодным является такой температурный режим, при котором на первом участке до t=t s
температура поддерживается на минимальном уровне (Т р1=Tmin), а затем она переключается на
верхний уровень (Tp2=Tmax). В этом случае можно использовать тепло реакции для перевода
процесса с минимальной температуры на максимальный уровень. На рис. 5.3.3 показан
профиль изменения переменных состояния при оптимальном управлении процессом.
74
ts ,час
5
1
t k,час
0
1.5 2.5 3.5 4.5
Рис.5.3.2. Зависимость момента переключения
управления от времени контакта
75
xо,кмоль/м3
1.9
1.8
1.7
1.6
t k ,час
1.5
1.4 2.0 3.0 4.0 5.0
Рис.5.3.3. Зависимость величины критерия оптимальности от
времени контакта
76
хо,кмоль.м3
Тр,К
315
T* p,max
305
x o (t)
295 x 2 (t)
T p,min
285
t k ,час
275
0 0.5 1.0 1.5 2.0 2.5
Рис.5.3.4. Профили изменения температуры и концентраций в оптимальном режиме при t k=2.5
часа
77
78
2.6. Методы поиска экстремума функций.
равной длины, то есть возможность локализовать экстремум гораздо быстрее. Было найдено, что
это отношение отрезков, на которые нужно делить весь заданный интервал, равно 0.38. Это
сечением. При использовании метода золотого сечения имеется возможность после одного
В этой точке рассчитывается значение функции R(u), после чего снова выбирается сокращенный
начиная с пункта 4.
Для изложенного алгоритма была получена формула для вычисления точности определения
s 3
ba 5 1
(1.6.4)
2
2
При применении метода «золотого сечения» для того же числа расчетов значений функции R(u)
достигаемая точность в 10 раз выше, чем при использовании метода деления интервала на равные
части.
80
Метод поиска с использованием чисел Фибоначчи.
Показано, что свойства последовательности чисел Фибоначчи, описываемой рекуррентным
соотношением
Fk=Fk-1+Fk-2 ; F0 = F1 (1.6.5)
Можно использовать для поиска экстремума функции одной переменной.
Доказано, что если требуется найти положение экстремума функции R(u), определенной на
интервале [a,b] c абсолютной ошибкой, не превышающей:
ba
(1.6.6)
F s
Где Fs – s-e число Фибоначчи, то для отыскания положения экстремума достаточно вычислить не
более s значений функции R(u). Так, например, при выполнении s=21 расчетов точность
определения экстремума составит
1 1 4
0.56 10 (1.6.7)
b a F s 17711
Эта точность оказывается более высокой, чем в приведенных выше методах поиска деления
интервала на равные части и «золотого сечения».
Алгоритм поиска с использованием чисел Фибоначчи имеет следующий вид:
1. По заданной точности , с которой необходимо найти положение экстремума функции R(u) в
интервале [ a, b ], рассчитывается вспомогательное число N.
ba
N
2. Для полученного значения N находится такое число Фибоначчи, чтобы выполнялось
неравенство
Fs-1 < N < Fs
3. Определяется минимальный шаг поиска по формуле:
ba
m
F s
82
Градиентный метод поиска экстремума функций многих переменных.
При градиентном методе вычисляют частные производные оптимизируемой переменной
по варьируемым параметрам – управляющим воздействиям и каждое следующее значение
управляющих переменных делают в направлении градиента оптимизируемой функции по
варьируемым переменным следующим образом:
(k ) (k )
ui M ui M
( k 1) (k ) (k )
u (1.6.8)
ui ui
i
(k ) ( k 1)
(1.6.9)
Если условие (2.1.2) выполняется ( при поиске минимума), то следующий (k+1)-й шаг делается в
этом же направлении, если же условие (2.1.2) не выполняется, то делается возврат в предыдущую
точку, вычисляется новое значение градиента и делается шаг с новым значением градиента.
При некоторых модификациях этого метода выбирается оптимальное значение коэффициента
пропорциональности М, с которым делается шаг в направлении градиента. Рассматривая этот
коэффициент как новую варьируемую переменную, можно применить метод
однопараметрической оптимизации, например метод золотого сечения, и определяется экстремум
функции на выбранном направлении градиента.
Метод релаксации
Алгоритм метода заключается в отыскании осевого направления, вдоль которого целевая
функция изменяется наиболее сильно. Для этого в начальной точке поиска определяются частные
83
производные оптимизируемой функции по всем варьируемым переменным. Осевому
направлении. По направлению убывания целевой функции производятся шаги до тех пор, пока не
будет получено минимальное значение по выбранному осевому направлению. При этом для
определения величины шага по этому направлению поиска также может быть использован один
Критерием окончания поиска является достижение такой точки, при движении из которой по
2
R
n
(1.6.10)
u j
j 1
84
Здесь - заданная точность достижения экстремума. При это условие превращается в точное
условие равенства нулю производных в точке оптимума. Разумеется, что условие (1.6.10) может
быть использовано только в том случае, когда оптимум находится внутри допустимой области
критерий типа (1.6.10) непригоден, и вместо него следует применять условие положительности
всех производных по допустимым осевым направлениям. При этом допустимым будет только
направление внутрь области U. Обратное направление по той же оси ведет за пределы области U,
если, конечно, рассматриваемая ось не является касательной к границе области в данной точке.
Алгоритм спуска для выбранного направления может быть записан в следующем виде:
( p)
( k 1) (k ) (k ) R(u )
u j
u j h sgn
u j
(1.6.11)
Где uj(k) – значение изменяемой переменной на k-ом шаге спуска, h(k) – величина k-го шага, которая
может изменять свое значение в зависимости от номера шага, sgn – функция знака; u(p) – вектор
85
Рисунок 1.6.1 Траектория движения к экстремуму при использовании метода релаксации
Очевидно, что скорость движения к оптимуму будет зависеть от величины шага h(k). Хорошие
Метод сканирования.
Описанные выше метода поиска экстремума иногда являются малоэффективными, если у функции
экстремума. В таких ситуациях иногда оказывается очень полезным так называемый метод
ряде точек, принадлежащих допустимой области управления и нахождения среди них такой точки,
где критерий имеет минимальное (или максимальное ) значение. Точность метода определяется
86
тем, насколько «густо» располагаются точки сканирования в допустимой области изменения
переменных.
Основным достоинством метода сканирования является то, что при его использовании с
в большом числе точек. Это должно гарантировать, что оптимум не будет пропущен. Этот метод
начальная точка поиска. Метод сканирования лишен этого недостатка и поэтому его иногда
оптимумов.
сокращения числа вычислений, необходимых для отыскания оптимума, часто применяют метод
область разбивается с помощью более мелкой сетки. В узлах этой сетки вычисляется значение
87
функции и уточняется положение оптимума. Эффективное применение этого метода
Q N
q 1 i 1
x (qiр) x (qiэ) (ln k
2
01
,. ln k 01e . ln k 02 , E1 , E 1e , E 2 ) min (1.6.3.
3)
Используя систему ReactOp, созданную для разработки и идентификации математических моделей
можно решить эту задачу, используя метод нелинейного программирования для поиска набора
такого набора параметров, который обеспечивает минимум функции (1.6.3.3). Расчетные значения
переменных состояния, соответствующих концентрациям реакционной смеси, получаются путем
численного интегрирования системы уравнений (1.6.3.2) с параметрами математической модели,
получаемыми на каждом шаге поиска в соответствии со следующим алгоритмом метода
нелинейного программирования:
(i ) (i )
k j M k j M
( i 1) (i ) (i )
k j
k j k j
(1.6.3.4)
где i-номер шага поиска, М –коэффициент пропорциональности изменения
параметра в направлении градиента минимизируемой функции. При градиентном методе
параметры изменяются на каждом шаге поиска в направлении градиента, однако этот
метод требует большого объема вычислений, связанных с необходимостью вычисления
градиента функции в каждой точке поиска. Для сокращения объема вычислений
применяют обычно так называемый метод наискорейшего спуска.
При использовании этого метода после каждого шага в направлении к экстремуму
проверяется удачным ли был этот шаг:
(i ) ( i 1)
(1.6.3.5)
Если условие (6) выполняется, то следующий (i+1)-й шаг делается в этом же
направлении, если же условие (6) не выполняется, то делается возврат в предыдущую
точку, вычисляется новое значение градиента и делается шаг с новым значением
89
градиента. Эти методы называются линейными градиентными методами, потому, что при
вычислении производной функции рассогласования по формуле (1.6.3.4) мы заменяем
производную ее конечно-разностным выражением,.. Это эквивалентно тому, что мы
разлагаем неизвестную функцию (kj) в ряд Тейлора по искомым параметрам модели и
отбрасываем все члены разложения, за исключением членов, содержащих параметры в
первой степени. Используются также различные модификации этих линейных
градиентных методов, ускоряющих их сходимость. Например, для выбора коэффициента
пропорциональности М в формуле (1.6.3.4) используют методы поиска экстремума
функции одной переменной – метод «золотого сечения» или метод чисел Фибоначчи. Эти
методы позволяют быстро достичь минимума на определенном направлении градиента.
Однако часто некоторые параметры модели оказывают очень большое влияние на
функцию рассогласования. Поэтому для этих случаев используют так называемые методы
квадратичного программирования. При использовании этих методов частные производные
минимизируемой функции вычисляются из выражения разложения функции (kj) в ряд
Тейлора с учетом квадратичных членов.
= b0 +biki+bijkikj+biiki2 (1.6.3.6)
В этом случае получаются более точные значения производных, что позволяет локализовать
положение экстремума.
На рис. 1.6.3.2 Показаны рассогласование экспериментальных и расчетных данных при начальном
приближении параметров модели.
Начальное приближение:
90
20 10
8
15
A, kmol/m3
D, kmol/m3
10
0
0 5 10
Length, m 0
0 5 10
Length, m
10
10
8
8
6
6
C, kmol/m3
D, kmol/m3
4 4
91
2 2
0 0
0 5 10 0 5 10
Length, m Length, m
Рисунок 2.6.3 Описание экспериментальных данных моделью при начальном приближении
92
20
4
3
15
A, kmol/m3
D, kmol/m3
2
10
0
5 0 5 10
0 5 10 Length, m
10 Length, m
10
5
6
C, kmol/m3
B, kmol/m3
4
0
0 0 5 10
0 5 10 Length, m
Length, m
оптимальное управление, заданное в виде функций времени или длины для любых объектов при
математическом описании объекта, этот метод не всегда может быть успешно использован в связи
Для таких сложных случаев более целесообразен следующий подход: Искомую оптимальную
Для учета этих мы в процесс поиска будем проверять находимую температуру на выполнение этих
неравенств. Если температура оказывается меньше Tmin, для решения уравнений модели и
вычисления целевой функции используется Tmin. При нарушении верхнего предела по температуре
, используется Tmax . Таким образом мы всегда находимся в допустимой области управления. При
наличии ограничений на переменные состояния, формируется функция штрафа, учитывающая
возможность выполнения ограничения. На рисунке показано полученное оптимальное управление.
95
500
450
400
K
350
300
0 5 10
Length, m
96
20
15
kmol/m3
10
0
0 5 10
Length, m
97
Из полученного решения видно, что максимальное значение критерия оптимизации
достигается внутри реактора. Затем критерий постепенно и незначительно уменьшается.
Следовательно, для достижения максимального значения критерия оптимизации для данного
случая необходимо либо уменьшить длину реактора до величины примерно 6 метров, либо
увеличить скорость потока, а следовательно производительность. Это можно сделать в
зависимости от заданных условий функционирования. Используемый метод оптимизации не
гарантирует нахождения глобального оптимума. Поэтому для нахождения глобального оптимума
нужно задавать различное начальное приближения для поиска оптимума и исследовать находимые
локальные экстремумы. Из семейства найденных локальных экстремумов выбирается наиболее
подходящий, как по достигаемой величине критерия оптимизации, так и по возможности его
реализации. Несмотря на кажущуюся громоздкость такого подхода, с помощью
автоматизированной системы поиска оптимума решение можно получить достаточно быстро.
100
Рис2.7.2.1 Экстремальная зависимость температуры топочных газов
101
Рис.2.7.2.2 Функциональная схема Э С У для системы «Дизель-Генератор»
102
Где U=sign=sign{’q +signv}- функция переключения; sign - единичная функция, знак
которой определяется знаком функции ; - зона нечувствительности экстремального
регулятора.
103
Динамические характеристики ЭСУ.
Важное значение для оценки качества управления с помощью ЭСУ имеют
динамические характеристики объекта при управлении его работой с использованием
ЭСУ.
Это особенно важно для объектов сложной структуры, содержащей нелинейные звенья.
Рассмотрим объект, содержащий два последовательно соединенных звена:
безынерционное нелинейное звено (НЗ) и линейное звено (ЛЗ). Функциональная схема
системы изображена на рис.2.7.2.4.
104
Экстремальный регулятор ЭР функционирует на основании информации о знаке
производной в соответствии с уравнением (2.7.2.2)
Определим динамические показатели работы системы.
Перепишем уравнение (2.7.2.4) с учетом (2.2.7.3) в следующем виде:
d du 2
T 0 K0 u
du dt
Тогда с учетом (2.7.2.5) и (2.7.2.2) имеем:
d 2
T 0 К и v0 K 0 u (2.7.2.6)
du
Обозначив
1
a; K 0
b
T 0 К и v0 T К v
0 и 0
d 2
Получим a b u (2.2.7.7)
du
Общее решение уравнение вида (2.2.7.7) при v = v0 ищется в виде:
e (b u ) e du C
adu 2 adu
где С – постоянная интегрирования.
После двойного интегрирования по частям выражения, стоящего в квадратных
скобках, получим
a u b 2 2b 2b
С e u 2 u 3 (2.2.7.8)
a a a
где С определяется из начальных условий u(0) = u0 и (0)=0:
b 2 2b 2 b a
С 0 u0 2 u0 3 e u0 (2.2.7.9)
a a a
В соответствии с уравнением (2.2.7.8) на рис. 2.2.7.5 построена фазовая траектория,
характеризующая движение системы на фазовой плоскости с координатами ,u.
105
Рис.2.7.2.5. Фазовая траектория при работе экстремального регулятора
110
При декомпозиции системы на подсистемы расчленение системы осуществляется сверху вниз,
выделяя отдельные автономные подсистемы, выполняющие самостоятельные функции и имеющие
локальные цели, соответствующе достижению общей цели функционирования.
На рис. 3.1 изображена иерархическая структура производственного предприятия.
I
V
III
...
II-1 II-2 II-
S
III
...
II-1 II-2 II-
S
112
Задачи управления, выполняемые на этом уровне иерархии, являются наиболее
ответственными, ибо именно здесь происходит процесс превращения исходного сырья в
конечные продукты, и от того, насколько экономично происходят эти процессы, зависит
эффективность работы всего предприятия. Это понимал еще известный капиталист Генри
Форд, который высказал крылатую фразу: «Деньги текут из цеха, а не из банка». Эту фразу
он использовал как девиз и основной постулат управления своими производствами, что и
позволило ему работать весьма прибыльно.
Целью функционирования технологических цехов и отдельных производств
является выпуск установленных количеств отдельных видов продуктов, или
полупродуктов для других цехов заданного качества.
Показателями эффективности функционирования подсистем этого уровня иерархии
являются расходные нормы по сырью, топливу, энергоресурсам (электроэнергия, пар,
охлаждающая вода и т.д.), производительность, себестоимость производимой продукции.
Нормальный режим функционирования нарушают следующие возмущающие воздействия:
1. Изменение спроса на производимые продукты.
2. Изменение выпуска используемого сырья.
3. Изменения требований к качеству выпускаемых продуктов, требующих изменения
технологии.
4. Аварийные остановки.
5. Ремонтные остановки обеспечивающих цехов.
На втором и третьем уровнях иерархии возникают задачи оптимизации и
программирования с целью создания оптимальной координации функционирования элементов и
подсистем и оптимального распределения и согласования технологических потоков между ними.
Целью функционирования предприятия является выпуск установленного
ассортимента продукции с заданными качественными показателями.
Эффективность функционирования предприятия определяется экономическими
показателями, поскольку варианты организации производства, часто эквивалентные по своим
технологическим показателям, могут иметь разные экономические показатели. Можно выделить
следующие экономические показатели:
1. Количество реализованной продукции, т/год. Если предприятие выпускает n продуктов, этот
показатель характеризуется не единственным параметром, а совокупностью параметров {Bj},
где j=1,…,n.
2. Качество выпускаемой продукции по каждому из выпускаемых продуктов. По каждому из
продуктов может быть совокупность качественных показателей pj. Этот показатель
характеризуется множеством {jr}, где r-=1,…,pj.
3. Эксплуатационные затраты на производство продукции З э.
4. Капитальные затраты К, включая затраты на создание необходимых оборотных средств.
113
В качестве обобщенного показателя экономической эффективности производства можно
использовать так называемый приведенный доход в руб/год
n
Д Ц B j Зэ Е K t (3.1)
пр j
j 1
Где, Цj – отпускная цена на j-й продукт, руб./т, Bj –годовой объем реализации j-го
продукта, Зэ – суммарные эксплуатационные затраты, руб/год, Е – нормативный показатель
эффективности капвложений, год -1, Кt – производственные фонды, т.е. единовременные
затраты с учетом фактора времени, руб.
Возмущающими воздействиями, которые вызывают отклонение в
функционировании предприятия, являются - возможные аварии, неравномерность
поступления сырья, изменения спроса на выпускаемую продукции, колебания цен на
энергоресурсы и др.
Системы управления производством в целом, представляют собой автоматизированные
информационно-вычислительные системы, объединяющие и координирующие работу
всех систем управления предыдущих уровней иерархии.
На каждом уровне иерархии используются свои подходы к системе управления. Для I-го
уровня иерархии стремятся использовать подходы, обеспечивающие работу объектов в
автоматическом режиме без участия человека. В зависимости от степени изученности
объекта и цели функционирования используются различные методы оптимального
управления, либо адаптивного управления, включая самонастраивающиеся системы
управления, обеспечивающие автоматический выбор структуры управления, параметров
настройки и выбор управляющих воздействий.
На верхних уровнях иерархии задачи управления становятся менее
формализованными, часто отсутствует в явном виде связь между критерием
эффективности и управляющими параметрами, возникают трудности в формировании
единого обобщенного критерия эффективности. В контуре управления появляется человек
как участник процесса управления. Появление человека приносит целый ряд
дополнительных сложностей в формализацию задачи управления. Человек, как элемент
системы управления, представляет собой плохо предсказуемое звено. С другой стороны
человек обладает мощной интуицией и прогнозирующей способностью, которых
невозможно достичь с использованием чисто технических средств управления.
114
3.3.Особенности системы «Человек-машина»
116
Состояние объекта управления Состояние
Состояние
объекта объекта управления
не полностью Состояние
объекта не
определено полностью
Н=0 определено
Состояние
определено объекта
Н=0 управления Состояние
определено
Н=Н
Состояние
объекта объекта управления
max не полностью Состояние
Н=Н
объекта
max не полностью
определено Н=0 определено
определено Н=0
Н=Н определено
max
Н=Н max
118
• исследовать функционирование системы в динамике, т.е. на различных
этапах ее существования: при проектировании, производстве, эксплуатации.
Таким образом, максимально возможное обобщение методов исследования
разнообразных технических устройств, природных компонентов и человека, но не исключающее
в то же время дифференцированного подхода к отдельным элементам СЧМ, позволяет
реализовать системный (комплексный) подход при создании СЧМ как системы, объединенной
общей целью функционирования.
121
3.5.Разработка алгоритмов управления большими системами с использованием различных
методов.
122
ВИ к ИУ
ВП ЧО ВПО
З У ОО З
П
ВИ к ИУ
ВП ЧО ВПО
З У ОО З
П
( )
k
(3.5.1)
P(k ) e
k!
Где P(k) – вероятность того, что за время произойдет ровно k событий (поступлений заявок; -
плотность потока заявок (среднее их число в единицу времени).
Важной характеристикой потока является закон распределения длины промежутка
времени между поступлениями заявок. Вероятность того, что Tt ( здесь t – время,
отсчитываемое от момента предыдущей заявки), можно получить, положив в выражении (3.5.1)
k=0:
P{Tt) = P(t) = P(k=0) = exp(-) (5.3.2)
Тогда вероятность противоположного события (поступление заявки за время Т):
P{T<t} = f(t) = 1 – exp( - ) (5.3.3)
При этом числовые характеристики случайной величины T (математическое ожидание mT и
среднее квадратическое отклонение T) mT = T = 1/.
Кроме характеристик входного потока заявок режим работы зависит и от характеристик
производительности самой системы: числа параллельно работающих
каналов и быстродействия каждого канала, При этом одной из важнейших характеристик
является время обслуживания одной заявки Т, которое во многих случаях имеет
экспоненциально распределение типа:
P{To<t} = Fo(t) = 1-exp(-t) (5.3.4)
Где - параметр, который равен величине, обратной времени обслуживания mTo.
Таким образом, если известны характеристики входного потока и производительности
системы, то для обеспечения установившегося режима обслуживания, обеспечивающего
124
нормальное функционирование объекта, необходимо выполнение условия mT>mTo, или <. При
этом, чем больше mT по сравнению с mTo, тем более надежно работает система.
Пример: Входная информация, поступающая к оператору на рис.3.3 представляет собой поток с
плотностью = 2 заявки в минуту. Среднее время обслуживания одной заявки mTo = 0.4 минуты.
Определить, существует ли установившийся режим обслуживания.
Решение: Параметр = 1/ mTo=1/0.4 = 2.5> = 2. Следовательно, стационарный режим
обслуживания существует.
В случае > возникает необходимость увеличить производительность системы. Например, при
переходе к групповой деятельности операторов система становится многоканальной, что
увеличивает ее производительность пропорционально количеству каналов. Другим путем
выполнения условия < является либо снижение плотности потока заявок, за счет передачи
части функций оператора системам автоматического управления, либо увеличения величины
за счет обучения оператора и снижения времени обслуживания одной заявки. При этом
возможность совершения ошибок и последующее их исправление может рассматриваться как
поток отказов системы, а время их исправления может рассматриваться как время
восстановления работоспособности системы.
Применение методов теории массового обслуживания для построения модели
деятельности СЧМ не всегда дает удовлетворительные количественные оценки, так как входной
поток заявок не всегда является простейшим, а распределение времени обслуживания Т о не всегда
подчиняется экспоненциальному закону (5.3.4). Кроме того, входной поток заявок не всегда
однороден и иногда не может быть разбит на несколько однородных потоков по определенным
признакам: срочности, важности, затратам на обслуживание и т.п. Однако применение теории
массового обслуживания позволяет в первом приближении решить многие вопросы организации
деятельности операторов: определить необходимое число операторов, выработать требования к
125
уровню их полготовки, установить допустимую плотность потока сигналов, решить возможности
взаимодействия между операторами и т.п.
126
Внешних проявлениях таких факторов, как состояние напряженности оператора, его
квалификация, слаженность работы коллектива, особенности памяти оператора, его реакция,
эмоциональная устойчивость и т.п.).
Изменения порядка отдельных действий, числа операторов, их психофизиологических
характеристик, условий работы и т.п. для получения интегральных показателей качества
работы оператора.
Сопоставляя полученные результаты , можно выбрать оптимальный по принятому критерию
вариант деятельности оператора.
Имитационное модели деятельности оператора можно разбить на два класса:
Модели решения оператором конкретной задачи, в частности связанной с определением
закона распределения времени выполнения отдельных операций.
Модели функционирования оператора в условиях потока таких задач, где вероятностные
характеристики решения конкретных задач считаются известными, в частности при заданных
функциях F1(t) F2(t) (F1(t) –функция распределения вероятности выполнения некого действия,
F2(t) - функция распределения вероятности отказа некого действия ).
В результате имитационного моделирования можно вычислить многие показатели работы
оператора: своевременность решения задач, степень загрузки в период занятости оператора и др.
127
развития откликов на управляющие воздействия операторов во времени, либо на основе детальной
математической модели объекта, созданной на основе закономерностей происходящих в объекте
процессов. Такие модели обладают более правильными реакциями на действия операторов и
позволяют проводить исследования действий операторов в критических ситуациях, при значениях
параметров процесса, соответствующих протеканию в аварийном или предаварийном режимах.
Модели, полученные методом имитационного моделирования, не могут описывать процессы в
этих ситуациях. Поэтому этому подходу в настоящее время уделяется большое внимание и
разрабатываются детальные динамические модели для создания тренажеров для потенциально
опасных процессов. Эти работы проводятся для крупнотоннажных химических , нефтехимических
и металлургических процессов, так как при переходе этих процессов в аварийное состояние могут
возникнуть ситуации, опасные для окружающей среды и населения. Поэтому, несмотря на
дороговизну этих работ и трудоемкость, эти работы проводятся очень интенсивно в последнее
время как в нашей стране, так и за рубежом. С помощью таких тренажеров, проводя имитационное
моделирование развития процесса, можно не только изучить свойства поведения оператора в
нормальном и аварийном режимах функционирования, но провести отбор операторов по их
психофизическим параметрам и провести их подготовку, не подвергая опасности ни процесс, ни
самих операторов, ни окружающую среду. Поэтому это направление имитационного
моделирования в настоящее время интенсивно развивается. Практически, для всех крупных
систем управления заказчики выдвигают требования создания тренажеров для решения проблем
отбора и подготовки операторов.
128
исполнительные механизмы управления. Основным понятием теории информации является
энтропия Н, которая характеризует меру первоначальной неопределенности объекта и зависит от
числа возможных его состояний N и от вероятности этих состояний pi (i=1,…N). Для
количественной оценки энтропии К. Шенноном было введено соотношение
N
H p log p (3.5)
i 2 i
i 1
N
функции H = f(p1,…, pi,…, pN) на условный экстремум при p
i 1
i
1 . Тогда при
pi= p = 1/N
1 N 1
H max
log log N (3.6)
N i 1 2 N 2
129
минимальное число вопросов, необходимое для выяснения содержания данного
сообщения, не меньше, чем количество информации, заключенной в сообщении. Заметим,
что выражения (3.50 и (3.6) определяют энтропию объекта с конечным числом состояний
N. В случае, если объект обладает бесконечным числом состояний, то N и Н.
Отсюда вытекает невозможность абсолютного знания. Для того, чтобы понятие энтропии
распространить на упомянутый класс объектов, необходимо определять состояния объекта
с фиксированной точностью Х, в пределах которой эти состояния практически
неразличимы. Это позволяет непрерывную величину свести к набору дискретных
состояний и пользоваться формулами (3.5) и (3.6).
4. При объединении нескольких независимых объектов в один их энтропия суммируется, т.е.
энтропия обладает свойством аддитивности:
N1 N2
H ( X , Y ) p log p p log p p log p H ( X ) H (Y )
ij 2 ij i 2 i j 2 j
i 1 i 1
(5.3.7)
где pij – вероятность того, что объединенный объект примет состояние Х=х i, Y=yj ( для
независимых объектов pij = pipj).
Количественная оценка информации позволяет согласовать производительность источника
информации с пропускной способностью канала связи. Под пропускной способностью канала
понимают количество информации, которое способен передать канал связи в единицу времени:
C=Ic,max/c, где Ic,max – максимальная информация в одном сигнале, c – длительность передачи
одного сигнала.
Число возможных сообщений N= mn, где m = - число отличительных признаков. Тогда:
H log N
I c,max max
2
log m (3.7)
n n 2
130
При двоичном коде m=2 и Ic,max= 1бит. Если известна производительность источника информации
Ic , то для передачи этой информации без задержки необходимо, чтобы выполнялось условие C>Ic.
Применение теории информации при исследовании человека как составляющей части
СЧМ позволяет решать следующие задачи:
Производить оценку сложности работы оператора, а также оценку времени, затрачиваемого на
переработку информации.
Согласовывать производительность источника информации Ic с психофизическими
возможностями человека по ее приему и обработке. Пропускная способность человека
определяется характером деятельности. Если эта деятельность может быть представлена как
канал без памяти (работа машинистки, корректора и т.д.), то С=1070 бит/сек, если канал с
кратковременной памятью - С=24 бит/сек. Если длина сообщения превышает объем
кратковременной памяти человека, то для его запоминания необходимо многократное
повторение. При этом величина С снижается до десятых долей бит в секунду.
131
Теория информации учитывает только количество информации, но не учитывает ее качество.
Для человека же смысловое значение сообщения может иметь решающее значение для
скорости обработки этого сообщения.
Если перечисленные факторы в условиях конкретной задачи не очень существенны, то
применение теории информации оказывается весьма плодотворным при оценке свойств
человека в СЧМ.
132
bij
aij (3.10)
Это означает, что игроки стремятся прийти к противоположным, с точки зрения каждого из них,
результатам. Если равенство (3.10) выполняется такие игры называются антагонистическими ,
или играми с нулевой суммой.
Математическое ожидание выигрыша А при выборе им распределения вероятностей
выборов до того как это сделал В, будет описываться выражением:
На основе этой теоремы о минимаксе может быть построен алгоритм многошагового метода
поиска оптимального решения задачи достижения заданного конечного состояния. Введем новую
функцию
f k
( c ) min max Eh ( x k )
(3.15)
i ij
p q
Здесь минимум определяется по множеству всевозможных распределений, выбираемым нами на
каждом шагу xk процесса поиска оптимального решения, а максимум – по множеству
распределений, устанавливаемым нам процессом. Тогда , используя принцип оптимальности в
сочетании с теоремой о минимаксе, можно построить следующий алгоритм поиска распределений
выбора, приводящий к выигрышу, т.е. к достижению поставленной цели функционирования
оператора в СЧМ:
133
f (c ) min max p q f [ g (c, y (i ) , (i ) )]
k i j k 1 1 r 1
p q i, j (3.14)
max min
q p
... (k 2,3....)
f 1
( c ) min max p q h[ g (c, y (i ) , r (i ) )]
i j 1
i, j
p q 1
(3.15)
max min... (k 2,3....)
q p
135
тщательного изучения объекта и задачи управления, путем анкетирования специалистов-
технологов, хорошо знающих объект управления и выступающих в качестве экспертов.
Схема фаззи-регулирования приведена на рис. 4.1.
Центральным звеном фаззи-регулятора является блок нечеткого вывода (БНВ), или блок
принятия решений. В этом блоке на основе нечеткой информации о сигнале ошибки
рассогласования делается вывод о соответствующем множестве значений управляющего
воздействия. Блок фазификации (БФ) преобразует четкие значения величины рассогласования в
нечеткие, а блок дефазификации (БДФ) преобразует нечеткие рекомендации по управлению
объектом в конкретный управляющий сигнал u*.
136
Рис.4.1. Функциональная схема фаззи-
управления
4.2. Элементы теории нечетких множеств.
Обычная теория множеств оперирует с множествами и их элементами, объединяемые в множества
по определенным признакам. При этом набор этих признаков позволяет обычно однозначно
отнести данный элемент к этому множеству. Эта принадлежность записывается следующим
образом: хХ.
Факт принадлежности элемента к множеству описывается с помощью функции принадлежности
(х), которая для четких множеств принимает значения 1,если элемент принадлежит множеству, и
0, если элемент не принадлежит множеству.
Такой жесткий однозначный принцип принадлежности не пригоден для описания и
классификации нестрогих понятий и высказываний типа, больше, немного больше, немного
137
меньше и так далее. Эти высказывания широко используются в обычном естественном языке, с
помощью которого можно описать большой круг сложных явлений и процессов.
Для того, чтобы представить приблизительное словесное описание свойств предметов и
явлений на языке теории множеств, Л.Заде ввел понятие лингвистической переменной,
значениями которой являются слова или фразы естественного языка. Например, возраст человека
на бытовом языке характеризуется понятиями ребенок, юноша, молодой человек, зрелый,
пожилой, старый. Введя эти понятия в виде набора элементов множества, мы можем ввести
некоторую шкалу соответствия между этими понятиями и возрастом человека.
138
7
5
Опеделения, Xl
0
0 10 20 30 40 50 60 70 80
Возраст в годах
139
различные диапазоны базовой переменной. При этом функция принадлежности (ФП),
ограничивающая значение базовой переменной, принимает значения из интервала [0,1].
1,200
1,000
Функци принадлежности
0,800
0,600
0,400
0,200
0,000
0,000 10,000 20,000 30,000 40,000 50,000
-0,200
Возраст. годы
(х)=exp[-(x-m)] (4.1)
140
Как видно, зависимость представляет собой функцию треугольной формой, которой чаще всего и
пользуются на практике. На следующем рисунке представлено все терм - множество возрастов.
пинадлежности
2
Функция 0
-2 0 50 100
Возраст, годы
Так как для понятий ребенок и старый человек существует лишь одностороннее ограничение,
функция принадлежности к этим категориям представлена в виде трапеции.
Обычно используют вместо абсолютных значений базовой переменной ее нормированные
значения. Достаточно удобной при этом оказывается система из пяти ФП, охватывающая
следующие универсальные лингвистические значения: negative big (NB), negative small (NS), zero
(ZR), positive small (PS), positive big (PB). Иногда пользуются более дифференцированными
лингвистическими оценками, например NM (negative medium) и PM(positive medium)/
141
(u)
NB NS ZR PS PB
-2 -1 0 2
1
142
Рис. 4.5. Функции принадлежности для ошибок регулирования и управляющего
воздействия, заданные на интервале [-2,2].
Нечеткое множество А можно определить как совокупность всех пар вида [x, A(x)],
которые образованы из значений базовой переменной хХ и из функций принадлежности A(x):
A x, x X
A
(4.2)
xi , ( xi)
n
A (4.3)
i 1
144
АВ(x)=С(х)=max{A(х), B(х)} (4.5)
символ означает равно по определению.
Фаззи – пересечением двух нечетких множеств А и В, заданных на общем базовом
множестве Х, называют наибольшее нечеткое множество С, которое содержится одновременно и в
А, и в В (рис.4.6,б).
САВ {[x, АВ(x)]xX}, (4.6)
Где
АВ(x)=С(х)=min{A(х), B(х)} (4.7)
Фаззи – дополнением нечеткого множества А, заданного на базовом множестве Х,
называют нечеткое множество вида
A x,
( x) (4.8)
A
где
A-(x)=1-A(x) (рис.4.6,в)
148
Результирующая функция принадлежности р(u), которая характеризует всю совокупность
j правил, соединенных между собой союзом ИЛИ, определяется как максимум среди всех функций
(4.13) при заданных у:
р(y,u)= p(u) = max {j(y,uj)}, j=1,2,…,n (4.14)
u * (u)du
p
u*
(4.15)
* (u)du
p
В фаззи – технологии известны формы записи правил (4.12), у которых в правой части ТО
указывается не лингвистическое значение управляющего воздействия (например u =PB), а его
конкретное, четкое значение (например, u=u*).
Так, По методологии Сугено и Такаги j-е правило логического вывода записывается в
виде:
где Aj1,…,Ajk – фаззи – множества типа NB, NS и т.п. cjk – постоянные четкие значения
управляющего воздействия, заданные в виде синглтонов, т.е. в виде пар [uj,(uj)=1]. Выражение
(4.16) называют моделью Сугено нулевого порядка:
149
« ЕСЛИ у1 = Аj1 И,…, И, yk =Ajk, ТО uj*=cj0+ cj1y1*+…+ cjky*jk (4.17)
j 1
j
( y ) u *j
u* n (4.18)
j 1
j
( y)
150
«ЕСЛИ 1 = NB и 2 = PB, ТО u=PB»
«ЕСЛИ 1 = NB и 2 = ZR, ТО u=ZR»
«ЕСЛИ 1 = ZR и 2 = PB, ТО u=PB» (4.19)
«ЕСЛИ 1 = ZR и 2 = PB, ТО u=PB»
«ЕСЛИ 1 = ZR и 2 = ZR, ТО u=ZR»
151
1(1,2) = min {NB(1*), PB(2*)} = min {0.7;0.4} = 0.4
2(1,2) = min {NB(1*), ZR(2*)} = min {0.7;0.6} = 0.6
3(1,2) = min {ZR(1*), PB(2*)} = min {0.3;0.4} = 0.3
Четвертая посылка правила (4.19) содержит союз ИЛИ, поэтому функция принадлежности
фаззи – объединения
4(1,2) = max {ZR(1*), ZR(2*)} = max {0.3;0.6} = 0.6
Теперь можно в соответствии с композиционным правилом Мамдани (4.13) определить
результирующие функции принадлежности, характеризующие импликации (4.19):
1 = min {1(1, 2), PB(u)};
2 = min {2(1, 2), ZR(u)};
3 = min {3(1, 2), PB(u)};
152
Рис.4.8. Фаззи - объединение управляющих воздействий
153
науки и техники. Первая нечеткая система регулирования была испытана сотрудником
б
1*
2*
Лондонского университета Г. Мамдани в начале 70-х годов. Через 10 лет была разработана первая
промышленная система для управления вращающейся цементной печью. С 1985 года в Японии
было выполнено ряд работ по применению систем управления промышленными объектами на
базе систем нечеткого управления. Этот опыт изложен коллективом японских авторов в
154
монографии « Прикладные нечеткие системы» В монографии рассмотрены применения нечетких
множеств для решения следующих задач:
Управление доменной печью
Управление холодной прокаткой металлов
Управление скоростью движения автомобиля
Вождение поездов
Распознавание речи и распознавание образов
Составление оптимального расписания движения автобусов
Медицинская диагностика
И еще целый ряд практически важных задач.
155
Раздел 5. Предсказывающие системы управления.
Как мы уже отмечали ранее, предсказывающие системы управления относятся к
разомкнутым системам управления и реализуют управление по возмущению. Замкнутые системы
управления по отклонению, работающие с использованием обратной связи, получили наибольшее
распространение во всех отраслях. Однако они не могут быть успешно использоваться для
управления объектов с распределенными параметрами, которые характеризуются большими
временами запаздывания. Такие объекты, как кожухотрубчатые теплообменники, колонны
разделения, в которых управляемой величиной является состав выходной смеси, трубчатые и
колонные реакторы, работающие в вытеснительном режиме, все они относятся к объектам с
распределенными параметрами, и имеют большое время запаздывания практически по всем
каналам управления.
Для управления такого типа объектами необходимо использовать управление с предварением,
которое на основе анализа входных переменных объекта и точного знания порядка
преобразования входных переменных в выходные, может вырабатывать управляющее
воздействие, обеспечивающее поддержание управляемой величины (критерия эффективности)
системы на заданном уровне.
Для управления такого типа объектами используют системы управления по возмущению.
Простейшая схема такой разомкнутой системы регулирования приведена на рис.5.1.а.
156
xy xp x
W p (p) W об (p)
а)
xy xp x
Wp(p)
W об (р)
W в.к. (р)
W ов.k (р)
xy xp x
Wp(p)
W об (р)
Рис.5.1.Cтруктурные схемы разомкнутых систем
регулирования
В этой схеме отсутствует обратная связь, образующая замкнутый на себя контур передачи
воздействий, и не имеется условий для появления неустойчивой работы. В связи с этим
появляется значительно большая свобода выбора для выбора параметров регулятора, чем в
замкнутых системах регулирования. Изображение регулируемой величины в разомкнутой системе
регулирования, представленной на рис.5.1.а,определяется формулой:
X(p)=Wp(p)Wоб(р)Ху(р) (5.1)
где Wp(p) иWоб(р) - передаточные функции регулятора и объекта относительно регулирующего
воздействия.
Поэтому, если передаточную функцию регулятора выбрать равной обратной передаточной
функции объекта
157
1
W p ( p) (5.2)
W об ( p)
то будет выполнено тождество:
х=ху (5.3)
т.е. регулируемая величина будет точно следовать за изменением управляющего воздействия.
Таким образом, идеальный регулятор должен иметь передаточную функцию, обратную
передаточной функции объекта. В этом случае, при полном знании характеристик объекта, мы
могли построить идеальную систему управления по возмущению. Основным недостатком
разомкнутых систем регулирования является возможность самопроизвольного отклонения
регулируемой величины от заданного значения в результате воздействия на объект внешних
возмущений. Радикальным путем устранения этого недостатка является переход к замкнутой
системе с отрицательной обратной связью. Однако, как уже было сказано выше, для объектов с
запаздыванием такое регулирование не улучшает качество управления. Имеется и другой путь
решения этой задачи, который заключается в применении принципа регулирования по
возмущениям. Структурная схема системы регулирования, работающей по этому принципу,
приведена на рис.5.1,б. В этой системе дополнительный регулятор на основании измерения
возмущения оказывает на регулируемый объект регулирующее воздействие, с тем, чтобы не
допускать отклонения регулируемой величины.
Изображение отклонения регулируемой величины, вызванное k-м возмущающим
воздействием хв.k определяется следующей формулой:
Х(р)=[Wов.k(p)-Wвk(p)Wоб(р)]Xвk(p) (5.4)
где - Wов.k(p) – передаточная функция регулируемого объекта относительно
возмущающего воздействия.
Wвk(p) – передаточная функция регулятора, работающего по
158
возмущению.
Wоб(р) – передаточная функция объекта управления.
Из этой формулы следует, что если передаточную функцию регулятора выбрать из
условия:
Wов.k(p)-Wвk(p)Wоб(р)=0 (5.5)
т.е.
W oв.k ( p)
W вk ( p ) (5.6)
W об ( p)
то
х=0 (5.7)
и регулируемая величина совершенно не будет реагировать на возмущение х вk и будет
инвариантна относительно этого возмущения. Рассмотренная система работает на принципе
компенсации возмущений, не имеет замкнутых контуров передачи воздействий и поэтому выбор
параметров регулятора в такой схеме не лимитируется вопросами устойчивости работы.
Другой вариант структурной схемы с компенсацией возмущений приведен на рис. 5.1,в.
Здесь выходная величина регулятора по возмущению подается на вход регулятора, реагирующего
на управляющее воздействие совместно с этим регулятором. Изображение отклонения
регулируемой величины в этой системе, вызванного возмущением х вk, определяется формулой:
Х(р)=[Wов.k(p)-Wвk(p) Wр(р)Wоб(р)]Xвk(p) (5.8).
Если передаточную функцию устройства ввода воздействия от возмущения выбрать в
соответствии с формулой:
159
W ( p)
W вk ( p) oв . k
W p ( p)W об ( p)
(5.9)
160
идентификации модели ИД производится решение обратной задачи и уточняются коэффициенты
модели. При этом обязательно учитывается время запаздывания объекта, с тем чтобы каждому
выходному состоянию объекта поставить в соответствие именно то значение вектора входных
переменных и вектора управления, которое соответствует данному значению выходных
переменных с учетом времени запаздывания объекта. Это очень важная особенность процесса
идентификации. Фактическое время запаздывания определяется, либо с использованием
результатов пассивного эксперимента по данным корреляционного анализа получаемых
характеристик выходных и входных переменных, либо с применением метода активного
эксперимента. В этом случае на вход объекта наносятся специальным образом спланированные
возмущения и можно проследить за их проявлением в характеристиках выходных переменных и
определить, таким образом, точное значение времени запаздывания по различным каналам. После
идентификации модель передается в вычислительное устройство, в котором определяются
оптимальные значения управляющих воздействий, соответствующих данному, текущему
значению входных переменных. Такая схема управления в настоящее время широко применяется
для управления сложными и ответственными объектами, характеризующимися разнообразным
характером возмущения входных переменных. Такая система управления в американской
литературе называется «система управления с быстрой моделью». При этом предполагается, что
процедура идентификации модели и получение оптимального управления использование модели
объекта, занимает гораздо меньше времени, чем протекание процесса в реальном объекте. На
основании опыта функционировании такой системы, устанавливаются те отклонения от
результатов предсказания модели, после которых необходимо делать процедуру идентификации,
Это позволяет проводить процедуру идентификации модели не так часто и за счет этого повысить
быстродействие системы управления.
161
ОУ – объект управления.
УУ - устройство управления
АВ – анализатор входа
АС – анализатор выходных переменных объекта управления
ИДМ – устройство идентификации модели
ВУ – вычислительное устройство для вычисления оптимального управления
объектом
Литература
Основная
162
1. А.И. Бояринов, В.В. Кафаров. Методы оптимизации в химической
промышленности, «Химия», 1985
2. В.В. Кафаров Химическая кибернетика, «Химия», 1995
3. Е.Б. Андреев, В.Е. Попадько. Программные средства систем
управления технологическими процессами в нефтяной и газовой
промышленности, Учебное пособие. М., ФГУП Изд-во «Нефть и газ»
РГУ нефти и газа им. И.М. Губкина, 2005. 268 с.
4. А.С. Гринин, Н.А. Орехов, В.Н. Новиков, Математическое моделирование в
экологии, Учеб. Пособие для вузов.М., ЮНИТИ-ДАНА, 2003 г.
Дополнительпая
1. А.В. Беспалов, Н.И. Харитонов, Задачник по системам управления химико-
технологическими процессами. Учебное пособие для вузов М., ИКЦ
«Академкнига», 2005 г
2. Е.А. Дубовик, А.Е. Дубовик, Численные методы и алгоритмы диспетчеризации
вычислений с динамически изменяющимися приоритетами. М., СИНТЕГ, 2006,
120 с. (Серия «Информационные технологии)
163
2ЭР
164