Вы находитесь на странице: 1из 164

ПЕРВОЕ ВЫСШЕЕ ТЕХНИЧЕСКОЕ УЧЕБНОЕ ЗАВЕДЕНИЕ РОССИИ

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ


федеральное государственное бюджетное образовательное учреждение высшего профессионального образования
«НАЦИОНАЛЬНЫЙ МИНЕРАЛЬНО-СЫРЬЕВОЙ УНИВЕРСИТЕТ «ГОРНЫЙ»

Согласовано Утверждаю

_______________________ ______________________
Руководитель ООП Зав. кафедрой АТПП
по направлению 220700 доц. А.А. Кульчицкий
доц. А.А. Кульчицкий

Конспект лекций

«СОВРЕМЕННЫЕ ПРОБЛЕМЫ
АВТОМАТИЗАЦИИ И УПРАВЛЕНИЯ»
Направление подготовки:
220700 Автоматизация технологических процессов и производств

Профиль подготовки:
Автоматизация технологических процессов и производств в
нефтегазопереработке
Квалификация (степень) выпускника: магистр
Форма обучения: очная

Составители: Профессор каф. АТПП Ю.В. Шариков

САНКТ-ПЕТЕРБУРГ
2014

2
УДК 669.02.001.57 (075.8)
ББК 34.33.В6.Я7
Ш259
ISBN 5-85574-120-6

Изложены методы оптимизации технологических объектов, формулировка задач


оптимизации, методы численной реализации задач оптимизации с использованием
математических моделей.
Предназначено для научных сотрудников, а также для преподавателей, аспирантов и
студентов специальностей 220301 «Автоматизация технологических процессов и производств (в
металлургии)», 130603 «Оборудование нефтегазопереработки», 150103 «Теплофизика,
автоматизация и экология промышленных печей».

Шариков Ю.В.
Ш259. Современные проблемы автоматизации и управления. Ю.В. Шариков, Санкт-
Петербургский государственный горный университет. СПб, 2012. с.

ISBN 5-85574-120-6

© Ю.В. Шариков,
2012

3
«СОВРЕМЕННЫЕ ПРОБЛЕМЫ АВТОМАТИЗАЦИИ И УПРАВЛЕНИЯ».........................................................1
1. Оптимальные системы управления.....................................................................................................................5
1.1. Постановка задачи.....................................................................................................................................5
1.2. Формализация цели управления, Основные виды критериальных функций оптимизации..........................6
2. Математические методы решения оптимальных задач..................................................................................14
2.1. Методы исследования функций классического анализа.....................................................................15
2.1.1.Экстремумы функций одной переменной...................................................................................................15
Если же в этой точке d3R/dx3=0, то вычисляют следующую производную d4R/dx4 и т.д............................16
2.1.2. Экстремумы функций многих переменных...............................................................................................17
2.1.3. Примеры решения задач оптимизации теплообменников с использованием методов классического
анализа функций.....................................................................................................................................................20
2.2. Метод множителей Лагранжа................................................................................................................27
2.2.1. Оптимальное распределение потоков сырья между параллельно работающими производствами.....31
2.2.2. Определение минимального реакционного объема в каскаде реакторов идеального перемешивания.
..................................................................................................................................................................................35
Раздел 2.3. Классические вариационные задачи и методы их решения................................................................40
A......................................................................................................................................................................44
2.4. Динамическое программирование.....................................................................................................................50
2.5. Принцип максимума Понтрягина......................................................................................................................57
Синтез систем, оптимальных по быстродействию..............................................................................................63
Пример.3. Определение оптимального температурного профиля для системы параллельно
последовательных реакций в реакторе идеального вытеснения........................................................................68
2.6. Методы поиска экстремума функций................................................................................................................77
1.6.1.Методы поиска экстремума функции одной переменной.........................................................................77
Метод деления интервала......................................................................................................................................77
Метод золотого сечения.........................................................................................................................................77
Метод поиска с использованием чисел Фибоначчи............................................................................................79
2.6.2. Методы поиска экстремума функции многих переменных.....................................................................80
Метод поочередного изменения переменных......................................................................................................80
Градиентный метод поиска экстремума функций многих переменных...........................................................81
Метод наискорейшего спуска................................................................................................................................81
Метод релаксации...................................................................................................................................................81
Метод сканирования...............................................................................................................................................84
2.6.3 Пример использования метода нелинейного программирования для поиска экстремума функции
многих переменных................................................................................................................................................86
2.6.4. Определение оптимального температурного профиля методами нелинейного программирования.. .91
Раздел 2.7 Адаптивные системы управления...........................................................................................................95
2.7.1. Назначение. Классификация........................................................................................................................95
2.7.2.Экстремальные системы управления..............................................................................................................97
4
Динамические характеристики ЭСУ.....................................................................................................................101
Раздел 3. Большие и сложные системы..................................................................................................................106
3.1. Основные характерные черты больших и сложных систем......................................................................106
3.2. Декомпозиция систем и иерархическая структура системы управления................................................107
3.3.Особенности системы «Человек-машина».....................................................................................................111
3.4.Режимы работы системы «Человек-Машина».................................................................................................115
3.5.Разработка алгоритмов управления большими системами с использованием различных методов......117
3.5.2.Применение метода статистических испытаний......................................................................................121
3.5.4. Применение теории игр.................................................................................................................................127
Раздел 4. Нечеткие системы управления на базе теории нечетких множеств....................................................130
4.1.Подходы, применяемые в фаззи – технологии для синтеза систем управления......................................130
4.2. Элементы теории нечетких множеств.........................................................................................................132
4.3.Основные понятия нечеткой логики.............................................................................................................140
Нечеткая логика изучает логические операции над высказываниями типа...............................................140
4.4. Применение теории нечетких множеств и фаззи-логики в задачах управления.....................................142
Раздел 5. Предсказывающие системы управления................................................................................................151
Литература.................................................................................................................................................................157
Основная.....................................................................................................................................................................157
Дополнительпая......................................................................................................................................................158
1. А.В. Беспалов, Н.И. Харитонов, Задачник по системам управления химико-технологическими
процессами. Учебное пособие для вузов М., ИКЦ «Академкнига», 2005 г.......................................................158
2. Е.А. Дубовик, А.Е. Дубовик, Численные методы и алгоритмы диспетчеризации вычислений с
динамически изменяющимися приоритетами. М., СИНТЕГ, 2006, 120 с. (Серия «Информационные
технологии)...............................................................................................................................................................158

5
1. Оптимальные системы управления

1.1. Постановка задачи.


Оптимизация – это целенаправленная деятельность, заключающаяся в получении наилучших
результатов при заданных условиях.
Постановка задачи оптимизации предполагает наличие объекта оптимизации. В качестве
объекта оптимизации может рассматриваться производственная деятельность какого-либо
коллектива за определенный период, либо результаты промышленной эксплуатации какого-либо
объекта.
1. Решение задачи оптимизации начинают с выявления цели оптимизации, т.е. формулировки
требований, предъявляемых к объекту автоматизации. От того, насколько правильно
сформулированы эти требования, может зависеть возможность решения задачи.
Типичным случаем неправильной постановки задачи является распространенная ошибка,
когда нужно найти оптимальные значения сразу нескольких величин одновременно, например:
получить максимальный выход продукции при минимальных затратах. Минимальные затраты
равны нулю, а при нулевых затратах, как известно, никакого выхода продукции получить
нельзя.
Примерами корректной формулировки цели оптимизации могут быть следующие:
а) получить максимальный выход продукции при заданном расходе сырья, или
б) для заданного выхода продукции получить минимальный расход сырья.
2. Для решения задачи оптимизации нужно располагать определенными ресурсами
оптимизации, под которыми понимают свободу выбора значений некоторых параметров
оптимизируемого объекта.
3. Наконец еще одно условие правильной постановки задачи оптимизации заключается в
наличии количественной оценки качества работы объекта оптимизации, интересующего нас в
данный момент.
Таким образом, для правильной постановки оптимальной задачи необходимо выполнение
следующих основных требований:
1) Требование оптимизации только одной величины
2) Наличие степеней свободы у оптимизируемого объекта,.
3) Возможность количественной оценки оптимизируемой величины.
Наиболее важным и ответственным этапом при постановке задачи оптимизации является
правильная формулировка критерия оптимизации, или целевой функции, как его иногда ещё
называют при дословном переводе с английского языка – objective.
6
1.2. Формализация цели управления, Основные виды критериальных функций
оптимизации.
Наиболее правильно при формировании критерия оптимальности производства
использовать экономические показатели процесса. Поэтому мы рассмотрим некоторые
экономические характеристики производства и установим их связь с технологическими условиями
работы. Обычно при формировании критерия оптимальности используют следующие показатели
производства:
1. Производительность В- объем выпускаемой продукции в единицу времени [кол. ед. пр./
ед. вр.].
2. Объем капитальных вложений Ф в данное производство, исчисляемый в денежных
единицах [ден. ед.].
3. Эксплутационные затраты Э на осуществление процесса производства, [ден. ед./ед.вр].
4. Качественные показатели выпускаемого продукта К, от которых зависит рентабельность
производства, так как цена выпускаемой продукции зависит от её качества.
Таким образом, в общем случае экономический критерий оптимальности можно
сформулировать как некоторую функцию от выше указанных показателей:
R  R ( B, Ф, Э, К) (1.1)

Конкретный вид уравнения (1.1) может быть различным, в зависимости от постановки


оптимальной задачи. Например, это может быть себестоимость получаемой продукции, сумма
прибыли в течение заданного времени, эффективность использования капитальных вложений, и
другие показатели. Следует отметить, что постановке задачи оптимизации в конкретной форме
должен предшествовать всесторонний экономический и технический анализ процесса, для того,
чтобы корректно записать выражение (1.1) и выявить варьируемые параметры, оказывающие
влияние на показатели, входящие в уравнение (1.1).
Одним из важнейших показателей экономической эффективности процесса, часто
используемых в качестве критерия оптимальности, является себестоимость выпускаемой
продукции:

 S c  ST  S п
1 (1.2)
s пр

B

Где: s ïð - себестоимость выпускаемой продукции, [ден.ед./ед.пр]


7
S ,S ,S
c T Ï
– затраты на сырье, переменные и постоянные расходы, соответственно
[ден.ед./ед.вр]
Рассмотрим более подробно входящие в уравнение (1.2) переменные.
Затраты на сырье Sс – эту составляющую себестоимости обычно можно принять
пропорциональной объему выпускаемой продукции, т.е. производительности процесса В.
Затраты на сырье могут использоваться с учетом коэффициента использования сырья . Так, если
принять, что стоимость исходного сырья составляет sc, а стоимость реализуемых отходов
производства равна sот, то общие затраты на сырье описываются выражением:

S с

 B  s  (1   )  s  B  s'
c от от
 (1.3)

При полном использовании сырья коэффициент  становится равным единице и затраты на


сырье составляют величину
(1.4)
S c
 B  sc

При решении задач оптимизации коэффициент использования сырья  можно


рассматривать как переменную величину, значение которой зависит от режима процесса.
Если в процессе производства образуется ряд побочных продуктов в количествах,
пропорциональных производительности В, то получаемая при этом часть стоимости может быть
отнесена к снижению расходов на сырье:
 m
 (1.5)
Sс  B   sc  (1   )     
sот i 1 sпоб.,i i   B  s'от

(1.5)
Где: sпоб.,i – стоимость от реализации единицы i-го побочного продукта,[ден.ед/ед.пр.]
i – коэффициент, показывающий сколько единиц i-го побочного продукта образуется на
единицу основного продукта процесса, n-число реализуемых побочных продуктов.
Коэффициенты i , также как и , при решении задачи,можно считать переменными величинами.
Переменные расходы ST. Эта часть стоимости производства продукции включает в себя
стоимость электроэнергии, пара, охлаждающей воды, вспомогательных материалов, например,
ингибиторов коррозии, катализаторов и т.д.. Эта часть принимается пропорциональной
производительности процесса
(1.6)
S T
 B  sT
8
Коэффициент sT представляет собой объем переменных расходов на единицу продукции и
определяется сложившейся для данного производства стоимостью вспомогательных материалов.
Расчет коэффициента sT может быть выполнен по формуле
m (1.7)
s T
  s э,i  q
i
i 1

Где sэ,i – стоимость единицы энергетического потока (электроэнергии, пара, воды и т.д.) или
единицы вспомогательного материала, [ден.ед/ед.пр.],
qi – количество единиц i-го энергетического потока или вспомогательного материала ,
необходимых для производства единицы основной продукции [ед/ед.пр.]. В переменные расходы
иногда можно включать и заработную плату обслуживающего персонала. При этом выражение
(1.7)можно представить в следующем виде:
m (1.8)
s T
  s э,i  q  s з
i
i 1

Где sз- основной заработок или доплата к основному окладу обслуживающего персонала за
единицу выпускаемой продукции, [ден.ед/ед.пр.].
Постоянные расходы Sп. Эта часть расходов не зависит от объема выпускаемой продукции В и
определяется объемом капитальных вложений в основные фонды производства, стоимостью
планового и профилактического ремонтов оборудования и уровнем заработной платы
обслуживающего персонала.
Рассмотрим более детально составляющие части постоянных расходов.
Амортизационные отчисления Sa. Амортизация – это процесс постепенного изнашивание
основных фондов и перенесения их стоимости на стоимость производимого продукта, чтобы
иметь средства для замены основных фондов при их износе или выходе из строя. Важнейшим
элементом расчета амортизации является срок службы основных фондов Т, который определяется
с учетом интенсивности использования оборудования, его физического износа и морального
устаревания. Размеры амортизационных отчислений определяются на основе нормы амортизации
На, выраженной в процентах от первоначальной стоимости капитальных вложений в процесс. При
этом учитываются также затраты на капитальные ремонты оборудования Р в течение срока его
службы и ликвидационная стоимость основных фондов Л после истечения срока амортизации.
Тогда Норма амортизации составит величину:

9
ФРЛ (1.9)

На   100%
Ф Т
и амортизационные отчисления составят величину
ФНа Ф Р Л (1.10)
Sа  
100 Т

Стоимость профилактического ремонта Sp и заработная плата обслуживающего персонала Sз.


Эти составляющие постоянных расходов определяются сложностью профилактических ремонтов,
числом работников, обслуживающих производство и уровнем оплаты их труда. Общее выражение
для постоянных расходов может быть записано в следующем ви де:
(1.11)
S S S S
  
Ï à ð ë

С учетом выполненного анализа выражение для себестоимости (1.2) может быть записано
в виде:
Ф  Р  Л S p  Sз (1.12)
s пр  s 'c  sT  
Ф Т B

Важным показателем экономической эффективности производства является прибыль от


реализации продукции по рыночным ценам. Очевидно, что сумма прибыли зависит от разности
между ценой продукта, его себестоимостью и от объема производства. В соответствии с этим
прибыль может быть рассчитана по формуле:
(1.13)
Ï  Â(  ) s s
ö ïð

Где sц – рыночная цена единицы продукции.


Сама по себе сумма прибыли не может служить объективной оценкой эффективности
производства, поскольку она не отражает абсолютных затрат, связанных с выпуском продукции.
Например, для двух одинаковых производств с различной производительностью, сумма прибыли
может быть одинакова, а для производства большей мощности себестоимость продукции при этом
окажется более высокой. Более полной оценкой экономической эффективности производства

10
является норма прибыли Нп , которая представляет собой выраженное в процентах отношение
разности между рыночной ценой и себестоимостью, отнесенное к себе стоимости:

s s ц пр
(1.14)

Н 
s п
пр

Для определения экономической эффективности капиталовложений иногда используют


понятие нормы рентабельности, исчисляемой как отношение суммы прибыли к объему
капитальных вложений:
В  ( s ц  s пр ) (1.15)
Нр
Ф

Достоинством экономических оценок эффективности процесса при помощи показателей


нормы рентабельности и нормы прибыли является то, что в них входит цена реализации
продукции.
Проанализируем задачу выбора оптимальной производительности процесса при
использовании различных экономических оценок в качестве критерия оптимальности. При этом
будем предполагать, что известна оптимальная величина производительности В опт, при которой
достигается минимальная себестоимость продукции. На рис.1.1 показан возможный характер
зависимости себестоимости продукции от производительности.

sпр

Sпр,min

В
Вопт
11
Рис.1.1 Зависимость себестоимости продукции от
производительности

Кривую sпр(В) можно построить на основании экономического анализа процесса, после чего
расчет оптимальной производительности процесса можно выполнить очень просто. В точке
оптимума должно выполняться условие
 s пр
0
(1.16)

B
Прибыль в качестве критерия оптимальности. Оптимальное значение производительности
при применении прибыли в качестве критерия оптимальности можно найти решением уравнения,
получаемого путем приравнивания нулю производной от правой части уравнения (1.13) по В.
П 
 sц  sпр  В 
sпр (1.17)

В B
Приравнивая нулю (1.17) ,находим выражение для производной в точке экстремума.
 s пр


s s ц пр
(1.18)

B B
Поскольку величина производительности В всегда положительна, то знак производной
 sпр / B всегда определяется знаком разности, между рыночной ценой продукции и ее

себестоимости. Когда цена продукции выше её себестоимости, производная  sпр / B


положительна, и наоборот, если цена продукции ниже её себестоимости, производная должна
быть отрицательной, для выполнения условия (1.18). Из рис.1.1 видно, что положительному знаку
производной  sпр / B отвечают производительности, большие В опт.. Другими словами, для
получения максимальной прибыли необходимо проводить процесс при большем значении
производительности, чем это следует из условия минимизации себестоимости продукции.
Подобная ситуация представлена на рис.1.2, где тангенс угла наклона определяется выражением:

12
tg ( ) 
s  s  ( B'
ц пр опт
) (1.19)

В опт

соответствующим условию (1.18).


Графики на рис1.2 показывают, что имеется ограниченная область изменения производительности
(Bm,BM), в которой прибыль существует. За пределами этой области прибыль становится
отрицательной, при этом убытки производства определяются выражением (1.13).

sпр

S
w

BM
B
П Bm Вопт B’опт

Рис.1.2. Зависимость прибыли от производительности процесса В

Норма прибыли в качестве критерия оптимальности. Для определения условия оптимальности


продифференцируем правую часть уравнения (1.14) и приравняем полученную производную
нулю. В итоге получим уравнение:

13
1  sпр
(1.20)
Нп
 2  0
В s В
пр

Из уравнения видно, что выполнение условия (1.20) возможно лишь при равенстве нулю
производной sпр/В, т.е. при соблюдении условия (1.16). Это означает, что оптимальное значение
производительности Bопт, рассчитанное из условия максимизации нормы прибыли (1.14),
совпадает с оптимальным значением В опт, которое определено из условия минимизации
себестоимости. Следовательно, максимум нормы прибыли достигается при производительности,
обеспечивающей минимальную себестоимость продукции.

Норма рентабельности капиталовложений в качестве критерия оптимальности.


При заданном объеме капиталовложений Ф величина нормы их рентабельности, описываемой
формулой (1.15), с точностью до постоянного множителя, совпадает с выражением для суммы
прибыли (1.13). Следовательно, оптимальное значение производительности, найденное из
условия максимизации нормы рентабельности капвложений, идентично оптимальному значению,
которое получено из условия максимизации суммы прибыли.
Отличие будет лишь в том случае, если оказывается, что объем капвложений в производство
зависит от величины производительности. Это может иметь место в том случае, если объем
оборотных средств пропорционален выпуску продукции. При такой постановке задачи
оптимизации вместо (1.18) получится выражение:
 sпр s
ц
s пр 1
(1.21)
 
1  В  Ф0
B B
Ф'
Где Ф - объем капвложений в основные фонды производства, [ден.ед.], Ф 0 – объем оборотных
средств на единицу выпуска продукции, [ден.ед/ед.пр.].
Анализ выражения (1.21) показывает, что оптимальное значение производительности
будет несколько меньшим, чем определенное из условия (1.18), причем степень этого уменьшения
зависит от отношения объема оборотных средств ВФ 0 к объему капвложений в основные фонды
Ф.
Приведенные соотношения были получены для определения стационарных режимов
непрерывных процессов. Эти же результаты могут быть перенесены и на периодические
процессы, если анализ их экономических показателей охватывает достаточно большой период
времени, в течение которого повторяется несколько циклов периодического производства.
14
Эти задачи называются задачами статической оптимизации. Наряду с такими задачами
существуют задачи оптимизации при нестационарных режимах эксплуатации.
Эти задачи называются задачами динамической оптимизации Примером такой задачи может
служить задача оптимального управления периодическим процессом за один цикл, когда нужно
выбрать закон управления, чтобы получить продукт необходимого качества за один цикл в
течение минимального времени, или при заданной продолжительности цикла обеспечить
максимальный выход продукта заданного качества. Особенностью задач динамической
оптимизации является то, что значение критерия оптимальности определяется не только
состоянием процесса в данный момент времени, но оно зависит также от предыстории процесса,
начиная с некоторого начального времени. Поэтому оценка эффективности процесса должна
выполняться с учетом поведения процесса за весь рассматриваемый промежуток времени. Для
этого используют обычно интегральные оценки –функционалы типа:
tk (1.22)
I   R (t )  dt
0

Где R(t)- заданный функционал параметров и функций управления, определяющих состояние


процесса в любой момент времени.
Аналогичные оценки применяют также и для оптимизации объектов с распределенными
параметрами.

2. Математические методы решения оптимальных задач.

После формулирования критерия оптимизации с учетом технико-экономических


характеристик процесса, необходимо с помощью математической модели процесса установить
связь критерия оптимизации, например, себестоимости, с варьируемыми технологическими
параметрами и выбрать математический метод решения полученной оптимальной задачи.
Выбор математического метода оптимизации зависит от используемой математической
модели, характера управляющих воздействий и вида ограничений, налагаемых на переменные
состояния и управления.
В настоящее время для решения оптимальных задач применяют, в основном, следующие
методы:
1. Методы исследования функций классического анализа
2. Методы, основанные на использовании неопределенных множителей Лагранжа
3. Вариационное исчисление
15
4.Динамическое программирование
5.Принцип максимума Понтрягина
6.Линейное программирование
7.Нелинейное программирование.
Как правило, нельзя рекомендовать какой-либо один метод, пригодный для решения всех
задач, встречающихся на практике. Одни методы являются более общими, другие – менее
общими. Наконец, некоторые методы можно применять в сочетании друг с другом.
Отметим, что некоторые методы специально разработаны или наилучшим образом
подходят для решения оптимальных задач с математическими моделями определенного типа.
Так, например, методы линейного программирования очень хорошо приспособлены для
решения задач с линейным критерием оптимальности и линейными ограничениями на
переменные.
Динамическое программирование идеально приспособлено для решения задач
оптимизации многостадийных процессов, особенно для задач, в которых на каждой стадии
имеется небольшое число переменных. Однако, при наличии значительного числа переменных
применение метода динамического программирования затруднительно, вследствие ограниченного
быстродействия и памяти вычислительных машин. Пожалуй, наилучшим методом следует
признать различные комбинации методов нелинейного программирования и таких строгих
методов как принцип максимума Понтрягина .
Далее мы рассмотрим детальнее каждый из перечисленных методов и примеры их
использования для постановки оптимальных задач.

2.1. Методы исследования функций классического анализа

2.1.1.Экстремумы функций одной переменной.

Методы исследования функций классического анализа в основном применяют в тех


случаях, когда известен аналитический вид зависимости оптимизируемой функции R от
независимой переменной xi.
R  R (x) (2.1.1)
Это позволяет найти также в аналитическом виде производные оптимизируемой функции,
используя которые и определяют необходимые и достаточные условия существования
экстремума. Как известно из теории классического анализа функций, необходимые условия
существования экстремума функций одной переменной могут быть найдены из анализа первой
производной dR/dx. При этом функция R(x) может иметь экстремальные значения при таких
значениях независимой переменной х или, что то же самое, в тех точках оси х, где производные

R(x) R(x) R(x)


16

M
M
M

m m m

x1 x2 x x2
x1 x2 x x1 x

Рис.2.1. Различные типы экстремумов функции R(x)


dR/dx равны нулю, либо вообще не существуют. На рис.2.1 показаны различные типы
экстремумов функции R(x).

Для определения типа экстремума - максимум или минимум существует несколько


подходов.
1. Сравнение значений функций. Этот способ сводится к тому, что со значением
функции в точке xk, “подозреваемой” на экстремум, сравнивают два её значения, рассчитанные в
точках, достаточно близких к исследуемой и расположенных слева и справа от неё, т.е. при
значениях переменной xk -  и xk + , где  - малая положительная величина. При этом, если
окажется, что оба значения функции меньше, чем R(xk), то в точке xk имеется максимум функции
R(x), если в обоих точках функции больше, чем R(xk), то в точке xk имеется минимум функции
R(x). Если же R(xk) имеет промежуточное значение между R(xk - ) и R(xk + ), то в точке xk
функция R(x) не обладает ни максимумом, ни минимумом.
2 Сравнение знаков производных. При этом способе исследования точки
xk,“подозреваемой» на экстремум, в точках xk -  и xk + , определяется знак производной dR/dx.
Если знак производной dR/dx при таком переходе изменяется с (+) на (-), то в точке xk
максимум, если наоборот – с (-) на (+), то минимум. Если же знаки производной в точках xk -  и
xk +  совпадают, то в точке xk нет ни минимума, ни максимума, т.е. она не является
экстремальной.
2. Исследование знаков высших производных. Этот способ можно применять в тех случаях,
когда в точке, «подозреваемой» на экстремум существует не только первая производная, но и
производные высших порядков. При этом в точке, «подозреваемой» на экстремум, вычисляют
вторую производную. При этом, если d2R/dx2x=xk>0, то – минимум, если d2R/dx2x=xk<0, то –
максимум. Если вторая производная в точке xk равна нулю, то вычисляют третью
производную. Причем, если d3R/dx30, точка xk не является точкой экстремума.
Если же в этой точке d3R/dx3=0, то вычисляют следующую производную d4R/dx4 и т.д..
При этом нужно руководствоваться таким правилом:

Когда порядок первой, не обращающейся в нуль производной в точке xk, для которой
dR/dxx=xk=0, нечетный, то в этой точке функция R(x) не имеет ни максимума, ни минимума, т.е.
точка xk не является точкой экстремума функции R(x). Если же порядок первой, не
обращающейся в нуль производной в точке xk четный, то в данной точке есть экстремум
функции R(x), который будет максимумом или минимумом в зависимости от того,
отрицательна или положительна эта производная.
Способ исследования знаков производных требует довольно громоздких вычислений,
поэтому гораздо проще воспользоваться одним из двух первых способов

17
При решении задачи оптимизации необходимо найти не какой-либо экстремум
оптимальной функции, но требуется найти условия, при которых функция R(x) принимает
наибольшее или наименьшее значение. Точки наибольшего, или наименьшего значения функции
R(x) называют обычно глобальными экстремумами, в отличие от остальных экстремумов, которые
в этих случаях называют локальными.
Для поиска глобального экстремума необходимо найти все локальные экстремумы в
заданной области оптимизации, а затем выбрать среди них наибольший ( или наименьший) Это
довольно громоздкая процедура, для упрощения которой используют целый ряд эмпирических
правил.

2.1.2. Экстремумы функций многих переменных.

Решение задачи оптимизации существенно усложняется, когда критерий оптимальности


является функцией многих переменных даже при известном аналитическом выражении этой
функции. Наибольшие трудности возникают при отсутствии непрерывности у всех или
некоторых производных оптимизируемой функции. В этом случае более целесообразно
использовать методы нелинейного программирования. Рассмотрим необходимые и достаточные
условия существования экстремума для непрерывных функций, имеющих к тому же непрерывные
производные первого и второго порядков.
Для непрерывной функции многих переменных
(2.1.2)
R  R( x1 , x1 ,..., xn)

имеющей непрерывные производные первого и второго порядка по всем переменным xi (i=1,…,n),


необходимым условием экстремума в точке xi(k) (i=1,…,n) служит равенство нулю в этой точке
частных производных по всем переменным. Точки, в которых возможен экстремум, могут быть
получены решением системы уравнений
(2.1.3)
R( x1 , x 2 ,..., x n )
0
 xi
Для того чтобы проверить, действительно ли точка xi(k) (i=1,…,n), координаты которой
удовлетворяют уравнениям (2.1.3), является точкой экстремума функции (2.1.2), уже недостаточно
проверки экстремальности по всем переменным в отдельности.

18
Для этого применяют обычно вычисление приращения функции в окрестности точки
предполагаемого экстремума, применяя разложение функции R=R(x1,x2,...,xn) в ряд Тейлора в
окрестности точки и вычисляя приращение в сле дующем виде:
2 (2.1.4)
1 n  
R  R ( x )  R ( x
(k )
)  
2 
 x i   R( x
(k )
)
i 1  x i 

Из выражения (2.1.4) следует, знак приращения функции R в достаточно малой


окрестности точки x(k) определяется производными второго порядка от R(x) по всем переменным,
включая и смешанные производные. Для того чтобы точка x(k) являлась точкой экстремума
функции R(x), достаточно при любых малых приращениях независимых переменных xi правой
части выражения (2.1.4) оставаться положительной для точки минимума и отрицательной для
точки максимума.
Поскольку вторые производные в выражении (2.1.4) вычисляются в точке x(k) , они могут
рассматриваться как постоянные числа. В этом случае для анализа знака правой выражения (2.1.4)
не обязательно требовать малости величин xi. Таким образом, вопрос о знаки приращения
функции R может решаться анализом квадратичной формы:
(2.1.5)
U    a ij  z i  z j

коэффициенты которой связаны с производными в правой части выражения (2.1.4)


соотношениями
(2.1.6)
 R( x )   R( x )  a
2 k 2 k

aij   x  x  x  x ji
, i, j  1,..., n
i j j i

Квадратичная форма называется положительно определенной, если для любых значений zp она
сохраняет положительное значение, за исключением точки zp = 0 (p=1,…,n), в которой она
обращается в нуль. Для того чтобы найти , является ли данная квадратичная форма

19
положительно определенной можно воспользоваться теоремой, которая формулируется
следующим образом. Для положительной определенности квадратичной формы (2.1.5)
необходимо и достаточно, чтобы выполнялись условия Сильвестора:
 a11 a12  0; ... 

(2.1.7)
1  a 11  0; 2 
 a21 a22 
 


a11 a12 ... a1n 

 a21 a22 ... a2 n  0 
 n  
 .......... ........ 
 an1an 2 ... ann 
 

Условия (2.1.7) означают, что квадратичная форма (2.1.5) будет положительно


определенной в том случае, если все глав ные миноры соответствующей ей матрицы
a a ... a
(2.1.8) 11 12 1n

[ A]  a ... 2n a 22 a 2 n

...................
a n1 a n2
... a nn

составленной из коэффициентов, будут строго положительны.


Таким образом, если решен вопрос о положительной определенности квадратичной формы
(2.1.5), где коэффициенты рассчитываются по формулам (2.1.6), то тем самым решается задача и о
типе точки x(k), в которой удовлетворяются условия экстремума. Если квадратичная форма
оказывается положительно определенной, точка x(k) соответствует минимуму оптимизируемой
функции. Если квадратичная форма будет отрицательно определенной, точка x(k)будет
соответствовать максимуму оптимизируемой функции.
При обращении в нуль всех главных миноров матрицы (2.1.8) вопрос о наличии и
характере экстремума в исследуемой точке решается с использованием производных более
высокого порядка.

2.1.3. Примеры решения задач оптимизации теплообменников с использованием методов


классического анализа функций.

Основным вопросом, который приходится решать при проектировании теплообменных


аппаратов, является выбор величины поверхности теплообмена и соответствующей ей нагрузки
по хладагенту vx для заданной тепловой нагрузки на теплообменник Q. В связи с этим для
экономической оценки эффективности теплообменника заданной конструкции может быть
использован критерий оптимальности, объединяющий параметры F и vx , который может быть
записан в следующем виде:

20
R=sxvx+sFF (2.1.9)
Где: sx –стоимость единицы объема хладагента; sF- стоимость единицы поверхности
теплообмена, исчисляемая с учетом амортизации теплообменника. Критерий (2.1.9) представляет
собой суммарные затраты на эксплуатацию теплообменника в единицу времени. Чтобы получить
возможность использовать критерий оптимальности (2.1.9) для выбора оптимальной поверхности
Fопт и оптимальной величины расхода хладагента vх,опти, необходимо найти связь между F и vx,
которую дают уравнения математического описания теплообменника. Рассмотрим простейшую
схему теплообмена, которая соответствует теплообмену в двух аппаратах смешения через
теплообменную поверхность, как изображено на рис.2.2.

Рис.2.2. Схематическое изображение теплообменника типа «смешение-смешение»


Рис.2.2. Схематическое изображение теплообменника типа «смешение-смешение»

Рисунок 2.2 Схема теплообменника типа «смешение-смешение»

Стационарный режим работы такого теплообменника может быть описан системой уравнений
теплового баланса по каждому потоку:

v  cp T   T   K  F  T  Tx   0
( 0) (k )
T
(k ) (k )
(2.1.10)

vx  c p,x Tx  Tx   K  F  T  Tx   0
( 0) (k )
T
(k ) (k )
(2.1.11)

21
Эта система уравнений может быть разрешена относительно любых двух параметров, входящих в
эти уравнения. В частности, для выходных температур теплоносителя T(k) и хладагента Tx(k)
можно получить следующие выражения:

 1 ( 0)
1 
1 KT  F   Tx( 0) 
 v c v  cp 
(k ) ( 0)  x p,x T 
T T   1
(2.1.12)

 1 
1 KT  F  
 v c v  cp 
 x p,x 

 ( 0) 1 
1  K T  F   T ( 0) 
1

 v  cp 
x c px v
Tx 
(k ) ( 0)  
Tx  Tx   1
(2.1.13)

 1 
1 KT  F  
 v c v  cp 
 x p,x 
При расчетах теплообменников обычно задают тепловую нагрузку на теплообменник Q, т.е. то
количество тепла, которое нужно передать от теплоносителя к хладагенту в единицу времени. Для
определенного расхода теплоносителя, известной его теплоемкости и заданной входной
температуры это эквивалентно заданию выходной температуры теплоносителя, поскольку

Q  vc T p
(0)
T
k

Задача расчета теплообменника ставится как задача определения величины поверхности
теплообмена при заданных параметрах хладагента.
Конечная температура хладагента вычисляется из уравнения теп лового баланса

vc T
p
( 0)
T   v c Tx
k
x px
( 0)
 Tx 0
 k  (2.1.14)

22
и равна следующей величине:

(2.1.15)
v cp
Tx Tx
(k ) (0) (0) (k )
 (T T )
v c x px

Подставляя в уравнение (2.1.10) или в (2.1.11) выражение для выходной температуры хладагента
(2.1.15) и решая полученное уравнение относительно поверхности теплообмена F, найдем для F
следующее выражение:

F
v c x px
(2.1.16)

 v c 
K    v   1
x px
T
c 
 p 

где:
(k ) ( 0) (2.1.17)
 Tx
 T ( 0) (k )
T T

Знаменатель выражения (2.1.16) может обращаться в нуль или принимать отрицательные


значения. При этом поверхность теплообмена, определяемая этим уравнением равна
бесконечности либо становится отрицательной. . В обоих случаях это означает невозможность
создания теплообменника на заданную тепловую нагрузку при принятых параметрах хладагента.
23
Поэтому условие положительности знаменателя в выражении (2.1.16) можно использовать как
условие физической реализуемости теплообменника при заданных параметрах теплоносителя и
хладагента.


vx
c(2.1.18)
px
1
v vp

Используя полученное соотношение между поверхностью теплообмена и расходом хладагента,


можно теперь продолжить решение сформулированной оптимальной задачи по определению
оптимальной поверхности теплообмена и расхода хладагента.
Запишем в общем виде полученное соотношение между поверхностью теплообмена и рас ходом
хладагента

F  F (v ) x
(2.1.19)

Подставим это выражение в выражение для критерия оптимальности (2.1.9) продифференцируем


его по vx и приравняем производную нулю.
dF (2.1.20)
sxs d v F
0
x

Дифференцирование выражения (2.1.16)для зависимости F(vx) по vx дает следующее значение


производной:

dF

c px  1
(2.1.21)

d vx KT
2
 v x c px 
  
 v c p 1
 
Подстановка (2.1.21) в (2.1.20) дает следующее уравнение:
24
2 (2.1.22)
 v x c px  s  c
  
 v c p 1 s  K
F px
0
  x T

Уравнение (2.1.22) представляет собой условие обращения в нуль производной от критерия


оптимальности по управляющей переменной vx. Решение этого уравнения дает два корня:
(2.1.23)
 0 .5

v  c p   s F c px  
v x1     1    
c px   s x  K T  
 
(2.1.24)
 0 .5

v  c p   s F c px  
v x1     1   
c px   s x  K T  
 

Кроме того, согласно правилам исследования экстремумов функций одной переменной,


оптимальное значение следует искать также в тех точках, где производная от критерия
оптимальности не существует. В рассматриваемом случае имеется такая точка, в которой
производная dF/dvx не существует и которая соответствует обращению в нуль знаменателя
выражения (2.21). Из этого условия следует следующее выражение для переменной vx3:

v c p
(2.1.25)

v 
x3
c px

Таким образом, мы имеем три значения vx (2.1.23)-(2.1.25), которые формально должны


быть исследованы на экстремум. Анализ условий достаточности в данном случае целесообразно
провести, исходя из физического смысла решаемой задачи. С этой целью проанализируем
25
выражение для величины поверхности теплообмена (2.1.16). Очевидно, что физический смысл
может иметь только положительное выражение для поверхности теплообмена F. Это
соответствует выполнению условия (2.1.18), из которого следует, что должно соблюдаться
неравенство:

v cp (2.1.26)

v x

  c px

Условию (2.1.26) соответствует лишь значение vx1, определяемое формулой (2.1.23).


Остается проверить, будет ли при данном значении vx1 достигаться минимальное значение
критерия оптимальности (2.1.9). Анализ выражения (2.1.9) показывает, что при выполнении
условия (2.1.16) производная dR/dvx является монотонной возрастающей функцией величины vx.
Следовательно, в точке обращения в нуль эта функция меняет свой знак с (-) на (+), что позволяет
утверждать о наличии минимума R при значении vx1, определяемом формулой (2.1.23). Это значит,
что
 0.5

v  c p   s F c px  
v x,опт     1     (2.1.27)
c px   s x  K T  
 
Подставляя теперь значение vx,опт из выражения (2.1.27) в выражение (2.1.16), получим выражение
для величины оптимальной поверхности теплообмена.

 0.5

v  cp   s xK T  
F опт     1     (2.1.28)
K T   s F c px  
 
Как следует из уравнений (2.1.27) и (2.1.28) оптимальные значения vx и F зависят от величины
безразмерного комплекса

26
z  sx
 KT
(2.1.29)
sF  c px
в который входят стоимостные коэффициенты критерия оптимальности sx и sF. На рис. 2.3 показан
вид зависимостей (2.1.27) и (2.1.28) от величины безразмерного комплекса z для теплообменника
типа «смешение-смешение»

vx,F

Fопт

Vх,опт

Рис.2.3 Оптимальные значения поверхности теплообмена F и нагруз-


ки по хладагенту vx для теплообменника типа
«смешение-смешение».

27
2.2. Метод множителей Лагранжа.
Эти методы применяются для решения задач оптимизации, в которых на независимые
переменные наложены ограничения типа равенств. Типичными примерами подобных задач
служат задачи, в которых требуется оптимальным образом распределить заданное количество
ресурсов, чтобы принятая оценка эффективности процесса имела при этом максимальное или
минимальное значение.
Для решения экстремальных задач с такими ограничениями в классическом анализе
разработан и используется метод неопределенных множителей Лагранжа, сводящий задачу с
ограничениями к обычной экстремальной задаче без ограничений, что позволяет применять для её
решения приемы, рассмотренные ранее в предыдущем разделе курса.
Метод множителей Лагранжа часто применяется и при использовании других методов
оптимизации в качестве вспомогательного средства, позволяющего упростить решение более
сложных задач оптимизации.
Рассмотрим суть этого метода. Пусть требуется найти экстремум функции
R=R(x1,x2,…,xn) (2.2.1)
которая зависит от n переменных xi (i=1,2,…,n), связанных в свою очередь соотношениями:
k(x1,x2,…,xn)=0, k=1,…,m (2.2.2)

Экстремум, который достигается функцией R с учетом выполнения соотношений (2.2.2), обычно


называется условным или относительным.
Очевидно, что число соотношений m (2.2.2) в постановке экстремальной задачи, должно
быть меньше числа независимых переменных n, так как, например, при m=n диапазон изменения
переменных xi= (i=1,…,n) сведется лишь к определенному набору дискретных точек x(l) (l=1,…,q),
который может быть найден решением системы уравнений (2.2.2), поскольку для данного случая
число уравнений равно числу неизвестных. При этом решение оптимальной задачи сведется к
проверке значений функции R только в дискретном множестве точек. Экстремальная задача
решается в этом случае перебором допустимых точек, удовлетворяющих ограничивающим
условиям (2.2.2). Если число ограничений m меньше числа независимых переменных n, то для
решения экстремальной задачи может быть использован следующий прием. Из системы m

28
уравнений (2.2.2) можно выразить m независимых переменных xi как функции остальных n-m
переменных, т.е. представить ограничения (2.2.2) в виде:
xk=fk(x1,x2,…,xn-m) (2.2.3)
Подставляя полученные соотношения (2.2.3) в выражение (2.2.1), получим функцию R*, которая
будет зависеть только от n-m переменных, не связанных дополнительными условиями:
R*=R*(x1,x2,…,xn-m) (2.2.4)
Таким образом, устраняя ограничивающие условия (2.2.2), удалось и уменьшить
размерность исходной оптимальной задачи. Однако, практически почти невозможно аналитически
решить систему уравнений (2.2.2) и представить ограничения в форме (2.2.3). Поэтому для
решения таких задач чаще всего используют метод неопределенных множителей Лагранжа, суть
которого заключается в следующем.
(0)
(x
( 0) (0)
Предположим, что в некоторой точке x(0) , x 2 ,..., x n ) функция R (2.2.1)
1
имеет условный экстремум. Это означает, что система ограничивающих условий (2.2.2) в данной
точке также выполняется. Как известно, необходимым условием экстремума функции многих
переменных является равенство нулю дифференциала этой функции в экстремальной точке.
n R ( x (0))
 d x  0 (2.2.5)
i  1  xi
i

При этом дифференциалы переменных dxi (i=1,…,n) в выражении (2.2.5) не все являются
независимыми, поскольку на указанные переменные наложены дополнительные условия (2.2.2).
Продифференцируем эти условия в точке x(0), в результате чего получим систему равенств:
 ( x )
(0)
n


i 1
k

 xi
 d xi  0, k  1,..., m (2.2.6)

Умножим каждое из равенств системы (2.2.6) на пока неопределенный множитель k (k=1,…,m) и


сложим все эти равенства с выражением (2.2.5). Тогда, объединяя слагаемые с одинаковыми
дифференциалами dxi, найдем:

n  R( ( 0) )
 x   1   ( x
(0)
)   ( x
(0)
) 
      k  m

 d xi  0 (2.2.7)

 xi xi xi 
i 1  1
 
Среди дифференциалов dxi независимыми являются только n-m, тогда как остальные m
дифференциалов зависят от первых. Поэтому в соотношении (2.2.7) независимым образом можно

29
изменять лишь n-m дифференциалов, например, dxi (i=1,…,n-m). Для того, чтобы исключить m
зависимых дифференциалов dxi (i=n-m+1,…,n) из выражения (2.2.7), выберем m множителей k
(k=1,…,m) так, чтобы коэффициенты при этих превратились в нуль.
Для этого определим k из системы уравнений:
 ( x )  ( x )
(0) (0) ( 0)
R( x )
 1  1
   m
0
 xi  xi  xi (2.2.8)

i  n - m  1,..., n
Тогда в соотношении (2.2.7) останется только n-m слагаемых с независимыми дифференциалами
dxi (i=1,…,n-m) и оно может быть переписано в виде:

n m  R( ( 0) )
 x   1 x   
  (
( 0)
)   m x
(
(0)
) 
   
 d xi  0 (2.2.9)

 xi xi xi 
i 1  1
 
Для того чтобы соотношение (2.2.9) выполнялось при любых значениях независимых
дифференциалов dxi (i=1,…,n-m), необходимо равенство нулю коэффициентов при этих
дифференциалах, что дает систему уравнений
 R( ( 0))
 x   1 x
(
(0)
)   m x
(
( 0)
) 

  1     m   0
  xi  xi  xi  (2.2.10)

i  1,..., n - m
аналогичную системе (2.2.8). Объединяя системы уравнений (2.2.8) и (2.2.10), окончательно
получим:

 ( x )  ( x ) 
(0) ( 0) ( 0)
R( x ) 
 1  1
   m m
 0
 xi  xi  xi  (2.2.11)

i  1,..., n i  1,..., n
Системе (2.2.11) должны удовлетворять как величины k (k=1,…,m), так и значения
переменных xi (i=1,…,n), при которых функция R имеет условный экстремум. Кроме системы

30
(2.2.11), переменные xi должны также удовлетворять системе условий (2.2.2). Таким образом,
получим всего n+m уравнений (системы (2.2.2) и (2.2.11)), из которых можно найти n значений
переменных xi (i=1,…,n), соответствующих условному экстремуму функции R и m значений
множителей k (k=1,…,m).
Чтобы представить полученные результаты в более компактной форме, введем
вспомогательную функцию Лагранжа, которую определим соотношением:

m
 ( x,  )  R ( x )    k  ( x ) (2.2.13)
k
k 1
С помощью функции  систему уравнений (2.2.11) можно записать в виде:
 ( x,  )
0 i  1,..., n (2.2.14)
 xi
Итак, для решения задачи отыскания условного экстремума функции R (2.2.1) при ограничениях
на переменные (2.2.2) необходимо решить систему уравнений (2.2.13), где функция 
определяется уравнением (2.2.12), совместно с системой ограничивающих условий (2.2.2).
Можно пойти дальше по пути обобщения и обозначить неопределенные множители как
новые вспомогательные переменные
k = xn+k k=1,…,m. (2.2.15)
Тогда формально задача нахождения условного экстремума функции R (2.2.1) сведется к
нахождению безусловного экстремума функции  (xi), где i=1,…, n+m), поскольку при
дифференцировании функции  (xi) по вспомогательным переменным в результате
приравниваания нулю получаемых производных находится система ограничений (2.2.2).
Следует отметить, что метод множителей Лагранжа позволяет найти лишь необходимые условия
существования условного экстремума для непрерывных функций, имеющих к тому же
непрерывные производные. Полученные в результате поиска экстремальные условия необходимо
точно также проверять на тип экстремума, как это было изложено ранее.

2.2.1. Оптимальное распределение потоков сырья между параллельно


работающими производствами.
В качестве примера использования метода неопределенных множителей Лагранжа, рассмотрим
задачу оптимального распределения потока сырья между параллельно работающими аппаратами.
Эта задача является типичным примером задачи об оптимальном распределении ограниченных
ресурсов. Эта задача встречается очень часто на практике во многих производствах, и поэтому мы
рассмотрим такую задачу безотносительно типа работающих аппаратов.
31
1 r1
1 r1

v1 r2
2
v2

vm

i ri
v1 r2
2
v2

vm
32
i ri

N rN
N rN

Рис.2.4 Схематическое изображение производства с распределением


Рис.2.4 нескольких
Схематическое изображение
потоков сырья производства с распределением
нескольких потоков сырья

На рис.2.4 представлена схема такого производства, в котором m потоков сырья распределяется


между N параллельно работающими аппаратами или процессами, включающими целый ряд
аппаратов. Предположим, что каждый из N процессов характеризуется своим критерием
оптимальности ri*, выражение для которого выбрано так, чтобы эффективность всего
производства оценивалась суммарным значением критериев оптимальности отдельных процессов.
N
R   ri
*
(2.2.16)
i 1

Эффективность каждого процесса является функцией принятого в данный момент


распределения потоков сырья Vk(i) (k=1,…,m). Кроме того, на эффективность ri* может оказывать
влияние еще ряд параметров i-го процесса, которые характеризуют его режим, и могут быть как
управляемыми, так и неуправляемыми переменными величинами. Это могут быть, например,
параметры теплового режима процесса, поддающиеся управлению, либо присутствие примесей,
которые изменяются случайным образом.
Вектор управления i-го процесса может записан в следующем виде:
u(i)=(u1(i), u2(i),…, uqi(i)) (2.2.17)
Число переменных параметров этого типа qi в общем случае может быть различным для любого
процесса рассматриваемого производства.
33
Таким образом, критерий оптимальности каждого из процессов можно записать как
ri*=ri*(v(i),u(i)) (i=1,…N) (2.2.18)
Критерий оптимальности всего производства может считаться функцией n=mN значений
векторных величин u(i). Полагая, что параметры uk(i) произвольным образом влияют на вид оценки
эффективности i-го процесса, представим соотношение (2.2.17) в форме:
ri=ri(v(i)) (2.2.19)
Это позволяет записать общее выражение критерия оптимальности всего производства как
функцию только распределения потоков сырья между отдельными процессами.
N

 r (v
(1) (2) (N ) (i )
R (v ,v ,..., v ) i
) (2.2.20)
i 1
Поставим задачей оптимизации отыскание такого распределения потоков сырья между
отдельными процессами, при котором критерий оптимальности производства в целом (2.2.20)
имел бы минимальное значение при любой заданной совокупности значений величин u(i) (i=1,
…,N). Такая задача может возникнуть, например, при решении вопросов управления
распределением сырья в производстве, когда оптимальный режим каждого процесса в отдельности
уже обеспечивается локальной системой оптимизации с помощью параметров u(i)k, доступных для
целенаправленного изменения. Поскольку величина любого потока сырья Vk, поступающего в
производство, задана, выбор оптимальных значений v(i)k должен производиться с учетом условий
N

v
(i )
k
V k k  1,..., m (2.2.21)
i 1
которые представляют собой ограничения типа равенств на независимые переменные v(i)k и
позволяют использовать для решения поставленной оптимальной задачи метод множителей
Лагранжа.
Перепишем уравнение (2.2.21) в следующую форму:

V k   vk  0
(i )
(2.2.22)
i 1
Составим функцию Лагранжа для поставленной задачи в соответствии с ранее полученным
уравнением (2.2.13).
N m
 N
(i ) 
   ri (v    k V k   v k  (2.2.23)
(i )

i 1 k 1  i 1 
или
m N
 m
(i )
    k V k   ri (v )    k  v k  (2.2.24)
(i )

k 1 i 1  k 1 
34
В последнем уравнении каждое слагаемое второй суммы зависит от тех величин vk(i) (k=1,…,m),
которые определяют нагрузку по сырью лишь i-го процесса.
Дифференцируя выражение (2.2.24) по vk(i), найдем соотношение
(i )
  r i (v )
(i )
 (i )
 k (2.2.25),
 vk  vk
с учетом которого система уравнений (2.2.14) может быть представлена как
(i )
 ri (v )
(i )
 k k=1,…,m; i=1,…,N (2.2.26)
 vk
Параметры k можно исключить из уравнений системы (2.2.26), после чего получим:
(1) ( 2) (N )
 r1 (v )  r 2 (v )  r n (v )
(1)
 ( 2)
   (1)
k  1,..., m (2.2.27)
 vk  vk  vk
Отсюда следует, что при оптимальном распределении потока k-го сырья, производные
dri/dvk(i) (i=1,…,N) от критериев оптимальности всех процессов, на которые это сырье
распределяется, должны быть равны между собой. Система уравнений (2.2.27) включает уже
m(N-1) равенств. Добавляя к этой системе m условий (2.2.22), получим систему mN уравнений
относительно mN неизвестных величин vk(i). Следует отметить, что решение системы уравнений
(2.2.27) и (2.2.25) на практике может оказаться достаточно сложным.
Однако вывод, сделанный относительно равенства производных (2.2.27) при оптимальном
распределении потоков сырья представляет практический интерес и может быть использован для
организации управления производством.

2.2.2. Определение минимального реакционного объема в каскаде реакторов


идеального перемешивания.
В каскаде из трех реакторов идеального перемешивания протекает реакция первого порядка типа
АВ. Реакторы работают в изотермическом режиме при одной и той же температуре Т.
E

Константа скорости реакции в соответствии с уравнением Аррениуса k  k0 e RT , поскольку
мы принимаем, что температура во всех реакторах каскада одинакова, то константа скорости в
каждом реакторе одна и та же. Обозначим ее через k. Необходимо так выбрать объемы отдельных
35
реакторов Vi (i=1,2,3), чтобы при заданной производительности и заданной конечной степени
превращения, суммарный объем реактора был бы минимальным.
Управляющими переменными для данной задачи будут времена пребывания реакционной смеси в
каждом реакторе каскада.

 i
V i (i=1,2,3) ( 2.2.28)
v
Где Vi – объем i-го реактора в каскаде, м3; v- объемный расход реакционной смеси через каскад
реакторов.
Обозначим через x степень превращения исходного реагента в продукты реакции

c  cA
xA 
A, 0
(2.2.29)
c A, 0
Где сА,0 – концентрация исходного реагента на входе в реактор, [кмоль/м 3]; сА- концентрация
исходного реагента на выходе их реактора, [кмоль/м 3].
При заданной производительности каскада реактора, минимальный суммарный объем реактора
соответствует минимальному времени контакта в каждом реакторе.

Для вывода уравнений математической модели в каскаде реакторов в изотермических условиях


составим уравнения материального баланса для каждого реактора в каскаде. Обозначим через с А0-
концентрацию реагента на входе в первый аппарат каскада. Тогда для установившегося режима
работы уравнение материального баланса по компоненту А для первого аппарата каскада будет
иметь следующий вид:
v  c A0 V 1 k  c A1  v  c A1  0 ; Для любого аппарата каскада можно очевидно записать
следующее уравнение материального баланса: v  c A,i 1 V i k  c A,i  v  c A,i  0 ;
Разрешая уравнение относительно концентрации на выходе из i-го реактора и разделив уравнение
на объемную производительность реактора, мы получим рекуррентное уравнение:

c
A,i 1 c ; c ; c
c 1  k  c 1  k  c 1  k  c
A, 0 A,1 A, 2
 ;    ;
A,i
i i
A,1
i 1
A, 2
i 2
A, 3
1  k 
i 3

36
Вычисляя последовательно концентрации на выходе из 1-го реактора и подставляя полученное
значение в выражение для вычисления концентрации в последующем реакторе, мы получим

c
c  A, 0
следующее выражение: .
A, 3
(1  k  )  (1  k  )  (1  k  )
1 1 2 2 3 3
Подставляя полученное выражение в уравнение (2.2.29) для степени превращения, получим
следующее выражение:
:

 3
1 
x A , k  1  
  (2.2.30)
 i 1 (1   i k i 
 )
Для случая 3-х реакторов в каскаде, работающих в изотермических условиях, выражение (2.2.30)
принимает вид:
 1 
 
x А,k  (1  )  (1 
1   (2.2.31)
 k  1 k  2)  (1  k  3) 
Таким образом, критерий оптимизации для рассматриваемой задачи будет иметь вид:
R  ( 1  2  3)  min ( 2.2.32)
При выполнении ограничения
 1 
f  x A , k  1  
зад
(2.2.33)
 (1  k )  (1  k )  (1  k ) 
  1  2  3 
Запишем выражение для вспомогательной функции Лагранжа в соответствии с уравнением
(2.2.13):
  R    f   1  2  3 
 зад  1  (2.2.34)
   x A , k  1  

  (1  k  1)  (1  k  1)  (1  k  1 
)
Продифференцируем функцию Ф по переменным 1, 2, 3,  и приравняем нулю полученные
производные:
37
  k
 1 0
 1
 2)  (1  k  3)  (1 k  1)
2
(1  k 
  k
 1 0
 2
 )  (1  k  )  (1 k  2)
2
(1  k  1 3
(2.2.35)
  k
 1 0
 3
 )  (1  k  )  (1 k  3)
2
(1  k  1 2

 зад 1

 x 1 0
(1  k  1)  (1  k  2)  (1 k  3)
A,k

Для решения полученной системы введем обозначения:


1+k1=x, 1+k2=y, 1+k3=z , подставим эти переменные в систему (2.2.37) и получим следующую
систему уравнений:
2
x  yz   k  0
2
y  x z   k  0
(2.2.38)
2
z  yz   k  0
 x  1  x  y  z  1  0
зад
A, k
Вычтем из 1-го уравнения системы (2.2.38) 2-е и вынесем за скобки произведение xyz, получим:
xyz(x-y)=0,
отсюда следует, что x=y.
Вычтем из 2-го уравнения (2.2.38) третье и вынесем за скобки произведение xyz, получим:
xyz(y-z)=0
отсюда следует, что y=z.
Таким образом из первых 3-х уравнений системы (2.2.38) мы нашли, что x=y=z, или
1+k1=1+k2=1+k3 откуда следует, что при равной температуре в реакторе:
1=2=3 (2.2.39)
При постоянном объемном расходе реакционной смеси через реакторы должны быть равных
объемов и при этом суммарный объем реакторов будет минимальным. Для определения времени
38
пребывания в реакторе, соответствующего оптимальным условиям используем 4-е уравнение
системы (2.2.38).

1  _
x yz   1 k   ,
1  x A,k
зад

  (2.2.40)
1
1 3 зад
_ 1  x A,k
откуда  
k
Рассмотрим численный пример использования метода множителей Лагранжа для
определения оптимальных условий, обеспечивающих использование минимального реакторного
объема для достижения заданной конечной степени превращения при заданной
производительности реакторного узла. Пусть задана производительность реакторного узла по
реакционной смеси – v= 2 м3/час. Заданная конверсия в конце каскада из трех реакторов равна
xA,kзад=0.936. В реакторах происходит реакция превращения исходного реагента с константой
скорости k=0.35 час-1.
В соответствии с уравнением (2.2.40 рассчитаем
1
1 3 =4.2 часа Зная объемный расход можно рассчитать объем реактора
_
 1  0.936
k
_

V р  v  = 24.2= 8.4 м3. Суммарный объем реакторного пространства будет равен

Vсум=8.43=25.2 м3.

Если температуры в реакторе не равны, то k(Т1)1=k(Т2)2=k(Т3)3


Если температуры в реакторах различаются, например, на 10 С и температуры будут равны
Т2=Т1+10; Т3=Т2+10, и если температур6ный коэффициент константы скорости равен 2, мы имеем
следующее соотношение между константами: k(T2)/k(T1)=2 и k(T3)/k(T2)=2. В этом случае при
оптимальном значении параметра k(Тi)i=const мы получаем, что время пребывания во втором
реакторе, будет в два раза меньше, чем в первом, а время пребывания в 3-м реакторе будет в два
раза меньше, чем во 2-м. Таким образом, повышение температуры в реакторах каскада на 10С
приводит к существенному сокращению общего времени пребывания и сокращения необходимого
реакционного объема. В этом случае общее время пребывания будет равно:
39
общ(неизот)=1+2+3=1+0.51+0.251=1.751
При равной температуре в каждом реакторе каскада общее время пребывания равно
общ(изот)=1+1+1=31.
Отношение общ(неизот)/ общ(изот)=1.75/3=0.583. Таким образом, применяя ступенчатое
повышение температуры в реакторах каскада из 3-х аппаратов, можно добиться сокращения
необходимого реакционного объема на 42%.
Таким образом, с помощью метода множителей Лагранжа можно решать широкий круг
задач оптимизации с ограничениями типа равенств, однако когда оптимизируемая функция
нелинейна относительно управляющих переменных, и их число велико, получаются сложные
системы нелинейных алгебраических уравнений, решение которых затруднительно и приходится
использовать методы нелинейного программирования для решения получающихся уравнений.

40
Раздел 2.3. Классические вариационные задачи и методы их решения.
Рассмотренные в предыдущих разделах методы решения задач
оптимизации применимы к объектам с сосредоточенными параметрами, динамика
которых описывается обыкновенными дифференциальными уравнениями, и когда
искомыми управлениями являются переменные. Для объектов с распределенными
параметрами, динамика которых описывается дифференциальными уравнениями в
частных производных, управлениями являются не переменные, а функции.
В этом случае критерий оптимизации будет уже формироваться не как
функция управляющих переменных, но уже как функция от управляющих
функций.
Эта величина называется функционал:
I  I [ x (t )] (1.3.1)
Решением задачи отыскания экстремума функционала I служат одна или несколько
функций xj (t) (j=1,…,q), при подстановке которых в выражение (1.3.1) для
функционала его величина принимает экстремальное значение. Такие функции
называются экстремалями.
Предположим, что задача оптимизации сведена к задаче отыскания экстремума
функционала
(k )
t
I    (t , x, x ' , )dt (1.3.2)
(0)
t

Допустим, что экстремаль известна и задана в виде уравнения


x=x(t) (1.3.3)
Введем такую произвольную дифференцируемую функцию w(t), чтобы она
обращалась в нуль на концах интервала интегрирования:
w(t(0))= w(t(k))=0 (1.3.4)
Образуем теперь некую новую функцию
y(t,)=x(t)+w(t) (1.3.5)
Где - малый численный параметр.
Подставим функцию y в выражение для функционала (1.3.2). Для заданной
функции w(t) величину функционала можно считать функцией параметра :
(k )
t
I ( )    (t , x    w, x '  w' )dt (1.3.6)
(0)
t

41
Поскольку x(t) является экстремалью функционала I, величина I(), определяемая
соотношением (1.3.6) должна иметь экстремум при =0, и, следовательно, её
производная dI()/d должна обращаться в нуль как производная функции одной
переменной в точке экстремума. Продифференцируем (1.3.6) по  для нахождения
этой производной:

 dI ( ) 
(k )
t
  (t , x, x ' )  (t , x, x ' ) 
I ' ( )     ( 0)  x  w   w'  dt (1.3.7)

 d   0 t
x' 
и преобразуем второй член в подынтегральном выражении с помощью
интегрирования по частям

(k ) (k )
t   t d   
( 0 ) x'  w 'dt 
x '
 w  
(0)
w    dt (1.3.8)
dt  x ' 
t t
тогда выражение (1.3.7) перепишется в виде:
(k )
t

(k)
t   d   
I ' ( 0)  w   w     dt (1.3.9)
x dt  x ' 
x' t ( 0)
t
(0) 

В последнем соотношении на основании определения функции w (1.3.4)


(k )
t

w 0
x' t
(0)

С учетом этого уравнение (1.3.9) будет иметь вид

42
(k )
t   d   
I ' ( 0)   w   x
( 0)
    dt (1.3.10)
dt  x ' 
t
Для экстремали необходимо, чтобы I’(0) =0. Это требует равенства нулю интеграла
в правой части уравнения (1.3.9). Поскольку функция w(t) произвольна, для
обращения в нуль интеграла необходимо равенства нулю выражения в квадратных
скобках на всем интервале интегрирования. Отсюда следует, что если функция x(t)
является экстремалью функционала (1.3.2), она должна удовлетворять уравнению
 d   
    0 (1.3.11).
x dt  x ' 
Это уравнение называют обычно уравнением Эйлера.
Величина I, равная произведению I’(0) представляет собой дифференциал
функции I() при =0, который в вариационном исчислении называют первой
вариацией функционала I. Полагая, что w(t)=(x), можно записать для первой
вариации следующее выражение:
(k )

t
(k )
t
 d 
I  I ' (0)  x    w ( 0 )   w   x   x '   x  dt (1.3.12),
x' t (0)  dt 
t
где х является вариацией функции x(t).
Теперь условие того, что функция x(t) есть экстремаль функционала I может быть
сформулировано как требование равенства нулю первой вариации функционала I,
откуда следует также и уравнение Эйлера. Понятие вариации функционала в
вариационном исчислении аналогично понятию дифференциала в обычном
анализе. Подобно тому, как в анализе дифференциал функции характеризует
приращение функции x(t) при изменении независимой переменной t на бесконечно
малую величину dt, первая вариация функционала I определяет приращение
функционала I при бесконечно малом варьировании х функции x(t).
Уравнение Эйлера является обыкновенным дифференциальным уравнением
второго порядка относительно функции x(t). Решение этого уравнения содержит
две произвольные постоянные, которые должны быть определены из граничных
условий, например,
x(t(0))=x(0) x(t(k))=x(k) (1.3.13)
Уравнение Эйлера получено для случая, когда аргументом функционала
является только одна функция. Если функционал зависит от нескольких функций
одной переменной и описывается выражением вида:

43
(k )
t
I ( x1 , x 2 ,..., x m )    (t , x ,..., x , x
(0)
1 m 1
' ,..., x'm )  dt (1.3.14)
t
то, проводя аналогичные рассуждения можно получить систему уравнений Эйлера,
которой должны удовлетворять эти функции, чтобы функционал (1.3.14) имел
экстремальное значение:
d
 xi  dt  xi  0, i  1,..., m (1.3.15)
Таким образом, в вариационном исчислении задача отыскания экстремума
сводится к решению системы дифференциальных уравнений с краевыми
условиями.
Аналогично тому, как в классическом анализе функций равенство нулю
производной обеспечивают только необходимое условие экстремума, так и в
вариационном исчислении уравнения Эйлера обеспечивают также только
необходимые условия экстремума. Если искомой является только одна функция,
проверка типа экстремали может быть выполнена относительно просто. Так, когда
экстремаль функционала (1.3.2) является минималью, для любой ее точки должно
соблюдаться условие:
A
x,x’(t,x,x’) 0 (1.3.16)
Если же экстремаль функционала
A есть максималь, то:
x,x’(t,x,x’) 0 (1.3.17)
Соотношения (1.3.16) и (1.3.17) называются, обычно, условиями Лежандра. Они
соответствуют обычным условиям на вторую производную, используемым в
анализе. A
Рассмотрим пример использования вариационного исчисления для нахождения
оптимального управления.
A
Пусть в реакторе идеального вытеснения протекают параллельные реакции

P
Q
P
A Q

При этом целевым продуктом является вещество P. Рассмотрим задачу


нахождения оптимального температурного профиля для достижения заданной
44
концентрации целевого продукта Р при минимальном времени пребывания в
реакторе. Реакция имеет первый порядок по компоненту А, математическое
описание процесса в реакторе при этом будет иметь вид:
d xA
 ( k 1  k 2 )  x A
d
(1.3.18)
d xP
 k1  x A
d
Где, хА, хР, - текущие концентрации реагентов А и Р по текущей длине
( или времени контакта реактора) , k1, k2 – константа скорости основной и
побочной реакций. Константы скорости зависят от температуры в соответствии с
законом Аррениуса
Ki (T)=exp(lnk0i –Ei/(RT)), i=1,2. Температура изменяется по длине реактора и
является управляющей функцией процесса Т=Т().
Граничные условия для задачи имеют следующий вид:
хА(0)=хА(0), хР(0)=хP(0)= 0
Необходимое время пребывания, при котором достигается заданная концентрация
целевого реагента, может быть определено из уравнения (1.3.18) при его
интегрировании следующим образом:
(k )
xP d xP
k   k (T )  x (1.3.19)
0 1 A
В уравнении (1.3.19) величины х А и Т должны рассматриваться как функции
переменной интегрирования хР. Для установления этих функциональных
зависимостей используем уравнения математической модели. Для этого разделим
1-е уравнение на 2-е в системе уравнений (1.3.18). В итоге получим следующее
соотношение

d xA  
 1  k 2  (1.3.20)
d x P  k 1 
Обозначим через Т0 такую условную температуру, при которой константы скорости
основной и побочной реакции будут равны k1(T0)=k2(T0)=k0 и введем
вспомогательную величину z, определяемую соотношением:
45
 E 1  1 1 
z  exp     (1.3.21)
 
 Rг  T 0 T 
Применяя эту зависимость, можно записать выражения для констант скорости в
следующем виде:

k 1  k 0 z k  k 0  z E 2 E1
/
(1.3.21)
2
C учетом уравнения (1.3.21) уравнение (1.3.20) может быть записано в следующем
виде:

d xA
d xP

 x'A   1  z E 2 E 1 или z 
/ 1
  - x'A 1
E1
E 2 E1 (1.3.22)

Теперь с учетом новых обозначений выражение для функционала можно записать в


следующем виде:
(k )

1 xP d x
  
(k ) P
( 1.3.23)
k E1
x A ( x' A 1) 2 E1
0 0
 E
или после замены обозначений:

m E 1
; x  x A ; t  x P ; I   k 0 
(k )

E E 2 1
(k ) (1.3.24)
t dt
I 
t x  ( x'1)
m
(0)

Полученный функционал можно использовать для определения его экстремали,


максимизирующей его значение.
Рассмотрим применение метода вариационного исчисления для синтеза
регулятора, оптимального по быстродействию.

46
Пример. Найти оптимальную по быстродействию кривую изменения скорости
двигателя постоянного тока независимого возбуждения при отработке заданного
T

перемещения  0     dt и ограничениях, наложенных на нагрев двигателя,


0
T

определяемых потерями в якоре q   R  t  dt  A . Здесь Т- время перемещения


2

двигателя; -частота вращения двигателя; А – допустимые потери; i и R – ток и


сопротивление якоря.
Решение. Математическая формулировка задачи: Найти экстремаль функционала
T

Q
1
  dt  min (1.3.25)
0
при наличии уравнений связи в виде:
T T

Q   R  t  dt  A ; Q     dt   (1.3.26).
2
2 3 0
0 0
Таким образом, мы имеем задачу на условный экстремум, для решения
которой составим вспомогательную функцию
F*  F   2  F 2  3  F 3  1  2  R i   3 
2
(1.3.27)
Запишем уравнение движения двигателя при неизменном потоке возбуждения
=const и отсутствии момента сопротивления Мс=0:
d J
J  M д  K M  i; i  ' (1.3.28)
dt KM
Здесь J – момент инерции; Мд – момент двигателя; КМ=СМ;
CМ- электромашинная постоянная. Тогда уравнение (1.3.27) можно записать в виде:
F *  1   2  K  '   3  
2
, где К=J2R/KM2
Для нахождения экстремали уравнения (1.3.25), запишем уравнение Эйлера с
учетом выражений (1.3.26):
F * d F *
dt  '  3
    2   2  K   ' '  0 , откуда


47
''   13
(1.3.29)
2  K 2  K
2 0
где 023.
Интегрируя уравнение (1.3.29) найдем уравнение для экстремалей в следующем
виде:
1 1 2
'   t  C1 ;    t  C1  t  C2 (1.3.30)
2  0  K 4  0  K
С учетом уравнения (1.3.28) запишем выражение для тока:
J J J
i '  t   C1 (1.3.31)
K M
2  0  K  K M KM
Таким образом, оптимальное в смысле быстродействия управление
двигателем при выполнении условий (1.3.26) осуществляется при линейном
изменении тока и изменении  по параболическому закону.
Постоянные интегрирования С1 и С2 и постоянный множитель 0 можно
определить из граничных условий
(0)=0; (T)=0; i(0)=i0; i(T) = -i0 (1.3.32),
соответствующих началу разгона и торможения двигателя.
Подставив (1.3.32) в (1.3.30) и (1.3.31) окончательно запишем выражения для
постоянных интегрирования и постоянного множителя в следующем виде:

KM ; J T
C1 i0 J
  C2  0; 0   4  i0  K  K M
(1.3.33)

Значения i0 и Т можно найти с помощью уравнений связи (1.3.26) и соотношений


(1.3.30)-(1.3.33). После интегрирования получим
2
T
T  R  i0
q   R  i  dt 
2
 A (1.3.34)
0
3

48
2

  dt  K i T
T
 
 
0
M

6 J
0
(1.3.35)
0
Решив совместно уравнения (1.3.34) и (1.3.35) можно определить выражения для
времени и начального тока:

12   R  J 6   J
2 2

T 3 0

A K M
2
; i0  0
2
(1.3.36)
K TM
Подставляя (1.3.33) с учетом (1.3.36) в (1.3.30) и (1.3.31) найдем в окончательном
виде закон изменения тока и скорости при оптимальном режиме в функции
времени (рис. 1.3.1). Так как управление двигателем постоянного тока обычно
производится изменением напряжения на зажимах якоря Uя, то воспользовавшись
уравнением якорной цепи
Uя=Ri+Kc (1.3.37)
и уравнениями i(t) и (t) , можно найти зависимость Uя(t). Так как зависимость i(t)
линейна, а (t) параболическая , то Uя(t) тоже будет изменяться по параболе
(рис.1.3.1).
Если управлять двигателем, контролируя выходные координаты  и , то,
исключив переменную t, получим зависимость i(), подставив которую в (1.3.37),
найдем зависимость Uя(). Кроме того, для учета знака i необходимо также
производить непрерывное измерение угла поворота . Окончательно получим:

U я
( , )  B  (B
1 2
 2   )  sign(  2   )  K e   (1.3.38)
0
где
1/ 3

R A  9 A K 2M 
B1  
; B2   
 4  R  J 2 
0
 0 
Как следует из уравнения (1.3.38), для реализации оптимального алгоритма
управления требуется нелинейный регулятор, который проще всего реализовать с
помощью вычислительного устройства.

49
i,Uя,
i0

U0

U
T
я

t
i 0

0/2 

U0

i0

Рис.1.3.1 Изменение переменных при оптимальном управлении.

50
2.4. Динамическое программирование.
Динамическое программирование хорошо приспособлено для решения задач оптимизации
многостадийных процессов. При этом эта многостадийность может рассматриваться как
распределенной во времени, например по отдельным участкам времени, так и в пространстве,
например по отдельным аппаратам, в которых происходит последовательная обработка сырья,
либо по отдельным элементам одного аппарата, например по отдельным тарелкам
ректификационной колонны, либо по отдельным аппаратам каскада реакторов. Для
многостадийного процесса предполагается известным математическое описание, учитывающее
возможность выделения управляющих воздействий на каждой стадии:
x k(i)= k(i)(x1(i-1),…,xm(i-1),u1(i),…, ur(i)) (1.4.1)
k=1,…,m; i=1,…N
Здесь, i – номер стадии. Математическое описание связывает выходные переменные i-й стадии с
ее входными переменными и управляющими воздействиям на этой стадии.
В векторной форме уравнение математического описания многостадийного процесса можно
записать в следующем виде:

(i ) (i ) ( i 1) (i )
x (x , u ) (1.4.2)
Где x(i) – вектор совокупности переменных состояния, i=1,…,m;
u(i) – вектор совокупности управляющих воздействий ( управление ) на i-й
стадии.
Размерности векторов состояния и векторов управления на каждой стадии в общем случае
могут быть различными для разных стадий процесса. Однако далее, не нарушая общности, можно
принять, что размерности m и r векторов состояния и управления для всех стадий процесса
одинаковы. В реальных процессах на значения переменных состояния и управления можно
наложить ограничения, определяющие диапазон изменения или взаимосвязь указанных
переменных. Это можно выразить либо соотношениями типа
Fj(x(1),…, x(N), u(1),…, u(N) )  0 (1.4.3)
Либо соотношениями типа
(i ) (i )
x  X, u U (1.4.4),
означающими, что значения переменных x(i) и u(i) принадлежат к допустимым областям их
изменения X и U, ограниченным соотношениями (1.4.3).
Предположим, что эффективность каждой стадии процесса оценивается некоторой величиной:
ri=ri*(x(i),u(i)) (1.4.5)
заданной в виде функции от переменных состояния стадии x(i) и применяемого на ней управления
u(i).
51
С учетом математического описания (1.4.2), можно записать уравнение (1.4.5), выразив
переменные состояния на данной стадии через ее входные переменные и управление.
ri=ri (x(i-1),u(i)) (1.4.6)
Результирующая оценка эффективности многостадийного процесса в целом определяется как
аддитивная функция результатов, получаемых на каждой стадии:
N

r (x
( i 1) (i )
R N
 i
, u ) (1.4.7)
i 1
Естественно, что значение критерия оптимальности зависит от совокупности всех управляющих
воздействий на всех стадиях процесса, которая представляет собой набор значений векторов u(i)
для каждой стадии:
_
(1) (2) (N )
u N
 (u , u ,..., u ) (1.4.8)
_
Совокупность управлений для всех стадий процесса
u N
будем называть стратегией

управления многостадийным процессом, или просто, стратегией управления.


Таким образом, задачу оптимизации многостадийного процесса можно сформулировать как задачу
отыскания оптимальной стратегии

_
(1) (2) N
u Nопти
 (uопт , uопт ,..., uопт) (1.4.9)

для которой критерий оптимальности RN принимает максимальное или минимальное значение, в


зависимости от постановки задачи. В основу метода динамического программирования положен
принцип оптимальности Беллмана, который применительно к многостадийному процессу, схема
которого приведена на рис.1.4.1, может быть сформулирован следующим образом:

x(0) x (2) x(i-1)


x (1)
x(i) x(N-1) x(N)
1 2 i N

u(i) u(N)
u(1) u(2)

Рис.1.4.1 Схема многостадийного процесса


52
x(0) x (2) x(i-1)
x(1) x(i) x(N-1) x(N)
1 2 i N

u(i) u(N)
u(1) u(2)

Рис.1.4.1 Схема многостадийного процесса

Оптимальная стратегия обладает тем свойством, что каковы ни были начальное


состояние x(0) многостадийного процесса и управление им на первой стадии u(1), последующие
управления на всех стадиях u(i) (i=2,…,N) должны составлять оптимальную стратегию ữ N-1
относительно начального состояния х(1) первой стадии, определяемого начальным
состоянием процесса х(0) и управлением на первой стадии процесс u(1).
Под оптимальной стратегией ữ N-1 понимается стратегия управления многостадийным процессом,
включающим N-1 последних стадий исходного процесса, придающая критерию
N

r (x
( i 1) i
R N 1  i
, u ) (1.4.9.)
(i 2
оптимальное значение.
Таким образом, если известна оптимальная стратегия управления ữ N-1 для любого
возможного состояния х(1) первой стадии N – стадийного процесса, то уже не составляет труда
выбрать оптимальное управление и на первой стадии u(1)опт, поскольку на последующих стадиях
оно определяется выходом первой стадии
ữN-1= ữN-1(x(1) ) (1.4.10)
Процедура применения принципа оптимальности для оптимизации N-стадийного процесса должна
начинаться с последней стадии процесса, для которой не существует последующих стадий, могущих
повлиять согласно принципа оптимальности на выбор управления uопт(N) на этой стадии. После того как
оптимальное управление u(N)опт. найдено для всех возможных состояний входа последней стадии x(N-1)X,
можно приступить к определению оптимального управления для предыдущей (N-1) стадии, для которой
оптимальная стратегия управления на последующих стадиях (т.е. на последней N-й стадии) известна, и т.д.
В результате может быть найдена оптимальная стратегия управления для всего многостадийного
процесса, являющаяся функцией начального состояния процесса uN(х(0)). Если начальное состояние х(0)
известно ( задано или выбрано из условия оптимума критерия R), то его значение определяет оптимальные
управления для всех стадий процесса.

53
Рассмотрим более детально процедуру нахождения оптимального управления многостадийным процессом
Пусть величина критерия оптимальности многостадийного процесса определяется выражением:
N
  ri( x
i 1 i
R N
, u ) (1.4.11)
i 1
Величина этого критерия зависит только от состояния 1-й стадии х(0), т.е.
RN=RN(x(0)) (1.4.12)
Критерий оптимальности RN-1, определенный также для N-1 последних стадий N-стадийного
процесса выражением (1.4.9), может рассматриваться как функция состояния выхода первой
стадии х(1):
RN-1=RN-1(x(1)) (1.4.13)
Предположим, что задача оптимизации состоит в нахождении оптимальной стратегии управления
uN,опт= (uопт(1), uопт(2),…, uопт(N),) (1.4.14)
максимизирующей величину RN. Обозначим через fN максимальное значение RN, которое может
быть получено при использовании оптимальной стратегии управления uN,опт. Значение fN также
зависит от состояния входа первой стадии x(0) и может быть определено как
f N ( x (0))  max R N ( x (0))
u (i ) U (1.4.15)
i 1,..., N
где максимизация производится по всем возможным управлениям u(i), принадлежащим области
допустимых значений U на всех стадиях процесса.
Соотношение (1.4.15) является математической формулировкой задачи оптимизации
N-стадийного процесса и не содержит указаний как именно нужно максимизировать критерий RN,
чтобы получить оптимальную стратегию (1.4.14).
Критерий оптимальности N-стадийного процесса является аддитивной величиной критериев
оптимальности отдельных стадий многостадийного процесса:
RN(x(0))=r1(x(0),u(1))+RN-1(x(1)) (1.4.16)
Подставим теперь уравнение (1.4.16) в уравнение (1.4.15). В итоге получим:

f N ( x (0))  max 
r1( x (0),u (1)  R N 1( x (1)) 
u (i ) U (1.4.17)
i 1,..., N
Соотношение (1.4.17) может быть выражено как

54
 
f N ( x (0))  r ( x ( 0) ,u (1)  max R ( (1) 
)
max  1 N 1 x
u (i )U
 (1.4.18)
u (1)U  
 i  2,..., N 

где максимизация первого слагаемого r1(x(0),u(1)) проводится только по управлению u(1), а второе
слагаемое максимизируется выбором управлений на всех стадиях u(i) (i=1,…N), поскольку
значения x(1) зависит от управления u(1). Разумеется, что в выражении, заключенном в квадратные
скобки, каждое слагаемой нельзя максимизировать в отдельности, так как величины обоих
слагаемых зависят от управления u(1). Причем на первое слагаемое управление u(1) влияет прямо, а
на второе это влияние сказывается косвенно, через изменение значения x(1). Рассмотрим задачу
максимизации 2-го слагаемого в соотношении (1.4.18). Эта задача может рассматриваться как
задача оптимизации для (N-1)-стадийного процесса с критерием оптимальности RN-1(x(1)).Этот
критерий оптимизируется выбором управлений u(i) (i=2,…,N). Принимая во внимание, что
оптимальная стратегия управления
uN-1,опт= (uопт(2), uопт(3),…, uопт(N),) (1.4.19)
максимизирует значение критерия оптимальности RN-1,найденного для N-1 последних стадий,
можно записать соотношение, которое аналогично выражению (1.4.15):

f N 1( x (1))  max R N ( x (1))


u (i ) U (1.4.20)
i  2,..., N
где fN-1(x(1)) – максимальное значение критерия оптимальности RN-1 при использовании
оптимальной стратегии управления (1.4.19). С учетом выражения (1.4.20) выражение
(1.4.18) может быть записано в виде:
f N ( x (0))  
max r1( x ,u  f
( 0) (1)
N 1( x
(1)

)
u (1)U (1.4.21)

Воспользовавшись математическим описанием 1-й стадии


x(1)=(1)(x(0),u(1)) (1.4.22)
можно записать:
fN-1(x(1))=fN-1[((1)(x(0),u(1))] (1.4.23)
Подставляя теперь полученное выражение (1.4.23) в качестве 2-го слагаемого в соотношение

(1.4.18), получим:
55
f N ( x (0))  
max r1( x ,u )  f
( 0) (1)
 1( x (0),u (1))]
N 1[ 
u (1)U

(1.4.24)
Уравнение (1.4.24) является математической формулировкой принципа оптимальности. Оно

позволяет, зная оптимальную стратегию управления (1.4.19) для N-1 последних стадий процесса

и зависимость максимального значения критерия оптимальности RN-1 от состояния выхода первой

стадии fN-1(x(1)), определить оптимальное управление на первой стадии uопт.(1). Выражение (1.4.24)

фактически представляет собой рекуррентное соотношение, характеризующее последовательность

функций:

fi(x(N-i)) i=1,…,N (1.4.25)

Последняя из этих функций fN(x(0)) отвечает искомому решению оптимальной задачи, поскольку

значение fN(x(0)) равно максимальному значению критерия оптимальности RN(x(0)). При этом в

процессе нахождения функций fi(x(N-i)) определяется также оптимальная стратегия управления

uN,опт. в соответствии с формулой (1.4.14).

Очевидно, что для начала расчетов по рекуррентному соотношению (1.4.24) необходимо задаться

начальной функцией, порождающей последовательность функций (1.4.25). В качестве такой

начальной функции принимают обычно

f0(xN) = 0 (1.4.26)

56
Это соответствует отсутствию процесса за пределами последней стадии.

Таким образом, метод динамического программирования дает возможность при оптимизации

многостадийного процесса расчленить задачу выбора оптимальных управлений u(i) (i=1,…,N) на N

задач, в каждой из которых выбирается только одно управление u(i).

57
2.5. Принцип максимума Понтрягина.
При решении вариационных задач классическими методами возникают серьезные
трудности в тех случаях, когда отыскиваемые управляющие воздействия не принадлежат к классу
непрерывных функций или когда на переменные наложены ограничения типа неравенств. Для
решения таких задач может быть использован метод, сформулированный и доказанный в работах
Л.С. Понтрягина и его учеников, который получил название принципа максимума. Этот принцип
сформулирован и доказан как необходимое и достаточное условие оптимальности для процессов
описываемых линейными и нелинейными дифференциальными уравнениями.
Рассмотрим процесс, описываемый системой нелинейных дифференциальных уравнений:
d x   ( , ,..., , ,..., )
dt
i
x x x u u i 1 2 m 1 r
(1.5.1)

Где i=1,…,m ; m- размерность вектора состояния, r-размерность вектора управления.


Или в векторной форме
dx
  ( x ,u ) (1.5.2)
dt
Где х- вектор состояния процесса, рассматриваемый как функция независимой переменной t; u-
вектор управления, принимающий любые значения из допустимой области его определения U,
которая может быть задана в виде совокупности соответствующего числа соотношений типа
равенств или неравенств. Для системы уравнений типа (1.5.1) или для векторного уравнения
(1.5.2) могут быть заданы граничные условия
( 0) ( 0) ( 0) ( 0)
x (t
i
) x i
i  1,..., m или x (t ) x (1.5.3)

(k ) (k ) (k ) (k )
x (t i
) x i
i  1,..., m или x (t ) x (1.5.4)
определяющие заданные значения всех или только некоторых переменных состояния х i для двух
значений независимой переменной t(0) и t(k). Состояние процесса при t=t(0) будем называть
начальным, а состояние процесса при t=t(k) конечным состоянием. Это позволяет
интерпретировать поведение процесса в фазовом пространстве переменных состояния как переход
из начального состояния х(0) в конечное состояние х(k) (рис1.5.1), или из начальной области в
конечную область (рис.1.5.2).

58
x(k)
x(k)

x(0)

Рис.1.5.1. Траектория процесса с заданными начальным


и конечным состояниями

F1(k)(x)=0

x(k)
F (0)(x)=0
F2(k)(x)=0

x(0)

Рис.1.5.2. Траектория процесса с заданными начальной


x(0) и конечной областями допустимых
состояний

Рис.1.5.1. Траектория процесса с заданными начальным


и конечным состояниями

59 F1(k)(x)=0
x(k)
F (0)(x)=0
F2(k)(x)=0

x(0)

Рис.1.5.2. Траектория процесса с заданными начальной


и конечной областями допустимых
состояний

Предположим, что критерий оптимальности задан в виде функционала


(k )
t
I   ( x , u )  dt
( 0)
0
(1.5.5).
t
где 0(x,u) – заданная функция переменных состояния и управления. Начальное и конечное
состояния могут быть не заданы и подлежат определению в процессе решения оптимальной
задачи.
Рассмотрим формулировку принципа максимума на примере задачи о быстродействии. В этой

задаче необходимо так выбрать управляющие воздействия, чтобы перевести процесс из

начального состояния в конечное за минимальное время.

Как было показано Л.С. Понтрягиным и его учениками, если ввести Гамильтониан Н и
вспомогательные переменные (t), связанные с переменными состояния и уравнениями движения
следующим образом:

m
H   ( x1 ,..., x m , u1 ,..., u r )  (t ) (1.5.6)
i i
i 1

60
d H d xi H
i
  (1.5.7)
dt  xi dt 
i
Анализ полной производной от функции Н по независимой переменной t имеет вид:

dH H dψ H dx H du
      (1.5.8)
dt ψ dt x dt u dt
Принимая во внимание соотношения (1.5.7), получаем
dH H du
  (1.5.9)
dt u dt
Как было показано, если оптимальное значение вектора управления uопт. находится внутри
допустимой области управления U, то максимальное значение функции Н соответствует точке
экстремума этой функции, для которой выполняется условие:
H H
 0 или в обычной записи  0 , j  1,..., r (1.5.10)
u uj
Если же оптимальное управление находится на границе области управления U, заданной системой
неравенств
aj uj bj j=1,…, r (1.5.11)
то выполняется условие
du
 0 (1.5.12)
dt
В любом из отмеченных случаев полная производная по t от функции Н, определяемая
соотношением (1.5.10) равна нулю. Это значит, что функция Н на оптимальной траектории имеет
постоянное значение.
Итак, принцип максимума утверждает, что если управляемый процесс описывается
системой дифференциальных уравнений, при использовании оптимального управления uопт.(t)
процесс переводится из начального состояния в конечное за минимально возможное время и
функция Н принимает на оптимальной траектории максимально возможное значение, т.е.
H [ψ(t ), x(t ), uопт. (t )]  max [ψ(t ), x(t ), u (t )] (1.5.13).
uU
При этом, как было показано, это значение постоянно и неотрицательно вдоль всей траектории
процесса

61
(k ) (k ) (k )
H [ ψ(t ), x (t ), uопт. (t )]  H [ ψ(t ), x (t ), uопт. (t )]  0 (1.5.14).

В приведенной формулировке не содержится никаких сведений о том, будут ли вообще


существовать оптимальное управление и оптимальная траектория и как их найти. Тем самым
принцип максимума в данной формулировке представляет собой лишь необходимое условие
оптимальности. Однако, как было показано, при соблюдении некоторых добавочных ограничений
на оптимизируемый процесс, которые легко выполняются при решении практических задач,
принцип максимума является и достаточным условием оптимальности. Таким образом, если
оптимальное управление с помощью соотношения (1.5.10) найдено, оно является действительно
оптимальным и никакой дополнительной проверки не требуется.
Таким образом, для поиска оптимального управления необходимо решать систему
дифференциальных уравнений для переменных состояния xi (t) и вспомогательных переменных
i(t). Если размерность m, то для ее решения необходимо задать 2m граничных условий. В задаче
о быстродействии, когда для всех переменных заданы значения в начальной точке при x(t(0)) и в
конце интервала интегрирования x(t(k)), для решения оптимальной задачи нужно решать краевую
задачу – необходимо подбирать неизвестные начальные условия для вспомогательных
переменных (t(0)) так, чтобы выполнялись заданные граничные условия для основных
переменных x(t(k)).
Если не все переменные заданы в конце интервала интегрирования, то тогда из условия
трансверсальности для соответствующих вспомогательных переменных будут заданы граничные
условия в виде нулевых значений.
Таким образом, в общем случае граничные условия для решения оптимальной задачи

имеют следующий вид:

xi(t(0))=xi(0) i=1,…,m
xi(t(k))=xi(k) i=1,…,p (1.5.15)
i(t(k))=qi i=1,…, p
i(t(k))=0 i=p+1,…, m
где qi – некоторые произвольные постоянные, задаваемые в зависимости от постановки
оптимальной задачи.

Рассмотрим применение принципа максимума Понтрягина на примере определения


оптимального температурного профиля для реактора идеального вытеснения в котором протекают
последовательные реакции типа
АPQ
62
Где А - исходный реагент, Р – целевой продукт, Q- побочный продукт,

 E1  E2
k 1 k 01 e RгT
  k 2 k 02 e RгT
  - константы скорости основной и побочной реакций.

Обозначим через х1 – концентрацию исходного реагента, а через х 2 – концентрацию целевого


продукта. Тогда уравнения математической модели будут иметь вид:
d x1
  k 1 (T )  x1
dt
d x2
 k 1 (T )  x1  k 2 (T )  x2 ; T  T(t) (1.5.16)
dt
( 0) ( 0) ( 0)
Начальные условия x1 (t )  x1 ; x 2 (t )  0
(k ) (k )
Конечное состояние x1 (t )  не определено; x 2 (t )  max

Запишем выражение для Гамильтониана и вспомогательных переменных для поставленной


оптимальной задачи:
H    k 1 (T )  x1   k 1 (T )  x1   k 2 (T )  x 2
1 2 2

d H
1
  (  )  k 1 (T )
dt  x1 1 2
(1.5.17)
d H
2
   k 2 (T )
dt  x2 2

Граничные условия : (t )  0,  (t
(k ) (k )
) 1
1 2
Таким образом, для решения оптимальной задачи необходимо решать систему дифференциальных
уравнений (1.5.16) и (1.5.17), образующих краевую задачу, поскольку граничные условия заданы
на разных концах интервала интегрирования, т.е. необходимо подбирать начальные условия для
вспомогательных переменных таким образом, чтобы выполнялись заданные конечные условия для

63
этих переменных. При этом на каждом шаге интегрирования определять оптимальное значение
температуры из допустимой области температур:
Tmin T(t) Tmax (1.5.18)
Для данной постановки оптимальной задачи можно получить аналитическое выражение для
оптимальной температуры, если взять производную от функции Н по температуре и приравнять ее
нулю:
H  k 1
 x1  (  )  k 2  x 2   0


T T 2 1 T 2

 ki
 k i (T )  E i 2 ; i  1,2
T Rг  T
(T )  E1  (  )  k (T )  E  x 
(1.5.19)
k1  x 2
0
R г T 2
1 2 2 2
2
R T
1
г
2

k 1(T ) E1  x  (  )  k (T )  E  x   0
1 2 1 2 2 2 2

k 1(T ) E1  x  (  )  k (T )  E  x 
1 2 1 2 2 2 2
После логарифмирования и разрешения полученного равенства относительно температуры найдем
следующее выражение для оптимальной температуры:

E E
T опт. (t )  1

 E  k  x  (  ) 
2

(1.5.20)
R  ln  
1 01 1 2 1

 E k x 
г
   
2 02  2 2
При вычислении оптимальной температуры с использованием (1.5.20) возникают
трудности при вычислении температуры в начальный момент времени, когда х 2=0. Но эту
трудность легко преодолеть, подставляя в начальный момент времени в качестве температуры
Тmin. При интегрировании полученной системы уравнений на каждом шаге интегрирования
полученное по уравнению значение оптимальной температуры проверяется на принадлежность

64
заданной области допустимых управлений путем проверки неравенства (1.5.18). Если оптимальная
температура, вычисленная по уравнению (1.5.20) выходит за пределы допустимой области, то в
качестве текущего значения оптимальной температуры принимается Т min или Tmax, в зависимости
от того, какую границу нарушило вычисленное значение температуры. Если число управляющих
переменных более одного, или решение уравнения H/ T не допускает аналитического
выражения для оптимального управления, применяются методы нелинейного программирования
для определения управления, обеспечивающего максимальное значение Гамильтониана Н.

Синтез систем, оптимальных по быстродействию.


Сформулируем задачу синтеза системы, оптимальной по быстродействию в следующем
виде.
Пусть в n-мерном пространстве задано состояние объекта в начальный момент времени в виде
вектора
y(t0)=y0 (1.5.21).
Конечное состояние объекта в момент времени t=T
y(T)=yT (1.5.22)
Объект описывается линейными дифференциальными уравнениями:
d y
dt
i
 f i
( y, u) ; i=1,…n (1.5.23)
На управления наложены ограничения ujuj,max j=1,…,n (1.5.24)
Критерий оптимальности по быстродействию, т.е. при F(y,u) =1, имеет вид:
T
Q   1  dt  T (1.5.25)
0
Требуется найти такое управление u(t), при котором время перехода объекта из состояния y0 в
состояние yT минимально. Предполагается, что fi(y,u) определена для любых значений y
 ( y, u) , соответствующих областей управления u  (u) . Кроме того, функции fi(y,u)
непрерывны и дифференцируемы по всем переменным yi. Управление может принадлежать к
классу кусочно-непрерывных функций, содержащих разрывы первого рода.
Так как F=f0=1, то с учетом того, что в общем случае 00, первое слагаемое суммы в
уравнении (1.5.14) 0f00. Тогда уравнение (1.5.14) для рассматриваемой задачи можно
представить в виде:

65
n
max  i  f i
0 или max H ( ψ, y, u)  0 (1.5.26)
i 1 u ( u )
u ( u )
Порядок решения задачи следующий:
1. Составляют функцию Гамильтона Н равную скалярному произведению векторов f и , т.е.
n
H    f .
i i
i 1
2. Берут частные производные Н по uj, которые приравнивают нулю. Из полученной системы
уравнений находят uj, которые максимизируют функцию Н согласно уравнению (1.5.26). В
случае линейной зависимости Н от uj частная производная Н/uj является функцией одной
или нескольких составляющих вектора . При этом для достижения положительного
максимума Н необходимо, чтобы
uj=uj maxsign i(t) (1.5.27)
где
  1 при   0
sign  
(t )   i
i


 1 при  i
 0

Таким образом, в данном случае управляющее воздействие при смене знака i(0)
изменяется скачкообразно от +umax до –umax или наоборот. Момент смены знака называется
моментом переключения.
3. Для нахождения вспомогательной функции i(t), определяющей управление, в частности
согласно (1.5.27) составляют и решают систему вспомогательных переменных согласно
уравнению (1.5.7)
d H
i

dt y
i
4. В случае замкнутой системы ищут зависимость управления от контролируемых координат
системы, соответствующих оптимальной траектории u=(y). При этом моменты переключения
определяются автоматически при отклонении фактической траектории от оптимальной. В
случае разомкнутой системы устанавливают количество изменений знака i(t), т.е. число
корней функции i(t). Моменты переключения могут быть найдены методом стыковки
решений дифференциальных уравнений со знакопеременной правой частью. При этом в
конечном итоге получают систему n трансцендентных уравнений с n неизвестными
моментами переключения ti (i=1,…,n), решение которых возможно только численными
66
методами. Исключение составляют системы, характеристическое уравнение которых имеет
кратные нулевые корни.
Пример: Пусть объект задан следующими уравнениями:

d y y y
2
d d
2
1
 u или
dt
1
 y f  ;
dt
1
u f (1.5.28)
dt 2 1 2

Если положить, что y1=l, y2=v, u=F, то приведенная система описывает движение материальной
точки с единичной массой m=1, свободно и без трения движущейся по горизонтальной прямой с
координатами l – путь, v – скорость и снабженной двигателем, развивающим силу F=ma, где a=y2.
Требуется найти оптимальное управление u*, обеспечивающее максимальное
быстродействие системы при переходе ее из произвольного начального состояния y0 в конечное
равновесное состояние yT. На управление наложено ограничение uumax.
Решение. Составим функцию Гамильтона:
H=f11+f2 2 (1.5.29)
Так как функция Н линейна относительно u, то в соответствии с условиями максимума, имеем:
u*=umaxsign2 (1.5.30)
Для определения 2, а следовательно и u*, составим и решим систему уравнений для
сопряженных переменных:
d H d H
1
  0; 2
   (1.5.31)
dt y dt y 1
1 2
Интегрируя эти уравнения, найдем:
1=С1; 2=С2 – С1t (1.5.32)
где С1 и С2 – постоянные интегрирования. Поскольку функция 2 имеет один корень
t= C2/C1, то управление u* имеет одну перемену знака ( два интервала управления). Так как
начальные условия для функций i(t) неизвестны, постоянные интегрирования С 1 и С2 не могут
быть определены, то использование принципа максимума дает только качественное представление
об изменении управляющего воздействия – одно переключение. Для определения количественных
характеристик управления необходимо определить моменты переключения и продолжительность
управления Т. Для этого необходимо решить уравнения системы (1.5.28), правая часть которых в
соответствии с уравнением (1.5.30) знакопеременная.

67
d y
2

2
1
  u max (1.5.33)
dt
Интегрируя (1.5.33), получим:
d y
y y   u2  t  C  t  C
2
 1
 umax  t  C1 ; max
1 2
(1.5.34)
2 dt 1

Исключив из уравнения (1.5.34) время t найдем уравнение фазовой траектории движения системы
y1=(y2)
2
y  y (2 C  1)  C
y 
1
2

u
2
C
1 1
2
max
Пусть, например, точка при t=t0=0 находится в точке В.(рис1.5.3). Для быстрейшего
перемещения ее из этой точки в точку О необходимо вначале разогнаться с максимальным
ускорением (u=+umax), а затем затормозить с максимальным замедлением (u= - umax).
Соответствующие траектории ВА и ОА приведены на рис1.5.3. Заметим, что при любых
координатах точки В управление должно обеспечивать попадание материальной точки на фазовую
траекторию, входящую в начало координат (АОА). Именно на этой траектории происходит смена
знака управления, и поэтому она носит название линии переключения.

68
Рис. 1.5.3. Фазовые траектории движения точки при оптимальной траектории.

Уравнение этой линии при подходе материальной точки в точку О (t=T) слева и справа от
оси ординат находится из уравнения (1.5.34) и имеет следующий вид:
2
y
y 2
  2 (1.5.35)
1
u max
Здесь при определении постоянных интегрирования С 1 и С2 учтено, что в точке О (при t=T)
координаты системы y1(t) и y2(t) равны нулю. Знак минус ставится при y2>0, знак плюс при y2<0.
Выражение (1.5.35) является уравнением параболы, лежащей в разных квадрантах в зависимости
от знака y2. Уравнение фазовой траектории для режима разгона также является параболой, но с
постоянными С1 и С2, зависящими от начальных условий y1(t0) и y2(t0). В общем случае фазовый
портрет системы представляет собой семейство парабол, различающихся произвольными
постоянными (рис.1.5.3).
Таким образом, для перемещения материальной точки из точки В в точку О необходимо
осуществить движение по траектории ВАО ( разгон – смена знака управления – торможение). Как
видно из фазового портрета в области I управление должно быть положительным С а в области II
отрицательным (y2 падает). Линия переключения и является границей, разделяющей области I и II.
Зная уравнение этой линии и состояние системы y1 и y2 , можно определить знак управления.
Запишем уравнения переключения (1.5.35) в виде:
2
 ( y1 , y 2 )  2  u max  y 1
 y 2
sign y 2
 0 (1.5.36)
Из (1.5.36) следует, что если начальные значения у 1 и у2 таковы, что изображающая точка не лежит
на линии переключения, то для области I (у1,у2)<0, а для области II (у1,у2)>0. Тогда уравнение
управляющего устройства примет вид:
u=  umax sign (у1,у2) (1.5.37)
Таким образом, реализация даже такой простейшей замкнутой системы требует наличия
функционального устройства, вычисляющего функцию (у1,у2), и релейного исполнительного
элемента, выдающего управляющий сигнал в соответствии с уравнением (1.4.37).
В случае разомкнутой системы моменты переключения находятся методом
припасовывания дифференциальных уравнений. Воспользовавшись граничными условиями y1(t0)=
- y10; y2(t0)=0 и у1(Т)= у2(Т)=0, запишем уравнение (1.5.34) в виде:

69
y (t )   u2  t  C  t  C   y
max 2
1 0 0 11 0 21 10

y (t )   u  t  C  0
2 0 max 0 11
(1.5.37)

y(T )   u2  T  C  T  C  0
1
max 2
0 12 0 22

y (T )   u  T  C  0
2 max 12
где С11, С12, С21, С22 – постоянные интегрирования на первом (разгон) и втором (торможение)
интервалах управления.
Так как координаты системы у1 и у2 непрерывны, можно произвести стыковку решений на
границе первого и второго интервала управления:

u  t1  C11  t1  C 21   u max  t1  C12  t1  C 22


max 2 2

2 2 (1.5.38)

umax  t1  C11   umax  t1  C12


Решая совместно систему уравнений (1.5.37) и (1.5.38), можно определить постоянные
интегрирования и моменты времени t1 и Т. В результате решения получим

  u max  T
2
С11=0; С21=у10; С12=у10 С12=umaxT;
C 22
2
T=2t1;

t 1
 y /u10 max
Таким образом, управление можно осуществлять с помощью программного
устройства, подающего команду на изменение знака управления в момент времени t=t1.
С помощью принципа максимума Понтрягина можно осуществлять последовательный
синтез различных систем управления, получая достаточные условия оптимальности, Однако
довести решение до числовых результатов не всегда удается. В большинстве случаев этот метод
ограничивается синтезом оптимальных систем управления, когда Гамильтониан позволяет в явном
виде получить частные производные по управляющим переменным и выразить их как явные
функции переменных состояния и сопряженных переменных. Однако сочетание принципа
максимума Понтрягина с нелинейными методами поиска экстремума позволяет очень строго о
корректно решать большой класс задач синтеза оптимального управления.

70
Пример.3. Определение оптимального температурного профиля для системы
параллельно последовательных реакций в реакторе идеального вытеснения

Пусть в реакторе периодического действия протекают последовательно-параллельные реакции в


соответствии со схемой:

1.A+BP+B
2.A+CD+C
3.A+DF+D

P
T(t)
T

Математическая модель процесса имеет вид:


d x 2
 K1
dt
d x 3
 K2
dt (5.3.1)
d x4
 K 31  x 3
dt
где K  k (T )  p
i i

Здесь x2-расход окиси этилена на образование целевого продукта

71
x3-расход окиси этилена на образование 1-го побочного продукта (этиленгликолей)
x4-расход окиси этилена на образование 2-го побочного продукта (политэтиленгликолей).
Задача оптимизации может быть сформулирована следующим образом:
Найти такое оптимальное изменение температуры реакции T* p(t), которое бы позволило за
некоторое заданное время контакта tk получить продукт с заданным содержанием целевого
продукта –x2(tk)=x2зад при минимальном общем расходе окиси этилена.
При такой постановке оптимальной задачи критерий оптимизации будет иметь следующий вид:
tk
x 0  ( x 2  x3  x 4)  dt (5.3.2)

0
Запишем функцию Понтрягина (Гамильтониан) для системы (5.3.1) и (5.3.2)

H   ( x 2  x 3  x 4)   K 1   K 2   K 3  x 3 (5.3.3)
0 1 1 3
где i –вспомогательные переменные, уравнения для которых имеют следующий вид:
d H
1
  
dt  x1 0

d H
2
    K 3  (5.3.4)
dt  x3 0 3

d H
3
  
dt  x4 0

Краевые условия для системы уравнений для основных и вспомогательных переменных будут
иметь следующий вид в соответствии с условиями поставленной задачи:
x ( 0)  0
2 x (t )  0.9
2 k

x ( 0)  0
3  (t )  0
2 k (5.3.5)

x ( 0)  0
4  (t )  0
3 k
Так как мы разыскиваем оптимальное управление из заданной области:
72
Тmin  T*p(t)  Tmax (5.3.6)
Обеспечивающее минимум критерия оптимальности, то в соответствии с условиями
трансверсальности вспомогательная переменная
0= 1 (5.3.7)
С учетом уравнения (5.3.7) систему (5.3.4) можно переписать в следующем виде:
d
1
1
dt
d
2
 1  K 3  (5.3.8)
dt 3

d
3
1
dt
Уравнения (5.3.8) позволяют проанализировать вид зависимости вспомогательных переменных от
времени и сделать качественные выводы о характере оптимального управления.
Поскольку для 3-го уравнения системы (5.3.8) заданы граничные условия для вспомогательной
переменной, мы можем непосредственно получить решения для этой переменной. Оно имеет
следующий вид:
3(t)=tk-t (5.3.9)
откуда следует, что 3 монотонно возрастает от –tk при t=0 до нуля при t=tk.
Функция 2(t) также есть монотонная функция времени,, которая изменяется от некоторой
отрицательной величины при t=0 до нуля при t=t k. 1(t), так же как и 3(t) является уравнением
прямой, но поскольку ее значение на границах интервала не задано, она может либо целиком
расположена в отрицательной области, либо в положительной, либо переходить из одной области
в другую и менять знак в некоторой точке t s. Согласно принципа максимума Понтрягина
управление Тр(t) должно таким образом выбираться из допустимой области управления, чтобы
функция H(Tp) была бы максимальной. Из уравнения (5.3.3) видно, что H(T p) есть монотонно
возрастающая функция температуры. Следовательно, оптимальной температурой для этого
процесса будет максимально допустимая температура T max. Однако, выбор температуры должен
быть таким, чтобы выполнялось заданное граничное условие в конце процесса x 2(tk)= x2зад Анализ
показывает, что температура должна быть ступенчатой функцией времени, имеющей одну точку
переключения с одного допустимого уровня на другой. Точку переключения, в которой и
происходит изменение знака переменной 1(t), можно легко определить из решения 1-го
уравнения системы (5.3.1)

73
зад
K 1 (T max)  t k  x2
t  (5.3.10)
s
K 1 (T max)  K 1 (T min)
Из выражения (5.3.10) видно, что значение t s линейно зависит от заданного времени контакта t k и
заданного содержания целевого продукта. Значение критерия оптимальности может быть
рассчитано из решения системы (5.3.1) при выбранном оптимальном температурном режиме.

K (T 
Выражение для критерия оптимальности имеет вид:
x 0
 1 p2
)  K 2 (T p 2)  K 3 (T p 2)  t s  ( K 2 (T p 2)  K 2 (T p1))  (t k  t s )
1 1
 K 2 (T p 2 )  K 3 (T p 2)  (t k  t s )  ( K (T p1)  K 2 (T p1))  t s   K 2 (T p1)  K 3 (T p1)
2 2

2 1 2
(5.3.11)
Здесь Тр1 и Тр2 – температуры на участках 0-t s и ts-tk. Причем оказалось, что значение критерия
оптимальности не зависит от того, будет ли вначале температура минимальной (Т р1=Tmin) а затем
максимальной (Тр2=Tmax), или наоборот. Расчеты показали, что при t k=1.55 часа ts=0, т.е. все время
темпратура должна поддерживаться максимальной, а при t k=4.75 часа ts= tk весь процесс должен
проходить при минимальной температуре. При этом критерий оптимальности х 0 в первом случае
принимает минимальное значение, а во втором- максимальное. Однако проводить весь процесс
при времени tk=1.55 часа невыгодно по следующим соображениям:
1. Нужно было бы в начале нагреть смесь до температуры T p=Tmax, а затем интенсивно охлаждать
реакционную смесь для поддержания заданной температуры, так как процесс высоко
экзотермичен. Это потребует дополнительных затрат как на организацию дополнительного
подогрева, так и на более интенсивное охлаждение реактора. Выигрыш в эффективности
процесса при уменьшении времени от 2.5 часов до 1часа 50 минут небольшой.
2. Чувствительность процесса к колебаниям параметров процесса с повышением температуры
также увеличивается. Это повышает требования к системе автоматического регулирования
реакторного узла.
Более выгодным является такой температурный режим, при котором на первом участке до t=t s
температура поддерживается на минимальном уровне (Т р1=Tmin), а затем она переключается на
верхний уровень (Tp2=Tmax). В этом случае можно использовать тепло реакции для перевода
процесса с минимальной температуры на максимальный уровень. На рис. 5.3.3 показан
профиль изменения переменных состояния при оптимальном управлении процессом.

74
ts ,час
5

1
t k,час
0
1.5 2.5 3.5 4.5
Рис.5.3.2. Зависимость момента переключения
управления от времени контакта

75
xо,кмоль/м3
1.9

1.8

1.7

1.6

t k ,час
1.5
1.4 2.0 3.0 4.0 5.0
Рис.5.3.3. Зависимость величины критерия оптимальности от
времени контакта

76
хо,кмоль.м3
Тр,К

315
T* p,max

305
x o (t)

295 x 2 (t)

T p,min

285

t k ,час
275
0 0.5 1.0 1.5 2.0 2.5
Рис.5.3.4. Профили изменения температуры и концентраций в оптимальном режиме при t k=2.5
часа

77
78
2.6. Методы поиска экстремума функций.

1.6.1.Методы поиска экстремума функции одной переменной.

Метод деления интервала.


При использовании этого метода весь интервал допустимой области изменения
переменной делится на n равных частей и вычисляется значение функции во всех точках, включая
граничные точки интервала. Затем из полученных значений функций выбираются такие точки, где
функция имеет наименьшие значения (при поиске минимума функции). Полученный интервал
опять делится на n – равных частей и процедура повторяется до тех пор, пока мы не получаем
точку с самым минимальным значением функции ( при заданной точности определения
экстремума).

Метод золотого сечения.


Было показано, что если делить заданный интервал не на равные интервалы, а на отрезки не

равной длины, то есть возможность локализовать экстремум гораздо быстрее. Было найдено, что

это отношение отрезков, на которые нужно делить весь заданный интервал, равно 0.38. Это

значение отношения отрезков (меньшего отрезка ко всему интервалу) называется золотым

сечением. При использовании метода золотого сечения имеется возможность после одного

вычисления на каждом этапе локализовать положение экстремума в интервале, длина которого

составляет 0.62 от исходного интервала.

Алгоритм поиска экстремума методом золотого сечения складывается из следующих этапов:

1. Вычисляются и запоминаются значения оптимизируемой функции R(u) на концах исходного


интервала [u(0),u(3)], т.е. значения функций R(u(0),R(u(3)).
2. Вычисляется и запоминается значение функции в точке u (1), координаты которой определяются
следующим образом:
u(1)=u(0)+0.38(u(3)  u(0)) (1.6.1)
79
3. Вычисляется и запоминается значение функции в точке u (2), координаты которой
определяются следующим образом:
u(2)=u(3) - 0.38(u(3)  u(0)) (1.6.2)

4. По найденным значениям функции R(u(0)), R(u(1)), R(u(2)), R(u(3)) определяется подынтервал, в


котором локализован экстремум, состоящий из двух подынтервалов l1 и l2 не равной длины.
5. Внутри большего интервала находится точка, отстоящая от конца общего интервала l1 + l2 на
расстоянии
l=( l1 + l2)0.38 (2.1.3)

В этой точке рассчитывается значение функции R(u), после чего снова выбирается сокращенный

подынтервал в интервале (l1 + l2), локализующий экстремум, т.е. вычисления повторяются

начиная с пункта 4.

Для изложенного алгоритма была получена формула для вычисления точности определения

экстремума после s вычислений значений функции R(u):

s 3

ba  5 1 
   (1.6.4)
2  
 2 
При применении метода «золотого сечения» для того же числа расчетов значений функции R(u)

достигаемая точность в 10 раз выше, чем при использовании метода деления интервала на равные

части.

80
Метод поиска с использованием чисел Фибоначчи.
Показано, что свойства последовательности чисел Фибоначчи, описываемой рекуррентным

соотношением

Fk=Fk-1+Fk-2 ; F0 = F1 (1.6.5)
Можно использовать для поиска экстремума функции одной переменной.
Доказано, что если требуется найти положение экстремума функции R(u), определенной на
интервале [a,b] c абсолютной ошибкой, не превышающей:
ba
 (1.6.6)
F s
Где Fs – s-e число Фибоначчи, то для отыскания положения экстремума достаточно вычислить не
более s значений функции R(u). Так, например, при выполнении s=21 расчетов точность
определения экстремума составит
 1 1 4
   0.56 10 (1.6.7)
b  a F s 17711
Эта точность оказывается более высокой, чем в приведенных выше методах поиска деления
интервала на равные части и «золотого сечения».
Алгоритм поиска с использованием чисел Фибоначчи имеет следующий вид:
1. По заданной точности , с которой необходимо найти положение экстремума функции R(u) в
интервале [ a, b ], рассчитывается вспомогательное число N.
ba
N 

2. Для полученного значения N находится такое число Фибоначчи, чтобы выполнялось
неравенство
Fs-1 < N < Fs
3. Определяется минимальный шаг поиска по формуле:
ba
 
m
F s

4. Рассчитывается значение функции R(u) в начале интервала, т.е. R(a).


5. Рассчитывается следующая точка, в которой вычисляется R(u) по формуле:
u(1) = a +mFs-2
81
6. Если этот шаг оказался удачным, т.е. R(u(1))<R(a), то следующая точка определяется как
u(2) = г(1) +mFs-3
(1)
При R(u )>R(a) (шаг неудачный)
u(2) = г(1) +mFs-3
7. Последующие шаги выполняются с уменьшающейся величиной шага, которая для
i – го шага будет равна
u(i)=mFs-i-2
Шаги выполняются в соответствии со следующим правилом.
Если при выполнении шага u(i) значение функции в точке
u(i+1)=u(i)+u(i)
оказывается меньше чем в предыдущей точке, т.е. R(u(i+10)<R(u(i)) - шаг оказался удачным, то
следующий шаг делается из этой точки, т.е.
u(i+2)=u(i+1)+u(i+1)
Если же шаг оказался неудачным т.е. R(u(i+10)>R(u(i)), то следующий (i+1)-й шаг выполняется из
предыдущей точки в противоположном направлении:
u(i+2)=u(i)  u(i+1)
Описанный процесс продолжается до тех пор, пока не будут исчерпаны все числа Фибоначчи в
убывающей последовательности:
Fs-i-2 = Fs-i – Fs-i-1
Можно показать, что алгоритм поиска с использованием чисел Фибоначчи в пределе при s, т.е.
при поиске с высокой точностью, совпадает с методом «золотого сечения». Это следует из того,
что отношение Fs-1/Fs очень быстро стремится к величине 0.62.

2.6.2. Методы поиска экстремума функции многих переменных.

Метод поочередного изменения переменных.


Для случая многоканальных ЭСУ применяют методы поиска для функций многих
переменных типа метода Гауса-Зейделя, или его еще называют методом по координатного спуска.
Этот метод заключается в том, что все переменные изменяют по очереди, добиваясь
экстремального значения оптимизируемой переменной по каждой из координат. Этот метод
обладает достаточно хорошей скоростью достижения экстремума при небольшом числе
переменных. Для большего количества переменных используют методы нелинейного
программирования – градиентный метод, или его модификацию метод наискорейшего спуска.

82
Градиентный метод поиска экстремума функций многих переменных.
При градиентном методе вычисляют частные производные оптимизируемой переменной
по варьируемым параметрам – управляющим воздействиям и каждое следующее значение
управляющих переменных делают в направлении градиента оптимизируемой функции по
варьируемым переменным следующим образом:

(k ) (k )
     
 ui  M     ui  M   
( k 1) (k ) (k )
u (1.6.8)

  ui    ui 
i

В этом выражении частная производная оптимизируемой функции заменена ее конечно-


разностным эквивалентом. При наличии большого числа варьируемых переменных эта процедура
требует большого числа вычислений, что создает некоторые трудности при работе системы
управления с экстремальным регулятором в реальном времени. Поэтому вместо градиентного
метода применяют различные модификации этого метода, ускоряющие движение к экстремуму.
Например, метод наискорейшего спуска.

Метод наискорейшего спуска.


При использовании этого метода после каждого шага в направлении к экстремуму проверяется
удачным ли был этот шаг:

 
(k ) ( k 1)
(1.6.9)
Если условие (2.1.2) выполняется ( при поиске минимума), то следующий (k+1)-й шаг делается в
этом же направлении, если же условие (2.1.2) не выполняется, то делается возврат в предыдущую
точку, вычисляется новое значение градиента и делается шаг с новым значением градиента.
При некоторых модификациях этого метода выбирается оптимальное значение коэффициента
пропорциональности М, с которым делается шаг в направлении градиента. Рассматривая этот
коэффициент как новую варьируемую переменную, можно применить метод
однопараметрической оптимизации, например метод золотого сечения, и определяется экстремум
функции на выбранном направлении градиента.

Метод релаксации
Алгоритм метода заключается в отыскании осевого направления, вдоль которого целевая

функция изменяется наиболее сильно. Для этого в начальной точке поиска определяются частные

83
производные оптимизируемой функции по всем варьируемым переменным. Осевому

направлению, в котором целевая функция изменяется наиболее быстро, соответствует наибольшая

по модулю производная. Если знак производной отрицательный, то функция убывает в

направлении данной оси, если производная положительна, то функция убывает в обратном

направлении. По направлению убывания целевой функции производятся шаги до тех пор, пока не

будет получено минимальное значение по выбранному осевому направлению. При этом для

определения величины шага по этому направлению поиска также может быть использован один

из методов однопараметрической оптимизации, рассмотренных выше. После достижения

экстремума функции в выбранном направлении, вновь определяются частные производные по

всем переменным, за исключением той, по которой осуществлялось движение и вновь

определяется направление наискорейшего убывания функции, по которому и делаются шаги до

тех пор, пока движение будет успешно, и т.д.

Критерием окончания поиска является достижение такой точки, при движении из которой по

любому осевому направлению, дальнейшего убывания функции не происходит. На практике в

качестве признака оптимума часто применяется условие:

2
 R 
  
n
 (1.6.10)

 u j 
j 1

84
Здесь  - заданная точность достижения экстремума. При  это условие превращается в точное

условие равенства нулю производных в точке оптимума. Разумеется, что условие (1.6.10) может

быть использовано только в том случае, когда оптимум находится внутри допустимой области

изменения управляющих переменных U. Если же оптимум попадает на границу области U, то

критерий типа (1.6.10) непригоден, и вместо него следует применять условие положительности

всех производных по допустимым осевым направлениям. При этом допустимым будет только

направление внутрь области U. Обратное направление по той же оси ведет за пределы области U,

если, конечно, рассматриваемая ось не является касательной к границе области в данной точке.

Алгоритм спуска для выбранного направления может быть записан в следующем виде:

( p)
( k 1) (k ) (k ) R(u )
u j
 u j  h  sgn
u j
(1.6.11)

Где uj(k) – значение изменяемой переменной на k-ом шаге спуска, h(k) – величина k-го шага, которая

может изменять свое значение в зависимости от номера шага, sgn – функция знака; u(p) – вектор

точки, в которой последний раз производилось вычисление производных целевой функции.

Графическое изображение движения от исходного состояния к оптимуму показано на рис. 1.6.1

85
Рисунок 1.6.1 Траектория движения к экстремуму при использовании метода релаксации

Очевидно, что скорость движения к оптимуму будет зависеть от величины шага h(k). Хорошие

результаты дает стратегия изменения, основанная на свойствах чисел Фибоначчи.

Метод сканирования.
Описанные выше метода поиска экстремума иногда являются малоэффективными, если у функции

имеются локальные экстремумы, к которым сходится поиск, не позволяя достичь глобального

экстремума. В таких ситуациях иногда оказывается очень полезным так называемый метод

сканирования, который заключается в последовательном просмотре критерия оптимальности в

ряде точек, принадлежащих допустимой области управления и нахождения среди них такой точки,

где критерий имеет минимальное (или максимальное ) значение. Точность метода определяется

86
тем, насколько «густо» располагаются точки сканирования в допустимой области изменения

переменных.

Основным достоинством метода сканирования является то, что при его использовании с

достаточно густым расположением исследуемых точек всегда гарантируется отыскание

глобального оптимума. Другое достоинство этого метода – независимость от свойств

оптимизируемой функции. К недостаткам метода относится необходимость вычисления функции

в большом числе точек. Это должно гарантировать, что оптимум не будет пропущен. Этот метод

лишен общего недостатка градиентных методов оптимизации – все они «застревают» в

ближайшем локальном экстремуме, в область притяжения которого попадает выбранная

начальная точка поиска. Метод сканирования лишен этого недостатка и поэтому его иногда

применяют для предварительного «грубого» определения границ областей притяжения локальных

оптимумов.

Число вычислений критерия оптимальности при определении положения оптимума методом

сканирования возрастает в показательной зависимости от размерности решаемой задачи. Для

сокращения числа вычислений, необходимых для отыскания оптимума, часто применяют метод

сканирования с переменной сеткой сканирования. В соответствии с этим методом на первом этапе

проводится сканирование на грубой сетке. После уточнения положения экстремума, найденная

область разбивается с помощью более мелкой сетки. В узлах этой сетки вычисляется значение

87
функции и уточняется положение оптимума. Эффективное применение этого метода

ограничивается обычно задачами с 2-3 управляющими переменными.

2.6.3 Пример использования метода нелинейного программирования для поиска


экстремума функции многих переменных.
Рассмотрим задачу определения параметров математической модели технологического объекта по

результатам его функционирования.

Рассмотрим реактор полного вытеснения, в котором происходит процесс, описываемый


следующей схемой превращений:

1.A+B  C lnk01, E1, lnK01e, Ee1.(1.6.3.1)


2. A+C D lnk02, E2
Схема реактора имеет следующий вид:

Рис.2.6.2 Схема проточного аппарата


Для случая, когда температура внутри реактора задана, матема
тическое описание процесс в реакторе имеет следующий вид:

w*dC(j)/dx = R(j) , (1.6.3.2)


T = T(x)
88
где j=1,…,4 номера компонентов реакционной смеси, х – продольная координата реактора.
Если мы располагаем экспериментальными данными в виде профиля изменения концентраций
реакционной смеси по длине реактора, т.е. С A(x), СB(x), СC(x), СD(x) при заданном профиле
температур Т(х), то задача идентификации параметров математической модели сводится к поиску
минимума функции рассогласования между результатами моделирования реактора по уравнениям
(1.6.3.2) и результатами наблюдения за процессом, заданными в виде профилей концентраций и
температур.

  
Q N

q 1 i 1
 x (qiр)  x (qiэ)   (ln k
2

01
,. ln k 01e . ln k 02 , E1 , E 1e , E 2 )  min (1.6.3.

3)
Используя систему ReactOp, созданную для разработки и идентификации математических моделей
можно решить эту задачу, используя метод нелинейного программирования для поиска набора
такого набора параметров, который обеспечивает минимум функции (1.6.3.3). Расчетные значения
переменных состояния, соответствующих концентрациям реакционной смеси, получаются путем
численного интегрирования системы уравнений (1.6.3.2) с параметрами математической модели,
получаемыми на каждом шаге поиска в соответствии со следующим алгоритмом метода
нелинейного программирования:

(i ) (i )
     
 k j  M    k j  M  
( i 1) (i ) (i )
k j
 k j   k j 
(1.6.3.4)

   
где i-номер шага поиска, М –коэффициент пропорциональности изменения
параметра в направлении градиента минимизируемой функции. При градиентном методе
параметры изменяются на каждом шаге поиска в направлении градиента, однако этот
метод требует большого объема вычислений, связанных с необходимостью вычисления
градиента функции в каждой точке поиска. Для сокращения объема вычислений
применяют обычно так называемый метод наискорейшего спуска.
При использовании этого метода после каждого шага в направлении к экстремуму
проверяется удачным ли был этот шаг:

 
(i ) ( i 1)
(1.6.3.5)
Если условие (6) выполняется, то следующий (i+1)-й шаг делается в этом же
направлении, если же условие (6) не выполняется, то делается возврат в предыдущую
точку, вычисляется новое значение градиента и делается шаг с новым значением
89
градиента. Эти методы называются линейными градиентными методами, потому, что при
вычислении производной функции рассогласования по формуле (1.6.3.4) мы заменяем
производную ее конечно-разностным выражением,.. Это эквивалентно тому, что мы
разлагаем неизвестную функцию (kj) в ряд Тейлора по искомым параметрам модели и
отбрасываем все члены разложения, за исключением членов, содержащих параметры в
первой степени. Используются также различные модификации этих линейных
градиентных методов, ускоряющих их сходимость. Например, для выбора коэффициента
пропорциональности М в формуле (1.6.3.4) используют методы поиска экстремума
функции одной переменной – метод «золотого сечения» или метод чисел Фибоначчи. Эти
методы позволяют быстро достичь минимума на определенном направлении градиента.
Однако часто некоторые параметры модели оказывают очень большое влияние на
функцию рассогласования. Поэтому для этих случаев используют так называемые методы
квадратичного программирования. При использовании этих методов частные производные
минимизируемой функции вычисляются из выражения разложения функции (kj) в ряд
Тейлора с учетом квадратичных членов.
 = b0 +biki+bijkikj+biiki2 (1.6.3.6)
В этом случае получаются более точные значения производных, что позволяет локализовать
положение экстремума.
На рис. 1.6.3.2 Показаны рассогласование экспериментальных и расчетных данных при начальном
приближении параметров модели.

Начальное приближение:

Name Optimum Gradient Sing.Value


ln(Ko), [m] 16 4106.06156.001
E, kJ/mol 68 -3805.89 127.783
ln(Keo), [m] 17 41.381 5.94273
Ee, kJ/mol 50 -14.1758 3.34576
ln(Ko), [m] 4 4510.420.478809
E, kJ/mol 35 -5232.4 0.0136476

Величина рассогласования 1709.7

90
20 10

8
15
A, kmol/m3

D, kmol/m3
10

0
0 5 10
Length, m 0
0 5 10
Length, m

10
10

8
8

6
6
C, kmol/m3

D, kmol/m3

4 4
91

2 2

0 0
0 5 10 0 5 10
Length, m Length, m
Рисунок 2.6.3 Описание экспериментальных данных моделью при начальном приближении

Рисунок 2.6.4 Результаты поиска оптимальных значений параметров.

92
20
4

3
15

A, kmol/m3

D, kmol/m3
2

10

0
5 0 5 10
0 5 10 Length, m
10 Length, m
10

5
6
C, kmol/m3

B, kmol/m3
4
0

0 0 5 10
0 5 10 Length, m
Length, m

Оптимальные параметры модели.


Name Optimum Gradient Sing.Value
ln(Ko), [m] 15.00002 -1.08764E-6 161.632
E, kJ/mol 80.00009 1.00293E-6 68.0658
ln(Keo), [m] 22.01528 1.03968E-7 3.44993
93
ln(Ko), [m] 2.000001 -1.69987E-5 1.76642
E, kJ/mol 40 1.82003E-5 0.025618

Величина рассогласования равна 1.5598610-10


Модель, с найденными значениями параметров адекватно описывает экспериментальные данные.

2.6.4. Определение оптимального температурного профиля методами


нелинейного программирования.
Рассмотренный нами в разделе 1.5. принцип максимума Понтрягина позволяет найти

оптимальное управление, заданное в виде функций времени или длины для любых объектов при

наличии ограничений на переменные состояния и управления. Однако при сложном

математическом описании объекта, этот метод не всегда может быть успешно использован в связи

с вычислительными трудностями, связанными с решением краевой задачи и нахождении

поисковыми методами управления, соответствующего максимальному значению Гамильтониана.

Для таких сложных случаев более целесообразен следующий подход: Искомую оптимальную

функцию управления аппроксимируют в виде кусочно-линейной функции. В этом случае,

критерий оптимизации становится уже не функционалом, а функцией переменных, описывающих

аппроксимированную управляющую функцию (или функции). Таким образом, мы задачу поиска

оптимума функционала, сводим к задаче поиска оптимума функции многих переменных.

Рассмотрим этот подход на примере поиска оптимального профиля температуры.

Пусть необходимо найти оптимальный профиль изменения температуры в реакторе


идеального вытеснения для рассмотренного нами случая идентификации параметров модели.
В реакторе полного вытеснения происходит система последовательных реакций типа
(1.6.3.1)
94
1.A+B  C lnk01, E1, lnK01e, Ee1.(1.6.3.1)
2. A+C D lnk02, E2
Поставим оптимальную задачу следующим образом:
Найти такой оптимальный профиль изменения температуры Т(х), который обеспечил бы
максимальное значение концентрации целевого продукта С на выходе из реактора при заданной
производительности реактора, определяемой скоростью потока, и заданной длине реактора. Пусть
длина реактора равна 10 метров. Представим себе, что искомый температурный профиль
аппроксимирован в виде кусочно-линейной функции. Тогда искомыми параметрами
температурного профиля будет значения температур в точках переключения и абсциссы точек
переключения. Если мы разобьем длину реактора на 10 отрезков, то число варьируемых
параметров будет равно 21. При этом на температуру мы наложим ограничения типа неравенств:

TminT(x) Tmax (1.6.4.1)

Для учета этих мы в процесс поиска будем проверять находимую температуру на выполнение этих
неравенств. Если температура оказывается меньше Tmin, для решения уравнений модели и
вычисления целевой функции используется Tmin. При нарушении верхнего предела по температуре
, используется Tmax . Таким образом мы всегда находимся в допустимой области управления. При
наличии ограничений на переменные состояния, формируется функция штрафа, учитывающая
возможность выполнения ограничения. На рисунке показано полученное оптимальное управление.

95
500

450

400
K

350

300
0 5 10
Length, m

Рис. 2.6.5. Оптимальный профиль температур для поставленной задачи.

96
20

15
kmol/m3

10

0
0 5 10
Length, m

Рис. 2.6.6. Изменение переменных состояния в оптимальном режиме.

97
Из полученного решения видно, что максимальное значение критерия оптимизации
достигается внутри реактора. Затем критерий постепенно и незначительно уменьшается.
Следовательно, для достижения максимального значения критерия оптимизации для данного
случая необходимо либо уменьшить длину реактора до величины примерно 6 метров, либо
увеличить скорость потока, а следовательно производительность. Это можно сделать в
зависимости от заданных условий функционирования. Используемый метод оптимизации не
гарантирует нахождения глобального оптимума. Поэтому для нахождения глобального оптимума
нужно задавать различное начальное приближения для поиска оптимума и исследовать находимые
локальные экстремумы. Из семейства найденных локальных экстремумов выбирается наиболее
подходящий, как по достигаемой величине критерия оптимизации, так и по возможности его
реализации. Несмотря на кажущуюся громоздкость такого подхода, с помощью
автоматизированной системы поиска оптимума решение можно получить достаточно быстро.

Раздел 2.7 Адаптивные системы управления.

2.7.1. Назначение. Классификация.


В большинстве случаев системы управления создаются для условий, когда
статические и динамические свойства объекта управления и всех элементов системы
известны, не зависят от внешних условий и постоянны во времени. Однако во многих
случаях свойства объекта не известны достаточно полно, либо изменяются во времени под
действием процессов старения и при воздействии внешних условий. Существующая
система управления может обеспечить управление объектом по поддержанию его
параметров на заданном уровне при наличии достаточного запаса устойчивости. Если же
98
статические и динамические характеристики объекта изменяются в широком диапазоне,
то управление объектом с помощью простейшей системы с постоянными параметрами и
структурой может оказаться вообще невозможным вследствие потери устойчивости. Для
таких случаев необходимо применение систем с изменяющимися свойствами.
Процесс изменения свойств системы, позволяющей ей достигать наилучшего
функционирования в изменяющихся условиях, называется адаптацией, т.е.
приспособлением к изменяющимся условиям функционирования.
Системы, осуществляющие процесс адаптации, называются адаптивными. Характерным
признаком адаптивных систем является отсутствие полной информации об объекте
управления, внешних возмущениях и граничных условиях. Адаптивной системе присущ
индетерминизм, т.е. неопределенность в поведении. Функционирование такой системы
должно быть направлено на раскрытие этой неопределенности, т.е. нахождения такого
состояния, при котором реализуется цель управления. Раскрытие неопределенности может
обеспечиваться благодаря избыточности системы, логичности ее действий ,
прогнозированию состояния и анализу накапливаемой информации с целью
самообучения.
Оптимальное функционирование адаптивной системы может быть рассчитано на основе
информации о состоянии системы. Такие системы называются аналитическими. Если
оптимальный режим определяется в результате поиска экстремума критерия
эффективности системы, то система называется поисковой.
Изменение состояния системы можно производить за счет контролируемых изменений
управляющих воздействий, параметров и структуры системы.
Адаптивные системы классифицируются в зависимости от объема этих изменений:
 Экстремальные системы- изменяются только управляющие воздействия
 Самонастраивающиеся системы- изменяются управляющие воздействия и параметры
системы.
 Самоорганизующиеся системы- изменяются управляющие воздействия, параметры и
структура системы.
 Обучающиеся системы- изменяются управляющие воздействия, параметры и
структура системы, алгоритм действия, а в случае самообучения может меняться и
целевая функция.
По способу осуществления контролируемых изменений адаптивные системы
подразделяются на пассивные, в которых эти изменения осуществляются по заранее
разработанной программе, и активные, в которых контролируемые изменения заранее
не определены, а диктуются сложившейся ситуацией.
99
Адаптивные системы могут также работать по замкнутому и разомкнутому контуру,
При работе по замкнутому контуру производится анализ действия контролируемых
изменений, а при работе по разомкнутому контуру такой анализ не производится.
Наиболее совершенными являются аналитические активные замкнутые
обучающиеся системы. Они применяются, в основном при наличии вычислительной
техники в контуре управления. Наибольшее распространение получили экстремальные
и самонастраивающиеся системы благодаря возможности аппаратной реализации их
алгоритмов при использовании электронных средств построения контуров управления.

2.7.2.Экстремальные системы управления


Задачей экстремальных систем управления (ЭСУ) является обеспечение
наилучшего статического режима работы объекта. При этом необходимо наличие
экстремальной зависимости критерия эффективности R по крайней мере от одного
управляющего воздействия u. В худшем случае достаточно знания того, что такой
экстремум существует Это является достаточной основой для построения ЭСУ. Таким
образом, если статическая характеристика R=f(u) имеет экстремум, то ЭСУ должна
вывести и удержать рабочую точку объекта в глобальном экстремуме.

Примером объекта с экстремальной характеристикой может служить топочная установка


энергетического блока. Здесь статическая характеристика по каналу расход воздуха на
горение u - температура топочных газов R имеет экстремум-максимум при определенном
значении расхода u*. При u<u* имеет место неполное сгорание топлива, при u>u* избыток
воздуха. И в том, и в другом случае температура топочных газов снижается. При
изменении , либо расхода, либо качества подаваемого топлива, значение u, при котором
R*=max, изменяется. Задача ЭСУ в данном случае сводится к изменению подачи воздуха
до значений, обеспечивающих наилучшие условия сгорания топлива, т.е. к отслеживанию
координат экстремальной точки R*,u*, которые изменяются (дрейфуют) во времени.
К простейшим ЭСУ относятся одноканальные системы, т.е. системы,
использующие одно управляющее воздействие. Это позволяет существенно улучшить
динамические показатели качества работы системы. Поиск экстремума функции R(u)
можно осуществлять различными способами. В частности, это можно делать с помощью
дифференцирующих аналоговых звеньев. Иногда для организации работы ЭСУ
достаточно знания знака производной dR/du..

100
Рис2.7.2.1 Экстремальная зависимость температуры топочных газов

В качестве примера рассмотрим систему дизель – генератор (Д – Г), работающую


параллельно с энергосистемой. Целью управления установкой является максимизация ее
КПД (R=max) в условиях нестабильности зависимости f(q), где q=u-расход топлива,
подаваемого к дизелю. Какой бы ни была функция f(q), экстремальное значение 
d
будет достигнуто при dq  0 . Поэтому для обеспечения цели управления необходимо
вычислить текущее значение  и q’ и осуществлять управление так, чтобы величина
производной q’ стремилась к нулю. Возможный вариант схемы ЭСУ представлен на
рис.2.7.2.2

101
Рис.2.7.2.2 Функциональная схема Э С У для системы «Дизель-Генератор»

Информация о входной мощности Рвх, пропорциональной расходу топлива q и о


выходной мощности генератора Рг дает возможность непрерывно измерять КПД
установки =Рг/Рвх. Дифференцирование величин  и q по времени с помощью
дифференцирующих звеньев (ДЗ) и последующим делением производных ’t и q’t дает
величину, пропорциональную ’q, которая подается на исполнительный механизм (ИМ),
вырабатывающий управляющий сигнал, подаваемый далее на клапан, изменяющий расход
топлива, подаваемого в дизель. Исполнительный механизм в соответствии со знаком и
величиной ’q изменяет расход топлива до тех пор, пока не будет достигнуто равенство
нулю производной ’q. В рассматриваемой системе скорость изменения величины q
пропорциональна величине ’q, т.е.
v=Ku’q (2.7.2.1)
где Kи – коэффициент передачи исполнительного механизма.
В том случае, если определяется только знак производной ’q , исполнительный механизм
движется в ту или другую сторону с постоянной скоростью v0, т.е.
V=v0=v0U (2.7.2.2)

102
Где U=sign=sign{’q +signv}- функция переключения; sign  - единичная функция, знак
которой определяется знаком функции ;  - зона нечувствительности экстремального
регулятора.

Рис.2.7.2.3 Экстремальное управление системой


«Дизель-генератор»

103
Динамические характеристики ЭСУ.
Важное значение для оценки качества управления с помощью ЭСУ имеют
динамические характеристики объекта при управлении его работой с использованием
ЭСУ.
Это особенно важно для объектов сложной структуры, содержащей нелинейные звенья.
Рассмотрим объект, содержащий два последовательно соединенных звена:
безынерционное нелинейное звено (НЗ) и линейное звено (ЛЗ). Функциональная схема
системы изображена на рис.2.7.2.4.

Рис.2.7.2.4. Функциональная схема экстремального


Рис.2.7.2.4. Функциональная схема экстремального
управления
управлениянелинейным объектом
нелинейным объектом
Уравнение нелинейного звена можно записать в виде параболы
R= -K0u2 (2.7.2.3)
Линейное звено (ЛЗ), дифференциальное уравнение которого имеет вид:
d
T 0     R (2.7.2.4)
dt
где К0 и Т0 коэффициент усиления и постоянная времени объекта управления.
Исполнительный механизм системы (ИМ) представляет собой интегрирующее звено,
описываемое уравнением:
du
dt К и
  v (2.7.2.5)

104
Экстремальный регулятор ЭР функционирует на основании информации о знаке
производной в соответствии с уравнением (2.7.2.2)
Определим динамические показатели работы системы.
Перепишем уравнение (2.7.2.4) с учетом (2.2.7.3) в следующем виде:
d du 2
T 0      K0 u
du dt
Тогда с учетом (2.7.2.5) и (2.7.2.2) имеем:
d 2
 T 0  К и  v0     K 0 u (2.7.2.6)
du

Обозначив
1
 a; K 0
b
T 0  К и  v0 T  К v
0 и 0
d 2
Получим  a    b  u (2.2.7.7)
du
Общее решение уравнение вида (2.2.7.7) при v = v0 ищется в виде:
  e    (b  u )  e  du  C 
 adu 2 adu
 
где С – постоянная интегрирования.
После двойного интегрирования по частям выражения, стоящего в квадратных
скобках, получим
 a u b 2 2b 2b
  С e   u  2  u  3 (2.2.7.8)
a a a
где С определяется из начальных условий u(0) = u0 и (0)=0:
 b 2 2b 2  b  a
С   0   u0  2  u0  3   e u0 (2.2.7.9)

 a a a 
В соответствии с уравнением (2.2.7.8) на рис. 2.2.7.5 построена фазовая траектория,
характеризующая движение системы на фазовой плоскости с координатами ,u.

105
Рис.2.7.2.5. Фазовая траектория при работе экстремального регулятора

После пересечения фазовой траекторией (u), обозначенной на рис. 2.2.7.5


штрихованной линией, статической характеристики R(u) координата  начинает
d
уменьшатся и, следовательно, знак производной станет отрицательным. При
du
u>signv (точка u01,01) функция переключения меняет свой знак на обратный и
экстремальный регулятор подает команду на реверс исполнительного механизма.
Уравнение фазовой траектории сохраняет тот же вид, но так как в данном случае v0<0, то
коэффициенты a и b в уравнениях (2.2.8) и (2.2.9) меняют знак, а в уравнении (2.2.9),
кроме того, вместо 0 и u0 cледует подставить 01 и u01. В точке u02, 02 снова произойдет
реверс и так далее. Предельный цикл, показанный на рис.2.2.5 сплошными линиями,
характеризует установившиеся автоколебания в системе.
Имея фазовую траекторию и предельный цикл, можно определить качественные
показатели работы системы, к которым относятся потери на поиск, время выхода в зону
экстремума и параметры автоколебаний. В последнем случае помимо периода
автоколебаний Та определяется размах колебаний как управляющего воздействия u (зона
поиска на входе), так и показатели качества  (зона поиска на выходе). Из рис.2.7.2.5
106
видно, что зона поиска на входе u=u1 + u2и 2-1. Так как скорость
исполнительного механизма в соответствии с уравнением (2.7.2.5) равна Киv, где v=v0,
период автоколебаний
u
T  (2.7.2.10)
К и  v0
a

Потери на поиск Р определяются как разность между экстремальным R* и средним


Rср значениями критерия на выходе объекта и характеризуют точность работы ЭСУ. Так
как автоколебания симметричны, то величина потерь
P=0.5(1+ 1) (2.7.2.11)
Время выхода в зону экстремума Тв определится как сумма времен, за которые
система проходит определенные участки фазовой траектории
n
u u
Т в    t i;
0i 1
 ti  0i
(2.2.7.12)
i 1 К v и 0
где n – количество участков фазовой траектории до выхода на предельный цикл.
Аналогичные результаты по определению динамических характеристик системы
экстремального регулирования можно получить, определяя поведение выходной
координаты во времени. Учитывая, что в соответствии с (2.7.2.5)
ui= Киv0t+v0, и подставляя это выражение в (2.7.2.8), получим зависимость (t),
которая также позволяет установить качественные показатели работы системы.

Рис.2.7.2.6 Характер отклонения во времени


107
Системы экстремального управления с непосредственным измерением величины
или знака производной обладают сравнительно низкой помехозащищенностью.
Например, если при движении к экстремуму на характеристику R(u) накладываются
высокочастотные помехи, то система буде совершать ложные реверсы, что значительно
ухудшает ее динамические свойства. С целью повышения помехозащищенности
применяют ЭСУ шагового типа, в которых значение экстремального показателя R
измеряется дискретно, через определенные интервалы времени t, называемые шагами. В
зависимости от результатов сравнения величин R в начале и конце каждого шага
осуществляют изменение управляющего воздействия u в соответствии с алгоритмом
ui+1=ui + uUi+1 ; Ui+1=sign(R+)signUi (2.2.13)
где ui и ui+1 – величина управляющего воздействия на i-м и i+1-шаге квантования по
времени, соответственно; u – величина изменения управляющего воздействия на каждом
шаге квантования по времени; R- приращение критерия эффективности на i-м шаге;
- зона нечувствительности экстремального регулятора.
Нетрудно заметить, что при достаточно большой величине u обеспечивается
достаточно надежное измерение приращения критерия эффективности, что способствует
повышению помехозащищенности системы.
Величина шага квантования по времени t ограничена: при очень большом шаге в
системе могут появиться ошибки из-за дрейфа статической характеристики R(u); при
слишком малом шаге на правильность работы системы помимо запаздывания информации
о выходных показателях, обусловленного инерционностью объекта, могут оказывать
влияние высокочастотные помехи. Таким образом, оптимальная величина t выбирается
исходя из конкретных условий работы системы.

Наряду с рассмотренными принципами построения экстремальных систем


управления могут также использоваться поисковые методы экстремального
регулирования, основанные на рассмотренных методах поиска экстремума методами
нелинейного программирования. Использованная и рассмотренная нами процедура
идентификации модели путем поиска параметров, минимизирующих рассогласование
между результатами моделирования и наблюдения является, по существу, экстремальным
регулятором, обеспечивающим движение объекта по заданной траектории. Аналогично
эти методы могут применяться и при решении других задач управления, однако при этом
всегда возникает запаздывание между выработкой управляющих воздействий и
состоянием объекта. Поэтому такие методы могут использоваться для процессов,
108
характеристики которых изменяются не слишком быстро. Либо делается поиск
оптимальных управления для целой области возможных изменений параметров процесса,
полученные результаты аппроксимируются и вводятся в машину. В этом случае система
управления работает по принципу обратной связи, с периодической коррекцией
полученных управлений.

Раздел 3. Большие и сложные системы.

3.1. Основные характерные черты больших и сложных систем.


Под системой мы будем понимать взаимосвязь самых различных элементов. Эти элементы
объединены общей целью функционирования и для достижения этой цели могут обмениваются
между собой веществом, энергией и информацией. По существу, вся вселенная состоит из
множества систем, каждая из которых содержится в более крупной системе подобно множеству
пустотелых кубиков, вложенных друг в друга.
Для того чтобы исследовать взаимосвязи элементов систем друг с другом, мы должны
четко определить границы каждого элемента, его связи и границы системы. При стремлении
исследовать все воздействия на какой-либо материальный объект, мы должны определить его как
часть некоторой системы. Поэтому для исследования объекта мы должны выделить и определить
систему, к которой принадлежит данный объект.
Основным характеристиками систем являются функция, цель и структура. Для каждой
системы может быть сформулирован критерий эффективности ее функционирования в
зависимости от поставленной цели. Напомним, что целью функционирования системы является
наиболее предпочтительное конечное состояние системы. Управляющая часть системы должна
109
быть построена таким образом, чтобы система функционировала для достижения поставленной
цели наиболее эффективным способом, т.е. таким образом, чтобы критерий эффективности в
процессе ее функционирования принимал бы экстремальное значение.

3.2. Декомпозиция систем и иерархическая структура системы управления


Для больших и сложных систем задача построения управляющей части, обеспечивающей
оптимальное функционирование системой в соответствии с ее целью и сформулированным
критерием эффективности, является весьма сложной задачей. Основная проблема, которая создает
большие трудности в создании управляющей части системы, является проблема размерности. При
большом числе элементов и подсистем возрастает число управляющих параметров, которые
оказывают влияние на ее функционирование и достигаемый при этом критерий эффективности.
Попытки решить в прямую задачу оптимизации и определить оптимальные значения всех
управляющих переменных, оказываются, как правило, мало плодотворными, по двум причинам:
1. Как правило, трудно установить прямую математическую связь между критерием
эффективности и всеми управляющими переменными.
2. Размерность задачи оптимизации становится слишком большой для решения. Кроме того,
даже если и удается сформулировать такой обобщенный критерий эффективности как
функцию всех управляющих параметров и организовать решение такой оптимальной задачи в
режиме реального времени, получаемые оптимальные значения управляющих переменных
получаются с большим запаздыванием. Они не соответствуют состоянию объекта, и их
использование приведет не к стабилизации и движению по оптимальной траектории, а к
возникновению больших колебаний и потери устойчивости системы.
Таким образом, построение централизованных систем управления, работающих в режиме
реального времени, для больших и сложных систем является нецелесообразным. Выходом из
этой ситуации является декомпозиция большой и сложной системы на подсистемы и создание
распределенной системы управления. Эта процедура выполнятся методами системного анализа.
При декомпозиции системы мы получаем отдельные подсистемы, объединенные общей целью
функционирования. Однако для каждой из подсистем формируется свой собственный критерий
эффективности, определяющий эффективность функционирования выделенной подсистемы и не
противоречащий общей цели функционирования системы. Для выделенных подсистем уже могут
быть построены локальные системы управления, обеспечивающие функционирование подсистемы
в автоматическом режиме. При этом кроме выработки управляющих воздействий, оптимальных в
смысле критерия эффективности, сформулированного для каждой подсистемы, локальная система
управления должна обеспечивать формирование и передачу на верхний уровень иерархической
структуры управления информацию, необходимую для определения эффективности
функционирования подсистемы высшего уровня иерархии, или всей системы в целом.

110
При декомпозиции системы на подсистемы расчленение системы осуществляется сверху вниз,
выделяя отдельные автономные подсистемы, выполняющие самостоятельные функции и имеющие
локальные цели, соответствующе достижению общей цели функционирования.
На рис. 3.1 изображена иерархическая структура производственного предприятия.

I
V

III

...
II-1 II-2 II-
S

I-1 ... I- ... I-L ... I-


K N
I
V

III

...
II-1 II-2 II-
S

I-1 ... I- ... I-L ... I-


K N
111
Рис3.1. Иерархическая структура производственного предприятия

I уровень иерархии – отдельные технологические процессы, соответствующие отдельным


стадиям технологического процесса ( механические, гидромеханические, фазовые
превращения, сушка, реакторные процессы и т.д.) локальные системы управления.
II уровень иерархии –технологические системы, соответствующие цехам или отдельным
участкам. САУ процессами организационного и технологического функционирования.
III уровень иерархии – сложные технологические системы, выполняющие выпуск
отдельных целевых продуктов, соответствующие им САУ организационного и
технологического функционирования производств.
IV уровень иерархии – завод или комбинат в целом, соответствующая задачам
функционирования завода САУ, обеспечивающая организационное управление заводом в
целом.
Первую низшую ступень иерархической структуры системы предприятия образуют
отдельные технологические аппараты и агрегаты, выполняющие конкретные
технологические переделы – подготовку сырья, химические превращения, выделение
целевых продуктов, переработку и утилизацию отходов. Целью функционирования этих
подсистем является выполнение отдельных технологических стадий по переработке и
превращению сырья в полупродукты или в продукты. Критерий эффективности этих
подсистем формируется обычно в виде эффективности переработки сырья в конечные
продукты, степень превращения сырья, выходы целевых компонентов и т.д. Эти
подсистемы функционируют обычно под управлением локальных систем управления.
Аппараты и отдельные узлы технологических схем функционируют под воздействием
внутренних и внешних возмущающих воздействий, которые стремятся
противодействовать целенаправленному протеканию технологических процессов.
Внутренние возмущения связаны обычно с колебанием технологических параметров
функционирования элементов (например, отложение примесей на теплообменных
поверхностях, изменения охлаждающей способности и т.п.). Внешние возмущения
обусловлены изменением качества сырья, физико-химических параметров
технологических потоков и энергоносителей, изменением производительности и режимов
работы предшествующих или смежных агрегатов.
Локальные системы управления процессами функционирования отдельных
элементов и подсистем технологических схем используют системы стабилизации
отдельных технологических параметров, системы оптимизации, системы адаптивного
управления и весь тот аппарат оптимального управления, который обеспечивает
оптимальное функционирование отдельных агрегатов.

112
Задачи управления, выполняемые на этом уровне иерархии, являются наиболее
ответственными, ибо именно здесь происходит процесс превращения исходного сырья в
конечные продукты, и от того, насколько экономично происходят эти процессы, зависит
эффективность работы всего предприятия. Это понимал еще известный капиталист Генри
Форд, который высказал крылатую фразу: «Деньги текут из цеха, а не из банка». Эту фразу
он использовал как девиз и основной постулат управления своими производствами, что и
позволило ему работать весьма прибыльно.
Целью функционирования технологических цехов и отдельных производств
является выпуск установленных количеств отдельных видов продуктов, или
полупродуктов для других цехов заданного качества.
Показателями эффективности функционирования подсистем этого уровня иерархии
являются расходные нормы по сырью, топливу, энергоресурсам (электроэнергия, пар,
охлаждающая вода и т.д.), производительность, себестоимость производимой продукции.
Нормальный режим функционирования нарушают следующие возмущающие воздействия:
1. Изменение спроса на производимые продукты.
2. Изменение выпуска используемого сырья.
3. Изменения требований к качеству выпускаемых продуктов, требующих изменения
технологии.
4. Аварийные остановки.
5. Ремонтные остановки обеспечивающих цехов.
На втором и третьем уровнях иерархии возникают задачи оптимизации и
программирования с целью создания оптимальной координации функционирования элементов и
подсистем и оптимального распределения и согласования технологических потоков между ними.
Целью функционирования предприятия является выпуск установленного
ассортимента продукции с заданными качественными показателями.
Эффективность функционирования предприятия определяется экономическими
показателями, поскольку варианты организации производства, часто эквивалентные по своим
технологическим показателям, могут иметь разные экономические показатели. Можно выделить
следующие экономические показатели:
1. Количество реализованной продукции, т/год. Если предприятие выпускает n продуктов, этот
показатель характеризуется не единственным параметром, а совокупностью параметров {Bj},
где j=1,…,n.
2. Качество выпускаемой продукции по каждому из выпускаемых продуктов. По каждому из
продуктов может быть совокупность качественных показателей pj. Этот показатель
характеризуется множеством {jr}, где r-=1,…,pj.
3. Эксплуатационные затраты на производство продукции З э.
4. Капитальные затраты К, включая затраты на создание необходимых оборотных средств.
113
В качестве обобщенного показателя экономической эффективности производства можно
использовать так называемый приведенный доход в руб/год
n

Д   Ц  B j  Зэ  Е  K t (3.1)
пр j
j 1

Где, Цj – отпускная цена на j-й продукт, руб./т, Bj –годовой объем реализации j-го
продукта, Зэ – суммарные эксплуатационные затраты, руб/год, Е – нормативный показатель
эффективности капвложений, год -1, Кt – производственные фонды, т.е. единовременные
затраты с учетом фактора времени, руб.
Возмущающими воздействиями, которые вызывают отклонение в
функционировании предприятия, являются - возможные аварии, неравномерность
поступления сырья, изменения спроса на выпускаемую продукции, колебания цен на
энергоресурсы и др.
Системы управления производством в целом, представляют собой автоматизированные
информационно-вычислительные системы, объединяющие и координирующие работу
всех систем управления предыдущих уровней иерархии.
На каждом уровне иерархии используются свои подходы к системе управления. Для I-го
уровня иерархии стремятся использовать подходы, обеспечивающие работу объектов в
автоматическом режиме без участия человека. В зависимости от степени изученности
объекта и цели функционирования используются различные методы оптимального
управления, либо адаптивного управления, включая самонастраивающиеся системы
управления, обеспечивающие автоматический выбор структуры управления, параметров
настройки и выбор управляющих воздействий.
На верхних уровнях иерархии задачи управления становятся менее
формализованными, часто отсутствует в явном виде связь между критерием
эффективности и управляющими параметрами, возникают трудности в формировании
единого обобщенного критерия эффективности. В контуре управления появляется человек
как участник процесса управления. Появление человека приносит целый ряд
дополнительных сложностей в формализацию задачи управления. Человек, как элемент
системы управления, представляет собой плохо предсказуемое звено. С другой стороны
человек обладает мощной интуицией и прогнозирующей способностью, которых
невозможно достичь с использованием чисто технических средств управления.

114
3.3.Особенности системы «Человек-машина»

Система человек - машина (СЧМ) относится к классу сложных динамических


систем, состоящих из взаимосвязанных элементов различной природы (человек, коллектив
людей, технические устройства и их комплексы, природные компоненты и т.п.) с разным
качеством связей (прямые, обратные, положительные, отрицательные и др.). При этом
предполагается, что структура системы и характеристики ее элементов могут изменяться с
течением времени.
Характерной чертой СЧМ является иерархичность ее структуры, при которой отдельные
подсистемы способны автономно выполнять определенную часть задач, стоящих перед
системой. Кроме того, эти системы обладают большим объемом контролируемых изменений,
что существенно расширяет возможности их адаптации к изменяющимся внешним и
внутренним условиям. Например, при нормальном функционировании системы оператор лишь
следит за ее состоянием, т.е. образует как бы параллельный резервный контур управления,
который вступает в работу, как только зафиксированы недопустимые отклонения состояния
системы от нормы.
Распределение функций между человеком оператором и техническими средствами
управления и сигнализации представляет собой одну из основных проблем инженерной
психологии. В настоящее время сформировались следующие подходы к анализу и проектированию
систем «Человек-машина» (СЧМ):
Антропоцентрический
Машиноцентрический
Равнокомпонентный.
В первом подходе основное внимание уделяется свойствам и особенностям действий оператора.
Во втором - свойствам машины, и в третьем – равное внимание уделяется обоим компонентам
системы управления в СЧМ.
В результате многочисленных теоретических и экспериментальных
исследований были обнаружены закономерности организации деятельности и разработана
концепция активного оператора, представляющая собой принцип актуализации
психофизиологических возможностей человека при помощи технических средств, поддержание
115
его базовых рабочих характеристик и, таким образом, создание условий для принятия
оператором ответственных решений.
Если, мы допустим, что основная цель СЧМ - обеспечить такое состояние объекта
управления, где он может функционировать с заданной надежностью и безопасностью при
функционировании в расчетном и управляемом поле изменчивости, то основная функция
СЧМ - снижение неопределенности состояния объекта (снижение наличной изменчивости до
расчетной).
Степени свободы (проектируемая область изменчивости и, соответственно, возможности
контроля управления) автоматизированных средств управления, тем более автоматических,
заранее ограничены. А если объект управления сложен, то возникает (подразумевается) часть
задач, которую невозможно решать только средствами технического контроля и управления.
Такие задачи управления отличаются от всех остальных тем, что
• во-первых, для решения требуют большее количество степеней свободы, чем
имеют технические средства;
• во-вторых, характеризуют неопределенность состояния объекта управления;
• в-третьих, фактически могут быть решены только посредством дополняющих
возможностей оператора.
Из этого следует, что функции оператора в СЧМ при различной неопределенности
состояний объекта и задач управления будут разными.
Проиллюстрируем зависимость функций оператора в СЧМ от неопределенности
объекта управления с помощью закономерности активности (рис. 3.2).

116
Состояние объекта управления Состояние
Состояние
объекта объекта управления
не полностью Состояние
объекта не
определено полностью
Н=0 определено
Состояние
определено объекта
Н=0 управления Состояние
определено
Н=Н
Состояние
объекта объекта управления
max не полностью Состояние
Н=Н
объекта
max не полностью
определено Н=0 определено
определено Н=0
Н=Н определено
max
Н=Н max

Детерминированные задачи. Неопределенные задачи.


Паритетные задачи.
Машина “Ведущая”. Оператор “Ведущий”.

Рис. 3.2. Распределение активности между составляющими СЧМ.


На рис. 3.2 приведена ось, символизирующая неопределенность объекта управления,
оцениваемую энтропией Н (0 < Н < Н mах) и, соответственно, неопределенность задач управления.
В левой части оси Н = 0, т.е. задачи перед СЧМ стоят детерминированные (надежная,
расчетная, известная область изменения объекта). В этом случае машина, например, система
автоматического управления (САУ) будет иметь преимущество перед оператором: по
быстродействию, надежности и т.д. в достижении общей цели СЧМ. В этих условиях оператор
обеспечивает надежное функционирование автоматики (режим наблюдения, профилактики,
обеспечения). Таким образом, здесь роль оператора пассивная (ведомая), а машины - активная
(ведущая) в управлении технологическим процессом.
В правой части оси, где Н = Н m а х СЧМ должна управлять и контролировать
нетрадиционными, недетерминированными (неопределенными) состояниями объекта
управления. Здесь, возможно, машина (САУ) исчерпала свой потенциал изменчивости (ее
характеристики изначально точно определены). Следовательно, для управления такими
состояниями объекта оператор вынужден компенсировать ограничение САУ в изменчивости
своими возможностями. Таким образом, при решении неопределенных задач, оператор в
СЧМ становится активным (ведущим), а машина - пассивной (обеспечивающей).
117
Очевидно, что большинство задач СЧМ находятся между двумя крайними положениями
- это так называемые паритетные задачи. В них активность распределяется между элементами
системы (в данном случае между САУ и оператором) в определенной пропорции.
Из закономерности активности, следует ряд выводов:
• в процессе деятельности (именно в процессе) оператор “скользит” по оси
неопределенности с различной активностью. Под активностью, в частности, мы будем
понимать энергетическое обеспечение способности изменяться.
Причем, очевидно, что процесс деятельности и режимы работы оператора не
дискретны (аварийны, стационарны и т.д.), а непрерывны;
• с ростом неопределенности объекта управления возрастает активность
(ответственность) роли оператора в СЧМ;
• более изменчивая, гибкая система более энергоемка.
Такой подход позволяет синтезировать различные точки зрения на распределение функций
между оператором и САУ в СЧМ, а также увязать функции оператора с характеристиками
объекта управления.
Поэтому при изучении СЧМ следует применять системный подход, руководствуясь
следующими принципами:
• как можно полнее определить назначения системы, ее целей и задач; а это требует,
в свою очередь, анализа состава и значимости отдельных целей, подцелей и
задач, учета возможности их осуществления и требуемых для этого средств и
ресурсов, определения показателей качества и целевой функции СЧМ;
• исследовать структуру системы и, прежде всего, состава входящих в нее
компонентов, характера связей между компонентами и системой в целом с
внешней средой, пространственно-временной организации компонентов системы
и граничных условий, изменчивости системы и ее особенностей на различных стадиях
существования;
• последовательно изучить характер функционирования системы, в том числе в
целом всей системы, отдельных подсистем в пределах целого, изменчивости
функции и ее особенностей на разных стадиях существования системы;

118
• исследовать функционирование системы в динамике, т.е. на различных
этапах ее существования: при проектировании, производстве, эксплуатации.
Таким образом, максимально возможное обобщение методов исследования
разнообразных технических устройств, природных компонентов и человека, но не исключающее
в то же время дифференцированного подхода к отдельным элементам СЧМ, позволяет
реализовать системный (комплексный) подход при создании СЧМ как системы, объединенной
общей целью функционирования.

3.4.Режимы работы системы «Человек-Машина».

Задачи оперативного персонала СЧМ обычно подразделяются на аварийные и


стационарные. Основанием для такой классификации является состояние объекта
управления, обусловленное параметрами технологического процесса. Если работа оборудования
предельна, то такой режим работы СЧМ относится к аварийным, а при расчетных параметрах
эксплуатации к стационарным режимам управления.
Однако такой подход не позволяет предусмотреть различия в квалификации
операторов и анализировать последствия ошибочных действий для СЧМ. В этом смысле,
например, хорошо известная и объективно сложная аварийная задача может определяться
оператором как “стационарная”, а безобидная, “стационарная”, но незнакомая - являться
проблемой и представлять собой существенную угрозу, для безопасности СЧМ.
Проясним различие между задачей и проблемой в СЧМ. Задача управления для
оператора часто имеет четкую структуру: в ней нечто всегда дано, например, условия, причем
совокупность этих условий для оператора уже определена. Другими словами задача включает в
себя требование (цель), условие (известное) и искомое (неизвестное), т.е. основным
отличительным признаком в определении «задачи» является включенность в условия заранее
известных переменных. Проблемы и проблемные ситуации это задачи, но с условиями,
которые необходимо определить в процессе решения. Исходя из результатов анализа наиболее
существенных ошибок в СЧМ, можно заключить, что наибольшую угрозу для безопасности
представляют плохо определенные, нетрадиционные, неожиданные задачи управления. Поэтому
для того, чтобы обоснованно выбрать критерий классификации задач при исследовании и
119
проектировании СЧМ, предусмотреть возможные сбои и аварийные ситуации в каждом
конкретном случае имеет смысл рассмотреть подробней суть процесса управления
технологическим объектом (задачи и проблемы).
Если основную цель СЧМ свести к управлению технологическим п р о ц е с с о м , т о
с а м о у п р а в л е н и е м о ж н о п р е д с т а в и т ь к а к п р о ц е с с целенаправленного ограничения
возможных степеней свободы существования объекта (состояние, изменение, динамика и т.д.) до
расчетных (технологически необходимых, надежных, безопасных и т.д.) значений.
Следовательно, если СЧМ стремится управлять другой технической системой, то, для
обеспечения условия надежного результата, управляющая система должна, как минимум,
обладать большим количеством степеней свободы по отношению к объекту управления
(естественно, в общем диапазоне изменчивости). Кроме того, управляющая система должна
обладать соответствующей управлению активностью, т.е. возможностью превратить желаемый
результат а действительность. Очевидно, что эта борьба ведет к понижению энтропии
системы, включающей в себя индивида и его непосредственное окружение, т.е. представляет
собой, прежде всего, негэнтропный процесс. Ю.П. Пономарев определяет время “жизни”
системы величиной энергии (величиной избытка энергии), которая понимается как
источник негэнтропии, препятствующий распаду системы. Неопределенность, впервые
введенная Клаузиусом, как мера деградации системы, и в дальнейшем широко
представленная в работах Клода Шенона, является связующим звеном между энергией и
информацией системы и предоставляет возможность классифицировать различные
задачи и режимы для разных технологических циклов, которые управляются с помощью СЧМ.
Таким образом, основные различия между объективной и субъективной
неопределенностью задачи, которые приводят к аварийным ситуациям в СЧМ, заключаются в
следующем
• в общем, объективная неопределенность может порождаться большим количеством
объектов, включенных в ситуацию, и сложностью взаимосвязей между ними, дефицитом
информации о ситуации, лимитом времени для анализа ситуации и восполнения
дефицита информации;
• неопределенностью, вызванной поведением среды;
• принципиальной неопределенностью.
120
В частности, объект управления может включать огромное количество разнородных по
своему составу элементов, что резко снижает надежное функционирование во всех возможных
состояниях. Кроме того, взаимодействие элементов внутри этого объекта может
(принципиально) создавать новые состояния, которые могут быть отличны от надежной
области и могут быть заранее не известны проектировщику объекта (не говоря уже об
операторе).
Напротив, субъективная неопределенность порождается индивидуальными качествами,
например, стратегией деятельности, концептуальной моделью объекта управления и
прогнозирования результата, компетенцией и опытом оператора и характеризует их неполноту,
вариативность и, возможно, неадекватность.
В целом, причины субъективной неопределенности:
• порождаются оператором в силу недостатка его опыта и знаний тех факторов, которые
влияют на процесс принятия решений;
• обусловлены таким видом неопределенности объекта управления, которую достаточно сложно
или невозможно устранить, т.е. существует слишком высокая или недоступная плата за
определенность.
Заметим, что анализ субъективной и объективной неопределенности задачи посредством их
сравнения, позволяет исследователю определить основные отличия между “стационарным”
и “аварийным” режимом работы СЧМ. В результате, создается возможность коррекции работы
системы, улучшения количественных и качественных показателей, а также предотвращения
аварийных ситуаций. Таким образом, “человеческий фактор” в системе управления
увеличивает степени свободы системы управления. Иными словами отвечает закону
достаточного разнообразия, сформулированному английским кибернетиком Эшби:
"Разнообразие состояний системы управления должно быть не меньше разнообразия состояний
управляемого объекта". Но именно это достоинство - увеличение степеней свободы -
оборачивается недостатком, приводит к ошибкам и сбоям операторов, что и ухудшает
надежность всей системы.

121
3.5.Разработка алгоритмов управления большими системами с использованием различных
методов.

При построении систем управления большими системами необходима разработка алгоритмов


управления с учетом возможности участия человека-оператора в реализации этих алгоритмов и с
оптимальным распределением функций между оператором и машиной, или точнее между
системой управления с использованием технических средств, в том числе и вычислительной
техники, входящей в систему управления. При разработке таких алгоритмов используются
различные подходы:
 Теория массового обслуживания.
 Методы статистических испытаний
 Теория информации
 Игровые системы.
Рассмотрим кратко основы применения этих методов для построения алгоритмов управления
большими и сложными системами.
Первым и общим этапом для построения алгоритмов управления является распределение
управляющих функций между машиной и человеком и выделение круга задач, по которым
оператор должен принимать решение и доводить его до исполнения, либо путем
непосредственного воздействия на процесс, либо путем воздействия на систему управления,
например, путем задания уставок контурам управления или изменения параметров контуров
управления. В любом случае необходимо проанализировать и установить затраты времени
оператором на получения и анализ информации о состоянии объекта, времени на принятие
решения и времени на выполнение управляющего воздействия.
3.5.1.Применение теории массового обслуживания. Рассмотрим функциональную схему
системы обслуживания системы управления человеком-оператором рис.3.3.

122
ВИ к ИУ
ВП ЧО ВПО
З У ОО З
П

Рис.3.3. Функциональная схема обслуживания заявок оператором

ВИ к ИУ
ВП ЧО ВПО
З У ОО З
П

Рис.3.3. Функциональная схема обслуживания заявок оператором


Здесь: ВИ- входная информация, ВПЗ – входной поток заявок
ЧО – человек-оператор, УП- устройство памяти,
ВПОЗ- выходной поток обслуженных заявок, ИУ – исполнительные
устройства
Входная информация (ВИ) условно может быть представлена тремя потоками –от внешней
среды, от других операторов и от измерительных средств системы. Эти потоки образуют
входной поток заявок (ВПЗ), который поступает непосредственно к человеку-оператору (ЧО),
либо, если оператор занят обслуживанием другой заявки, в устройство памяти (УП).
Организация обслуживания заявок организуется обычно по схеме массового обслуживания с
ожиданием. Заявки, обслуженные оператором, образуют выходной поток обслуженных заявок
(ВПОЗ), который поступает на вход исполнительных устройств или к другому оператору.
Обычно предполагается, что входной поток обладает свойством стационарности (вероятностные
характеристики не зависят от начала отсчета времени), ординарности
(при малых t вероятностью появления двух и более событий можно пренебречь) и является
потоком без последствий (для любых неперекрывающихся участков времени число событий на
123
каждом из них не зависит друг от друга). Такой поток заявок называется простейшим и
подчиняется закону распределения Пуассона:

(  )
k
  (3.5.1)
P(k )  e
k!
Где P(k) – вероятность того, что за время  произойдет ровно k событий (поступлений заявок;  -
плотность потока заявок (среднее их число в единицу времени).
Важной характеристикой потока является закон распределения длины промежутка
времени между поступлениями заявок. Вероятность того, что Tt ( здесь t – время,
отсчитываемое от момента предыдущей заявки), можно получить, положив в выражении (3.5.1)
k=0:
P{Tt) = P(t) = P(k=0) = exp(-) (5.3.2)
Тогда вероятность противоположного события (поступление заявки за время Т):
P{T<t} = f(t) = 1 – exp( - ) (5.3.3)
При этом числовые характеристики случайной величины T (математическое ожидание mT и
среднее квадратическое отклонение T) mT = T = 1/.
Кроме характеристик входного потока заявок режим работы зависит и от характеристик
производительности самой системы: числа параллельно работающих
каналов и быстродействия каждого канала, При этом одной из важнейших характеристик
является время обслуживания одной заявки Т, которое во многих случаях имеет
экспоненциально распределение типа:
P{To<t} = Fo(t) = 1-exp(-t) (5.3.4)
Где  - параметр, который равен величине, обратной времени обслуживания mTo.
Таким образом, если известны характеристики входного потока и производительности
системы, то для обеспечения установившегося режима обслуживания, обеспечивающего

124
нормальное функционирование объекта, необходимо выполнение условия mT>mTo, или <. При
этом, чем больше mT по сравнению с mTo, тем более надежно работает система.
Пример: Входная информация, поступающая к оператору на рис.3.3 представляет собой поток с
плотностью  = 2 заявки в минуту. Среднее время обслуживания одной заявки mTo = 0.4 минуты.
Определить, существует ли установившийся режим обслуживания.
Решение: Параметр  = 1/ mTo=1/0.4 = 2.5> = 2. Следовательно, стационарный режим
обслуживания существует.
В случае > возникает необходимость увеличить производительность системы. Например, при
переходе к групповой деятельности операторов система становится многоканальной, что
увеличивает ее производительность пропорционально количеству каналов. Другим путем
выполнения условия < является либо снижение плотности потока заявок, за счет передачи
части функций оператора системам автоматического управления, либо увеличения величины 
за счет обучения оператора и снижения времени обслуживания одной заявки. При этом
возможность совершения ошибок и последующее их исправление может рассматриваться как
поток отказов системы, а время их исправления может рассматриваться как время
восстановления работоспособности системы.
Применение методов теории массового обслуживания для построения модели
деятельности СЧМ не всегда дает удовлетворительные количественные оценки, так как входной
поток заявок не всегда является простейшим, а распределение времени обслуживания Т о не всегда
подчиняется экспоненциальному закону (5.3.4). Кроме того, входной поток заявок не всегда
однороден и иногда не может быть разбит на несколько однородных потоков по определенным
признакам: срочности, важности, затратам на обслуживание и т.п. Однако применение теории
массового обслуживания позволяет в первом приближении решить многие вопросы организации
деятельности операторов: определить необходимое число операторов, выработать требования к

125
уровню их полготовки, установить допустимую плотность потока сигналов, решить возможности
взаимодействия между операторами и т.п.

3.5.2.Применение метода статистических испытаний.


В тех случаях, когда мы имеем дело со сложной системой взаимодействия разнородных
элементов с непредсказуемым исходом и когда точное описание таких процессов невозможно, с
успехом применяется метод статистических испытаний, называемый также методом Монте-Карло
или методом имитационного моделирования. Его можно также использовать и для моделирования
функционирования такой сложной вероятностной системы как СЧМ в тех случаях, когда теория
массового обслуживания не может быть использована. Это бывает в случаях, когда входной поток
заявок далеко неоднороден и иногда не может быть разбит на несколько однородных потоков по
определенным признакам. В таких случаях можно успешно применять метод статистических
испытаний. В этом случае все входные переменные (поток заявок, их вид, реакция на них
оператора, вид этой реакции, воздействие на процесс) рассматриваются как случайные числа.
Одна такая реализация поступления случайного сигнала на вход СЧМ не дает еще никакой
полезной информации о тенденциях развития этого процесса и его стационарных
характеристиках. Однако многократная реализация таких процессов дает набор реализаций,
статистические свойства которых – математическое ожидание и дисперсия становятся
постоянными. Таким образом можно смоделировать поведение оператора в СЧМ на различные
поступающие к нему сигналы о состоянии системы и его реакции на эти сигналы. Применение
метода имитационного моделирования при исследовании деятельности человека требует учета
следующих особенностей деятельности и оператора:
 Последовательности деятельности оператора, который в пределах заданных ограничений
действует согласно предписаниям (последовательность действий и предписания могут быть
заданы в детерминированном и вероятностном видах).

126
 Внешних проявлениях таких факторов, как состояние напряженности оператора, его
квалификация, слаженность работы коллектива, особенности памяти оператора, его реакция,
эмоциональная устойчивость и т.п.).
 Изменения порядка отдельных действий, числа операторов, их психофизиологических
характеристик, условий работы и т.п. для получения интегральных показателей качества
работы оператора.
Сопоставляя полученные результаты , можно выбрать оптимальный по принятому критерию
вариант деятельности оператора.
Имитационное модели деятельности оператора можно разбить на два класса:
 Модели решения оператором конкретной задачи, в частности связанной с определением
закона распределения времени выполнения отдельных операций.
 Модели функционирования оператора в условиях потока таких задач, где вероятностные
характеристики решения конкретных задач считаются известными, в частности при заданных
функциях F1(t) F2(t) (F1(t) –функция распределения вероятности выполнения некого действия,
F2(t) - функция распределения вероятности отказа некого действия ).
В результате имитационного моделирования можно вычислить многие показатели работы
оператора: своевременность решения задач, степень загрузки в период занятости оператора и др.

Другим подходом к решению задачи исследования поведения оператора в СЧМ является


подход, основанный на исследовании поведения оператора в условиях его деятельности с
использованием тренажера, имитирующего работу объекта управления, системы управления и
системы связи оператора с объектом через пульт оператора. В тренажер в качестве объекта
управления вводится детальная динамическая модель объекта, реагирующая на действия
оператора точно таким же образом, как и объект. Такая модель может быть получена либо
методом имитационного моделирования путем установления связей «вход-выход» с учетом

127
развития откликов на управляющие воздействия операторов во времени, либо на основе детальной
математической модели объекта, созданной на основе закономерностей происходящих в объекте
процессов. Такие модели обладают более правильными реакциями на действия операторов и
позволяют проводить исследования действий операторов в критических ситуациях, при значениях
параметров процесса, соответствующих протеканию в аварийном или предаварийном режимах.
Модели, полученные методом имитационного моделирования, не могут описывать процессы в
этих ситуациях. Поэтому этому подходу в настоящее время уделяется большое внимание и
разрабатываются детальные динамические модели для создания тренажеров для потенциально
опасных процессов. Эти работы проводятся для крупнотоннажных химических , нефтехимических
и металлургических процессов, так как при переходе этих процессов в аварийное состояние могут
возникнуть ситуации, опасные для окружающей среды и населения. Поэтому, несмотря на
дороговизну этих работ и трудоемкость, эти работы проводятся очень интенсивно в последнее
время как в нашей стране, так и за рубежом. С помощью таких тренажеров, проводя имитационное
моделирование развития процесса, можно не только изучить свойства поведения оператора в
нормальном и аварийном режимах функционирования, но провести отбор операторов по их
психофизическим параметрам и провести их подготовку, не подвергая опасности ни процесс, ни
самих операторов, ни окружающую среду. Поэтому это направление имитационного
моделирования в настоящее время интенсивно развивается. Практически, для всех крупных
систем управления заказчики выдвигают требования создания тренажеров для решения проблем
отбора и подготовки операторов.

3.5.3.Применение теории информации.


Методы теории информации применяются для количественного описания
функционирования каналов связи, и в частности человека-оператора, деятельность которого
заключается в передаче информации, поступающей с систем отображения информации (СОИ) на

128
исполнительные механизмы управления. Основным понятием теории информации является
энтропия Н, которая характеризует меру первоначальной неопределенности объекта и зависит от
числа возможных его состояний N и от вероятности этих состояний pi (i=1,…N). Для
количественной оценки энтропии К. Шенноном было введено соотношение
N
H   p  log p (3.5)
i 2 i
i 1

Сообщение о состоянии объекта полностью ликвидирует неопределенность и поэтому


доставляет количество информации I, численно равное Н.
Свойства энтропии:
1. Энтропия есть величина вещественная, ограниченная и неотрицательная. Это следует
непосредственно из ее определения формулой (3.5) с учетом того, что 0  pi  1.
2. Энтропия детерминированных сообщений, когда одно событие достоверно (pi=1), а
остальные невозможны (pji = 0), равна нулю. Это вытекает из подстановки pi=1 и pj 0
в выражение (3.5).
3. Энтропия максимальна, если N возможных состояний равновероятны, и растет с
увеличением числа этих состояний. Это утверждение вытекает из исследования

N
функции H = f(p1,…, pi,…, pN) на условный экстремум при   p
i 1
i
 1 . Тогда при

pi= p = 1/N
1 N 1
H max
    log  log N (3.6)
N i 1 2 N 2

Из уравнения (3.6) следует, что для получения максимальной информации в сообщении


необходимо так опрашивать СОИ, чтобы все ответы типа «да - нет» были равновероятны
(оптимальное кодирование). Если это не удается, то можно только утверждать, что

129
минимальное число вопросов, необходимое для выяснения содержания данного
сообщения, не меньше, чем количество информации, заключенной в сообщении. Заметим,
что выражения (3.50 и (3.6) определяют энтропию объекта с конечным числом состояний
N. В случае, если объект обладает бесконечным числом состояний, то N  и Н.
Отсюда вытекает невозможность абсолютного знания. Для того, чтобы понятие энтропии
распространить на упомянутый класс объектов, необходимо определять состояния объекта
с фиксированной точностью Х, в пределах которой эти состояния практически
неразличимы. Это позволяет непрерывную величину свести к набору дискретных
состояний и пользоваться формулами (3.5) и (3.6).
4. При объединении нескольких независимых объектов в один их энтропия суммируется, т.е.
энтропия обладает свойством аддитивности:
N1 N2
H ( X , Y )    p log p   p log p   p log p  H ( X )  H (Y )
ij 2 ij i 2 i j 2 j
i 1 i 1

(5.3.7)
где pij – вероятность того, что объединенный объект примет состояние Х=х i, Y=yj ( для
независимых объектов pij = pipj).
Количественная оценка информации позволяет согласовать производительность источника
информации с пропускной способностью канала связи. Под пропускной способностью канала
понимают количество информации, которое способен передать канал связи в единицу времени:
C=Ic,max/c, где Ic,max – максимальная информация в одном сигнале, c – длительность передачи
одного сигнала.
Число возможных сообщений N= mn, где m = - число отличительных признаков. Тогда:

H log N
I c,max  max
 2
 log m (3.7)
n n 2

130
При двоичном коде m=2 и Ic,max= 1бит. Если известна производительность источника информации
Ic , то для передачи этой информации без задержки необходимо, чтобы выполнялось условие C>Ic.
Применение теории информации при исследовании человека как составляющей части
СЧМ позволяет решать следующие задачи:
 Производить оценку сложности работы оператора, а также оценку времени, затрачиваемого на
переработку информации.
 Согласовывать производительность источника информации Ic с психофизическими
возможностями человека по ее приему и обработке. Пропускная способность человека
определяется характером деятельности. Если эта деятельность может быть представлена как
канал без памяти (работа машинистки, корректора и т.д.), то С=1070 бит/сек, если канал с
кратковременной памятью - С=24 бит/сек. Если длина сообщения превышает объем
кратковременной памяти человека, то для его запоминания необходимо многократное
повторение. При этом величина С снижается до десятых долей бит в секунду.

К факторам, ограничивающим применение теории информации при изучении деятельности


оператора, можно отнести следующие:
 При вычислении энтропии объекта используется вполне определенное количество возможных
состояний.N и вероятности этих состояний pi. Человек субъективно оценивает эти состояния, а
характеристики человека по их различению зависят от его состояния, утомляемости,
способности к обучению, т.е. непрерывно меняются во времени.
 Теория информации не учитывает временной неопределенности сигналов, а для человека
большое значение имеет время поступления этих сигналов, а не только вероятность их
поступления.

131
 Теория информации учитывает только количество информации, но не учитывает ее качество.
Для человека же смысловое значение сообщения может иметь решающее значение для
скорости обработки этого сообщения.
Если перечисленные факторы в условиях конкретной задачи не очень существенны, то
применение теории информации оказывается весьма плодотворным при оценке свойств
человека в СЧМ.

3.5.4. Применение теории игр.


Применение теории игр для анализа поведения человека в СЧМ при
функционировании объекта базируется на представлении, что человек ведет некую игру с
условным противником ( это может быть функционирующий объект) для достижения
поставленной цели поступающие сообщения с объекта о его состояния могут
рассматриваться как ходы условного противника, а действия оператора могут также
рассматриваться как ходы, направленные на достижение поставленной цели.
Основы теории игр были впервые сформулированы Борелем и фон Нейманом
независимо друг от друга. Для преодоления трудностей, связанных с одновременностью
ходов обоих противников, заменим понятие определенного выбора понятием
распределения вероятностей выбора. Мы видим, что для этого случая обобщением понятия
состояния оказалось понятие распределение вероятностей состояний. В этом случае мы
для игрока А устанавливаем не строго определенны выбор хода, а только чтобы он указал
распределение вероятностей этих выборов [p1,p2,…,pN]. Точно так же игрок В должен
выбрать вероятностное распределение [q1,q2,…qM]. Задав вероятности выборов, мы пришли
к оцениванию только возможности выигрыша. Математическое ожидание выигрыша
игрока А может быть задано выражением:
E A
( p, q)   a ij pq (3.8)
i j
i, j

а для игрока В математическое ожидание выигрыша будет задано:


E B
( p, q)   bij pq (3.9)
i j
i, j
На первый взгляд кажется, что мы ничего не выиграли от введения вероятностей выбора, но как
оказалось, очень полезный результат получается, если принять , что

132
bij
  aij (3.10)
Это означает, что игроки стремятся прийти к противоположным, с точки зрения каждого из них,
результатам. Если равенство (3.10) выполняется такие игры называются антагонистическими ,
или играми с нулевой суммой.
Математическое ожидание выигрыша А при выборе им распределения вероятностей
выборов до того как это сделал В, будет описываться выражением:

max min E A ( p, q) (3.11)


[ p] [q]
Если же право первого выбора принадлежит В, то математическое ожидание выигрыша А имеет
вид:

min max E A ( p, q) (3.12)


[q] [ p]
В обоих случаях изменять распределение можно только таким образом, чтобы
N

p  0,  p  1
i
[ 1
i

N  (3.13)
q  0, q  1 
i
[ 1
i 

Полученный результат позволяет построить многошаговый алгоритм достижения результата
выигрыша. Этот алгоритм базируется на теореме фон Неймана о минимаксе:

min max E A ( p, q)  max min E A ( p, q)


[ p] [q] [q] [ p]
(3.14)

На основе этой теоремы о минимаксе может быть построен алгоритм многошагового метода
поиска оптимального решения задачи достижения заданного конечного состояния. Введем новую
функцию
f k
( c )  min max Eh ( x k )
(3.15)
 i  ij 
p  q 
   
Здесь минимум определяется по множеству всевозможных распределений, выбираемым нами на
каждом шагу xk процесса поиска оптимального решения, а максимум – по множеству
распределений, устанавливаемым нам процессом. Тогда , используя принцип оптимальности в
сочетании с теоремой о минимаксе, можно построить следующий алгоритм поиска распределений
выбора, приводящий к выигрышу, т.е. к достижению поставленной цели функционирования
оператора в СЧМ:

133
 
f (c )  min max  p q f [ g (c, y (i ) , (i ) )] 
k i j k 1 1 r 1
p q i, j  (3.14)
max min 
q p

 ... (k  2,3....)
 
f 1
( c )  min max  p q h[ g (c, y (i ) , r (i ) )] 
i j 1
 i, j
p q 1
 (3.15)
max min... (k  2,3....)
q p

Мы получили вычислительный алгоритм, аналогичный тем, которые используются для


определения оптимальной стратегии методом динамического программирования.
Используя этот алгоритм и задавая различные распределения вероятностей сигналов о
состоянии процесса можно определить оптимальную стратегию действий оператора. Можно
использовать и другие методы поиска оптимальных стратегий действий, но преимуществом этого
подхода является то, что мы находим оптимальную стратеги вероятностей различных выборов
действий оператора при функционировании объекта.

Раздел 4. Нечеткие системы управления на базе теории нечетких множеств.


Теория нечетких множеств (ТНМ), лежащая в основе создания управления на ее основе,
возникла на стыке математической теории множеств и математической логики. Ее основы были
впервые сформулированы в 1965 году американским математиком Л.Заде. Развитие этих подходов
134
к теории автоматического управления позволило сформулировать совокупность методов и
приемов использования ТНМ. Эту совокупность называют обычно фаззи – технологией. При ее
использовании для построения алгоритмов управления широко используется опыт и интуиция
специалистов по действиям в возникающих ситуациях, как в штатных, так и в аварийных.
В результате развития теории и подходов к решению задач управления, этот метод
превратился в мощное и весьма практичное средство синтеза разнообразных систем управления
сложными технологическими процессами различной природы.

4.1.Подходы, применяемые в фаззи – технологии для синтеза систем


управления.
Традиционно применяемый подход к синтезу систем управления заключается в том, что
нам известна математическая модель объекта, на основе которой мы можем сформировать
критерий эффективности функционирования систем, установить с помощью модели связь его с
управляемыми переменными и найти такое управление, которое обеспечит функционирование
системы в оптимальном режиме. Однако такой подход не всегда возможен, потому, что нам не
всегда известна достаточно детальная математическая модель объекта управления. В то же время,
для функционирования большинства объектов, имеется обширный опыт специалистов,
основанный на опыте и интуиции, который позволяет им достаточно успешно управлять
функционированием объектов с вполне удовлетворительным качеством. Однако используемые
ими методы не могут быть строго формализованы и доведены до строгого математического
описания.
Согласно принципу функционирования и методологии построения фаззи-системы
регулирования вся исходная информация о стратегии управления хранится в виде базы правил – в
виде условных логических выводов типа «ЕСЛИ …, ТО….». Эта база формируется на основе

135
тщательного изучения объекта и задачи управления, путем анкетирования специалистов-
технологов, хорошо знающих объект управления и выступающих в качестве экспертов.
Схема фаззи-регулирования приведена на рис. 4.1.
Центральным звеном фаззи-регулятора является блок нечеткого вывода (БНВ), или блок
принятия решений. В этом блоке на основе нечеткой информации о сигнале ошибки
рассогласования делается вывод о соответствующем множестве значений управляющего
воздействия. Блок фазификации (БФ) преобразует четкие значения величины рассогласования в
нечеткие, а блок дефазификации (БДФ) преобразует нечеткие рекомендации по управлению
объектом в конкретный управляющий сигнал u*.

Рис.4.1. Функциональная схема фаззи-


управления

136
Рис.4.1. Функциональная схема фаззи-
управления
4.2. Элементы теории нечетких множеств.
Обычная теория множеств оперирует с множествами и их элементами, объединяемые в множества
по определенным признакам. При этом набор этих признаков позволяет обычно однозначно
отнести данный элемент к этому множеству. Эта принадлежность записывается следующим
образом: хХ.
Факт принадлежности элемента к множеству описывается с помощью функции принадлежности
(х), которая для четких множеств принимает значения 1,если элемент принадлежит множеству, и
0, если элемент не принадлежит множеству.
Такой жесткий однозначный принцип принадлежности не пригоден для описания и
классификации нестрогих понятий и высказываний типа, больше, немного больше, немного

137
меньше и так далее. Эти высказывания широко используются в обычном естественном языке, с
помощью которого можно описать большой круг сложных явлений и процессов.
Для того, чтобы представить приблизительное словесное описание свойств предметов и
явлений на языке теории множеств, Л.Заде ввел понятие лингвистической переменной,
значениями которой являются слова или фразы естественного языка. Например, возраст человека
на бытовом языке характеризуется понятиями ребенок, юноша, молодой человек, зрелый,
пожилой, старый. Введя эти понятия в виде набора элементов множества, мы можем ввести
некоторую шкалу соответствия между этими понятиями и возрастом человека.

138
7

5
Опеделения, Xl

0
0 10 20 30 40 50 60 70 80

Возраст в годах

Рис.4.2 Соответствие между возрастом и его определением.

Совокупность возможных словесных характеристик типа ребенок, юноша и т.д. лингвистической


переменной образуют так называемое терм-множество, при этом исходная переменная х
называется базовой переменной.
Переход от абсолютных значений базовой переменной х к соответствующим значениям
лингвистической переменной Xl необязательно линеен, различным термам могут соответствовать

139
различные диапазоны базовой переменной. При этом функция принадлежности (ФП),
ограничивающая значение базовой переменной, принимает значения из интервала [0,1].

1,200

1,000
Функци принадлежности

0,800

0,600

0,400

0,200

0,000
0,000 10,000 20,000 30,000 40,000 50,000
-0,200
Возраст. годы

Рис.4.3Функция принадлежности, определяющая терм-


множество возраст

Вычисления функции принадлежности выполнено по уравнению, соответствующему кривой


Гаусса.

(х)=exp[-(x-m)] (4.1)

140
Как видно, зависимость представляет собой функцию треугольной формой, которой чаще всего и
пользуются на практике. На следующем рисунке представлено все терм - множество возрастов.

пинадлежности
2
Функция 0
-2 0 50 100
Возраст, годы

Рис.4.4 Терм- множество принадлежности

Так как для понятий ребенок и старый человек существует лишь одностороннее ограничение,
функция принадлежности к этим категориям представлена в виде трапеции.
Обычно используют вместо абсолютных значений базовой переменной ее нормированные
значения. Достаточно удобной при этом оказывается система из пяти ФП, охватывающая
следующие универсальные лингвистические значения: negative big (NB), negative small (NS), zero
(ZR), positive small (PS), positive big (PB). Иногда пользуются более дифференцированными
лингвистическими оценками, например NM (negative medium) и PM(positive medium)/

141
 (u)

NB NS ZR PS PB

-2 -1 0 2
1

142
Рис. 4.5. Функции принадлежности для ошибок регулирования и управляющего
воздействия, заданные на интервале [-2,2].

Нечеткое множество А можно определить как совокупность всех пар вида [x, A(x)],
которые образованы из значений базовой переменной хХ и из функций принадлежности A(x):

 
A  x,  x  X
A
 (4.2)

Множество А состоит из элементов, каждый из которых характеризуется парой значений [xi ,


A(xi)]. Такую элементарную составляющую нечеткого множества называют синглтоном.
Примером такого синглтона служат дискретные значения функции (u) на рис.4.5.
Любое нечеткое множество А можно рассматривать как объединение синглтонов:

 xi ,  ( xi) 
n
A (4.3)
i 1

Здесь знак  обозначает принятую в теории множеств операцию объединения.


Процедура введения терм-множеств А, их функций принадлежности А(х) и установления
конкретного значения А(х*), соответствующего измеренному значению x*, называется
фазификацией.
Нечеткие множества обладают всеми свойствами обычных множеств, и с ними можно
совершать все операции, возможные для обычных множеств.
Так, фаззи - множества А и В равны друг другу, если равны их функции принадлежности
А(х) = В(х),  хХ, где  - квантор общности, логический эквивалент понятия все.
Фаззи – множество А включает в себя Фаззи – множество В, т.е. ВА, если В(х)  А(х),
 хХ, где  - знак включенности, означающий, что В является подмножеством А.
143
Рис.4.6. Соотношения между фаззи – множествами.
Фаззи – объединением двух нечетких множеств А и В, заданных на общем базовом множестве Х,
называют наименьшее нечеткое множество С, которое содержит одновременно как А, так и В
(рис4.6,а):
САВ  {[x, АВ(x)]xX}, (4.4)
Где

144
 АВ(x)=С(х)=max{A(х), B(х)} (4.5)
символ  означает равно по определению.
Фаззи – пересечением двух нечетких множеств А и В, заданных на общем базовом
множестве Х, называют наибольшее нечеткое множество С, которое содержится одновременно и в
А, и в В (рис.4.6,б).
САВ  {[x, АВ(x)]xX}, (4.6)
Где
 АВ(x)=С(х)=min{A(х), B(х)} (4.7)
Фаззи – дополнением нечеткого множества А, заданного на базовом множестве Х,
называют нечеткое множество вида

A   x,  

 ( x) (4.8)
A

где
A-(x)=1-A(x) (рис.4.6,в)

4.3.Основные понятия нечеткой логики.


Нечеткая логика изучает логические операции над высказываниями типа
«ЕСЛИ …,ТО…» и позволяет построить алгоритмы управления на основе базы правил и
признаков, сформулированных при опросе экспертов о возможном протекании процесса и
действиях по его управлению. При этом логические операции служат для получения из
нескольких исходных высказываний одного, более сложного. Однако, если в булевой алгебре
истинности или ложности того или иного положения ставят в соответствие лишь числа 0 или 1, то
в фаззи – логике каждое положение характеризуется истинностными значениями во всем
интервале [0,1].
145
Таблица 4.1.Логические операции булевой алгебры.

Исходные Отрица- Конъюнк- Дизъюнк- Импликация Эквиваленц


высказывания ние НЕ ция И ция ИЛИ «ЕСЛИ… ия
ТО»
А В  В A B A B AB AB
1 1 0 0 1 1 1 1
1 0 0 1 0 1 0 0
0 1 1 0 0 1 1 0
0 0 1 1 0 0 1 1

Импликация соответствует высказыванию «ЕСЛИ А…, ТО В», где А – посылка


высказывания, В – его заключение. Применение операций булевой алгебры к нечетким
высказываниям также возможны при следующих условиях. Высказывания  и В имеют
смысл характеристики истинности высказывания. Тогда возможны следующие фаззи – операции:
 Отрицание  = 1 -  (4.8)
 Дизъюнкция  ( A  B )  max{ ( A),  ( B )}; (4.9)
 Конъюнкция  ( A  B )  min{ ( A),  ( B )}; (4.10)
 Импликация  ( A  B )  min{1, (1   ( B )   ( A)} (4.11)
Приведенные фаззи – логические операции при частных значениях  и В, равных 1 или 0,
полностью подчиняются правилам булевой алгебры, приведенным в таблице 4.1.
Приведем пример применения фаззи – логики для формализации нечеткого высказывания.
Пример 4.1. Формализовать высказывание, являющееся частью нечеткого алгоритма: « ЕСЛИ
температура в реакторе значительно упала И увеличилась кислотность раствора, ТО имеет место
избыток реагента ИЛИ засорение отводящего трубопровода»
Решение. Пусть в некоторый момент времени отдельным частям этого высказывания
соответствуют следующие характеристики истинности:
146
Лингвистическая переменная Символ ФП
Температура незначительно упала А (А)=0.8
Увеличилась кислотность раствора В (В)=0.6
Наблюдается избыток реагента С (С)=0.4
Засорился отводящий трубопровод D (D)=0.3
Полное высказывание можно представить в виде импликации:
A B  C  D
с функцией принадлежности:
( A  B  C  D ) = min{1,(1+  ( A  B )   (C  D )) }=
=min{1,(1+max{(C), (D)}-min {(A), (B)})}=
=min{1,(1+max{0.4;0.3}-min{0.8;0.6})}=
=min{1,(1+0.4-0.6)}=0.8.
Пример 4.1. иллюстрирует общее свойство фаззи – логической импликации, вытекающее из (4.11):
=1, если В, т.е. истинностное значение логического вывода равно единице, если
истинностное значение посылки не больше истинностного значения заключения В.

4.4. Применение теории нечетких множеств и фаззи-логики в задачах


управления.
При использовании фаззи-технологии для синтеза систем управления алгоритм
функционирования управляющего устройства УУ представляют как совокупность нечетких
правил:

«ЕСЛИ … (посылка 1), ТО … (заключение 1)»


«ЕСЛИ … (посылка 2), ТО … (заключение 2)»
147
.....
«ЕСЛИ … (посылка j), ТО … (заключение j)» (4.12)
….
«ЕСЛИ … (посылка n), ТО … (заключение n)»
Первая часть правила обычно представляет собой высказывание о нечетком
(лингвистическом) значении входных переменных УУ, т.е. переменных состояния yi(t) объекта
или ошибки регулирования i(t), а вторая часть содержит высказывание о соответствующем
значении управляющей переменной ui(t). Часто посылка и заключение содержат высказывания о
двух и более входных и выходных переменных, соединенных союзами И и ИЛИ, например:
«ЕСЛИ ошибка регулирования положительно велика (РВ) ИЛИ скорость изменения ошибки
положительно мала (PS), ТО управляющее воздействие по каналу 1 отрицательно мало (NS) И
управляющее воздействие по каналу 2 отрицательно большое (NB)».
Для нахождения функции принадлежности j(y,uj), характеризующей j-е нечеткое правило
нечеткого условного логического вывода, предложено несколько формул, среди которых
наибольшее распространение получило Правило импликации Мамдани:
j(y,uj) = min{j(y),l(uj)} (4.13)
где у – вектор входных переменных УУ; l(uj)-ФП, характеризующая l-е лингвистическое
значение управляющего воздействия u в j-м правиле, для которого j(y,uj) задана на декартовом
пересечении множеств Y U.
Выражение (4.13) получено из гипотезы, согласно которой следствие каждого правила
имеет истинностное значение, не меньшее, чем соответствующая предпосылка. Формулу
совместной ФП (4.13), соответствующую конкретному правилу «ЕСЛИ…ТО…» называют
оператором импликации.

148
Результирующая функция принадлежности р(u), которая характеризует всю совокупность
j правил, соединенных между собой союзом ИЛИ, определяется как максимум среди всех функций
(4.13) при заданных у:
р(y,u)= p(u) = max {j(y,uj)}, j=1,2,…,n (4.14)

Процедура объединения всех правил называется инференц-процедурой.


Заключительная процедура синтеза УУ по фаззи – технологии – дефазификация – сводится
к определению точного значения управляющего воздействия u*. Она выполняется чаще всего по
методу центра площади, согласно которому для непрерывной функции р(u) искомое значение
управляющего воздействия определяется как центр площади фигуры, образованной этой
функцией и осью абсцисс u:

 u   * (u)du
p
u*  
(4.15)
  * (u)du

p

В фаззи – технологии известны формы записи правил (4.12), у которых в правой части ТО
указывается не лингвистическое значение управляющего воздействия (например u =PB), а его
конкретное, четкое значение (например, u=u*).
Так, По методологии Сугено и Такаги j-е правило логического вывода записывается в
виде:

« ЕСЛИ у1 = Аj1 И,…, И, yk =Ajk, ТО uj*=cj0+ cj1+…+ cjk (4.16)

где Aj1,…,Ajk – фаззи – множества типа NB, NS и т.п. cjk – постоянные четкие значения
управляющего воздействия, заданные в виде синглтонов, т.е. в виде пар [uj,(uj)=1]. Выражение
(4.16) называют моделью Сугено нулевого порядка:
149
« ЕСЛИ у1 = Аj1 И,…, И, yk =Ajk, ТО uj*=cj0+ cj1y1*+…+ cjky*jk (4.17)

где yi* - четкие измеренные значения выходной переменной ОУ.


Объединение составных частей посылок в (4.16) и (4.17) осуществляют так же, как и в
методе Мамдани, с помощью процедур максимизации (4.9) и минимизации (4.10)
соответствующих ФП. Агрегирование всех n j-x правил, соединенных между собой союзом ИЛИ,
происходит аналогично, по выражению (4.9). Однако, процедура импликации и инференц-
процедура, выполняемые в методе Мамдани по формулам (4.130 и (4.14), здесь в явном виде
отсутствуют. Максимальные и минимальные значения ФП j(y), характеризующих посылки
правил, умножаются на соответствующие синглтоны управляющего воздействия.
Результирующее значение управляющего воздействия, соответствующее всем n правилам,
определяется по следующей формуле Сутено:
n


j 1
j
( y ) u *j
u*  n (4.18)
 j 1
j
( y)

Таким образом, сложная процедура дефазификации в чистом виде, например по формуле


(4.15), в методе Сугено-Такаги отсутствует.

Пример 4.2. Провести процедуры фазификации, фаззи-импликации и дефазификации для объекта,


в котором входные переменные 1 и 2 характеризуются упрощенными функциями
принадлежности (рис.4.7 ), а некоторый алгоритм нечеткого управления представлен
следующими правилами:

150
«ЕСЛИ 1 = NB и 2 = PB, ТО u=PB»
«ЕСЛИ 1 = NB и 2 = ZR, ТО u=ZR»
«ЕСЛИ 1 = ZR и 2 = PB, ТО u=PB» (4.19)
«ЕСЛИ 1 = ZR и 2 = PB, ТО u=PB»
«ЕСЛИ 1 = ZR и 2 = ZR, ТО u=ZR»

Решение. Пусть входные переменные имеют конкретные значения


1* и 2* (рис.4.7). Тогда, согласно выражениям (4.7) и (4.10), посылки правил (4.19), содержащих союз И,
дают следующие значения функций принадлежности соответствующих фаззи - пересечений:

Рис.4.7. Функции принадлежности ошибок регулирования

151
1(1,2) = min {NB(1*), PB(2*)} = min {0.7;0.4} = 0.4
2(1,2) = min {NB(1*), ZR(2*)} = min {0.7;0.6} = 0.6
3(1,2) = min {ZR(1*), PB(2*)} = min {0.3;0.4} = 0.3
Четвертая посылка правила (4.19) содержит союз ИЛИ, поэтому функция принадлежности
фаззи – объединения
4(1,2) = max {ZR(1*), ZR(2*)} = max {0.3;0.6} = 0.6
Теперь можно в соответствии с композиционным правилом Мамдани (4.13) определить
результирующие функции принадлежности, характеризующие импликации (4.19):
1 = min {1(1, 2), PB(u)};
2 = min {2(1, 2), ZR(u)};
3 = min {3(1, 2), PB(u)};

4 = min {4I(1, 2), ZR(u)};


где j(u) – функции принадлежности, характеризующие фаззи – множества управляющих
воздействий u (рис.4.8). Выполняя для рассматриваемого примера последнюю процедуру
фазификации (инференц - процедуру) – фаззи – объединение функций 1- 4 в соответствии с
выражением (4.14) – получаем результирующую функцию принадлежности *р(u), показанную на
рис. 4.8 жирной линией. Результирующее значение управляющего воздействия u* находят,
выполняя процедуру дефазификации по выражению (4.15). На рис.4.9 показана общая схема
фаззи – регулятора, реализующего все рассмотренные процедуры.

152
Рис.4.8. Фаззи - объединение управляющих воздействий

К настоящему времени фаззи-системы управления применяются в самых разнообразных отраслях

153
науки и техники. Первая нечеткая система регулирования была испытана сотрудником
б

1*

2*

Лондонского университета Г. Мамдани в начале 70-х годов. Через 10 лет была разработана первая
промышленная система для управления вращающейся цементной печью. С 1985 года в Японии
было выполнено ряд работ по применению систем управления промышленными объектами на
базе систем нечеткого управления. Этот опыт изложен коллективом японских авторов в

154
монографии « Прикладные нечеткие системы» В монографии рассмотрены применения нечетких
множеств для решения следующих задач:
 Управление доменной печью
 Управление холодной прокаткой металлов
 Управление скоростью движения автомобиля
 Вождение поездов
 Распознавание речи и распознавание образов
 Составление оптимального расписания движения автобусов
 Медицинская диагностика
И еще целый ряд практически важных задач.

155
Раздел 5. Предсказывающие системы управления.
Как мы уже отмечали ранее, предсказывающие системы управления относятся к
разомкнутым системам управления и реализуют управление по возмущению. Замкнутые системы
управления по отклонению, работающие с использованием обратной связи, получили наибольшее
распространение во всех отраслях. Однако они не могут быть успешно использоваться для
управления объектов с распределенными параметрами, которые характеризуются большими
временами запаздывания. Такие объекты, как кожухотрубчатые теплообменники, колонны
разделения, в которых управляемой величиной является состав выходной смеси, трубчатые и
колонные реакторы, работающие в вытеснительном режиме, все они относятся к объектам с
распределенными параметрами, и имеют большое время запаздывания практически по всем
каналам управления.
Для управления такого типа объектами необходимо использовать управление с предварением,
которое на основе анализа входных переменных объекта и точного знания порядка
преобразования входных переменных в выходные, может вырабатывать управляющее
воздействие, обеспечивающее поддержание управляемой величины (критерия эффективности)
системы на заданном уровне.
Для управления такого типа объектами используют системы управления по возмущению.
Простейшая схема такой разомкнутой системы регулирования приведена на рис.5.1.а.

156
xy xp x
W p (p) W об (p)

а)

W в.к. (р) W ов.k (р)

xy xp x
Wp(p)

W об (р)
W в.к. (р)
W ов.k (р)
xy xp x
Wp(p)
W об (р)
Рис.5.1.Cтруктурные схемы разомкнутых систем
регулирования

В этой схеме отсутствует обратная связь, образующая замкнутый на себя контур передачи
воздействий, и не имеется условий для появления неустойчивой работы. В связи с этим
появляется значительно большая свобода выбора для выбора параметров регулятора, чем в
замкнутых системах регулирования. Изображение регулируемой величины в разомкнутой системе
регулирования, представленной на рис.5.1.а,определяется формулой:
X(p)=Wp(p)Wоб(р)Ху(р) (5.1)
где Wp(p) иWоб(р) - передаточные функции регулятора и объекта относительно регулирующего
воздействия.
Поэтому, если передаточную функцию регулятора выбрать равной обратной передаточной
функции объекта

157
1
W p ( p)  (5.2)
W об ( p)
то будет выполнено тождество:
х=ху (5.3)
т.е. регулируемая величина будет точно следовать за изменением управляющего воздействия.
Таким образом, идеальный регулятор должен иметь передаточную функцию, обратную
передаточной функции объекта. В этом случае, при полном знании характеристик объекта, мы
могли построить идеальную систему управления по возмущению. Основным недостатком
разомкнутых систем регулирования является возможность самопроизвольного отклонения
регулируемой величины от заданного значения в результате воздействия на объект внешних
возмущений. Радикальным путем устранения этого недостатка является переход к замкнутой
системе с отрицательной обратной связью. Однако, как уже было сказано выше, для объектов с
запаздыванием такое регулирование не улучшает качество управления. Имеется и другой путь
решения этой задачи, который заключается в применении принципа регулирования по
возмущениям. Структурная схема системы регулирования, работающей по этому принципу,
приведена на рис.5.1,б. В этой системе дополнительный регулятор на основании измерения
возмущения оказывает на регулируемый объект регулирующее воздействие, с тем, чтобы не
допускать отклонения регулируемой величины.
Изображение отклонения регулируемой величины, вызванное k-м возмущающим
воздействием хв.k определяется следующей формулой:

Х(р)=[Wов.k(p)-Wвk(p)Wоб(р)]Xвk(p) (5.4)
где - Wов.k(p) – передаточная функция регулируемого объекта относительно
возмущающего воздействия.
Wвk(p) – передаточная функция регулятора, работающего по
158
возмущению.
Wоб(р) – передаточная функция объекта управления.
Из этой формулы следует, что если передаточную функцию регулятора выбрать из
условия:

Wов.k(p)-Wвk(p)Wоб(р)=0 (5.5)
т.е.

W oв.k ( p)
W вk ( p )  (5.6)
W об ( p)
то
х=0 (5.7)
и регулируемая величина совершенно не будет реагировать на возмущение х вk и будет
инвариантна относительно этого возмущения. Рассмотренная система работает на принципе
компенсации возмущений, не имеет замкнутых контуров передачи воздействий и поэтому выбор
параметров регулятора в такой схеме не лимитируется вопросами устойчивости работы.
Другой вариант структурной схемы с компенсацией возмущений приведен на рис. 5.1,в.
Здесь выходная величина регулятора по возмущению подается на вход регулятора, реагирующего
на управляющее воздействие совместно с этим регулятором. Изображение отклонения
регулируемой величины в этой системе, вызванного возмущением х вk, определяется формулой:
Х(р)=[Wов.k(p)-Wвk(p) Wр(р)Wоб(р)]Xвk(p) (5.8).
Если передаточную функцию устройства ввода воздействия от возмущения выбрать в
соответствии с формулой:

159
W ( p)
W вk ( p)  oв . k

W p ( p)W об ( p)
(5.9)

то система будет инвариантна по отношению к возмущению х в.k.


Учитывая также формулу (5.2) для оптимальной передаточной функции регулятора, которая
обеспечивает идеальное воспроизведение управляющего сигнала, получаем, что
Wвk(p)=Wов k(p) (5.10)
т.е. устройство ввода воздействия от возмущения должно моделировать передаточную функцию
регулируемого объекта по отношению к прохождению этого возмущения в объекте. Таким
образом, используя рассмотренные подходы, можно построить систему управления, точно
компенсирующую возмущения, не содержащую отрицательной обратной связи и связанной с ней
проблемы устойчивости. Однако во всех случаях введения компенсирующих воздействий по
возмущению необходимо знание точной модели объекта, позволяющей построить его
передаточные функции по различным каналам, в том числе по возмущающим воздействиям.
Поэтому проблема построения предсказывающих систем управления тесно связана с проблемой
построения модели объекта и ее идентификации в процессе функционирования объекта
управления. На рис. 5.2 приведена обобщенная структурная схема предикативной системы
управления, обеспечивающая выработку оптимальных управляющих воздействий при
поступлении различных возмущений на вход объекта.
Входные переменные объекта проходят через устройство АВ – анализатор возмущений, с
которого характеристики вектора водных переменных и характеристики возмущений поступают в
вычислительное устройство ВУ. И в устройство идентификации модели ИД. Выходные
переменные объекта поступают в анализатор выходных переменных состояния АС и результаты
анализа поступают в устройство идентификации модели ИД. В это же устройство поступает
информация о текущем значении вектора управляющих воздействий. В устройстве

160
идентификации модели ИД производится решение обратной задачи и уточняются коэффициенты
модели. При этом обязательно учитывается время запаздывания объекта, с тем чтобы каждому
выходному состоянию объекта поставить в соответствие именно то значение вектора входных
переменных и вектора управления, которое соответствует данному значению выходных
переменных с учетом времени запаздывания объекта. Это очень важная особенность процесса
идентификации. Фактическое время запаздывания определяется, либо с использованием
результатов пассивного эксперимента по данным корреляционного анализа получаемых
характеристик выходных и входных переменных, либо с применением метода активного
эксперимента. В этом случае на вход объекта наносятся специальным образом спланированные
возмущения и можно проследить за их проявлением в характеристиках выходных переменных и
определить, таким образом, точное значение времени запаздывания по различным каналам. После
идентификации модель передается в вычислительное устройство, в котором определяются
оптимальные значения управляющих воздействий, соответствующих данному, текущему
значению входных переменных. Такая схема управления в настоящее время широко применяется
для управления сложными и ответственными объектами, характеризующимися разнообразным
характером возмущения входных переменных. Такая система управления в американской
литературе называется «система управления с быстрой моделью». При этом предполагается, что
процедура идентификации модели и получение оптимального управления использование модели
объекта, занимает гораздо меньше времени, чем протекание процесса в реальном объекте. На
основании опыта функционировании такой системы, устанавливаются те отклонения от
результатов предсказания модели, после которых необходимо делать процедуру идентификации,
Это позволяет проводить процедуру идентификации модели не так часто и за счет этого повысить
быстродействие системы управления.

161
ОУ – объект управления.
УУ - устройство управления
АВ – анализатор входа
АС – анализатор выходных переменных объекта управления
ИДМ – устройство идентификации модели
ВУ – вычислительное устройство для вычисления оптимального управления
объектом

Литература
Основная
162
1. А.И. Бояринов, В.В. Кафаров. Методы оптимизации в химической
промышленности, «Химия», 1985
2. В.В. Кафаров Химическая кибернетика, «Химия», 1995
3. Е.Б. Андреев, В.Е. Попадько. Программные средства систем
управления технологическими процессами в нефтяной и газовой
промышленности, Учебное пособие. М., ФГУП Изд-во «Нефть и газ»
РГУ нефти и газа им. И.М. Губкина, 2005. 268 с.
4. А.С. Гринин, Н.А. Орехов, В.Н. Новиков, Математическое моделирование в
экологии, Учеб. Пособие для вузов.М., ЮНИТИ-ДАНА, 2003 г.
Дополнительпая
1. А.В. Беспалов, Н.И. Харитонов, Задачник по системам управления химико-
технологическими процессами. Учебное пособие для вузов М., ИКЦ
«Академкнига», 2005 г
2. Е.А. Дубовик, А.Е. Дубовик, Численные методы и алгоритмы диспетчеризации
вычислений с динамически изменяющимися приоритетами. М., СИНТЕГ, 2006,
120 с. (Серия «Информационные технологии)

163
2ЭР

164