Вы находитесь на странице: 1из 19

Математические модели.

Переменные состояния
(фазовые координаты)
управляемого процесса
Теория оптимальных процессов имеет дело с математическими
моделями (ММ) технических или экономических задач оптимизации
процесса управления физическими системами. ММ есть
достаточно полная сводка функциональных соотношений,
описывающих основные свойства физических объектов, процессы
их функционирования и управления в рамках выбранной степени
приближения и детализации и отражающая все существенные
требования к конкретным техническим характеристикам системы.
Математическая модель задачи оптимизации процесса управления
состоит из ряда частных математических моделей, включая ММ
управляемого процесса, математическая модель ограничений на
величины управляющих воздействий и на возможное расположение
на траектории, математическое описание показателя
эффективности (критерия качества) процесса управления и т.д.
Математическая задача оптимизации процесса управления
считается полностью определенной (корректно поставленной), если
точно описаны все элементы ММ
ММ управляемого процесса основывается на понятии переменных состояния (фазовых
координат), которые вводятся в задачу следующим образом.
Пусть управляемая система S может быть идеализирована настолько, что в каждый
фиксированный момент времени наблюдения t = t′ на интервале T = {t, t0 ≤ t ≤ t1}, t′∈T
ее свойства могут быть описаны конечным множеством действительных чисел
x1(t′), x2 (t′), ..., xn (t′) , которые рассматриваются как компоненты некоторого вектора
x(t’)= (x1(t’), x2 (t’), ..., xn (t’))T .
При изменении момента времени наблюдения, вообще говоря, изменяется и вектор х.
Это изменение может быть вызвано приложенными к объекту воздействиями. Если и при t
> t′ свойства системы по-прежнему полностью описываются вектором
x(t’= (x1(t), x2 (t), ..., xn (t’)T .
и если n – наименьшее количество величин xi (t′) , с помощью которых оказывается
возможным предсказать значение x(t) при всех t > t′ по известным значениям x(t′) и
известным на Т значениям приложенных воздействий, то вектор x(t) называется вектором
состояния (детерминированной) системы S в момент t (или вектором фазовых
координат).
Величины xi называются компонентами вектора состояния, или фазовыми
координатами.
Множество всех возможных состояний T x = (x1(t),K, xn (t)) в различные моменты времени
t ∈T образуют n-мерное пространство состояний Xn ⊂ Rn (n – мерное фазовое
пространство), точка xn∈ Xn является изображающей точкой этого пространства.
Первым шагом к построению математической модели системы
является математическое описание того, что система получает на входе и
выдает на выходе.
Величины, определяющие внешние воздействия на систему,
называются ее входными сигналами.
Величины, определяющие действие системы на окружающую среду,
называются выходными сигналами системы.
Кроме входных и выходных сигналов, для построения математической
модели вводятся вспомогательные величины, характеризующие
внутреннее состояние системы в каждый момент времени. Такие величины
называются переменными состояния системы.

Множество всех возможных входных сигналов системы будем


называть ее пространством входных сигналов.
Множество всех выходных сигналов – пространством выходных
сигналов.
Множество всех возможных состояний системы будем называть ее
пространством состояний.
Математическая модель системы

После определения входных и выходных сигналов и переменных состояний


системы для получения ее математической модели нужно установить
соотношения между этими величинами. Эти соотношения могут быть
относительно простыми или весьма сложными, носить детерминированный
или вероятностный характер.
Математической моделью системы называется совокупность четырех
элементов:
1) пространство состояний;
2) пространство входных сигналов;
3) пространство выходных сигналов;
4) соотношения, связывающие входные и выходные сигналы и переменные
состояния.
Этапы построения и элементы математической
модели задачи оптимизации процесса управления
для детерминированных систем с
сосредоточенными параметрами и непрерывным
Этап Содержание этапа временем
Элементы ММ Примечания
I Неформальное описание задачи и Формулировка Подготавливают
ее анализ; выбор и обоснование рассмотренного случая данные, на основе
степени точности и детализации или узкой задачи которых в дальнейшем
описания системы физическими исследования в строится ММ и
теориями. Физическая постановка содержательных формулируются
задачи терминах. Установление специфические
физических законов, допущения,
которым подчиняются позволяющие
различные объекты задач использовать
математические
допущения
Этап Содержание этапа Элементы ММ Примечания

II Формирование ММ. Вектор состояния На базе I этапа


Математическая (фазовых координат) Выбор фазовых
постановка задачи Выбор и X=( x1, x2, x3,… xn) T координат для
перечисление переменных x∈ X ⊂ Rn , dim( x) = n конкретной задачи не
состояния (фазовых размерность фазового является единственным
координат), области их пространства. (например, он зависит
определения и интервала Область определения x: от выбора системы
времени, на котором Xn, координат)
целесообразно отрезок времени
рассматривать T = {t, t0 ≤ t ≤ t1}
управляемый процесс.
Выбор системы (или
систем) координат, в
которых целесообразно
рассматривать процессы
движения и управления
Этап Содержание этапа Элементы ММ Примечания

II Установление общих ДУ движения Здесь y – вектор пока


законов, которым неопределенных
подчиняется эволюция элементов в правой части
состояния уравнений движения.
f=(f1, f2, ….fn)T
рассматриваемой системы. область определения f: Вектор неопределенных
Оценка области их t ∈T, x∈ X n , y∈Y m1 . элементов y либо
применимости (области становится управлением u,
определения). Управляющие переменные либо известной функцией
Выбор и перечисление u = (u1 , u2 , ..., um)T , (t, x), либо управляющим
управляющих переменных параметром а.
к области их определения, Управляющие (проектные) В стохастических задачах
параметры a = (a1, a2 , ..., an )
а также управляющих w – случайные функции.
параметров и возмущений. Иногда ограничения
возмущение
Анализ технических Ws = (w1 ,w2, …. ws)T представляют в виде:
ограничений на значение u∈Um ; x∈ X n ; a∈ Ar ,
управляющих где U m, X n , Ar –
воздействий, фазовые Ограничения типа равенств замкнутые ограничения
координаты и области
управляющие параметры. Ограничения типа неравенств.
Этап Содержание этапа Элементы ММ Примечания

II Выбор функциональных Обычно u(t) – кусочно-


классов для управлений и непрерывные
траекторий. Определение ограничения функции
допустимых траекторий, времени t,
управлений и управляющих x(t) – непрерывные
параметров. кусочно-гладкие
функции времени.
Формулировка начальных и Условие типа , Формируются также
граничных условий (цели g (t0, t1, x(t0), x(t1), a)= свободные граничные
эволюции системы). = (g1, g2,...gl)T =0 условия
l≤2n+2+r
Этап Содержание этапа Элементы ММ Примечания

Выбор показателя оценки Различного рода


качества управления, функционалы J[u,a] ,
направленного на определение на решениях
достижение поставленной системы
цели.
max J[u]
Выбор вычислительного
оператора (max, min, max min J[u]
min, min max, …),
применение
которого к показателю
min max J[u]
качества является
математическим min max J[u,w]
выражением технического
понимания оптимальности
системы. Фиксация
аргументов этого оператора
(u, a, t и т.д.).
Формулировка задач
оптимизации
Этап Содержание этапа Элементы ММ Примечания

III Корректировка Число переменных, вид Аналитические трудности,


технической постановки уравнений, критерий, изучение
задачи. граничные условия и т.д.
сформулированной
модели могут заставить
пойти на дальнейшие
упрощения.
Эквивалент Переход к новым фазовым В частности,
преобразования ММ для и (или) управляющим использование методов
удобства изменения переменным, граничным штрафных функций,
аналитических численных условиям и т.д. редукции к более простым
методов решения задач задачам и т.д.
оптимизации.
Изменение ММ для Производится на базе
удобства вычислений. содержательной (этап I) и
Формулировка понятий математической (этап II)
«практически формулировок задач
оптимальной системы»,
«практической точности
получения результата» в
конкретной задаче
Система S называется управляемой на отрезке (одно из определений
управляемости) [t0 , t1] , если ее поведение при t > t0 зависит только от
начального состояния (t = t0 , x0 = x(t0 )) , будущего поведения некоторого
переменного вектора u (входа системы)
u = (u1, …., um )T , m ≥ 1
называемого управляющим вектором (или просто управлением) u, и
постоянного вектора a :
a= (a1, …., a r)T ,r ≥ 0
называемого вектором управляющих (проектных) параметров.
Вектор u принимает значение из некоторого множества U m m-мерного
пространства Rm с координатами u1, u2 , ..., um .
Это множество может быть всем пространством Rm или его частью U m ⊂
Rm . Um – чаще всего компактное множество пространства Rm .
Множество Um m называется множеством допустимых значений
управления. Постоянный вектор a обычно принадлежит некоторому
замкнутому множеству Ar ⊂ Rr .
Изменение состояния (эволюция) системы S на временном интервале
T = {t, t0 ≤ t ≤ t1} часто с хорошей степенью приближения описывается
системой обыкновенных дифференциальных уравнений первого порядка:

(1)
где
x = (x1, x2 ,..., xn ) T – вектор состояния;
u = (u1,u2 ,...,um ) T– управляющий вектор;
a = (a1, a2 ,...,ar ) T – вектор проектных параметров.
Система (1) образует существенную часть математической модели
динамической системы S.
В ММ, описываемой системой ДУ, формальным признаком переменной

состояния x является наличие ее производной в левой части системы


(1).

Управляющая переменная u входит только в правую часть системы (1) и не


встречается под знаком производной (это формальный признак
управляющей переменной).
Предполагается, что вектор-функция f(t, x, u, a) определена
для любых значений x∈ Xn , u∈Um, a∈ Ar , t ∈T ,
непрерывна по совокупности переменных t, x, u, a и
непрерывно дифференцируема по x, a. Хотя гладкость
является достаточно жестким требованием и может быть
заменена требованием измеримости и ограниченности. Так как
поведение вектора u может быть произвольным (за
исключением условия u∈Um ) и, кроме того, можно
произвольно выбрать постоянный вектор a∈ Ar , то система
уравнений (1) определяет управляемый процесс. Ход
управляемого процесса будет определен на некотором
интервале t0 ≤ t ≤ t1 , если на этом интервале вектор u задан в
одной из двух форм:
u = u(t) = (u1(t), u2 (t), ..., um (t)) T
u = v(x,t) = (v1(x,t), v2 (x,t), ..., vm (x,t)) T
Вектор-функцию u(t) называют программным (временным)
управлением, а вектор-функцию v(x, t) – координатным
управлением или законом управления. Закон управления
физически выражает известный принцип обратной связи,
согласно которому величина управляющего воздействия
определяется на основании измерения текущего состояния
системы x и, быть может, момента времени t.
Каждому выбору векторов управляющих параметров a и
управления u и каждому начальному состоянию
(t0 , x0 ) соответствует по (1) временная последовательность
состояний x(t, x0 , t0 ) , которая называется фазовой
траекторией (поведением, эволюцией, движением) системы S.
Пара вектор-функций {u(t), x(t)} или {v(x, t), x(t)} называется
процессом управления или режимом.
Функционал. Критерий качества управления

Величина J[u(t)] называется функционалом функции u(t) на отрезке t0 ≤ t ≤


t1 , если каждой функции u(t), t ∈[t0 , t1] , принадлежащей некоторому классу
функций, поставлено в соответствие определенное число

Таким образом, функционал J[u(t)] – это отображение, в котором роль


независимого переменного (функционального аргумента) играет функция
u(t). При этом J[u(t)] зависит от совокупности всех значений, принимаемых
функцией u(t) на отрезке [t0 , t1] , и может рассматриваться как функция
бесконечного числа независимых переменных.

Для каждого фиксированного конечного момента времени t1 = t1′ состояние


x(t1′) системы S, движущейся из начального состояния (t0 , x0 ) в соответствии
с уравнением (1), является одновременно векторным функционалом (т.е.
вектором, компонентами которого являются функционалы) от управления
u(t) и вектор-функцией от вектора a и вектора начальных условий x0 (t0 ) .
Критерии качества процессов управления являются функционалами.
Рассмотрим некоторые показатели или критерии качества
управления.
Предположим, что некоторый объект управления необходимо
перевести из исходного состояния в заданное состояние с
помощью какого-либо управления . Обычно существует
множество управлений , обеспечивающих выполнение задачи.
Показатель качества предназначен для сравнения всех
возможных управлений между собой и выбора наилучшего или
оптимального управления , минимизирующего этот показатель.
Одним из показателей может служить время достижения
цели. Наилучшим или оптимальным будет управление ,
соответствующее минимальному . В этом случае говорят об
оптимальных по быстродействию системах.
В других задачах величина соответствует расходу
топлива на перемещение объекта. Такие задачи характерны,
например, для управления ракетами. В этом случае из множества
допустимых управлений желательно выбрать такое, которое
обеспечивает .
Часто требуется обеспечить равенство выходного сигнала
системы заданной величине .
В этом случае все критерии качества, как правило, основаны на
величине рассогласования между заданным и
действительным состоянием системы.
Например, или .
Такие системы называются системами слежения. В частном
случае, когда – системами стабилизации.
В системах слежения управляющее
воздействие формируется на основании измерения величины
ошибки . При этом системы приобретают замкнутую структуру,
включающую объект управления, измеритель рассогласования и
устройство управления.
Принцип динамического программирования Беллмана

В основе метода динамического программирования лежит


принцип оптимальности, сформулированный Р. Беллманом (1960 г.)
«Оптимальные стратегии управления обладают тем свойством,
что каково бы ни было начальное состояние системы и управление в
начальный момент, последующее управление должно быть
оптимальным в смысле заданного критерия относительно любого
другого состояния, которое могло бы явиться естественным
следствием управления в начальный момент».
Этот принцип для динамических систем может быть
сформулирован короче: конечный отрезок оптимальной траектории
есть тоже оптимальная траектория.