Вы находитесь на странице: 1из 58

Министерство транспорта Российской Федерации

Филиал ФГБОУ ВО «Государственный морской университет


имени адмирала Ф.Ф. Ушакова»
в г. Севастополь

Кафедра «Судовождение»

РЕФЕРАТ
по дисциплине
«Информационные технологии в профессиональной деятельности»
На тему
«Принципы ситуационного управления»

Выполнил:
Курсант: Строкань С.С.
Проверил:
Селезень Я.Ю.

СЕВАСТОПОЛЬ
2020
1 ГЛАВА
Принципы ситуационного управления

У народов обыкновенно много слов для


обозначения того, что их больше всего интересует.
Э. Ренан
§1.1. Традиционная схема управления
Традиционная теория автоматического управления техническими
объектами, выросшая на существовавшей ранее теории автоматического
регулирования, имеет дело с такими объектами, для которых процедура
управления в самом общем виде представляется так, как показано на рис. 1.1.

Рисунок 1.1

На управляемый объект воздействуют входов, причем значение

входов можно оценить в каждый момент времени, а для входов такая


возможность отсутствует. Чаще всего это происходит из-за отсутствия

необходимых датчиков. Но бывает, что измерение входов физически

невозможно или слишком дорого обходится. В идеальном случае входов


нет. Объект имеет выходов. Предполагается, что между входным
вектором и выходным есть некоторая связь . Эта связь
может иметь самые разные характеры: она может быть функциональной,
статистической, в виде неоднозначного отображения и т. п. Важно лишь то,
что изменения в и как-то сказываются на значениях . Значения
небезразличны некоторому лицу, которое мы в дальнейшем будем условно
называть лицо, принимающие е решение (ЛПР), как принято в современной
теории исследования операций. Для ЛПР важно добиться получения
определенных значений при любых значениях и . На векторы и
оно влиять не может. Поэтому оно строит систему управления так, чтобы
получить от объекта интересующие его значения . Это делается с помощью
специальных управляющих воздействий подаваемых от системы
управления на объект. Подобно векторам и , значения вектора
воздействий влияют на значения вектора . Другими словами, вместо

соотношения возникает соотношение Задача ЛПР


— сделать систему управления такой, чтобы при наличии информации о
текущих значениях (информация о значениях системе управления,
естественно, недоступна) добиться таких значений , которые устраивают
ЛПР. Это означает, что система управления реализует некоторую

зависимость вида ,с помощью которой она находит необходимые


управляющие воздействия на объект.
Если ЛПР не удовлетворено своим детищем, то оно может внести
коррективы в его функционирование. На рис. 1.1 эта возможность показана в
виде подачи на систему управления корректирующего вектора . Если же
коррекция не приводит к цели или невозможна, то ЛПР может сменить
систему управления.
Не будем вдаваться в дальнейшее рассмотрение приведенной схемы.
Для нас важно следующее: для того чтобы ЛПР смогло построить
удовлетворяющую его систему управления, оно должно знать две вещи:
множество предпочтительных векторов и как задано отображение .

Отображение описывает функционирование объекта управления, а знание


предпочтительных значений и говорит о понимании цели его
функционирования. Итак, ЛПР необходимо знать описание объекта (т. е. его
структуры и функционирования), которым он собирается управлять, и цели
существования этого объекта. Зная это, он может сформулировать критерий
управления, в котором воплощаются требования к системе управления.
Отображение на рис. 1.1 воплощает в себе критерий управления объектом.
Он может быть различным: максимизация или минимизация каких-то
значений вектора , их поддержание в некоторых заданных пределах,
недопущение некоторых комбинаций этих значений или запрещение
появления определенных временных последовательностей значений вектора
и т. п. Но именно наличие критерия управления позволяет ЛПР ставить и
решать традиционную задачу управления объектом.
Так возникает цепочка: описание объекта управления — описание
целей существования объекта управления — формирование критерия
управления им — проектирование и создание системы управления.
Следовало бы ожидать, что теория управления уделит одинаковое внимание
всем элементам цепочки. Однако исторически этого не произошло. Как
правило, специалисты в области управления прилагали усилия лишь к поиску
процедуры управления объектом, когда и сам объект, и критерий управления
им были уже описаны в точных терминах. Оптимизация управления была
центральной проблемой традиционной теории автоматического управления.
И лишь на последнем этапе ее развития внимание специалистов
переместилось на проблему идентификации объекта управления и на
проблему выявления критериев управления им.
Но здесь возник ряд трудностей, связанных с тем, что объектами
управления стали системы, для которых привычные, наработанные
десятилетиями приемы оказались неприменимыми. Какова же была их
природа?

§ 1.2. Нетрадиционные объекты управления


Их называют по-разному: плохо определенные или слабострук-
турированные, организационные или обладающие «свободой воли». Но
независимо от названия эти новые объекты обладают рядом неожиданных
для традиционного управленца свойств, отличающих их от привычных
объектов прошлого. Перечислим основные их свойства.
1. Уникальность. Каждый объект обладает такой структурой и
функционирует так, что система управления им должна строиться с учетом
всех его качеств и к нему нельзя применить какую-либо типовую
стандартную процедуру управления. Если, например, удалось
спроектировать систему управления движением для автомобиля ВАЗ 2103, то
она пригодна для любого конкретного автомобиля такой модели. Если же
спроектирована система управления для министерства здравоохранения
некоторой союзной республики, то ее нельзя перенести без изменений для
того же министерства другой республики. При переносе надо учесть все
индивидуальные особенности нового объекта управления. Это
обстоятельство резко удорожает процедуру построения системы управления,
ибо фактически нужно создавать столько систем управления, сколько
объектов мы хотим автоматизировать.
2. Отсутствие формализуемой цели существования. Для старых,
привычных для теории автоматического управления объектов всегда было
ясно, зачем был создан тот объект, управление которым мы строим. Как
правило, управленцы имели дело с объектами искусственного
происхождения, созданными людьми для достижения понятных им целей.
Станок должен был производить определенную обработку заготовок,
самолет должен был перевозить по воздуху пассажиров и грузы. Но не для
всех объектов (даже созданных человеком) можно так же четко
сформулировать цель их существования. Сейчас, когда мы хотим управлять
городами, отраслями народного хозяйства, регионами, экосистемами, мы
попадаем в весьма затруднительное положение при попытке четко
сформулировать цель существования этих объектов. Даже созданные
людьми, они возникли не по чьему-то плану, для решения какой-то
конкретной задачи, а развились постепенно в силу определенных социально-
экономических и исторических причин. Каковы, например, цели
существования сверхгородов? Или для чего возникла экосистема Азово-
Черноморского бассейна? На такие вопросы практически невозможно
ответить.
А это приводит к весьма большим сложностям в формировании
критерия управления. Ибо критерий управления в традиционных системах
управления был теснейшим образом связан с целью существования объекта.
Критерий управления самолетом был основан на достижении им своей цели
существования — перевозки людей и грузов по воздуху, управления
производством синтетического каучука — на соображениях повышения
качества продукта. Именно поэтому в различных автоматизированных
системах управления, создаваемых для объектов нового класса, очень часто
можно наблюдать реализацию различных критериев управления.
3. Отсутствие оптимальности. Следствием того, о чем говорилось в
предшествующих двух пунктах, является неправомочность постановки для
объектов новой природы классической задачи оптимизации. Из-за отсутствия
цели существования (в рамках теории управления) для рассматриваемых
объектов нельзя построить объективный критерий управления. Критерий
управления становится субъективным, целиком зависящим от ЛПР.
Эту чрезвычайно важную для дальнейшего мысль можно
проиллюстрировать следующим примером, стоящим, правда, несколько в
стороне от собственно задачи управления. Пусть с помощью людей-
экспертов мы хотим измерить размер какого-либо предмета. Например,
длину автомашины ВАЗ 2105. Каждый специалист называет некоторое
число, которое, по его мнению, означает длину автомобиля. ЛПР ( которое
также может прикинуть длину автомобиля) анализирует показания
экспертов. Если находится эксперт, оценивающий длину автомобиля в 10 м
или в 50 см, то ЛПР вправе усомниться в его квалификации как эксперта.
Отбросив такие аномальные предложения, ЛПР может просуммировать
остальные числа и найти среднее арифметическое от полученного результата.
Такое усреднение как бы объективизирует результат. Если экспертов было
много и они обладали неплохим глазомером, то результат экспертизы будет
близок к истинной длине автомобиля.
Отметим две особенности описанной нами процедуры. Во-первых, если
экспертов уже много, то появление некоторого нового эксперта не внесет
особых изменений в результат, полученный ЛПР. Другими словами, такая
экспертиза обладает свойством устойчивости. Во-вторых, можно проверить
качество экспертизы, взяв какое-либо измерительное приспособление,
точность которого удовлетворяет ЛПР, и провести измерение. Та или иная
близость данных измерения к результату, полученному с помощью
экспертов, будет характеризовать качество экспертизы. А это позволяет
ставить, например, задачу оптимизации формирования коллектива экспертов
по их количеству или каким-либо социальным или физиологическим
особенностям.
Теперь рассмотрим пример другой экспертизы. Группа людей
заблудилась в пещере. После долгого блуждания они оказались на площадке,
с которой путь, приведший их на нее, разветвляется. Влево и вправо уходят
подземные коридоры. Требуется решить: куда идти? Руководитель группы
(ЛПР) устраивает опрос. Сторонники движения по левому коридору
высказывают свои соображения, их противники — другие. Для ЛПР доводы
тех и других не кажутся слишком убедительными, и оно проводит простое
голосование. Предположим, что большинство участников этой экспертизы
высказалось за движение по левому коридору. Группа пошла по нему. После
нескольких дней, ослабевшие от голода и жажды, они выбрались на
поверхность. И с тех пор ЛПР мучает вопрос: правильно ли оно приняло
решение?
Ясно, что ответа на этот вопрос нет. Он был бы, если бы группа прошла
и правым коридором. Возможно, что он сразу бы вывел их на поверхность,
но весьма вероятно, что они могли бы навсегда остаться под землей. Оценить
правильность выбора, его целесообразность, оптимальность в этом случае
можно, только имея план пещеры, а значит, «пройдя» по всем ее коридорам.
В отличие от ситуации с измерением длины автомобиля, здесь нет
возможности оценить качество принятого решения, если альтернативные
решения не проверялись. Кроме того, экспертиза второго типа не обладает
устойчивостью, характерной для предшествующего примера. Если бы после
принятия решения о движении по левому коридору подавляющим
большинством экспертов на площадку, где стоит группа, выбрался бы из
левого коридора человек, тоже блуждающий в поисках выхода, и сказал бы,
что этот путь ведет в тупик, то весь результат опроса рухнул бы. И
дальнейшее движение было бы продолжено по правому коридору.
Ситуация, аналогичная поиску пути в пещере, складывается весьма
часто. При решении о выборе тех или иных характеристик будущего изделия,
при принятии тех или иных решений по структуре и методам
функционирования автоматизированной системы управления, при всяком
«волевом» решении (хотя и подкрепленным рядом соображений самого ЛПР
и других экспертов) всегда возникает ситуация, описанная нами. Отсюда
следует, что в этих случаях невозможно говорить об оптимальности
получаемых решений. Нельзя, например, требовать, чтобы проектировщики
создали оптимальную АСУ отраслью или городом. Такая постановка
некорректна и неправомочна. Качество созданной системы для управления
объектами новой природы может оцениваться только субъективно самим
ЛПР или их коллективом. Поэтому здесь уместнее говорить о
целесообразности результата управления, а не об его оптимальности. Важно
только, чтобы ЛПР в нужных случаях не боялось принимать решения.
В одноактной пьесе Славомира Мрожека, которая называется
«Стриптиз», описана как раз такая ситуация, при которой одно из ЛПР
увиливает от принятия решений. Два человека, не знакомых между собой,
оказываются некоторым непостижимым для них образом перенесенными в
помещение, из которого имеется выход через открытую дверь. Им надо
принять решение: что делать?
Происходит следующий диалог:
Первый. Что такое свобода? Это возможность выбирать. Пока я
нахожусь здесь, я знаю, что могу выйти в эти двери, до тех пор я свободен.
Зато в тот момент, когда я встану и выйду отсюда, я тем самым произведу
выбор, т. е. ограничу возможность моего поведения и утрачу свободу. Я
стану рабом своего ухода.
Второй. Но, оставаясь на месте и никуда не выходя, вы тоже
производите выбор. Вы избираете сидение и невыход.
Первый. Неправда. Я сижу, но я могу выйти. Выйдя, я исключаю
возможность сидения.
4. Динамичность. В каком-то смысле объекты, с которыми сейчас
сталкивается теория управления, подобны живым системам. С течением
времени изменяется их структура и функционирование. Объекты как бы
эволюционируют во времени. На предприятии строят новые цеха, возникают
новые производства, меняется технология. Сеть ЭВМ растет, отдельные сети
начинают соединяться между собой, стремясь к общемировой сети обработки
данных. Меняется структура отрасли, города расширяют свои границы,
меняется их застройка, смещаются транспортные и людские потоки. И эта
динамичность должна быть учтена в системах управления подобными
объектами. Они поневоле должны быть адаптивными, готовыми к изменению
своего функционирования.
5. Неполнота описания. Как правило, никакой коллектив экспертов,
знающих объект управления, не в состоянии сразу же обеспечить
информацию, которой бы заведомо хватило для создания системы
управления объектом. Существует несколько причин, почему это
происходит. Описывая объект управления старого типа, управленец всегда
знал о тех допущениях, которые он принял, строя описание. Он мог
предполагать, что передаточная функция объекта имеет тот или иной вид,
что запаздывание не играет в его функционировании большой роли, что

влияние параметров незначительно и им можно пренебречь и т. п. И если


созданная им система управления оказывалась не слишком хорошей, то он
знал, от каких допущений надо отказываться. Но при работе с объектами
новой природы эти допущения нельзя сформулировать столь ясно и просто.
Управленец в этом случае почти целиком полагается на экспертов, знающих
объект управления. И тот или иной уровень допущений фактически
предлагают они. Но, не будучи специалистами по системам управления,
эксперты не могут оценить тот уровень полноты описания, который нужен
специалисту по управлению.
Ведь само описание, вычленение в нем тех или иных аспектов и
особенностей тесно связано с задачей управления. И это не всегда может
уловить человек, смотрящий на объект управления другими глазами —
глазами технолога. Проиллюстрирую свою мысль примером разговора двух
управленцев, двух превосходных летчиков Антуана де Сент Экзюпери и его
друга Гийоме. Гийоме объясняет своему коллеге, как летать над Испанией из
Франции в Африку: «Странный то был урок географии! Гийоме не
преподносил мне сведений об Испании, он дарил мне ее дружбу. Он не
говорил о водных бассейнах, о численности населения и поголовье скота. Он
говорил не о Гуадисе, но о трех апельсиновых деревьях, что растут на краю
поля неподалеку от Гуадиса. «Берегись, отметь их на карте...» И с того часа
эти три дерева занимали на моей карте больше места, чем Сьерра-Невада. Он
говорил не о Лорке, но о маленькой ферме возле Лорки. О жизни этой
фермы. О ее хозяине. И о хозяйке. И эта чета, затерявшаяся на земных
просторах за тысячу с лишним километров от нас, безмерно вырастала в
моих глазах. Их дом стоял на горном склоне, их окна светили издалека,
словно звезды,— подобно смотрителям маяка эти двое всегда были готовы
помочь людям своим огнем... Так понемногу Испания на моей карте, под
лампой Гийоме, становилась какой-то сказочной страной. Я отмечал
крестиками посадочные площадки и опасные ловушки. Отметил фермера на
горе и ручеек на лугу. Старательно нанес на карту пастушку с тридцатью
баранами...» («Планета людей»).
Это образец того, как один профессионал описывает объект другому
профессионалу. Тут важно все: о чем говорится, с каким уровнем
детализации, на каком языке. При работе управленца со сложным объектом
самые большие сложности возникают при контактах с технологами,
знающими данный объект. Несходство их взглядов на него иногда приводит
к полному непониманию друг друга, в результате чего возникает неполнота
описания, которым руководствуется проектировщик системы управления.
Другая немаловажная причина неполноты описания объекта —
незнание некоторых сторон функционирования его самим технологом.
Некоторые ситуации, никогда не встречавшиеся им ранее, естественно,
нельзя сообщить и проектировщику системы управления. Чаще всего это
всевозможные аварийные ситуации. Для иллюстрации возможных
последствий аварий вспомним катастрофу с энергетической системой США,
происшедшую несколько десятилетий назад. Развал системы возник по вине
системы управления. Автоматическое отключение линий и источников
энергии при перегрузках привело к тому, что значительная часть страны
лишилась электроэнергии, а это привело к огромным потерям. Другим
примером может служить система управления большой ЭВМ, ее
операционная система. Когда специалисты по ее проектированию в
шестидесятых годах создавали мультипрограммные операционные системы с
развитыми системами прерываний и приоритетов, то они вовсе не
рассчитывали на ситуации, в которых система управления блокировала бы
сама себя из-за невозможности выйти из прерываний. И в том, и в другом
случае управленцев подвела неполнота описания функционирования объекта

и влияния сигналов на это функционирование.


Третья причина неполноты описания — отсутствие у самого технолога
четкого понимания функционирования объекта. Выдавая управленцу
большое количество информации, он тем не менее не сообщает ему самой
главной, по которой сам принимает решение о функционировании объекта.
Делает он это не сознательно, ибо «самая главная информация» может
учитываться им только на уровне собственной интуиции.
Мне вспоминается следующий случай, свидетелем которого я был.
Всемирная организация здравоохранения (ВОЗ) распространила в ряде стран
истории болезни нескольких больных из скандинавских стран. И попросила
ведущих психиатров различных стран дать заочный диагноз заболевания на
основании историй болезни. В СССР последние были размножены и
разосланы значительному количеству специалистов. Через некоторое время
они собрались все вместе в Москве для обсуждения своих диагнозов. Была
составлена и вывешена для всеобщего обозрения сводная таблица, в которой
для всех больных были указаны диагнозы. Это была удивительная таблица!
Почти для каждого случая имелся разброс диагноза от «практически здоров»
до «заболевание в самой тяжелой форме». Авторы диагнозов выходили на
трибуну и обосновывали свою точку зрения. Самым интересным было то,
что, привлекая одни и те же данные из истории болезни, они приходили к
почти противоположным выводам. Например, из того, что больной отказался
входить в контакт с близкими и врачом, в одном случае следовал вывод о
стремлении к изоляции, неконтактности, а в другом — о вполне адекватной
данной ситуации форме поведения. Споры фактически прекратились после
выступления одной очень уважаемой пожилой специалистки в области
психиатрии. Она сказала, буквально, следующее: «Коллеги, о чем мы
спорим? Ведь мы все знаем, что как только к нам на прием придет пациент,
мы в первую же секунду определим — болен он или нет. Только мы не
можем сказать, как это у нас получается». И все согласились с выступавшей.
И, наконец, еще одна причина, приводящая к неполноте описания
сложных объектов. Эта причина состоит в том, что многие особенности
функционирования объекта, а иногда и его структуры не могут быть описаны
количественно. Они допускают лишь качественное, словесное описание.
Переход от качественных описаний к некоторым формальным
представлениям должен производиться управленцем, который не всегда в
состоянии решить такую сложную проблему.
6. Наличие свободы воли. Во многих объектах управления люди
являются элементами их структуры. Это так называемые организационные
системы. В отличие от всех других элементов, образующих объекты, люди
функционируют в нем с учетом своих личных интересов и целей. Их
интересы и цели могут значительно отличаться от того, что они должны
делать с точки зрения ЛПР. Их индивидуальное поведение практически
невозможно учесть при создании системы управления, и требуются
специальные приемы для нейтрализации их воздействия на
функционирование объекта управления. Иначе могут возникнуть ситуации
вроде той, которая описана в следующем анекдоте.
Некто , большой начальник, говорит подчиненным: «Я считаю, что
должность должен занять генерал в отставке в возрасте около 60 лет».
Один из подчиненных радостно восклицает, что он знает такого человека. Но
явно недоволен. «Идиот,— шепчет на ухо выступившему его сосед,— он
просто хочет посадить на это место своего приятеля».
Существует еще несколько особенностей объектов нового типа, с
которыми теория управления начала сталкиваться с конца пятидесятых годов
нашего столетия. Но и сказанного, по-видимому, вполне достаточно для того,
чтобы оценить необходимость в новом подходе к объекту управления при
попытке создать систему, управляющую им. Но прежде чем мы перейдем к
описанию, возможных путей решения этой проблемы, нам нужно совершить
экскурс в психологию мышления.
§ 1.3. Психологические предпосылки
Психологи много внимания уделяли проблеме исследования поведения
человека при решении возникающих перед ним задач. Было создано немало
концептуальных схем, объясняющих особенности его поведения при
решении различных по своему характеру задач. Рассмотрим три такие схемы,
получившие наиболее широкое распространение и представляющие для нас
интерес в рамках нашей книги.
Самая грубая схема носит название стимульно-реактивной теории. В
ее основе лежит представление об объекте управления как о «черном ящике».
Внутренняя структура объекта непостижима для ЛПР. Наблюдению
доступны лишь внешние входные сигналы, поступающие на объект
(стимулы), и выходные сигналы объекта (реакции). Задача ЛПР состоит в
том, чтобы, меняя значения входных сигналов и наблюдая за возникающим

при этом изменением выходных сигналов, сказать что-то о , т. е. об


описании функционирования объекта.
В психологии такой подход к изучению поведения человека носит
название бихевиоризма. Он справедливо подвергся критике, ибо сводит весь
процесс решения проблемы к методу проб и ошибок с постепенным
накоплением вероятностной информации о целесообразном поведении в
данной ситуации. Тем не менее ряд систем управления может быть построен
на основе этой весьма грубой теории. Ограничимся для иллюстрации этого
утверждения всего одним примером.
Пример 1.1. Рассмотрим объект, имеющий выходной канал и два

входных канала и . На входы и могут подаваться сигналы двух


типов 1 и 0, что соответствует возбуждению и невозбуждению
соответствующих входов. На выходе также могут появиться два сигнала 0 и
1, что соответствует невозбуждению и возбуждению выхода объекта. При
фиксированном возбужденном входе случай, когда оба входа возбуждены,
исключается; значение сигнала на выходе определяется распределением

, где . Другими словами, с вероятностью на выходе

объекта при возбужденном входе ; появляется сигнал 0, а с вероятностью

— сигнал 1. Задача ЛПР состоит в проектировании такой системы


управления, которая минимизировала бы случаи невозбуждения выхода
объекта.

Если бы значения ; были ЛПР известны, то дело обстояло бы весьма

просто. Пусть, например, для распределение имеет вид (0,9; 0,1), а для
— вид (0.01; 0,99). Тогда совершенно ясно, что необходимо всегда

возбуждать вход и только его. При этом случаи невозбуждения объекта


будут сведены к минимуму. Но в случае «черного ящика» информация о

распределениях априорно неизвестна. Надо суметь построить


такую систему управления, которая бы при любых заранее неизвестных
распределениях добивалась бы успеха, минимизируя число невозбуждений
объекта. Как это сделать, показано на схеме, приведенной на рис. 1.2.

Рисунок 1.2
В качестве системы управления использован конечный автомат
вероятностного типа. Он работает следующим образом. Во всех состояниях
левой группы автомат выдает на объект сигнал , а во всех состояниях
правой группы — сигнал . Смена состояний автомата происходит с
помощью анализа сигнала, поступившего от объекта после подачи на него
того или иного входного сигнала. Если этот сигнал равен 0, то происходит
смена текущего состояния автомата по стрелке, приведенной на рисунке
штриховой линией, или сохранение текущего состояния, что показано
петлеобразной штриховой дугой. Выбор того или другого происходит
равновероятно. Если выходной сигнал от объекта равен 1, то всегда
происходит смена текущего состояния автомата в соответствии со сплошной
стрелкой.
Можно строго доказать, что подобный автомат с увеличением глубины
памяти будет, по мнению ЛПР, асимптотически стремиться к наилучшему
функционированию. Но и без строгого доказательства это видно из
структуры автомата. Пусть, например, объект описывается распределениями,
приведенными выше: (0,9; 0,1) и (0,01; 0,99). И пусть в начальный момент
наш автомат находится в состоянии 2 левой группы. Он выдает на объект
сигнал . С вероятностью 0,9 в ответ будет получен сигнал о том, что объект
не возбудился. Тогда с вероятностью 0,5 автомат останется в состоянии 2
левой группы, а с вероятностью 0,5 перейдет в состояние 1 той же группы.
Таким образом, с вероятностью 0,45 сохранится состояние 2 в левой группе,
с такой же вероятностью возникает состояние 1 в левой группе и лишь с
вероятностью 0,1 — состояние 3 в левой группе. На следующем такте работы
автомат опять выдаст сигнал и снова с вероятностью 0.9 получит сигнал о
невозбуждении объекта. Если он находился в состоянии 1 левой группы, то с
вероятностью 0,45 это состояние сохранится, а с вероятностью 0,45
произойдет переход автомата в состояние 1 правой группы. Рассуждения
относительно остальных состояний левой группы, в которых мог находиться
автомат, аналогичны. После двух тактов работы из начального состояния
(состояние 2 левой группы) его очередным состоянием будет с вероятностью
0,2025 состояние 1 правой группы, с вероятностью 0,405 — состояние 1
левой группы, с вероятностью 0,2025 — состояние 2 левой группы, с
вероятностью 0,09 — состояние 3 левой группы и с вероятностью 0,01 —
состояние 4 левой группы. Легко посчитать, что с течением времени
вероятность уйти в глубь левой группы будет все время падать, а вероятность
перейти в правую группу — возрастать. Но как только автомат перейдет в
правую группу и начнет выдавать сигнал , положение резко изменится.
Теперь с вероятностью 0,99 на каждом такте работы он будет переходить в
глубь состоянии этой группы и лишь с вероятностями 0,005 сохранять свое
текущее состояние или менять его, переходя влево. Очевидно, что с течением
времени автомат обязательно попадет в правую группу состояний и
практически при большом никогда ее не покинет. Тем самым он найдет
правильный способ управления объектом лишь на основании знания его
выходных сигналов, ничего априорно не зная о внутренней структуре
объекта.
Несмотря на столь эффектный пример, следует все-таки отметить, что
стимульно-реактивная теория слишком слаба как для объяснения сложных
форм поведения человека при решении задач, так и для использования
подобного подхода в системах управления сложными объектами. Даже там,
где поначалу казалось, что модели такого типа могут привести к успеху, в
теории опознавания образов (наиболее популярная модель стимульно-
реактивного типа в этой области — персептрон), оказалось, что отсутствие
структурирования задачи (объекта) неминуемо приводит к непреодолимым
трудностям. Научив, например, персептрон устойчиво отличать букву А от
буквы Б и показав ему сочетание АБ, мы поставим его полностью в тупик.
Ибо сочетание АБ он не может расчленить на известные ему А и Б. Это
сочетание выступает для него как абсолютно новый образ, никак не
связанный с ранее усвоенными.
Другая концепция, получившая значительное развитие в моделях
решения задач человеком и оказавшая существенное влияние на развитие
эвристического программирования для ЭВМ, носит название лабиринтной
теории. Согласно этой теории перед человеком, принимающим решение,
находится как бы лабиринт возможных путей. Используя некоторые
локальные критерии, он выбирает то или иное продолжение движения в
лабиринте возможностей. Особенность лабиринтной модели состоит в том,
что человек видит лабиринт не целиком, а только в некоторой
фиксированной окрестности площадки, где он находится.
Иллюстрацией этого могут служить ситуации, складывающиеся в
различных позиционных играх. Пусть разыгрывается некоторая шахматная
партия. Любая позиция, сложившаяся в процессе игры на доске, есть
площадка некоего лабиринта, коридорами которого являются все возможные
ходы, допустимые в игре. Итак, мы находимся на некоторой площадке.
Игрок, собирающийся сделать очередной ход, имеет возможность выбора
любого хода (коридора лабиринта), допустимого в данной позиции. Если бы
он видел лабиринт с высоты птичьего полета, то он мог бы наметить
последовательность ходов, ведущую к матовой позиции или к ничьей. Но для
человека это исключено. Он может мысленно экстраполировать развитие
партии только на несколько ходов вперед, учитывая возможные ответные
ходы противника. А это означает, что он может проанализировать лишь
некоторую часть лабиринта, некоторую окрестность той площадки, где он
сейчас находится. И он должен сделать выбор на основе этой локальной
информации. Поэтому правила, которыми игрок руководствуется при выборе
хода, неточны, эвристичны. Его выбор не обязательно приведет его к
положению, которое приближает для него победу в игре. Он может
допустить ошибку, чего-то не учесть вне анализируемой окрестности
лабиринта.
Точное решение в лабиринтной модели достигается только тогда, когда
удается проанализировать весь лабиринт. Пример такого положения — игра
в крестики- нолики на поле 3 3. Недаром ею увлекаются малыши. Они еще
не сообразили, что можно априорно проанализировать все пути развития
игры и всегда выигрывать, если противник допускает ошибку. При
безошибочной игре крестики-нолики всегда заканчиваются ничьей.
Малые конечные лабиринты приводят к модели решения задачи,
имитируемой конечными автоматами. Любая площадка лабиринта
соответствует некоторому состоянию автомата, а коридоры — переходам
автомата из состояния в состояние под воздействием входного сигнала и с
учетом того состояния (той площадки лабиринта), где автомат сейчас
находится. Входной сигнал имитирует те решения, которые принимает ЛПР
при выборе коридора лабиринта. При этом ЛПР может создать систему
управления объектом также в виде некоторого конечного
(детерминированного или вероятностного) автомата. Подобная схема
управления показана на рис. 1.3.
На нем и отражают обратные связи, характеризующие память
автоматов, имитирующих объект управления и систему управления. Если
ЛПР структура автомата, имитирующего объект, полностью известна (т. е.
известен автоматный граф смены состояний и формирования выходных
сигналов), то обратная связь от объекта к системе управления не нужна.
Поэтому она показана штриховой линией. Необходимость в ней возникает
только тогда, когда в процессе работы нужно производить «настройку»
автомата, имитирующего систему управления, из-за неполного априорного
знания об объекте управления. По сравнению со схемой на рис. 1.1 здесь нет
входов, характеризуемых вектором . Это соответствует тому, что в
лабиринтной теории поведения предполагается, что влияние этих не
поддающихся измерению параметров можно описать некоторой

вероятностной схемой связи между вектором и вектором .


Рисунок 1.3
Пример 1.2. Проиллюстрируем схему, показанную на рис. 1.3, для
конкретного примера. Для этого выберем простейшую схему условного
рефлекса с двумя раздражителями: безусловным и условным . Как
известно, при поступлении на вход схемы безусловного раздражителя
должна быть выдана некоторая фиксированная реакция — сигнал . При
подаче на вход схемы только условного раздражителя необученная схема
сигнала у выдавать не должна. Пусть в течение некоторого числа тактов
(некоторого времени) на вход схемы подаются одновременно два сигнала:
и . Тогда через определенное время должен возникнуть условный рефлекс.
Он заключается в том, что при подаче на вход схемы только сигнала она
все-таки выдает сигнал , т. е. реагирует на условный раздражитель, как
собака в опытах И. П. Павлова, которая после долгого кормления
одновременно со звонком начинает выделять желудочный сок при наличии
звонка. Если теперь некоторое число тактов на вход схемы подается только
сигнал , то возникает явление угасания условного рефлекса. Через какое-то
число тактов рефлекс должен исчезнуть и наступит такой момент, что подача
на вход схемы не вызовет сигнала у на ее выходе.
На рис. 1.4 показана схема вероятностного конечного автомата, которая
имитирует описанный процесс. Автомат состоит из трех блоков: логического
блока ЛБ, магазинной памяти и датчика, на выходе которого появляется

сигнал , принимающий с вероятностями значения —1,0, 1. Автомат


работает следующим образом. В начальный момент память-магазин пуста.
Пусть глубина магазина есть . Если на вход автомата поступает только
сигнал , то на выходе ЛБ появляется сигнал у и содержимое магазина не
меняется. Датчик при наличии только не срабатывает. Если на вход
автомата поступили два сигнала и , то ЛБ выдает сигнал . Кроме того,

в магазин передается сигнал , вызывающий появление единицы на самом


нижнем уровне магазина. При повторении комбинации сигналов и

сигнал сдвигает эту единицу каждый раз на одну ячейку магазина вверх.
При комбинации сигналов и срабатывает и датчик случайных сигналов.

При он не оказывает никакого действия на запись в магазине. При


он выдает сигнал, заставляющий единицу в магазине сдвинуться еще на одну
ячейку вверх.

Рисунок 1.4

Наконец, при сигнал от датчика заставляет единицу в магазине


сдвинуться на одну ячейку вниз или исчезнуть из магазина, если единица
находилась на самом нижнем его уровне. При поступлении на вход автомата
только сигнала происходит следующее. Если единица в магазине
находится выше некоторого уровня , то магазин вырабатывает сигнал ,
который формирует на выходе ЛБ сигнал . Если же уровень в магазине
не достигнут, то сигнал не выдается и на выходе автомата нет сигнала .
Кроме того, при наличии только ЛБ выдает в магазин сигнал ,
заставляющий единицу в магазине опуститься на одну ячейку вниз. Датчик
при наличии только работает так же, как и при наличии и .
Таким образом, положение единицы в магазине характеризует степень
обученности автомата условному рефлексу. Уровень есть порог рефлекса.
Меняя его, можно имитировать различные предрасположенности системы к
установлению рефлекса. Датчик вносит необходимую вероятностную

компоненту. Но так как математическое ожидание равно нулю, то он не


вносит в процесс систематических искажений.
Как следует из рис. 1.3, мы предполагаем, что имитирующий автомат и
объект описываются одинаковыми (с точностью до вероятностных
реализаций) процессами функционирования. Другими словами, схема эта как
бы обратима. И подопытное животное может рассматривать себя в качестве
экспериментатора, устанавливающего условный рефлекс у истинного
экспериментатора (ЛПР). Ситуация эта хорошо отражена в следующем
анекдоте.
В клетке находятся две подопытные обезьяны. В комнату входит
научный сотрудник, экспериментирующий с обезьянами. В этот момент одна
обезьяна говорит другой: «Посмотри, чему я научилась. Сейчас я дерну за
веревку, зазвенит колокольчик, и этот чудак даст мне банан. Правда,
получилось это не сразу. Пришлось с ним поработать »
Однако в большинстве практически интересных случаев ЛПР не
стремится к тому, чтобы система управления имитировала объект
управления. В этом нет никакой необходимости. Как правило, систему
управления можно сделать проще объекта, которым она управляет.
Например, нетрудно показать, что с усложнением объекта имитации —
с переходом от простейшей схемы условного рефлекса к цепочкам таких
рефлексов и сетям условных рефлексов, способным моделировать весьма
сложные поведенческие акты,— система управления, воспроизводящая их
особенности, останется таким же конечным автоматом, который был
использован в примере 1.2.
Но что делать, если лабиринт оказывается слишком большим? Или
вообще бесконечным. Например, мы играем в крестики-нолики на
неограниченном поле с условием, что l одинаковых крестиков или ноликов (l
выбирается по договоренности) в горизонтальных или вертикальных рядах
или на диагонали приводят к выигрышу. Такой лабиринт нельзя отобразить в
схему конечного автомата. В этом случае можно воспользоваться
гипотетическим устройством, легко имитируемым на ЭВМ, которое носит
название «Общий решатель задач» (ОРЗ). Его функционирование протекает
следующим образом. Пусть мы имеем некоторую начальную площадку
лабиринта. Эту площадку (текущую ситуацию) можно как-то описать. Если
снова привлечь в качестве примера шахматную игру, то описание начальной
площадки может заключаться, например, в том, что в нем будут перечислены
все фигуры, имеющиеся на доске, с указанием полей, на которых они
находятся. А описание конечной площадки также будет описанием
некоторой позиции на шахматной доске. И цель состоит в поиске такой
последовательности ходов, которая постепенно преобразует исходное
описание в желаемое (целевое). Для преобразования описаний используются
специальные операторы из некоторого фиксированного списка, хранящегося
в ОРЗ. Условие их применения формируется на основе системы различий и
приоритетов различий. Каждые два несовпадающих описания в чем-то
различаются между собой. Это фиксируется в ОРЗ в виде некоторого
типового различия. Например, в шахматной игре одна позиция от другой
может отличаться набором фигур на доске или их положением на игровых
полях. Приоритет различий задает локальные правила выбора. Они
определяют, какие различия требуется устранить в первую очередь. Такая
приоритетность различий позволяет ОРЗ на каждом шаге его работы
выбирать для применения те операторы (выбирать коридоры в лабиринте),
которые устраняют наиболее приоритетные различия. При нескольких
операторах, способных устранить определенное различие, в ОРЗ может быть
задан и набор приоритетов для операторов. Проиллюстрируем работу ОРЗ на
примере, который понадобится нам и в дальнейшем.
Рисунок. 1.5
Пример 1.3. Игра в 5 есть усеченный вариант игры в 15, которой,
наверное, увлекались многие читатели. Игра происходит на поле 2x3 (рис.
1.5), на котором расположено пять фишек с цифрами от 1 до 5. Одно поле
остается свободным. Требуется перевести фишки из начального
расположения (например, показанного на рис. 1.5) в некоторое заранее
заданное положение (например, в положение, при котором все фишки стоят
по порядку, а правая нижняя клетка свободна). Введем теперь различия
между позициями этой игры и операторы устранения различий. Можно,
например, считать, что позиции имеют элементарное различие, если в
соответствующих клетках поля стоят разные фишки, а различием двух
позиций считать сумму элементарных различий, которыми они
характеризуются. Тогда позиция, показанная на рис. 1.5, будет отличаться от
целевой позиции на 4 единицы, так как фишки с номерами 4 и 5 уже стоят на
тех местах, которые требуются для целевой позиции. Но такое определение
различий не слишком удобно для решения поставленной задачи. Если,
например, в позиции на рис. 1.5 поменять местами фишки с номерами 3 и 2,
то различие сохранится, но нет уверенности, что исходная позиция и вновь
полученная «одинаково далеки» (в смысле числа необходимых
преобразований) от целевой позиции. Более удобно ввести различие через
суммарное число транспозиций, необходимых для перевода текущей
ситуации в целевую. (Транспозиция — это перестановка двух соседних
фишек или сдвиг фишки на пустое поле.) Например, для того чтобы фишка с
номером 2 стояла там где надо, требуется одна транспозиция — передвижка
ее на одно поле вправо. Для фишки с номером 1 требуется две транспозиции,
а для фишки с номером 3 — одна. Как уже говорилось, фишки с номерами 4
и 5 уже стоят на своих местах. Тогда суммарное отличие начальной позиции
от целевой будет равно 4 единицам. Но если фишки с номерами 2 и 3
поменять местами, то различие в транспозициях будет другим (в отличие от
того, что было при другом определении различия, приведенном ранее). При
таком изменении различие будет равняться 6 единицам. Другими словами,
вновь полученная позиция будет отстоять от целевой па большее расстояние,
чем исходная.
Для устранения различий в рассматриваемой игре можно использовать
операторы четырех типов: сдвинуть на свободное поле нижнюю, верхнюю,
левую, правую фишки. В конкретной позиции можно использовать не все
операторы. При свободном поле в середине — три из четырех, а при
свободном угловом поле — два из четырех. Выбор того или иного оператора
определяется их приоритетностью. Приоритетность, в свою очередь,
определяется тем, насколько данный оператор уменьшает различие.
Например, в той позиции, которая изображена на рис. 1.5, нет смысла
двигать фишку с номером 5 (применять оператор «сдвинуть на свободное
поле нижнюю фишку), так как это приведет к увеличению различия.
Применение же операторов: «сдвинуть на свободное поле левую фишку» и
«сдвинуть на свободное поле правую фишку» здесь равноправно.
Применение любого из них уменьшает отличие данной позиции от целевой
на одну единицу.
Пример 1.3 демонстрирует одну важную особенность ОРЗ. Планы
решения, которые строит ОРЗ, обладают свойством монотонности. На
каждом шаге решения должно происходить улучшение, приближение к цели.
Именно это свойство и оказалось роковым для ОРЗ и подобных ему
программ и систем. Можно привести следующую аналогию из математики.
Метод градиента позволяет находить экстремум функции только при
условии, что эта функция имеет один экстремум. Тогда возможно
монотонное движение к экстремальной точке. Но в большинстве случаев
экстремумов у функции несколько. Тогда метод градиента, последовательно
«улучшающий» значения функции, может завести нас в любой локальный
экстремум, который окажется для нас ловушкой. Куда бы мы ни двигались из
данной точки с заданным шагом градиента, везде нас ожидает неудача, ибо
значения функции во всей доступной нам окрестности «хуже» того, которое
соответствует точке, в которой мы находимся.
Для поиска глобального экстремума в теории оптимизации придумано
немало приемов: изменение градиентного шага, движение «вдоль оврага» и
т.п. В системах типа ОРЗ также построены некоторые приемы улучшения
планов решения. Например, переход от исходного лабиринта к более
простому, более грубому. Планирование движения сначала по нему, а потом
уточнение этого плана на исходном лабиринте, причем при монотонности
грубого плана уточненный план может стать немонотонным. Но, к
сожалению, пока не удалось найти хорошие процедуры для построения
грубых планов. А пока это не сделано, нельзя надеяться на построение
хороших моделей принятия решений.
Но у лабиринтной теории есть куда более важный недостаток, чем
свойство монотонности, присущее практически всем процедурам движения
по лабиринту. Этот недостаток заключается в априорной заданности
лабиринта или способа его построения. Но откуда берутся эти сведения? В
терминах, принятых в п. 1.1, это означает, что ЛПР знает f и ему нужно лишь
построить процедуру управления. Но мы уже говорили, что создание
описания объекта управления — задача не только более сложная, чем
нахождение самой процедуры управления, но и не имеющая пока каких-либо
стандартных приемов решения.
При решении различных задач, при принятии решений мы всегда
сталкиваемся с двумя случаями. Либо перед нами задача, которую, в
принципе, мы умеем решать и надо только найти решение данной
конкретной задачи, либо мы сталкиваемся с совершенно неясной для пас
проблемой, для которой даже неизвестно, с чего начать. Вот ребенок пробует
сложить из кубиков то, что нарисовано на картинке. Если в коробке всего
шесть кубиков, на сторонах которых что-то нарисовано, то его лабиринт
весьма велик — можно сложить более 48 тысяч комбинаций. Но маленький
ребенок справляется с таким громадным лабиринтом. Ибо он не складывает
кубики хаотично, а соотносит их с концевой площадкой лабиринта, выбирая
для каждого кубика одну верную грань из шести. В этой задаче лабиринт
налицо. Раз научившись что-либо складывать, ребенок уверенно выполняет
аналогичную работу для других кубиков, даже если число их значительно
больше шести. Но вот перед ним другая задача.
Обратимся к рис. 1.6. На нем изображена карта острова. На ней
отмечены города и связывающие их железные дороги. Мистер Браун живет в
городе А, находящемся па севере острова. Во время отпуска он поставил
перед собой следующую задачу: не пользуясь шоссейными дорогами и
автомобилем, проехать из города А в город Я, посетив по пути все города,
отмеченные на карте, ровно по одному разу.
Разрешима ли эта задача? Лабиринт перед вами. Остается только
пробовать. Прежде чем читать дальше, попробуйте.
Теперь вам стало ясно, что решение, по-видимому, не существует, но
мистер Браун решил поставленную перед собой задачу. Как он это сделал?
По-видимому, он кое-что слышал о лабиринтной и модельной теориях
мышления, а скорее всего, обошелся без них, не зная, что он «говорит
прозой». Он знал, что задача разрешима. Для этого достаточно
воспользоваться тем, что между городами В и Щ можно проехать морским
путем, па который нет запрета в условии задачи. Тогда поставленная задача
разрешима. Если вы сами догадались о подобном решении, то вы испытали
инсайт (озарение), чувство радостного изумления от найденного решения.
При этом от лабиринта, навязанного чертежом, приведенным на рис. 1.6, вы
сумели перейти к новому лабиринту, построенному вами.
В рассмотренной задаче подсказка о новом лабиринте содержалась в
чертеже. Города В и Щ стоят на море. Но подобная подсказка может и
отсутствовать. Такое положение имеется в весьма популярной в
психологических экспериментах головоломке «не ломая и не сгибая спичек,
сложить из шести спичек четыре одинаковых равносторонних треугольника».
В эксперименте все шесть спичек кладутся перед испытуемым на стол, что
задает лабиринт всевозможных положений шести спичек на плоскости
стола. Испытуемые делятся на две группы. Те, кто относится к первой
группе, подвигав спички и убедившись, что задача не решается (в данном
лабиринте!), отказываются от ее решения, считая, что их попросту надули.
Испытуемые второй группы начинают пытаться выяснить условия, при
которых решение задачи возможно. И вознаграждаются за усилия тем,что
строят новый лабиринт возможностей — пространственный. В нем легко
решают поставленную экспериментальную задачу, сооружая правильную
треугольную пирамиду.

Рисунок 1.6
Можно считать, что в какой-то мере лабиринтная модель описывает
поведение человека при решении задач, когда им используется стандартная
шаблонная модель, найденная ранее им самим, или сообщенная ему
учителем, или почерпнутая им из книг и учебников. Итак, кроме поиска по
лабиринту возможностей для человека при решении нетривиальных проблем
весьма важна процедура поиска самого лабиринта (или его части), в котором
можно найти необходимое решение. В процессе решения задачи он должен
сформировать этот лабиринт, а затем уже искать решение. Именно
нахождение такого лабиринта положительных эмоций, «радость открытия».
Сформулированное нами положение о двухэтапности решения любой задачи
является краеугольным камнем третьей психологической теории решения
задач — модельной теории.
В рамках этой теории всякое решение некоторой проблемы состоит из
последовательности нескольких шагов: описание исходной позиции задачи,
описание целевой позиции задачи, установление гомоморфизма между этими
описаниями или сведение их к одинаковому языку описания, установление
системы преобразований описаний, поиск последовательности
преобразований, ведущих от начальной позиции к целевой. Лишь последний
шаг отражен в лабиринтной модели решения задач, первые четыре шага в
ней считаются уже реализованными.Рассмотрим суть первых четырех этапов.
На этапе описания исходной позиции можно поступать по-разному. Для
иллюстрации этого опять обратимся к шахматам. В некоторой шахматной
позиции можно, как уже говорилось, описать положение каждой фигуры на
игровом поле. И это описание будет полным и исчерпывающим. Но
шахматист вряд ли использует его для поиска своего хода. Оно для него
слишком далеко от способа описания целевой Позиции. В самом деле,
окончательная позиция в шахматной игре не описана в терминах
расположения конкретных фигур на полях доски. Она описана в других
терминах, типа «Король противника находится под ударом, не может
покинуть клетку, где он находится, так, чтобы перейти на клетку, не
находящуюся под ударом, и не может другими фигурами ликвидировать
угрозу взятия короля». Это означает, что описание исходной позиции,
которое мы приняли, и описание конечной позиции (описание патовой
позиции производится в тех же терминах, что и описание мата) не
гомоморфны друг другу. Они не лежат в пределах одного лабиринта. И
именно в этом состоит психологическая трудность решения шахматных
задач для неопытных шахматистов. Опытные же шахматисты описывают
исходную позицию на языке того же уровня, что и язык, использованный для
описания заключительной позиции. Так вместо отдельных фигур и ходов
появляются связки, вилки, сдвоенные и проходные пешки, форсированные
ходы и многое другое.
В шахматах нет нужды искать систему преобразовании описаний. Она
определена правилами игры. Но во многих случаях это необходимо делать.
На соревнованиях кондитеров, которые должны приготовить торт из
заданного для всех одинакового набора исходных компонент, каждый
участник соревнования формирует свою систему «преобразования позиций».
И насколько успешно он это сделает, настолько успешен будет результат его
работы.
Заканчивая этот экскурс в психологию решения задач человеком,
остановимся еще на одном важном для нас вопросе. До сих пор мы
рассматривали решение задач человеком в статике, вне времени и
пространства. Но для реальных объектов управления такое ограничение вряд
ли возможно. Как правило, решения по управлению принимаются с учетом
динамики функционирования объекта управления. Что по этому поводу
может сказать нам психология?
При наблюдении за поведением людей, занятых управлением
динамическими объектами, психологи выявили определенные принципы,
которыми люди руководствуются при принятии своих решений. И основной
вывод заключается в том, что при решении управленческих задач, в которых
учитывается динамика процессов в объекте, человек строит их
динамическую модель. Они как бы протекают у него в уме, сохраняя
относительный временной масштаб частей процессов.
В зависимости от «удаленности» управленца от процесса управления
динамическая модель может быть различной. Если дежурный на
железнодорожной сортировочной горке, который управляет перемещением
локомотивов и вагонов с помощью стрелок, видит всю пространственную
картину перемещений непосредственно, то дежурный по станции
воспринимает ее с помощью мнемосхемы, а поездной диспетчер — лишь по
графику движения поездов, вычерчиваемому по дискретным сообщениям,
поступающим к нему. Таким образом, динамическая модель процесса на
сортировочной горке не требует от дежурного специальных способов
отображения кроме тех, которые связаны с непосредственным наблюдением
за реальным положением вещей. Дежурный по станции непосредственно
наблюдать и оценивать может только то, что видно из окна помещения, где
он находится. Остальная информация является опосредованной, она
отражена на мнемосхеме. Поэтому развитие процессов частично происходит
как бы в его голове. Он вынужден интерполировать и экстраполировать это
развитие. В наибольшей степени интерполяция и экстраполяция процессов
происходит в голове поездного диспетчера или дежурного по отделению
железной дороги. В его голове как бы отражается в реальном масштабе
времени процесс перемещения поездов на участке, которым он управляет. У
опытных дежурных и диспетчеров такое протекание процессов на объекте
управления отражается как бы «само собой», вне активного сознания.
Поступающие к диспетчеру или дежурному словесные сообщения
перекодируются им на уровень представлений, характерных для
имитационной модели, работающей в его голове.
§ 1.4. В чем состоит ситуационное управление?
Итак, при работе с объектами, с которыми столкнулась сейчас теория
управления, по-видимому, не приходится надеяться на возможность
использования для управления ими традиционных методов и приемов. Как
уже выяснилось, проблема состоит в самом описании уникального объекта
управления, учета в этом описании не только его специфической структуры и
функционирования, но и поведения людей, и возможностей эволюции
объекта во времени. Требуется создать такой подход, который на едином
языке давал бы возможность описывать как объект управления и его
функционирование, так и процедуру управления им.
Рассмотрим сначала постановку задачи управления, в схему которой
укладываются все известные сегодня задачи управления сложными
объектами.
Определение 1.1. Будем называть текущей ситуацией на объекте
управления совокупность всех сведений о структуре объекта управления и
его функционировании в данный момент времени.
Определение 1.2. Будем называть полной ситуацией совокупность,
состоящую из текущей ситуации, знаний о состоянии системы управления в
данный момент и знаний о технологии управления.
В этих двух определениях многое нуждается в уточнении. Но на
концептуальном уровне изложения, по-видимому, достаточно того их
понимания, которое было дано выше. Будем обозначать полные ситуации

через ( есть отличительный номер ситуации), а текущие ситуации —

через ( есть отличительный номер ситуации). Пусть в распоряжении


системы управления имеется различных способов воздействия на объект
управления (одношаговых решений). Каждое такое решение мы будем

обозначать как ( есть отличительный номер воздействия).


Элементарный акт управления можно представить в следующем виде:

Смысл этого соотношения заключается в следующем. Если на объекте

управления сложилась ситуация и состояние системы управления и

технологическая схема управления, определяемые , допускают

использование воздействия , то оно применяется, и текущая ситуация


превращается в новую ситуацию (. Подобные правила преобразования в
дальнейшем называются логико-трансформационными правилами (ЛТП) или
корреляционными правилами. Список ЛТП задает возможности системы
управления воздействовать на процессы, протекающие в объекте.
Очевидно, что в силу конечности числа различных воздействий все
множество возможных полных ситуаций как-то распадается на п классов,
каждому из которых будет соответствовать одно из возможных воздействий
на объект управления. Другими словами, должны существовать такие
процедуры, которые позволили бы классифицировать полные ситуации так,
чтобы из них можно было образовать столько классов, сколько различных
одношаговых решений есть в распоряжении системы управления. Эти
процедуры можно назвать процедурами классификации. Если для некоторых
полных ситуаций невозможно в силу не слишком хорошего знания как
объекта, так и влияния воздействий на него, указать единственное
одношаговое решение, то можно пока включить эту ситуацию в несколько
классов.
Но из-за такого пересечения классов возникнет задача выбора того или
иного решения из числа возможных для данной полной ситуации. Для
осуществления подобного выбора нужны специальные процедуры
экстраполяции последствий принятия того или иного решения. С их
помощью можно на основании знаний об объекте управления и его
функционировании заранее оценить результаты применения выбранного
воздействия и сравнить полученные прогнозы для данной полной ситуации
воздействий. Если все указанные процедуры оказалось возможным
построить, то общая схема решения задачи управления выглядела бы так, как
показано на рис. 1.7.
Описание текущей ситуации, сложившейся на объекте управления,
дается на вход Анализатора. Его задача состоит в оценке сообщения и
определения необходимости вмешательства системы управления в процесс,
протекающий в объекте управления. Если текущая ситуация не требует
такого вмешательства, то Анализатор не передает ее на дальнейшую
обработку. В противном случае описание текущей ситуации поступает в
Классификатор. Используя информацию, хранящуюся в нем, Классификатор
относит текущую ситуацию к одному или нескольким классам, которым
соответствуют одношаговые решения.

Рисунок 1.7
Эта информация передается в Коррелятор, в котором хранятся все
ЛТП. Коррелятор определяет то ЛТП, которое должно быть использовано.
Если такое правило единственное, то оно выдается для исполнения. Если же
таких правил несколько, то выбор лучшего из них производится после
обработки предварительных решений в Экстраполяторе, после чего
Коррелятор выдает решение о воздействии на объект. Если Коррелятор или
Классификатор не могут принять решения по поступившему описанию
текущей ситуации, то срабатывает Блок случайного выбора и выбирается
одно из воздействий, оказывающих не слишком большое влияние на объект,
или же система отказывается от какого-либо воздействия на объект. Это
говорит о том, что система управления не располагает необходимой
информацией о своем поведении в данной ситуации.
Фактически из-за сложности объектов управления, которыми мы
занимаемся, нет надежды на то, что исходные знания о них и способах
управления ими будут достаточно полны. Поэтому система управления
подобного типа принципиально должна быть открытой системой. Она
должна иметь возможность корректировать свои знания об объекте и методах
управления им. В работе такой системы управления имеется как бы два
этапа: этап обучения и настройки и этап работы. В начальный период, когда
система управления только еще создается, собираются многочисленные
сведения от технологов, хорошо знающих объект управления. С их помощью
формируются классы ситуаций и ЛТП. Они определяют целесообразность
использования тех или иных воздействий на объект управления в той или
иной ситуации. При этом мнения экспертов могут не совпадать, что и
приводит к попаданию одной и той же ситуации в различные классы по
управлению. С помощью экспертов формируются и процедуры
экстраполяции, способы оценки ситуаций, исходящие из желаемого
функционирования объекта управления.
Это означает, что на первом этапе в проект системы закладывается
значительное количество субъективной информации об объекте управления
и процедурах управления им. Это как бы коллективный опыт тех людей,
которые — хорошо или плохо — справлялись со своими обязанностями при
управлении объектом. Здесь важно, что при проектировании системы
желательно учитывать самые, на первый взгляд, незначительные сведения об
объекте. Зачастую оказывается, что именно такие побочные знания играют
большую роль в принятии решений по управлению объектом.
После этапа накопления знаний и формирования процедур в блоках,
показанных на рис. 1.7, система может начинать работать. Но в процессе
своей эксплуатации, особенно на первых порах, она будет довольно часто
принимать неверные решения из-за неполноты информации и неточности
процедур. Во всех этих случаях необходим этап дообучения системы
управления.
Отметим одну важную особенность рассматриваемого класса систем.
Число различных полных ситуаций обычно весьма велико. Возможно, что их
заранее и нельзя перечислить. А число решений конечно и невелико.

Другими словами, чаще всего , где, как всегда, означает


число элементов, входящих в множество А. Находясь за рулем автомобиля,
водитель воспринимает огромное число полных ситуаций, определяемых
внешней обстановкой на пути движения и состоянием автомобиля. А число
принимаемых им одношаговых решений невелико. Регулировщик на
перекрестке сводит все множество ситуаций в окрестности перекрестка к
двум одношаговым решениям по переключению сигнала светофора в
некотором фиксированном направлении. Секретарь, находящийся в
приемной большого начальника, мгновенно оценивает полную ситуацию и
принимает одно из трех решений, выражаемых, обычно в стандартных
словах «Проходите, пожалуйста», «Подождите, сейчас он занят», «К
сожалению, Его нет и сегодня не будет».
Чем больше число возможных ситуаций и чем меньше число
допустимых одношаговых решений, тем эффективнее выглядит работа схемы

управления, которую мы показали на рис. 1.7. Но и тогда, когда ,


можно применить подобную схему. Хотя ее эффективность в таком случае и
не будет очень высока, но, возможно, что это единственный путь управления
объектом.
Метод управления, который в общих чертах мы описали, основан на
введении понятия ситуации, классификации ситуаций и их преобразовании.
Естественно поэтому назвать его методом ситуационного управления, ибо, в
противовес к эпиграфу данной главы, в русском языке слово, определяющее
суть описываемого подхода, фактически единственное. И лишь большой
интерес к методам управления подобного типа породил в последнее время
ряд названий методов, частично более широких, а частично и более узких по
сравнению с тем, что вкладывается в понятие метода ситуационного
управления (семиотическое моделирование, семиотическое управление,
логико-лингвистические методы управления и т. п.).
Сформулируем теперь ряд особенностей, присущих методу
ситуационного управления.
1. Ситуационное управление требует больших затрат на создание
предварительной базы сведений об объекте управления, его
функционировании и способах управления им. Эти затраты оправданы
только тогда, когда традиционные пути формализации описания объекта
управления и процедуры управления реализовать невозможно. Другими
словами, если объект управления таков, что адекватно описывается,
например, системой линейных дифференциальных уравнений первой степени
с постоянными коэффициентами, то нет никакой нужды использовать метод
ситуационного управления. Это оправдано лишь тогда, когда традиционная
формализация приводит к задаче такой размерности, что ее практическое
решение известными методами невозможно — например в случае, когда
число уравнений в системе составляет несколько десятков тысяч.
2. Описание ситуаций, складывающихся на объекте управления
(текущих ситуаций), должно быть произведено на таком языке, в котором
отражались бы все основные параметры и связи, необходимые для
классификации этого описания и сопоставления ему одношагового решения
по управлению. При этом необходимо правильно выбрать уровень описания,
который не должен быть ни слишком подробным, ни слишком грубым. При
слишком подробном описании возникает «шумовой эффект», частности и
несущественные для управления факты и явления могут сильно усложнить
понимание сути функционирования объекта и сделать построение системы
управления невозможным. Этот случай можно проиллюстрировать
следующим примером. Некто, никогда не видевший игры в футбол
описывает свои впечатления от игры другому лицу, также не имеющему
представления об этой игре, следующим образом: «двадцать два человека,
одиннадцать из которых одеты в одну форму с номерами на спине, а
одиннадцать других — в другую форму, также с номерами на спине,
перемещаются по полю, которое имеет следующие особенности (следует
точное и подробное описание поля и его разметки). Каждый из играющих
может перемещаться по следующим, по-видимому, связанным с его
номерами траекториями (следует формальное описание динамики
перемещения игроков по полю). Иногда вместе с перемещением игроков
перемещается круглый предмет (следует описание мяча), но с некоторой
вероятностью осуществляется передача этого предмета от одного играющего
к другому или вывод его из поля игры (следует описание вероятностного
процесса передачи мяча). В последнем случае специальные игроки
возвращают мяч на поле по некоторым траекториям (следует описание
динамики вбрасывания мяча). И т. д.». Возникает вопрос: сможет ли
слушающий уловить в этом научном изложении, достаточно точно
описывающем наблюдавшийся матч, суть игры в футбол? Думаю, что это
весьма затруднительно. А если бы футбольный матч был описан на уровне
языка статистической физики (что тоже принципиально возможно), то что
тогда можно было извлечь из этого описания?
Язык описания ситуаций должен позволять отражать в нем не только
количественные факты и соотношения, характеризующие объект управления,
но и качественные знания, которые не могут быть формализованы в обычном
математическом смысле. Ведь большинство сведений, которые управленец
будет получать от технолога, будут иметь примерно такой вид: «в
большинстве случаев я думаю, что надо делать , если имеет место »;
«мне кажется, что в ситуации хорошо было бы сделать », «когда
растет, то, как правило, убывает, но не очень сильно» и т. п. И надо
научиться отражать эти качественные высказывания на языке описания
ситуаций. Следует также учитывать, что высказывания человека об объекте и
способах управления им неполны. Нужны специальные приемы для
получения от него всей той информации, которая нужна для принятия
решений по управлению (вспомним случай с диагностикой психических
заболеваний, когда на самом деле истории болезней не содержали
информации). Известная детская задача: «в движущемся поезде, состоящем
из 40 вагонов, три из которых пассажирские, а остальные товарные, имеется
три проводника и один охранник; требуется узнать сколько лет машинисту»
— иллюстрирует сказанное.
4. Классификация ситуаций, объединение их в классы при
использовании одношаговых решений происходит на субъективной основе,
ибо первоначальная информация о соответствии той или иной текущей
ситуации тому или иному решению получается от экспертов. Система как бы
суммирует знания отдельных экспертов и становится носительницей
коллективного опыта людей. Однако процедуры классификации должны
быть построены таким образом, чтобы сама классификация годилась бы для
тех текущих ситуаций, о которых система не получила информации от
экспертов. Это приводит к тому, что задача классификации становится
аналогичной задаче формирования понятий на основе обучающих
последовательностей. Система, сформировав некоторое понятие, обладает
уже большими знаниями, чем те, которые были заложены в нее вначале
экспертами, хотя эти дополнительные знания могут оказаться и неверными,
что может выявиться в процессе ее эксплуатации. Таким образом, в системе
могут появляться «предрассудки», неверные представления и неправомерные
обобщения. Она может вести себя, как женщина, которая говорит в
разговоре: «знаю я вас. Все мужчины лгут». А на ехидный вопрос «вы что
же, имели дело со всеми мужчинами?», простодушно отвечает: «да, была
знакома с одним вроде вас...».
5. Аналогичные слова можно сказать и о формировании ЛТП. Они
первоначально также получаются с помощью информации, сообщаемой
экспертами. Уточнение этих правил, уничтожение противоречий в них и
формирование новых ЛТП происходят уже в процессе эксплуатации
системы. Все это верно и для правил экстраполяции и для оценки тех или
иных текущих ситуаций.
6. Из двух последних пунктов вытекает принципиальный вывод о том,
что системы ситуационного управления не могут оптимизировать сам
процесс управления. Они ориентированы лишь на такое управление, когда
достигнутые результаты будут не хуже лучших результатов, которые мог бы
получить человек. Однако, как показала практика применения систем
подобного типа, чаще всего результаты, выдаваемые системой, лучше
человеческих. Это происходит по ряду причин. В частности, на систему не
влияют эмоции человека-управленца и в стрессовых ситуациях она
принимает решения так же, как и в обычных; система ничего не забывает и
не упускает решений, которые для человека апостериори «сами собою
разумеющиеся», но не пришли ему вовремя в голову. Помните, как в
известном рассказе А. П. Чехова: «Было б мне козьей ножкой!». Таким
образом, метод ситуационного управления можно считать эвристическим.
7. На самом деле для многих реальных объектов управления
одношаговые решения не определяют стратегии управления. В таких
объектах необходимо формировать в качестве решений цепочки из
одношаговых решений. Для этого в системе экстраполяции должны быть
предусмотрены специальные процедуры «склейки» одношаговых решений. С
их помощью формируются более сложные решения по управлению.
Указанные особенности учтены в процедурах и методах, описанных в
последующих главах. Надо помнить, что эти методы не единственно
возможные. И любой специалист вправе придумывать и предлагать свои
подходы к решению задач, вытекающих из сути метода ситуационного
управления.
И последнее замечание. Как следует из Исторического очерка развития
ситуационного управления, приведенного в конце книги, оно возникло много
раньше, чем сформировалось активно развивающееся сейчас научное
направление, называемое теорией искусственного интеллекта. У
ситуационного управления много общего с методами, характерными для
исследований в области искусственного интеллекта. По ходу изложения эти
аналогии мы будем отмечать, что поможет читателю использовать из
арсенала теории искусственного интеллекта не только терминологию, но и те
результаты, которые там получены, для обогащения своих систем
управления сложными объектами.

§ 1.5. Семиотические модели


Цель настоящего параграфа — уточнить понятие семиотической
модели, лежащее в основе метода ситуационного управления и вообще
методов семиотического управления. В том, что в таких методах
используется именно данная модель, состоит главное отличие от
традиционных методов теории управления, в основе которых лежит некая
формальная (в логическом смысле) модель.
Начнем с определения формальной модели.
Определение 1.3. Формальной моделью называется четверка

где — множество базовых элементов,


— синтаксические правила,
— система аксиом,
— семантические правила.
Поясним суть элементов, образующих формальную модель. Множество
состоит из конечного или счетного множества элементов любой природы.
Это как бы алфавит формальной системы, набор элементов, из которых будут
строиться все остальные ее элементы. На элементы формальной системы не
накладывается никаких ограничений. Важно только, чтобы любые два
элемента из чем-то отличались друг от друга. Иными словами, должна
существовать такая конструктивная (завершающаяся через конечное число

шагов) процедура , что ее применение к элементам множества Т дает ответ


на вопрос: одинаковы ли два сравниваемых элемента или нет. Важность этой
процедуры можно проиллюстрировать на примере множества , состоящего
из букв русского алфавита. Отождествление различных написаний буквы ,
например, дело не такое простое. А иногда, особенно в скорописи, бывает
довольно трудно идентифицировать в слове ту или иную букву.

Кроме того, должна существовать конструктивная процедура ,


которая дает ответ на вопрос: принадлежит ли данный элемент к или не
принадлежит. Для того же иллюстративного примера это соответствует
ответу на вопрос о принадлежности некоторой графемы к списку букв
русского алфавита.
Синтаксические правила используются для того, чтобы из базовых
элементов строить такие их совокупности, которые в рамках данной
формальной системы считаются синтаксически правильными
совокупностями. На множество синтаксических правил нет особых

ограничений. Требуется только наличие конструктивной процедуры


которая давала бы однозначный ответ на вопрос: является ли данная
совокупность базовых элементов синтаксически правильной или нет.
Систему аксиом образует любое множество синтаксически
правильных совокупностей. На это множество не накладывается никаких
специальных ограничений. В частности, оно может совпадать со всем
множеством синтаксически правильных совокупностей.
Наконец, семантические правила (по-другому они называются
правилами вывода) расширяют, если это возможно, множество аксиом,
добавляя к ним новые синтаксически правильные совокупности. Множество,
получаемое после применения семантических правил к аксиомам, носит
название множества семантически правильных совокупностей.
На рис. 1.8 условно показан результат работы формальной системы,
которая выступает как автономный генератор. Процедуры порождения
множества синтаксически правильных совокупностей, основанные на
произвольном применении правил , и процедуры порождения множества
семантически правильных совокупностей, основанные на применении правил
, работают независимо.
Определение 1.4. Формальная модель, для которой существуют

конструктивные процедуры , и , называется конструктивной


формальной моделью.
Определение 1.5. Конструктивная формальная модель, для которой
существует конструктивная процедура л4, дающая однозначный ответ на
вопрос — принадлежит ли данная синтаксически правильная совокупность
множеству семантически правильных совокупностей, называется
разрешимой формальной моделью.

Рисунок 1.8
Приведем несколько иллюстративных примеров.
Пример 1.4. Вернемся снова к коробке детских кубиков, содержащей
всего шесть кубиков. Каждый кубик есть базовый элемент. Легко убедиться,

что существуют и , позволяющие отличать один кубик от другого (по


несовпадающему рисунку хотя бы на одной грани двух сравниваемых
кубиков) и отличать кубики из других наборов (например, по несовпадению
концевых точек линий или границ между цветами на всех шести гранях
данного кубика со всеми другими кубиками набора, если нет более простого
признака типа другого размера кубика). Система синтаксических правил
такова, что она считает синтаксически правильными любые совокупности
кубиков, в которых все шесть кубиков выложены в виде прямоугольника 2 3

или 3 2. Ясно, что существует конструктивная процедура . Система


аксиом совпадает с такой совокупностью кубиков, которая соответствует
одной из приложенных к коробке картинок (эта картинка как бы фиксируется
в виде начальной позиции). Правила дают возможность получать из
исходной картинки новые картинки (думаю, что читатели в детстве сами
строили эти правила). И, наконец, ясно, что существует конструктивная

процедура , ибо определение всех семантически правильных


совокупностей содержится в наборе шести картинок, приложенных к набору.
Следовательно, мы имеем дело с разрешимой формальной моделью.
Пример 1.5. Рассмотрим классическое исчисление высказываний. В
качестве элементов будем использовать малые латинские буквы без

индексов и с нижними индексами, а также символы , , и . В качестве


возьмем следующий набор правил: 1. Каждый базовый элемент есть
синтаксически правильная совокупность. 2. Если — синтаксически

правильная совокупность (формула), то также есть формула. 3. Если и

— формулы, то , , — также формулы. Здесь и

— метасимволы, не входящие в . Процедура явно существует.

Рассмотрим, например, совокупность базовых элементов вида .


Это, конечно, формула, ибо и — формулы согласно первому

правилу из , — формула согласно второму правилу из , а —


формула по третьему правилу из . В противоположность предыдущей
совокупности совокупность не есть формула, ибо в нет правил,
последовательное применение которых привело бы к ее построению. Явное

выражение процедуры не приводится, чтобы доставить читателю


удовольствие самому написать ее.
Система аксиом имеет следующий вид:

(1) ;

(2) ;

(3) ;

(4) ;

(5) ;

(6) ;

(7) ;

(8) ;

(9) ;

(10) ;

(11) .
Конечно, аксиом многовато и непривычному к логической символике
читателю трудно их охватить единым взглядом. Но это и не нужно. Надо
смотреть на них, как на множество произвольно выбранных из правильных
совокупностей элементов.
Наконец, правила в классическом исчислении высказываний в той
его форме, как она рассматривается в данном примере, имеют вид: 1. Если
— семантически правильная совокупность (выводимая формула), то при
замене в а любого базового элемента (везде, где он входит в ) любой

формулой вновь получается выводимая формула; 2. Если и —

выводимые формулы, то также выводимая формула.


Вопрос о существовании конструктивной процедуры , которая
позволяла бы для любой формулы исчисления высказываний определять
выводима она или нет, пока остается открытым. Но в рассуждениях, которые
будут следовать после определения 1.6, мы дадим на этот вопрос
положительный ответ. И тогда читателю станет ясно, почему в данном
примере выбрана именно такая система аксиом.
Приведенных примеров, по-видимому, достаточно. Отметим только,
что исчисление предикатов и формальные грамматики, широко
используемые в языках программирования, суть конструктивные
формальные системы. Но в общем случае они не являются разрешимыми
формальными системами.
Рассмотрим теперь модель вида

Здесь — некое множество, которое мы будем называть множеством


интерпретируемых значений. Правила , называемые правилами

отображения, устанавливают возможность отображения , которое


является многозначным в обе стороны. Эти правила при некоторой
конкретной реализации дают отображение , однозначное в одну
сторону, т. е. приписывают каждому элементу, из некоторое
интерпретирующее значение. Та или иная реализация отображения задается
— правилами отображения или задается извне. Наконец, правила
интерпретации позволяют приписывать любой синтаксически правильной
совокупности базовых элементов некоторое интерпретирующее значение,
если заданы интерпретирующие значения для всех базовых элементов,
входящих в эту совокупность.
Определение 1.6. Формальная модель , для которой задана модель
, называется интерпретированной формальной моделью.
Пример 1.6. Для исчисления высказываний, рассмотренного в примере
1.5, можно в качестве модели интерпретации взять модель, в которой
, правила отображения задают произвольное

отображение любых элементов из , кроме , , и в любой элемент


, правила отсутствуют, а правила определяются табл. 1.1.

Ложь Ложь Истина Ложь Ложь Истина


Ложь Истина Истина Ложь Истина Истина
Истина Ложь Ложь Ложь Истина Ложь
Истина Истина Ложь Истина Истина Истина
Таблица 1.1
Эти правила позволяют для любой синтаксически правильной формулы
исчисления высказываний приписать некоторое интерпретирующее
значение. Нетрудно проверить, что всем аксиомам, перечисленным в
примере 1.5, эти правила при любых интерпретациях входящих в них
базовых элементов приписывают значение «Истина». Семантические
правила, приведенные в том же примере, не могут изменить значение
формул, к которым они применяются. Таким образом, все формулы, которые
выводятся из аксиом, также всегда имеют интерпретирующее значение
«Истина». Можно доказать, что аксиомы и правила вывода, приведенные
нами, обладают свойством полноты в том смысле, что любая формула
исчисления высказываний, которая имеет значение «Истина», выводима из
этого множества аксиом с помощью имеющихся семантических правил. А
это означает, что исчисление высказываний, рассмотренное нами, является

разрешимой формальной системой. Процедура состоит в проверке того,


что при любых интерпретациях базовых элементов проверяемой формулы
она принимает значение «Истина». Если это не так, то проверяемая формула
не принадлежит множеству семантически правильных формул
(совокупностей).
В формальных системах . . и . остаются неизменными. Это
означает, что если бы формальные системы использовались для создания
ситуационных моделей управления, то язык описания ситуаций (он
определяется Т и Р), исходные знания об объекте управления и законах
управления (они определяются заданием множества аксиом) и ЛТП (они
совпадают с семантическими правилами) оставались бы неизменными и
незыблемыми. Но это противоречит всему, что мы говорили об объектах
управления и самой системе ситуационного управления, ее принципиальной
открытости для обучения и дообучения. Система управления, базирующаяся
на формальной модели, априорно должна иметь всю информацию, которая
остается для нее неизменной в течение всего периода управления. Все
утверждения, выведенные в ней в любой момент времени, остаются
выведенными навсегда.
Ясно, что для объектов управления, отличных от детских кубиков из
примера 1.4, такое положение не имеет места. В процессе функционирования
системы управления могут корректироваться языки описания ситуаций,
изменяться знания об объекте и методах управления им. Это означает, что
все элементы, входящие в определение М, могут изменяться в процессе ее
функционирования.
Рассмотрим в связи с этим модель вида

Здесь , , ,и — соответственно правила изменения , ,


и .
Определение 1.7. Модель С называется семиотической моделью.
Подобное название С связано с тем, что в отличие от формальных
моделей, в которых элементы, образующие множество Т, обладают жестким

синтаксисом, задаваемым процедурой , жесткой семантикой,


определяемой процедурой интерпретации, и жесткой прагматикой (то, как
трактует этот элемент ЛПР с точки зрения процесса управления), в модели С
все эти свойства элементов становятся доступными для изменения. Но
именно такой особенностью обладают знаки — элементы знаковых, или
семиотических систем, изучаемых в семиотике. Такие системы тесно
связаны со всей человеческой деятельностью. Именно изменчивость и
условность знаков делают эту деятельность эффективной. Поясним
сказанное на простом примере. Сигнал звонка может означать, что кому-то
надо поднять телефонную трубку. Но прагматика звонка для меня может
быть различной в зависимости от того, жду ли я с кем-то разговора или знаю,
что трубку должны снять в соседней комнате. Вместо звонка меня могут
позвать к телефону стуком в перегородку. Синтаксис знака изменился, а
семантика и прагматика сохранились. И точно такой же звонок может
означать конец работы, что при неизменном синтаксисе знака дает другую
семантику. А в странах, где надо особо платить за каждое соединение
абонентов, люди договариваются о том, что если телефон прозвонит четыре
раза, то встреча состоится, а если пять — откладывается. Сохраняя синтаксис
телефонных звонков, они меняют их семантику и прагматику.
Человек окружен знаковыми системами, его деятельность пронизана
ими. Он постоянно творит такие системы, договариваясь с другими
партнерами о синтаксисе, семантике и прагматике знаков.
Правила изменения, введенные нами в модель С, в какой-то мере

отражают подобный процесс. Правила и меняют синтаксис базовых

элементов и их совокупностей, правила и — семантику и прагматику


совокупностей. Можно было бы еще изменять модель интерпретации. Тогда
бы мы получили модель, подобную знаковым системам человека. Но мы
этого делать не будем. Для систем управления вполне достаточно изменения
элементов в формальных моделях.
Другое название знаковых систем и моделей — семиотические модели.
Этого названия мы и будем придерживаться в дальнейшем.
Посмотрим, что означают правила изменения в модели в
терминологии системы управления. Начнем с ЛТП. Модель

детерминирована и неизменна. Правила дают возможность отказаться от


этого, сделать ЛТП переменными, например адаптивными. Примерами таких
ЛТП могут служить ЛТП с вероятностной перенастройкой вида

В таком ЛТП текущая ситуация при полной ситуации

преобразуется не в одну фиксированную текущую ситуацию как было


ранее, а в различных текущих ситуаций. Выбор того или иного
преобразования осуществляется вероятностным механизмом с учетом того,

что — вероятности реализации соответствующего

преобразования . В зависимости от удачи или неудачи


применения такого ЛТП происходит изменение распределения. Если,

например, в полной ситуации было применено преобразование и


оно оказалось удачным (например, с точки зрения ЛПР), то может
увеличиться на некоторую величину при условии сохранения нормировки, т.

е. при условии соответствующего уменьшения остальных ). Такой способ


изменения ЛТП позволяет подстраивать семантические правила под тот
объект, для которого построена система управления. Вместо пересчета
вероятностной схемы можно менять ЛТП и другими способами, и об этом
будет говориться в соответствующем разделе книги.
В каждый текущий момент некоторые утверждения об объекте, его
состоянии, а также состоянии системы управления являются истинными,
отражают положение вещей. Эти знания можно выразить в виде набора
аксиом. Можно считать, что все, составляющее в момент принятия решений

описание полной ситуации есть набор таких аксиом. Они служат


источником вывода о том решении , которое надо применить в данном
случае. Однако в другой момент времени эти знания будут уже другими. И
утверждение о том, что станок № 1245 свободен, которое могло выступать
как аксиома в предшествующий такт управления, на данном такте может уже
оказаться ложным. Система аксиом все время «дышит», меняется. И эти
изменения можно явно указывать, например, в правых частях ЛТП,
записывая их в виде

Здесь — те изменения, которые необходимо внести в описание

полной ситуации после того, как перешла в возможны и другие

способы описания изменений аксиом, задаваемых правилами .


Наконец, изменения синтаксических правил могут свидетельствовать,
что язык описания ситуаций на объекте управления, полные знания о нем и
процедурах управления оказался слишком бедным. В него необходимо
ввести новые способы образования функций, отношений типовых

сообщений. Функции такого изменения выполняют правила . Правила


добавляют в список исходных понятий, отношений или функций новые
элементы или исключают из него те, которые оказались ненужными для
целей управления.
Семиотическую модель можно представить в виде сети, показанной на
рис. 1.9.

Рисунок 1.9
Каждая вершина сети представляет собой некоторую формальную
систему, а связи между вершинами определяют переходы от одной
формальной системы к другой под влиянием изменений . Эти изменения

могут совпадать с , , или или быть какой-то их комбинацией. За

один такт работы семиотической модели в зависимости от содержимого


модель либо останется в том же состоянии (в рамках той же формальной
системы), что и ранее, либо перейдет в новое состояние.

§ 1.6. Данные и знания


Введенное нами понятие семиотической модели и ее интерпретация,
показанная на рис. 1.9, позволяют рассмотреть важную проблему
искусственного интеллекта — взаимоотношение данных и знаний и
логическую противоречивость знаний. Вопрос этот важен и для
ситуационного управления. Но прежде чем мы непосредственно перейдем к
его обсуждению, отметим, что до последнего времени в теории
программирования задач для систем искусственного интеллекта оживленно
дебатировался вопрос о двух возможных путях построения подобных систем:
процедурном и декларативном. В процедурном подходе в центре внимания
разработчика находилась процедура, программа, а информация для нее
играла второстепенную роль. Программа работала с данными, вызывала их
по мере необходимости, уничтожала в памяти. Данные оставались где-то на
периферии. Считалось, что основная работа по созданию системы лежит в
области создания процедур.
Это положение стало меняться, когда данные стали усложняться.
Появились структурированные данные — списки, документы, семантические
сети, фреймы. О некоторых из них речь еще впереди, они будут играть
важную роль на страницах нашей книги. Затем возникли специальные
средства для хранения данных — информационные банки и базы, к которым
стал добавляться термин интеллектуальный. Это означало, что вместе с
хранением данных в базах и банках происходит их элементарная обработка,
выполняемая специальными вспомогательными программами. Они
осуществляют поиск данных, запись их в отведенное место и ряд других
операций. Форма записи данных в хранилище может не совпадать с той их
формой, которую использует программа, решающая основную задачу, ибо
таких программ много, а хранилище одно. Поэтому сервисные программы
стали брать на себя функцию перевода запроса и выдаваемого ответа из
одной формы представления в другую. Информация усложняла свою форму
представления, она становилась структурированной, одни порции
информации стали связываться с другими некоторыми отношениями.
Процедуры, связанные с ее обработкой, начинали усложняться. становились
самодовлеющими. Многие преобразования, которые раньше осуществлялись
программами, решающими основную задачу (например, поиск по образцу)
стали выполняться вне основной программы. Во многих случаях

Рисунок 1.10
привычные программы, перерабатывающие информацию за счет ее
прямого видоизменения, заменялись специальными процедурами по
переработке информации. Так возник декларативный подход, в котором
работа с данными (их начинают называть знаниями) выходит на первый план,
оттесняя сами процедуры на второй план.
В чем же принципиальная разница между данными и знаниями?
Традиционное программирование не дает на это ответа. Но в рамках теории
семиотических моделей такой ответ можно найти. Давайте посмотрим на
рис. 1.10. На нем очень условно показана лошадь, пасущаяся на лугу, что
вызывает в голове видящего ее индивида некоторый обобщенный образ
«лошади, пасущейся на лугу». Этот образ включен в некоторую систему
данных о такой ситуации. Индивид может, например, понять, что движения,
которые делает лошадь, сводятся к перемещению по лугу, отгону
надоедливых слепней и к поглощению травы — пищи для лошади. Он может
установить, что это лошадь определенной масти (если он, конечно, знает, что
это такое), домашняя и. следовательно, она кому-то принадлежит. По
некоторой ассоциации он может себе представить конюшню (не конкретную,
где живет данная лошадь, а конюшню вообще), человека, который за
лошадью ухаживает, и т. п. Важно, что весь тот информационный комплекс,
который возникает у индивида, видящего пасущуюся лошадь, оказывается
логически непротиворечивым, ибо он может представить себе конкретную
ситуацию (ей в ситуационном управлении соответствует текущая ситуация),
в рамках которой все эти сведения могут быть совмещены. И если индивиду
задать вопрос: «Лошадь летает?», то он ответит на него отрицательно. Такие
лошади, конечно, не летают. Но индивид может легко представить себе
летающую лошадь. Например, Пегаса, если он что-то слышал о нем. В мире
греческой мифологии, где действует Пегас, лошадь может летать. Но если в
мире мифологии задать вопрос: «С помощью чего летает Пегас?», то ответом
будет: «С помощью крыльев». Ибо Пегас — крылатая лошадь. А в мире
русской народной сказки лошади не надо иметь даже крыльев. Конек-
Горбунок умеет летать и без них, перенося героя сказки куда тому нужно.
Если эти знания о лошади совместить в рамках одной конкретной
ситуации, то получится логически противоречивая система. В ней лошадь
летает и не летает, летает только если у нее есть крылья и может летать без
крыльев. Получается абсурд. Но подобный абсурд встречается на пути
человека постоянно, и он нисколько не страдает от этого. Он вполне
спокойно оперирует с такими, например, логически противоречивыми
образами: «Началась третья половина игры», «Исполнение всех желаний, у
которых нет предела», «Речка движется и не движется, вся из лунного
серебра» и т. п. Более того, подобные абсурдные утверждения развлекают
человеческий ум, приятны для человека. Это происходит потому, что в
голове человека вся такая информация не хранится в рамках одной системы.
Тогда бы он был лишен возможности производить над ней логические
операции, а следовательно, не смог бы использовать хранимую информацию
для своих прагматических целей. Значит, эта логически противоречивая
информация так организована в его памяти, чтобы избежать возможных
логических противоречий.
Одна из возможностей такой организации информации как раз и
показана на рис. 1.9. В каждой вершине сети хранится логически
непротиворечивая информация, совместимая в рамках одной ситуации, и эта
информация может быть отражена в некоторой формальной системе.
Относительно нее можно делать логически обоснованные выводы, которые
можно использовать при наличии подобной ситуации. Но возможны и другие
ситуации, в которых действуют свои аксиомы и семантические правила, своя
интерпретация. В этих ситуациях (возможных мирах) может выводиться то,
что в другой ситуации оказалось бы бессмысленным.
Отметим еще один важный аспект, позволяющий уяснить разницу
между данными и знаниями. Любое понятие, используемое человеком, имеет
как бы две стороны — экстенсионал и интенсионал. В науке до сих пор
продолжаются споры относительно точной их интерпретации. Поэтому наши
дальнейшие рассуждения нельзя рассматривать как способ разрешить эти
споры. Понятия «экстенсионал.» и «интенсионал» мы будем трактовать
прагматически, как принято в теории представления знаний. Под
экстенсионалом некоторого понятия мы будем подразумевать набор
конкретных фактов, соответствующих данному понятию. Если, например,
для некоторой конкретной лаборатории в данном научном учреждении мы
рассмотрим понятие «сотрудник», то его экстенсионалом может быть список
работающих в этой лаборатории. Экстенсионалом понятия «ателье по
ремонту микрокалькуляторов в г. Минске» служит перечень всех таких
ателье, имеющихся в данном городе в данный момент времени.
Экстенсионал понятия может быть конечным, как было в приведенных нами
примерах, но может быть и бесконечным. В последнем случае, разумеется,
его нельзя задать простым перечислением. В этом случае поступают по-
иному. Например, задают некоторое характеристическое правило,
удовлетворение или неудовлетворение которому определяет принадлежность
к экстенсионалу данного понятия. Например, определяя экстенсионал
понятия «четное число», мы не можем просто перечислить все четные числа,
но можем задать его путем следующего характеристического празила: если
при делении на 2 данное число имеет нулевой остаток, то оно принадлежит
экстенсионалу понятия «четное число». Подобное правило можно (что
обычно и делается) использовать для определения понятия «четное число».
Это определение и будет генсионалом данного понятия.
Между декларативным и процедурным представлением, с одной
стороны, и экстенсионален и интенсионалом, с другой, существует очевидная
связь. Экстенсионал — это набор конкретных данных, заданных в
декларативной форме. Интенсионал же, как правило, задает некоторую
процедуру, позволяющую определять принадлежность того или иного
конкретного факта к некоторому понятию. Интенсионал выделяет знания,
отделяет их от данных, которые всегда задаются экстенсионально.
Теперь можно описать разницу между данными и знаниями. Данные
есть комплекс информации, совместимый в рамках некоторой формальной
системы с учетом всех возможных интерпретаций этой системы. В случае
ситуационного управления множество данных есть множество текущих
ситуаций, которые могут складываться на объекте управления (последний
предполагается неизменным), и информация о текущем состоянии объекта и
системы управления им. Знания же есть информация, которая хранится во
всех возможных мирах вместе с условиями перехода от одного мира к
другому. Другими словами, знания — это не только множество всех текущих
ситуаций в объектах данного типа, но и способы перехода от одного
описания объекта к другому, способы изменения компонент формальной
системы, а, следовательно, знания — это то, что воплощается в некоторой
семиотической модели.
§ 1.7. План дальнейшего изложения
Прежде чем переходить к изложению основных проблем, связанных с
созданием систем ситуационного управления, наметим план изложения.
В последующих главах мы прежде всего займемся описанием языка
ситуационного управления, с помощью которого будут описываться
ситуации. Этот язык допускает согласование с языком описания знаний об
объекте управления и управления им, а также с языком, на котором
описываются цели управления.
Затем мы рассмотрим процедуры классификации, столь важные для
ситуационного управления. Опишем методы пополнения описаний ситуаций
за счет использования знаний относительно объекта управления и методов
управления им, хранящихся в памяти системы. В связи с этим мы обсудим
специальные псевдофизические логики, используемые для пополнения
описаний и процедуры индуктивного вывода, позволяющие получать в
процессе управления новые знания.

Вам также может понравиться