Вы находитесь на странице: 1из 44

МИЭТ

Лекции по искусственному
интеллекту

Москва
2011

1
Лекция 1. Эволюция искусственного интеллекта и её становление как
научной отрасли. Базовые понятия предметной области.
Терминология. Философские аспекты проблемы систем ИИ (возможность существования,
безопасность, полезность). История развития систем ИИ.

Термин интеллект (intelligence) происходит от латинского intellectus — что означает ум, рассудок,
разум; мыслительные способности человека. Соответственно искусственный интеллект (artificial
intelligence) — ИИ (AI) обычно толкуется как свойство автоматических систем брать на себя
отдельные функции интеллекта человека, например, выбирать и принимать оптимальные решения
на основе ранее полученного опыта и рационального анализа внешних воздействий.
Мы, в нашем курсе, интеллектом будем называть способность мозга решать (интеллектуальные)
задачи путем приобретения, запоминания и целенаправленного преобразования знаний в процессе
обучения на опыте и адаптации к разнообразным обстоятельствам.
В этом определении под термином "знания" подразумевается не только ту информацию, которая
поступает в мозг через органы чувств. Такого типа знания чрезвычайно важны, но недостаточны
для интеллектуальной деятельности. Дело в том, что объекты окружающей нас среды обладают
свойством не только воздействовать на органы чувств, но и находиться друг с другом в
определенных отношениях. Ясно, что для того, чтобы осуществлять в окружающей среде
интеллектуальную деятельность (или хотя бы просто существовать), необходимо иметь в системе
знаний модель этого мира. В этой информационной модели окружающей среды реальные объекты,
их свойства и отношения между ними не только отображаются и запоминаются, но и, как это
отмечено в данном определении интеллекта, могут мысленно "целенаправленно
преобразовываться". При этом существенно то, что формирование модели внешней среды
происходит "в процессе обучения на опыте и адаптации к разнообразным обстоятельствам".
Мы употребили термин интеллектуальная задача. Для того, чтобы пояснить, чем отличается
интеллектуальная задача от просто задачи, необходимо ввести термин "алгоритм" — один из
краеугольных терминов кибернетики.
Под алгоритмом понимают точное предписание о выполнении в определенном порядке системы
операций для решения любой задачи из некоторого данного класса (множества) задач. Термин
"алгоритм" происходит от имени узбекского математика Аль-Хорезми, который еще в IX веке
предложил простейшие арифметические алгоритмы. В математике и кибернетике класс задач
определенного типа считается решенным, когда для ее решения установлен алгоритм. Нахождение
алгоритмов является естественной целью человека при решении им разнообразных классов задач.
Отыскание алгоритма для задач некоторого данного типа связано с тонкими и сложными
рассуждениями, требующими большой изобретательности и высокой квалификации. Принято
считать, что подобного рода деятельность требует участия интеллекта человека. Задачи,
связанные с отысканием алгоритма решения класса задач определенного типа, будем называть
интеллектуальными.

2
Что же касается задач, алгоритмы решения которых уже установлены, то, как отмечает известный
специалист в области ИИ М. Минский, "излишне приписывать им такое мистическое свойства, как
"интеллектуальность". В самом деле, после того, как такой алгоритм уже найден, процесс решения
соответствующих задач становится таким, что его могут в точности выполнить человек,
вычислительная машина (должным образом запрограммированная) или робот, не имеющие ни
малейшего представления о сущность самой задачи. Требуется только, чтобы лицо, решающее
задачу, было способно выполнять те элементарные операции, их которых складывается процесс, и,
кроме того, чтобы оно педантично и аккуратно руководствовалось предложенным алгоритмом.
Такое лицо, действуя, как говорят в таких случаях, чисто машинально, может успешно решать
любую задачу рассматриваемого типа.
Поэтому представляется совершенно естественным исключить их класса интеллектуальных такие
задачи, для которых существуют стандартные методы решения. Примерами таких задач могут
служить чисто вычислительные задачи: решение системы линейных алгебраических уравнений,
численное интегрирование дифференциальных уравнений и т. д. Для решения подобного рода
задач имеются стандартные алгоритмы, представляющие собой определенную последовательность
элементарных операций, которая может быть легко реализована в виде программы для
вычислительной машины. В противоположность этому для широкого класса интеллектуальных
задач, таких, как распознавание образов, игра в шахматы, доказательство теорем и т. п., напротив
это формальное разбиение процесса поиска решения на отдельные элементарные шаги часто
оказывается весьма затруднительным, даже если само их решение несложно.
Таким образом, мы можем перефразировать определение интеллекта как универсальный
сверхалгоритм, который способен создавать алгоритмы решения конкретных задач.
Еще интересным замечанием здесь является то, что профессия программиста, исходя из наших
определений, является одной из самых интеллектуальных, поскольку продуктом деятельности
программиста являются программы — алгоритмы в чистом виде. Именно поэтому, создание даже
элементов ИИ должно очень сильно повысить производительность его труда.
Деятельность мозга (обладающего интеллектом), направленную на решение интеллектуальных
задач, мы будем называть мышлением, или интеллектуальной деятельностью. Интеллект и
мышление органически связаны с решением таких задач, как доказательство теорем, логический
анализ, распознавание ситуаций, планирование поведения, игры и управление в условиях
неопределенности. Характерными чертами интеллекта, проявляющимися в процессе решения
задач, являются способность к обучению, обобщению, накоплению опыта (знаний и навыков) и
адаптации к изменяющимся условиям в процессе решения задач. Благодаря этим качествам
интеллекта мозг может решать разнообразные задачи, а также легко перестраиваться с решения
одной задачи на другую. Таким образом, мозг, наделенный интеллектом, является универсальным
средством решения широкого круга задач (в том числе неформализованных) для которых нет
стандартных, заранее известных методов решения.
Следует иметь в виду, что существуют и другие, чисто поведенческие (функциональные)
определения. Так, по А. Н. Колмогорову, любая материальная система, с которой можно
достаточно долго обсуждать проблемы науки, литературы и искусства, обладает интеллектом.

3
Другим примером поведенческой трактовки интеллекта может служить известное определение А.
Тьюринга. Его смысл заключается в следующем. В разных комнатах находится люди и машина. Они
не могут видеть друг друга, но имеют возможность обмениваться информацией (например, с
помощью электронной почты). Если в процессе диалога между участниками игры людям не удается
установить, что один из участников — машина, то такую машину можно считать обладающей
интеллектом.
Кстати интересен план имитации мышления, предложенный А. Тьюрингом. "Пытаясь имитировать
интеллект взрослого человека, — пишет Тьюринг, — мы вынуждены много размышлять о том
процессе, в результате которого человеческий мозг достиг своего настоящего состояния… Почему
бы нам вместо того, чтобы пытаться создать программу, имитирующую интеллект взрослого
человека, не попытаться создать программу, которая имитировала бы интеллект ребенка? Ведь
если интеллект ребенка получает соответствующее воспитание, он становится интеллектом
взрослого человека… Наш расчет состоит в том, что устройство, ему подобное, может быть легко
запрограммировано… Таким образом, мы расчленим нашу проблему на две части: на задачу
построения "программы-ребенка" и задачу "воспитания" этой программы".
Забегая вперед, можно сказать, что именно этот путь используют практически все системы ИИ.
Ведь понятно, что практически невозможно заложить все знания в достаточно сложную систему.
Кроме того, только на этом пути проявятся перечисленные выше признаки интеллектуальной
деятельности (накопление опыта, адаптация и т. д.).
Философские аспекты проблемы систем ИИ (возможность существования, безопасность,
полезность).
С курсом "Основы проектирования систем ИИ" сложилась ситуация, которая роднит его с
коммунизмом — изучается то, чего еще нет. И если этого не будет в течение ближайших 100 лет,
то очень может быть, что эпоха ИИ на этом окончится.
Исходя из сказанного выше, вытекает основная философская проблема в области ИИ —
возможность или не возможность моделирования мышления человека. В случае если когда-либо
будет получен отрицательный ответ на этот вопрос, то все остальные вопросы курса не будут
иметь не малейшего смысла.
Следовательно, начиная исследование ИИ, мы заранее предполагаем положительный ответ.
Попробуем привести несколько соображений, которые подводят нас к данному ответу.
Первое доказательство является схоластическим, и доказывает непротиворечивость ИИ и Библии.
По-видимому, даже люди далекие от религии, знают слова священного писания: "И создал Господь
человека по образу и подобию своему …". Исходя из этих слов, мы можем заключить, что,
поскольку Господь, во-первых, создал нас, а во-вторых, мы по своей сути подобны ему, то мы
вполне можем создать кого-то по образу и подобию человека.
Создание нового разума биологическим путем для человека дело вполне привычное. Наблюдая за
детьми, мы видим, что большую часть знаний они приобретают путем обучения, а не как
заложенную в них заранее. Данное утверждение на современном уровне не доказано, но по
внешним признакам все выглядит именно так.

4
То, что раньше казалось вершиной человеческого творчества — игра в шахматы, шашки,
распознавание зрительных и звуковых образов, синтез новых технических решений, на практике
оказалось не таким уж сложным делом (теперь работа ведется не на уровне возможности или
невозможности реализации перечисленного, а о нахождении наиболее оптимального алгоритма).
Теперь зачастую данные проблемы даже не относят к проблемам ИИ. Есть надежда, что и полное
моделирование мышления человека окажется не таким уж и сложным делом.
С проблемой воспроизведения своего мышления тесно смыкается проблема возможности
самовоспроизведения.
Способность к самовоспроизведению долгое время считалась прерогативой живых организмов.
Однако некоторые явления, происходящие в неживой природе (например, рост кристаллов, синтез
сложных молекул копированием), очень похожи на самовоспроизведение. В начале 50-х годов Дж.
фон Нейман занялся основательным изучением самовоспроизведения и заложил основы
математической теории "самовоспроизводящихся автоматов". Так же он доказал теоретически
возможность их создания.
Существуют также различные неформальные доказательства возможности самовоспроизведения,
но для программистов самым ярким доказательством, пожалуй, будет существование
компьютерных вирусов.
Принципиальная возможность автоматизации решения интеллектуальных задач с помощью ЭВМ
обеспечивается свойством алгоритмической универсальности. Что же это за свойство?
Алгоритмическая универсальность ЭВМ означает, что на них можно программно реализовывать (т.
е. представить в виде машинной программы) любые алгоритмы преобразования информации, —
будь то вычислительные алгоритмы, алгоритмы управления, поиска доказательства теорем или
композиции мелодий. При этом мы имеем в виду, что процессы, порождаемые этими алгоритмами,
являются потенциально осуществимыми, т. е. что они осуществимы в результате конечного числа
элементарных операций. Практическая осуществимость алгоритмов зависит от имеющихся в нашем
распоряжении средств, которые могут меняться с развитием техники. Так, в связи с появлением
быстродействующих ЭВМ стали практически осуществимыми и такие алгоритмы, которые ранее
были только потенциально осуществимыми.
Однако свойство алгоритмической универсальности не ограничивается констатацией того, что для
всех известных алгоритмов оказывается возможной их программная реализация на ЭВМ.
Содержание этого свойства имеет и характер прогноза на будущее: всякий раз, когда в будущем
какое-либо предписание будет признано алгоритмом, то независимо от того, в какой форме и
какими средствами это предписание будет первоначально выражено, его можно будет задать
также в виде машинной программы.
Однако не следует думать, что вычислительные машины и роботы могут в принципе решать любые
задачи. Анализ разнообразных задач привел математиков к замечательному открытию. Было
строго доказано существование таких типов задач, для которых невозможен единый эффективный
алгоритм, решающий все задачи данного типа; в этом смысле невозможно решение задач такого
типа и с помощью вычислительных машин. Этот факт способствует лучшему пониманию того, что
могут делать машины и чего они не могут сделать. В самом деле, утверждение об алгоритмической

5
неразрешимости некоторого класса задач является не просто признанием того, что такой алгоритм
нам не известен и никем еще не найден. Такое утверждение представляет собой одновременно и
прогноз на все будущие времена о том, что подобного рода алгоритм нам не известен и никем не
будет указан или, и иными словами, что он не существует.
Как же действует человек при решении таких задач? Похоже, что он просто-напросто игнорирует
их, что, однако не мешает ему жить дальше. Другим путем является сужение условий
универсальности задачи, когда она решается только для определенного подмножества начальных
условий. И еще один путь заключается в том, что человек методом "научного тыка" расширяет
множество доступных для себя элементарных операций (например, создает новые материалы,
открывает новые месторождения или типы ядерных реакций).
Следующим философским вопросом ИИ является цель создания. В принципе все, что мы делаем в
практической жизни, обычно направлено на то, чтобы больше ничего не делать. Однако при
достаточно высоком уровне жизни (большом количестве потенциальной энергии) человека на
первые роли выступает уже не лень (в смысле желания экономить энергию), а поисковые
инстинкты. Допустим, что человек сумел создать интеллект, превышающий свой собственный
(пусть не качеством, так количеством). Что теперь будет с человечеством? Какую роль будет
играть человек? Для чего он теперь нужен? Не станет ли он тупой и жирной свиньей? И вообще,
нужно ли в принципе создание ИИ?
По-видимому, самым приемлемым ответом на эти вопросы является концепция "усилителя
интеллекта" (УИ). Я думаю, что здесь уместна аналогия с президентом государства — он не обязан
знать валентности ванадия или языка программирования Java для принятия решения о развитии
ванадиевой промышленности. Каждый занимается своим делом — химик описывает
технологический процесс, программист пишет программу; в конце концов, экономист говорит
президенту, что вложив деньги в промышленный шпионаж, страна получит 20%, а в ванадиевую
промышленность — 30% годовых. Думаю, что при такой постановке вопроса даже самый
последний бомж (правда находящийся в сознании) сможет сделать правильный выбор.
В данном примере президент использует биологический УИ — группу специалистов с их белковыми
мозгами. Но уже сейчас используются и неживые УИ — например мы не могли бы предсказать
погоду без компьютеров, при полетах космических кораблей с самого начала использовались
бортовые счетно-решающие устройства. Кроме того, человек уже давно использует усилители
силы (УС) — понятие, во многом аналогичное УИ. В качестве усилителей силы ему служат
автомобили, краны, электродвигатели, прессы, пушки, самолеты и многое-многое другое.
Основным отличием УИ от УС является наличие воли. Ведь мы не сможем себе представить, чтобы
вдруг серийный "Запорожец" взбунтовался, и стал ездить так, как ему хочется. Не можем
представить именно потому, что ему ничего не хочется, у него нет желаний. В тоже время,
интеллектуальная система, вполне могла бы иметь свои желания, и поступать не так, как нам
хотелось бы. Таким образом перед нами встает еще одна проблема — проблема безопасности.
Данная проблема будоражит умы человечества еще со времен Карела Чапека, впервые
употребившего термин "робот". Большую лепту в обсуждение данной проблемы внесли и другие
писатели-фантасты. Как самые известные мы можем упомянуть серии рассказов писателя-фантаста

6
и ученого Айзека Азимова, а так же довольно свежее произведение — "Терминатор". Кстати
именно у Айзека Азимова мы можем найти самое проработанное, и принятое большинством людей
решение проблемы безопасности. Речь идет о так называемых трех законах роботехники.
Робот не может причинить вред человеку или своим бездействием допустить, чтобы человеку был
причинен вред.
Робот должен повиноваться командам, которые ему дает человек, кроме тех случаев, когда эти
команды противоречат первому закону.
Робот должен заботиться о своей безопасности, насколько это не противоречит первому и
второму закону.
На первый взгляд подобные законы, при их полном соблюдении, должны обеспечить безопасность
человечества. Однако при внимательном рассмотрении возникают некоторые вопросы. Во-первых,
законы сформулированы на человеческом языке, который не допускает простого их перевода в
алгоритмическую форму. Попробуйте, к примеру перевести на любой из известных Вам языков
программирования, такой термин, как "причинить вред". Или "допустить". Попробуйте определить,
что происходит в любом случае, а что он "допустил"?
Далее предположим, что мы сумели переформулировать, данные законы на язык, который
понимает автоматизированная система. Теперь интересно, что будет подразумевать система ИИ
под термином "вред" после долгих логических размышлений? Не решит ли она, что все
существования человека это сплошной вред? Ведь он курит, пьет, с годами стареет и теряет
здоровье, страдает. Не будет ли меньшим злом быстро прекратить эту цепь страданий? Конечно
можно ввести некоторые дополнения, связанные с ценностью жизни, свободой волеизъявления. Но
это уже будут не те простые три закона, которые были в исходнике.
Следующим вопросом будет такой. Что решит система ИИ в ситуации, когда спасение одной жизни
возможно только за счет другой? Особенно интересны те случаи, когда система не имеет полной
информации о том, кто есть кто.
Однако несмотря на перечисленные проблемы, данные законы являются довольно неплохим
неформальным базисом проверки надежности системы безопасности для систем ИИ.
Так что же, неужели нет надежной системы безопасности? Если отталкиваться от концепции УИ, то
можно предложить следующий вариант.
Согласно многочисленным опытам, несмотря на то, что мы не знаем точно, за что отвечает каждый
отдельный нейрон в человеческом мозге, многим из наших эмоций обычно соответствует
возбуждение группы нейронов (нейронный ансамбль) во вполне предсказуемой области. Были
также проведены обратные эксперименты, когда раздражение определенной области вызывало
желаемый результат. Это могли быть эмоции радости, угнетения, страха, агрессивности. Это
наводит на мысль, что в принципе мы вполне могли бы вывести степень "довольности" организма
наружу. В то же время, практически все известные механизмы адаптации и самонастройки (в
первую очередь имеются в виду технические системы), базируются на принципах типа "хорошо" —
"плохо". В математической интерпретации это сведение какой-либо функции к максимуму или к
минимуму. Теперь представим себе, что наш УИ в качестве такой функции использует измеренную
прямо или косвенно, степень удовольствия мозга человека-хозяина. Если принять меры, чтобы

7
исключить самодеструктивную деятельность в состоянии депрессии, а так же предусмотреть
другие особые состояния психики, то получим следующее.
Поскольку предполагается, что нормальный человек, не будет наносить вред самому себе, и, без
особой на то причины, другим, а УИ теперь является частью данного индивидуума (не обязательно
физическая общность), то автоматически выполняются все 3 закона роботехники. При этом
вопросы безопасности смещаются в область психологии и правоохранения, поскольку система
(обученная) не будет делать ничего такого, чего бы не хотел ее владелец.
И теперь осталась еще одна тема — а стоит ли вообще создавать ИИ, может просто закрыть все
работы в этой области? Единственное, что можно сказать по этому поводу — если ИИ возможно
создать, то рано или поздно он будет создан. И лучше его создавать под контролем
общественности, с тщательной проработкой вопросов безопасности, чем он будет создан лет через
100-150 (если к тому времени человечество еще не уничтожит само себя) каким-нибудь
программистом-механиком-самоучкой, использующим достижения современной ему техники. Ведь
сегодня, например, любой грамотный инженер, при наличии определенных денежных ресурсов и
материалов, может изготовить атомную бомбу.

История развития систем ИИ.


Исторически сложились три основных направления в моделировании ИИ.
В рамках первого подхода объектом исследований являются структура и механизмы работы мозга
человека, а конечная цель заключается в раскрытии тайн мышления. Необходимыми этапами
исследований в этом направлении являются построение моделей на основе психофизиологических
данных, проведение экспериментов с ними, выдвижение новых гипотез относительно механизмов
интеллектуальной деятельности, совершенствование моделей и т. д.
Второй подход в качестве объекта исследования рассматривает ИИ. Здесь речь идет о
моделировании интеллектуальной деятельности с помощью вычислительных машин. Целью работ
в этом направлении является создание алгоритмического и программного обеспечения
вычислительных машин, позволяющего решать интеллектуальные задачи не хуже человека.
Наконец, третий подход ориентирован на создание смешанных человеко-машинных, или, как еще
говорят, интерактивных интеллектуальных систем, на симбиоз возможностей естественного и
искусственного интеллекта. Важнейшими проблемами в этих исследованиях является оптимальное
распределение функций между естественным и искусственным интеллектом и организация диалога
между человеком и машиной.
Самыми первыми интеллектуальными задачами, которые стали решаться при помощи ЭВМ были
логические игры (шашки, шахматы), доказательство теорем. Хотя, правда здесь надо отметить еще
кибернетические игрушки типа "электронной мыши" Клода Шеннона, которая управлялась
сложной релейной схемой. Эта мышка могла "исследовать" лабиринт, и находить выход из него. А
кроме того, помещенная в уже известный ей лабиринт, она не искала выход, а сразу же, не
заглядывая в тупиковые ходы, выходила из лабиринта.
Американский кибернетик А. Самуэль составил для вычислительной машины программу, которая
позволяет ей играть в шашки, причем в ходе игры машина обучается или, по крайней мере,

8
создает впечатление, что обучается, улучшая свою игру на основе накопленного опыта. В 1962 г.
эта программа сразилась с Р. Нили, сильнейшим шашистом в США и победила.
Каким образом машине удалось достичь столь высокого класса игры?
Естественно, что в машину были программно заложены правила игры так, что выбор очередного
хода был подчинен этим правилам. На каждой стадии игры машина выбирала очередной ход из
множества возможных ходов согласно некоторому критерию качества игры. В шашках (как и в
шахматах) обычно невыгодно терять свои фигуры, и, напротив, выгодно брать фигуры противника.
Игрок (будь он человек или машина), который сохраняет подвижность своих фигур и право выбора
ходов и в то же время держит под боем большое число полей на доске, обычно играет лучше
своего противника, не придающего значения этим элементам игры. Описанные критерии хорошей
игры сохраняют свою силу на протяжении всей игры, но есть и другие критерии, которые
относятся к отдельным ее стадиям — дебюту, миттэндшпилю, эндшпилю.
Разумно сочетая такие критерии (например в виде линейной комбинации с экспериментально
подбираемыми коэффициентами или более сложным образом), можно для оценки очередного хода
машины получить некоторый числовой показатель эффективности — оценочную функцию. Тогда
машина, сравнив между собой показатели эффективности очередных ходов, выберет ход,
соответствующий наибольшему показателю. Подобная автоматизация выбора очередного хода не
обязательно обеспечивает оптимальный выбор, но все же это какой-то выбор, и на его основе
машина может продолжать игру, совершенствуя свою стратегию (образ действия) в процессе
обучения на прошлом опыте. Формально обучение состоит в подстройке параметров
(коэффициентов) оценочной функции на основе анализа проведенных ходов и игр с учетом их
исхода.
По мнению А. Самуэля, машина, использующая этот вид обучения, может научиться играть лучше,
чем средний игрок, за относительно короткий период времени.
Можно сказать, что все эти элементы интеллекта, продемонстрированные машиной в процессе
игры в шашки, сообщены ей автором программы. Отчасти это так. Но не следует забывать, что
программа эта не является "жесткой", заранее продуманной во всех деталях. Она совершенствует
свою стратегию игры в процессе самообучения. И хотя процесс "мышления" у машины существенно
отличен оттого, что происходит в мозгу играющего в шашки человека, она способна у него
выиграть.
Ярким примером сложной интеллектуальной игры до недавнего времени являлись шахматы. В 1974
г. состоялся международный шахматный турнир машин, снабженных соответствующими
программами. Как известно, победу на этом турнире одержала советская машина с шахматной
программой "Каисса".
Почему здесь употреблено "до недавнего времени"? Дело в том, что недавние события показали,
что несмотря на довольно большую сложность шахмат, и невозможность, в связи с этим
произвести полный перебор ходов, возможность перебора их на большую глубину, чем обычно,
очень увеличивает шансы на победу. К примеру, по сообщениям в печати, компьютер фирмы IBM,
победивший Каспарова, имел 256 процессоров, каждый из которых имел 4 Гб дисковой памяти и
128 Мб оперативной. Весь этот комплекс мог просчитывать более 100'000'000 ходов в секунду. До

9
недавнего времени редкостью был компьютер, могущий делать такое количество целочисленных
операций в секунду, а здесь мы говорим о ходах, которые должны быть сгенерированы и для
которых просчитаны оценочные функции. Хотя с другой стороны, этот пример говорит о
могуществе и универсальности переборных алгоритмов.
В настоящее время существуют и успешно применяются программы, позволяющие машинам играть
в деловые или военные игры, имеющие большое прикладное значение. Здесь также чрезвычайно
важно придать программам присущие человеку способность к обучению и адаптации. Одной из
наиболее интересных интеллектуальных задач, также имеющей огромное прикладное значение,
является задача обучения распознавания образов и ситуаций. Решением ее занимались и
продолжают заниматься представители различных наук — физиологи, психологи, математики,
инженеры. Такой интерес к задаче стимулировался фантастическими перспективами широкого
практического использования результатов теоретических исследований: читающие автоматы,
системы ИИ, ставящие медицинские диагнозы, проводящие криминалистическую экспертизу и т. п.,
а также роботы, способные распознавать и анализировать сложные сенсорные ситуации.
В 1957 г. американский физиолог Ф. Розенблатт предложил модель зрительного восприятия и
распознавания — перцептрон. Появление машины, способной обучаться понятиям и распознавать
предъявляемые объекты, оказалось чрезвычайно интересным не только физиологам, но и
представителям других областей знания и породило большой поток теоретических и
экспериментальных исследований.
Перцептрон или любая программа, имитирующая процесс распознавания, работают в двух
режимах: в режиме обучения и в режиме распознавания. В режиме обучения некто (человек,
машина, робот или природа), играющий роль учителя, предъявляет машине объекты и о каждом их
них сообщает, к какому понятию (классу) он принадлежит. По этим данным строится решающее
правило, являющееся, по существу, формальным описанием понятий. В режиме распознавания
машине предъявляются новые объекты (вообще говоря, отличные от ранее предъявленных), и она
должна их классифицировать, по возможности, правильно.
Проблема обучения распознаванию тесно связана с другой интеллектуальной задачей —
проблемой перевода с одного языка на другой, а также обучения машины языку. При достаточно
формальной обработке и классификации основных грамматических правил и приемов пользования
словарем можно создать вполне удовлетворительный алгоритм для перевода, скажем научного или
делового текста. Для некоторых языков такие системы были созданы еще в конце 60-г. Однако для
того, чтобы связно перевести достаточно большой разговорный текст, необходимо понимать его
смысл. Работы над такими программами ведутся уже давно, но до полного успеха еще далеко.
Имеются также программы, обеспечивающие диалог между человеком и машиной на урезанном
естественном языке.
Что же касается моделирования логического мышления, то хорошей модельной задачей здесь
может служить задача автоматизации доказательства теорем. Начиная с 1960 г., был разработан
ряд программ, способных находить доказательства теорем в исчислении предикатов первого
порядка. Эти программы обладают, по словам американского специалиста в области ИИ Дж.
Маккатти, "здравым смыслом", т. е. способностью делать дедуктивные заключения.

10
В программе К. Грина и др., реализующей вопросно-ответную систему, знания записываются на
языке логики предикатов в виде набора аксиом, а вопросы, задаваемые машине, формулируются
как подлежащие доказательству теоремы. Большой интерес представляет "интеллектуальная"
программа американского математика Хао Ванга. Эта программа за 3 минуты работы IBM-704
вывела 220 относительно простых лемм и теорем из фундаментальной математической
монографии, а затем за 8.5 мин выдала доказательства еще 130 более сложных теорем, часть их
которых еще не была выведена математиками. Правда, до сих пор ни одна программа не вывела и
не доказала ни одной теоремы, которая бы, что называется "позарез" была бы нужна математикам
и была бы принципиально новой.
Очень большим направлением систем ИИ является роботехника. В чем основное отличие
интеллекта робота от интеллекта универсальных вычислительных машин?
Для ответа на этот вопрос уместно вспомнить принадлежащее великому русскому физиологу И. М.
Сеченову высказывание: "… все бесконечное разнообразие внешних проявлений мозговой
деятельности сводится окончательно лишь к одному явлению — мышечному движению". Другими
словами, вся интеллектуальная деятельность человека направлена в конечном счете на активное
взаимодействие с внешним миром посредством движений. Точно так же элементы интеллекта
робота служат прежде всего для организации его целенаправленных движений. В то же время
основное назначение чисто компьютерных систем ИИ состоит в решении интеллектуальных задач,
носящих абстрактный или вспомогательный характер, которые обычно не связаны ни с
восприятием окружающей среды с помощью искусственных органов чувств, ни с организацией
движений исполнительных механизмов.
Первых роботов трудно назвать интеллектуальными. Только в 60-х годах появились очуствленные
роботы, которые управлялись универсальными компьютерами. К примеру в 1969 г. в
Электротехнической лаборатории (Япония) началась разработка проекта "промышленный
интеллектуальный робот". Цель этой разработки — создание очуствленного манипуляционного
робота с элементами искусственного интеллекта для выполнения сборочно-монтажных работ с
визуальным контролем.
Манипулятор робота имеет шесть степеней свободы и управляется мини-ЭВМ NEAC-3100 (объем
оперативной памяти 32000 слов, объем внешней памяти на магнитных дисках 273000 слов),
формирующей требуемое программное движение, которое отрабатывается следящей
электрогидравлической системой. Схват манипулятора оснащен тактильными датчиками.
В качестве системы зрительного восприятия используются две телевизионные камеры, снабженные
красно-зелено-синими фильтрами для распознавания цвета предметов. Поле зрения
телевизионной камеры разбито на 64*64 ячеек. В результате обработки полученной информации
грубо определяется область, занимаемая интересующим робота предметом. Далее, с целью
детального изучения этого предмета выявленная область вновь делится на 4096 ячеек. В том
случае, когда предмет не помещается в выбранное "окошко", оно автоматически перемещается,
подобно тому, как человек скользит взглядом по предмету. Робот Электротехнической
лаборатории был способен распознавать простые предметы, ограниченные плоскостями и

11
цилиндрическими поверхностями при специальном освещении. Стоимость данного
экспериментального образца составляла примерно 400000 долларов.
Постепенно характеристики роботов монотонно улучшались, Но до сих пор они еще далеки по
понятливости от человека, хотя некоторые операции уже выполняют на уровне лучших жонглеров.
К примеру удерживают на лезвии ножа шарик от настольного тенниса.
Еще пожалуй здесь можно выделить работы киевского Института кибернетики, где под
руководством Н. М. Амосова и В. М. Глушкова (ныне покойного) ведется комплекс исследований,
направленных на разработку элементов интеллекта роботов. Особое внимание в этих
исследованиях уделяется проблемам распознавания изображений и речи, логического вывода
(автоматического доказательства теорем) и управления с помощью нейроподобных сетей.
К примеру можно рассмотреть созданный еще в 70-х годах макет транспортного автономного
интегрального робота (ТАИР). Конструктивно ТАИР представляет собой трехколесное шасси, на
котором смонтирована сенсорная система и блок управления. Сенсорная система включает в себя
следующие средства очуствления: оптический дальномер, навигационная система с двумя
радиомаяками и компасом, контактные датчики, датчики углов наклона тележки, таймер и др. И
особенность, которая отличает ТАИР от многих других систем, созданных у нас и за рубежом, это
то, что в его составе нет компьютера в том виде, к которому мы привыкли. Основу системы
управления составляет бортовая нейроподобная сеть, на которой реализуются различные
алгоритмы обработки сенсорной информации, планирования поведения и управления движением
робота.
В конце данного очень краткого обзора рассмотрим примеры крупномасштабных экспертных
систем.
MICIN — экспертная система для медицинской диагностики. Разработана группой по
инфекционным заболеваниям Стенфордского университета. Ставит соответствующий диагноз,
исходя из представленных ей симптомов, и рекомендует курс медикаментозного лечения любой из
диагностированных инфекций. База данных состоит из 450 правил.
PUFF — анализ нарушения дыхания. Данная система представляет собой MICIN, из которой
удалили данные по инфекциям и вставили данные о легочных заболеваниях.
DENDRAL — распознавание химических структур. Данная система старейшая, из имеющих звание
экспертных. Первые версии данной системы появились еще в 1965 году во все том же
Стенфордском университете. Пользователь дает системе DENDRAL некоторую информацию о
веществе, а также данные спектрометрии (инфракрасной, ядерного магнитного резонанса и масс-
спектрометрии), и та в свою очередь выдает диагноз в виде соответствующей химической
структуры.
PROSPECTOR — экспертная система, созданная для содействия поиску коммерчески оправданных
месторождений полезных ископаемых.

12
Лекция 2. Классификация интеллектуальных информационных систем
Особенности и признаки интеллектуальности информационных систем. Системы с
интеллектуальным интерфейсом. Экспертные системы. Самообучающиеся системы.
Адаптивные информационные системы.

Особенности и признаки интеллектуальности информационных систем

Любая информационная система (ИС) выполняет следующие функции: воспринимает


вводимые пользователем информационные запросы и необходимые исходные данные,
обрабатывает введенные и хранимые в системе данные в соответствии с известным алгоритмом и
формирует требуемую выходную информацию. С точки зрения реализации перечисленных
функций ИС можно рассматривать как фабрику, производящую информацию, в которой заказом
является информационный запрос, сырьем - исходные данные, продуктом - требуемая
информация, а инструментом (оборудованием) - знание, с помощью которого данные
преобразуются в информацию.
Знание имеет двоякую природу: фактуальную и операционную.
 Фактуальное знание - это осмысленные и понятые данные. Данные сами по себе - это
специально организованные знаки на каком-либо носителе.
 Операционное знание - это те общие зависимости между фактами, которые позволяют
интерпретировать данные или извлекать из них информацию. Информация по сути - это новое
и полезное знание для решения каких-либо задач.
Часто фактуальное знание называют экстенсиональным (детализированным), а
операционное знание - интенсиональным (обобщенным).
Процесс извлечения информации из данных сводится к адекватному соединению
операционного и фактуального знаний и в различных типах ИС выполняется по-разному. Самый
простой путь их соединения заключается в рамках одной прикладной программы:

Программа = Алгоритм (Правила преобразования данных +


Управляющая структура) + Структура данных

Таким образом, операционное знание (алгоритм) и фактуальное знание (структура данных)


неотделимы друг от друга. Однако, если в ходе эксплуатации ИС выяснится потребность в
модификации одного из двух компонентов программы, то возникнет необходимость ее
переписывания. Это объясняется тем, что полным знанием проблемной области обладает только
разработчик ИС, а программа служит “недумающим исполнителем” знания разработчика. Конечный
же пользователь вследствие процедурности и машинной ориентированности представления знаний
понимает лишь внешнюю сторону процесса обработки данных и никак не может на него влиять.
Следствием перечисленных недостатков является плохая жизнеспособность ИС или
неадаптивность к изменениям информационных потребностей. Кроме того, в силу

13
детерминированности алгоритмов решаемых задач ИС не способна к формированию у
пользователя знания о действиях в не полностью определенных ситуациях.
В системах, основанных на обработке баз данных (СБД - Data Base Systems), происходит
отделение фактуального и операционного знаний друг от друга. Первое организуется в виде базы
данных, второе - в виде программ. Причем программа может автоматически генерироваться по
запросу пользователя (например, реализация SQL или QBE запросов). В качестве посредника
между программой и базой данных выступает программный инструмент доступа к данным -
система управления базой данных (СУБД):

СБД = Программа <=> СУБД <=> База данных

Концепция независимости программ от данных позволяет повысить гибкость ИС по


выполнению произвольных информационных запросов. Однако, эта гибкость в силу процедурности
представления операционного знания имеет четко определенные границы. Для формулирования
информационного запроса пользователь должен ясно представлять себе структуру базы данных и
до определенной степени алгоритм решения задачи. Следовательно, пользователь должен
достаточно хорошо разбираться в проблемной области, в логической структуре базы данных и
алгоритме программы. Концептуальная схема базы данных выступает в основном только в роли
промежуточного звена в процессе отображения логической структуры данных на структуру данных
прикладной программы.
Общие недостатки традиционных информационных систем, к которым относятся системы
первых двух типов, заключаются в слабой адаптивности к изменениям в предметной области и
информационным потребностям пользователей, в невозможности решать плохо формализуемые
задачи, с которыми управленческие работники постоянно имеют дело. Перечисленные недостатки
устраняются в интеллектуальных информационных системах (ИИС).
Анализ структуры программы показывает возможность выделения из программы
операционного знания (правил преобразования данных) в так называемую базу знаний, которая в
декларативной форме хранит общие для различных задач единицы знаний. При этом управляющая
структура приобретает характер универсального механизма решения задач (механизма вывода),
который связывает единицы знаний в исполняемые цепочки (генерируемые алгоритмы) в
зависимости от конкретной постановки задачи (сформулированной в запросе цели и исходных
условий). Такие ИС становятся системами, основанными на обработке знаний (СБЗ - Knowledge
Base (Based) Systems):

СБЗ = База знаний <=> Управляющая структура <=> База данных


(Механизм вывода)

Следующим шагом в развитии интеллектуальных информационных систем является


выделение в самостоятельную подсистему или репозиторий метазнания, описывающего структуру
операционного и фактуального знания и отражающего модель проблемной области. В таких

14
системах и программы, и структуры данных генерируются или компонуются из единиц знаний,
описанных в репозитории, каждый раз при изменении модели проблемной области. Будем
называть ИИС, обрабатывающие метазнание, системами, основанными на моделях (СБМ - Model
Based Systems):

СБМ = Репозиторий <=> Механизм => База данных


Модель данных генерации
Модель операций или => Программы
Правила связи конфигурации

Для интеллектуальных информационных систем, ориентированных на генерацию


алгоритмов решения задач, характерны следующие признаки:
 развитые коммуникативные способности,
 умение решать сложные плохо формализуемые задачи,
 способность к самообучению,
 адаптивность.
Коммуникативные способности ИИС характеризуют способ взаимодействия (интерфейса)
конечного пользователя с системой, в частности, возможность формулирования произвольного
запроса в диалоге с ИИС на языке, максимально приближенном к естественному.
Сложные плохо формализуемые задачи - это задачи, которые требуют построения
оригинального алгоритма решения в зависимости от конкретной ситуации, для которой могут быть
характерны неопределенность и динамичность исходных данных и знаний.
Способность к самообучению - это возможность автоматического извлечения знаний для
решения задач из накопленного опыта конкретных ситуаций.
Адаптивность - способность к развитию системы в соответствии с объективными
изменениями модели проблемной области.
В различных ИИС перечисленные признаки интеллектуальности развиты в неодинаковой
степени и редко, когда все четыре признака реализуются одновременно. Условно каждому из
признаков интеллектуальности соответствует свой класс ИИС (рис. 1.1):
 Системы с интеллектуальным интерфейсом;
 Экспертные системы;
 Самообучающиеся системы;
 Адаптивные системы.

Системы с интеллектуальным интерфейсом

Интеллектуальные базы данных отличаются от обычных баз данных возможностью


выборки по запросу необходимой информации, которая может явно не храниться, а выводиться из
имеющейся в базе данных. Примерами таких запросов могут быть следующие:
- “Вывести список товаров, цена которых выше среднеотраслевой”,
- “Вывести список товаров-заменителей некоторой продукции”,

15
- “Вывести список потенциальных покупателей некоторого товара” и т.д.
Для выполнения первого типа запроса необходимо сначала проведение статистического
расчета среднеотраслевой цены по всей базе данных, а уже после этого собственно отбор данных.
Для выполнения второго типа запроса необходимо вывести значения характерных признаков
объекта, а затем поиск по ним аналогичных объектов. Для третьего типа запроса требуется
сначала определить список посредников-продавцов, выполняющих продажу данного товара, а
затем провести поиск связанных с ними покупателей.
Во всех перечисленных типах запросов требуется осуществить поиск по условию, которое
должно быть доопределено в ходе решения задачи. Интеллектуальная система без помощи
пользователя по структуре базы данных сама строит путь доступа к файлам данных.
Формулирование запроса осуществляется в диалоге с пользователем, последовательность шагов
которого выполняется в максимально удобной для пользователя форме. Запрос к базе данных
может формулироваться и с помощью естественно-языкового интерфейса.
Естественно-языковой интерфейс предполагает трансляцию естественно-языковых
конструкций на внутримашинный уровень представления знаний. Для этого необходимо решать
задачи морфологического, синтаксического и семантического анализа и синтеза высказываний на
естественном языке. Так, морфологический анализ предполагает распознавание и проверку
правильности написания слов по словарям, синтаксический контроль - разложение входных
сообщений на отдельные компоненты (определение структуры) с проверкой соответствия
грамматическим правилам внутреннего представления знаний и выявления недостающих частей и,
наконец, семантический анализ - установление смысловой правильности синтаксических
конструкций. Синтез высказываний решает обратную задачу преобразования внутреннего
представления информации в естественно-языковое.
Естественно-языковый интерфейс используется для:
 доступа к интеллектуальным базам данных;
 контекстного поиска документальной текстовой информации;
 голосового ввода команд в системах управления;
 машинного перевода c иностранных языков.
Гипертекстовые системы предназначены для реализации поиска по ключевым словам в
базах текстовой информации. Интеллектуальные гипертекстовые системы отличаются
возможностью более сложной семантической организации ключевых слов, которая отражает
различные смысловые отношения терминов. Таким образом, механизм поиска работает прежде
всего с базой знаний ключевых слов, а уже затем непосредственно с текстом. В более широком
плане сказанное распространяется и на поиск мультимедийной информации, включающей
помимо текстовой и цифровой информации графические, аудио и видео- образы.
Системы контекстной помощи можно рассматривать, как частный случай интеллектуальных
гипертекстовых и естественно-языковых систем. В отличие от обычных систем помощи,
навязывающих пользователю схему поиска требуемой информации, в системах контекстной
помощи пользователь описывает проблему (ситуацию), а система с помощью дополнительного
диалога ее конкретизирует и сама выполняет поиск относящихся к ситуации рекомендаций. Такие

16
системы относятся к классу систем распространения знаний (Knowledge Publishing) и создаются как
приложение к системам документации (например, технической документации по эксплуатации
товаров).
Системы когнитивной графики позволяют осуществлять интерфейс пользователя с ИИС с
помощью графических образов, которые генерируются в соответствии с происходящими
событиями. Такие системы используются в мониторинге и управлении оперативными процессами.
Графические образы в наглядном и интегрированном виде описывают множество параметров
изучаемой ситуации. Например, состояние сложного управляемого объекта отображается в виде
человеческого лица, на котором каждая черта отвечает за какой-либо параметр, а общее
выражение лица дает интегрированную характеристику ситуации.
Системы когнитивной графики широко используются также в обучающих и тренажерных
системах на основе использования принципов виртуальной реальности, когда графические образы
моделируют ситуации, в которых обучаемому необходимо принимать решения и выполнять
определенные действия.
Экспертные системы

Назначение экспертных систем заключается в решении достаточно трудных для


экспертов задач на основе накапливаемой базы знаний, отражающей опыт работы экспертов в
рассматриваемой проблемной области. Достоинство применения экспертных систем заключается в
возможности принятия решений в уникальных ситуациях, для которых алгоритм заранее не
известен и формируется по исходным данным в виде цепочки рассуждений (правил принятия
решений) из базы знаний. Причем решение задач предполагается осуществлять в условиях
неполноты, недостоверности, многозначности исходной информации и качественных оценок
процессов.
Экспертная система является инструментом, усиливающим интеллектуальные способности
эксперта, и может выполнять следующие роли:
 консультанта для неопытных или непрофессиональных пользователей;
 ассистента в связи с необходимостью анализа экспертом различных вариантов принятия
решений;
 партнера эксперта по вопросам, относящимся к источникам знаний из смежных областей
деятельности.
Экспертные системы используются во многих областях, среди которых лидирует сегмент
приложений в бизнесе

Самообучающиеся системы

В основе самообучающихся систем лежат методы автоматической классификации


примеров ситуаций реальной практики (обучения на примерах). Примеры реальных ситуаций
накапливаются за некоторый исторический период и составляют обучающую выборку. Эти
примеры описываются множеством признаков классификации. Причем обучающая выборка может
быть:

17
 “с учителем”, когда для каждого примера задается в явном виде значение признака его
принадлежности некоторому классу ситуаций (классообразующего признака);
 “без учителя”, когда по степени близости значений признаков классификации система сама
выделяет классы ситуаций.
В результате обучения системы автоматически строятся обобщенные правила или функции,
определяющие принадлежность ситуаций классам, которыми обученная система пользуется при
интерпретации новых возникающих ситуаций. Таким образом, автоматически формируется база
знаний, используемая при решении задач классификации и прогнозирования. Эта база знаний
периодически автоматически корректируется по мере накопления опыта реальных ситуаций, что
позволяет сократить затраты на ее создание и обновление.
Общие недостатки, свойственные всем самообучающимся системам, заключаются в
следующем:
 возможна неполнота и/или зашумленность (избыточность) обучающей выборки и, как
следствие, относительная адекватность базы знаний возникающим проблемам;
 возникают проблемы, связанные с плохой смысловой ясностью зависимостей признаков и, как
следствие, неспособность объяснения пользователям получаемых результатов;
 ограничения в размерности признакового пространства вызывают неглубокое описание
проблемной области и узкую направленность применения.

Системы, основанные на прецедентах (Case-based reasoning). В этих системах база знаний


содержит описания не обобщенных ситуаций, а собственно сами ситуации или прецеденты. Тогда
поиск решения проблемы сводится к поиску по аналогии (абдуктивному выводу от частного к
частному):
1. Получение подробной информации о текущей проблеме;
2. Сопоставление полученной информации со значениями признаков прецедентов из базы знаний;
3. Выбор прецедента из базы знаний, наиболее близкого к рассматриваемой проблеме;
4. В случае необходимости выполняется адаптация выбранного прецедента к текущей проблеме;
5. Проверка корректности каждого полученного решения;
6. Занесение детальной информации о полученном решении в базу знаний.
Так же как и для индуктивных систем прецеденты описываются множеством признаков, по
которым строятся индексы быстрого поиска. Но в отличие от индуктивных систем допускается
нечеткий поиск с получением множества допустимых альтернатив, каждая из которых
оценивается некоторым коэффициентом уверенности. Далее наиболее подходящие решения
адаптируются по специальным алгоритмам к реальным ситуациям. Обучение системы сводится к
запоминанию каждой новой обработанной ситуации с принятыми решениями в базе прецедентов.
Системы, основанные на прецедентах, применяются как системы распространения знаний с
расширенными возможностями или как в системах контекстной помощи (рис. 1.14.).

Описание ситуации (проблемы)


Не печатает принтер
Вопросы

18
Включено ли питание? да
Прошло ли тестирование? да
Замята ли бумага? да
Подключен ли драйвер? не знаю
Действия
Освободите бумагу уверенность 80
Загрузите драйвер уверенность 50
Вызовите тех. персонал уверенность 10

Рис. 1.14. Пример диалога с CBR-системой

В качестве примера инструментального средства поддержки баз знаний прецедентов,


распространяемого в России, можно назвать систему CBR-Express (Inference, дистрибьютор фирма
Метатехнология).

Информационные хранилища (Data Warehouse). В отличие от интеллектуальной базы


данных информационное хранилище представляет собой хранилище извлеченной значимой
информации из оперативной базы данных, которое предназначено для оперативного анализа
данных (реализации OLAP - технологии). Извлечение знаний из баз данных осуществляется
регулярно, например, ежедневно.
Типичными задачами оперативного ситуационного анализа являются:
 Определение профиля потребителей конкретного товара;
 Предсказание изменений ситуации на рынке;
 Анализ зависимостей признаков ситуаций (корреляционный анализ) и др.
Для извлечения значимой информации из баз данных используются специальные методы
(Data Mining или Knowledge Discovery), основанные или на применении многомерных
статистических таблиц, или индуктивных методов построения деревьев решений, или нейронных
сетей. Формулирование запроса осуществляется в результате применения интеллектуального
интерфейса, позволяющего в диалоге гибко определять значимые признаки анализа.
Применение информационных хранилищ на практике все в большей степени
демонстрирует необходимость интеграции интеллектуальных и традиционных информационных
технологий, комбинированное использование различных методов представления и вывода
знаний, усложнение архитектуры информационных систем.
Разработкой и распространением информационных хранилищ в настоящее время
занимаются такие компьютерные фирмы, как IBM (Intelligent Miner), Silicon Graphics (MineSet),
Intersolv (DataDirect, SmartData), Oracle (Express), SAS Institute (SAS/Assist) и др.

Адаптивные информационные системы


В условиях динамического развития экономических объектов возрастают требования к
адаптивности информационных систем к изменениям. Эти требования сводятся к следующему:
 ИС в каждый момент времени должна адекватно поддерживать организацию бизнес-процессов.

19
 Реконструкция ИС должна проводиться всякий раз, как возникает потребность в реорганизации
бизнес-процессов.
 Реконструкция ИС должна проводиться быстро и с минимальными затратами.
Учитывая высокую динамичность современных бизнес-процессов, можно сделать вывод о
том, что адаптивность ИС немыслима без интеллектуализации ее архитектуры. Ядром
адаптивной ИС является постоянно развиваемая модель проблемной области (предприятия),
поддерживаемая в специальной базе знаний - репозитории, на основе которого осуществляется
генерация или конфигурация программного обеспечения. Таким образом, проектирование и
адаптация ИС сводится, прежде всего, к построению модели проблемной области и ее
своевременной корректировке.
При проектировании информационной системы обычно используются два подхода:
оригинальное или типовое проектирование. Первый подход предполагает разработку
информационной системы “с чистого листа” в соответствии с требованиями экономического
объекта, второй подход - адаптацию типовых разработок к особенностям экономического объекта.
Первый подход, как правило, реализуется на основе применения систем автоматизированного
проектирования ИС или CASE-технологий, например, таких как, Designer 2000 (Oracle),
SilverRun (SilverRun Technology), Natural LightStorm (Software AG) и др., второй подход - на основе
применения систем компонентного проектирования ИС , например, таких как R/3 (SAP), BAAN
IV (Baan Corp), Prodis (Software AG), Галактика (Новый Атлант) и др.
С точки зрения адаптивности информационной системы к бизнес-процессам
экономического объекта оба подхода ориентируются на предварительное тщательное изучение
экономического объекта и его моделирование [ 6 ]. Отличие подходов заключается в следующем:
при использовании CASE-технологии на основе репозитория при возникновении изменения
выполняется каждый раз генерация (пересоздание) программного обеспечения, а при
использовании компонентной технологии - конфигурация программ и только в редких случаях их
переработка с помощью CASE - средств, например, использования языков четвертого поколения
(4GL).
Для моделирования проблемной области и последующих конфигураций информационной
системы из отдельных компонентов (программных модулей) используется специальный
программный инструментарий, например, R/3 Business Engineer и BAAN Orgware. Несомненным
достоинством применения модельно-ориентированных компонентных систем, таких как R/3 или
BAAN IV, перед CASE - технологиями является накапливание опыта проектирования
информационных систем для различных отраслей и типов производства в виде типовых моделей
или так называемых референтных/ссылочных (reference) моделей, которые поставляются
вместе с программным продуктом в форме наполненного репозитория. Таким образом, вместе с
программным продуктом пользователи приобретают базу знаний «know-how» об эффективных
методах организации и управления бизнес-процессами, которые можно адаптировать в
соответствии со спецификой конкретного экономического объекта.
В обобщенном виде конфигурация адаптивных информационных систем на основе
компонентной технологии [ 18 ] представлена на рис. 1.15.

20
Базовая модель

Объекты Функции Правила

Процессы

Модель Типовая
предприятия : модель :
Объекты Репозиторий Объекты
Функции Типовая
Функции
Процессы модель :
Процессы
Объекты
Типовая
Функции
Процессы :
модель
Объекты
Функции
Конфигурация Процессы
информационной
системы

Информационная
система
предприятия

Рис. 1.15. Конфигурация адаптивной информационной системы на основе компонентной


технологии

Базовая модель репозитория содержит описание объектов, функций (операций),


процессов (совокупности операций), которые реализуются в программных модулях
компонентной системы. При этом большое значение в базовой модели имеет задание правил
(бизнес-правил) поддержания целостности информационной системы, которые устанавливают
условия проверки корректности совместного применения операций бизнес-процессов и
поддерживающих их программных модулей. Таким образом, многообразие и гибкость определения
бизнес-процессов и соответствующих конфигураций информационной системы задается с помощью
набора бизнес-правил.
Типовые модели соответствуют типовым конфигурациям информационной системы,
выполненным для определенных отраслей (автомобильная, электронная, нефтегазовая и т.д.) или
типов производства (индивидуальное, серийное, массовое, непрерывное и т.д.).
Модель предприятия (проблемной области) строится либо путем привязки или
копирования фрагментов основной или типовой моделей в соответствии со специфическим
особенностями предприятия, например, как в инструментальном средстве BAAN Orgware, либо в
результате просмотра этих моделей и экспертного опроса, как в инструментальном средстве R/3

21
Business Engineer. Причем в последнем случае пользователю предлагается определить значения
не всех параметров, а только тех, которые связаны между собой в контексте диалога и описаны
бизнес-правилами.
Сформированная модель предприятия в виде метаописания хранится в репозитории и при
необходимости может быть откорректирована. Далее по сформированной модели предприятия
автоматически осуществляется конфигурация информационной системы, в ходе которой
выполняется. семантический контроль по соответствующим бизнес-правилам.
Недостатками описанной схемы конфигурации информационной системы является
отсутствие средств оценки модели предприятия. Для того, чтобы можно было выбирать
оптимальные варианты конфигурации информационной системы, как правило, используются
средства экспорта модели во внешние системы моделирования. Так, для системы R/3 предусмотрен
экспорт(импорт) моделей в(из) среду(ы) инструментального средства ARIS Toolset, который
позволяет осуществлять функционально-стоимостной анализ эффективности моделируемых
бизнес-процессов и их динамическое имитационное моделирование.

22
Лекция 3. Экспертные системы – системы, базирующиеся на знаниях.

Экспертные системы (ЭС) - основная разновидность ИИС. Функциональные


возможности и характеристика ЭС. Области применения экспертных систем.
Статические и динамические экспертные системы.

Экспертные системы – основная разновидность интеллектуальных систем.


Название «экспертная система» происходит из термина «экспертная система, базирующаяся
на знаниях». Экспертная система – это система, которая использует человеческие знания,
встраиваемые в компьютер, для решения задач, которые обычно требуют человеческой
экспертизы. Хорошо разработанные системы имитируют процесс рассуждения экспертов, используя
это для решения специфических задач.
Такие системы могут использоваться не экспертом для улучшения их способностей и
возможностей в решении задач определенного класса в конкретной предметной области. ЭС могут
быть также использованы для распространения источников редких знаний.
В конечном счете, такие системы могут функционировать лучше, чем некоторые отдельные
эксперты - люди при выработке решения или суждения в специфической, обычно узкой области
экспертизы.
Эта возможность может иметь значительное влияние как на деятельность таких
профессиональных консультантов, как финансовые аналитики, юристы, аудиторы и др., так и на
организации и их менеджмент.
Технологию построения ЭС часто называют инженерией знаний. Этот процесс требует
специфической формы взаимодействия создателя ЭС, которого называют инженером знаний, и
одного или нескольких экспертов в некоторой предметной области. Инженер знаний «извлекает»
из экспертов процедуры, стратегии, эмпирические правила, которые они используют при решении
задач и встраивает эти знания в ЭС (см.рис.4.1) [61]

Рис.4.1. Процесс построения ЭС.


ЭС – это сложные программы, которые манипулируют знаниями в целях получения
эффективного решения в узкой предметной области. Как и настоящий человек – эксперт, эти

23
системы используют символическую логику и эвристики (эмпирические правила) чтобы найти
решения. И, они могут ошибаться, но обладают способностью учиться на своих ошибках.
Основные понятия ЭС. Основными понятиями ЭС являются: экспертиза, эксперты,
проведение экспертизы, вывод и объяснительные способности.
Экспертиза – это обширное, специфическое знание для решения задачи, извлеченное из
обучения, чтения и опыта. Следующие типы знаний являются примерами того, что включает себя
экспертиза:
- теории о проблемной области;
- правила и процедуры относительно проблемной области;
- правила (эвристики) о том, что делать в данной проблемной ситуации;
- глобальные стратегии для решения таких типов задач;
- мета - знания (знания о знаниях);
- факты о проблемной области.
Эти типы знаний дают возможность ЛПР принимать решения лучше и быстрее при решении
сложных задач.
Эксперты. Трудно дать определение понятию эксперт, т.к. мы в действительности говорим о
разных степенях или уровнях экспертизы. Вопросом является также каким объемом экспертных
знаний в данной области и какими навыками должен обладать, чтобы быть квалифицированным в
качестве эксперта?
Обычно, человеческая экспертиза включает многогранное интеллектуальное поведение,
которое вовлекает в процесс следующие виды деятельности.
- выявление и формулировка проблемы и задачи;
- решение задачи быстро и надлежащим образом;
- объяснение решения;
- обучение из опыта;
- реструктуризация знаний;
- при необходимости от устоявшихся правил и шаблонов;
- определение уместности и соответствия;
- осознание ограничений.
Для имитации эксперта – человека необходимо создать компьютерную систему,
проявляющую все эти характеристики. Однако в современных ЭС прежде всего исследованы и
разработаны вторая и третья из этих видов деятельности (решение задач и объяснение решений).
Проведение экспертизы. Целью ЭС является проведение экспертизы путем аккумуляции
знаний от экспертов и предоставлению их другим людям (неэкспертам). В этот процесс вовлечены
четыре вида деятельности: извлечение знаний (из экспертов или других источников),
представление знаний (в компьютере), вывод знаний и передача знаний пользователю. Знания
хранятся в компьютере в базе знаний (БЗ).
Вывод. Уникальной чертой ЭС является их способность рассуждать («думать»). Имеется в
виду, что необходимые знания для экспертизы хранятся в БЗ, программа может иметь доступ к
соответствующим данным в БД, а ЭС может делать логический вывод, получая нужное знание,

24
зачастую не хранящееся в явном виде в БЗ. Процесс вывода осуществляется составляющей
системы, которая называется машина вывода.
Способность объяснять. Другой уникальной чертой ЭС является ее способность объяснять
свои советы или рекомендации. Объяснение и обоснование производятся подсистемой объяснений.
Она дает возможность системе проверять свои рассуждения и объяснять их действия.
Принципам построения и разработке ЭС посвящено огромное количество публикаций.
Помимо приведенных фундаментальных работ Фейгенбаума и Уотермана [78,61], интерес
представляют [50,68,67,20].
Из отечественных можно назвать [49,46,42].

Функциональные возможности и характеристика ЭС.


Основными характеристиками ЭС являются:
- накопление и организация знаний – одна из самых важных характеристик ЭС;
- знания – основа ЭС, они являются явными и доступными, что отличает эти системы от
большинства традиционных программ;
- ЭС применяет для решения проблем высококачественный опыт квалифицированных
экспертов. Именно высококачественный опыт в сочетании с умением его применять делает
системы рентабельной. Этому также способствует гибкость системы;
- Наличие прогностических способностей. ЭС может объяснить каким образом новая
ситуация привела к изменениям;
- Ведущие специалисты уходят, но их опыт остается и используется в ЭС;
- ЭС можно использовать для обучения и тренировки.
Преимущества ЭС.
Затем разрабатывать ЭС. Не лучше ли обратится к человеческому опыту как это было в
прошлом. Приведем доводы в пользу ЭС.
Таблица 4.1.
Сравнение человеческой и искусственной компетентности.
Человеческая компетентность Искусственная компетентность
Непрочная Постоянная
Трудно представляемая Легко передаваемая
Трудно документируемая Легко документируемая
Непредсказуемая Устойчивая
Дорогая Приемлемая по затратам

Здесь очевидны преимущества искусственной компетентности. Кроме того, эксперт – человек


может принимать различные решения в тождественных ситуациях из-за эмоциональных факторов
(влияние дефицита времени, влияние стресса).
Необходимость человека в контуре управления. Почему необходимо оставить для человека
место в системе?

25
Если искусственная компетентность настолько лучше человеческой, почему бы полностью не
отказаться от экспертов – людей, заменив их ЭС? О несостоятельности подобных предложений и
рассуждений говорят много доводов. Приведем некоторые из них:
- Хотя ЭС хорошо справляются со своей работой, но в некоторых областях деятельности
человеческая компетентность превосходит любую искусственную. Это не есть отражение
фундаментальных ограничений ИИ, но характерно для современного его состояния. Например,
область творчества.
- Обучение: человеческая компетентность пока превосходит искусственную. Эксперты
адаптируются к изменяющимся условиям, приспосабливают свои стратегии к новым
обстоятельствам. ЭС мало приспособлены к обучению новым концепциям и правилам. Обучающие
программы разработаны для простых задач и мало пригодны, когда требуется учитывать всю
сложность реальных задач.
- Эксперты могут непосредственно воспринимать комплекс входной сенсорной информации
(визуальной, звуковой, осязательной, обонятельной и тактильной). ЭС – только символы. Хотя в
отдельных направлениях разработки инженерных и производственных интеллектуальных систем
получены реальные результаты определенной обработки сенсорной информации.
- Эксперты – люди могут охватить картину в целом, все аспекты проблемы и понять, как они
соотносятся с основной задачей. ЭС стремится сосредоточить на самой задаче, хотя смежные
задачи могут повлиять на решение основной.
- Люди, эксперты и не эксперты, имеют то, что мы называем здравым смыслом, или
общедоступными знаниями. Это широкий спектр общих знаний о мире, о том, какие законы в нем
действуют, т.е. знания, которыми каждый из нас обладает, приобретает из опыта и которыми
постоянно пользуется. Из-за огромного объема знаний, образующих здравый смысл, не существует
легкого способа встроить их в интеллектуальную программу. Знания здравого смысла включают
знания о том, что вы знаете и чего не знаете.
Поэтому ЭС наиболее часто используются как советчики, в качестве консультантов или
помощников ЛПР. А, которые проявляются виртуально в ка
Функциональные возможности ЭС определяются двумя ее главными системными частями:
средой развития и средой рекомендаций (рис.4.2). Среда развития используется разработчиком ЭС
для построения компонентов и размещения знаний в БЗ. Среда рекомендаций используется
неэкспертами для получения экспертных знаний и советов.
Три главных компонента, коте проявляются в каждой ЭС- это БЗ, механизм вывода и
пользовательский интерфейс. Хотя вообще ЭС могут содержать следующие компоненты:
- подсистема извлечения знаний;
- БЗ;
- механизм вывода;
- пользовательский интерфейс;
- рабочая область;
- подсистема объяснения;
- подсистема верификации знаний.

26
- Обычно, большинство ЭС не содержат подсистему верификации знаний. Существует также
большие колебания в содержании и способностях каждой компоненты.
Извлечение знаний представляет собой накопление, передачу и преобразование экспертиз
решения задачи от экспертов или документированных источников знаний компьютерной
программой для конструирования или расширения БЗ. Понтенциальные источники знаний
включают экспертов, учебники, справочники, мультимедийные документы, базы данных
(общественные или частные), специальные исследовательские отчеты и информацию, доступную
через Интернет.

Рис.4.2. Структура ЭС и ее окружение.


Извлечение знаний из экспертов является сложной задачей, которая часто создает узкое
место при построении ЭС.
Современные условия требуют от знаний и способностей взаимодействовать с одним или
более людьми – экспертами при построении БЗ. Инженер знаний помогает эксперту
структурировать проблемную область путем интерпретации и объединения ответов человека на
вопросы, проводя аналогии, предлагая контрпримеры и выявляя концептуальные трудности.

27
База знаний содержит знания, необходимые для понимания, формулирования и решения
задач. Она включает два основных элемента: факты, такие как проблемная ситуация и
теоретические знания о проблемной области; и специальные эвристики ти правила, которые
направляют использование знаний при решении специфических задач в отдельной области. Кроме
того, механизм вывода, тесно связанный с БЗ, содержит стандартные правила решения задач и
принятия решений. Эвристики выражают неформальные знания, мнения и суждения в прикладной
области. Глобальные стратегии, которые могут быть как эвристиками, так и частью теории
проблемной области, обычно включаются в БЗ. Знания, а не просто факты, являются
первоначальным необработанным материалом экспертных систем. Информация и знания в БЗ
представлены и включены в компьютерную программу путем реализации процесса, называемого
представление знаний.
Пользовательсктй интерфейс. Обмен данными между конечным пользователем и ЭС выполняет
программа интеллектуального интерфейса, которая воспринимает сообщения пользователя и
преобразует их в форму представления базы знаний и, наоборот, переводит внутреннее
представление результата обработки в формат пользователя и выдает сообщение на требуемый
носитель. Важнейшим требованием к организации диалога пользователя с ЭС является
естественность, которая не означает буквально формулирование потребностей пользователя
предложениями естественного языка, хотя это и не исключается в ряде случаев. Важно, чтобы
последовательность решения задачи была гибкой, соответствовала представлениям
пользователя и велась в профессиональных терминах.
Механизм вывода. Этот программный инструмент получает от интеллектуального интерфейса
преобразованный во внутреннее представление запрос, формирует из базы знаний конкретный
алгоритм решения задачи, выполняет алгоритм, а полученный результат предоставляется
интеллектуальному интерфейсу для выдачи ответа на запрос пользователя.

ПРЕДПРИЯТИЕ_ОТРАСЛИ#1
Имя слота Указатель Тип Значение
наследования
Super-сlass U FRAME ROOT
Sub-сlass U FRAME Предприятие
Код предприятия U String 101
Код отрасли U String 123
Отраслевой U Real 20
коэфф. рент.

ПРЕПРИЯТИЕ#1
Имя слота Указатель Тип Значение
наследования
Super-сlass S FRAME Предприятие
отрасли
Sub-сlass - - -
Код предприятия S String 101
Код S String 123
отрасли
Отраслевой S Real 20
коэфф. рент.
Коэфф. рент. Real 25

28
Задолженность String Нет
Репутация String Удовл
Фин.состояние Process Fin_sost
Надежность Process Nad
Рис. 1.4. Описание объектов
В основе использования любого механизма вывода лежит процесс нахождения в
соответствии с поставленной целью и описанием конкретной ситуации (исходных данных)
относящихся к решению единиц знаний (правил, объектов, прецедентов и т.д.) и связыванию их
при необходимости в цепочку рассуждений, приводящую к определенному результату. Для
представления знаний в форме правил это может быть прямая (рис. 1.5) или обратная (рис. 1.6)
цепочка рассуждений.
Для объектно-ориентированного представления знаний характерно применение механизма
наследования атрибутов, когда значения атрибутов передаются по иерархии от вышестоящих
классов к нижестоящим (например, на рис.1.4. код отрасли, отраслевой коэффициент
рентабельности). Также при заполнении атрибутов фрейма необходимыми данными запускаются
на выполнение присоединенные процедуры.

Коэфф. Рентабельность=
рентаб.>20 "Удовл." Финансовое
состояние=
"Удовл." Надежность=
"Удовл."
Задолженность=
"нет"

Репутация=
"Удовл."

Рис. 1.5. Прямая цепочка рассуждений


Рентабельность= Коэфф.
"Удовл."? рентаб.>20
ДА ДА
Финансовое
состояние=
"Удовл."?
ДА
Надежность= Задолженность=
"Удовл."? "нет"?
ДА ДА
Репутация=
"Удовл."?
ДА

Рис. 1.6. Обратная цепочка рассуждений

Рабочая область – это область, расположенная отдельно для описания текущей задачи, как
определено входными данными. Она также используется для запоминания промежуточных
результатов. В рабочей области запоминаются промежуточные гипотезы и решения.

29
Могут быть запомнены три типа решений: план (как атаковать задачу), агенда
(потенциальные действия, ожидающие выполнения) и решение (гипотезы – кандидаты и
альтернативные направления действий, которые система сгенерировала до сих пор).

Подсистема объяснения. В процессе или по результатам решения задачи пользователь может


запросить объяснение или обоснование хода решения. С этой целью ЭС должна предоставить
соответствующий механизм объяснения. Объяснительные способности ЭС определяются
возможностью механизма вывода запоминать путь решения задачи. Тогда на вопросы
пользователя "Как?" и "Почему?" получено решение или запрошены те или иные данные система
всегда может выдать цепочку рассуждений до требуемой контрольной точки, сопровождая выдачу
объяснения заранее подготовленными комментариями. В случае отсутствия решения задач
объяснение должно выдаваться пользователю автоматически. Полезно иметь возможность и
гипотетического объяснения решения задачи, когда система отвечает на вопросы, что будет в
том или ином случае.
Однако, не всегда пользователя может интересовать полный вывод решения, содержащий
множество ненужных деталей. В этом случае система должна уметь выбирать из цепочки только
ключевые моменты с учетом их важности и уровня знаний пользователя. Для этого в базе знаний
необходимо поддерживать модель знаний и намерений пользователя. Если же пользователь
продолжает не понимать полученный ответ, то система должна быть способна в диалоге на
основе поддерживаемой модели проблемных знаний обучать пользователя тем или иным
фрагментам знаний, т.е. раскрывать более подробно отдельные понятия и зависимости, если даже
эти детали непосредственно в выводе не использовались. Подсистема верификации и
совершенствования знаний. Эксперты обладают способностями верифицировать и
совершенствовать знания. То есть, они могут анализировать свои собственные знания и их
использование, обучаться от них и улучшать их для будущих консультаций. Аналогично, такая
эволюция необходима в компьютеризованном обучении, так, чтобы программа могла
анализировать рассуждения под углом их успеха или неудачи. Это может привести к улучшениям,
и как результату, более точным БЗ и более эффективному рассуждению. Такой составляющей в
настоящее время пока нет в коммерческих ЭС, но она разрабатывается в экспериментальных ЭС.

Области применения экспертных систем.


ЭС могут быть классифицированы несколькими путями. Одним из них является
классификация по основным проблемным областям, на которые они ориентированы. При этом
проблемные области определяются основными классами задач, эффективно решаемыми методами
ЭС. Например, диагностика может быть определена как «выявление неисправностей системы через
наблюдения». Диагностика является общей по своей сути деятельностью, совершаемой в
медицине, организационных исследованиях, компьютерных операциях, контроле за
оборудованием. Основные классы задач, для решения которых создаются экспертные системы
перечисленные в таблице 4.2.
Таблица 4.2.
Основные классы решения задач, решаемые ЭС.

30
Класс На решение какой задачи направлена
Интерпретация Выявление описаний ситуации из наблюдений
Предсказание Выявление похожих последствий в данной ситуации.
Диагностика Выявление неисправности системы через наблюдения.
Конфигурирование и разработка объектов, удовлетворяющих
Проектирование
определенным требованиям.
Планирование Разработка планов для достижения целей.
Сравнение наблюдений с планами, сигнализируя об отклонениях и
Мониторинг
исключениях.
Отладка Выявление и устранение неисправностей.
Интерпретирование, предсказывание восстановление и мониторинг
Управление
поведения системы.
Некоторые ЭС принадлежат к двум или более из этих категорий. Дадим краткое описание
каждой их этих категорий.
Системы интерпретации выявляют описания ситуации из наблюдений. Это категория
включает наблюдения, понимание речи, анализ образов, интерпретацию сигналов и многие другие
виды интеллектуального анализа. Система интерпретации объясняют наблюдаемые данные путем
присвоения им символических значений, описывающих ситуацию.
Системы предсказания включают прогнозирование погоды, демографические предсказания,
экономическое прогнозирование, оценки урожайности, а также военное, маркетинговое и
финансовое прогнозирование.
Системы диагностики включают диагностику в медицине, электронике, механике и
программном обеспечении. Диагностирующие системы обычно соотносят наблюдаемые
поведенческие отклонения с причинами, лежащими в основе.
Системы проектирования разрабатывают конфигурации объектов, которые удовлетворяют
определенным требованиям задачи проектирования. Такие задачи включают конструирование
зданий, планировка расположения оборудования и др. Эти системы конструируют различные
взаимосвязи описаний объектов друг с другом и проверяют, удовлетворяют ли эти конфигурации
установленным ограничениям и требованиям.
Системы планирования специализируются на задачах планирования, например, такой как
автоматическое программирование. Они также работают с кратко и долгосрочным планированием
в управлении проектами, маршрутизация, коммуникация, разработка продукт а, военные
приложения, производственное и финансовое планирование.
Системы мониторинга сравнивают наблюдения поведения системы со стандартами, которые
представляются определяющими для достижения цели. Эти решающие выявления соответствуют
потенциальным недостаткам на предприятии. Существует много компьютерных систем
мониторинга: от контроля движения воздушных потоков до задач управления сбором налогов.
Системы управления и контроля адаптивно управляют всеобщим поведением системы. Для
осуществления этого система управления должна периодически интерпретировать текущую
ситуацию, предсказывать будущее, диагностировать причины ожидаемых проблем, формулировать
план устранения этих проблем и осуществлять мониторинг его выполнения для обеспечения
успеха.

31
Не все задачи, которые обычно образуются в каждом из этих классов, подходят для ЭС.
Однако есть тысячи задач, которые подходят к этим классам.
Рассмотренные классы задач ЭС, определяющие проблемные области, решаются в
различных предметных областях. Области применения существующих на сегодняшний день ЭС
охватывают: медицину, геологию, научные исследования в области химии и биологии, военное
дело, инженерное дело, космическую технику, метеорологию, экологию, производство, управление
процессами, юриспруденцию, маркетинг, финансы, банковское дело и др.
Сегодня ЭС используются многими большими и средними организациями как главный
инструмент для улучшения производительности и качества. Они являются также важным
инструментом для поддержания стратегических решений и реинжиниринга бизнес – процессов.
Важными работами, отражающими позитивные результаты использования ЭС в таких
предметных областях как производство, финансы, бизнес и менеджмент (как проблемная область),
являются.

Стратегические и динамические ЭС.


При классификации ЭС по проблемным областям на основе классов и типов задач, важно
исследовать и оценивать характер проблемной и предметной областей с позиций динамики
решаемых задач, важности временного фактора и темпоральной информации.
То есть, если исходная информация о предметной области или окружающем мире, на основе
которой решается задача, не изменяется за время решения задачи, то такую предметную область
можно условно назвать статической предметной областью, и ее представление в ЭС будет
статическим. Если информация о предметной области изменяется за время решения задач, то
такую предметную область можно назвать динамической предметной областью.
Если задачи, решаемые ЭС, явно но учитывают фактор времени и не изменяют в процессе
решения данные о реальной действительности, то это статические задачи. Если задачи при
решении требуют учета фактора времени или изменяют данные о реальных внешних процессах, то
это динамические задачи.
То есть, ЭС работает в статической проблемной среде, если она использует статическое
представление и решает статические задачи. Если ЭС использует динамическое представление или
решает динамические задачи, то, соответственно она работает в динамической проблемной среде.
Важность времени в динамических проблемных средах определила название таких ЭС, как систем,
работающих в реальном времени.
Среди специализированных систем, основанных на знаниях, наиболее значимыми являются
ЭС реального времени или динамические ЭС. Исследования по разработке таких систем с целью их
практического использования ведутся достаточно давно, с середины 80-х годов прошлого века.
В 1985 г. фирма Lisp Machine Inc. (LMI) выпустила систему PICON (process Intelligent Control –
интеллектуальное управление процессом). Система применялась для управления
нефтеперерабатывающим предприятием. Система обеспечивает контроль 20 тысяч точек. Имеется
возможность динамически изменить программу контроля с уделением особого внимания «горячим

32
точкам», параметры которых выходят за рамки допусков. Позже LMI разработала также пакет
RTIME [88].
Успех системы PICON привел к тому, что в 1986 группа ведущих разработчиков системы
образовала фирму Gensym, которая, значительно развив идеи, заложенные в PICON, в 1988 г.
вышла на рынок с инструментальным средством G2, версия 1.0.
С этого времени работы по созданию инструментальных средств для ЭС реального времени
стали вестись более активно. С отставанием от Gensym на 2-3 года другие фирмы начали
создавать свои инструментальные средства для ЭС реального времени.
Значимость инструментальных средств реального времени определяется не столько их
бурным коммерческим успехом (хотя и это достойно тщательного анализа), но, в первую очередь,
тем, что только с помощью подобных средств создаются стратегически значимые приложения в
таких областях, как управление непрерывными производственными процессами, аэрокосмические
исследования, транспортировка и переработка нефти и газа, управление атомными и тепловыми
электростанциями, финансовые операции и многие другие.
Экспертные системы реального времени, решают следующие классы задач:
мониторинг в реальном масштабе времени, обнаружения неисправностей, диагностика,
оперативное планирование, системы – советчики оператора.
Статические экспертные системы не способны решать подобные задачи, так как они не
выполняют требования, предъявляемые к системам, работающим в реальном времени:
1. Представлять изменяющиеся во времени данные, поступающие от внешних
источников, обеспечивать хранение и анализ изменяющихся данных.
2. Выполнять временные рассуждения о нескольких различных асинхронных процессах
одновременно (т.е. планировать в соответствии с приоритетами обработку
поступивших в систему процессов).
3. Обеспечивать механизм рассуждения при ограниченных ресурсах (время, память).
Реализация этого механизма предъявляет требования к высокой скорости работы системы,
способности одновременно решать несколько задач (т.е. операционные системы UNIX, VMS,
Windows NT).
4. Осуществлять постоянный мониторинг процесса, и при необходимости автоматически
запускать механизм логического вывода решений по устранению критических ситуаций с
одновременным информированием ЛПР.
5. Моделировать "окружающий мир", рассматриваемый в данном приложении,
обеспечивать создание различных его состояний.
6. Протоколировать свои действия и действия персонала, обеспечивать восстановление
после сбоя.
7. Обеспечивать наполнение базы знаний для приложений реальной степени сложности с
минимальными затратами времени и труда (необходимо использование объектно-ориентированной
технологии, общих правил, модульности и т.п.).
8. Обеспечивать настройку системы на решаемые задачи (проблемная/предметная
ориентированность).

33
9. Обеспечивать создание и поддержку пользовательских интерфейсов для различных
категорий пользователей.
10. Обеспечивать уровень защиты информации (по категориям пользователей) и
предотвращать несанкционированный доступ.
Специфические требования, предъявляемые к экспертной системе реального времени,
приводят к тому, что их архитектура отличается от архитектуры статических систем. Появляются
две новые подсистемы: моделирования внешнего окружения и сопряжения с внешним миром
(датчиками, контроллерами, СУБД и т.п.) – и значительные изменения, которым подвергаются
оставшиеся подсистемы.
При создании ЭС реального времени, приобретают важное значение несколько новых по
сравнению с обычными ЭС соображений. Главное из них – эффективность исполнения. В обычных
ЭС факты и знания, на которых основываются рассуждения, носят статический характер. В
производственных системах факты, или показания технологических датчиков, являются
динамическими. В таких ЭС может существовать до нескольких тысяч показаний приборов и
аварийных сигналов, заметно меняющих величину или состояние в течение нескольких минут.
Задача системы – советника оператора или ЛПР – поставить экспертные диагнозы состояния
производства и рекомендовать неотложные аварийные мероприятия или операции по обеспечению
экономически оптимальных режимов процесса.
Например, возможны следующие производственные ситуации:
1. Отказ важного датчика и передача вследствие этого ложной информации. ЭС должна при
помощи БЗ о процессе обнаружить противоречия и послать оператору аварийный сигнал.
2. Нарушение хода процессе ЭС должна найти причины возникших нарушений, отделить их
от следствий, и помочь оператору в устранении неполадок. Для этого она могла бы использовать
эвристические правила оптимизации.
В приведенных примерах ЭС работает по правилам экспертизы, заложенным в нее при
разработке. Потенциальное преимущество системы – советника оператора – заключается в том,
что она проводит экспертизу во всех отношениях достаточно быстро, обеспечивая постоянную
организованную помощь оператору.
Таким образом, основными принципами построения ЭС реального времени, в дополнение к
требованиям и ЭС реального времени, рассмотренный выше, являются следующие:
1. Доступ к данным. Необходим эффективный интерфейс передачи данных в реальном
масштабе времени между ЭС и распределенной измерительной системой.
2. Концепция рассуждений. Базовые механизмы прямой и обратной цепочек рассуждений
должны быть «встроены» в программное окружение, работающее в реальном времени.
3. Вычислительная эффективность. Эффективность рассуждений зависит от структуры
программы и БЗ, а также от быстродействия компьютера. Кроме того, дедуктивные процедуры
обычных рассуждений могут быть дополнены эвристическими процедурами, подобными тем,
которыми пользуются эксперты.

34
Лекция 4 Нейронные сети и процесс обучения.
Нейронные сети. Нейрон как простой вычислительный элемент; персептрон;
многослойные нейронные сети; ускоренное обучение в многослойных нейронных
сетях; сеть Хопфилда; самоорганизующиеся нейронные сети, самообучающиеся
системы.

За последние четыре десятилетия область ИИ сделала большой прогресс в направлении


моделирования человеческого рассуждения. Тем не менее, инструментальные средства ИИ в
большинстве были ограничены последовательной обработкой информации. Другой подход к
интеллектуальным системам включает конструирование компьютеров с архитектурными и
обрабатывающими способностями, которые имитируют некоторые способности к обработке
информации человеческого мозга. Результатами явились представления знаний, основанные на
массированной параллельной обработке, быстром поиске больших объемов информации и
способности распознавать образцы, основанной на исторических прецедентах. Технология,
которая пытается достичь этих результатов называется нейронные вычисления или искусственные
нейронные сети (ИНС).
Искусственные нейронные сети являются технологией обработки информации,
вдохновленной изучением мозга и нервной системы. После падения в немилость в 1970-х годах,
область ИНС пережили драматическое возрождение в конце 1980-х. Возобновленный интерес
развился из-за потребности обработки информации аналогично человеческому мозгу,
продвижения компьютерной технологии и прогресса нейрофизиологии в направлении лучшего
понимания механизмов мозга.
Длительный период эволюции придал мозгу человека много качеств, которые отсутствуют
как в машинах с архитектурой фон Неймана, так и в современных параллельных компьютерах. К
ним относятся:
 массовый параллелизм,
 распределенное представление информации и вычисления,
 способность к обучению и способность к обобщению,
 адаптивность,
 свойство контекстуальной обработки информации,
 толерантность к ошибкам,
 низкое энергопотребление.
Можно предположить, что приборы, построенные на тех же принципах, что и биологические
нейроны, будут обладать перечисленными характеристиками.

От биологических сетей к ИНС


Современные компьютеры превосходят человека по способности производить числовые и
символьные вычисления. Однако человек может без усилий решать сложные задачи восприятия
внешних данных (например, узнавание человека в толпе только по его промелькнувшему лицу) с

35
такой скоростью и точностью, что мощнейший в мире компьютер будет ему уступать. В чем
причина столь значительного различия в их производительности? Архитектура биологической
нейронной системы совершенно не похожа на архитектуру машины фон Неймана (Таблица 5.1),
существенно влияет на типы функций, которые более эффективно исполняются каждой моделью.
Таблица 5.1.
Машина фон Неймана по сравнению с биологической нейронной системой.
Биологическая нейронная
Машина фон Неймана
система
Простой
Процессор Сложный
Высокоскоростной Низкоскоростной
Один или несколько Большое количество
Память Интегрирована в процессор
Отделена от процессора
Локализована Распределенная
Адресация не по содержанию Адресация по содержанию
Вычисления Централизованные Распределенные
Последовательные Параллельные
Хранимые программы Самообучение
Надежность Высокая уязвимость Живучесть
Численные и символьные
Специализация Проблемы восприятия
операции
Среда функционирования Строго определенная Плохо определенная
Строго ограниченная Без ограничений

Подобно биологической нейронной системе ИНС является вычислительной системой с


огромным числом параллельно функционирующих простых процессоров с множеством связей.
Модели ИНС в некоторой степени воспроизводят "организационные" принципы, свойственные
мозгу человека. Моделирование биологической нейронной системы с использованием ИНС может
также способствовать лучшему пониманию биологических функций. Такие технологии
производства, как VLSI (сверхвысокий уровень интеграции) и оптические аппаратные средства,
делают возможным подобное моделирование.
Глубокое изучение ИНС требует знания нейрофизиологии, когнителогии, психологии, физики
(статистической механики), теории управления, теории вычислений, проблем искусственного
интеллекта, статистики/математики, распознавания образов, компьютерного зрения, параллельных
вычислений и аппаратных средств (цифровых/аналоговых/VLSI(Very-Large-Scale-
Integration)/оптических). С другой стороны, ИНС также стимулируют эти дисциплины, обеспечивая
их новыми инструментами и представлениями. Этот симбиоз жизненно необходим для
исследований по нейронным сетям.
Представим некоторые проблемы, решаемые в контексте ИНС и представляющие интерес для
ученых и инженеров, разрабатывающих ИСПР [103].
Классификация образов. Задача состоит в указании принадлежности входного образа
(например, речевого сигнала или рукописного символа), представленного вектором признаков,
одному или нескольким предварительно определенным классам. К известным приложениям

36
относятся распознавание букв, распознавание речи, классификация сигнала электрокардиограммы,
классификация клеток крови.
Кластеризация/категоризация. При решении задачи кластеризации, которая известна также
как классификация образов "без учителя", отсутствует обучающая выборка с метками классов.
Алгоритм кластеризации основан на подобии образов и размещает близкие образы в один кластер.
Известны случаи применения кластеризации для извлечения знаний, сжатия данных и
исследования свойств данных.
Аппроксимация функций. Предположим, что имеется обучающая выборка ((x1,y1), (x2,y2)...,
(xn,yn)) (пары данных вход-выход), которая генерируется неизвестной функцией (x), искаженной
шумом. Задача аппроксимации состоит в нахождении оценки неизвестной функции (x).
Аппроксимация функций необходима при решении многочисленных инженерных и научных задач
моделирования.
Предсказание/прогноз. Пусть заданы n дискретных отсчетов {y(t1), y(t2)..., y(tn)} в
последовательные моменты времени t1, t2,..., tn . Задача состоит в предсказании значения y(tn+1) в
некоторый будущий момент времени tn+1. Предсказание/прогноз имеют значительное влияние на
принятие решений в бизнесе, науке и технике. Предсказание цен на фондовой бирже и прогноз
погоды являются типичными приложениями техники предсказания/прогноза.
Оптимизация. Многочисленные проблемы в математике, статистике, технике, науке,
медицине и экономике могут рассматриваться как проблемы оптимизации. Задачей алгоритма
оптимизации является нахождение такого решения, которое удовлетворяет системе ограничений и
максимизирует или минимизирует целевую функцию.
Память, адресуемая по содержанию. В модели вычислений фон Неймана обращение к памяти
доступно только посредством адреса, который не зависит от содержания памяти. Более того, если
допущена ошибка в вычислении адреса, то может быть найдена совершенно иная информация.
Ассоциативная память, или память, адресуемая по содержанию, доступна по указанию заданного
содержания. Содержимое памяти может быть вызвано даже по частичному входу или искаженному
содержанию. Ассоциативная память чрезвычайно желательна при создании мультимедийных
информационных баз данных.
Управление. Рассмотрим динамическую систему, заданную совокупностью {u(t), y(t)}, где
u(t) является входным управляющим воздействием, а y(t) - выходом системы в момент времени t. В
системах управления с эталонной моделью целью управления является расчет такого входного
воздействия u(t), при котором система следует по желаемой траектории, диктуемой эталонной
моделью. Примером является оптимальное управление двигателем.
Краткий исторический обзор.
Исследования в области ИНС пережили три периода активизации. Первый пик в 40-х годах
обусловлен пионерской работой МакКаллока и Пейперта [33]. Второй возник в 60-х благодаря
теореме сходимости перцептрона Розенблатта [54] и работе Минского и Пейперта [37], указавшей
ограниченные возможности простейшего перцептрона. Результаты Минского и Пейперта погасили
энтузиазм большинства исследователей, особенно тех, кто работал в области вычислительных
наук. Возникшее в исследованиях по нейронным сетям затишье продлилось почти 20 лет. С начала

37
80-х годов ИНС вновь привлекли интерес исследователей, что связано с энергетическим подходом
Хопфилда [101] и алгоритмом обратного распространения для обучения многослойного
перцептрона (многослойные сети прямого распространения), впервые предложенного Вербосом и
независимо разработанного рядом других авторов. Алгоритм получил известность благодаря
Румельхарту [123].
Биологические нейронные сети
Нейрон (нервная клетка) является особой биологической клеткой, которая обрабатывает
информацию (рис. 5.8). Она состоит из тела клетки (cell body), или сомы (soma), и двух типов
внешних древоподобных ветвей: аксона (axon) и дендритов (dendrites), Тело клетки включает ядро
(nucleus), которое содержит информацию о наследственных свойствах, и плазму, обладающую
молекулярными средствами для производства необходимых нейрону материалов. Нейрон получает
сигнал (импульсы) от других нейронов через дендриты (приемники) и передает сигналы,
сгенерированные телом клетки, вдоль аксона (передатчик), который в конце разветвляется на
волокна (strands). На окончаниях этих волокон находятся синапсы (synapses).

Рис. 5.8. Схема биологического нейрона.

Синапс является элементарной структурой и функциональным узлом между двумя


нейронами (волокно аксона одного нейрона и дендрит другого). Когда импульс достигает
синаптического окончания, высвобождаются определенные химические вещества, называемые
нейротрансмиттерами. Нейротрансмиттеры диффундируют через синаптическую щель,
возбуждая или затормаживая, в зависимости от типа синапса, способность нейрона-приемника
генерировать электрические импульсы. Результативность синапса может настраиваться
проходящими через него сигналами, так что синапсы могут обучаться в зависимости от
активности процессов, в которых они участвуют. Эта зависимость от предыстории действует как
память, которая, возможно, ответственна за память человека.
Кора головного мозга человека является протяженной, образованной нейронами поверхностью
толщиной от 2 до 3 мм с площадью около 2200 см2, что вдвое превышает площадь поверхности
стандартной клавиатуры, Кора головного мозга содержит около 1011 нейронов, что
приблизительно равно числу звезд Млечного пути [12]. Каждый нейрон связан с 103 - 104 другими

38
нейронами. В целом мозг человека содержит приблизительно от 1014 до 1015 взаимосвязей.
Нейроны взаимодействуют посредством короткой серии импульсов, как правило,
продолжительностью несколько мсек. Сообщение передается посредством частотно-импульсной
модуляции. Частота может изменяться от нескольких единиц до сотен герц, что в миллион раз
медленнее, чем самые быстродействующие переключательные электронные схемы. Тем не менее,
сложные решения по восприятию информации, как, например, распознавание лица, человек
принимает за несколько сотен мс. Эти решения онтролируются сетью нейронов, которые имеют
скорость выполнения операций всего несколько мс. Это означает, что вычисления требуют не
более 100 последовательных стадий. Другими словами, для таких сложных задач мозг "запускает"
параллельные программы, содержащие около 100 шагов. Это известно как правило ста шагов.
Рассуждая аналогичным образом, можно обнаружить, что количество информации, посылаемое от
одного нейрона другому, должно быть очень маленьким (несколько бит). Отсюда следует, что
основная информация не передается непосредственно, а захватывается и распределяется в связях
между нейронами. Этим объясняется такое название, как коннекционистская модель, применяемое
к ИНС.

Модель технического нейрона


МакКаллок и Питтс предложили использовать бинарный пороговый элемент в качестве
модели искусственного нейрона. Этот математический нейрон вычисляет взвешенную сумму n
входных сигналов xj, j = 1, 2... n, и формирует на выходе сигнал величины 1, если эта сумма
превышает определенный порог u, и 0 - в противном случае. Часто удобно рассматривать u как
весовой коэффициент, связанный с постоянным входом x0=1. Положительные веса соответствуют
возбуждающим связям, а отрицательные – тормозным. МакКаллок и Питтс доказали, что при
соответствующим образом подобранных весах совокупность параллельно функционирующих
нейронов подобного типа способна выполнять универсальные вычисления. Здесь наблюдается
определенная аналогия с биологическим нейроном: передачу сигнала и взаимосвязи имитируют
аксоны и дендриты, веса связей соответствуют синапсам, а пороговая функция отражает
активность сомы.
ИНС представляет собой модель, прототипом которой является биологическая нейронная
сеть. Сегодняшние нейронные вычисления используют очень ограниченное множество понятий
биологических нейронных сетей (см. табл.5.2.).
Таблица 5.2.
Некоторые аналогии и отношения между биологическими и искусственными
нейронными сетями.
Биологические Искусственные
Сома Узел
Дендриты Вход
Аксон Выход
Синапс Вес
Много нейронов (10 )
9
Немного нейронов (от

39
десятка до сотни тысяч)

Понятия используются для осуществления программной имитации массированных


параллельных процессов, которые включают обрабатывающие элементы (также называемые
искусственными нейронами), взаимосвязанными в архитектуру нейронной сети. Искусственный
нейрон получает входные сигналы, являющиеся аналогами электрохимических импульсов, которые
дендриты биологических нейронов получают от других нейронов.
Входные сигналы искусственного нейрона соответствуют сигналам, посылаемым от
биологического нейрона через его аксон. Эти искусственные сигналы могут быть изменены таким
же образом, как физические изменения происходят в синапсах.
Важно признать, что ИНС были первоначально предложены как способ моделирования
деятельности человеческого мозга. Человеческий мозг имеет намного большую сложность, чем
модель может выразить. Несмотря на обширные исследования в нейробиологии и физиологии,
остаются важные вопросы о том, как работают мозг и разум человека. Это только одна причина,
почему нейронные вычислительные модели не очень сходны с реальными биологическими
системами. Тем не менее, исследования и разработки в области ИНС производят интересные и
полезные системы, которые заимствуют некоторые черты.
Архитектура нейронной сети.
ИНС состоит из искусственных нейронов (или обрабатывающих элементов), организованных
различными путями для формирования структуры сети.
На рис.5.9. представлена схема трех взаимосвязанных искусственных нейронов.
Каждый из нейронов получает входные сигналы, обрабатывает их и выдает простой
выходной сигнал. Этот процесс показан на рис.5.10. Входным сигналом могут быть необработанные
данные или выходные сигналы других нейронов. Выходной сигнал может быть конечным
результатом или он может быть входным сигналом другого нейрона.

Рис.5.9. Три взаимосвязанных искусственных нейрона

40
Рис.5.10. Обработка информации в искусственном нейроне

Каждая ИНС состоит из набора нейронов, которые сгруппированы по слоям. Типичная


структура ИНС показана на рис.5.11. Здесь представлены три слоя: входной, промежуточный
(называемый скрытым слоем) и выходной. Между входным и выходным слоями может быть
размещено несколько скрытых слоев.

Рис.5.11. Нейронная сеть с одним скрытым слоем


Как и биологические нейронные сети, ИНС могут быть организованы несколькими
различными способами (топологическими или архитектурными), т.е. нейроны могут быть
взаимосвязаны различными способами. Поэтому ИНС проявляются в различных конфигурациях.
При обработке информации, многие обрабатывающие элементы выполняют свои вычисления
одновременно. Эта параллельная обработка имеет сходство с тем, как работает мозг, и отличается
от последовательной обработки при традиционных вычислениях.

41
ИНС может рассматриваться как направленный граф со взвешенными связями, в котором
искусственные нейроны являются узлами. По архитектуре связей ИНС могут быть сгруппированы в
два класса (рис. 5.12): сети прямого распространения, в которых графы не имеют петель, и
рекуррентные сети, или сети с обратными связями.

Рис. 5.12 Систематизация архитектур сетей прямого распространения и рекуррентных (с


обратной связью).
В наиболее распространенном семействе сетей первого класса, называемых многослойным
перцептроном, нейроны расположены слоями и имеют однонаправленные связи между слоями. На
рис. 5.12 представлены типовые сети каждого класса. Сети прямого распространения являются
статическими в том смысле, что на заданный вход они вырабатывают одну совокупность выходных
значений, не зависящих от предыдущего состояния сети. Рекуррентные сети являются
динамическими, так как в силу обратных связей в них модифицируются входы нейронов, что
приводит к изменению состояния сети.
Самообучающиеся системы
Способность к обучению является фундаментальным свойством мозга. В контексте ИНС
процесс обучения может рассматриваться как настройка архитектуры сети и весов связей для
эффективного выполнения специальной задачи. Обычно нейронная сеть должна настроить веса
связей по имеющейся обучающей выборке. Функционирование сети улучшается по мере
итеративной настройки весовых коэффициентов. Свойство сети обучаться на примерах делает их
более привлекательными по сравнению с системами, которые следуют определенной системе
правил функционирования, сформулированной экспертами.
Для конструирования процесса обучения, прежде всего, необходимо иметь модель внешней
среды, в которой функционирует нейронная сеть - знать доступную для сети информацию. Эта
модель определяет парадигму обучения. Во-вторых, необходимо понять, как модифицировать
весовые параметры сети - какие правила обучения управляют процессом настройки. Алгоритм
обучения означает процедуру, в которой используются правила обучения для настройки весов.
Существуют три парадигмы обучения: "с учителем", "без учителя" (самообучение) и
смешанная. В первом случае нейронная сеть располагает правильными ответами (выходами сети)
на каждый входной пример. Веса настраиваются так, чтобы сеть производила ответы как можно
более близкие к известным правильным ответам. Усиленный вариант обучения с учителем
предполагает, что известна только критическая оценка правильности выхода нейронной сети, но

42
не сами правильные значения выхода. Обучение без учителя не требует знания правильных
ответов на каждый пример обучающей выборки. В этом случае раскрывается внутренняя структура
данных или корреляции между образцами в системе данных, что позволяет распределить образцы
по категориям. При смешанном обучении часть весов определяется посредством обучения с
учителем, в то время как остальная получается с помощью самообучения.
Теория обучения рассматривает три фундаментальных свойства, связанных с обучением по
примерам: емкость, сложность образцов и вычислительная сложность. Под емкостью понимается,
сколько образцов может запомнить сеть, и какие функции и границы принятия решений могут быть
на ней сформированы. Сложность образцов определяет число обучающих примеров, необходимых
для достижения способности сети к обобщению. Слишком малое число примеров может вызвать
"переобученность" сети, когда она хорошо функционирует на примерах обучающей выборки, но
плохо - на тестовых примерах, подчиненных тому же статистическому распределению. Известны 4
основных типа правил обучения: коррекция по ошибке, машина Больцмана, правило Хебба и
обучение методом соревнования.
1. Правило коррекции по ошибке. При обучении с учителем для каждого входного примера
задан желаемый выход d. Реальный выход сети y может не совпадать с желаемым. Принцип
коррекции по ошибке при обучении состоит в использовании сигнала (d-y) для модификации
весов, обеспечивающей постепенное уменьшение ошибки. Обучение имеет место только в случае,
когда перцептрон ошибается. Известны различные модификации этого алгоритма обучения.
2. Обучение Больцмана. Представляет собой стохастическое правило обучения, которое
следует из информационных теоретических и термодинамических принципов. Целью обучения
Больцмана является такая настройка весовых коэффициентов, при которой состояния видимых
нейронов удовлетворяют желаемому распределению вероятностей. Обучение Больцмана может
рассматриваться как специальный случай коррекции по ошибке, в котором под ошибкой
понимается расхождение корреляций состояний в двух режимах .
3. Правило Хебба. Самым старым обучающим правилом является постулат обучения Хебба
Хебб опирался на следующие нейрофизиологические наблюдения: если нейроны с обеих сторон
синапса активизируются одновременно и регулярно, то сила синаптической связи возрастает.
Важной особенностью этого правила является то, что изменение синаптического веса зависит
только от активности нейронов, которые связаны данным синапсом. Это существенно упрощает
цепи обучения в реализации VLSI.
4. Обучение методом соревнования. В отличие от обучения Хебба, в котором множество
выходных нейронов могут возбуждаться одновременно, при соревновательном обучении выходные
нейроны соревнуются между собой за активизацию. Это явление известно как правило
"победитель берет все". Подобное обучение имеет место в биологических нейронных сетях.
Обучение посредством соревнования позволяет кластеризовать входные данные: подобные
примеры группируются сетью в соответствии с корреляциями и представляются одним элементом.
При обучении модифицируются только веса "победившего" нейрона. Эффект этого правила
достигается за счет такого изменения сохраненного в сети образца (вектора весов связей
победившего нейрона), при котором он становится чуть ближе ко входному параметру.

43
Общие недостатки, свойственные всем самообучающимся системам, заключаются в
следующем:
 возможна неполнота и/или зашумленность (избыточность) обучающей выборки и, как
следствие, относительная адекватность базы знаний возникающим проблемам;
 возникают проблемы, связанные с плохой смысловой ясностью зависимостей признаков и, как
следствие, неспособность объяснения пользователям получаемых результатов;
 ограничения в размерности признакового пространства вызывают неглубокое описание
проблемной области и узкую направленность применения.

44