Вы находитесь на странице: 1из 25

10

РАЗДЕЛ 1

ПРОБЛЕМЫ, ЗАДАЧИ И МЕТОДЫ МАТЕМАТИЧЕСКОГО


МОДЕЛИРОВАНИЯ ДИСКРЕТНЫХ СИСТЕМ
НА ОСНОВЕ ЛОГИКИ ПРЕДИКАТОВ

В разделе проведен краткий анализ основных научных достижений в


области алгебрологического анализа и математического моделирования
естественного языка. Обоснована необходимость разработки универсального
алгебрологического аппарата для описания дискретных объектов, процессов
и их свойств, в частности естественного языка. Сформулированы и
обоснованы цели и задачи научных исследований, выполненных в работе.

1.1. Методы формализации описания структур моделей


искусственного интеллекта

Возросшее за последние годы разнообразие интеллектуальных систем


говорит о всестороннем и детальном исследовании механизмов работы
мозга, которые обеспечивают возможности интеллектуального мышления и
осмысленной деятельности. Еще Дж. фон Нейман подчеркивал, что из-за
различий в логической организации вычислительных машин и нервных
сетей, «…мозг, обладая большим числом более медленных элементов,
работает ближе к параллельному методу при меньшей логической глубине, и
задачи, решаемые им требуют меньшего разнообразия последовательных
вычислений» [1]. При этом интеллект представляет собой очень сложную
область знаний. Для ее описания ученые строят целую иерархию теорий [2].
В 1969 г. в Вашингтоне состоялась I Международная объединенная
конференция по искусственному интеллекту. В исследованиях по
искусственному интеллекту выделяют две основные цели. Одна из них,
которую часто называют информационной, или эвристической, состоит в
11
создании программ для вычислительных машин, с помощью которых
удалось бы автоматизировать такие виды человеческой деятельности,
которые традиционно считаются интеллектуальными. Вторая цель – ее
принято называть бионической – состоит в использовании программ
искусственного интеллекта для объяснения процессов, протекающих в
человеке, когда он решает те или иные задачи. Наряду с этими двумя
направлениями существует и третье, которое называется эволюционным
(способность к обучению) [2]. Задачей теории интеллекта является описание
естественных информационных процессов, протекающих в человеке, в
частности умение человека общаться на естественном языке. Проблемы
языка носят всепроникающий характер, и любая проблема информатики,
искусственного интеллекта, экспертных систем имеет языковой аспект, что, к
сожалению, не всегда понимается в полной мере. Корень многих
недоразумений кроется в неточном определении информационной природы
естественного языка. Здесь важно иметь в виду, что язык – это не только
форма выражения готовых мыслей, сколько способ содержательной
организации и представления знаний [3].
Что же конкретно заставляет уже сегодня говорить об острой
потребности в лингвистическом обеспечении компьютеризации? Прежде
всего, это гигантские объемы накопленной и постоянно пополняемой
информации, которая подлежит обработке с помощью ЭВМ. Поскольку эта
информация часто организована средствами естественного языка, ее
реальное освоение возможно лишь при автоматической смысловой обработке
текстов. Эффективное использование знаний, содержащихся в текстах,
требует новых стратегий обработки информации, отличных от традиционных
логических подходов. Такие стратегии должны учитывать смысловые законы
естественного языка [3]. Лингвистическое обеспечение автоматизированных
систем – это совокупность средств, позволяющих осуществлять
компьютеризацию языковой деятельности. Речь, в частности, идет о
создании того или иного типа автоматизированной системы обработки текста
12
(АСОТ) – некоторого процессора, на входе и на выходе которого
присутствует текстовая информация на естественном языке. Типы АСОТ
многообразны и могут быть нацелены на моделирование различных
языковых процессоров, таких, например, как диалоговое взаимодействие,
сжатие информации, реферирование текста, логическая обработка
содержания, перевод на другой естественный язык и т.д. [4-12].
В целом естественный язык может быть с полным основанием оценен
как сложнейший объект для моделирования. Компьютерное моделирование
языка и речевой деятельности нуждается в солидной теоретической базе. К
средствам описания лингвистических знаний предъявляется целый ряд
требований: независимость лингвистического описания от процедур решения
конкретных задач обработки текста; единство выразительных средств языка
описания; универсальность, понимаемая как пригодность для описания
целого класса близких по структуре языков; наглядность формальных
конструкций; приемлемость для автоматической обработки [13]. Формальное
описание всех механизмов естественного языка в полном объеме – это пока
неподъемная задача для теории интеллекта. В этой области имеются лишь
разрозненные факты [14-21]. Чтобы стать способной решить эту задачу,
логическая математика должна многократно усилить свой алгебраический
инструментарий, развивать язык формального описания.
В настоящее время существует множество разработок в областях
математического моделирования естественного языка, создания
интеллектуальных интерфейсов и лингвистических процессоров [22-28];
существует огромное множество формальных аппаратов моделирования
языка и методов их обработки, относящихся как к разделам
«неколичественной» математики (теория множеств, математическая логика,
теория алгоритмов, теория графов) так и к разделам «количественной»
математики (математическая статистика, теория вероятностей, теория
информации, математический анализ):
 порождающие грамматики Хомского;
13
 сети переходов;
 семантические сети;
 искусственный реляторный язык аппликативной модели;
 фреймы;
 аппарат синтаксических групп;
 онтологии;
 теоретико-множественный аппарат;
 стахостические модели;
 логические исчисления;
 аппарат теории алгоритмов.
Рассмотрим подробнее каждый из этих аппаратов. Одно из
главенствующих мест в этом перечне занимают порождающие грамматики
Хомского [29, 30], которые устанавливают правила получения единиц языка
из конечного набора основных структур с помощью специальных правил
преобразований. Хомский выделил три типа грамматик и, соответственно,
описываемых ими языков: грамматики с конечным числом состояний,
которые соответствуют описанию конечного автомата (машины Тьюринга);
контекстно-свободные грамматики, которые получили широкое
распространение в компьютерной лингвистике; контекстно-связанные
грамматики. Были предложены разнообразные варианты формальных
грамматик Хомского [31]:
 DCG (definite clause grammar) используется идея Колмероэ и
Ковальского о переходе от специального грамматического формализма к
более общему формализму логики предикатов первого порядка [32, 33];
 Унифицированные формализмы (PATR, FUG, LFG, GPSG, HPSG) –
это грамматики, в основе которых лежит логическое исчисление и форма
"атрибут-значение" [34-36].
 Формализм TAG (Tree-Adjoining Grammar) был предложен в середине
70-х годов для строгого описания структур ЕЯ [37, 38].
14
Несмотря на доминирующее положение формальных грамматик
(модификаций трансформационной грамматики Хомского) в современной
компьютерной лингвистике [39], они обладают рядом ограничений,
затрудняющих их использование для семантической обработки языка.
Данная модель, представляет в основном теоретический интерес, т.к. ее
основным недостатком является сложность реализации процедур, а также то,
что они не дают правил преобразования, что проявляется в недоучете
парадигматических отношений языка.
Традиция формального представления смысла фраз естественного языка
берет начало от логики Аристотеля [40]. Однако силлогистика Аристотеля
ориентирована на формализацию умозаключений в системе когнитивных
отношений "элемент-множество". Появление исчисления высказываний, или
"булевой алгебры", предоставило математический аппарат для определения
значений истинности сложных утверждений на основании значений
составляющих его простых компонентов. Исчисление высказываний бедно
выразительными средствами и не позволяет описывать дедуктивные
рассуждения всех типов, в частности силлогистические рассуждения.
Естественным развитием исчисления высказываний является исчисление
предикатов. Стратегия определения семантических значений компонент и
формул логики предикатов базируется на понятии интерпретации логической
формулы. При этом задается семантическое значение для каждого базисного
выражения. Затем вводятся правила вычисления семантических значений
сложных логических формул по известным семантическим значениям
компонент. Таким образом приписываются семантические значения все
более и более крупным составляющим логической формулы, так что в конце
концов семантическое значение будет приписано всей формуле. Этот
процесс называется композиционным методом [41]. Основной задачей [41]
представления знаний является перевод неформальных выражений или
описаний естественного языка в фразы языка исчисления предикатов [42].
Для формального описания модальности были предложены модальные
15
логики [43-51]. Название "модальная логика" происходит от того, что
модальные логические системы вводят такие операторы над логическими
формулами, которые позволяют модифицировать их интерпретацию.
Логическая система, базирующаяся на операторах “возможно, что» и
«необходимо, чтобы», называется логикой возможного или алетической
логикой. Деонтическая логика вводит модальности разрешено, обязательно,
реализующие языковые конструкции «разрешается», «надо, чтобы».
Эпистемическая логика, или логика знаний, исследует модальности знания и
веры, тогда как временная логика вводит модальности иногда и всегда (в
будущем и прошлом) вместе с их отрицаниями часто и никогда. Появление
нечетких логик, теории нечетких множеств и других нечетких теорий [48-51]
связано с работой [52]. Основная идея Заде состояла в том, что человеческий
способ рассуждений, опирающийся на естественный язык, не может быть
описан в рамках традиционных математических формализмов. Цель Заде
состояла в построении новой математической дисциплины, в основе которой
лежала бы не классическая теория множеств, а теория нечетких множеств.
Неклассические логики можно сочетать с классическим исчислением
предикатов. В свою очередь, исчисление предикатов можно комбинировать с
такими сравнительно эффективными механизмами вывода, как резолюция
[41]. Недостаток логического формализма – его неструктурированность:
например, для сбора всей информации по одному объекту приходится
пробегать все множество логических формул некой базы данных.
Глобализации и структурированию информации служат графовые
представления.
Идеи графового представления семантических и логических связей
между объектами берет начало от работ Пайерса [53] и в настоящее время
графовые представления знаний заняли прочное место в теории и практике
ИИ [54, 55]. Граф собирает вокруг одного узла всю информацию по
некоторому объекту, поэтому графовые представления, такие как
концептуальные графы [56, 57] и семантические сети [58], позволяют
16
визуализировать модель мира, которому принадлежит решаемая проблема.
Концептуальные графы и семантические сети составляют графическую
версию исчисления предикатов. Еще одно известное универсальное средство
представления знания для естественного языка является механизм фреймов.
Фреймы как объектное представление информации о предметной области
можно получить как из логического представления, так и из сетевого. Фрейм
— это модель абстрактного образа, минимально возможное описание
сущности какого-либо объекта, явления, события, ситуации, процесса. Фрейм
состоит из имени и отдельных единиц, называемых слотами. Основным
преимуществом фреймов как способа представления знаний является
наглядность и гибкость в употреблении. Кроме того, фреймовая структура
согласуется с современными представлениями о хранении информации в
памяти человека. В последние годы термин «фреймовый» часто заменяют
термином «объектно-ориентированный». Шаблон фрейма можно
рассматривать как класс, экземпляр фрейма — как объект. Языки объектно-
ориентированного программирования предоставляют средства создания
классов и объектов, а также средства для описания процедур обработки
объектов (методы). Существуют также специализированные языки
представления знаний на основе фреймовой модели, примерами которых
являются: FRL (Frame Representation Language), KRL (Knowledge
Representation Language), фреймовая «оболочка» Kappa и др.
Семантические сети используются для передачи смысловых связей
между элементами языка [59]. Семантическая сеть – структура для
представления знаний в виде узлов, соединенных дугами. Семантические
сети составляют конкуренцию фреймовым системам, логическому
программированию и другим языкам представления знаний. Начиная с конца
50-ых годов прошлого века были созданы и применены на практике десятки
вариантов семантических сетей. Самые простые сети, которые используются
в системах искусственного интеллекта, – это реляционные графы: каждый
узел представляет собой понятие, а каждая дуга - отношения между
17
различными понятиями. При работе с реляционными графами возникают
проблемы с передачей всего многообразия временных отношений и
отношений модальности. Еще одно средство представления знания для
естественного языка является механизм концептуальных графов,
предложенный в [56]. По своей идеологии формализм концептуальных
графов разрабатывался как средство представления высказываний на
естественном языке [57, 60]. Теория рематических графов [61] применяет
механизм сетевых представлений для отражения феноменов, характерных
для языка как средства коммуникации. Эта теория обеспечивает
представление одновременно семантической, синтаксической и
фонетической информации. Еще одна разновидность семантических сетей –
пропозиционные сети. В пропозиционных сетях узлы представляют целые
предложения. Эти узлы являются точками соприкосновения для отношений
между отдельными предложениями связанного текста. Различные
разновидности семантических сетей отличаются своими целями и исходными
предпосылками, формой представления отношений между объектами и
используемым для этого формализмом, набором решаемых задач.
Свойство иерархии и наследования, которое присуще всем
семантическим сетям, является отличной структурой для индексирования
базы знаний и ее эффективной организации: следование по какой-либо ветви
с помощью иерархии осуществляется гораздо быстрее.
Весьма популярна идея сетей переходов [62-65], которая была
реализована в различных модификациях, одной из которых являются сетевые
грамматики Вудса [62]. Эти грамматики более просты в реализации, чем
порождающие грамматики. Сети Вудса обладают одновременно
прозрачностью, логической мощностью и эффективностью, благодаря чему
они быстро получили известность и распространение. Предложенные Вудсом
расширенные сети переходов позволяют получать глубинную структуру
предложения (в смысле Хомского), минуя поверхностную, причем они
позволяют производить перестановку, перестройку, элиминацию
18
составляющих и т. д. Вообще, сети Вудса в принципе позволяют проводить
анализ структуры текста не только на уровне предложения, но и на уровне
структуры слов (морфологический разбор). Однако они обладают одним
существенным недостатком: ориентированы в основном для анализа текста, в
режиме же синтеза нуждаются в значительной перестройке.
Графы и сети представляют собой простые понятия для программ,
которые изучают новые структуры. Их преимущество при обучении
заключается в легкости добавления и удаления, а также сравнения дуг и
узлов. И хотя преимуществом сетей является наглядность представления
знаний, вывод на сетях, безусловно, сложнее. Более того, многие типы
отношений не исследованы и формального алгоритма не существует.
Применение к анализу русских текстов рассмотренных выше грамматик
вызывает ряд трудностей, связанных с наличием развитой морфологии в
русском языке и с более свободным по сравнению с другими языками
порядком слов в предложении. Другим следствием применения таких
грамматик является, очевидно, невозможность успешного анализа
неграмматичных конструкций, которые, тем не менее, широко
распространены в естественном языке, имеют смысл и должны учитываться
на семантическом уровне.
Для моделирования словообразования русского языка Соболевой П. А.
предложен искусственный реляторный язык аппликативной модели [66, 67].
Аппликативная порождающая модель относится к категории абстрактных
деривационных систем, в основе которых лежит ограниченное число
исходных объектов и правила деривации производных объектов. Реляторный
язык аппликативной модели оказался весьма удобным средством
единообразного описания словообразовательной структуры, надолго
определив разработки в данном направлении (П. А. Соболева, Е. Л. Гинзбург,
И. В. Альтман, С. С. Белокриницкая, А. С. Шишкина, Ю. А. Шепель).
Практический интерес представляют работы в которых моделерование
языковых явлений базируется на аппарате теории алгоритмов. Здесь следует
19
особо остановиться на модели многоступенчатого морфологического анализа
Г. Г. Белоногова [68-70]. В этой модели морфологический анализ и синтез
производятся с помощью словаря основ и вспомогательных таблиц. Каждой
основе ставится в соответствие сочетание кода словоизменительного класса и
кода флективного класса. Данная модель явилась прототипом для многих
моделей, нашедших практическое применение в реализации спеллеров
русского языка.
Рядом исследователей были предложены модели языка на базе
теоретико-множественного аппарата. Примером таких моделей являются
теоретико-множественные модели языков Маркуса. Они строятся
следующим образом. Рассматривается некоторое разбиение словаря
естественного языка (он считается конечным множеством) на классы
(например, совпадающие с множествами флективных форм слов). С
помощью такого разбиения можно дать формальное определение
грамматического рода или категории падежа. Кроме этого, Маркус вводит
понятие синтаксических типов, которые приблизительно соответствуют
традиционным частям речи. Осуществляя операции над синтаксическими
типами, становится возможным определить грамматическую правильность
предложения на естественном языке.
Однако математическое языкознание не может ограничиться
детерминистской, неколичественной экспликацией лингвистически объектов.
Во-первых, это ограничение затрудняет преобразование нечетких
лингвистических множеств, элементы которых имеют вероятностные веса
принадлежности, в четкие множества искусственных языков. Между тем
указанное преобразование лежит в основе всех видов машинной переработки
текста и автоматического распознавания смысла. Учитывая размытость
языковых явлений, предлагался и аппарат нечетких множеств, предложенный
Лотфи Заде.
Во-вторых, при таком ограничении вне сферы применения
математических методов остается акустико-физиологическая и
20
психолингвистическая проблематика речеобразования, а также стилистика и
история языка, при изучении которых широко применяются не столько
комбинаторные, сколько количественные измерения. Для решения задач
распознавания фонем, групп фонем и слов используются такие
стахостические модели, как скрытая марковская модель или НММ (hidden
Markov modelling), искусственные нейронные сети (ИНС) или их
комбинации, частотные словари словоформ и методы, основанные на RTP
(Relative Tag Probabilities), биграмные и триграммные модели. Для описания
лексических единиц существуют еще такие формализмы как аппарат
синтаксических групп [71-73], онтологии [74], логические исчисления [75,
76] и др.
Однако все они плохо приспособлены для целей описания языковых
структур. Например, теория множеств и исчисление предикатов, теория
алгоритмов и теория графов описывают принципиально бесконечные
системы или процессы, а естественный язык – это конечный объект [13]. К
тому же языки программирования и теории алгоритмов – это такие языки,
которые могут описывать только однозначные функции. А в среде ученых,
занимающихся изучением языка и мышления, существует предположение о
том, что фразы, которыми люди выражают свои мысли, – это отношения;
более того, весь механизм языка представляет собой систему отношений и
ничего более [77]. Т.о., естественный язык требует формальных средств для
описания многозначных функций, т.е. отображений произвольного вида,
иначе говоря, – отношений.

1.2. Современное состояние проблемы алгебраизации логики

В 1976 году Ньюэлл и Саймон высказали предположение, что любая


физическая система ведет себя разумно лишь в том случае, если она является
физической символьной системой [78]. Исходя из этой гипотезы о
физической символьной системе, при решении задач искусственного
21
интеллекта огромное значение имеют формальная логика и поиск. Одним из
языков теории интеллекта является логическая математика [79, 80]. Общая
теория интеллекта совпадает с той частью логической математики, которая
перспективна для информатизации; она изучает математические структуры,
которые выявляются при математическом описании конкретных механизмов
реальных интеллектуальных систем [81-86]. Логическая математика, в свою
очередь, разрабатывает новый формальный язык, необходимый для описания
естественных информационных процессов. Делает она это с помощью
алгебраизации логики. Логика в качестве основы языка теории интеллекта
выбрана ввиду ее универсальности: «…только на языке логики можно
описывать любые возможные объекты и процессы, в том числе, и саму
логику» [87, 88]. Алгебраизация логики – это процесс ее трансформации в
удобный язык описания информационных процессов [81].
Абстрактно логику можно определить как набор правил, которым
должны удовлетворять любые потенциально возможные объекты, и
взаимодействия между ними. С древнейших времен человек стремился к
накоплению и использованию логических знаний. В настоящее время собран
огромный материал в различных научных областях. Прогресс
информационной революции требует его использования для накопления с
помощью широкого использования информационной техники и дальнейшего
использования более сложных и в настоящее время недоступных логических
знаний.
Основоположником логики как науки принято считать древнегреческого
философа и ученого Аристотеля (384-322 гг. до н.э.) [40, 89]. Он впервые
разработал теорию дедукции, т.е. теорию логического вывода. На
протяжении многих веков различными философами и целыми философскими
школами дополнялась, усовершенствовалась и изменялась логика
Аристотеля. Это был первый (доматематический) этап развития формальной
логики. Второй этап связан с применением в логике математических
методов, начало которому положил немецкий философ и математик
22
Г. Лейбниц (2646-1716) [90]. Важный период становления математической
логики начинается с появления работ английского математика и логика
Дж. Буля (1815-1864). Он применил к логике методы современной ему
алгебры – язык символов и формул, составление и решение уравнений. Им
была создана своеобразная алгебра – алгебра логика. В этот период она
оформилась, как алгебра высказываний и была значительно развита в работах
шотландского логика А. де Моргана (1806-1871), английского логика
У. Джевонса (1835-1882), американского логика Ч. Пирса (1839-1914),
немецкого алгебраиста и логика Э. Шрёдера (1841-1902), русского
математика и логика П. С. Порецкого (1846-1907). Создание алгебры логики
явилось заключительным звеном в развитии формальной логики: алгебра
логики поставила и решила в самом общем виде те задачи, которые
рассматривались в Аристотелевой логике. В XIX в., в ходе развития
математической логики, сформировались различные направления
обоснования математики, создатели которых по-разному пытались
преодолеть возникшие на тот момент в математике трудности, связанные с
выявлением парадоксов в теории множеств. В каждом из них были получены
фундаментальные результаты, оказавшие влияние на развитие не только
математической логики, но и всей математики [91].
Основоположником одного из направлений: логицизма, – явился
немецкий математик и логик Г. Фреге (1848-1925), построивший первую
формальную логическую систему, включавшую значительную часть
арифметики. Кроме того, им и независимо от него Ч. Пирсом были введены в
язык логики предикаты, предметные переменные и кванторы, что дало
возможность применить этот язык к вопросам обоснования математики.
Задачу аксиоматического построения арифметики, геометрии и
математического анализа ставил перед собой итальянский математик
Дж. Пеано (1858-1932). Сведение чистой математики к логике продолжили в
своем трехтомном труде «Основания математики» (1910-1913) английские
математики Б. Рассел (1872-1970) и А. Уайтхед (1861-1947).
23
Немецкий математик Д. Гильберт (1862-1943) предложил свой путь
преодоления трудностей в основаниях математики, базирующийся на
применении аксиоматического метода, с помощью которого все
математические утверждения записываются в виде логических формул,
некоторые из которых выделяются в качестве аксиом, а остальные логически
из них выводятся [92, 93]. Это направление получило название формализм.
Открытие в 1930-1931 гг. австрийским математиком К. Гёделем (1906-1978)
неполноты формализованной арифметики показало ограниченность
гильбертовской программы обоснования математики. Тем не менее, работы
Гильберта и его последователей привели к глубокой разработке
аксиоматического метода и окончательному осознанию его фундаментальной
роли в математике. Аксиоматическая теория и ее методы – это
синтаксическое учение: учение о формулах и их свойствах. Однако есть и
семантическая сторона этого учения: учение о функциях, которые
выражаются данными формулами. Изучением этих функций заняты учения
об алгебрах. Т.о., к началу ХХ в. был разработан достаточно обширный
аппарат алгебры логики для того, чтобы можно было приступить к
формальному описанию естественного языка. Однако, при попытках
формализации естественного языка с помощью булевой алгебры,
специалисты столкнулись с рядом трудностей. Аппарат булевой алгебры
оперирует с двоичными знаками, а в языке имеют место многозначные
переменные (буквенные). Этого недостатка, казалось бы, можно избежать,
обратившись к аппарату многозначной логики. Однако при ближайшем
рассмотрении обнаруживается, что многозначная логика развита только в
сторону описания однозначных функций, а не отношений. Т.о., все виды
морфологической обработки естественного языка сводятся к решению
алгебрологических уравнений с различными исходными данными
(полностью или частично заданными), что при наличии алгоритма решения
этих уравнений, значительно упрощает формализацию различных процессов
словесной обработки [94]. При таком подходе имеется возможность
24
эквивалентных преобразований и минимизации рассматриваемой модели.
Обратившись к аппарату теории графов, обнаруживается, что, хотя он и
используется для описания конечных отношений, однако совершенно не
содержит в себе выразительных средств для аналитической записи этих
отношений в виде уравнений некоторой алгебры.
Анализируя недостатки существующего математического аппарата и
трудности, с которыми пришлось столкнуться при моделировании
естественного языка, в 70-х годах 20-го столетия был создан математический
аппарат для формального описания естественного языка, который получил
название алгебры конечных предикатов [87]. На языке данной алгебры могут
быть записаны в виде уравнений любые отношения. Представление
математической модели естественного языка в виде системы логических
уравнений (уравнений алгебры конечных предикатов) позволяет без
изменения лингвистического обеспечения решать любые задачи
грамматической обработки различных уровней языка, как с полным, так и с
частичным заданием начальных значений [13].

1.3. Алгебра предикатов и предикатных операций как


математический аппарат описания дискретных объектов, процессов и их
свойств

Алгебра предикатов – математический аппарат, предназначенный для


формального описания дискретных объектов и процессов [87]. К числу таких
объектов и явлений относятся алгоритмы, программы, схемы ЭВМ, граф-
схемы, лингвистические и логические закономерности, многие явления
социологии, экономики, биологии, психологии и генетики, механизмы
распознавания образов, интеллектуальные процессы [95]. Описываемые
математические средства являются обобщением аппарата алгебры логики и
многозначной логики. Алгебра предикатов, как формальный аппарат,
обладает единством выразительных средств: «Системный подход к
25
моделированию различных структурных единиц языка (флексийный в том
числе) на базе применения единого формального аппарата алгебры конечных
предикатов, позволит в перспективе создать гибкую, полную, адекватную,
экономичную модель естественного языка» [94]. Кроме того, общность
выразительных средств делает удобным анализ различных фрагментов такой
модели языка.
Доказано [96], что алгебра конечных предикатов полна, т.е. на ее языке
могут быть описаны любые конечные отношения. Поэтому любой другой
математический аппарат, предназначенный для описания произвольных
конечных отношений, в логическом смысле обязательно будет эквивалентен
алгебре конечных предикатов. Основным преимуществом использования
логики предикатов для представления знаний является то, что она обладает
хорошо понятными математическими свойствами, имеет мощный механизм
вывода, который может быть непосредственно запрограммирован. С
помощью этих программ могут быть получены новые знания. Недостатками
логического описания данных является чрезмерный уровень формализации
представления знаний, трудность их прочтения.
В настоящее время логическая математика представляет собой
совокупность разнообразных алгебр, наличие каждой из которых
определяется соответствующими предметными областями: булева алгебра
предикатов, каноническая алгебра предикатов, дизъюнктивно-
конъюнктивная алгебра конечных предикатов, дизъюнктивная алгебра
конечных предикатов [77, 81, 97-102]. В первую очередь необходимо
отметить дизъюнктивно-конъюнктивную алгебру конечных предикатов,
предложенную в данных работах. Она представляет собой обобщение
аппарата булевых функций и аппарата многозначной логики. В роли
базисных элементов этой алгебры используется предикат 0, а также
предикаты xia узнавания предмета a по переменной xi , i  1, m, a  Ai

1,если xi  a,
xia  
0,если xi  a.
26
Символ a в записи предиката xia называется его показателем. Для
предикатов узнавания предмета справедливы: закон отрицания: xia =
 
bU
b а
хib ; закон ложности: если b  a , то xia xib  0 ; закон истинности: bU

хib =1. Все эти законы справедливы при любых xi  U , i  1, m, a, b  U [104]. В


роли базисных операций в дизъюнктивно-конъюнктивной алгебре
предикатов используются дизъюнкция и конъюнкция.
Использование этой алгебры позволило приступить к формальному
описанию абстрактных понятий, которыми пользуется человек в своей
интеллектуальной деятельности. При этом возникла необходимость в
разработке алгебр конечных предикатов более высокого порядка, которые
позволили бы в гораздо более компактной и естественной форме
математически описывать многочисленные и разнообразные понятия
высокой степени абстракции, широко используемые человеческим
интеллектом. В работах [100, 101] были предложены различные алгебры
предикатных операций (АПО): булева АПО, АПО с константами и
переменными, дизъюнктивно-конъюнктивная АПО, прикладная и
фундаментальная алгебры предикатных операций, лингвистическая АПО. И
если алгебра предикатов – алгебра для записи отношений (предикатов), то
алгебра предикатных операций – алгебра для записи операций над
предикатами.
В связи со всем вышеизложенным, актуальной представляется задача
дальнейшего исследования логики предикатов. В работе [101] разработана
фундаментальная алгебры предикатных операций. Фундаментальной
называется любая алгебра предикатных операций, у которой базисными
операциями служат дизъюнкция X  Y и конъюнкция X  Y всевозможных
предикатных операций X и Y , а базисными элементами – предикаты 0 и 1
, всевозможные предикаты узнавания предмета xia (i  1, m; xi , a  Ai ) и
всевозможные предикаты узнавания предиката XP
j ( j  1, n; X i , P  B j ) . В
этой алгебре в роли основных законов используются все основные законы
27
булевой алгебры, закон отрицания для предикатов узнавания предмета
x ia   x ib X P
  X Q
b Ai
b a
и узнавания предиката j
QB j
Q P
j
; закон истинности

для предикатов узнавания предмета  xia  1 и узнавания предиката


aAi

 X Pj  1 ; закон ложности для предиката узнавания предмета, x a x b  0 если


PB j i i

a  b , и узнавания предиката X Pj X Qj  0 , если P  Q . Перечисленные законы

справедливы для всех i  1, m; j  1, n; a, b  Ai ; P, Q  B j . Они образуют

полную систему законов фундаментальной алгебры. Теорема о полноте


системы законов фундаментальной алгебры доказана в [101].
При любом носителе N фундаментальная алгебра предикатных
операций полна. Дизъюнктивно-конъюнктивная алгебра предикатов на
носителе M является подалгеброй фундаментальной алгебры предикатных
операций на носителе N . Если из базиса фундаментальной алгебры
исключить все предикаты узнавания предиката XP
j ( j  1, n; P  B j ) , то эта
алгебра превратится в дизъюнктивно-конъюнктивную алгебру предикатов.
Алгебра предикатных операций вместе с ее подалгеброй, являющейся
алгеброй предикатов, называется алгеброй предикатов и предикатных
операций. Как было отмечено выше, фундаментальная алгебра полна. А это
означает, что с помощью формул фундаментальной алгебры можно выразить
любую предикатную операцию, содержащуюся в ее носителе. Кроме того,
только для фундаментальной алгебры известна полная система законов,
позволяющая решить вопрос о том, выражают ли две произвольно взятые ее
формулы одну и ту же предикатную операцию или нет. Эти качества
фундаментальной алгебры делают ее незаменимой для теоретических
изысканий в области логической математики. Вместе с тем, для практических
применений фундаментальная алгебра не всегда удобна, поскольку ее
формулы и тождества не обладают достаточной компактностью. Для
практических целей более удобна так называемая “прикладная алгебра
предикатных операций”. Эту алгебру еще иначе называют алгеброй
28
подстановочных операций, так как единственная новая базисная операция в
этой алгебре – подстановка [100]. Базис операций прикладной алгебры
образован из подстановок вида x / a ( X ) (i  1, m; a  U ) ,
i а также операции
отрицания X и дизъюнкции X  Y , произвольных предикатных операций X
и Y , и с базисом элементов, образованным из предикатов равенства вида
D  x1 , xi    x1a xia , ( i  2, m ) (здесь они выступают в роли константных
aM

предикатных операций) и предикатных переменных X j , ( j  1, n ),

представляющих в данном случае тождественные предикатные операции.


Фундаментальная и прикладная алгебры предикатных операций, имеющие
один и тот же носитель, равносильны. Доказательство теоремы приведено в
[99]. А это означает, что прикладная алгебра, как и фундаментальная алгебра
полна.

1.4. Задача построения кванторной алгебры как развитие алгебры


предикатов и предикатных операций

Несмотря на то, что прикладная алгебра полна, для нее не найдено


полной системы законов, как это сделано для фундаментальной алгебры.
Трудности начинаются уже с формулировки законов для характеристики
операции подстановки. Известно, что операция подстановки аддитивна
относительно любой предикатной операции. Но таким же свойством
обладают операции замены и перестановки переменных, так что с помощью
закона аддитивности эти три операции различить не удается. В данной
области имеются только отдельные разрозненные результаты. Один из таких
результатов связан с идеей введения так называемой кванторной алгебры.
Кванторные выражения используются в двух ролях: для записи
предикатных операций и для записи отношений второго порядка. Во второй
роли они используются в классической математике для записи ее
утверждений. В первой роли – в информатике для преобразования
отношений первого порядка. Исходя из всего вышесказанного, можно
29
сделать вывод, что кванторную алгебру можно рассматривать также в двух
аспектах: в качестве алгебры предикатов второй ступени (для записи
высказываний) и в качестве алгебры предикатных операций. Особый интерес
для логической математики представляет разработка именно кванторной
алгебры предикатных операций.
Квантор xP (x ) – это аналог интегрирования в математике. Однако вид
 f ( x ) dx – частный случай. В общем случае интеграл – это линейное
преобразование вида:  f ( x ) K ( x, y )dx  g ( y ) . Данное линейное логическое
преобразование одно, не смотря на то, что очень часто и всюду используется
в природе. Т.о. квантор существования имеет следующий вид:
x  MP( x ) K ( x, y )  Q( y ) . А это есть ни что иное, как общий вид линейного
логического преобразования . В интеллектуальных системах в большинстве
случаев используются линейные логические преобразования. Именно эти
преобразования, и ни что иное, используют в своей работе логические сети –
устройство, предназначенное для решения уравнений алгебры предикатов,
предварительно преобразованных в бинарную систему [88, 105]. Логическая
сеть состоит из полюсов и ветвей и имеет алгоритм работы, описывающий их
взаимодействие [105]. Все логические сети имеют одинаковый алгоритм
работы, но состав полюсов и ветвей зависит от модели. Поэтому каждая
логическая сеть строится под заданную модель. Такая модель определяет
произвольное конечное дискретное отношение в неявном виде. Полюс сети –
это ячейка памяти, которая в каждый момент времени содержит некоторое
подмножество значений из области изменения соответствующей ему
переменной. Ветвь сети – это пара функций: из булеана области изменения
одной переменной в булеан области изменения другой переменной и обратно
(речь идет о переменных, которые находятся в полюсах сети, соединенных
между собой определенной ветвью). Каждая функция реализует линейный
логический оператор [88], ядром которого является характеристический
предикат бинарного отношения, связывающего определенные переменные.
Т.о., в ветвях логической сети, при движении информации в обе стороны,
30
работают кванторы существования. Однако в природе существует два
квантора. А сеть использует только квантор существования. В полюсах сети
имеем множество значений, которое на каждом такте сужается, т.е., в
результате получается однозначный или многозначный ответ. Однако
природа не зря «ввела» квантор общности. В сети может быть второй
параллельный слой – конъюнктивный квантор общности. Если взять его, то
изначально все множества пустые и квантор  расширяет множество
значений. Работают две двойственные сети. Получается вилка. И если два
множества конечных значений совпадут, то сеть находит корректное
решение – это означает, что в сети нет пробок. Это критерий эффективности
работы сети. Таким же образом можно определить, правильно ли заданы
внутренние состояния и др.
Функционирование логической сети, сводится к следующему:
пользователь вводит значения некоторых значений переменных, заданных в
полюсах сети (которые могут задаваться неоднозначно), а сеть определяет
значения остальных переменных. Исходные данные поступают в
соответствующие полюса сети; результат решения задачи так же содержится
в полюсах после остановки ее работы. Логическая сеть работает в
итеративном режиме, каждая итерация называется тактом. Остановка
происходит, когда состояние сети на очередном такте повторяется [95].
Реализовывать программно имеет смысл только логические сети с
относительно небольшим числом полюсов и ветвей. Обход полюсов и ветвей
на каждом такте любая программа на персональном компьютере
осуществляет последовательно. С ростом числа полюсов и ветвей скорость
обработки сети будет падать. Когда число полюсов сети достигнет порядка
104 (а это далеко не предел), то скорость работы программы, моделирующей
такую логическую сеть, вряд ли будет приемлемой. Между тем многие
задачи интеллектуальной обработки естественного языка требуют своего
решения в режиме реального времени. Например, при организации диалога с
31
компьютером на естественном языке задачи анализа и синтеза текста должны
решаться практически мгновенно – так, как это делает человек [95].
Чтобы скорость работы логической сети практически не зависела от ее
размеров, надо реализовать эту сеть в такой аппаратной платформе, где
однотипные операции на каждом такте смогут выполняться одновременно
[95]. В качестве такой параллельной платформы были выбраны
программируемые пользователем вентильные матрицы – FPGA (Field
Programmable Gate Array), которые относятся к классу программируемых
логических интегральных схем (ПЛИС). Впервые опыт такой реализации был
осуществлен на кафедре автоматического проектирования вычислительной
техники (АПВТ) в Харьковском национальном университете
радиоэлектроники [107]. Для реализации была выбрана модель логической
сети, выполняющая флективную обработку имен прилагательных русского
языка.
К настоящему времени сформировалась идея использования логической
сети в качестве компоненты персонального компьютера, расширяющей его
интеллектуальные возможности [108]. В общих чертах эту идею можно
представить следующим образом. Кристалл программируемой логики,
реализующий логическую сеть, располагается в виде процессора на PCI
плате, которая устанавливается на материнской плате персонального
компьютера. Процессор логической сети имеет высокоуровневый доступ к
шине посредством PCI контроллера. Драйвер этого устройства имеет
программный интерфейс пользовательских приложений, например,
компоненты в текстовом процессоре, системе автоматического перевода,
распознавания текста или речи [95].
1.5. Обоснование выбора цели и задач исследования

В связи со всем вышеизложенным актуальной представляется задача


дальнейшего исследования логики предикатов. Развитие аппарата алгебры
конечных предикатов, как языка логической математики, требует разработки
32
многих теоретических вопросов. Например, формальное описание
абстрактных понятий, которыми пользуется человек в своей
интеллектуальной деятельности, потребовало разработки алгебр конечных
предикатов более высокого порядка, чем первый –кванторной алгебры
предикатных операций.
Множество работ школы Ю. П. Шабанова-Кушнаренко посвящены
применению аппарата АКП в задачах автоматической обработки текстовой
информации, вопросах машинного перевода, понимания смысла дискурса
[95, 96, 109-113]. Построено множество моделей флективной обработки
именных и глагольных частей речи [98, 105, 109-112]. Ближайшая задача –
представить единой логической сетью полную модель флексии,
охватывающую все части речи. Для этого необходимо разработать метод, с
помощью которого можно было бы осуществить синтез этих моделей в одну
общую модель. В связи с этим большую актуальность приобретает задача
разработки метода композиции моделей, на основании которого будет
возможным соединение разрозненных моделей, и синтез соответствующих
им логических сетей.
Методы, основанные на применении языка алгебры конечных
предикатов, могут оказаться полезными и в других областях деятельности
человека, которые требуют объединения большого количества знаний в
гибкую систему. Примером такой системы является критичная
информационная система. Обеспечение функциональной стабильности
критичной информационной системы является сложной проблемой,
требующей системного решения комплекса взаимосвязанных задач по
разработке теоретических положений, методов автоматизированного
моделирования и анализа сложных информационных систем [111].
Компьютерные информационные системы можно отнести к
сложноорганизованным эргатическим информационным системам,
использующим биологические и компьютерные технологии обработки
информации, для которых характерно наличие технологических участков с
33
интеллектуальным управлением. Последнее обстоятельство усложняет
анализ проблемной области, поскольку свойства функциональной
стабильности неоднозначны для информационных систем с разным уровнем
сложности структурной организации. Представление логического
компонента алгоритма анализа функциональной стабильности в виде
формальных операций логического следования на множестве предложений
языка логики предикатов первого порядка [103, 114-117] позволяет
рассматривать процесс доказательства функциональной стабильности
архитектуры как многоуровневый управляемый логический вывод
некоторого выражения этого языка, который отыскивается в ходе построения
эксперимента. А поскольку алгебра предикатов служит для формульной
записи отношений, а, следовательно, и предикатов, то целесообразно было
бы использовать алгебру предикатов и для анализа функциональной
стабильности критичных информационных систем.
Исходя из всего вышесказанного наметим цель и сформулируем задачи
исследований.
Цель диссертационной работы состоит в разработке математических
моделей и методов анализа и синтеза логических вычислительных сетей,
используя алгебру конечних предикатов и предикатных операций, для
расширения возможностей и повышения качества обработки информации в
естественно-языковых системах и упрощения процесса обработки первичной
информации в информационных системах для анализа их функциональной
стабильности.
Для достижения намеченной цели поставлены следующие задачи
разработки и исследования.
1. Рассмотреть формальные аппараты моделирования естественного
языка и методы их обработки. Провести анализ научных достижений в
областях: алгебраизации логики; разработки алгебры предикатов и
предикатных операций как математического аппарата описания дискретных
объектов, процессов и их свойств; разработки логических сетей как
34
эффективного средства формального представления информации и решения
логических уравнений.
2. Разработать кванторную алгебру предикатных операций как аппарат
математического моделирования и исследования дискретных объектов и
систем. Исследовать данную алгебру на свойство полноты. Определить для
нее систему основных тождеств.
3. Разработать методы композиции и декомпозиции по набору
переменных моделей, формализованных с помощью алгебры предикатов, для
исследования и математического моделирования дискретных процессов и
объектов. Разработать предикатную модель и соответствующая ей
логическую сеть флективной обработки притяжательных имен
прилагательных русского языка.
4. На основании метода композиции по набору переменных и
существующих предикатных моделей флективной обработки
самостоятельных частей речи, выполнить синтез математической модели
склонения именных словосочетаний русского языка типа согласование и
соответствующей ей логической сети.
5. Усовершенствовать метод построения математической модели
архитектуры информационной системы для проведения анализа ее
функциональной стабильности. Построить предикатную математическую
модель статического состояния информационной системы на физическом,
синтаксическом, семантическом уровнях и разработать соответствующие им
логические сети. Описать опасные и безопасные состояния, правила перехода
системы в другие состояния в виде формул кванторной алгебры предикатных
операций.

Вам также может понравиться