Вы находитесь на странице: 1из 9

1

5. СЕМАНТИЧЕСКИЕ СЕТИ И КОНЦЕПТУАЛЬНЫЕ ГРАФЫ

5.1. Представление знаний семантическими сетями.

5.2. Классификация семантических сетей.

5.3. Достоинства и недостатки семантических сетей.

5.4. Концептуальные графы.

Вопросы для самопроверки.

5.1. Представление знаний семантическими сетями

Семантика – раздел языкознания, изучающий значение единиц языка, прежде всего его слов и
словосочетаний. В более общем смысле, семантика определяет смысл знаков (образов,
обозначений) и их сочетаний.

Семантическая сеть (смысловая сеть) — модель предметной области, представленная в виде


графа, вершинами которого являются понятия, а дуги (ребра) – отношения между ними.

Прародителями современных семантических сетей можно считать экзистенциальные (лат. exsisto


- возникаю, происхожу, существую) графы, предложенные Чарльзом Пирсом в 1909 г. С их
помощью описывались понятия и логические связи между ними некоторой предметной области.
Важным этапом в становлении семантических сетей стали работы немецкого психолога Отто
Сэлза 1913 и 1922 гг. Для описания понятий и связей между ними, а также изучения методов
наследования свойств он использовал графы и семантические отношения. Первые компьютерные
реализации семантических сетей появились в конце 1950-х – начале 1960-х гг. в системах
машинного перевода (Ричард Риченс, Маргарет Мастерман). Одной из основополагающих
теоретических работ по семантическим сетям считается труд американского психолога Росса
Куиллиана о «семантической памяти» («Semantic memory. Semantic information processing»,
«Семантическая память. Семантическая обработка информации», 1968г.) [23, 31].

В качестве понятий обычно выступают абстрактные или конкретные объекты (огурец, машина,
любовь, Маша). В качестве отношений наиболее часто используются следующие (смысловая
классификация) [19, 31]:

- таксономические («класс – подкласс – экземпляр», «множество – подмножество – элемент» и


т.п.). Данный тип отношения называют также отношением AKO (англ. A Kind Of – является
разновидностью), IS A (является, это есть) или гипонимии (гипероним – общая сущность; гипоним
– частная сущность);

- структурные («часть – целое»). Данный тип отношения называют также отношением Part of
(является частью), Has part (состоит из, включает в себя), агрегации (лат. aggregatio –
присоединение), композиции (лат. compositio – составление, связывание, сложение, соединение)
или меронимии (холоним – сущность, включающая в себя другие; мероним – сущность,
являющаяся частью другой);

- родовые («предок» - «потомок»);


2
- производственные («начальник» - «подчиненный»);

- функциональные (определяемые обычно глаголами «производит», «влияет» и т.п.);

- количественные (больше, меньше, равно и т.п.);

- пространственные (далеко от, близко от, за, под, над и т.п.);

- временные (раньше, позже, в течение и т.п.);

- атрибутивные (иметь свойство, иметь значение);

- логические (И, ИЛИ, НЕ);

- казуальные (причинно-следственные).

Отношения можно также классифицировать по степени участия (арности) понятий в отношениях:

- унарное (рекурсивное) - отношение связывает понятие само с собой;

- бинарное - отношение связывает два понятия;

- N-арное - отношение, связывающее более двух понятий.

Приведем пример двух простых семантических сетей. Одна из них (рис.5.1а) описывает понятие
«помидор», а другая (рис. 5.1б) описывает факт «Маша укрепила стул клеем».

Рис.5.1. Примеры семантических сетей

В разных вариациях семантических сетей для отображения понятий используются различные


геометрические примитивы: прямоугольники, овалы, четырехугольники со скругленными углами и
т.п.

Проблема поиска решения в семантической сети сводится к задаче поиска фрагмента сети,
соответствующего поставленному запросу. Например, вопрос «Какого цвета помидор?» можно
графически представить в виде подсети.

Рис.5.2. Представление вопроса в виде подсети

Наложение подсети вопроса на сеть, описывающую предметную область, дает ответ – «красный».

Семантические сети широко используются в экспертных системах в качестве языка


представления знаний (например, в экспертной системе PROSPECTOR), в системах
распознавания речи и понимания естественного языка. Непосредственное отношение к сетевым
моделям имеют исследования по реляционным, сетевым и иерархическим БД.

 
3

5.2. Классификация семантических сетей

Классифицировать семантические сети можно по следующим признакам [19, 21]:

- по количеству типов отношений:

- однородные (с единственным типом отношений);

- неоднородные (с различными типами отношений);

- по назначению. Обычно совпадает с преобладающим типом отношений, например:

- классифицирующие - позволяют описывать различные иерархические отношения между


понятиями. Могут содержать таксономические, структурные, родовые и производственные
отношения. В частности, если известную биологическую классификацию Карла Линнея (жизнь –
домен – царство – тип – класс – порядок – семейство – род – вид) представить в виде
семантической сети, то отношения между понятиями разных уровней можно рассматривать
одновременно как таксономические и структурные (например, семейство является одновременно
разновидностью и частью порядка);

- функциональные — вычислительные модели, позволяющие описывать процедуры вычислений


одних информационных единиц через другие;

- сценарии — используются для описания казуальных отношений (причинно-следственных или


устанавливающих влияние одних явлений или фактов на другие), а также отношений типа
«средство — результат», «орудие — действие» и т.п.;

- другие

5.3. Достоинства и недостатки семантических сетей

Достоинства семантических сетей [4, 21]:

- универсальность, достигаемая за счет выбора соответствующего набора отношений. В принципе


с помощью семантической сети можно описать сколь угодно сложную ситуацию, факт или
предметную область;

- наглядность системы знаний, представленной графически;

- близость структуры сети, представляющей систему знаний, семантической структуре фраз на


естественном языке;

- соответствие современным представлениям об организации долговременной памяти человека.

В качестве иллюстрации последнего утверждения приведем следующий пример [23].


4

Рис.5.3. Семантическая сеть «Канарейка»

Из психологии известно, что люди при запоминании часто используют ассоциации и стараются
иерархически организовать свои знания. Коллинс и Куиллиан проводили следующий тест. Группе
людей задавались вопросы о различных свойствах птиц, такие как «Канарейка — это птица?»,
«Канарейка может петь?» или «Канарейка может летать?».

Хотя ответы на эти вопросы, возможно, просты, изучение времени реакции показало, что при
ответе на вопрос «Может ли канарейка летать?» оно больше, чем на вопрос «Может ли канарейка
петь?». Аллан Коллинс и Росс Куиллиан объясняют эту разницу во времени ответа тем, что люди
запоминают информацию на самом абстрактном уровне. Вместо того, чтобы запоминать
конкретные свойства для каждой птицы (канарейки летают, дрозды летают, ласточки летают),
люди запоминают, что канарейки — птицы, а птицы (обычно) имеют свойство летать. Таким
образом, попытка вспомнить, может ли канарейка летать, занимает больше времени, чем
воспоминание, может ли канарейка петь. Это происходит из-за того, что для получения ответа
человек должен дольше путешествовать по иерархии структур памяти.

Недостатки семантических сетей:

- сетевая модель не дает (точнее, не содержит) ясного представления о структуре предметной


области, поэтому формирование и модификация такой модели затруднительны;

- сетевые модели представляют собой пассивные структуры, для обработки которых необходим
специальный аппарат формального вывода;

- проблема поиска решения в семантической сети сводится к задаче поиска фрагмента сети,
соответствующего подсети, отражающей поставленный запрос. Это, в свою очередь,
обуславливает сложность поиска решения в семантических сетях;

- представление, использование и модификация знаний при описании систем реального уровня


сложности оказывается трудоемкой процедурой, особенно при наличии множественных
отношений между ее понятиями.

В качестве иллюстрации последнего утверждения приведем выдержку из [25]:

Очень быстро семантические сети позволили воссоздать исходный ХАОС мироздания и снова
загнать кибернетику в интеллектуальный тупик.

Возьмем самый элементарный пример: "Федя дал книгу Мане".

Проще некуда?
5
Изобразим сеть с Федей и Маней и их связь (через книгу), направленную от Феди к Мане. Но,
поскольку все эти объекты обладают свойствами, то припишем Феде свойства "хороший и
сильный", а книге и Мане - "очень хорошая и интересная". И пририсуем их.

Но ведь есть и многие другие связи, которые тоже следует отобразить в сети: семейные (у
Феди жена и трое детей), дипломатические (с тещей), агентурные (Федя шпион, но не любит
об этом хвастаться), телепатические (у Мани еще с одним стеснительным мальчиком),
производственные (у Феди с оборонным КБ, а у Мани с начальником) и т.д. ...

5.4. Концептуальные графы

Дальнейшим развитием графовых структур, моделирующих семантику естественного языка,


являются концептуальные графы, предложенные Джоном Сова (1984г.).

Концептуальный граф – это двудольный ориентированный граф, состоящий из вершин двух


типов: понятий (англ. concept) и концептуальных отношений (англ. conceptual relation). Напомним,
что двудольный граф – это граф, множество вершин которого можно разбить на две части таким
образом, что каждое ребро графа соединяет какую-то вершину из одной части с какой-то
вершиной другой части, то есть не существует ребра, соединяющего две вершины из одной и той
же части.

Рис.5.4. Двудольный граф

Понятия в концептуальных графах отображаются прямоугольниками, отношения между ними –


эллипсами. В отличие от семантических сетей отношение между понятиями отображаются не
именованной дугой графа, а вершиной соответствующего типа, которая связывает два понятия
дугами без метки. Рассмотренный выше пример «Маша укрепила стул клеем» (см. рис.5.1) в виде
концептуального графа будет выглядеть следующим образом.

Рис.5.5. Пример концептуального графа

Авторы первых семантических сетей не уделяли должного внимания к четкому семантическому


разделению отношений вида «класс - подкласс» («множество» - «подможество») и «класс» -
6
«экземпляр» («множество» - «элемент») [13]. Например, отношения, характеризующие свойства и
поведение класса («млекопитающие»), могут отличаться от отношений подкласса («собака»),
также как отношения подкласса («собака») от отношений конкретного экземпляра («Тузик»).
Графического или символьного выделения таксономии (иерархии) понятий в семантических
графах не предусмотрено. В концептуальных графах внутри вершины, обозначающей понятие,
можно указывать имена его типа и экземпляра (разновидности типа). Например, «персона :
Маша», «млекопитающее : собака» или «собака : Тузик».

При описании конкретных, но неименованных (анонимных) экземпляров, используется маркер


«#». Например, «персона : #1234» или «собака : #4321». Использование анонимных экземпляров
позволяет упростить описание и представление предметной области (базы знаний), как набора
концептуальных графов. В частности, факт, что три собаки «Тузик», «Мухтар» и «Байкал» черного
цвета можно описать вместо одного графа двумя.

Рис.5.6. Пример использования анонимных экземпляров

Вместо обращения к экземпляру по имени можно использовать маркер «*», обозначающий любой
экземпляр типа. Т.о., имена понятий «собака» и «собака : *» являются эквивалентными.

Дополнительно к обобщающему маркеру «*» допускается использование переменных для более


упрощенного и наглядного отображения графов. В частности, для минимизации пересечений и
поворотов стрелок. Например, факт «Собака чешет лапой ухо» может выглядеть следующим
образом.

Рис.5.7. Пример использования переменной

Как отмечено ранее, база знаний представляет собой набор концептуальных графов. Каждый
отдельный граф представляет собой один факт (высказывание, правило) из предметной области,
описываемый через ассоциативные отношения между понятиями. Для представления второго
базового механизма структурирования знаний – обобщения понятий – в теории концептуальных
графов используются иерархии типов. Отдельная иерархия представляется в виде решетки,
описывающей таксономические отношения (отношения наследования) между понятиями, включая
множественное наследование. Для представления иерархии типов в виде решетки в нее
включается два специальных типа:

- универсальный тип (англ. universal type), являющийся супертипом для всех типов. Обозначается
символом «┬»;
7
- абсурдный тип (англ. absurd type), являющийся подтипом для всех типов. Обозначается
символом «┴».

На следующем рисунке приведен пример иерархии типов.

Рис.5.8. Пример иерархии типов геометрических фигур

Иерархии типов позволяют описать статическую составляющую предметной области, а


непосредственно концептуальные графы как статическую, так и динамическую.

Теория концептуальных графов предусматривает четыре вида операций, позволяющие


создавать новые графы на основе существующих. К ним относятся:

- копирование – создание точной копии какого - либо графа;

- объединение двух графов в один, если они имеют семантически общие вершины-понятия. Для
графов, отображенных на рис.5.6, результат объединения выглядит следующим образом:

Рис.5.9. Пример объединения двух графов

- ограничение – замена вершины-понятия графа другой вершиной-понятием, представляющими


его специализацию, или замена имени типа на имя подтипа (экземпляра). Пример применения
операции для графов, отображенных на рис.5.6:
8

Рис.5.10. Пример применения операции «ограничение»

- упрощение – исключение дублирующих понятий или отношений. Дублирование часто возникает


в результате операции объединения. Пример применения операции для графа, отображенного на
рис.5.7:

Рис.5.11. Пример применения операции «упрощение»

В дополнение к возможности определения отношений между понятиями предметной области,


выраженными в одном высказывании, с помощью концептуальных графов можно выражать
отношения между высказываниями. Например, предложение: «Вася предполагает, что Маша
любит мороженное». Здесь «предполагает» является отношением между субъектом «Вася» и
высказыванием «Маша любит мороженное». Все предложение целиком является высказыванием
о высказывании (метавысказыванием).

В формализме концептуальных графов выделяется особый класс понятий - утверждение (англ.


proposition). Понятие «утверждение» включает в себя один или несколько концептуальных графов,
что и позволяет определять метавысказывания. Визуально «утверждение» выражается в виде
прямоугольника, внутри которого располагаются другие концептуальные графы.

Рис.5.12. Пример метавысказывания

Помимо отображения высказываний в виде графов, наиболее наглядной и доступной для


понимания форме, они могут быть выражены в т.н. линейной форме. При этом понятия
9
заключаются в квадратные скобки, а отношения – в круглые. Например, граф, отображенный на
рис. 5.12, в линейной форме выглядит следующим образом:

[персона : Вася] <– (агент) <– [предполагает] –> (объект) –>

[[персона : Маша] <– (агент) <– [любит] –> (объект) –> [мороженное]].

При наличии более, чем двух дуг, соединяющих понятие или отношение с другими, они
перечисляются через «-». Например, для графа на рис. 5.5 линейная форма

[Маша] <– (агент) <– [укрепить] –

–> (время) –> [прошедшее]

–> (объект) –> [стул]

–> (инструмент) –> [клей].

Аналогичный подход используется, если в графе имеются контуры. Например, для графа на рис.
5.11 линейная форма

[собака : *X] –

<– (агент) <– [чешет] –

–> (объект) –> [ухо]

–> (инструмент) –> [лапа]

<– (часть) –

<– [ухо]

<– [лапа].

Существуют и другие способы текстово-символьного описания концептуальных графов. В


частности в международном стандарте «ISO/IEC IS 24707:2007. Information technology - Common
Logic (CL): a framework for a family of logicbased languages» («Информационная технология -
Общие положения: Основы семейства логически-ориентированных языков») дается описание
языка CGIF (Conceptual Graph Interchange Format, формат обмена концептуальными графами).

Вам также может понравиться