Вы находитесь на странице: 1из 47

Лингвистическое обеспечение

информационных систем
Оглавление

1 Организационно-методическое сопровождение
1.0.1 Содержание учебной дисциплины
1.1 Темы для выполнения практического задания
1.1.1 Страховая компания
1.1.2 Гостиница
1.1.3 Ломбард
1.1.4 Реализация готовой продукции
1.1.5 Ведение заказов
1.1.6 Бюро по трудоустройству
1.1.7 Нотариальная контора
1.1.8 Фирма по продаже запчастей
1.1.9 Курсы по повышению квалификации
1.1.10 Определение факультативов для студентов
1.1.11 Распределение учебной нагрузки
1.1.12 Распределение дополнительных обязанностей
1.1.13 Техническое обслуживание станков
1.1.14 Туристическая фирма
1.1.15 Грузовые перевозки
1.1.16 Учет телефонных переговоров
1.1.17 Учет внутриофисных расходов
1.1.18 Библиотека
1.1.19 Прокат автомобилей
1.1.20 Выдача банком кредитов
1.1.21 Инвестирование свободных средств
1.1.22 Занятость актеров театра
1.1.23 Платная поликлиника
1.1.24 Анализ динамики показателей финансовой отчетности различных предприятий
1.1.25 Учет телекомпанией стоимости прошедшей в эфире рекламы
1.1.26 Интернет-магазин
1.1.27 Ювелирная мастерская
1.1.28 Парикмахерская
1.1.29 Химчистка
1.1.30 Сдача в аренду торговых площадей
2 Место и назначение лингвистического обеспечения в информационных
системах
2.1 Энтропийный подход
2.2 Алгоритмический подход
2.3 Комбинаторный подход
2.4 Семантический подход
2.5 Прагматический подход Контрольные вопросы
3 Информационное взаимодействие
Контрольные вопросы

4 Знаковые системы
Контрольные вопросы

5 Морфологический анализ и синтез форм слов


5.1 Морфологический анализ (Раг1-о!-5реееЬ-1адд1пд)
5.2 Синтаксический анализ (Тех! Рагзшд)
5.3 Семантический анализ Контрольные вопросы
6 Формальные системы, грамматики, автоматы
6.1 Формальные системы (ФС)
6.2 Формальные грамматики (ФГ)
6.3 Автоматы и грамматики
6.4 Автоматная (регулярная) грамматика и конечный автомат
6.5 Теоремы Клини (прямая и обратная) Контрольные вопросы
7 Предметная область
7.1 Объекты и свойства
7.2 Единицы информации
7.3 Информационные отношения Контрольные вопросы

8 Теоретико-множественная модель представления объектов


8.1 Объектно-классификационное моделирование сложных систем
8.2 Определение понятия "объект"
8.3 Формальное моделирование атрибутов объектов
8.4 Классификация объектов. Пространство идентификаторов объектов
8.5 Состояние объекта. Пространство состояний объекта
8.6 Моделирование отношений между объектами и классами объектов
8.7 Классификационный подход к определению отношений
8.8 Моделирование отношений между параметрами объектов
8.9 Моделирование состояний объекта Контрольные вопросы
Литература
Список иллюстраций
1 Организационно-методическое сопровождение
Современные информационные технологии стали мощным инструментом ведения бизнеса. Их ис-
пользование приводит к качественно новым результатам, как на уровне отдельного предприятия,
так и экономики страны в целом. Сложившаяся тенденция стремительного роста возможностей
компьютерных и информационных технологий оказывается справедливой и для сферы экономики
и бизнеса. Информационные технологии обеспечивают качественно новый уровень системного
анализа и оценки процессов, происходящих внутри компании и за ее пределами. Управление
ресурсами компании позволяет быстро приспосабливаться к постоянно меняющимся условиям,
оперативно находить новые рынки, партнеров и клиентов, выводить на рынок новые продукты,
увеличивать доходность бизнеса. Бизнес и государственное управление нуждаются в
специалистах, способных осуществлять проектирование корпоративных информационных
систем: определять политику организаций в области ИС и ИТ, создавать информационные
модели бизнес-процессов, определять состав и функции информационных систем, выбирать
информационные технологии для реализации функций ИС, принимать обоснованные решения по
поводу интеграции отдельных компонент в корпоративную ИС и т.д. Курс «Лингвистическое
обеспечение информационных систем» входит в циклы общих математических и
естественнонаучных, общепрофессиональных дисциплин регионального и вузовского
компонентов, а также названных и специальных дисциплин в качестве курса по выбору
действующих образовательных программ подготовки бакалавров Государственного
образовательного стандарта второго поколения. Также курс учитывает требования проекта
Государственного образовательного стандарта третьего поколения подготовки бакалавров.
Учитывая фундаментальное место данной дисциплины в учебном плане подготовки специалистов
в области прикладной информатики, можно предположить перспективы применения данных
разработок в учебном процессе в условиях реформы высшей школы и двухуровневого
образования. Электронное учебное пособие «Лингвистическое обеспечение информационных
систем» предназначено для реализации программ подготовки кадров по специальности
«Прикладная информатика (по областям)», которая является одной из самых востребованных на
рынке труда. Разработка и внедрение данного электронного пособия соответствует цели инно-
вационной образовательной программы (формирование и создание научно-образовательной
системы продвижения инновационных технологий в инфраструктуру региона). Предлагаемое
пособие написано в полном соответствии с государственным образовательным стандартом по
дисциплине «Лингвистическое обеспечение информационных систем». Пособие состоит из пяти
глав, разбитых в свою очередь на параграфы.
Для самоконтроля студентов составлен список вопросов, правильные ответы на которые
гарантируют успешное изучение данного курса. После изучения соответствующего
теоретического материала студенты должны уметь отвечать на следующие за ним тестовые
вопросы и выполнять тестовые задания. Каждая глава сопровождается тестовым материалом для
проверки остаточных знаний, полученных навыков и компетенций. При изучении учебного курса
обучающийся проходит промежуточное тестирование, а после изучения проходит контрольное
тестирование. При этом обеспечена поддержка основных типов тестовых заданий:

• выбор одного из многих;

• выбор нескольких из многих.

1.0.1 Содержание учебной дисциплины


Введение Место и назначение лингвистического обеспечения, как одной из обеспечивающих
подсистем информационной системы (ИС), в контексте этапов жизненного цикла ИС.
Язык, как средство представления информации.
• Моделирующая функция языка. Понятие, суждение, умозаключение. Коммуникативная
функция языка. Знаковое представление информации.
• Семантический и прагматический подходы к измерению информации. Соотношение
понятий "информация" и "данные". Семиотический треугольник. Понятие и знак. Текст как
знак и как сообщение.

Языковые интерфейсы.

• Естественно-языковые интерфейсы. Морфологический анализ и синтез форм слов..


• Синтаксис, словосочетания, предложения. Подходы к автоматизации процесса анализа
слов и предложений. Основные компоненты ИС, применяющие данные подходы.
Инструментальные средства, выполняющие данные работы.
• Формальные методы описания искусственных языков. Грамматический разбор.
Отображение правил регулярной грамматики на состоянии конечного автомата. Выделение
лексических единиц языка с использованием конечных автоматов.

• Действующие стандарты в данной области.

Представление информации и языки обработки данных в ИС.


• Формализованные представления информации в процессе разработки ИС. Языковые средства,
создаваемые на основании анализа предметных областей, описываемых точными переменными
(атрибутивное представление).
• Соотношение основных понятий: знак, понятие, сущность, свойство, характеристические
признаки, связи.

• Ролевой и понятийный подходы к выделению отношений.

Разработка элементов информационно-поисковых систем.


• Теоретико-множественные модели идентификации. Типология и способы задания признаков.
Методы абстрагирования.

• Теоретико-множественная модель представления объектов.

• Использование классификаторов, кодификаторов, нормативных списков, тезаурусов.


• Методы и средства структурирования информационных запросов. Иерархический
классификатор предметной области. Конструкторы запросов. Поиск по ссылкам (гипертекст).

Моделирование лингвистического обеспечения ИС.


• Теоретико-множественное и линейные представления сообщений, запросов, массивов
документов, тезауруса..

• Матрицы ассоциации документов, терминов и их свойства..


• Модели и меры оценки силы парадигматических и синтагматических отношений. Меры, осно-
ванные на структурно-частотных характеристиках терминов..

1.1 Темы для выполнения практического задания


1.1.1 Страховая компания
Описание предметной области
Вы работаете в страховой компании. Вашей задачей является отслеживание финансовой
деятельности компании.
Компания имеет различные филиалы по всей стране. Каждый филиал характеризуется
названием, адресом и телефоном. Деятельность компании организована следующим образом: к
Вам обращаются различные лица с целью заключения договора о страховании. В зависимости от
принимаемых на страхование объектов и страхуемых рисков, договор заключается по
определенному виду страхования (например, страхование автотранспорта от угона, страхование
домашнего имущества, добровольное медицинское страхование). При заключении договора Вы
фиксируете дату заключения, страховую сумму, вид страхования, тарифную ставку и филиал, в
котором заключался договор.
Нужно учесть, что договоры заключают страховые агенты. Помимо информации об агентах
(фамилия, имя, отчество, адрес, телефон), нужно еще хранить информацию о филиале, в котором
работают агенты. Кроме того, нужно иметь возможность рассчитывать заработную плату
агентам. Заработная плата составляет некоторый процент от страхового платежа (страховой
платеж это страховая сумма, умноженная на тарифную ставку). Процент зависит от вида
страхования, по которому заключен договор.
1.1.2 Гостиница
Описание предметной области
Вы работаете в гостинице. Вашей задачей является отслеживание финансовой стороны работы
гостиницы.
Ваша деятельность организована следующим образом: гостиница предоставляет номера
клиентам на определенный срок. Каждый номер характеризуется вместимостью, комфортностью
(люкс, полулюкс, обычный) и ценой. Вашими клиентами являются различные лица, о которых Вы
собираете определенную информацию (фамилия, имя, отчество и некоторый комментарий). Сдача
номера клиенту производится при наличии свободных мест в номерах, подходящих клиенту по
указанным выше параметрам. При поселении фиксируется дата поселения. При выезде из
гостиницы для каждого места запоминается дата освобождения.
Необходимо хранить информацию не только по факту сдачи номера клиенту, но и
осуществлять бронирование номеров. Кроме того, для постоянных клиентов, а также для
определенных категорий клиентов, предусмотрена система скидок. Скидки могут суммироваться.

1.1.3 Ломбард
Описание предметной области
Вы работаете в ломбарде. Вашей задачей является отслеживание финансовой стороны работы
ломбарда.
Деятельность Вашей компании организована следующим образом: к Вам обращаются
различные лица с целью получения денежных средств под залог определенных товаров. У
каждого из приходящих к Вам клиентов Вы запрашиваете фамилию, имя, отчество и другие
паспортные данные. После оценивания стоимости принесенного в качестве залога товара Вы
определяете сумму, которую готовы выдать на руки клиенту, а также свои комиссионные. Кроме
того, определяете срок возврата денег. Если клиент согласен, то Ваши договоренности
фиксируются в виде документа, деньги выдаются клиенту, а товар остается у Вас. В случае если
в указанный срок не происходит возврата денег, товар переходит в Вашу собственность.
После перехода прав собственности на товар, ломбард может продавать товары по цене,
меньшей или большей, чем была заявлена при сдаче. Цена может меняться несколько раз, в
зависимости от ситуации на рынке. (Например, владелец ломбарда может устроить распродажу
зимних вещей в конце зимы). Помимо текущей цены, нужно хранить все возможные значения
цены для данного товара.

1.1.4 Реализация готовой продукции


Описание предметной области
Вы работаете в компании, занимающейся оптово-розничной продажей различных товаров.
Вашей задачей является отслеживание финансовой стороны работы компании.
Деятельность Вашей компании организована следующим образом: Ваша компания торгует
товарами из определенного спектра. Каждый из этих товаров характеризуется наименованием,
оптовой ценой, розничной ценой и справочной информацией. В Вашу компанию обращаются
покупатели. Для каждого из них Вы запоминаете в базе данных стандартные данные
(наименование, адрес, телефон, контактное лицо) и составляете по каждой сделке документ,
запоминая наряду с покупателем количество купленного им товара и дату покупки.
Обычно покупатели в рамках одной сделки покупают не один товар, а сразу несколько. Также
компания решила предоставлять скидки в зависимости от количества закупленных товаров и их
общей стоимости.

1.1.5 Ведение заказов


Описание предметной области
Вы работаете в компании, занимающейся оптовой продажей различных товаров. Вашей задачей
является отслеживание финансовой стороны работы компании.
Деятельность Вашей компании организована следующим образом: Ваша компания торгует
товарами из определенного спектра. Каждый из этих товаров характеризуется ценой, справочной
информацией и признаком наличия или отсутствия доставки. В Вашу компанию обращаются
заказчики. Для каждого из них Вы запоминаете в базе данных стандартные данные
(наименование, адрес, телефон, контактное лицо) и составляете по каждой сделке документ,
запоминая наряду с заказчиком количество купленного им товара и дату покупки.
Доставка разных товаров может производиться разными способами, различными по цене и ско-
рости. Нужно хранить информацию по тому, какими способами может осуществляться доставка
каждого товара и информацию о том, какой вид доставки (а, соответственно, и какую стоимость
доставки) выбрал клиент при заключении сделки.

1.1.6 Бюро по трудоустройству


Описание предметной области
Вы работаете в бюро по трудоустройству. Вашей задачей является отслеживание финансовой
стороны работы компании.
Деятельность Вашего бюро организована следующим образом: Ваше бюро готово искать
работников для различных работодателей и вакансии для ищущих работу специалистов
различного профиля. При обращении к Вам клиента-работодателя, его стандартные данные
(название, вид деятельности, адрес, телефон) фиксируются в базе данных. При обращении к Вам
клиента-соискателя, его стандартные данные (фамилия, имя, отчество, квалификация, профессия,
иные данные) также фиксируются в базе данных. По каждому факту удовлетворения интересов
обеих сторон составляется документ. В документе указываются соискатель, работодатель,
должность и комиссионные (доход бюро).
Также необходимо хранить информацию по открытым вакансиям. Кроме того, для
автоматического поиска вариантов, необходимо вести справочник «виды деятельности».

1.1.7 Нотариальная контора

Описание предметной области


Вы работаете в нотариальной конторе. Вашей задачей является отслеживание финансовой
стороны работы компании.
Деятельность Вашей нотариальной конторы организована следующим образом: Ваша фирма
готова предоставить клиенту определенный комплекс услуг. Для наведения порядка Вы
формализовали эти услуги, составив их список с описанием каждой услуги. При обращении к Вам
клиента, его стандартные данные (название, вид деятельности, адрес, телефон) фиксируются в
базе данных. По каждому факту оказания услуги клиенту составляется документ. В документе
указываются услуга, сумма сделки, комиссионные (доход конторы), описание сделки.
В рамках одной сделки клиенту может быть оказано несколько услуг. Стоимость каждой
услуги фиксирована. Кроме того, компания предоставляет в рамках одной сделки различные виды
скидок. Скидки могут суммироваться.

1.1.8 Фирма по продаже запчастей


Описание предметной области
Вы работаете в фирме, занимающейся продажей запасных частей для автомобилей. Вашей
задачей является отслеживание финансовой стороны работы компании.
Основная часть деятельности, находящейся в Вашем ведении, связана с работой с поставщика-
ми. Фирма имеет определенный набор поставщиков, по каждому из которых известны название,
адрес и телефон. У этих поставщиков Вы приобретаете детали. Каждая деталь наряду с названием
характеризуется артикулом и ценой (считаем цену постоянной). Некоторые из поставщиков могут
поставлять одинаковые детали (один и тот же артикул). Каждый факт покупки запчастей у
поставщика фиксируется, причем обязательными для запоминания являются дата покупки и
количество приобретенных деталей.
Выяснилось, что цена детали может меняться от поставки к поставке. Поставщики заранее
ставят Вас в известность о дате изменения цены и о его новом значении. Нужно хранить не
только текущее значение цены, но и всю историю изменения цен.

1.1.9 Курсы по повышению квалификации


Описание предметной области
Вы работаете в учебном заведении и занимаетесь организацией курсов повышения
квалификации.
В Вашем распоряжении имеются сведения о сформированных группах студентов. Группы фор-
мируются в зависимости от специальности и отделения. В каждой из них включено определенное
количество студентов. Проведение занятий обеспечивает штат преподавателей. Для каждого из
них у Вас в базе данных зарегистрированы стандартные анкетные данные (фамилия, имя,
отчество, телефон) и стаж работы. В результате распределения нагрузки Вы получаете
информацию о том, сколько часов занятий проводит каждый преподаватель с соответствующими
группами. Кроме того, хранятся также сведения о виде проводимых занятий (лекции, практика),
предмете и оплате за 1 час.
Размер почасовой оплаты зависит от предмета и типа занятия. Кроме того, каждый
преподаватель может вести не все предметы, а только некоторые.

1.1.10 Определение факультативов для студентов


Описание предметной области
Вы работаете в высшем учебном заведении и занимаетесь организацией факультативов.
В Вашем распоряжении имеются сведения о студентах, включающие стандартные анкетные
данные (фамилия, имя, отчество, адрес, телефон). Преподаватели Вашей кафедры должны
обеспечить проведение факультативных занятий по некоторым предметам. По каждому
факультативу существует определенное количество часов и вид проводимых занятий (лекции,
практика, лабораторные работы). В результате работы со студентами у Вас появляется
информация о том, кто из них записался на какие факультативы. Существует некоторый
минимальный объем факультативных предметов, которые должен прослушать каждый студент.
По окончанию семестра Вы заносите информацию об оценках, полученных студентами на
экзаменах.
Некоторые из факультативов могут длиться более одного семестра. В каждом семестре для
предмета устанавливается объем лекций, практик и лабораторных работ в часах. В качестве
итоговой оценки за предмет берется последняя оценка, полученная студентом.

1.1.11 Распределение учебной нагрузки


Описание предметной области
Вы работаете в высшем учебном заведении и занимаетесь распределением нагрузки между
преподавателями кафедры.
В Вашем распоряжении имеются сведения о преподавателях кафедры, включающие наряду с ан-
кетными данными сведения об их ученой степени, занимаемой административной должности и
стаже работы. Преподаватели Вашей кафедры должны обеспечить проведение занятий по
некоторым предметам. По каждому из них существует определенное количество часов. В
результате распределения нагрузки у Вас должна получится информация следующего рода:
«Такой-то преподаватель проводит занятия по такому-то предмету с такой-то группой».
Все проводимые занятия делятся на лекционные и практические. По каждому виду занятий уста-
навливается свое количество часов. Кроме того, данные по нагрузке нужно хранить несколько
лет.

1.1.12 Распределение дополнительных обязанностей


Описание предметной области
Вы работаете в коммерческой компании и занимаетесь распределением дополнительных
разовых работ. Вашей задачей является отслеживание хода выполнения дополнительных работ.
Компания имеет определенный штат сотрудников, каждый из которых получает определенный
оклад. Время от времени, возникает потребность в выполнении некоторой дополнительной
работы, не входящей в круг основных должностных обязанностей сотрудников. Для наведения
порядка в этой сфере деятельности Вы проклассифицировали все виды дополнительных работ,
определившись с суммой оплаты по факту их выполнения. При возникновении дополнительной
работы определенного вида Вы назначаете ответственного, фиксируя дату начала. По факту
окончания Вы фиксируете дату и выплачиваете дополнительную сумму к зарплате с учетом
Вашей классификации.
Некоторые из дополнительных работ являются достаточно трудоемкими и, в то же время, сроч-
ными, что требует привлечения к их выполнению нескольких сотрудников. Также оказалось, что
длительность работ в каждом конкретном случае составляет разную величину. Соответственно,
нужно заранее планировать длительность работы и количество сотрудников, занятых для
выполнения работы.

1.1.13 Техническое обслуживание станков


Описание предметной области
Ваше предприятие занимается ремонтом станков и другого промышленного оборудования.
Вашей задачей является отслеживание финансовой стороны деятельности предприятия.
Клиентами Вашей компании являются промышленные предприятия, оснащенные различным
сложным оборудованием. В случае поломок оборудования они обращаются к Вам.
Ремонтные работы в Вашей компании организованы следующим образом: все станки прокласси-
фицированы по странам-производителям, годам выпуска и маркам. Все виды ремонта
отличаются названием, продолжительностью в днях, стоимостью. Исходя из этих данных, по
каждому факту ремонта Вы фиксируете вид станка и дату начала ремонта.
Нужно не просто подразделять станки по типам, а иметь информацию о том, сколько раз ремон-
тировался тот или иной конкретный станок.

1.1.14 Туристическая фирма


Описание предметной области
Вы работаете в туристической компании. Ваша компания работает с клиентами, продавая им
путевки. Вашей задачей является отслеживание финансовой стороны деятельности фирмы.
Работа с клиентами в Вашей компании организована следующим образом: у каждого клиента,
пришедшего к Вам, собираются некоторые стандартные данные - фамилия, имя, отчество, адрес,
телефон. После этого Ваши сотрудники выясняют у клиента, куда он хотел бы поехать отдыхать.
При этом ему демонстрируются различные варианты, включающие страну проживания,
особенности местного климата, имеющиеся отели разного класса. Наряду с этим, обсуждается
возможная длительность пребывания и стоимость путевки. В случае если удалось договориться,
и найти для клиента приемлемый вариант, Вы регистрируете факт продажи путевки (или путевок,
если клиент покупает сразу несколько путевок), фиксируя дату отправления. Иногда Вы решаете
предоставить клиенту некоторую скидку.
Фирма работает с несколькими отелями в нескольких странах. Путевки продаются на одну, две
или четыре недели. Стоимость путевки зависит от длительности тура и отеля. Скидки, которые
предоставляет фирма, фиксированы. Например, при покупке более 1 путевки, предоставляется
скидка 5%. Скидки могут суммироваться.

1.1.15 Грузовые перевозки


Описание предметной области
Вы работаете в компании, занимающейся перевозками грузов. Вашей задачей является отслежи-
вание стоимости перевозок с учетом заработной платы водителей.
Ваша компания осуществляет перевозки по различным маршрутам. Для каждого маршрута Вы
определили некоторое название, вычислили примерное расстояние и установили некоторую
оплату для водителя. Информация о водителях включает фамилию, имя, отчество и стаж. Для
проведения расчетов Вы храните полную информацию о перевозках (маршрут, водитель, даты
отправки и прибытия). По факту некоторых перевозок водителям выплачивается премия.
Ваша фирма решила ввести гибкую систему оплаты. Так, оплата водителям должна теперь зави-
сеть не только от маршрута, но и от стажа водителя. Кроме того, нужно учесть, что перевозку
могут осуществлять два водителя.

1.1.16 Учет телефонных переговоров


Описание предметной области
Вы работаете в коммерческой службе телефонной компании. Компания предоставляет абонентам
телефонные линии для междугородних переговоров. Вашей задачей является отслеживание
стоимости междугородних телефонных переговоров.
Абонентами компании являются юридические лица, имеющие телефонную точку, ИНН,
расчетный счет в банке. Стоимость переговоров зависит от города, в который осуществляется
звонок, и времени суток (день, ночь). Каждый звонок абонента автоматически фиксируется в
базе данных. При этом запоминаются город, дата, длительность разговора и время суток.
Ваша фирма решила ввести гибкую систему скидок. Так, стоимость минуты теперь уменьшается
в зависимости от длительности разговора. Размер скидки для каждого города разный.

1.1.17 Учет внутриофисных расходов


Описание предметной области
Вы работаете в бухгалтерии частной фирмы. Сотрудники фирмы имеют возможность
осуществлять мелкие покупки для нужд фирмы, предоставляя в бухгалтерию товарный чек.
Вашей задачей является отслеживание внутриофисных расходов.
Ваша фирма состоит из отделов. Каждый отдел имеет название. В каждом отделе работает
определенное количество сотрудников. Сотрудники могут осуществлять покупки в соответствии
с видами расходов. Каждый вид расходов имеет название, некоторое описание и предельную
сумму средств, которые могут быть потрачены по данному виду расходов в месяц. При каждой
покупке сотрудник оформляет документ, где указывает вид расхода, дату, сумму и отдел.
Нужно хранить данные о расходах не только в целом по отделу, но и по отдельным
сотрудникам. Нормативы по расходованию средств устанавливаются не в целом, а по каждому
отделу за каждый месяц. Неиспользованные в текущем месяце деньги могут быть использованы
позже.

1.1.18 Библиотека
Описание предметной области
Вы являетесь руководителем библиотеки. Ваша библиотека решила зарабатывать деньги, выда-
вая напрокат некоторые книги, имеющиеся в небольшом количестве экземпляров. Вашей задачей
является отслеживание финансовых показателей работы библиотеки.
У каждой книги, выдаваемой в прокат, есть название, автор, жанр. В зависимости от ценности
книги Вы определили для каждой из них залоговую стоимость (сумма, вносимая клиентом при
взятии книги напрокат) и стоимость проката (сумма, которую клиент платит при возврате книги,
получая назад залог). В библиотеку обращаются читатели. Все читатели регистрируются в
картотеке, которая содержит стандартные анкетные данные (фамилия, имя, отчество, адрес,
телефон). Каждый читатель может обращаться в библиотеку несколько раз. Все обращения
читателей фиксируются, при этом по каждому факту выдачи книги запоминаются дата выдачи и
ожидаемая дата возврата.
Стоимость проката книги должна зависеть не только от самой книги, но и от срока ее проката.
Кроме того, необходимо добавить систему штрафов за вред, нанесенный книге и систему скидок
для некоторых категорий читателей.

1.1.19 Прокат автомобилей


Описание предметной области
Вы являетесь руководителем коммерческой службы в фирме, занимающейся прокатом
автомобилей. Вашей задачей является отслеживание финансовых показателей работы пункта
проката.
В Ваш автопарк входит некоторое количество автомобилей различных марок, стоимостей и ти-
пов. Каждый автомобиль имеет свою стоимость проката. В пункт проката обращаются клиенты.
Все клиенты проходят обязательную регистрацию, при которой о них собирается стандартная
информация (фамилия, имя, отчество, адрес, телефон). Каждый клиент может обращаться в пункт
проката несколько раз. Все обращения клиентов фиксируются, при этом по каждой сделке
запоминаются дата выдачи и ожидаемая дата возврата.
Стоимость проката автомобиля должна зависеть не только от самого автомобиля, но и от срока
его проката, а также от года выпуска. Также нужно ввести систему штрафов за возвращение
автомобиля в ненадлежащем виде и систему скидок для постоянных клиентов.

1.1.20 Выдача банком кредитов


Описание предметной области
Вы являетесь руководителем информационно-аналитического центра коммерческого банка.
Одним из существенных видов деятельности Вашего банка является выдача кредитов
юридическим лицам. Вашей задачей является отслеживание динамики работы кредитного
отдела.
В зависимости от условий получения кредита, процентной ставки и срока возврата все
кредитные операции делятся на несколько основных видов. Каждый из этих видов имеет свое
название. Кредит может получить юридическое лицо (клиент), при регистрации предоставивший
следующие сведения: название, вид собственности, адрес, телефон, контактное лицо. Каждый
факт выдачи кредита регистрируется банком, при этом фиксируются сумма кредита, клиент и
дата выдачи.
Необходимо учитывать в системе еще и дату фактического возврата денег. Нужно еще учесть,
что кредит может гаситься частями, и за задержку возврата кредита начисляются штрафы.
1.1.21 Инвестирование свободных средств
Описание предметной области
Вы являетесь руководителем аналитического центра инвестиционной компании. Ваша компания
занимается вложением денежных средств в ценные бумаги.
Ваши клиенты - предприятия, которые доверяют Вам управлять их свободными денежными сред-
ства на определенный период. Вам необходимо выбрать вид ценных бумаг, которые позволят по-
лучить прибыль и Вам и Вашему клиенту. При работе с клиентом для Вас весьма существенной
является информация о предприятии - название, вид собственности, адрес и телефон.
Необходимо хранить историю котировок каждой ценной бумаги. Кроме того, помимо вложений в
ценные бумаги, существует возможность вкладывать деньги в банковские депозиты.

1.1.22 Занятость актеров театра


Описание предметной области
Вы являетесь коммерческим директором театра, и в Ваши обязанности входит вся
организационно- финансовая работа, связанная с привлечением актеров и заключением
контрактов.
Вы поставили дело следующим образом: каждый год театр осуществляет постановку различных
спектаклей. Каждый спектакль имеет определенный бюджет. Для участия в конкретных
постановках в определенных ролях Вы привлекаете актеров. С каждым из актеров Вы
заключаете персональный контракт на определенную сумму. Каждый из актеров имеет
некоторый стаж работы, некоторые из них удостоены различных наград и званий.
В рамках одного спектакля на одну и ту же роль привлекается несколько актеров. Контракт
определяет базовую зарплату актера, а по итогам реально отыгранных спектаклей актеру
назначается премия. Кроме того, в базе данных нужно хранить информацию за несколько лет.

1.1.23 Платная поликлиника


Описание предметной области
Вы являетесь руководителем службы планирования платной поликлиники. Вашей задачей
является отслеживание финансовых показателей работы поликлиники.
В поликлинике работают врачи различных специальностей, имеющие разную квалификацию.
Каждый день в поликлинику обращаются больные. Все больные проходят обязательную
регистрацию, при которой в базу данных заносятся стандартные анкетные данные (фамилия, имя,
отчество, год рождения). Каждый больной может обращаться в поликлинику несколько раз,
нуждаясь в различной медицинской помощи. Все обращения больных фиксируются, при этом
устанавливается диагноз, определяется стоимость лечения, запоминается дата обращения.
При обращении в поликлинику пациент обследуется и проходит лечение у разных
специалистов. Общая стоимость лечения зависит от стоимости тех консультаций и процедур,
которые назначены пациенту. Кроме того, для определенных категорий граждан предусмотрены
скидки.

1.1.24 Анализ динамики показателей финансовой отчетности


различных
Предприятий

Описание предметной области


Вы являетесь руководителем информационно-аналитического центра крупного холдинга.
Вашей задачей является отслеживание динамики показателей для предприятий Вашего холдинга.
В структуру холдинга входят несколько предприятий. Каждое предприятие имеет стандартные
характеристики (название, реквизиты, телефон, контактное лицо). Работа предприятия может
быть оценена следующим образом: в начале каждого отчетного периода на основе финансовой
отчетности вычисляется по неким формулам определенный набор показателей. Принять, что
важность показателей характеризуется некоторыми числовыми константами. Значение каждого
показателя измеряется в некоторой системе единиц.
Некоторые показатели считаются в рублях, некоторые в долларах, некоторые в евро. Для
удобства работы с показателями нужно хранить изменения курсов валют относительно друг
друга.
1.1.25 Учет телекомпанией стоимости прошедшей в эфире
рекламы
Описание предметной области
Вы являетесь руководителем коммерческой службы телевизионной компании. Вашей задачей яв-
ляется отслеживание расчетов, связанных с прохождением рекламы в телеэфире.
Работа построена следующим образом: заказчики просят поместить свою рекламу в
определенной передаче в определенный день. Каждый рекламный ролик имеет определенную
продолжительность. Для каждой организации-заказчика известны банковские реквизиты,
телефон и контактное лицо для проведения переговоров. Передачи имеют определенный
рейтинг. Стоимость минуты рекламы в каждой конкретной передаче известна (определяется
коммерческой службой, исходя из рейтинга передачи и прочих соображений).
Необходимо также хранить информацию об агентах, заключивших договоры на рекламу.
Зарплата рекламных агентов составляет некоторый процент от общей стоимости рекламы,
прошедшей в эфире.

1.1.26 Интернет-магазин
Описание предметной области
Вы являетесь сотрудником коммерческого отдела компании, продающей различные товары
через Интернет. Вашей задачей является отслеживание финансовой составляющей работы
компании.
Работа Вашей компании организована следующим образом: на Интернет-сайте компании
представлены (выставлены на продажу) некоторые товары. Каждый из них имеет некоторое
название, цену и единицу измерения (штуки, килограммы, литры). Для проведения исследований
и оптимизации работы магазина Вы пытаетесь собирать данные с Ваших клиентов. При этом для
Вас определяющее значение имеют стандартные анкетные данные, а также телефон и адрес
электронной почты для связи. В случае приобретения товаров на сумму свыше 5000р. клиент
переходит в категорию «постоянных клиентов» и получает скидку на каждую покупку в размере
2%. По каждому факту продажи Вы автоматически фиксируете клиента, товары, количество, дату
продажи, дату доставки.
Иногда возникают проблемы, связанные с нехваткой информации о наличии нужных товаров
на складе в нужном количестве. Кроме того, обычно клиенты в рамках одного заказа покупают не
один вид товара, а несколько видов. Исходя из суммарной стоимости заказа, компания
предоставляет дополнительные скидки.

1.1.27 Ювелирная мастерская


Описание предметной области
Вы работаете в ювелирной мастерской. Ваша мастерская осуществляет изготовление
ювелирных изделий для частных лиц на заказ. Вы работаете с определенными материалами
(платина, золото, серебро, различные драгоценные камни и т.д.). При обращении к Вам
потенциального клиента Вы определяетесь с тем, какое именно изделие ему необходимо. Все
изготавливаемые Вами изделия принадлежат к некоторому типу (серьги, кольца, броши,
браслеты), бывают выполнены из определенного материала, имеют некоторый вес и цену
(включающую стоимость материалов и работы).
Ювелирное изделие может состоять из нескольких материалов. Кроме того, постоянным
клиентам мастерская предоставляет скидки.

1.1.28 Парикмахерская
Описание предметной области
Вы работаете в парикмахерской.
Ваша парикмахерская стрижет клиентов в соответствии с их пожеланиями и некоторым
каталогом различных видов стрижки. Так, для каждой стрижки определены название,
принадлежность полу (мужская, женская), стоимость работы. Для наведения порядка Вы, по мере
возможности, составляете базу данных клиентов, запоминая их анкетные данные (фамилия, имя,
отчество). Начиная с 5-ой стрижки, клиент переходит в категорию постоянных и получает скидку
в 3% при каждой последующей стрижке. После того, как закончена очередная работа, в кассе
фиксируются стрижка, клиент и дата производства работ.
У Вашей парикмахерской появился филиал, и Вы хотели бы видеть, в том числе, и раздельную
статистику по филиалам. Кроме того, стоимость стрижки может меняться с течением времени.
Нужно хранить не только последнюю цену, но и все данные по изменению цены стрижки.
1.1.29 Химчистка
Описание предметной области
Вы работаете в химчистке.
Ваша химчистка осуществляет прием у населения вещей для выведения пятен. Для наведения
порядка Вы, по мере возможности, составляете базу данных клиентов, запоминая их анкетные
данные (фамилия, имя, отчество). Начиная с 3-го обращения, клиент переходит в категорию
постоянных клиентов и получает скидку в 3% при чистке каждой последующей вещи. Все
оказываемые Вами услуги подразделяются на виды, имеющие название, тип и стоимость,
зависящую от сложности работ. Работа с клиентом первоначально состоит в определении объема
работ, вида услуги и, соответственно, ее стоимости. Если клиент согласен, он оставляет вещь
(при этом фиксируется услуга, клиент и дата приема) и забирает ее после обработки (при этом
фиксируется дата возврата).
У Вашей химчистки появился филиал, и Вы хотели бы видеть, в том числе, и раздельную
статистику по филиалам. Кроме того, вы решили делать надбавки за срочность и сложность
работ.

1.1.30 Сдача в аренду торговых площадей


Описание предметной области
Вы работаете в крупном торговом центре, сдающим в аренду коммерсантам свои торговые
площади.
Вашей задачей является наведение порядка в финансовой стороне работы торгового центра.
Работы Вашего торгового центра построена следующим образом: в результате планирования Вы
определили некоторое количество торговых точек в пределах Вашего здания, которые могут
сдаваться в аренду. Для каждой из торговых точек важными данными являются этаж, площадь,
наличие кондиционера и стоимость аренды в день. Со всех потенциальных клиентов Вы
собираете стандартные данные (название, адрес, телефон, реквизиты, контактное лицо). При
появлении потенциального клиента Вы показываете ему имеющиеся свободные площади. При
достижении соглашения Вы оформляете договор, фиксируя в базе данных торговую точку,
клиента, период (срок) аренды.
Некоторые клиенты арендуют сразу несколько торговых точек. Помимо этого, Вам необходимо
собирать информацию об ежемесячных платежах, поступающих Вам от арендаторов.

2 Место и назначение лингвистического обеспечения в


информационных системах
Условно все подходы к определению количества информации можно разделить на пять видов:
1. Энтропийный.
2. Алгоритмический.
3. Комбинаторный.
4. Семантический.
5. Прагматический.
Первые три вида дают количественное определение сложности описываемого объекта или
явления. Четвертый — описывает содержательность и новизну передаваемого сообщения для
получателя (пользователя) сообщения. Наконец, пятый вид обращает внимание на полезность
полученного сообщения для пользователя.

2.1 Энтропийный подход


Исторически первым возник энтропийный подход, потому что еще в Х1Х-м веке физики ввели
понятие "энтропия" для определения величины, характеризующей процессы перехода тепловой
энергии в механическую. В какой-то мере эта величина характеризовала меру хаотичности
(неопределенности) движения молекул. Наверное поэтому К. Шеннон назвал энтропией
количество информации, испускаемой источником. Энтропией, или неопределенностью,
называется вещественнозначная функция, зависящая от вероятностей событий и
удовлетворяющая следующим условиям:
1. Событие, наступающее с вероятностью единица, имеет нулевую неопределенность.

2. Если одно событие имеет меньшую вероятность чем другое, то неопределенность первого
события больше неопределенности второго.
3. Неопределенность одновременного наступления двух событий равна сумме их
неопределенностей.
Согласно Шеннону, информация, испускаемая дискретным источником X за единицу времени,
характеризуется энтропией

где Р — вероятность одной из возможных последовательностей сигналов, исходящих из


г

источника Х за единицу времени (в предположении, что источник испускает конечное число


таких неисправностей). Количество информации /(X,У), переданной источником X приёмнику У
также характеризуется с помощью энтропии

где Н у ( X) — условная энтропия источника. В


случае, рассмотренном Шенноном, обмен сообщениями между источником и приёмником
(информационное взаимодействие) характеризуется количеством информации, фактически
получаемой приёмником. Работы Шеннона показали, что для описания информационного
взаимодействия важны количественные характеристики участвующей в нем информации.
Сегодня принято считать, что энтропийный подход к характеристике самого понятия информа-
ции и введению её количественных характеристик, создан в работах Шеннона. Теория, развитая
Шенноном, позволила с единой точки зрения осмыслить разрозненные, но важные работы его
предшественников. Прежде всего, в этой связи следует упомянуть Р. Хартли, который ввел
понятие, являющееся частным, но важным случаем шенноновской энтропии в случае
равновероятного исходя случайных событий. После появления в 1948 году работы Шенннона
последовало большое количество работ по развитию энтропийного подхода к теории
информации. Отметим отдельно основополагающую работу А. Н. Колмогорова, в которой
введено понятие энтропии динамических систем как метрического инварианта преобразований,
сохраняющих меру. Работы Колмогорова и его последователей по энтропии динамических систем
показали, что все энтропии, в том числе и шенноновская, близки к энтропиям частных классов
динамических систем. С помощью энтропии выражается количество информации в данном
случайном объекте и информации, которую он несет о другом случайном объекте.
Обзор работ, посвященных энтропийному подходу, дан в монографии Н. Мартина и Дж.
Ингленда и содержит около 700 ссылок (вместе с дополнительным списком литературы).

2.2 Алгоритмический подход


Энтропийный подход в теории информации позволяет ответить на вопрос "Сколько информации
содержит объект Y относительно объекта X?" В рамках другого подхода — алгоритмического —
можно ответить и на вопрос "Сколько нужно информации, чтобы воссоздать (описать) объект X?"
Как показал Колмогоров, эту задачу можно строго сформулировать не только для стохастических
объектов, но и для объектов, имеющих вид последовательности из нулей и единиц. В этом случае
теория рекурсивных функций позволяет строго ввести понятие сложности объекта. На этой
основе А. Н. Колмогоровым был разработан алгоритмический подход к определению количества
информации.
Этот подход основан на теории алгоритмов и предполагает наличие априорной вероятностной
меры на множестве сигналов. Пусть имеется слово W в алфавите X. Описанием слова W
относительно способа описания f назовем такое слово а в алфавите 0,1, что f(α) = W, и
сложностью этого слова при данном способе f — длину кратчайшего описания. Оказывается, что
среди алгоритмических способов описания есть оптимальный (дающий с точностью до константы
более короткие описания, чем любой другой). Сложность относительно этого оптимального
способа называется колмогоровской сложностью R ( W ) и определяет количество информации в
слове W.
2.3 Комбинаторный подход
В алгоритмическом подходе количество информации, содержащейся в слове (последовательности
нулей и единиц), по существу, измеряется минимальной длиной программы, необходимой для
воспроизведения этого слова (последовательности). Возможно иное измерение количества
информации, содержащейся в слове (последовательности из нулей и единиц). Комбинаторный
подход, развиваемый В. Гоппа, приводит к "алгебраической теории информации". Количество
информации в последовательности определяется степенью её асимметрии. Пусть имеется
алфавит X и слова длины п в этом алфавите. На словах действует группа перестановок. Тогда
логарифм числа перестановок, переводящий слово в себя, называется θ-информацией этого
слова. Чем меньше симметрий в слове, тем больше θ-информации в нем.

2.4 Семантический подход


Основное достоинство трех перечисленных подходов к определению количества информации
состоит в том, что они опираются на строгие системы аксиом и поддерживаются развитым
математическим аппаратом для исследования свойств определяемого так количества
информации. Основной недостаток этих подходов состоит в том, что в рамках этих формальных
моделей не удается оценить содержательную сущность каждого сообщения, его семантику. Этот
недостаток был замечен исследователями в скором времени после появления работы Шеннона.
Предпринимались многочисленные попытки формального описания сущности интеллектуальных
процессов в информационном взаимодействии "источник — приёмник". Однако большинство из
них нельзя назвать удачными. Наиболее известна работа И. Бар-Хилпела и Р. Карнана,
основанная на теории формальных логических систем. Однако и эта работа не получила
конструктивного развития. В последние годы интерес к построению формальных моделей
смысла, содержащегося в сообщении, необычайно возрос в связи с созданием систем
автоматического перевода с одного естественного языка на другой.
Само преобразование содержательной сущности сообщения (его семантики) в текст скрыто от
нашего непосредственного наблюдения. Нам доступна только его начальная и конечная точки, т.
е. смысл, который мы хотим выразить, и текст, который при этом получается. Для того чтобы
построить систему автоматического перевода, необходимо создать формализованную процедуру
построения моделей "Текст, Смысл", "Смысл, Текст".
По существу, система автоматического перевода с языка А на язык В и обратно состоит в по-
строении формализованных моделей "Текст, Смысл", "Смысл, Текст" для этих языков. Лидером в
построении моделей естественных языков является Московская семантическая школа, основы
которой заложены в работах И. А. Мельчука и Ю. Д. Апресяна.

2.5 Прагматический подход


В работе А. А. Харкевича количество информации, получаемой приемником, предлагалось
оценивать степенью её полезности для достижения поставленной цели. Такой подход особенно
привлекателен для оценки количества информации в системах управления, в которых
применяется более сложная схема информационного взаимодействия "источник — приёмник",
чем в концепции Шеннона. В них информация рассматривается не сама по себе, а как средство, с
помощью которого управляющий объект А может влиять на управляемый объект В с целью
получения желательного поведения этого объекта, оцениваемого критериями качества.
В этом случае рассматривается двойная схема информационного взаимодействия. С одной
стороны, передается управляющая информация от А к В о том, как должны меняться состояния
В(прямая связь). С другой стороны, передается информация от В к А о том, насколько реальные
изменения состояний В соответствуют должным (обратная связь). В этой схеме количество
получаемой информации как в прямой, так и в обратной связи можно оценивать степенью её
полезности для достижения цели, стоящей перед системой управления.

Контрольные вопросы

1. Все подходы к определению количества информации можно разделить на следующие виды:


Комбинаторный.
Прагматический.
Алгоритмический.
Семантический.
Синтаксический.
Энтропийный.
Систематический.
2. Количественное определение сложности описываемого объекта или явления дают
следующие подходы к определению количества информации:
Прагматический.
Алгоритмический.
Семантический.
Синтаксический.
Систематический.
Энтропийный.
Комбинаторный.
3. Содержательность и новизну передаваемого сообщения описывает следующий подход к
определению количества информации:
Алгоритмический.
Энтропийный.
Синтаксический.
Прагматический.
Комбинаторный.
Семантический.
Систематический.
4. Полезность полученного сообщения для пользователя описывает следующий подход к
определению количества информации:
Комбинаторный.
Семантический.
Энтропийный.
Прагматический.
Систематический.
Синтаксический.
Алгоритмический.

3 Информационное взаимодействие
Термин "информация" происходит от латинского "informatio", что в переводе на русский язык
означает "осведомление", "разъяснение", и, по сути, предполагает наличие какой-либо формы
диалога между отправителями и получателями информации.
Все приведенные выше качественные и количественные определения информации также
предполагают наличие отправителей и получателей информации, т. е. речь идет о некотором виде
взаимодействия объектов.
Взаимодействие объектов, приводящее к изменению знаний хотя бы одного из них, будем
называть информационным взаимодействием.
Для того, чтобы процесс передачи знаний от одного объекта к другому был успешным, необхо-
димо соблюдение ряда условий. Рассмотрим процесс информационного взаимодействия на
примере передачи знаний посредством устной речи. Процесс этот многокомпонентный
(векторный). Первая компонента — физическая, т. е. необходимо наличие физического источника
звука (голосовых связок), физической среды распространения звука (воздуха) и физического
приемника (уха). Вторая компонента — сигнальная: амплитудно и частотно модулированные
колебания. Третья компонента — лингвистическая: необходимо, чтобы оба собеседника знали
хотя бы один общий язык. Четвертая компонента — семантическая, т. е. в передаваемом
сообщении должно присутствовать содержательное описание объекта или явления, чтобы при
получении сообщения могли измениться знания у принимающего эти сообщения. Наконец, пятая
компонента — прагматическая: необходимо наличие
желания (мотивации) передавать и принимать сообщение.
Следовательно, информационное взаимодействие можно представить пятикомпонентной
(пятимерной векторной) величиной, состоящей из компонент:
1. физической;
2. сигнальной;
3. лингвистической;
4. семантической;
5. прагматической.
Заметим, что приведенное разбиение информационного взаимодействия на пять компонент
носит условный характер и возможно частичное пересечение в этом разбиении. Так, отдельные
составляющие передаваемого сообщения можно отнести к физической или сигнальной,
сигнальной или лингвистической компонентам. На сложный, многокомпонентный характер
информации указывал еще А. Н. Колмогоров: "Подчеркну и качественно новое и неожиданное,
что содержится ... в теории информации. По первоначальному замыслу "информация" не есть
скалярная величина. Различные виды информации могут быть чрезвычайно разнообразны . . .
было совершенно неясно, можно ли качественно различные информации . . . считать
эквивалентными".
В качестве примера классификации информационных взаимодействий можно напомнить
протокольные уровни в международных стандартах открытых компьютерных сетей типа
Интернет. При взаимодействии двух пользователей в телекоммуникационной сети реализуется
совокупность протоколов семи уровней:
1. физического;
2. канального;
3. сетевого;
4. транспортного;
5. сеансового;
6. представительского;
7. прикладного.
Первые три протокольных уровня определяют такие особенности работы сети связи при обслу-
живании пользователей, как стандарт электрических сигналов в сети, обнаружение и исправление
ошибок, маршрутизация в транспортной сети и т. д.
Последующие четыре уровня определяют такие стандарты взаимодействия самих
пользователей, как контроль за целостностью сообщения, восстановление без потерь сеанса
взаимодействия в случае прерывания, представление данных на дисплеях и печатающих
устройствах и т. д.
Спектр информационных взаимодействий необычайно широк. Можно условно разделить
изучаемые информационные взаимодействия по объектам на три класса:
1. взаимодействие искусственных (технических) систем;
2. взаимодействие смешанных систем;
3. взаимодействие естественных (живых) систем.
К первому классу относятся информационные взаимодействия в технических системах — от
простейших регуляторов до глобальных компьютерных сетей. Ко второму классу —
информационные взаимодействия типа "живой организм — искусственный орган", "человек —
машина", "живой исследователь — неживой объект исследований" и т. д. К третьему классу
относятся информационные взаимодействия, действующие в пределах от молекулярно-
генетического уровня до уровня социальных сообществ.
При таком многообразии взаимодействующих объектов задача описания законов
информационного взаимодействия необычайно сложна, поскольку надо описать как обмен
однобитовой информацией типа "включено — выключено" в технических системах, так и
формирование морали в человеческих сообществах.
При описании каждого из этих уровней приходится опираться на специфическую для соответ-
ствующего уровня концепцию преобразователя информации, свои языки описания,
закономерности, разрабатываемые в рамках соответствующих дисциплин (наук), которые, тем
самым, изучают информационное взаимодействие на данном уровне.
Далее представлены примеры, относящиеся к описанию информационного взаимодействия в
природе и технике для трех типов объектов и пяти компонент информационного взаимодействия.
Несмотря на явно упрощенный характер описания информационного взаимодействия, она может
быть полезна для анализа различных определений информации. Так, энтропийный подход
описывает информацию на сигнальном уровне, алгоритмический и алгебраический — на
лингвистическом уровне, а логический — на семантическом уровне.
Наибольшие успехи были достигнуты при изучении информационного взаимодействия для от-
носительно простых сигнальной и лингвистической компонент. Из этих компонент удалось сфор-
мулировать простые и достаточно общие законы преобразования информации, подобные законам
сохранения энергии. Так, Шеннон вывел зависимость скорости передачи информации по каналу с
шумом от полосы пропускания, а Колмогоров доказал сохранение сложности при
алгоритмических
преобразованиях.
К сожалению, многочисленные попытки формализованного описания информационного
взаимодействия семантической компоненты не привели еще к открытию простых
закономерностей, подобно тому, как обстоит дело для сигнальной компоненты. Для других
компонент информационного взаимодействия можно сформулировать сегодня только некоторые
принципы — условия, при выполнении которых информационное взаимодействие будет
проходить успешно. Для информационного взаимодействия недостаточно только передать
сообщение, нужно, чтобы приёмник (адресат) обладал возможностью его адекватно воспринять.
Из этого следует принцип тезауруса: важность наличия априорной информации, достаточной для
дешифровки и усвоения полученного сообщения. Это означает, в частности, что участники
информационного взаимодействия должны обладать согласованной информацией об
используемых кодах, языках и их семантиках. Этот принцип подчеркивает первостепенную
важность для информатики лингвистических и семантических исследований в широком смысле
этого слова. В первую очередь речь идет о фрагментах языков человеческого общения и их
семантиках, ставших сегодня основой для разработки средств человеко-машинного диалога.
Успешное восприятие сообщения зависит не только от способности адресата дешифровать
(понять) содержание сообщения. Важную роль играет привлекательность сообщения, наличие у
адресата стимула для освоения содержания сообщения. Это обстоятельство позволяет
сформулировать принцип фасцинации (привлекательности) сообщения, которая зависит от
мотивов и целей адресата, формы сообщения и т. д. Важно отметить, что фасцинация
характеризует состояние адресата, форму сообщения и, в меньшей степени, его содержание.
Фасцинация как необходимая спутница информации может играть существенную роль в
организации человеко-машинного диалога, в проблеме понимания текстов на естественных
языках и в других задачах информационного взаимодействия. Следует заметить, что участники
информационного взаимодействия в процессе диалога могут выступать не только как получатели
информации, но и как ее создатели. Поэтому полезно рассматривать поступающее сообщение не
просто как контейнер с готовой информацией, но и как стимул для порождения адресатом на
основе прошлого опыта и модели ситуации мира новой информации — принцип маевтики, или
родовспоможения, восходящий к Сократу. В результате такого информационного взаимодействия
адресат может "получить" больше информации, чем содержалось в сообщении.
Не исключено, что на этом пути будут созданы принципиально новые способы организации
человеко-машинного информационного взаимодействия и, возможно, новые структуры систем
искусственного интеллекта.
Кроме вышеперечисленных законов и принципов следует упомянуть о разработанных к
настоящему времени методах, моделях и алгоритмах информационного взаимодействия,
имеющих огромное значение для развития научных исследований.
Если говорить об информационном взаимодействии "исследователь — исследуемый объект",
то среди них — методы планирования эксперимента, методы математического и компьютерного
моделирования, служащие методологической основой экспериментальных и теоретических
исследований. Популярны у исследователей также методы распознавания образов,
идентификации, адаптации, теории массового обслуживания. Этот перечень можно было бы
продолжать, однако перечисленное позволяет заключить, что система представлений об
информационном взаимодействии сущностей разной природы уже существует, успешно
развивается и заслуживает пристального внимания, дальнейшего осмысления и поддержки как
новая наука. Следует отметить, что развитие фундаментальных исследований в этой области
возможно только при совместной работе специалистов по информатике с математиками,
физиками, химиками, биологами, социологами, лингвистами, психологами, т. е. с
представителями различных естественных и гуманитарных наук. В то же время, модели и методы
информационного взаимодействия будут служить катализаторами развития функциональных
исследований природных и социокультурных объектов — от уровня фундаментальных структур
материи до уровня взаимодействия социальных групп.

Контрольные вопросы

1. Информационное взаимодействие можно представить величиной, состоящей из компонент:


семантической;
лингвистической;
физической;
сигнальной;
прагматической.
2. Информационные взаимодействия (по объектам) можно разделить на следующие классы:
взаимодействие естественных систем;
взаимодействие искусственных систем;
взаимодействие смешанных систем;
взаимодействие распределенных систем
взаимодействие систем массового
обслуживания
3. Информацию на сигнальном уровне описывает:
логический подход алгебраический подход
алгоритмический подход энтропийный подход

4. Информацию на лингвистическом уровне описывает:


энтропийный подход алгоритмический подход логический
подход алгебраический подход
5. Информацию на семантическом уровне описывает:
энтропийный подход алгоритмический подход логический
подход алгебраический подход
6. Фасцинация — это:
привлекательность сообщения для адресата; отклонение от синтаксической нормы.
количество информации в сообщении;

4 Знаковые системы
В самом общем виде знания в памяти компьютера представляются в виде некоторой знаковой
системы. Знаковые системы изучает наука семиотика. Основным понятием семиотики является
понятие знак.
Знак — это объект или событие, которые способны что-то обозначать, т.е. указывать на некото-
рый другой объект, и что-то означать, т.е. иметь некоторый смысл. Например, «Луна» обозначает
конкретный физический объект и имеет смысл «естественный спутник Земли»; знак «π»
обозначает число 3.14, имеет смысл «отношение длины окружности к диаметру».
Не все объекты, сопоставленные другим объектам, выступают в качестве знаков. Например,
паспорт, квитанции или гардеробные номерки не являются знаками. С понятием знак
непосредственно связаны понятия денотат и концепт знака. Денотат — это объект, обозначаемый
данным знаком, а концепт — свойство денотата, выражаемое знаком. Концепт определяет свой
денотат. Отношение между знаком, его концептом и денотатом выражает так называемый
семиотический треугольник, или треугольник Фреге (см. рис. 4.1)
Когда знак реально вступает во взаимодействие со своим денотатом и концептом, возникает
знаковая ситуация. Возможны знаковые ситуации, в которых одна из вершин семиотического
треугольника отсутствует (рис. 4.2)
Поскольку, по мнению Г.Фреге, знак обозначает денотат через посредство своего концепта,
изобразим семиотический треугольник вытянутым в цепь (3, К, Д) (рис. 4.3).
Соответствия между знаками, концептами и денотатами не являются взаимно- однозначными.
Отметим основные особенности употребления знаков (рис. 4.4).
Знаки z 1 , z 2 называются синонимичными, если они выражают один и тот же концепт. Знаки z 1 ,
z 2 каждый со своим концептом, называются денотативно тождественными, если они обозначают
один и тот же денотат.
Знак z называется омонимичным (или многозначным), если он может выражать более чем один
концепт. Знак z называется денотативно неоднозначным, если он при одном и том же концепте
может обозначать различные денотаты. Знак z автонимен, если его денотатом в данной знаковой
ситуации выступает сам знак.

Из семиотического треугольника следует, что знак имеет две знаковые функции: обозначает не
только денотат, но и его концепт — десигнат данного знака. Как следует из рис. 4.4, один и тот
же знак может обозначать разные денотаты. Объем знака — это объем поля денотатов. Важными
понятиями, имеющими к треугольнику Фреге непосредственное отношение, являются понятия
экстенсионал и интенсионал.
Экстенсионал знака определяет конкретный класс всех его допустимых денотатов. Если имя есть
предложение, высказывание (т.е. запись некоторого суждения), то его денотатом служит
истинное значение этого предложения (высказывания, суждения), т.е. «истина» или «ложь».
Интенсионал знака определяет содержание понятия и характеризует концепт.
Интенсиональность знака зависит не только от истинных его значений, но и от прагматических
оттенков этого смысла.
Знаковая система (рис. 4.5) — это множество знаков с регулярными отношениями между ними,
отражающими регулярные отношения между их концептами и денотатами. В знаковой системе
выделяют три аспекта: синтактику, семантику и прагматику.
Синтактика изучает внутреннее устройство знаковой системы, правила построения сложных зна-
ков из простых. Для естественных языков синтактика выступает в виде синтаксиса,
определяющего правильное построение предложения и связного текста. В искусственных языках
синтактика определяет правильное логическое построение потенциально осмысленных
выражений.
Семантика изучает соотношения, с одной стороны, между знаками и их денотатами, с другой —
между знаками и их концептами (смыслами).
Прагматика изучает знаки с точки зрения их отношения к адресату сообщений.

Контрольные вопросы

1. Объект или событие, которые способны что-то обозначать — это:


семиотический треугольник;
концепт;
денотат;
знаковая ситуация; знак;
2. Объект, обозначаемый данным знаком — это:
семиотический треугольник;
знак;
концепт;
денотат;
знаковая ситуация;
3. Свойство денотата, выражаемое знаком — это:
знаковая ситуация; семиотический треугольник;
денотат; концепт;
знак;
4. Когда знак реально вступает во взаимодействие со своим денотатом и концептом, возникает:
денотат;
семиотический треугольник;
знак;
концепт;
знаковая ситуация;
5. Отношение между знаком, его концептом и денотатом выражает:
денотат;
знаковая ситуация;
знак;
семиотический треугольник;
концепт;
6. Если знаки выражают один и тот же концепт, они называются:
автонимными;
многозначными;
денотативно неоднозначными;
денотативно тождественными;
синонимичными;
7. Если знаки обозначают один и тот же денотат, они называются:
многозначными;
денотативно неоднозначными;
синонимичными;
денотативно тождественными;
автонимными.
8. Если знаки могут выражать более чем один концепт, они называются:
многозначными;
денотативно
тождественными;
денотативно
неоднозначными;
автонимными.
синонимичными;
9. Если знаки при одном и том же концепте могут обозначать различные денотаты, они
называются:
синонимичными;
автонимными.
многозначными;
денотативно
неоднозначными;
денотативно
тождественными;
10. Если денотатами знаков в данной знаковой ситуации выступают сами знаки, они называются:

многозначными;
денотативно
тождественными;
автонимными.
денотативно
неоднозначными;
синонимичными;
11. Множество знаков с регулярными отношениями между ними, отражающими регулярные
отношения между их концептами и денотатами — это:
знаковая система;
семантика; прагматика.
синтактика;
12. Здесь рассматриваются правила построения сложных знаков из простых:
прагматика.
синтактика;
семантика;
знаковая
система;
13. Здесь рассматриваются соотношения, с одной стороны, между знаками и их денотатами, с
другой — между знаками и их концептами:
семантика;
прагматика.
синтактика;
знаковая система;

14. Здесь рассматриваются знаки с точки зрения их отношения к адресату сообщений:


семантика; синтактика;
знаковая система;
прагматика.

5 Морфологический анализ и синтез форм слов


Реализация полного лингвистического анализа текстовой информации предполагает решение
следующих задач:
• лексического анализа;
• морфологического анализа;
• синтаксического анализа;
• семантического анализа.
Перечень данных задач упорядочен по логическим этапам реализации полного
лингвистического анализа текстовой информации. Каждая последующая задача является более
трудоемкой, по сравнению с предыдущими, что обусловлено возрастающей сложностью ее
формализации. Реализация задач лингвистического анализатора зависит от особенностей
обрабатываемого (обрабатываемых) языков, на которых изложена текстовая информация.
Таким образом, перспективные поисковые системы (машины) должны включать в свой состав
программно-технические комплексы, реализующие полный перечень задач лингвистического
анализа текстовой информации.
Лучшие из существующих поисковых систем выполняют функции морфологического анализа
текстовой информации (как индексируемых текстов, так и запросов пользователей), а также
выполняют отдельные элементы синтаксического анализа предложений. Алгоритмы работы
существующих поисковых систем основаны на поиске в заранее проиндексированных текстах
ключевых слов. Запрос пользователя поисковой системы состоит из ключевых слов, и может
включать в себя управляющие символы формализованного языка запросов. Использование языка
запросов обеспечивает более точные результаты поиска, однако, требует от пользователя его
знания. Язык запросов для каждой поисковой системы уникален, поэтому на практике
пользователи редко им пользуются. Это обуславливает снижение качества поиска за счет
увеличения количества найденных документов с неадекватной информацией и необходимости их
последующего просмотра и анализа.
Синтаксический анализ текстовой информации позволяет выделить семантические элементы
предложения — именную группу, терминологическое целое, предикативную основу. Это
позволяет повысить интеллектуальность процесса обработки тестовой информации на основе
обеспечения работы с более обобщенными семантическими элементами.
Реализация семантического анализа текстовой информации предполагает обязательное
использование экспертных систем, систем искусственного интеллекта для выявления семантики
информации. В настоящее время отсутствуют сложившиеся подходы к реализации задачи
семантического анализа текстовой информации, что во много обусловлено недостаточно полной
проработкой научного направления создания систем искусственного интеллекта.
Лексический анализ заключатся в разборе текстовой информации на отдельные абзацы,
предложения, слова, определении национального языка изложения, типа предложения, выявлении
типа лексических выражений (бранных, жаргонных слов) и т.д. Он не представляет существенной
сложности для реализации.

5.1 Морфологический анализ (Part-of-Speech-tagging)


Задача морфологического анализа — автоматически распознать, какой части речи принадлежит
каждое слово тексте (каждому слову поставить в соответствие лексико-грамматический класс).
Данная задача может быть выполнена для русского языка практически со стопроцентной точ-
ностью благодаря его развитой морфологии. В английском языке простой алгоритм, присваиваю-
щий каждому слову в тексте наиболее вероятный для данного слова лексико-грамматический
класс (синтаксическую часть речи) работает с точностью около 90%, что обусловлено
лексической многозначностью английского языка. Для проведения морфологического анализа
русскоязычных текстов обычно используется компьютерная версия грамматического словаря
Зализняка, а для проведения морфологического анализа англоязычных текстов используется
компьютерная версия грамматического словаря Мюллера. Для улучшения точности
морфологического анализа в случае определения частей речи многозначных слов используются
два типа алгоритмов: вероятностно-статистические и основанные на продукционных правилах,
оперирующих словами и кодами.
Большинство вероятностно-статистических алгоритмов использует два источника
информации:
• Словарь словоформ языка, в котором каждой словоформе соответствует множество лексико-
грамматических классов, которые могут иметься у данной словоформы.
точность при лексико-грамматическом анализа текста вручную также имеет определенную
погрешность (0,5-2%), можно считать, что точность лексико-грамматического анализа в
автоматическом режиме достигла практически точности лексико-грамматического анализа в
ручном режиме.

5.2 Синтаксический анализ (Text Parsing)


В отличие от морфологического анализа текста, синтаксический анализ — развивающаяся
область прикладной лингвистики. Цель синтаксического анализа — автоматическое построение
функционального дерева фразы, т.е. нахождение взаимозависимостей между разноуровневыми
элементами предложения. Считается, что, имея успешно построенное функциональное дерево
фразы, можно выделить из предложения смысловые элементы: логический субъект, логический
предикат, прямые и косвенные дополнения и различные виды обстоятельств. Существует
большое количество различных количество подходов к синтаксическому анализу текстов,
которые реализованы в следующих программных продуктах:
• Ergo Linguistic Technologies Parser
• Functional Dependency
• Link Parser
• Star4Win (STARLING)
В последнее время над задачами синтаксического анализа предложения работает множество
исследовательских групп, и на настоящий момент можно считать, что в рамках синтаксического
анализа предложения частично решена и уже нашла применение в производстве задача
автоматического выделения именных групп. Что же касается полного синтаксического разбора
предложения, данная проблема в полном объеме в настоящее время еще не решена.
5.3 Семантический анализ
Целью семантического анализа является определение информативности текстовой информации и
выделение наиболее важной информации из обрабатываемого текста. Проведение
автоматизированного семантического анализа текста предполагает решение задачи выявления и
оценки смыслового содержания текста. Данная задача является трудно формализуемой
вследствие необходимости наличия совершенного аппарата экспертной оценки качества
информации. Это, в свою очередь, требует наличия априорно в самой системе семантического
анализа гигантского объема полной информации по оцениваемым рубрикам для проведения
оценки смыслового содержания текста. Таким образом, теряется всякий смысл создания
поисковой системы, которая должна иметь в своем составе полную информацию по достаточно
широкому кругу оцениваемых рубрик, и которая будет осуществлять оценку смыслового
содержания индексируемых документов. Это обусловлено тем, что поисковая система
перерождается в громоздкую энциклопедическую систему оценки информативности индек-
сируемых текстов.
Поэтому, семантический анализатор поисковой системы должен обеспечивать выделение
смысловой информации индексируемых текстов на основе обобщенного критерия о
встречающихся именных группах, группах терминологических целых, предикативных основах в
условиях отсутствия априорно полной информации по оцениваемым рубрикам.
В настоящее время отсутствуют поисковые системы, реализующие в данном понимании
семантический анализ текстовой информации.
При создании поисковых систем, основанных на рубрикаторах могут быть использованы
алгоритмы автоматического реферирования текстовой информации (Automatic Text
Summarization) На рынке присутствуют очень небольшое количество традиционных программ
реферирования, то есть таких, которые выделяют наиболее весомые предложения из текста
используя статистические алгоритмы, либо слова-подсказки (Inxight Summarizer, Extractor,
TextAnalyst).
Таким образом, в настоящее время не решена задача создания поисковой машины,
реализующей в полном объеме лингвистическую обработку текстовой информации.

Контрольные вопросы

1. Реализация полного лингвистического анализа текстовой информации предполагает


решение следующих задач:
семантического
анализа.
синтаксического
анализа;
лексического
анализа;
морфологического
анализа;
2. Эта разновидность анализа текстовой информации позволяет выделить именную группу,
терминологическое целое, предикативную основу:
морфологический;
синтаксический;
семантического.
лексический;
3. Эта разновидность анализа позволяет каждому слову поставить в соответствие лексико-
грамматически класс:
синтаксический;
семантического;
морфологический;
лексический;
4. Эта разновидность анализа заключается в разборе текстовой информации на отдельные
абзацы, предложения, слова, определении национального языка изложения, типа
предложения, выявлении типа лексических выражений:
синтаксический;
лексический;
семантического;
морфологический;

6 Формальные системы,
грамматики, автоматы

6.1 Формальные системы (ФС)


Формальная система суть исчисление, где выделено подмножество формул (слов), которое
объявлено изначально выводимым. Эти формулы называются аксиомами. Р 8 = (РРР, РРРА, РУ) ,
где
1. Р Р Р — правильно построенные формулы в алфавите А,
2. РРР € А*, А* — множество слов построенное в алфавите А,
3. Р Р Р F А € {РРР} — аксиомы являются подмножеством РРР,
4. РУ — правила вида (РРF1,..., Р Р F к ) ^ Р Р F , что означает, из совокупности РРF выводима
РРF. В любой ФС множество формул РРFА выводятся из РРFА с помощью правил РV. При
этом {РРFV} {РРF} , — называются выводимыми формулами.
Например, исчисление высказываний является формальной системой, где РРF являются фор-
мулы, построенные из имён переменных, знаков операций (&— конъюнкция, V — дизъюнкция, ]
— отрицание, → — импликация) и скобок. Выделяются Р Р F , которые объявляются аксиомами и
единственное правило вывода «modus ponens». В исчислении высказываний порождаются только
такие Р Р F , которые могут интерпретироваться как тождественно истинные формулы
(тавтологии) и только они.

6.2 Формальные грамматики (ФГ)


Исчисление в виде ФС предложено американским математиком Хомским (1953 г.) сначала для
решения проблем структурной лингвистики, а далее описания формальных языков
программирования. F G = ( А , V , S , Р ), где А = { а , Ь , с , . . . } — терминальный алфавит, V =
{ А , В , . . . , S } — вспомогательный алфавит, S — единственная аксиома, Р — правила вида S → х
и у → z , где х , у , z { А € V }*.
ФГ порождает характерный язык в виде подмножества слов L с {А}*. Правила ФГ не содержат
никаких ограничений на рекурсивность подстановок.

6.3 Автоматы и грамматики


Основные определения. Конечный алфавит А = { а , Ь , с , . . . , х } — терминальный алфавит (малые
латинские буквы).
А * = { а , Ь , с , . . . , х } * — все слова, полученные из букв алфавита, * - операция итерации
приписывания (конкатенации). Например, слово α = а а Ь с с получено из а приписыванием
буквы а к букве а - β = а • а , далее α = β • Ь • с • с получено последовательным
приписыванием к слову β букв Ь , с , с . L С А * — язык, вообще говоря, состоит из
бесконечного числа слов. Возникает проблема описания языка при помощи конечных и
конструктивных объектов (например, формул или правил порождения).
Как обычно, рассматриваются две основные задачи.
Порождение языка L. Для порождения слова а служит специальная конструкция —
порождающая грамматика С, которая представляет собой конечный набор продукций (правил
подстановок) для вывода любых слов языка из специального символа 5 (аксиомы) и только их.
Формально — G = (А, V, Р, S) А — основной алфавит, V — вспомогательный алфавит, S € У —
аксиома, ∑ = (А U У) — объединённый алфавит, Р — правила (подстановки, продукции): имеет
вид σi→ σj, где σi→ σj € (Е)*(в общем случае) (слова в объединённом алфавите).
Распознавание слов языка L. Дано слово w, определить w € L или w € L. Для решения этой
задачи служат распознающие автоматы. Формально автомат определяется — А = () , где А —
основной алфавит, S — алфавит состояний, Р — правила вида Si*Wi→Sj, Wi€ A*, Si,Sj € S

6.4 Автоматная (регулярная) грамматика и конечный


автомат
Автоматная грамматика АG = (А, V Р, S0) , где А — основной алфавит; Р — правила вида Vi→
AjVj, Vi, Vj € V, Aj € A, S0 — аксиома.
Конечный автомат АК = (А, S, Р, s0,sк) , где А — основной алфавит; S — алфавит состояний; s0 —
начальное состояние; s к — конечное состояние; Р — правила вида si, ai → sj, si, sj € S, aj € A .
Пример . Для языка заданы:

1. • АG = (А, V, Р, Sо )
• А = {а, b, с} U {Δ}
• V = {Sо , S1 }

2. • К А = (А,V,Р,Sо ,Sк)
• А = {а, Ь, с} U { Δ }
• V = {S0 ,S1 , Sk}
Δ — маркер конца слова. А G — правила порождения:
1. S 0 → а S 0
2. S 0 → с S 1
3. S 1 → Ь S 1
4. S 1 → Δ
K А — правила перехода
1. S 0 a → S 0
2. S 0 , с → S 1
2. S 1 , b → S 1
5. S1 , Δ → S к

А G порождает слова языка L1. К А распознаёт слова языка L1.


Если заданы правила АG, то правила К А получаются формальными переносами символов А
из правой части правил в левую (см. пример). Если заданы правила K А , то правила А G
переносом символов А в правую часть правил. К А задается графом переходов и по сути
является машиной состояний ( S М ). См. рис. 6.1
Рис. 6.1: Граф переходов

Кроме того, автоматный язык задается регулярным выражением (формулой из букв А, знаков
операций: • — конкатенация, * — итерация, V — разделённое «или»). Для примера выше
регулярное выражение для L 1 = ( ( а ) * • с ( b ) * Δ) .
Пример. Пусть для языка L 2 на рисунке задан граф К А и слово w 1 = а • а • с • b • с Δ ,
говорят, что w 1 распознаётся КА, если находясь в S0 под действием w 1 попадает в S к .Слово w 2 =
а • с • b • b • а Δ не распознаётся КА; К А из S 0 под действием w 2 останется в S1, т.к. нет
правила выводящего из S 1 под действием какого-либо символа кроме b и Δ.См. рис. 6.2
Регулярное выражение для языка L 2 = ( а ) * • ( Ъ V с ) • А ,слова которого распознаются КА.
Пример. Вывод некоторого слова в А G из примера 1. Рис. 6.3 Вывод слова а а а с b b b . В
кружочках отмечены номера правил.

Рис. 6.3: Граф переходов 2

6.5 Теоремы Клини (прямая и обратная)


1. По регулярному выражению может быть построен КА

2. По КА может быть построено регулярное выражение

Формально любая машина состояний является конечным автоматом и поэтому на SМ


распространяется теорема Клини.

Контрольные вопросы

1. Исчисление, где выделено подмножество формул (слов), которое объявлено изначально


выводимым:
конечный автомат;
формальная грамматика;
формальная система;
2. "По регулярному выражению может быть построен КА". Данная фраза - это:
Грамматика Хомского.
прямая теорема Клини;
обратная теорема Клини;
3. "По КА может быть построено регулярное выражение". Данная фраза - это:
грамматика Хомского;
прямая теорема Клини;
обратная теорема Клини;
4. В теории автоматов решаются следующие задачи:
распознавание слов языка;
разработка автоматизированных систем.
построение регулярных выражений;
порождение языка;
5. Слова языка порождает:
автоматная грамматика, регулярная грамматика; конечный автомат;
6. Распознает слова языка:
автоматная грамматика, регулярная грамматика; конечный автомат;

Набрано баллов

7 Предметная область

7.1 Объекты и свойства


Каждая из автоматизированных информационных систем (АИС) соотносится определенной части
реального мира, именуемой предметной областью, и является сферой проблемной ориентации
этой системы. При этом каждая автоматизированная система ориентирована на выполнение
определенных функций в соответствующей ей области применения.
При определении предметной области объект должен иметь относительно целостный характер
и для целей обработки информации обладать конечным набором свойств. Под свойством
понимается некоторая его характеристика, позволяющая устанавливать его сходство и различие
по отношению к другим объектам. При этом свойства объекта могут быть индивидуальными и
общими, присущими лишь единичным экземплярам и целому классу объектов соответственно.
Например, индивидуальными свойствами отличаются друг от друга животные одного вида,
станки одной модели, товары одного наименования, а общие свойства имеются у одного вида
растений, у материальных ценностей различных наименований, объединенных в одну группу.
Существенными являются свойства объекта, по которым он может идентифицироваться в модели
предметной области.
Под отношением понимается форма связи между объектами. Отношения подразделяются на
внешние и внутренние. Внешние отражают связи между объектами, не затрагивая при этом их
свойств. Например, внешними являются структурные отношения между элементами некоторой
системы.
Внутреннее отношение выявляет свойства объектов или обусловливает зависимость свойств объ-
ектов от данного отношения.
Описание предметной области должно вестись на общедоступном естественном языке. Для этого
достаточно использовать предложения естественного языка, позволяющие именовать объекты и
формулировать утверждения о том, что они обладают некоторыми свойствами, либо о том, что
конкретные объекты находятся в определенных взаимоотношениях. Однако машины могут
оперировать только определенной формой описаний предметной области.
При этом под описанием предметной области на формальном языке всегда предполагается
соотнесение с ее описанием на естественном языке. Введение формального языка приводит к
необходимости однозначного перевода описания на одном языке (естественном или формальном)
в описание на другом языке и к необходимости их эквивалентной интерпретации.
Эквивалентная интерпретация достигается введением абстрактных состояний предметной обла-
сти, определенных формально и служащих однозначной интерпретацией описания состояния как
на естественном, так и на формальном языке. См. рис. 7.1
Описания на естественном и формальном языках эквивалентны, если одно из них является ре-
зультатом перевода другого и если их интерпретацией служит одно и то же абстрактное
состояние.
Простая модель, удовлетворяющая указанным требованиям, отражает абстрактные состояния,
как
совокупность множества абстрактных объектов Е, множества типов Т (каждый тип Тj € Т есть
Т^ т

подмножество Е = U Тj) и совокупности отношений R, в которой каждое отношение Rj имеет


степень nj.
Интерпретация описания состояний предметной области на естественном языке 1ЕА есть соответ-
ствие:
фраз, однозначно именующих различные реальные объекты, различным абстрактным
объектам из Е;

7.1: Предметная область

• фраз, обозначающих свойства объектов, типам из Т;

• фраз, обозначающих взаимоотношения конкретных объектов, кортежам отношений из R.


Один и тот же объект с различными свойствами может принадлежать нескольким различным
типам. Предложение естественного языка есть утверждение о том, что некоторые объекты обла-
дают определенным свойством или что между конкретными объектами существуют определенные
взаимоотношения.
В первом случае предложение становится фактом (предложению соответствует истинное
значение), если объекты в абстрактном состоянии принадлежат типам, определенным фразами,
обозначающими свойства объектов. Во втором случае предложение становится фактом, если
объекты, определяемые связанными друг с другом в предложении именами, образуют кортеж
соответствующего отношения. Если указанные условия не выполняются, предложению
соответствует значение «ложь», и предложение фактом не является.
Абстрактное состояние является моделью описания состояния на естественном языке, если
имеется интерпретация IЕА, такая, что всем предложениям этого описания соответствует значение
«истина», а всем предложениям, не принадлежащим описанию, — значение «ложь».
Пример описания предметной области приведен ниже.
Описание на естественном языке. «Отдел N 50 есть отдел с названием отдела ОЭВМ и номером
отдела N 50. Проект Ш-Р1 — проект, имеющий шифр Ш-Р1. Проект Ш-Р2 — проект, имеющий
шифр Ш-Р2. Ресурс Р-АВ — ресурс, имеющий шифр Р-АВ. Отдел N 50 разрабатывает проект Ш-
Р1. Проект Ш-Р1 потребляет ресурс Р-АВ до конечной даты 1.06.84».
Абстрактные состояния (Е,Т, Д), представляющие состояние рассматриваемой предметной
области, а также соответствие элементов описания предметной области обозначениям объектов,
типов и отношений, приведены ниже:
Е = { i 1 ,...i10}, где

• l1= «отдел № 50»;


• l 2 = «№ 50»;
• l 3 = «ОЭВМ»;
• l 4 = «проект Ш-Р1»;
• l 5 = «Ш-Р1»;
• l 6 = «проект Ш-Р2»;
• l 7 = «Ш-Р2»;
• l 8 = «ресурс Р-АВ»;
• l9= «Р-АВ»;
• l г 0= «1.06.84».

Т = ( Т 1 Т 2 … Т 8 . ) ,где
• Т\= «быть отделом»;
• Т 2 = «быть номером отдела»;
• Т 3 = «быть названием отдела»;
• Т4= «быть проектом»;
• Т5= «быть шифром проекта»;
• Т6= «быть ресурсом»;
• Т7= «быть шифром ресурса»;
• Т8= «быть датой»;
Т1 = { l 1 } , Т2 = { l } , Тз = { l 3 } , Т4 = { l 4 , l б } , Т5 = { l 5 , l 7 } , Тб = { / } , Т7 = {19} , Т8 = { ^ 0 } .
2 8

R = ( R 1, R 2,. . . , R б)
• R1= «отдел имеет номер отдела»;
• R2= «отдел имеет название»;
• R3= «отдел разрабатывает проект»;
• R4= «проект потребляет ресурс до конечной даты»;
• R5= «проект имеет шифр проекта»;
• R6= «ресурс имеет шифр ресурса»;
R1 = {(11 ,12 ) } , R2 = {(11 , 1з ) } .
Основные принципы описания состояния предметной области на некотором формальном
языке следующие:
• информационное содержание раскрывается посредством описания состояния предметной
области на естественном языке, позволяющем соотносить элементы описания реальным
объектам;
• формальное установление факта эквивалентности описаний состояния на различных языках
требует их абстрактной интерпретации в терминах некоторой эталонной модели;
• извлечение информации требует обязательного перехода от формального описания к
описанию на естественном языке.
В автоматизированных системах сведения об окружающем нас мире представляются
посредством определенного набора понятий. В качестве таких понятий выступают единицы
информации и информационные отношения. Рассмотрим их на примере экономических данных.

7.2 Единицы информации


Информационные единицы бывают элементарными и составными. Рассмотрим их на примере
накладной. В качестве элементарных единиц информации выступают реквизиты — логически
неделимые элементы, соотносимые с определенным свойством отображаемого объекта или
процесса. Форма реквизита определяет полное его наименование, тип, описание множества
допустимых значений и другие характеристики. Рис. 7.2
Существует ряд типов реквизитов в зависимости от значений, которые они могут принимать.
Наиболее распространенными являются числовой и текстовый реквизиты.
Числовые реквизиты характеризуют количественные свойства экономических явлений,
полученные в результате подсчета натуральных единиц, измерения, взвешивания, вычисления и
т. п. Значениями таких реквизитов являются числа. Примерами служат числовые реквизиты.

Рис. 7.2: Пример накладной

Текстовые реквизиты отражают качественные свойства экономических явлений, дают характе-


ристику тем обстоятельствам, при которых протекало то или иное экономическое явление или
процесс и были получены те или иные числовые значения. Текстовые реквизиты называют также
реквизитами-признаками, их использование позволяет однозначно трактовать тот или иной хо-
зяйственный процесс, не допуская смыслового искажения или смещения различных процессов
или явлений. В качестве текстовых реквизитов в примере выступают СКЛАД, НАИМЕНОВАНИЕ
ПОЛУЧАТЕЛЯ, АДРЕС ПОЛУЧАТЕЛЯ. Над числовыми реквизитами, как правило, в процессе
обработки выполняются арифметические операции, а над текстовыми — логические. Кроме
текстового и числового типов, часто применяется также логический тип, который определяет,
какое из двух значений имеет величина — истину или ложь.
Каждый из наблюдаемых объектов или процессов характеризует ряд присущих ему свойств.
Изолированно взятый реквизит, характеризующий одно из свойств, не может служить полной
информацией о наблюдаемом объекте или процессе. Для воспроизведения некоторого сообщения
об объекте, определенной информации о процессе требуется некоторая взаимосвязанная
совокупность реквизитов.
Единицу информации, состоящую из совокупности других единиц, связанных между собой, на-
зывают составной единицей информации (СЕИ). Единицу информации, входящую в СЕИ,
называют составляющей единицей информации. Для С = ( R 1 , R 2 , . . . , R т ) Доставляющими
являются реквизиты R 1 , R 2 , . . . , R т . Составной единицей является, например, ДАТА: ДАТА =
(ЧИСЛО, МЕСЯЦ, ГОД).
Хотя во многих случаях она рассматривается как один реквизит. Следует отметить, что
существуют и другие реквизиты, кроме даты, которые могут быть составными. К таким
реквизитам относятся множественные реквизиты, отражающие тот факт, что отображенное
свойство объекта может, иметь несколько значений при представлении объекта, процесса или
явления. В качестве множественного реквизита может выступать реквизит ЗНАНИЕ
ИНОСТРАННЫХ ЯЗЫКОВ в кадровой анкете. Отдельная личность может владеть несколькими
иностранными языками.
Структуру приказа-накладной можно представить составными единицами информации
следующим образом: С = (С1С2); С1 = ( С 1 1 , С 1 2 , С13); С 1 1 = ( R 1 , R 2 , R з , R 4 ) ; С 1 2 =
( R 5 , R 6 , R 7 ) ; С 1 3 = ( С 1 3 1 , R 1 0 , R 1 1 , R 1 2 ) ; C131 = ( R 8 , R 9 ) ; C 2 = (R13, R14, Q1, C21,
Q4); C21=(Q3,Q4).
В составных единицах информации выделяют промежуточные единицы — группы. Группа,
состоящая только из реквизитов, называется простой, а группы, имеющие в своем составе
другие группы, называются составными. Различают повторяющиеся и неповторяющиеся
группы. Повторяющиеся группы допускают, как и множественные реквизиты, определенное
количество реализаций:
• простые группы С 1 1 , С 1 2 , С 1 3 1 , С 2 1 ;
• составные группы С , С 1 , С 1 3 , С 2 ;
• повторяющиеся группы С2;
• неповторяющиеся — остальные (кроме С2).
Из возможных структурных образований — групп, особого внимания заслуживает группа,
называемая показателем. Показатель — это составная единица информации, состоящая из
одного реквизита числового типа, именуемого основанием показателя и отражающего тот или
иной факт в количественной оценке, и ряда характеризующих его и связанных с ним
реквизитов-признаков текстового типа (времени, места действия, действующих лиц,
предметов, продуктов труда и т. д.).
Общий вид показателя можно представить следующим образом Р (1 : N ) ( P 1 , . . . , Р п , Q)
где Р 1 , . . . , Р п — реквизиты-признаки; Q — реквизит-основание показателя.
Одной из причин выделения показателей в особую разновидность составных единиц
информации является то, что показатель, по существу, служит минимальной по составу
информационной совокупностью, достаточной для образования самостоятельного документа.
Этот документ может существовать изолированно.
Показатели представляются, с одной стороны, простейшими СЕИ, способными к
документированию, а с другой — сложными образованиями информации, охватывающими
описание многообразных качественных свойств и количественной характеристики объекта и
состоящими в результате этого из целого ряда реквизитов. Например, в приказе-накладной
показателем является
ЦЕНА ИЗДЕЛИЯ: Рсs ,(1 : N)(R13, R14, Q1). Составную единицу информации любой сложности
можно свести в конечном итоге к определенной совокупности различных показателей.
Например, приказ-накладную можно представить в виде четырех показателей: цена изделия
(Рсo,), количество отпущенных со склада изделий (Рсs), количество изделий, предназначенных
на отпуск (Р„), сумма стоимости отпущенных со склада изделий (Рсi):
Рс s ,(1 : N)(R1 3 ,R1 4 , Q1); Pci(1: N)(Р2, Р3, Р4, Р5, Р6, Р7, Р10, Р11, Р13, Р14, Q 2 ) ; P c o ( 1 : N ) (Р2 , Рз , Р4 , Р5 ,
Рб , Р7 ) Рa с (1 : N)(Р2 ,Р3 ,Р4 ,Р5 ,Рб ,Р7 ,Р1 0 ,Р1 1 ,Р1 3 , Р1 4 , Q 4 ) .
Особый интерес представляют показатели со значением основания, равным 1. Такие
показатели внешне выступают с составом, включающим одни признаки. При основании,
равном 1, количество информации будет больше в том показателе, который содержит большее
число признаков, поскольку он дает более разностороннюю характеристику данному
экономическому хозяйственному процессу или явлению.
Можно ввести условие, что форма показателя с минимальным составом, включающая одно
основание и один признак, содержит единичное количество информации. Это позволяет
ввести логарифмическую меру и выразить количество информации, содержащейся в
показателе в следующем виде: I(Р) = 1од 2 (1 + Q ) 1од 2 (1 + ∑q), где n — число реквизитов-
признаков в показателе.
В литературе часто показатели подразделяются по единице измерения основания на
абсолютные и относительные. К абсолютным отнесены показатели, основания которых
получают прямым счетом, измерением, взвешиванием, алгебраическим суммированием
других абсолютных показателей, различные средние абсолютные показатели. В число
относительных входят показатели, значения оснований которых получены отношением двух
других показателей (удельный вес, отношение двух
частей и т. д.)

7.3 Информационные отношения


Между различными объектами, свойствами объектов и объектами существуют всевозможные
объективные отношения, определяемые предметной областью (пространственные, временные,
функциональные и т. п.). При информационном отображений объектов и присущих им свойств
эти отношения переносятся на отношения между составными единицами информации, с помощью
которых представляются объекты и их свойства.
Для установления связи между составными единицами информации используется понятие
«групповое отношение». Групповым отношением называется бинарное отношение Sк С Gi*Gj,
заданное на двух множествах групп Gi и Gj. Групповое отношение позволяет устанавливать связи
между группами и тем самым выражать отношения между объектами. Групповые отношения
различаются прежде всего тем, как связаны между собой конкретные представители множеств
групп Gi и Gj в групповом отношении. Часто основные виды групповых отношений называют
отношениями 1 : 1, 1 : n, n : 1 и n : m, а указанные пары чисел коэффициентом группового
отношения. Рис. 7.3
В отношении с коэффициентами группового отношения вида 1 : 1 , 1 : n и n : m группа q1
называется родительской, а qj — подчиненной. В отношении n : 1, наоборот, qj — родительская, а
qi — подчиненная.
Иерархическим называется групповое отношение, в котором каждая подчиненная группа может
быть связана только с одной родительской. Отношения вида 1 : 1 , 1 : n, n : 1 являются иерархиче-
скими.
Неиерархическое отношение, напротив, позволяет соотносить каждую подчиненную группу с
произвольным числом родительских групп. Иногда групповые отношения вида 1 : 1, 1 : n, n : 1
называют функциональными. Действительно, в первом и третьем случаях S к — функция, а во
втором — функцией является отношение Sk-1.
Реализацией группового отношения S к называют группу q i С Gi вместе с совокупностью Iqj=
{ q j 1 , . . . , q i j }, таких, что ( q i , q j ) C S к , для любых qj C Iqj. Говорят, что q i — владелец
реализации группового отношения, а q j C I q j — члены реализации.
Графически группы и групповые отношения удобно изображать в виде диаграмм, используя
следующие соглашения. На диаграммах группы изображаются прямоугольником, над левым
верхним углом которого помещается имя группы. Внутри прямоугольника могут быть показаны
имена реквизитов. Групповые отношения обозначаются стрелками, проведенными от
родительского к подчиненному типу группы с возможным указанием коэффициента группового
отношения (1:1, 1 : п , п : 1 и п : т ) и имени группового отношения.
Если диаграмму трактовать как ориентированный граф и группы в диаграмме отождествлять с
вершиной графа, а отношения — с дугой графа, то путем в диаграмме называется такая последо-
вательность групповых отношений (дуг), что конец каждой предыдущей дуги совпадает с
началом следующей. Рис. 7.4

Олимпиада

Рис. 7.4: Диаграмма группы

Контрольные вопросы

1. Определенная часть реального мира, которая является сферой проблемной ориентации


системы — это:
отношение;
свойство;
параметр;
предметная область;
2. Некоторая характеристика объекта, позволяющая устанавливать его сходство и различие
по отношению к другим объектам — это:
предметная область;
параметр;
свойство;
отношение;
3. Форма связи между объектами — это:
отношение;
свойство;
предметная область;
параметр;
4. Интерпретация описания состояний предметной области на естественном языке есть соответ-
ствие:
фраз, однозначно именующих различные реальные объекты, различным абстрактным
объектам из Е;
фраз, обозначающих свойства объектов, типам из Т;
фраз, обозначающих взаимоотношения конкретных объектов, кортежам отношений из R.
5. Один и тот же объект с различными свойствами может принадлежать:
нескольким типам;
одному типу.
6. Предложение естественного языка есть утверждение о том, что:

некоторые объекты обладают определенным свойством


между конкретными объектами существуют определенные взаимоотношения.
7. Основные принципы описания состояния предметной области на некотором формальном языке
следующие:
извлечение информации требует обязательного перехода от формального описания к описа-
нию на естественном языке.
формальное установление факта эквивалентности описаний состояния на различных языках
требует их абстрактной интерпретации в терминах некоторой эталонной модели;
информационное содержание раскрывается посредством описания состояния предметной
области на естественном языке, позволяющем соотносить элементы описания реальным
объектам;
8. Информационные единицы бывают:
элементарными;
локальными;
объектными;
распределенными;
классовыми;
составными;
9. Логически неделимые элементы, соотносимые с определенным свойством отображаемого
объекта или процесса:
сущности;
реквизиты;
объекты;
10. Количественные свойства экономических явлений характеризуют:
текстовые реквизиты.
числовые реквизиты;
11. Качественные свойства экономических явлений характеризуют:
текстовые реквизиты.
числовые реквизиты;

Набрано баллов

8 Теоретико-множественная модель представления


объектов

8.1 Объектно-классификационное моделирование


сложных систем
Чем дальше развивается цивилизация общества, тем сложнее становятся общественные
отношения и создаваемые обществом технические, организационные, информационные,
энергетические, транспортные, производственные, военные и другие системы, составляющие суть
данной цивилизации.
Создание и использование этих систем требует специального теоретического осмысления
общих закономерностей построения и функционирования систем любой природы. Другими
словами, обществу нужна системная философия (системология), общая теория и множество
специальных теорий анализа и синтеза сложных систем. Людей, практически занимающихся
проектированием сложных систем, уже не устраивает вербальная философия на уровне
рассуждений об общих закономерностях развития природы и общества.
Современная наука ищет способы и методы строгой формализации этих рассуждений на основе
последних достижений математики, логики, кибернетики, информатики и других точных наук.
Выше были изложены некоторые принципы исследования и проектирования сложных систем, из-
вестные как принципы системного подхода к проектированию объектов. Методологической
основой системного подхода является теория и практика математического моделирования
сложных систем. Классический системный подход, как правило, опирается на математическое
моделирование с использованием теории подобия, теории научного эксперимента,
математической статистики, теории алгоритмов и ряда других фундаментальных классических
теорий.
Наряду с этим классическим направлением за последнее десятилетие предпринималось много
попыток создания системологии адекватной новым условиям цивилизации. Это особенно заметно
в области проектирования информационно-управляющих систем и программного обеспечения
ЭВМ. Одним из направлений проектирования, анализа и синтеза сложных систем является так
называемый объектно-ориентированный подход (ООП). ООП заявлен как перспективная
методологическая основа проектирования сложных систем преимущественно в области создания
программного обеспечения ЭВМ.
Вообще объектно-ориентированный подход очень популярен в современном
программировании. Поэтому о нем уже написано достаточно много работ, в основном
прикладного характера. Однако фундаментальные исследования в данном направлении мало
известны и слабо формализованы. Однако, распространение идей ООП на общенаучный
системологический уровень было бы полезно и для философского понимания процессов
мышления и для практического проектирования сложных систем. На методологическое
обобщение системного анализа и синтеза претендует также теоретическая системология.
В данном разделе пытаемся объединить последние две системные концепции понятием
"объектно- классификационное моделирование" (ОКМ) сложных систем любой природы и
формализовать данную концепцию.
Основными методологическими категориями ОКМ являются понятия: объект, класс,
отношение (связь), система. Теория ОКМ предполагает содержательное и формальное
определение этих категорий с целью построения математических моделей сложных систем.

8.2 Определение понятия "объект"


В нашем представлении объект — это все что мы различаем как нечто целое, реально
существующее, или возникающее в нашем сознании и обладающее свойствами, значения которых
позволяют нам однозначно распознавать это нечто.
Очевидно, что понятие "сущность" в приведенном определении объекта не более понятно для
нас, чем понятие "объект". Поэтому не ясно, какие же свойства сущности наследуют все объекты,
и чем объект отличается от сущности. Для более строгого определения понятий, используемых в
теории ОКМ, предлагается применять следующую методику:
• Вводить уникальный идентификатор (имя) определяемого понятия, например: "объект",
"система", "человек" и т. п.
• Указывать ранее определенное известное понятие, свойства которого наследует
определяемое понятие. Так реализуется принцип наследования при определении новых
понятий, например, объект — есть сущность. Очевидно, предполагается, что должны быть
известны все атрибуты понятия "сущность".
• Указывать существенные для нового понятия свойства, отличающие его от всех других
понятий, например, осязаемость, видимость, мыслимость, ощутимость объекта для
человека. Принцип выделения отличительных особенностей нового понятия.
В теории ОКМ понятие "объект" играет роль фундаментального исходного понятия, через
которое определяются все основные понятия теории. Оно не может быть выведено из каких-либо
более общих понятий путем наследования их свойств. С точки зрения теории ОКМ объектом
называется все то, что можно мысленно выделить из окружающей его среды, путем указания
свойств и признаков, существенных для данного понятия. Всеобщими свойствами объектов
являются:
• наличие уникального имени,
• определенность предназначения,
• наличие внутренней структуры,
• наличие особенных свойств или признаков, позволяющих идентифицировать (узнавать)
данный объект,
• нахождение в определенном пространстве,
• нахождение в определенном состоянии,
• возможность изменения положения и состояния объекта,
• наличие отношений и связей с другими объектами.
Перечисленные свойства в дальнейшем будем называть атрибутами объекта. Вообще говоря,
атрибут есть существенная деталь, параметр, свойство или функция определяемого объекта.
Другими словами, атрибут есть объект служащий для определения другого объекта, и он также,
как и любой другой объект имеет свои атрибуты. В зависимости от предназначения атрибуты
объектов можно разделить на:
• идентификаторы,
• параметры,
• методы взаимодействия и функции.
В теории ОКМ любые объекты определяются путем детализации и конкретизации
перечисленных атрибутов данного понятия. Допускается также дополнять, конкретизировать или
изменять данный перечень атрибутов в зависимости от природы определяемых объектов.
Например, идентификатором конкретного человека могут служить паспортные данные,
отпечатки пальцев, характеристики ДНК и т. д. В качестве аргументов для идентификаторов
объектов выбираются переменные, не изменяющие своих значений в течение всего периода
жизни объекта, или хотя бы в течение периода его использования. Параметрами обычно
являются: рост, вес, температура тела, отпечатки пальцев, антропометрические параметры,
структурные параметры и т. д. Параметры обычно характеризуют состояние объекта во времени
и пространстве. Состояние, как правило, меняется с течением времени. Особое значение для всех
объектов имеют их структурные параметры: состав элементов и характер связей между ними.
Методы взаимодействия с окружающей средой определяют реакции объекта (в данном случае
человека) на воздействия окружающей среды, например, на пощечину. Чаще всего методы
описывают изменение параметров объекта в ответ на внешние воздействия окружающей среды. К
числу функций, как правило, относят действия объекта, приводящие к некоторому результату,
например, к производству определенного продукта. Аргументами функций, как правило,
являются значения внешних воздействий на объект и значения параметров объекта в некоторые
моменты времени.
Вообще говоря, методы определяют динамику внутренних состояний объектов, а функции
определяют внешний эффект, возникающий в результате этой динамики.
Из приведенного примера видно, что границы между перечисленными группами атрибутов
весьма условны. Назначение атрибутов при описании объекта является прерогативой
исследователя и полностью определяется целями и задачами исследования. Однако очевидно, что
каждому исследователю в каждом конкретном случае, когда требуется изучать какие-либо
объекты, не следует изобретать свой собственный способ формального описания
(моделирования) объектов. Эти способы являются предметом исследования и развития
общесистемной научной дисциплины, которую можно назвать "Объектно-классификационное
моделирование систем", сокращенно — ОКМ.
Всякая научная дисциплина использует для описания исследуемых объектов определенный
символический язык. Описание объектов на этом языке называют символическими моделями.
Для символического моделирования любого объекта необходимо описать все его атрибуты и
процесс изменения значений этих атрибутов во времени под воздействием различных факторов.
Первое описание называют статической моделью объекта, а второе — моделью поведения
объекта в заданных условиях. Проблема ОКМ состоит в том, чтобы найти общий подход к
символическому моделированию (формализованному представлению) объектов и процессов
любой природы.
Обозначим описание имени — идентификатора объекта символом К , описание параметров
объекта символом в и описание методов и функций объекта символом Ф. Тогда статическая
модель объекта есть формула: О = ( К , Ө, Ф, t ) .
Символ t здесь указывает на то, что статическое описание объекта всегда относится к какому-
то моменту времени, то есть, характеризует некоторое состояние объекта.
Поведение объекта есть процесс изменения его состояний во времени под воздействием
множества X внешних и внутренних факторов. Этот процесс полностью определяется следующим
описанием: Ŏ = Ф (К, Ө , Х , t ) .
В дальнейшем попытаемся найти формальные средства и конкретные выражения для моделей
такого рода.

8.3 Формальное моделирование атрибутов объектов


Возвращаясь к понятию "атрибут", напомним, что атрибут есть существенная деталь, параметр,
свойство или функция определяемого объекта. Мы разделили все атрибуты объекта на четыре
класса:
• идентификаторы,
• параметры,
• методы,
• функции.
Однако, описание любого атрибута А также включает в себя описания своих атрибутов. Этими
атрибутами являются: идентификатор К (код имени атрибута), синтаксическая форма описания
(множество в структурных параметров) и функциональное (семантическое) значение 2. Иными
словами, любой атрибут представляется моделью (К, Ө, Z, t). Описание Z значения атрибута
определяет тип значения, размерность значения (его предметную интерпретацию) и символику
значения. Например, фраза "объект Өj весит 250 кг." представляет собой описание параметра по
имени "вес" данного объекта. Атрибут "вес" объекта Өj в настоящее время имеет значение
цифрового типа 250, и размерность - кг. Можно сказать, что фраза "объект Өj весит 250 кг." есть
модель текущего состояния объекта Өj с единственным параметром "вес", записанная на русском
естественном языке. Эту же фразу можно представить в виде логической формулы: Ө = Өj =>вес
Өj = 250кг.
Здесь Ө = Өj и вес=250 кг — логические высказывания. Символ => указывает на то, что из
истинности первого высказывания следует истинность второго высказывания. Однако, о времени
в этой модели ничего не сказано. Более точная формальная модель, соответствующая фразе
"объект Өj, весит 250 кг", имеет вид: (Ө = Өj) ^ (Өi = " ") ^ ( t =" ") => ( Өi,j = 250)кг, где Өi,j
параметр объекта Өj, t — фактор времени. Данная модель точно определяет условия, при
которых параметр Өi, j принимает значение 250 кг. Однако и эта модель является неполной, так
как в ней тип и область значений параметра Өi, j определяются по умолчанию. Основное
преимущество последней модели в том, что к ней можно применять все правила формального
исчисления высказываний, которые позволяют формализовать анализ и синтез объектных
моделей.
Предположим теперь, что атрибут объекта Өj является его идентификатором Кj. Это означает,
что Кj однозначно указывает на конкретный объект Өj, выделяя его из множества ему подобных.
Например, "человек Петров Петр Петрович, 2000 года рождения, г. Москва" или "программное
средство Windows 95". Обычно, идентификатор Кj представляет собой набор значений ряда клас-
сификационных признаков (классификационных атрибутов А 1 , . . . , А n ) , т. е. К j C { Е 1 , . . . , Е п } ,
где Е область значений атрибута Аi, i = 1 , п . Отсюда следует, что формально идентификатор
i

любого объекта можно представить как элемент декартового произведения Е 1 х . . . х Еn.


Функциональные атрибуты объектов это методы и функции, определяющие их поведение.
Например: "хамелеон меняет цвет кожи в соответствии с изменением цвета окружающей среды",
"изображение объекта исчезает с экрана при нажатии левой клавиши "мышки", когда указатель
находится в поле изображения кнопки "выход"", "напряжение на участке электрической цепи
равно произведению силы тока на сопротивление в этой цепи". Структура формальной модели
всех этих выражений представляет собой отношение "причина — следствие". Причиной обычно
являются некоторые действия, либо некоторые условия, а следствием — результат действия или
обусловленное значение атрибута. В общем случае схема этой модели имеет вид: f ( Х 1 , . . . , Х s ) =
Y , где Х 1 , . . . , Х 3 — аргументы, а Y — функция, символ f обозначает тип операции с
аргументами. Аргументами таких моделей обычно являются параметры Ө объектов, а так же
внешние и внутренние факторы х , влияющие на поведение объектов. Поэтому применительно к
объектам модели функциональных атрибутов имеют вид:
f(
Ө1,…, Өr,x1,…, xs)=y
Идентификатор объекта при этом предполагается известным по умолчанию. Из приведенных
примеров видно, что наши представление об атрибутах рассматриваемых объектов
формулируются, как высказывания на определенном языке. Поэтому можно предположить, что
обобщенной формальной моделью любого атрибута является многозначный предикат Р(А), с
помощью которого и определяются значения атрибута конкретного объекта в его формальной
модели. В простейшем случае Р(А) есть утверждение: "Атрибут Аi объекта Өj имеет значение а i j
из множества Еi = {а1, . . . , а к } ". В данном предикате атрибут Аi выступает в качестве предметной
переменной. На формальном языке исчисления предикатов данное утверждение можно записать
так:Өj^Ai|s(Aij)=aijCEi.

Задача теории ОКМ состоит в том, чтобы найти общие методы построения комплексных
математических моделей объектов и систем, представленных в пространстве всех своих
атрибутов.

8.4 Классификация объектов. Пространство


идентификаторов объектов
Обычно объекты, определенные на одних и тех же атрибутах с различными значениями, относят
к одному классу объектов. Процесс объединения объектов в классы в соответствии с их
свойствами называется классификацией.
Ни одна научная дисциплина не может обойтись без классификации рассматриваемых в ней
объектов. Таблица химических элементов Д. И. Менделеева и теория происхождения видов
Дарвина — открытия полученные методом классификации объектов. В действительности
мышление человека основано на абстракциях (понятиях), обозначающих классы различных
объектов. При проектировании сложных систем исследователь (разработчик) должен выбирать
необходимые ему экземпляры объектов из заданного класса объектов путем конкретизации
значений их атрибутов (идентификации). Сложность выбора необходимого варианта (экземпляра
объектов) оценивается величиной разнообразия (мощностью) данного класса объектов. "Класс"
— термин, употребляемый в математике в основном как синоним термина "множество" для
обозначения произвольных совокупностей объектов, обладающих каким-либо определенным
свойством, или признаком (например, в алгебре — классы эквивалентности относительно данного
отношения эквивалентности). Иногда классами предпочитают называть совокупности,
элементами которых являются множества (например, в рекурсивной теории — перечислимые
классы). В некоторых случаях под влиянием аксиоматической теории множеств термин "класс"
применяется для того, чтобы подчеркнуть, что данная совокупность оказывается собственно
классом, а не множеством в узком смысле (например, в алгебре — примитивные классы
универсальных алгебр, называемые также многообразиями).
Теоретико-множественные операции над классами определяются так же, как и над
множествами. В общем случае классификация объектов может проводиться по нескольким
определяющим признакам (атрибутам объектов). Например, людей можно классифицировать по
имени, полу, дню рождения, образованию, профессии и т. д. Каждый конкретный человек
данного класса будет определяться (идентифицироваться) соответствующим уникальным, только
ему присущим, набором значений данных атрибутов, который в дальнейшем будем называть
кодом или идентификатором данного объекта.
Пусть А 1 , . . . , А п — перечень независимых атрибутов, характеризующих некоторое множество
объектов. Поставим в однозначное соответствие каждому атрибуту Аi многозначный предикат Pi,
определяющий множество значений Е i = { а 1 , . . . , а к } данного атрибута так, что Рi = V е(Аi(t)) =
а е € Е*.
Другими словами, в любой момент времени атрибут А^ может принимать только одно какое-
нибудь значение а е из множества Е^. Тогда класс К есть абстракция, определяемая как декартово
произведение {Еi х . . . х Еп} = { К 1 , . . . , Кm}, Кj — код или идентификатор конкретного объекта
Өj. По данному определению символы Өj и Кj обозначают понятия, находящиеся в отношении
взаимно однозначного соответствия, Өj  Кj. Код Кj есть символическая (абстрактная) модель
объекта Өj.
Размышляя об объектах, мы фактически оперируем их наименованиями, ярлыками, кодами
или идентификаторами, т.е. их абстрактными представлениями в нашем сознании. Однако,
экземпляр класса объектов не одно и тоже, что экземпляр класса кодов этих объектов.
Экземпляр класса объектов — это конкретный объект Өj из множества объектов Ө 1 , . . . ,
Өm, составляющих данный класс Өj C Ө = {Ө1 . . . , Өm}. В процессе классификации классу
объектов в по определенным правилам ставится в соответствие класс представляющих
объектов (моделей) — К . Данное определение класса, по сути, эквивалентно теоретико-
множественному понятию универсума U . Это означает, что класс как математический
формализм обладает всеми свойствами формализма универсум. Поэтому для описания и
анализа отношений между объектами и подмножествами объектов одного класса можно
успешно применять исчисление обобщенных кодов подмножеств. При этом атрибуты
А 1 , . . . , А п объектов класса в можно рассматривать как оси классификационного пространства
(пространства идентификаторов) объектов {Ө1,..., Өn}, где каждый конкретный объект в^
представлен точкой с координатами К ^ , как показано на рис. 8.1
Введем отношение порядка в классе идентификаторов объектов { К 1 , . . . , К т } такое, что
µ ( К 1 ) < . . . < µ ( К т ), где ( К j ) — мера или ключ упорядочения идентификаторов объектов в
классификационном пространстве. Такой мерой может быть, например, индекс j = 1 , . . . , т .
Тогда пространство идентификаторов объектов можно представить таблицей на рис. 8.3.

В данной таблице каждая строка идентифицирует конкретный объект Өj определенного


класса Өj.
Согласно теории обобщенных кодов подмножеств каждая строка данной таблицы есть код
( а 1 ^ , а 2 ^ , . . . , а ) конкретного объекта Өj — экземпляра данного класса Ө1.

Здесь i — номер атрибута и соответствующего ему столбца, а г — номер строки таблицы, соот-
ветствующий номеру кода (идентификатора) объекта, а i j C Е i = { а 1 , . . . , а к }i . Таким способом в
теории ОКМ осуществляется формальное представление идентификаторов объектов. В данном
случае идентификатор объекта, как мы уже говорили, является символической моделью
конкретного объекта, а таблица на рис. 8.3 представляет собой модель класса объектов. В
процессе исследования систем классы, как правило, разбивают на подклассы. Обычно это
творческий, в основном интуитивный процесс. Применение теории обобщенных кодов позволяет
выяснить суть процесса разбиения класса объектов на подклассы и в значительной мере
формализовать его. Если класс в
представлен множеством определяюших
его атрибутов А1,...,Ап, то
предполагается, что все эти атрибуты
существенны для данного класса, и каждый
из них может принимать любое значение из
соответствующего ему множества значений
Е^ = { а 1 , . . . , а к }. Устанавливая
конкретное значение «г, е € Ег для
некоторого атрибута А класса в, мы тем
самым ограничиваем множество объектов
исходного класс в до определенного нами
подмножества объектов, для которых
важно, чтобы атрибут Аг имел значение а*,е
= е € Е^. В результате получается подкласс
в^ класса в. В литературе по объектно-
ориентированному программированию
класс в^ обычно называют дочерним
классом, а класс в — родительским классом.

8.5 Состояние объекта. Пространство состояний объекта


Как уже было сказано, идентификаторы объектов одного класса можно упорядочить по некото-
рому критерию µ(Кj), определенному на множестве значений одного или нескольких атрибутов,
характеризующих этот класс объектов. Например, располагая имена (идентификаторы) объектов
по алфавиту, или упорядочивая их по возрастанию цифровых значений какого-нибудь иного
атрибута. Если такого атрибута не существует, то в качестве критерия упорядочения может
служить комбинации значений нескольких, или даже всех, атрибутов объектов данного класса.
Упорядоченные объекты, точнее их идентификаторы, можно изображать точками на одной
линии, которую будем называть линией классификации. Рис. 8.3
Классификационные атрибуты объектов служат для идентификации конкретных объектов. На-
ряду с классификационными атрибутами, как правило, не меняющими своих значений с течением
времени, объекты обладают также атрибутами, которые могут изменять свои значения со
временем под воздействием внешних и внутренних факторов, то есть, они являются функциями
времени t и других факторов Аi=fi(t,X). Символом X здесь обозначено множество всех возможных
факторов, воздействующих на объект Ө. Набор значений всех атрибутов объекта в в
определенный момент времени t называется состоянием данного объекта. Атрибуты Аi = fi(t,Х)
характеризуют состояние объекта в, поэтому они называются параметрами данного объекта, и мы
будем обозначать их специальными символами Өi, Өi=fi(t,X). В отличие от параметрических
атрибутов Өi, классификационные атрибуты, определяющие идентификатор объекта в и его место
в некотором классе Ө, в дальнейшем будем обозначать символами кi.
Таким образом, множество А всех атрибутов объекта Ө разбивается на два подмножества К и О.
Подмножество К содержит статические атрибуты объекта в, а подмножество О содержит атрибу-
ты, характеризующие поведение данного объекта, т.е. А = К U О. Значения атрибутов Ө i = fi(t,Х)
также могут быть сформулированы при помощи предикатов и объединены в последовательность
переменных Ө1 , . . . , Ө8 , которая представляет собой базу координат пространства состояний
определенного объекта. Состояние объекта в момент времени t изображается на графике точкой в
этом пространстве. Последовательность состояний объекта Өj за определенное время Δt есть
процесс, который называется поведением объекта и обозначается Ŏj. Пример графика поведения
объекта Ŏj на отрезке времени [t0,t1] показан на рис. 8.4
Переменные Өj могут быть многоместными методами или функциями, но в число их
аргументов, как правило, должен входить фактор времени. Другими словами, утверждается
следующее: методы и функции являются атрибутами, описывающими поведение объекта в
пространстве его состояний. Поскольку классификационное пространство (пространство
идентификаторов объектов) и пространство состояний объектов (параметрическое пространство)
характеризуют одни и те же объекты, первое определяет объекты как экземпляры определенного
класса, а второе характеризует поведение каждого объекта данного класса (изменение его
состояний), то эти пространства естественно

Рис. 8.4: Поведение объекта О^ в пространстве координат

связаны между собой посредством объектов, которые они определяют и характеризуют.


Фактически модель объекта определяется в двух взаимосвязанных системах координат:
классификационной и параметрической. Графически эта связь показана на рис. 8.5
На рис. 8.5 показано, что каждый объект Өj, принадлежащий к определенному классу объектов,
имеет свой идентификатор К в универсуме U и обладает своим собственным поведением,
j

которое характеризуется функцией Өi = fi(t,Кi,Х) , i = 1, s . Поведение объекта Өj зависит как от


собственных параметров, так и от внешних факторов, в том числе и от воздействий со стороны
других объектов, которые могут принадлежать различным классам. Согласно введенным обо-
значениям любой объект Өj класс Ө может быть представлен набором значений своих координат
К 1 , . . . , К Өi + 1 , . . . , Өn, t , функций и методов ( φ 1 , . . . , φ г , т.е. Өj = > ( к 1 , . . . , К , Өi +
i, г

1,. . . , Өn, 1 ) или Өj ( К j , Ө, Ф , t ) , где К — код-идентификатор объекта Өj из классификационного


j

пространства, Өj — набор значений параметров, определяющих поведение объекта Өj и Фj —


набор отношений,
Рис. 8.5: Связь классификационного пространства с пространством состояний объектов одного
класса

Рис. 8.6: Математическая модель поведения объекта в,-

методов и функций, определяющих поведение объекта, t — фактор времени. При этом поведение
объекта Өj есть процесс Ŏj = Фj(Кj, Өj , X, t) где X — база факторного пространства. Фактор вре-
мени I вынесен из множества X в силу его особой значимости в процессе поведения объекта.
Выражение Ŏj = Фj( К , Өj, X, t) по сути есть математическая модель процесса поведения
j

объекта Өj в условиях воздействия на него различных внешних и внутренних факторов х C X в


определенные моменты времени Ее можно представить в графическом виде так как показано на
рис. 8.6
Главным отличием данной модели от прочих является наличие в ней явно выраженного
идентификатора Кj данного объекта. Это главный компонент модели, через который
осуществляется связь моделей различных объектов в системную модель более высокого уровня.

8.6 Моделирование отношений между объектами и


классами объектов
Связующими элементами между моделями различных объектов являются отношения. Рассмотрим
приложение данного понятия для формализации объектно-классификационных моделей объектов
и систем. Определяющими атрибутами любого отношения являются:
• свойство, по которому определяется отношение рассматриваемых объектов;
• размерность, или, другими словами, мера данного свойства, определяющая
соответствующую единицу измерения;
• область определения, представляющая собой базовое множество Е данного свойства;
• область значений отношения, содержащая альтернативные значения — результаты данного
отношения;
• семантика, определяющая сущность отношения,
• имя отношения, которое является символическим ярлыком его сущности. (Сущность есть
концентрированное выражение свойств некоторого объекта);
• время, к которому относится отношение (настоящее, прошедшее или будущее);
• формула, представляющая собой конструкцию из символов определенного языка,
отражающую синтаксис отношения.
Всеобщими свойствами отношений являются:
• истинность — характеристика реальности отношения в определенных условиях; отношение,
как субъективное отражение объективной реальности, может быть истинным, ложным или
неопределенным, мерой истинности, как правило, служит вероятность;
• местность, по количеству аргументов отношение может быть одноместным, двухместным и
так далее, вообще говоря, n-местным;
• сущность, как концентрированное выражение совокупности основных логических свойств
отношения: симметричности, транзитивность, рефлексивности, антисимметричности и
антирефлексивности;
• предметность, устанавливающая связь отношения с конкретными свойствами конкретных
объектов.
В математике, отношением называется подмножество R декартового произведения E 1 х . . . х
Е п , где Е i — множество значений некоторой переменной Х j , i = 1, п .
Обычная форма записи простейших отношений между переменными (формула) имеет
следующий вид:
ИМЯ_ОТНОШЕНИЯ (аргумент , ... , аргумент),
например, РАВНО(х,у), ЛЮБИТ(х,у), ПРИНАДЛЕЖИИТ(А,В) и т.д. На естественном языке
такие отношения представляют собой высказывания, указывающие на определенные действия над
значениями переменных х , у , . . . . При определенных условиях эти высказывания могут быть ис-
тинными или ложными. Поэтому множество ИСТИНА, ЛОЖЬ является областью значений лю-
бого отношения. Обычно предполагается, что все специфические свойства отношения определе-
ны заранее и заданы по умолчанию. Например, предполагается, что подчиненность аргументов,
или направленность действия отношения определяется порядком записи аргументов (х любит у).
Все действия с отношениями выполняются с учетом этих свойств. Например, из того, что "при-
надлежит (а, b)" и "принадлежит (b, с)" с учетом свойства транзитивности отношения принадлежит
следует отношение "принадлежит (а, с)". Свойство транзитивности было присвоено отношению
"принадлежит (х, у)" при определении данного отношения. Формулы более сложных отношений,
как правило, составляют из этих простейших формул по правилу подстановки, например так:
РАВНО(*),ПРОИЗВЕДЕНИЕ(х,у))), или РАВНО(ПРОИЗВЕДЕНИЕ x,у),z)) в силу рефлексивности
отношения РАВНО (x, у) по определению.
В прикладной математике, чтобы приблизить формальные выражения к естественному языку,
применяют следующую, более привычную форму записи отношений: аргумент ДЕЙСТВИЕ
аргумент УКАЗАТЕЛЬ результат.
Здесь слово ДЕЙСТВИЕ обозначает класс всех функциональных отношений, а слово УКАЗА-
ТЕЛЬ — класс всех отношений типа "причина — следствие", например, х + у =z. Если между
значениями атрибутов Аi объекта Өj установлена какая-нибудь зависимость, то ее можно
представить (описать или смоделировать) в виде определенного отношения Д. Например, если
параметрами объекта прямоугольник являются длина — Ө 1 , ширина — Ө 2 и площадь — Өз, то
эти параметры связаны следующим отношением: ПРОИЗВЕДЕНИЕ (в^) РАВНО вз.
Как принято в арифметике, формальная запись этого отношения имеет вид: Ө 3 = Ө 1 * Ө 2 , или
Ө 3 = Ө 1 * Ө 2 , или Ө 3 = Ө 1 * Ө 2 .
Здесь идентификаторами отношения ПРОИЗВЕДЕНИЕ служат символы: "х", " * " или запись
аргументов без разделительных знаков; отношение РАВНО обозначается символом "=".
Вообще формульное представление отношений многообразно и обычно зависит от языка,
традиций и вкусов авторов, применяющих те или иные формальные системы. Область
применения отношений также влияет на формы представления и интерпретацию отношений,
применяемых в данной области. Например, в естественном языке отношения между объектами
описывают с помощью соответствующих предложений (высказываний), в математике используют
язык символических формул, в логике применяют свои специальные символы для записи
отношений между высказываниями, химия, физика и многие другие научные дисциплины обычно
используют специальные символы для записи отношений между объектами в исследуемой
предметной области. Однако, в любом случае понятие "отношение" сохраняет вышеизложенные
атрибуты, определяющие суть данного понятия. Поэтому можно предложить единый метод
определения и формулирования отношений, как класса абстрактных объектов (понятий).

8.7 Классификационный подход к определению


отношений
Отношения, как разновидность абстрактных объектов, могут быть определены в системе четырех
атрибутивных множеств (пространств): идентификаторов, параметров, функций и факторов, т. е.
в системе К О ФХ. Для этого достаточно все перечисленные выше атрибуты понятия "отношения"
отнести к соответствующим пространствам К , О , Ф, Х и указать способы формального
представления (записи) атрибутов в координатах данных пространств. Идентификаторы Кj
общеизвестных отношений обычно представляют собой специальные символы, отличающиеся от
алфавита естественного языка.
В ОКМ для идентификаторов общеизвестных отношений, как правило, будем использовать об-
щепринятую символику. Для идентификаторов отношений, имеющих новый смысл и не формали-
зованных в каких-нибудь общеизвестных дисциплинах, мы будем употреблять слова русской
речи, написанные прописными буквами. Примеры идентификаторов некоторых общеизвестных и
вновь формализуемых здесь отношений приведены в первом столбце таблицы на рис. 8.7.
Рассматривая отношения как объекты в терминах теории ОКМ, заметим, что определение любого
отношения так же как и определение любого иного объекта требует явной или не явной
конкретизации основных атрибутов: идентификатора, параметрических свойств, определяющих
его структуру, методов и функций, характеризующих его поведение. Другими словами,
отношение также как и все иные объекты представляются в следующей форме: Кj, Оj, Ф j , t , г д е
Фj — подмножество атрибутов, определяющих алгоритм применения (или поведение) отношения
Rj. Моделирование отношений между объектами и классами объектов независимо от их природы
является предметом исследования общей системологии. В теории ОКМ предпринимается
попытка формализации таких моделей с целью выявления общих закономерностей и методов
математического моделирования сложных систем, а также практического приложения этой
теории при проектировании таких систем. По определению φ есть код — идентификатор
подмножества R С {Е1 х . . . Е8}, где Еi - множество значений атрибута Өj, i =1, s . Если атрибуты
принадлежат разным объектам, то отношения определяется между этими объектами. Если
атрибуты принадлежат одному объекту, то отношение касается только атрибутов одного данного
объекта.
Важными частными случаями отношений являются:
• когда R представляет собой подмножество универсума U, т.е. когда все атрибуты Аi, i = 1, n ,
относятся к классификационному пространству объектов одного определенного класса,
например людей, деревьев, космических аппаратов и т. д.;
• когда аргументами отношения R являются атрибуты одной размерности (одного типа) и R
определено в некоторой формальной системе, например, в алгебре величин, алгебре
множеств, в исчислении высказываний и т. п., например, когда речь идет о сравнении
каких-нибудь параметров некоторых объектов;
• R представляет собой значение показателя определенного свойства Xi,; некоторого объекта
Өi, если R С Еi, где Еi — область определения меры свойства Xi.

8.8 Моделирование отношений между параметрами


объектов
Между параметрами одного и того же объекта, а также между параметрами различных объектов
существует много различных отношения, которые могут представлять интерес для
исследователей. Если рассматриваются отношения между параметрами различных объектов, то в
этом случае чаще всего речь идет о сравнении значений параметров заданных объектов,
например, о сравнении возраста людей или растений, о сравнении площадей различных фигур и
т.п.
Отношения между параметрами объектов изучаются многими общими и специальными
научными дисциплинами. Как привило, специальные дисциплины при описании отношений
между атрибутами изучаемых объектов применяют символику и формальные модели отношений,
определяемые общими дисциплинами. Если между значениями параметрических атрибутов в
объекта 0j установлена какая- нибудь зависимость, то говорят, что параметры Ө находятся в
определенном отношении φ.
По определению φ есть код-идентификатор подмножества R С {Е1 х . . . х Е 3 ] , где Е i —
множество значений атрибута Ө j , i =1, s . Например, если параметрами объекта прямоугольник
являются длина — Ө 1 , ширина — Ө 2 и площадь — Ө 3 , то эти параметры связаны следующим
функциональным отношением: ПРОИЗВЕДЕНИЕ^ , Ө 2 , Ө 3 ) , где аргументы отношения
соответственно определены, как множители (в1,в2) и результат (произведение) — в3. Как принято в
арифметике, формальная запись этого отношения имеет вид: Ө 3 = Ө 1 * Ө 2 , или Ө 3 = Ө 1 1 Ө 2 ,
или Ө 3 = Ө 1 Ө 2 . Здесь идентификаторами отношения ПРОИЗВЕДЕНИЕ или умножение служат
символы: "х", " * " или запись аргументов без разделительных знаков. В принципе объект 9^-
может быть представлен в отношении R любым числом своих атрибутов. Однако сложные
отношения трудно представить в практически обозримой форме. Поэтому необходимо искать
простые аксиоматические формы отношений, из которых можно строить сложные отношения с
помощью простых и понятных правил.
Одним из подходов к решению данной проблемы является определение отношений между ат-
рибутами по типам их параметров и формализация отношений с учетом специфики каждого типа.
Например, общепринятыми типами являются: число, символ, множество и высказывание
(предикат). Отношения между этими типами формализованы с помощью специальных
общенаучных математических дисциплин: арифметики, символьной алгебры, теории множеств и
математической логики. Атрибуты объектов в принципе могут определяться как предикаты. В
дополнение к известным общепринятым типам атрибутов (величин, символов, высказываний,
множеств и т.д.) в ОКМ вводится тип идентификаторов объектов. Идентификатор однозначно
представляет объект в определенном классификационном пространстве. Другими словами,
идентификатор есть элементарный код К конкретного объекта определенного класса К.
Формально К С (Е1 х . . . х Е п = К ). Это означает, что любой класс К объектов в 1 ,. . . , в т может
быть однозначно представлен множеством К 1 , . . . , К т соответствующих идентификаторов К, и
любой объект 9^ может быть представлен своим идентификатором (кодом) К = (а1, j, а 2 , j , . . . , аn,
j ), определенном в базе координат к 1 , . . . , к n классификационного пространства.

8.9 Моделирование состояний объекта


Как было определено выше для описания состояния объекта Өj необходимо указать значения всех
его атрибутов А i в определенный момент времени К. При этом значения классификационных
атрибутов к определяют код Кj — идентификатор данного объекта, а значения параметрических
атрибутов Өj определяют состояние этого объекта в момент времени t . При этом параметры Ө
объекта Ө взаимосвязаны определенными отношениями у. Обозначим набор значений всех
параметрических атрибутов Ө1 , . . . , Өs символом Өj и по аналогии с кодом идентификатора К
будем называть этот набор кодом состояния объекта Өj. Таким образом модель состояния любого
объекта 0j будет представлена тройкой Кj,О j , t . Другими словами, имеет место отображение Ө Ө
Ө j^ ( t ) => ( К j , О j , t ) .

Контрольные вопросы

1. Общими свойствами объектов являются:


нахождение в определенном состоянии;
наличие внутренней структуры;
наличие уникального имени;
наличие особенных свойств или признаков, позволяющих идентифицировать (узнавать)
данный объект;
возможность изменения положения и состояния объекта;
определенность предназначения;
наличие отношений и связей с другими объектами;
нахождение в определенном пространстве.

1
2. Нечто целое, реально существующее, или возникающее в сознании и обладающее
свойствами, значения которых позволяют однозначно распознавать это нечто — это:
атрибут;
объект;
экземпляр класса объектов;
классификация;
3. Существенная деталь, параметр, свойство или функция определяемого объекта — это:
экземпляр класса объектов.
атрибут;
классификация;
объект;
4. Процесс объединения объектов в классы в соответствии с их свойствами — это:
объект;
экземпляр класса объектов.
классификация;
атрибут;
5. Конкретный объект из множества объектов — это:
объект;
атрибут;
классификация;
экземпляр класса объектов.
6. Атрибуты объектов можно разделить на:
Функции;
методы взаимодействия;
параметры;
идентификаторы;
ассоциации.
7. Описание атрибута включает в себя:
множество структурных параметров;
функциональное значение;
вид;
объектное значение;
идентификатор;
тип;

Набрано баллов
Литература
[1] http://staratel.com/iso/ISO9000/Article/ConImp/ContImprove.htm.

[2] http://www.cfin.ru/itm/bpr/idef0_bpr.shtml.
[3] А.М. Вендров. Методы и средства моделирования бизнес-процессов (обзор).—
http://www.jetinfo.ru/2004/10/1/article1.10.2004.html.
[4] Швецов В.И. Визгунов А.Н. Мееров И.Б. Базы данных. Учебное пособие. — ННГУ, 2004. —
С. 217.
Список иллюстраций

4.1 Семиотический треугольник


4.2 Знаковая ситуация
4.3 Вытянутый семиотический треугольник
4.4 Неоднозначность элементов семиотического треугольника
4.5 Знаковая система
6.1 Граф переходов
6.2 Граф переходов 1
6.3 Граф переходов 2
7.1 Предметная область
7.2 Пример накладной
7.3 Групповое отношение
7.4 Диаграмма группы
8.1 Оси классификационного пространства объектов
8.2 Пространство идентификаторов объектов
8.3 Линия классификации объектов

Оценить