Вы находитесь на странице: 1из 5

МЯГКИЕ ИЗМЕРЕНИЯ И ВЫЧИСЛЕНИЯ

КОГНИТИВНЫЕ МЕТОДЫ В МОДЕЛИРОВАНИИ,


ПРИНЯТИИ РЕШЕНИЙ И УПРАВЛЕНИИ
СЛОЖНЫМИ СИСТЕМАМИ

УДК 740

КОГНИТИВНАЯ ТЕХНОЛОГИЯ ИСКУССТВЕННОЙ ГЕНЕРАЦИИ


ЭКОНОМИЧЕСКИХ ЗНАНИЙ НА ОСНОВЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ
«ЦИФРОВОЙ ТОЛКОВЫЙ СЛОВАРЬ»

А.И. Иванус1, д.э.н., профессор Департамента анализа данных,


финансовых технологий и принятия решений

Аннотация. Рассматривается новый подход к разработке системы искусственной


генерации экономических знаний на основе интеллектуальной системы «Цифровой тол-
ковый словарь» (ЦТС). В семантической структуре терминов положена координата «ис-
тинность», являющаяся структурным дополнением к информационной составляющей
термина. Таким образом образуется в свою очередь новый объект более высокого уровня,
называемый семантическим ядром истинности термина. Данный подход имитирует
двухполушарную технологию генерации новых знаний мозгом человека. Рассмотренная
технология имеет ряд преимуществ, связанных, в частности, с наличием гауссового рас-
пределения семантического ядра истинности.
Ключевые слова: интеллектуальная система, когнитивная технология, генераций
новых знаний, функция распределения, толковый словарь.

1. Актуальность

Интеллектуальная система ЦТС предназначена в широком смысле для информацион-


ного обеспечения процессов решения широкого спектра социально-экономических задач
управления народным хозяйством Российской Федерации.
Известно, что в каждой сфере человеческой деятельности содержится огромное коли-
чество терминов, которые, несмотря на то, что они повсеместно всеми используются, тем не
менее, допускают большой или малый разброс в их понимании. Это относится практически
ко всем терминам, независимо от их частоты использования, степени общеупотребительно-
сти и уровня квалификации тех, кто их использует.
Само по себе это явление, как правило, на бытовом уровне не несёт каких-либо отрица-
тельных последствий. Однако, есть отрасли, где степень ответственности использования
терминов необычайно высока.
Так, это в полной мере относится к юриспруденции, где совершенно недопустимо раз-
ное понимание одних и тех же терминов такими участниками судебного процесса, например,
как судья, обвинитель и адвокат. По отзывам юристов именно эта проблема является акту-
альной сейчас, тем более что количество законов и законодательных актов лавинообразно
увеличивается. (Кстати, относительно термина законодательный акт в юридическом слова-
ре сказано: «Законодательный акт – понятие, вызывающее в науке права различные подходы.
По мнению одних авторов …..»).

1
Финансовый университет при Правительстве Российской Федерации.

48
№ 1 (2) − 2018 ЯНВАРЬ

Аналогичные проблемы характерны и для других видов научной и профессиональной


деятельности.
Поэтому неспроста в медицине принята латынь в качестве международного языка ме-
диков. Видимо, медики первые поняли опасность неоднозначного понимания терминов для
здоровья человека.
Образцом однозначности понимания терминов среди современных наук служит мате-
матика, где неоднозначность в толковании терминов сведена практически к нулю.
В связи с изложенным, представляется весьма актуальной задача создания толкового
словаря терминов и определений, основанного на современных принципах искусственного
интеллекта, когнитивных подходов и цифровых технологий, в которой разногласия в пони-
мании терминов в области инновационного развития или снимаются полностью, или мини-
мизируются. Это необходимо ещё и потому, что проблема неоднозначности понимания тер-
минов конвертируется в проблему неоднозначности управленческих решений, что в бизнесе
часто приводит к большим потерям. Кроме того, данная проблема перманентно ощущается
на межязыковых уровнях в процессе обеспечения адекватности перевода.
Вместе с тем, есть ещё одно чрезвычайное обстоятельство в пользу необходимости со-
здания токового словаря нового типа. В 1965 году новый революционный вклад в решение
проблемы управления сложными объектами в условиях неопределённости был внесён про-
фессором Калифорнийского университета Л.А. Заде. Как он сам кратко сформулировал идею
своего подхода, «…действительная проблема состоит в разработке систем вычислений со
словами, способных справиться с предложениями большей сложности, которые выражают
знания о реальном мире», и далее «…исходной моделью для вычислений со словами, нечёт-
кой логики и мягких вычислений является человеческий разум».
Из этих цитат следует, что инструментальной основой для использования мягкой мате-
матики, и в частности, центрального её понятия – лингвистическая переменная на основе
функции принадлежности – используются новые объекты – слова, которые приобретают но-
вый смысл не только как средство общения, но и как новый предмет для математического
исследования и анализа. Слова становятся частью математической модели, а при более це-
лостном рассмотрении – самостоятельной математической моделью.
Данное обстоятельство представляется настолько важным, что из этого вытекает прин-
цип организации сложных систем, известный как принцип несовместимости Л. Заде: при ро-
сте сложности системы уменьшается возможность ее точного описания вплоть до некоторого
порога, за которым точность и релевантность (смысловая связанность) информации стано-
вятся несовместимыми, взаимно исключающими характеристиками.
Поэтому значимость ЦТС трудно переоценить.
В данном проекте для решения задачи унификации (минимизации неоднозначности
толкования) терминов предлагается использовать интеллектуальную когнитивную техноло-
гию, основанную на проведении семантического анализа терминов. Эта технология является
новейшей разработкой, она показала свои преимущества и поэтому принята в данном проек-
те в качестве рабочей.

2. Назначение и цели создания ЦТС

ЦТС предназначена для интеллектуальной унификации терминов и определений, вхо-


дящих в базу информации, как хранилища семантической структуры русского языка [1], и
создаётся с целью создания единой системы ведения терминов и определений широкого
профиля.
Задачи, решаемые ЦТС для достижения заданной цели:
1) преодоления разнообразия в толкования терминов и определений, входящих в науч-
но-производственный и социальный оборот, на основе процессов их унификации;
2) создания логической структуры массива терминов и определений в соответствии с
критериями полноты, точности, достоверности, своевременности, согласованности и др.;
49
МЯГКИЕ ИЗМЕРЕНИЯ И ВЫЧИСЛЕНИЯ

3) информационной поддержки инновационных процессов в экономике России в части


оперативного предоставления пользователям унифицированных терминов и определений,
входящих в базу данных ЦТС;
4) семантического анализа терминов и определений широкого профиля [2];
5) обеспечения пользователей качественной информацией в соответствии с заданной
тематикой;
6) (в перспективе) выявление предположительной области существования новых зна-
ний на основе семантического анализа терминов и определений заданной научной инноваци-
онной тематики в интересах выявления наиболее и наименее значимых направлений иннова-
ционного развития России.

3. Краткое описание ЦТС

Объектом интеллектуальной унификации являются термины и определения, получен-


ные из сети Интернет, входящие в ЦТС и используемые в различных областях человеческой
деятельности теоретически без ограничений.
В системе предлагается выделить следующие функциональные подсистемы:
1) подсистема сбора, обработки и загрузки данных (терминов и определений), которая пред-
назначена для реализации процессов сбора данных из разных источников;
2) подсистема семантического анализа терминов и определений [3];
2) подсистема хранения данных, которая предназначена для хранения данных;
3) подсистема формирования и визуализации отчётности, которая предназначена для форми-
рования выходных данных и отчётности.
Научно-методическое обеспечение системы включает задачи анализа устойчивости рас-
пределения семантической структуры терминов и определений и выявления предположительной
области существования новых знаний в рамках заданного научного направления, которые явля-
ются неотъемлемой частью системы ЦТС, и выполняются при проведении мероприятий научно-
го характера, т.е. специально организованных научных исследований в рамках.
Ядром научно-методического обеспечения должны быть алгоритмы и методики семан-
тического анализа текстов по тематике заданного направления.

4. Семантическое ядро истинности термина

Процесс генерации термина совпадает с моментом, когда формируется его так называ-
емое семантическое ядро истинности [4]. Семантическое ядро истинности можно наблюдать
на основе анализа результатов простого опроса выбранной группы людей, где в итоге полу-
чается распределение частот повторяемости ключевых слов, выбранных опрашиваемыми в
процессе определения заданных терминов. Пример такого распределения для термина
«Деньги» в масштабе log-log приведён на рис. 1.
Первая зона образуется первыми двумя-четырьмя ключевыми словами, здесь наклон
аппроксимирующей прямой небольшой. Эти большие значения частоты встречаемости клю-
чевых слов соответствуют факту наличия семантического ядра истинности, что в конечном
итоге обеспечивает адекватность понимания термина.
А последующие точки уже образуют зону с большой величиной наклона, которая резко
уходит вниз. И в этой зоне ключевые слова встречаются реже и как бы выполняют роль
«обертонов», дополняющих основное ядро.
Семантическое ядро истинности есть по своей сути результат деятельности правого и
левого полушарий мозга человека. Величина энтропии Н, как мера неопределённости семан-
тического ядра истинности, имеет максимальное значение 0,38.
Из рисунка видно, что для распределения характерно наличие двух зон.
Всякое увеличение энтропии ядра истинности приведёт к его распаду, т.е. непонима-
нию термина. Значение максимальной энтропии 0,38 может служить точкой отсчёта, относи-
тельно которой можно измерять изменение степени семантического понимания термина.
50
№ 1 (2) − 2018 ЯНВАРЬ

4,5

3,5

2,5

1,5

0,5

0
0 1 2 3 4 5

Рис. 1. Иллюстрация ядра истинности термина «Деньги», полученная на основе данных опроса
группы студентов. По горизонтальной оси отложены ключевые слова, а по вертикальной –
частоты их повторения

Семантическое ядро истинности можно представить, как живую систему [5], в виде
двух составляющих в соответствии с формулой:

Нсемант. ядро = Нсем – Hоберт,

где: Нсемант. ядро – энтропия семантического ядра истинности термина, или, другими сло-
вами, энтропия семантического ресурса, Нсем – максимальное значение энтропии истинно-
сти термина, Ноберт – энтропия «обертонов».

Механизм понимания семантики высказываний технологически эквивалентен процессу


понимания семантики терминов, поскольку высказывание всегда включает в своём составе
термины, требующие аргументации. Это означает, что нам всё равно, идёт ли речь о понима-
нии высказывания или понимания термина, так как в основе данного механизма всегда ле-
жит семантическое ядро чувства истинности.
А если эти рассуждения по линии «термин-высказывание» пролонгировать далее на
управленческое решение, то можно и понятие семантического ядра истинности также рас-
пространить и на управленческие решения и на новые знания. Действительно, любое сгене-
рированное управленческое решение требует однозначного понимания, а без семантического
ядра истинности этого понимания мозг человека данное решение не сможет воспринять.
В целом можно заключить, что всякое умственное действие, которое сопровождает
термины, высказывания, управленческие решения, имеет в своей основе семантическое ядро
чувства истинности.
Вот поэтому в силу данного универсализма семантическое ядро истинности должно
рассматриваться в качестве функции принадлежности при решении задач когнитивного мо-
делирования экономических процессов.
Как показано в ряде исследований, функция принадлежности, заданная на семантиче-
ском ядре истинности, всегда имеет вид гауссового распределения.
Поэтому для данной функции принадлежности справедливы теоремы Гаусса-Маркова
и, как следствие, в анализе и моделировании экономических систем применимы все эконо-
метрические конструкции метода наименьших квадратов. Кроме того, семантику высказыва-

51
МЯГКИЕ ИЗМЕРЕНИЯ И ВЫЧИСЛЕНИЯ

ний можно формировать на основе использования операции простого арифметического


усреднения или обычного голосования.
Основная идея здесь состоит в том, что знания – это есть не только информация сущ-
ность, но и неотъемлемое наличие чисто человеческого чувства осознания истинности этой
информации.
Данный конструктивный подход оказывается весьма полезным и использован при фор-
мировании алгоритмов ЦТС.

5. Научная новизна и прикладная значимость предлагаемого проекта

Система ЦТС создаётся и функционирует на принципах краудсорсинга, где каждый ко-


нечный пользователь не только получает доступ к ЦТС, включающего унифицированные
термины и определения из различных областей знаний (юриспруденция, экономика, финан-
сы, технологии и т.д.), но и сам непосредственно активно участвует в формировании семан-
тики этих терминов и определений.
Данная проблема существует как внутри любой языковой системы, так и для межязы-
ковых обменов. Предлагаемая система позволяет не только оценивать, но и минимизировать
различия в толковании терминов и определений.
Новизна предлагаемого подхода состоит в том, что для унификации терминов и опре-
делений используется система анализа энтропии распределения величины разброса парамет-
ров истинности. Эта система имитирует когнитивные процессы мозговой деятельности чело-
века и основана на индуктивно-дедуктивном представлении этих процессов.
Если величина разброса мала, то это говорит о стабильности семантического ядра ис-
тинности понимания термина и здесь есть возможность минимизации этого разброса.
Если же величина разброса велика, то это может указывать на наличие процесса зарож-
дения нового термина или нового направления в толковании термина. Устранение неодно-
значности понимания термина в этом случае невозможно, но возможна минимизация этой
неоднозначности. При этом можно искусственно ускорить этот процесс и таким образом
сформировать новое толкование термина или даже на этой основе – сформировать предпола-
гаемую область возможного существования нового знания.

Литература
1. Иванус А.И. Цифровой толковый словарь терминов и определений – семантический
аспект / Сборник трудов VIII Международной конференции «ИТ-Стандарт 2017». Издатель-
ство «Проспект». – М., 2017. – С. 141–148.
2. Иванус А.И. О генерации новых знаний в экономических системах: труды / Третья
международная конференция «Управление крупномасштабными системами» (MLSD 2009)
(Москва, Россия, 5–7 октября 2009 г.). – М.: Учреждение РАН ИПУ им. В.А. Трапезникова
РАН, – 2009. Том II – С. 235–238.
3. Трусов Н.А., Башелханов И.В., Иванус А.И., Заличев Н.Н., Костиков П.А., Каратеев
А.Д., Мартынов С.В. О необходимости создания технологии семантического анализа терми-
нов в интересах задач управления / Хроноэкономика. – 2017. – № 3(5). – 2017. – С. 5–11.
4. Иванус А.И. О ключевой роли истинности в технологии генерации новых знаний по-
лушариями головного мозга / Хроноэкономика. – 2017. – № 2(4). – С. 13–24.
5. Иванус А.И. Об использовании принципов функционирования живых систем в моде-
лировании экономических систем / Хроноэкономика, – 2017. – № 5(7). – С. 14–21.

52

Вам также может понравиться