Вы находитесь на странице: 1из 21

Национальный исследовательский ядерный университет «МИФИ»

Введение в семантический анализ данных

Лекция №1

Лектор: Зайцев В.С.


Контакты

ФИО: Зайцев Владислав Сергеевич


e-mail: zvsmephi@gmail.com
Telegram: @v_zaytsev

16.03.2023 НИЯУ МИФИ 2


План работы
• 8 лекций (на самом деле 7)
• 8 семинаров
• БДЗ (задание будет выслано после 1 семинара) – 2 части:
- 1 часть: на 8 неделе
- 2 часть: на 16 неделе
• Зачётная неделя: аттестация по результатам БДЗ (основной вклад) +
работа на семинарах + посещаемость (чуть-чуть).
• Январь - экзамен

16.03.2023 НИЯУ МИФИ 3


Предметная область
Назначение информационной системы – удовлетворение
информационных нужд одного или многих пользователей: сбор,
записывание, обработка и распределение тех объектов данных, которые
связаны с определенной частью реальности.
Предметная область - особым образом выделенный и описанный
фрагмент внешнего мира.

Неформально:
ПО – выделенная часть реального или воображаемого мира, которая нас
интересует по каким-то причинам.
ОПО – представление ПО в некой языковой реальности.

16.03.2023 НИЯУ МИФИ 4


Модели предметных областей
Условно, модели можно классифицировать следующим
образом:
1. Когнитивные модели (связаны с восприятием человеком)
2. Имитационные (нацелены на воспроизведение поведения и
свойств объектов в динамике)
3. Аналитические (опираются на определённый раздел
математики)
4. Задачно-ориентированные (нацелены на решение
определенного круга задач, при этом могут использоваться
различные по своему характеру методы)

16.03.2023 НИЯУ МИФИ 5


Когнитивные модели
Среди когнитивных моделей в основном, рассматриваются следующие:
1. Концептуальные (основаны на понятиях и связях между ними).
2. Процессные (основаны на процессах, действиях и связях между ними).
3. Событийно-ориентированные (основаны на событиях и состояниях,
которые после них возникают).

16.03.2023 НИЯУ МИФИ 6


ER-диаграмма

16.03.2023 НИЯУ МИФИ 7


Диаграмма классов (UML)

16.03.2023 НИЯУ МИФИ 8


Начало анализа

Предметная область

С чего начать?

16.03.2023 НИЯУ МИФИ 9


Системный анализ и проектирование
Задача превращения воспринимаемой реальности в
(концептуальную) схему БД является задачей системного
анализа и проектирования.
Наиболее важные вопросы связаны со следующими
процессами, направленными на решение этой задачи:
• Именование
• Отбор
• Классификация

16.03.2023 НИЯУ МИФИ 10


Гипотеза о возможности моделирования предметной области
1) Выделение объектов: в предметной области можно выделить объекты,
атомарные на момент выделения.

2) Установление отношений: между объектами можно установить отношения,


определяемые на множестве всех объектов.

2’) Установление отношений: между объектами можно установить отношения,


которые в свою очередь могут считаться объектами и участвовать в других
отношениях, определяемых на множестве всех объектов.
Отношение R, определенное на множествах D1, D2, … Dn – подмножество
{D1 x D2 x … x Dn} = {(d1, d2, …, dn)| d1 D1, d2 D2, … , dn Dn }
D1 = (1, 2, 3), D2= (a, b, c), D1 x D2 = {(1, a), (1, b), (1,c), (2, a), (2, b), (2, c), (3, a), (3, b),
(3, c)}
16.03.2023 НИЯУ МИФИ 11
Присваивание имён
1) Каждый элемент из множества элементов отображенной предметной области
получает произвольное имя (каждое отдельно взятое имя присваивается только
одному элементу).
2) Каждому отношению отображенной предметной области присваивается
произвольное имя (и это имя – единственное для данного отношения среди
множества отношений).

1`) Каждый элемент множества получает имя.


2`) Каждая выборка в отношении поименована (можно считать, что имя выборки
составляется из имени отношения и имен элементов, участвующих в данной
выборке).

16.03.2023 НИЯУ МИФИ 12


Пример
Пусть в предметной области имеется следующее множество объектов:
{ ч1, ч2, ч3, ч4, ч5, г1, г2, a1, a2, a4, a4 }
ai – места
чi – люди
гi – города
и отношений между ними:
{ (а1, ч3), (а2, ч4), (а3, ч1), (а4, ч2) } ли («посещают»),
{ (ч1, ч2), (ч1, ч3), (ч4, ч5) } ма («быть матерью»),
{ (ч3, ч5) } па («быть отцом»),
{ (ч3, ч4) } ро («состоять в родстве»),
{ (ч3, г2), (ч4, г2) } бы («быть проездом»)
{ (ч1, г1), (ч1, г2) } жи («жить»)

16.03.2023 НИЯУ МИФИ 13


Отображённая проименованная предметная область

16.03.2023 НИЯУ МИФИ 14


Пространство выбора решений
Отбор: исключим из рассмотрения элементы а1, а2, а3, а4 и отношения { (ч3, г2), (ч4, г2) } бы и { (ч1,
г1), (ч1, г2) } жи.

16.03.2023 НИЯУ МИФИ 15


Отбор

Предметная область

A
A

16.03.2023 НИЯУ МИФИ 16


Отображённая проименованная проклассифицированная предметная
область
Отбор: исключим из рассмотрения элементы а1, а2, а3, а4 и отношения { (ч3, г2), (ч4, г2) } бы и { (ч1,
г1), (ч1, г2) } жи.

16.03.2023 НИЯУ МИФИ 17


Классификация
Введём следующие классы:
• Люди ({ч1, ч2, ч3, ч4, ч5})
• Города ({г1, г2 })
а также отношение «Быть в родстве»:
• ({(Люди, Люди)}) ро

16.03.2023 НИЯУ МИФИ 18


Проклассифицированная предметная область (ПВР)

16.03.2023 НИЯУ МИФИ 19


Схема ПВР
Начав с предметной области и выполнив 4 процесса: отображение, присвоение имён мы
получили представление ПО, которые называется «пространством выбора решений» (схема
ПВР).

Основной принцип фиксации соотнесения предметной области в рамках некоторого


формального языка: семантический аспект базы объектов данных выделяется и
фиксируется в описании соотнесения предметной области, сохраняющем соответствие
реальных объектов данных из предметной области и идеализированных объектов данных,
возникающих посредством этого описания.
16.03.2023 НИЯУ МИФИ 20
Спасибо за внимание!

Вам также может понравиться