Вы находитесь на странице: 1из 31

Классификация и

кодирование
Система классификации

Классификация объектов — это процедура группировки на


качественном уровне, направленная на выделение
однородных свойст.

Под объектом понимается любой предмет, процесс, явление


материального или нематериального свойства.

Классификация — это система распределения объектов


(предметов, явлений, процессов, понятий) по классам в
соответствии с определенным признаком.
Система классификации

Пример. Всю информацию об университете можно классифицировать по


многочисленным информационным объектам, которые будут характеризоваться
общими свойствами:

• информация о студентах — в виде информационного объекта «Студент»;

• информация о преподавателях — в виде информационного объекта


«Преподаватель»;

• информация о факультетах — в виде информационного объекта


«Факультет» и т. п.
Система классификации

Свойства информационного объекта определяются информационными


параметрами, называемыми реквизитами. Реквизиты представляются либо
числовыми данными (например, вес, стоимость, год), либо признаками
(например, цвет, марка машины, фамилия).

Реквизит – это логически неделимый информационный


элемент, описывающий определенное свойство объекта, процесса, явления.

Пример. Информация о каждом студенте в отделе кадров университета


представлена посредством одинаковых реквизитов:
фамилия, имя, отчество;
пол;
год рождения;
место рождения;
адрес проживания;
факультет, где проходит обучение студент, и т. д.
www.themegallery.com Company Logo
Система классификации
В любой стране разработаны и применяются государственные, отраслевые и
региональные классификаторы.
Например: классифицированы отрасли промышленности, оборудование,
профессии, единицы измерения, статьи затрат и т. д.
Классификатор — это систематизированный свод наименований и кодов
классификационных группировок.

При классификации широко используются понятия «классификационный при-


знак» и «значение классификационного признака», которые позволяют установить
степень сходства или различия объектов. Возможен подход к классификации с
объединением этих двух понятий в одно, названное признаком классификации.

Пример признака классификации: возраст. Для учащихся ВУЗа состоит из трех


значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.
www.themegallery.com Company Logo
Методы классификации объектов

Разработаны три метода классификации объектов:

иерархический,

фасетный,

дескрипторный.

www.themegallery.com Company Logo


Методы классификации объектов
Иерархическая система классификации
0-й уровень

1-й уровень

2-й

3-й

□ исходное множество элементов составляет 0-й уровень и делится в


зависимости от выбранного классификационного признака на классы
(группировки), которые образуют 1-й уровень;
□ каждый класс 1-го уровня в соответствии с характерным
классификационным признаком делится на подклассы, которые
образуют 2-й уровень;
□ каждый класс 2-го уровня аналогично делится на группы, которые
www.themegallery.com Company Logo
образуют 3-й уровень, и т. д.
Методы классификации объектов
Иерархическая система классификации

Количество уровней классификации, соответствующее числу признаков, вы-


бранных в качестве основания деления, характеризует глубину классификации.

Достоинства иерархической системы классификации:

– простота построения;

– использование независимых классификационных признаков в различных вет-


вях иерархической структуры.

Недостатки иерархической системы классификации:

– жесткая структура, которая приводит к сложности внесения изменений, так


как приходится перераспределять все классификационные группировки;

– невозможность группировать объекты по заранее непредусмотренным сочета-


ниям признаков.

www.themegallery.com Company Logo


Методы классификации объектов
Иерархическая система классификации

Пример. Создать иерархическую систему классификации для информационного


объекта «Факультет», которая позволила бы классифицировать информацию обо всех
студентах по следующим классификационным признакам: факультет, на котором
учится студент, возрастной состав студентов, пол студента, для женщин — наличие
детей.

www.themegallery.com Company Logo


Методы классификации объектов
Фасетная система классификации

Фасетная система классификации в отличие от иерархической позволяет выбирать


признаки классификации независимо как друг от друга, так и от семантического
содержания классифицируемого объекта. Признаки классификации называются
фасетами (facet — рамка).

Пример.

Фасет цвет содержит значения: красный, белый, зеленый, черный, желтый.

Фасет специальность содержит названия специальностей.

Фасет образование содержит значения: среднее, среднее специальное, высшее.

www.themegallery.com Company Logo


Методы классификации объектов
Фасетная система классификации

При построении фасетной системы классификации необходимо,


чтобы значение используемые в различных фасетах, не повторялись.
Фасетную систему легко модифицировать, внося изменения в конкретные
значения любого фасета.
www.themegallery.com Company Logo
Методы классификации объектов
Фасетная система классификации

Достоинства фасетной системы классификации:

– возможность достижения большой емкости классификации, то есть


использования большого количества признаков классификации и их значений для
создания группировок;
– возможность простой модификации всей системы классификации без
изменения структуры существующих группировок.

Недостаток фасетной системы классификации:


- сложность ее построения, так как необходимо учитывать все многообразие
классификационных признаков.

www.themegallery.com Company Logo


Методы классификации объектов
Фасетная система классификации

Название факультета Возраст Пол Дети

ФСГН До 20 лет М Есть

ФЕИН 20-30 лет Ж Нет


Свыше 30
ИСАУ
лет
ИФИ

www.themegallery.com Company Logo


Методы классификации объектов
Дескрипторная система классификации

Для организации поиска информации, для ведения тезаурусов (словарей)


эффективно используется дескрипторная (описательная) система классификации,
язык которой приближается к естественному языку описания информационных
объектов. Особенно широко она применяется в библиотечной системе поиска.

Суть дескрипторного метода классификации:


1. Отбирается совокупность ключевых слов или словосочетаний, описывающих
определенную предметную область или совокупность однородных объектов. Причем среди
ключевых слов могут быть синонимы.
2. Выбранные ключевые слова и словосочетания подвергаются нормализации, из
совокупности синонимов выбирается один или несколько наиболее употребимых.
3. Создается словарь дескрипторов, то есть словарь ключевых слов и словосочетания
отобранных в результате процедуры нормализации.
www.themegallery.com Company Logo
Методы классификации объектов
Дескрипторная система классификации

Пример. В качестве объекта классификации рассмотрим успеваемость студентов.


Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель,
студент, семестр, название предмета.

После нормализации: синонимов нет. Это и есть словарь дескрипторов


«успеваемость студентов».

Пример. В качестве предметной области выбираем учебную деятельность в


высшем учебном заведении. Ключевыми словами могут быть выбраны: студент,
обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент,
профессор, коллега, факультет, подразделение университета, аудитория, комната,
лекция, практическое занятие, занятие и т. д.

После нормализации словарь дескрипторов будет состоять из следующих


слов:……
Что можно оставить, а что убрать, как синонимы?
www.themegallery.com Company Logo
Методы классификации объектов
Дескрипторная система классификации

Между дескрипторами устанавливаются связи, которые позволяют расширить


область поиска информации. Связи могут быть трех видов:
синонимические связи указывают некоторую совокупность ключевых слов как
шов;
родово-видовые связи отражают включение некоторого класса объектов в более
представительный класс;
ассоциативные связи соединяют дескрипторы, обладающие общими
свойствами.

Пример:

Синонимическая связь: студент — учащийся — обучаемый.

Родо-видовая связь:
www.themegallery.com университет — факультет — кафедра. Company Logo
Классификация информации по разным
признакам

Информация

По месту По стадии По способу По функции


По стабильности
возникновения обработки отображения управления

Входная Переменная Первичная Текстовая Плановая


Нормативно-
Выходная Постоянная Вторичная Графическая
справочная

Внутренняя Промежуточная Учетная

Внешняя Результатная Оперативная

www.themegallery.com Company Logo


Кодирование информации

Система кодирования – совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов.


Код характеризуется длиной и структурой:

длина — число позиций в коде;

структура — порядок расположения в коде символов, используемых для обо-


значения классификационного признака.

Процедура присвоения объекту кодового обозначения называется


кодированием.
Декодирование — это получение исходных символов по кодам символов.

www.themegallery.com Company Logo


Мальчик заменил каждую букву своего имени ее
номером в алфавите.
Получилось

12 16 15 19 20 1 15 20 10 15

Как зовут мальчика?


Расшифруйте при помощи азбуки Морзе

– – /. –/ …. / . – ./ – – – /…/ – . – –/ . – – –/ – . –/ . – . . / – – – / –
Цели кодирования

• экономность, т.е. уменьшение избыточности сообщения;


• повышение скорости передачи или обработки;
• надежность, т.е. защита от случайных искажений;
• сохранность, т.е. защита от случайного доступа к информации;
• удобство физической реализации (например, двоичное кодирование
информации в ЭВМ);
• удобство восприятия.

www.themegallery.com Company Logo


Виды кодирования

Кодирование по образцу — каждый знак дискретного сигнала представляется


знаком или набором знаков того алфавита, в котором выполняется кодирование.
Кодирование по образцу используется, например, для ввода информации в
компьютер с целью ее внутреннего представления.

Пример. Для перевода символов, вводимых с клавиатуры, в числовой код, хра-


нящийся в памяти компьютера, используется кодовая таблица ASCII (American
Standard Code for Information Interchange — американский стандартный код для
обмена информацией), в которой каждому символу алфавита, а также множеству
специальных управляющих команд соответствует числовой код.

www.themegallery.com Company Logo


Виды кодирования

Криптографическое кодирование, или шифрование, используется тогда, когда


нужно защитить информацию от несанкционированного доступа.

Способы криптографического кодирования:

симметричное кодирование с закрытым ключом - для кодирования и


декодирования данных применяется один и тот же ключ. Этот ключ должен быть
по безопасным каналам доставлен стороне, осуществляющей декодирование, что
делает шифрование с симметричным ключом уязвимым.

асимметричное кодирование с открытым ключом - сторона, осуществляющая


декодирование, публикует так называемый открытый ключ (public key), который
применяется для кодирования сообщений, а декодирование осуществляется другим
— закрытым ключом (private key), известным только принимающей стороне. Такая
схема делает асимметричный способ кодирования высоконадежным. По этой
причине он приобрел массовую популярность.

www.themegallery.com Company Logo


Виды кодирования

www.themegallery.com Company Logo


Методы, используемые в системе
кодирования

классификационная система кодирования ориентирована на предварительную


классификацию объектов на основе либо иерархической, либо фасетной системы;

регистрационная система кодирования предварительной классификации объ-


ектов не требует.

Система кодирования

Классификационная Регистрационная

Последовательная Параллельная Порядковая Серийно-


(для иерархической (для фасетной порядковая
классификации) классификации)

www.themegallery.com Company Logo


Классификационное кодирования

Классификационное кодирование применяется после проведения классифика-


ции объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классифика-


ционной структуры. Суть метода заключается в следующем: сначала записывается
код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем
код группировки 3-го уровня и т. д. В результате получается кодовая комбинация,
каждый разряд которой содержит информацию о специфике выделенной группы на
каждом уровне иерархической структуры. Последовательная система кодирования
обладает теми же достоинствами и недостатками, что и иерархическая система
классификации.
Классификационное кодирования
Пример последовательного кодирования

В общем виде код можно записать как ХХХХ, где X — значение десятичного разряда. Рассмотрим
структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для классификационного признака «название факультета» и имеет
следующие значения: 1 — ФСГН; 2 — ФЕИН; 3 — ИСАУ, 4 — ИФИ.
2-й разряд выделен для классификационного признака «возраст» и имеет следующие значения: 1 — до
20 лет; 2 — от 20 до 30 лет; 3 — свыше 30 лет;
3-й разряд выделен для классификационного признака «пол» и имеет следующие значения: 1 —
мужчины; 2 — женщины;
4-й разряд выделен для классификационного признака «наличие детей у женщин» и имеет следующие
значения: 1 — есть дети, 2 — нет детей; 0 выделяется для мужчин, так как для них подобной информации не
требуется.
Декодировать коды: 1221, 2110.
Классификационное кодирования

Параллельное кодирование
используется для фасетной системы классификации. Суть метода
заключается в следующем: все фасеты кодируются независимо друг от друга; для
значений каждого фасета выделяется определенное количество разрядов кода.
Параллельная система кодирования обладает теми же достоинствами и
недостатками, что и фасетная система классификации.
Классификационное кодирования
Пример параллельного кодирования

Название
факультета Возраст Пол Дети
ФСГН До 20 лет М Есть
ФЕИН 20-30 лет Ж Нет
ИСАУ Свыше 30 лет

ФЭУ
1-й (старший) разряд выделен для фасета «пол» и имеет следующие значения: 1 — мужчины; 2 —
женщины;
2-й разряд выделен для фасета «наличие детей у женщин» и имеет следующие значения: 1 — есть дети,
2 — нет детей; 0 выделяется для мужчин, так как для них подобной информации не требуется;
3-й разряд выделен для фасета «возраст» и имеет следующие значения: 1 — до 20 лет; 2 — от 20 до 30
лет; 3 — свыше 30 лет;
4-й разряд выделен для фасета «название факультета» и имеет следующие значения: 1 — ФСГН, 2 —
ФЕИН, 3 — ИСАУ, 4 — ФЭУ и т. д.

Декодировать коды: 2213, 1021


Регистрационное кодирования

Используется для однозначной идентификации объектов и не требует предварительной


классификации объектов. Различают порядковую и серийно-порядковую систему.
Порядковая система кодирования предполагает последовательную нумерацию объектов
числами натурального ряда. Этот порядок может быть случайным или определяться после
предварительного упорядочения объектов, например, по алфавиту. Этот метод применяется в
том случае, когда количество объектов невелико, например, при кодировании названий
факультетов университета или студентов в учебной группе.
Серийно-порядковая система кодирования предусматривает предварительное выделение
групп объектов, которые составляют серию, затем в каждой серии производится порядковая
нумерация объектов. Каждая серия, в свою очередь, тоже получает порядковую нумерацию. По
своей сути серийно-порядковая система является смешанной: классифицирующей и
идентифицирующей. Применяется она тогда, когда количество групп невелико.
Пример. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии
— серии), для которых используется порядковая нумерация.
Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому
студенту присваивается номер.

Вам также может понравиться