Вы находитесь на странице: 1из 10

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение


высшего образования
«Московский авиационный институт
(национальный исследовательский университет)»

ОТЧЕТ
по лабораторной работе №4

«Реализация алгоритмов построения unsupervised моделей»

Институт №3 «Системы управления, информатика и электроэнергетика»


Кафедра 316 «Системное моделирование и автоматизированное
проектирование»

Преподаватель: Исполнитель: студент группы М3О-433Б-18


Прудников Кохановский Владислав Евгеньевич
Виталий Отметка:
Анатольевич Дата:

Москва 2021
ОГЛАВЛЕНИЕ

ОГЛАВЛЕНИЕ 2

ЗАДАНИЕ ЛАБОРАТОРНОЙ РАБОТЫ 3

ВЫПОЛНЕНИЕ ЛАБОРАТОРНОЙ РАБОТЫ 4

ЗАКЛЮЧЕНИЕ 8

ОТВЕТЫ НА ВОПРОСЫ 9
ЗАДАНИЕ ЛАБОРАТОРНОЙ РАБОТЫ

Цель работы: изучить основные принципы разработки алгоритмов data mining


строящих unsupervised модели.
Задание: реализовать алгоритм в соответствии с вариантом задания строящий
unsupervised модель.

3
ВЫПОЛНЕНИЕ ЛАБОРАТОРНОЙ РАБОТЫ

Рисунок 1 — Исходные данные в табличном виде файла weather-


nominal.arff
.

4
Рисунок 2 — Представление модели Decision Tree Mining Model

Рисунок 3 — Представление модели Decision Tree Mining Model в


результате применения алгоритма General

5
Рисунок 4 — Представление модели Decision Tree Mining Model

Рисунок 5 — Представление модели Decision Tree Mining Model в


результате применения алгоритма General

6
Рисунок 6 — Результат Decision Tree Mining Model в формате PMML

7
ЗАКЛЮЧЕНИЕ
В результате проделанной работы были изучены основные принципы
разработки алгоритмов data mining, строящих unsupervised модели и
реализован алгоритм, строящий unsupervised модель.

8
ОТВЕТЫ НА ВОПРОСЫ
1. Что такое unsupervised модели?
Обучение без учителя — технология машинного обучения, в которой для
коррекции параметров обучаемой модели не используется целевая функция.
Иными словами, в обучающих примерах при обучении без учителя не нужно
иметь заранее заданные выходы модели.
В алгоритмах обучения без учителя выходная ошибка модели на
обучающем множестве не вычисляется. Вместо неё используется информация
о текущем состоянии параметров модели и примеров обучающего множества.
Например, это может быть Евклидово расстояние между вектором признаков
примера и вектором весов нейрона, которое и будет управлять коррекцией
параметров модели в ходе обучения.
Основное применение обучения без учителя — построение моделей для
кластеризации. Поскольку кластерная структура данных заранее неизвестна, а
определяется в процессе обучения модели, использовать какие-либо целевые
значения невозможно.

2. Что такое описательные модели?


Описательные модели (дескриптивные, познавательные) предназначены
для описания свойств или поведения реальных (существующих) объектов. Они
являются формой представления знаний о действительности.
Описательные модели позволяют представить систему управления
качеством во всех подробностях и в этом их большое преимущество. В то же
время на их основе очень трудно наглядно представить общую структуру,
увидеть основные элементы, схему прямых и обратных связей между ними.
Такого рода затруднения остро ощущаются при проектировании систем
качества, их внедрении и сертификации.

9
3. Какие модели относятся к типу unsupervised?
● Метод ближайших соседей (k-means)
● Графовые алгоритмы кластеризации
● Нейронная сеть Кохонена
● Автоассоциатор
● Статистические алгоритмы кластеризации
● Иерархическая кластеризацияилитаксономия
● Глубокая сеть доверия

4. В чем идея алгоритма KMeans?


Метод k-средних (англ. k-means) — наиболее популярный метод
кластеризации. Был изобретён в 1950-х годах математиком Гуго Штейнгаузоми
почти одновременно Стюартом Ллойдом. Особую популярность приобрёл
после работы Маккуина.

5. Какие существуют дивизимные алгоритмы


Дивизимный алгоритм. Дивизимный алгоритм иерархической
классификации начинает свою работу с формирования единственного класса,
содержащего все ОТЕ, и проводит в общем случае I=N- 1 итерацию. На каждом
шаге алгоритма происходит последовательное разделение одного из классов
на два таким образом, чтобы качество получаемой классификации было
максимальным. Последний шаг работы алгоритма делит единственный
оставшийся нерасчлененный класс, состоящий из двух ОТЕ, на два класса (по
одной ОТЕ в каждом).

10

Вам также может понравиться