Вы находитесь на странице: 1из 15

Міністерство освіти і науки України

Державний університет телекомунікацій


Кафедра інформаційної та кібернетичної безпеки

Реферат з дисципліни теорія ризиків на тему:


«Метод дерева рішень»

Перевірив: Виконав:
Запорожченко М.М. студент групи БСД-31
Колесник В.Д.
2

КИЇВ — 2019
3

СОДЕРЖАНИЕ

ВСТУПЛЕНИЕ................................................................................................3

ТЕОРИЯ...........................................................................................................4

ПРИМЕР...........................................................................................................7

ДОСТОИНСТВА И НЕ СОВСЕМ.................................................................8

УНИКАЛЬНЫЙ АЛГОРИТМ СОЗДАНИЯ.................................................9

ВЫВОДЫ.......................................................................................................11
4

ВСТУПЛЕНИЕ
В общем случае для количественной оценки риска и его анализа
прибегают к наиболее популярным методам: статистический, аналитический,
экспертных оценок, нормативный, критических значений и среди кучи
остальных выделяется метод «дерева решений». Разумеется, каждый метод
используется точечно в конкретных случаях, однако я нахожу дерево решений
наиболее гибким, и в основном от того, что единственным недостатком такой
системы есть трудность её реализации для простых смертных.
Это прекрасный способ выбрать стратегию действий в условиях риска,
ведь продуманный план помогает проанализировать ситуацию. Нужда в таком
подходе возникает, когда появляется цепочка решений, вытекающих одно из
другого, которые соответствуют событиям, происходящим с некоторой
известной или заданной вероятностью.
Однако, стоит помнить, что это подход скорее не к риску, а к любой
задаче, также ограничивая понимание риска простой задачей/вопросом.
5

ТЕОРИЯ
Существует много трактовок, я попробую собрать все в цельный термин.
Дерево решений (регрессии, классификации) – модель
систематического подхода к автоматизации и метаструктурированию
метаданных под предопределенным фокусом. Это практическая реализация
принципа «Разделяй и властвуй».
Используют везде – банки, медицина, молекулярная биология,
метафизика, квантовая механика, математический анализ, логика, философия,
теология, любая промышленность, машинное обучение, статистика, Big Data...
Структура высшего уровня абстракции:
 Корень – данные, подлежащие классификации, собирает
результат обработки всех листьев (по принципу, что листья
падают на землю и входят в почву, которой питаются корни)
 Ствол – основа всего, главный вопрос, целевая функция, ведущий
объект
 Ветви – стрелочки, развилки, с несколькими вариантами ответа,
атрибуты, от которых зависит целевая функция
 Листья – события, к которым приведет выбранный ответ,
значения целевой функции, результаты
 Всё, что тут – атрибуты для различия случаев, которые даже не
являются элементом древа, это больше качели, что на нем висят
Цель состоит в том, чтобы создать модель, которая предсказывает
значение целевой переменной на основе нескольких переменных на входе.
В интеллектуальном анализе данных, деревья решений могут быть
использованы в качестве математических и вычислительных методов, чтобы
помочь описать, классифицировать и обобщить набор данных, которые могут
быть записаны следующим образом:
Зависимая переменная Y
является целевой переменной, которую необходимо проанализировать,
6

классифицировать и обобщить. Вектор x состоит из входных


переменных x1, x2, x3 и т. д., которые используются для выполнения этой
задачи.
Этот метод суть логика, потому что во благо ему можно
структурировать совершенно любой хаос (вспоминая тест Равена). Важно
понимать разграничение уровней абстрагирования. Некоторые части древа не
нуждаются в анализе и трактовании, за счет чего они могут восприниматься
просто как отдельные функции. Припоминая факт того, что дерево работает на
грубой логике, функции дают или «да» или «нет», следовательно их
внутреннюю структуру рассматривать нет смысла. И вопрос абстракции
неудивительно… абстрактен. Эту проблему легче объяснить на примере.
Существует парадокс лжеца. Классический его вариан: «Я лгу», или
«Данное утверждение ложно». Если предположить, что утверждение истинно,
то, поскольку оно гласит свою ложность, оно ложно, что является
противоречием. Напротив, если предположить его ложность, то оно
соответствует тому, что само гласит, а потому истинно, что также является
противоречием. Суть парадокса — самореференция, то есть указание
предложения на самого себя.
Однако, он разрешается очень просто, благодаря понятию «метаязык» и
лестнице абстракций.
Первым уровнем (обычным языком) этой лестницы являются
утверждения об объектах, например: «У Земли есть спутник». В языке низшей
ступени нет понятий «ложь» и «истина». Такие понятия, как оценка
истинности утверждений об объектах, являются привилегией метаязыка —
следующей ступеньки лестницы. Таким образом предложение «Утверждение
„снег белый“ истинно» имеет смысл в метаязыке. Однако о его истинности
можно говорить лишь в следующей надстройке — метаметаязыке. При этом
метаязык является объектным языком для этой следующей ступени. Можно
построить метаязык, для которого метаязык будет объектным и т. д.
Другой пример лестницы утверждений и метаязыков:
7

1. Сумма внутренних углов любого треугольника равна 180°


2. Утверждение 1 истинно.
3. Утверждение 2 истинно.
4. Утверждение 3 истинно.
Здесь первое утверждение написано на языке первого уровня, который
позволяет формулировать теоремы планиметрии. Языком второго уровня
(фраза № 2) пользуются при доказательстве теорем. Метаметаязык, которому
принадлежит третье утверждение, — это язык, на котором написаны книги
о теории доказательств. А если идти ещё дальше – теория типов, теория
моделей, теория систем, суть логики (не как отрасли науки, а как сущность),
металогика, математика, метаматематика… а дальше и я уже не знаю.
Основываясь на данном примере, когда мы определяем проблему,
объект древа или его элемент – нам нужно четко понимать, насколько сильно
нам нужно обобщить суть понятия, насколько надо усомниться в его
истинности, насколько надо абстрагироваться от вторичных факторов, что
влияют на этот элемент. Именно вот это правильное абстрагирование, иными
словами, оптимизация и упрощение, является путем к созданию идеальной
системы.
Причем в качестве объекта может выступать совершенно всё, даже
конкретная операция или действие: опись, представление, сравнение, выборка,
сама классификация, группы всего выше, отдельные регрессии, стратегии, цепи
событий, люди, техника, природа, любые силы в принципе.
При таком широком и философском подходе простой метод анализа
данных становится универсальным, гибридным инструментом структуризации
совершенно любого хаоса (я работаю над одним проектом, который
доказывает, что все наши нейронные связи, бессознательные ассоциации и
даже осознанные реакции на внешние и внутренние раздражители – построены
по принципу этого древа решений).
8

ПРИМЕР

Можно
было выбрать и
другой путь. Но
если принять
во внимание,
что Дерево
принятия решений

предполагает, что будут проанализированы все варианты движения и


спрогнозированы результаты – то это дерево неправильное, неполноценное,
однако же – лишенное недостатка «сложности конструкции», так как судит об
актуальных вариантах в моменте, ведь на нашем уровне представления – нам не
нужно в этом контексте представлять вообще все варианты. Это и есть
«абстрагирование».
9

ДОСТОИНСТВА И НЕ СОВСЕМ
При условии, что дерево составлено правильно, данный метод:
 Прост в понимании и интерпретации
 Не требует подготовки данных
 Работает с категориальными/интервальными переменными.
 Использует модель «белого ящика». Если ситуация наблюдается в
модели, то её можно объяснить при помощи булевой логики. Примером
«черного ящика» может быть искусственная нейронная сеть, так как результаты
данной модели поддаются объяснению с трудом
 Позволяет оценить надежность при помощи статистических тестов.
 Хорошо работает даже, если нарушены изначальные
предположения
 Позволяет работать с любым объёмом информации
 Это одномерная схема наглядных причинно-следственных связей
 Рассматривает нетипичные ситуации и сразу их решение
 Сбрасывает с нас бремя законов следствия (по типу закона Мёрфи)
 Прост в использовании
 Даёт возможность работать коллективом
 Дерево решений не ограничено во временных рамках
 Подходит для совершенно любых задач
И не совсем плохое, но:
 В процессе построения дерева решений могут создаваться слишком
сложные конструкции, которые недостаточно полно представляют данные.
Однако, эта проблема решается через абстрагирование.
 Фактическая логическая трудность выражения объектов
зависимостей в виде чисел (человек в виде числа), нужда в очень
нестандартном мышлении и понимании работы логических парадоксов.
10

Потому что далеко не всегда связь между явлениями должна быть логической.
Система, которая не ограничена логическими законами, которая умеет
связывать логику и её отсутствие является идеальной.
УНИКАЛЬНЫЙ АЛГОРИТМ СОЗДАНИЯ
Этапы формирования:
 Определение задачи/цели
 Определение вектора абстрагирования (упрощение/усложнение)
 Определение среды и инструментов визуализации
 Выбор типа структуры (глубину уточнений, уровень абстракции)
 Сбор информации
 Структуризация, классификация по возможности
 Опись каждого объекта, добавление всех зависимых атрибутов, их
качественное/количественное выражение
 Выбор параметров, ко которым будет производиться разбиение
древа на разные части (атрибут разбиения)
 Подготовка необходимых логических, статистических,
математических, любых методов обработки данных1
 Выборка необходимых операций2
 Заполнение «от большего к меньшему»
Так же можно добавить условия, логические функции, отдельные
деревья могут выполнять конкретную задачу, из нескольких деревьев можно
создать… логический аналогово-логический элемент, который, как ни
странно, будет сам обрабатывать данные и, как пример, «предсказывать»
необходимые результаты. А так как это всё основано зачастую на «да» и

1
Выражения человека в виде числа, как параметра/фактора. Понятие энтропии (мера
неупорядоченности). Измерение частотных зависимостей в древе я выполняю своими методами. Эти «меры»,
которые мы пытаемся выразить математически в некоторых работах упоминаются, как «критерии», и на
таковые приводится множество формул, но в своей совокупности, зачастую, не применимы в индивидуальном
случае, они больше показывают общий подход, нежели прикладной пример
2
Можно добавлять такие штуки, как критерий остановки – условие, по которому древо или его часть
перестает обрабатывать информацию. Например: все данные узла принадлежат одному и тому же классу; когда
не осталось признаков, по которым можно построить новое разбиение
11

«нет», то предсказывание будет иметь истинность, вне зависимости от


переменных. Мало того, можно сделать так, чтобы дерево само себя
сокращало.
ВЫВОДЫ
Это идеальная система, идеальная модель структуризации,
прогнозирования, анализа, расчёта, описи, классификации, да чего угодно,
которая может быть реализована кем угодно и за минимальные сроки. Качество
работы системы предопределено общим набором опыта исполнителя, включая
в себя понимание проблемы и цели создания такой системы. Нет метода,
который подходит к решению вообще всех проблем так, как это делает самая
очевидная структура. Причем стоит помнить, что «древо» — это просто
удобное название, приятная ассоциация, ведь в сути вещей это выглядит просто
как графы, а ещё глубже – простейшие метасвязи между любыми сущностями.
А единственная проблема данного метода решается простым
человеческим понимаем слов, которые он же и говорит.
12

Литература:
1. Тарасюк Н.М. Способи моделювання управлінських рішень
[Електронний ресурс] / Тарасюк Наталія Михайлівна //
ВНТУ. – 2012. – Випуск 1. – Режим доступу: 
http://tarasyukn.vk.vntu.edu.ua/file/1/19d4cb5553813f0696e76e233c1b
7e19.pdf
2. Тарасюк Н.М. Методичні вказівки до самостійної роботи
студентів з вивчення дисципліни «Менеджмент та маркетинг» для
студентів технічних спеціальностей / Уклад. О. Г. Ратушняк,
Н. М. Тарасюк // ВНТУ. – 2014. – Випуск 1. – Режим доступу: 
http://tarasyukn.vk.vntu.edu.ua/file/1/19d4cb5553813f0696e76e233c1b
7e19.pdf
3. Методичні вказівки до проведення практичних занять з
дисципліни «Виробничий менеджмент» для здобувачів вищої
освіти другого (магістерського) рівня з технічних спеціальностей /
Укл. Кучер М.М. – Кам'янське: ДДТУ, 2017. – 54 с.
4. Hovland, C. I. (1960). Computer simulation of thinking. American
Psychologist, 15(11), 687-693.
5. Hunt, Earl B.; Janet Marin; Philip J. Stone (1966). Experiments in
Induction. New York: Academic Press. ISBN 978-0-12-362350-8.
6. Quinlan, J. R. (1986). Induction of decision trees. Machine Learning,
1(1):81-106.
7. Quinlan, J. Ross. C4.5: Programs for Machine learning. Morgan
Kaufmann Publishers 1993.
8. Breiman, Leo, J. Friedman, R. Olshen, and C. Stone. Classification and
Regression Trees. Wadsworth, Belmont, CA, 1984.
13

9. Murthy, S. Automatic construction of decision trees from data: A


Multi-disciplinary survey.1997.
10.Buntine, W. A theory of classification rules. 1992.
11.Machine Learning, Neural and Statistical Classification. Editors D.
Mitchie et.al. 1994.
12.Шеннон, К. Работы по теории информации и кибернетике. М.
Иностранная литература, 1963.
13.Айвазян С. А., Мхитарян В. С Прикладная статистика и основы
эконометрики, М. Юнити, 1998.
14.Brett Lantz. Machine Learning with R. Packt Publishing, Birmingham -
Mumbai, 2013.
15.Шитиков В. К., Мастицкий С. Э. (2017) Классификация, регрессия,
алгоритмы Data Mining с использованием R. - Электронная книга,
адрес доступа: https://github.com/ranalytics/data-mining
16.Программная реализация метода деревьев решений для решения
задач классификации и прогнозирования / Зайцева Т.В., Васина
Н.В., Пусная О.П., Смородина Н.Н.
17.Литвин А.В., 2015, Розробка дерев рішень для прогнозування
фінансової кризи в страхових компаніях України
18.A comparison of neural network, statistical methods, and variable
choice for life insurers’ financial distress prediction / P. Brockett, L.
Golden, J. Jang, Ch. Yang // The Journal of Risk and Insurance. – 2006.
– № 73 (3). – P. 397–419.
19.Insolvency prediction model using artificial neural network for
Malaysian general insurers / N. Chiet, S. Jaaman, N. Ismail, S.
Shamsuddin // Proceedings of IEEE World congress on Nature and
Biologically Inspired Computing (NaBIC), Coimbatore, India. – 2009.
– P. 584–589.
14

20.Kleffner A. An examination of property & casualty insurer solvency in


Canada / A. Kleffner, R. Lee // Journal of Insurance Issues. – 2009. –
№ 32 (1). – P. 52–77.
21.Kotsiantis S. Decision trees: a recent overview / S. Kotsiantis //
Artificial Intelligence Review. – 2013. – № 39 (4). – P. 261–283.
22.Lee S. Analysis and prediction of insolvency in the propertyliability
insurance industry: a comparison of logit and hazard models / S. Lee, J.
Urrutia // The Journal of Risk and Insurance. – 2006. – № 63 (1). – P.
121–130.
23.Predicting financial distress and corporate failure: a review from the
state-of-the-art definitions, modeling, sampling, and featuring
approaches / J. Sun, H. Li, Q.-H. Huang, K.-Y. He // Knowledge-Based
Systems. – 2014. – № 57. – P. 41–56.
24.Sharpe I. Financial distress in Australian general insurers / I. Sharpe, A.
Stadnik // The Journal of Risk and Insurance. – 2007. – № 74 (2). – P.
377–399.
25.Данілов О. Інвестування: Навчальний посібник/ Олександр
Данілов, Ганна Івашина, Ольга Чумаченко,; Державна податкова
адміністрація України, Академія державної податкової служби
України. - К.: Видавничий дім "Комп’ютерпрес", 2001. - 362 с.
26.Ковшун Н. Аналіз та планування проектів: Навчальний посібник/
Наталія Ковшун; М-во освіти і науки України, Нац. ун-т водного
господарства та природокористування. - К.: Центр учбової
літератури, 2008. - 343 с.
27.Мойсеєнко І. Інвестування: Навчальний посібник/ Ірина
Мойсеєнко,. - К.: Знання , 2006. - 490 с.
28.Підхомний О. Управління інвестиційними процесами на
фінансових ринках: Навчальний посібник/ Олег Підхомний,. - К.:
Кондор, 2003. - 183 с.
15

29.Пересада А. Проектне фінансування: Підручник/ Анатолій


Пересада, Тетяна Майорова, Олена Ляхова,; М-во освіти і науки
України, КНЕУ. - К.: КНЕУ, 2005. - 733 с.
30.Фінансовий менеджмент: Навчальний посібник/ С. Я. Салига, Н.
В. Дацій, С. О. Корецький та ін.; М-во освіти і науки України. - К.:
Центр навчальної літератури, 2006. - 273 с.
31.Метаязык // Математическая энциклопедия / И. М. Виноградов. —
Москва: Советская энциклопедия, 1982. — Т. 3. — Стб. 653
32.Гарднер М. А ну-ка, догадайся!: Пер. с англ. = Aha! Gotcha.
Paradoxes to puzzle and delight. — М.: Мир, 1984. — С. 28-30. —
213 с.
33. Не помню, что за статья, но помню ссылку на неё:
https://habr.com/ru/company/ods/blog/322534/
34.Р. Барт. Литература и метаязык, 1957
35.Тарский А., Введение в логику и методологию дедуктивных наук,
пер. с англ., Метаязык, 1948;
36.Клини С. К., Введение в метаматематику, пер. с англ., Метаязык,
1957, гл. 1;
37.Чёрч А., Введение в математическую логику, пер. с англ., т. 1,
Метаязык, 1960 (введение);\
38.Карри Х. Б., Основания математической логики, пер. с англ.,
Метаязык, 1969, гл. 1-3.