медицина 2015
Успех или
Мистификация ?
Сергей Добриднюк,
«Диасофт Системы»
резидент ИЦ «Сколково»
Видение будущего
=
Кибернетические системы
Экспертные модели
Регрессионные модели
Деревья решений
Нейронные сети
Экспертные модели
Принцип
Для каждого из рассматриваемых
входных параметров имеется таблица
весов, поставленных экспертами-
людьми
Достоинства
Данная модель легко разрабатывается в
продуктах класса Excel или вручную по
результатам «мозгового штурма»
Недостатки
«Улучшение» или «ухудшение» общего
целевого балла, если рассматриваемые
входные параметры коррелируют
между собой
Примеры ИС, использующих экспертные
модели
WebMD Checker – диагностика по симптомам
PROTEGE – набор инструментов для построения баз знаний
DXPlain - системы поддержки клинических решений, используется для
ассистирования в процессе диагностики
CASNET предназначена для диагностики и выбора стратегии лечения
глаукомы
MYCIN, EMYCIN - диагностика и лечение инфекционных заболеваний
крови
Germwatcher - помощь больничному эпидемиологу. Включает базу
знаний, основанную на правилах, используется для генерации гипотез о
возможных инфекциях
PEIRS интерпретирует и комментирует отчеты по химическим патологиям
Puff - предназначена для интерпретации результатов
функционального пульмонологического теста на основе прецедентной
информации
HELP –госпитальная ИС с функциями поддержки принятия решений
Регрессионные модели
Принцип
Построение полинома (чаще лог-регрессия)
на основе обучающей выборки
Достоинства
• Не искажает результат в случае
корреляции входных параметров между
собой, автоматически обнуляя веса
зависимых параметров
• Модель можно перепроверить, т.к у
целевой функции существует обратная
функция
• Нечувствительность к резкому
изменению диапазона значений
входных параметров
Точность статистических моделей
Перем Коэффиц
енная Параметр иент
1 Число случаев беременности 0.1232
2 Концентрация глюкозы 0.0352
3 Артериальное диастолическое -0.0133
давление, мм. рт. ст.
4 Толщина кожной складки 0.0006
трехглавой мышцы, мм.
2-х часовой сывороточный
5 -0.0012
инсулин
6 Индекс массы тела 0.0897
Числовой параметр
7 0.9452
наследственности диабета
8 Возраст, лет 0.0149
confusion Фактически
matrix
Модель Положит. Отрицат.
*) Из UCI machine learning repository
Положит. TP FP
www.basegroup.ru
Отрицат. FN TN
Примеры статистических модулей,
подключаемых к МИС
• Bayesia
• Deductor Studio
• IBM SPSS Statistics
• IBM SPSS Modeler
• Matlab
• MS Excel
• Oracle Data Miner
• Orange
• Statsoft Statistica
• SAS Etnerprise
Miner
• Stata
• Statsoft Statistica
• TIBCO Spotfire
Деревья решений
Принцип
Построение дерева (обычно С4.5) на основе
обучающей выборки
Достоинства
• Также как и модель лог-регрессии –
модель автоматически ранжирует
входные параметры по степени влияния
на результат, рассчитывая коэффициенты
влияния
• Результат представляется в виде «дерева»
- которое можно использовать даже в
ручном режиме обработки данных
• Модель автоматически убирает ненужные
сравнения и расчеты, обеспечивая очень
высокую скорость расчета целевого
предложения
Нейронные сети
Принцип
Модель самообучающихся сетей,
имитирующих работу человеческого мозга
Достоинства
• Самые высокие показатели точности
• Позволяет найти закономерности даже
в случае «серой зоны» - когда ни по
одному из входных параметров
невозможно сделать точный вывод о
клиенте и его проблемах
Недостатки
• Очень высокие требования к
вычислительным средствам, на которых
разрабатывается и обсчитывается
модель, в тяжелых случаях применяется
специальное аппаратное обеспечение
Нейронные сети