Академический Документы
Профессиональный Документы
Культура Документы
медицинские
системы
Сергей Добриднюк,
«Диасофт Системы»
резидент ИЦ «Сколково»
Экосистема ИЦ «Сколково»
Инновационные
предприятия 1147
в Сколково
Принцип
Для каждого из рассматриваемых
входных параметров имеется таблица
весов, поставленных экспертами-
людьми
Достоинства
Данная модель легко разрабатывается в
продуктах класса Excel или вручную по
результатам «мозгового штурма»
Недостатки
«Улучшение» или «ухудшение» общего
целевого балла, если рассматриваемые
входные параметры коррелируют
между собой
Примеры ИС, использующих экспертные
модели
Принцип
Построение полинома (чаще лог-регрессия)
на основе обучающей выборки
Достоинства
• Не искажает результат в случае
корреляции входных параметров между
собой, автоматически обнуляя веса
зависимых параметров
• Модель можно перепроверить, т.к у
целевой функции существует обратная
функция
• Нечувствительность к резкому
изменению диапазона значений
входных параметров
Точность статистических моделей
Перем Коэффиц
Параметр
енная иент
1 Число случаев беременности 0.1232
2 Концентрация глюкозы 0.0352
Артериальное диастолическое
3 -0.0133
давление, мм. рт. ст.
Толщина кожной складки
4 0.0006
трехглавой мышцы, мм.
2-х часовой сывороточный
5 -0.0012
инсулин
6 Индекс массы тела 0.0897
Числовой параметр
7 0.9452
наследственности диабета confusion
Фактически
8 Возраст, лет 0.0149 matrix
Модель Положит. Отрицат.
*) Из UCI machine learning repository
www.basegroup.ru Положит. TP FP
Отрицат. FN TN
Примеры статистических модулей,
подключаемых к МИС
• Bayesia
• Deductor Studio
• IBM SPSS Statistics
• IBM SPSS Modeler
• Matlab
• MS Excel
• Oracle Data Miner
• Orange
• Statsoft Statistica
• SAS Etnerprise
Miner
• Stata
• Statsoft Statistica
• TIBCO Spotfire
Деревья решений
Принцип
Построение дерева (обычно С4.5) на основе
обучающей выборки
Достоинства
• Также как и модель лог-регрессии –
модель автоматически ранжирует
входные параметры по степени влияния
на результат, рассчитывая коэффициенты
влияния
• Результат представляется в виде «дерева»
- которое можно использовать даже в
ручном режиме обработки данных
• Модель автоматически убирает ненужные
сравнения и расчеты, обеспечивая очень
высокую скорость расчета целевого
предложения
Нейронные сети
Принцип
Модель самообучающихся сетей,
имитирующих работу человеческого мозга
Достоинства
• Самые высокие показатели точности
• Позволяет найти закономерности даже
в случае «серой зоны» - когда ни по
одному из входных параметров
невозможно сделать точный вывод о
клиенте и его проблемах
Недостатки
• Очень высокие требования к
вычислительным средствам, на которых
разрабатывается и обсчитывается
модель, в тяжелых случаях применяется
специальное аппаратное обеспечение
Нейронные сети