Вы находитесь на странице: 1из 6

М. Л.

НИКОНОРОВА,
к. п.н., Первый Санкт-Петербургский государственный медицинский университет им. академика
И. П. Павлова, г. Санкт-Петербург

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ
МЕДИЦИНСКИХ ДАННЫХ
С ИСПОЛЬЗОВАНИЕМ КЕЙСОВОЙ
ТЕХНОЛОГИИ

УДК 002.55; 024


Никонорова М. Л. Интеллектуальный анализ медицинских данных с использованием кейсовой технологии
(Первый Санкт-Петербургский государственный медицинский университет им. академика И. П. Павлова, г. Санкт-
Петербург)
Аннотация. Данная работа посвящена проблеме эффективности применения информационных технологий в по-
вседневной практической деятельности врача. Возникают реальные ситуации, когда принятие решения требует
больших временных затрат. В этих случаях всегда на помощь приходят компьютерные технологии, автоматизиро-
ванная обработка данных. В статье описана модель принятия решения, позволяющая реализовать конкретную
ситуацию. Приведен алгоритм решения и перечислены основные операторы прикладного программного обеспе-
чения RapidMiner. Приведен пример методического кейса, используемого на практических занятиях по медицин-
ской информатике.
Ключевые слова: модель принятия решения, кейс метод, Rapid Miner.

UDC 002.55; 024


Nikonorova M. L. Data mining using case technology (Pavlov First Saint Petersburg State Medical University)
Abstract. The article explained that you can use efficiency of information technologies in everyday life practical doctor.
There are real situations where the decision may be time consuming. In these cases, always come to the aid of computer
technology, automated data processing. The article describes the decision-making model, which allows to implement the
specific situation, An algorithm for solving the problem are the main operators and application software Rapid Miner. An
example case study methodology used in practical classes in medical Informatics.
Keywords: Data Mining, case study, Rapid Miner

В
водная часть и новизна. В соответствии со стратегией
развития медицинской науки в Российской Федерации на
период до 2025 года [5], эффективная реализация постав-
ленной задачи невозможна без внедрения в медицину современ-
ных компьютерных технологий обработки и анализа результатов
научных исследований. Известно, что новые автоматизированные
системы позволяют оценивать медико-биологические показатели
обследования пациентов, интеллектуальные информационные си-
стемы диагностируют заболевания и создают алгоритм лечения,
который в дальнейшем оказывает положительное лечебное воз-
действие. Совершенствование медицинских и информационных
технологий позволяет повысить эффективность лечебно-диагности-
ческих процессов. Правила, описывающие сочетания различных
симптомов заболеваний, положены в основу современных эксперт-

© М. Л. Никонорова, 2016 г.

54
2016, № 1

ных систем. Технологии Data Mining («обна- нологии позволяют эффективно реализовать
ружение знаний в базах данных» (knowledge педагогическую технологию case-studies, так
discovery in databases) или «интеллектуальный как обеспечивают множественность выбора
анализ данных») [3] позволяют обнаруживать источников информации, средств реализации
в медицинских данных шаблоны, составляю- и представления, возможность быстрой оцен-
щие основу указанных правил. Согласно это- ки качества каждого решения [1].
му, уровни знаний, извлекаемых из данных,
могут быть поверхностными (язык простых за- Данные о методике исследования.
просов), неглубокими (оперативная аналити- Действия в кейсе предложены в качестве ме-
ческая обработка) и скрытыми (Data Mining, тода разрешения проблемы. Тогда выработ-
discovery driven data mining), отображающими ка модели практического действия становится
взаимоотношения неочевидных и неожидан- достаточно продуктивным средством освое-
ных последовательностей. Известно, что для ния профессиональных компетенций студен-
интеллектуального анализа данных применя- тов [6].
ют систему Rapid Miner. Rapid Miner – бес- В качестве кейса рассмотрим следующую
платное программное обеспечение, ориен- задачу:
тированное на решение задач и построение В единую базу данных вносились результа-
модели принятия решений. Rapid Miner со- ты анализов пациентов, обратившихся в кли-
держит более 400 операторов различных нику. В конце года администрация клиники
методов машинного обучения, включая ввод приняла решение о дополнительных льготах
и вывод, предварительную обработку и визу- по обслуживанию пациентов с нарушением
ализацию данных. В то же время в Страте- дыхания в следующем году. Как оказалось,
гии 2025 рекомендовано разработать и ре- всех пациентов, обратившихся в клинику, мож-
ализовать специальные программы обучения но разделить на 4 группы: 1 группа пациентов
студентов медицинских вузов технологическим специализировалась на развитии реберного
методам научных биомедицинских исследо- дыхания, 2 группа развивала «полное дыха-
ваний, принципам доказательной медицины, ние йогов», 3 группа пациентов имеет пато-
методам обработки научной информации логию дыхания и оставшиеся – нормальное
и так далее. Эффективность образовательно- дыхание. При анализе биомедицинской ин-
го процесса, в рамках реализации новых Фе- формации оказалось, что часть базы данных
деральных государственных образовательных повреждена, оставшуюся информацию уда-
стандартов, определяется выбором и реали- лось сохранить в формате табличного ре-
зацией конкретных образовательных техноло- дактора MS Excel. Для выполнения решения
гий. Описание реальных ситуаций, отражение администрации клиники и предоставления до-
логики и содержание профессиональной де- полнительных льгот необходимо восстановить
ятельности отражено в методе кейсов (англ. утерянные данные и выделить пациентов с на-
case method, case-study, способ конкретных рушением дыхания.
ситуаций). Основной принцип метода кейсов Опишем алгоритм решения задач мето-
заключается в инициировании самостоятель- дом кейса:
ного изучения ситуации студентами, формиро- 1. Выработка модели практического дей-
вании их собственного видения проблем и их ствия у студентов. Определение роли и назначе-
решения, выработке умения дискутировать ния кейса. Источником кейса будет служить ре-
и обсуждать ситуацию со своими коллегами, альная ситуация из жизни практикующего врача.
преподавателями [2]. Информационные тех- Студент в этом случае выступает в роли врача.

55
2. Разработка информационной модели. сказательную способность, точность построе-
Рассматривая представленную задачу, при- ния модели принятия решений.
ходим к выводу, что решением является уста- 4. Обработка, представление и анализ
новка принадлежности объекта той или иной отобранной информации. На этом этапе про-
группе. В качестве примера считаем, что опи- ходит рассмотрение моделей различных ре-
санная задача относится к задачам классифи- шений с помощью классификаторов, изучение
кации и теперь необходимо выявить этот тип альтернативных вариантов. Классификаторы
закономерностей с помощью Data Mining, то осуществляют вывод предсказываемой пере-
есть установить принадлежность события или менной на основе комбинации других аспек-
объекта той или иной группе. При составле- тов (переменных–предсказателей). Результаты
нии информационной модели мы описываем обработки, представления и анализа оформ-
основные классификаторы, входящие в состав ляем в виде таблицы.
Rapid Miner: дерево решений с отсечениями, 5. Выработка решения. Защита кейса.
дерево решений без отсечений, дерево реше- Оцениваются различные варианты решения
ний с функциями информативности Information проблемы реальной ситуации и выбирается
gain, gain ratio; нейронная сеть с одним уров- оптимальное решение. Защита кейса прохо-
нем; нейронная сеть с двумя уровнями; метод дит в виде обсуждения или дискуссии. Препо-
k-ближайших соседей для k=1,2,3. Результаты даватель оценивает принятое решение.
формализации сводим в таблицу.
3. Разработка (формирование) алгоритми- Экспериментальная часть. Построим
ческой модели. Алгоритмическая модель стро- модель принятия решения для описанного кей-
ится из последовательности операторов вво- са в прикладной программе Rapid Miner, кото-
да информации, классификаторов, обработки рая состоит из следующих этапов:
и вывода информации. Статистическую инфор- 1. Загрузка исходных данных. Прежде всего
мацию для последующего анализа формирует создаем репозиторий, в котором открываем
оператор X–Validation, состоящий из двух про- две папки: Data – для загрузки исходных дан-
цессов – обучения и тестирования. В левой ных и Proc – для сохранения алгоритма при-
панели оператора формируется процесс об- нятия решения. Данные импортируются и со-
учения: поступают данные для обучения и на храняются в репозитории из программы Excel.
выходе получаем обученную модель. В каче- При импорте данных необходимо определить
стве оператора обучения используем основ- тип и роль каждой переменной, для этого мож-
ные классификаторы. Отметим, что в правой но воспользоваться автоматическим распозна-
панели всегда два оператора Apply Model ванием данных, представленных в RapidMiner
и Perfomance. На вход Apply Model поступа- или описать атрибуты самостоятельно. Соглас-
ют данные обученной модели и набор данных но этому выделяют численные атрибуты (це-
для последующей классификации. Сообразно лые или вещественные значения переменных);
с этим, на выходе Apply Model мы имеем на- номинальные атрибуты (состояния объекта)
бор данных с прогнозным значением, которые и «целевые» атрибуты, для которых необходи-
поступают на вход оператора Perfomance. мо сделать прогноз. «Целевые атрибуты» могут
В результате выполнения всего алгоритма на быть как численными, так и номинальными, они
выходе мы получаем визуализированные дан- определяют роль данных. Загружаемые данные
ные и оценку эффективности (Perfomance), по- сохраняем в папке Data.
зволяющую проанализировать внутреннюю 2. Построение алгоритмической моде-
структуру данных, распознавательную и пред- ли осуществляется с помощью операторов,

56
2016, № 1

входящих в следующие группы операто- процесса обучения создаётся и обучается


ров Rapid Miner: Repository Access (Retrieve); модель, которая в дальнейшем используется
Data Transformation (Nominal to Binominal, в процессе тестирования. Процесс обучения
Nominal to Numerical, Replace Missing Values, максимально оптимизирует модель непосред-
Normalize); Modeling (k–NN, Decision Tree, ственно для данных, которые участвуют в те-
Neural Net, Apple Model). стировании. При тестировании обученной
Дерево решений (Decision Tree) относится модели на некотором независимом наборе
к символьным (не числовым) алгоритмам. Пре- данных в основном точность построения мо-
имущество символьных алгоритмов отмечает- дели может отличаться в зависимости от об-
ся в относительной простоте интерпретации учающей и тестирующей выборки. Поэтому
человеком правил принятия решений; хорошо обучающая выборка должна быть тщательно
приспособлены для графического отображе- подобрана или презентативна. В исследован-
ния, на основе которого легко сделать выводы. ном примере разница составила не более 5%.
Алгоритм К–ближайщих соседей (k–NN) Оценка эффективности (Perfomance) по-
формирует решение на основании значимых зволяет провести анализ внутренней структуры
ближайших соседей, число которых легко из- данных, вывести распознавательную и пред-
меняется, часто применяется для сравнения сказательную способность, определить точ-
результатов «фактического» обучения и те- ность построения модели принятия решений.
стируемого. 3. Построение графической модели для
Нейронная сеть (Neural Net) представляет определения принципов принятия решения.
собой простейший линейный классификатор, На рабочее окно перемещаем операторы
в котором для всех ошибочных данных вектор Retrieve и X–Validation из базы операторов
весовых коэффициентов уменьшается или уве- Rapid Miner. Выход оператора загрузки дан-
личивается. Нейронная сеть является математи- ных соединяем со входом X–Validation. В опе-
ческой моделью, но напоминает функциональ- раторе X–Validation используется два выхода
ную структуру биологических нейронных сетей. для получения выходных данных: получение
В нейронной сети прямого распространения статистической таблицы и получение визуа-
соединения между блоками не образуют ориен- лизированного классификатора. Оператор
тированный цикл, информация движется только X–Validation позволяет сформировать панели
в одном направлении, вперед от входных узлов процессов обучения и тестирования. На пане-
через скрытые узлы к выходным узлам. Отметим, ли обучения выбранный классификатор обыч-
что нейронная сеть после анализа позволяет но имеет один вход и один выход. Панель те-
прогнозировать значение переменных. стирования включает в себя оператор Apple
Параметры построения классификаторов Model, на вход которого поступает 2 сигнала,
Дерева решений с отсечениями, без отсече- выход у оператора один. Он проверяется по-
ний, с различными функциями информативно- рядок, тип и вид данных, а также прогнозные
сти; Нейронной сети с одним уровнем, с дву- значения. Оператор Perfomance имеет один
мя уровнями: k-ближайщих соседей меняются вход и один выход, позволяет автоматически
на появляющейся панели Parametеrs при вы- определить тип задачи обучения и вычисляет
деленном операторе. общие критерии. После установки всех связей
Графическая модель (Apply Model) визуа- между операторами считаем, что графическая
лизирует графическую модель прогнозирова- модель построена. Осталось только выделить
ния. Все необходимые параметры сохраняют- классификатор и установить информативную
ся в пределах модели объекта. Так, на этапе функцию.

57
4. Анализ таблицы результатов. ственные выводы студентов на основании
В соответствии с таблицей определяем информации о кейсе, аналитические методы
точность и погрешность построения моде- обработки информации, подготовленные до-
ли принятия решения, распознавательную кументы в соответствии с ранее сделанными
и предсказательную способность модели по выводами.
каждому классификатору. Результаты форма- Кейс-метод позволяет решать задачи по
лизации сводим в таблицу. формированию и развитию информационно-
5. Описание выбранной модели принятия технологической компетенции представления
решения, наиболее точно отражающей вну- информации, созданию информационной
треннюю структуру данных, ее распознава- модели, освоению возможностей прикладно-
тельную и предсказательную способность. го пакета Rapid Miner, построению алгорит-
Считаем, что не поврежденные данные яв- мических моделей в среде Rapid Miner. На-
ляются тренировочными. Их можно использо- ряду с этим следует отметить формирование
вать для обучения или тестирования модели исследовательских компетенций студентов,
принятия решения. При восстановлении по- таких как: умение планировать свое иссле-
врежденных данных используется тестовый на- дование; оценить актуальность, доступность,
бор. При этом добавляются на рабочее поле репрезентативность полученной информации;
операторы Retrive(2) и Apple Model, выходы сохранить результаты [4]. В процессе решения
X–Validation и Retrive(2) поступают на вход кейса идет формирование личностных качеств
Apple Model, а его выход выдает результат студентов, позволяющих реализовать воспита-
восстановленных данных, при этом отмечает- тельную функцию.
ся уменьшение точности построения модели Однако, опираясь на мировой опыт, мож-
принятия решения на 5–8%. но утверждать [2], что этот метод способству-
ет формированию таких качеств будущего
Выводы и рекомендации. Предложен- специалиста, в которых нуждается рыночная
ный кейс позволяет студентам найти решение экономика. Например, умение вырабатывать
и решить поставленную задачу. Кейс-метод и принимать модель конкретных действий, спо-
требует подготовленности студентов, наличия собность к поиску новых знаний, способность
навыков самостоятельной работы, неподго- вырабатывать модели решения проблем, уме-
товленность может приводить к поверхност- ние аргументировать и отстаивать свою точку
ному обсуждению кейса или к неправильному зрения и т. д. Овладение и усовершенствова-
принятию решения. Преподаватель обсужда- ние компетенций в области компьютерных тех-
ет кейс со студентами, поддерживает деловой нологий позволит не только увеличить эффек-
настрой, оказывает помощь в загрузке данных тивность практической деятельности врача,
и технических проблемах, возникающих при но и принять участие в научной деятельности.
реализации выбранного алгоритма построе- Возможности прикладного пакета Rapid Miner
ния модели принятия решения. По результа- позволяют применять основные методы ин-
там принятия решения организует дискуссию теллектуального анализа данных для анализа
или обсуждение, оценивает вклад студентов и поддержки принятия решений в повседнев-
в анализ кейса. При этом учитываются соб- ной практике врача.

58
2016, № 1

ЛИТЕРАТУРА

1. Баранова Е. В., Симонова И. В. Развитие информационно-технологической компетентно-


сти студента в системе педагогического образования [Электронный ресурс] / Известия РГПУ
им. А. И. Герцена, СПб, 2004. № 4 (9). – Доступ с сайта Библиотека РГПУ им. А. И. Герцена.
С. 158–168.
2. Власова Н. В. Современные образовательные технологии в контексте новых феде-
ральных государственных образовательных стандартов [Текст] / Н. В. Власова // Теория
и практика образования в современном мире: материалы междунар. науч. конф. (г. Санкт-
Петербург, февраль 2012 г.). – СПб.: Реноме, 2012. С. 278–280.
3. В. Дюк. Data Mining – интеллектуальный анализ данных. Режим доступа: http://www.
iteam.ru/publications/it/section_92/article_1448/ Дата обращения: 28.05.2015.
4. Никонорова М. Л. Информационные технологии на практических занятиях будущих вра-
чей. Электронное обучение в ВУЗе и в школе / Материалы сетевой международной на-
учно-практической конференции. – СПб.: Астерион, 2014. Стр. 208–209.
5. Стратегия развития медицинской науки в Российской Федерации на период до 2025 года.
Режим доступа: http://goo.gl/BYUhNl Дата обращения: 01.06.2015
6. Царапкина Ю. М. Использование кейс-технологий при обучении студентов. Образова-
тельные технологии. Образование и наука. 2015. № 3 (122). Стр. 120–128.

ИТ-новости

ПУЛЬСОКСИМЕТР КАК ТОНОМЕТР

В
озможно, для контроля давления скоро не придется надевать на руку неприятно давя-
щую манжету – в компании MocaCare заявили о разработке компактного устройства,
которое способно определить целый ряд характеристик сердечно-сосудистой системы,
просто отсканировав ваш большой палец.
Гаджет, получивший название MocaHeart, оснащен электродом и видеодатчиком, с помо-
щью которых он определяет скорость кровотока, а по ней – частоту сердечных сокращений,
уровень кислорода крови и давление.
Правда, точные показатели систолического и диастолического давления он не выдаст – толь-
ко оценку по пятибалльной шкале: «низкое», «идеальное», «повышенное», «высокое» и «очень
высокое». Чтобы пройти тест, достаточно нажать пальцем на MocaHeart на несколько секунд.
Устройство сопровождается мобильным приложением, которое отображает результаты, обна-
руживает тенденции на основе долговременных наблюдений и выдает напоминания, когда при-
ходит время снова снять показания. При проведении процедуры, как утверждают в компании,
принимаются во внимание местонахождение пользователя и погодные условия.
Заряда батареи MocaHeart хватает на три дня работы. В США устройство предлагается
за 150 долл. В создании устройства, по словам представителей MocaCare, принимали участие
ученые из Стэнфорда и МТИ.
Источник: OSP.ru

59

Вам также может понравиться