Открыть Электронные книги
Категории
Открыть Аудиокниги
Категории
Открыть Журналы
Категории
Открыть Документы
Категории
2021, № 3, с. 54–64
Библиографическая ссылка:
Наркевич А. Н., Виноградов К. А., Гржибовский А. М. Интеллектуальные методы анализа данных в биомедицинских исследованиях:
деревья классификации. 2021. № 3. С. 54–64.
For citing:
Narkevich A. N., Vinogradov K. A., Grjibovski A. M. Intelligent Data Analysis in Biomedical Research: Classification Trees. Ekologiya
cheloveka (Human Ecology). 2021, 3, pp. 54-64.
Уровень анализа данных в современных медико- ми вкладывается куда более всестороннее изучение
биологических исследованиях не стоит на месте – на полученных в результате медико-биологического
сегодняшний день под понятием «анализ данных» уже эксперимента данных с применением многомерных
намного реже подразумевается применение классиче- статистических и математических методов. Под много-
ских статистических критериев и коэффициентов для мерными методами нами подразумеваются методы,
нахождения различий между группами или оценки которые позволяют одновременно учитывать не один,
связи между признаками [1, 20]. В настоящий момент а совокупность изучаемых у объектов признаков [11,
все чаще в понятие «анализ данных» исследователя- 14, 15]. Одним из многомерных методов анализа
54
Ekologiya cheloveka (Human Ecology) Research Methodology
2021, 3, pp. 54-64
данных является дерево классификации, или дерево данные о наличии или отсутствии факторов риска, на
решений [5, 9, 13, 16, 19]. Примеры использования основе которых будет осуществляться прогнозирова-
данной модели можно найти при решении различных ние, и данные о достоверном подтверждении диагноза
аналитических задач в социологии [8], пульмонологии или о достоверном отсутствии диагноза туберкулез.
[10], инфектологии [2, 3], анестезиологии [12], ото- После применения деревьев классификации на таких
риноларингологии [17], кардиологии [22], стомато- данных можно будет выяснять у пациентов наличие
логии [21], онкологии [18], общественном здоровье факторов риска и получать прогнозируемое значение
и здравоохранении [4] и других областях. качественного признака – есть туберкулез или нет
Целью данной статьи является рассмотрение туберкулеза.
вопросов применения деревьев классификации в Дальнейшая иллюстрация построения деревьев
медико-биологических исследованиях, а также пред- классификации будет осуществлена на приведенном
ставление примеров их построения в наиболее часто примере. Однако примеров подобных задач можно
применяемых статистических программах. привести достаточно много. Так, база данных вклю-
чает информацию о женщинах, имеющих по резуль-
Описание задачи, которая может быть решена татам ультразвукового исследования образование в
с помощью деревьев классификации яичниках. Информация включает в себя признаки,
В целом деревья классификации позволяют решать отражающие анамнез жизни, акушерско-гинекологи-
так называемую задачу прогнозирования качественно- ческий анамнез, данные лабораторных исследований,
го признака (иначе такая задача называется задачей в том числе результаты анализов на онкомаркеры.
классификации). Как правило, задача классификации Помимо этого у каждой женщины имеется инфор-
в медико-биологических исследованиях используется, мация о характере образования (злокачественное
когда выяснение реального значения качественного или доброкачественное), полученная в результате его
признака является либо очень дорогим, опасным для удаления и гистологического исследования. Задача
здоровья человека, либо в принципе затруднительным заключается в том, чтобы построить математическую
по каким-либо причинам (долгое по времени и т. д.). модель, которая позволит с достаточной уверенностью
Например, диагностика туберкулеза является доволь- определить, к какой группе относится женщина – со
но затруднительной, весьма затратной и самое главное злокачественным или доброкачественным образовани-
– более-менее достоверные данные о наличии или ем. На основании такой классификации врачом может
отсутствии туберкулеза могут быть получены лишь быть определена наиболее эффективная дальнейшая
через 20–90 дней, а пациента необходимо начинать тактика ведения.
лечить от туберкулеза или другого заболевания уже Еще одним примером может служить задача клас-
сейчас. При этом имеется информация, что наличие сификации пациентов с инфарктом миокарда после
туберкулеза связано с наличием у человека различ- проведения операции аортокоронарного шунтиро-
ных факторов риска. Этот пример можно применить вания на два класса – класс пациентов, у которых
практически к любому заболеванию – если у человека будут сохраняться когнитивные нарушения через
имеются факторы риска заболевания, то вероятность, 12 месяцев после операции, и класс пациентов, у
что человек имеет данное заболевание, выше (в которых через 12 месяцев когнитивных нарушений
этом как раз и есть суть факторов риска). В данном не будет. В данном случае в качестве входных при-
случае «туберкулез» является качественным призна- знаков для построения дерева классификации также
ком (есть туберкулез или нет туберкулеза). То есть могут использоваться анамнестические, клинические,
можно попытаться на основании данных о наличии лабораторные данные. Более того, в данном примере
у человека различных факторов риска спрогнозиро- может быть использована информация, характери-
вать – страдает он туберкулезом или нет. В целом зующая непосредственно произошедший инфаркт
даже неважно, знает ли исследователь, каким именно миокарда (сторона и глубина поражения, стадия,
образом факторы риска связаны с развитием тубер- на которой поступил пациент, и т. д.), и, к примеру,
кулеза, достаточно знания или даже предположения информация, характеризующая когнитивную сферу
о том, что эта связь есть [6]. непосредственно после операции и при выписке.
Для осуществления такого прогноза (решения за- Приведем пример из наркологической практики.
дачи классификации – построения математической Задача заключается в том, чтобы по поведенческим
модели, которая сможет всех пациентов разделить на и психиатрическим характеристикам пациента при
два класса: больные туберкулезом и не больные тубер- поступлении в наркологическое отделение определить
кулезом) надо собрать данные согласно следующему наиболее вероятное наркотическое вещество, прием
дизайну. Набираются две группы пациентов: одна – с или введение которого привело к возникновению де-
заранее достоверно установленным диагнозом тубер- виантного поведения. Примером применения деревьев
кулез, другая – с заранее достоверно установленным классификации в хирургии может служить решение
отсутствием диагноза туберкулез. Затем выясняется следующей потенциальной задачи. Необходимо клас-
наличие или отсутствие конкретных факторов риска сифицировать новорожденных, имеющих дефекты
и в одной, и в другой группе. двенадцатиперстной кишки, на два класса – детей, у
Таким образом, у каждого пациента должны быть которых возникнут послеоперационные осложнения,
55
Методология научных исследований Экология человека
2021, № 3, с. 54–64
56
Ekologiya cheloveka (Human Ecology) Research Methodology
2021, 3, pp. 54-64
57
Методология научных исследований Экология человека
2021, № 3, с. 54–64
узлов на основе статистики хи-квадрат и в отличии курит, то он относится к «Узел 10», если не курит,
от методов «CRT» и «QUEST» может генерировать то к «Узел 11»
не только бинарные разделения, но и множествен- Таким образом, для классификации пациента с
ные. Метод построения «Исчерпывающий CHAID» использованием полученного дерева классификации
является более углубленной модификацией метода достаточно трех параметров – «ИМТ», «Частое пере-
«CHAID». Метод построения «CRT» позволяет охлаждение» и «Табакокурение». В соответствии с
осуществлять только бинарные разделения узлов, этими значениями необходимо дойти до терминального
а метод «QUEST» является ускоренным методом узла, параметры которого и будут свидетельствовать
«CRT». После выбора зависимой и независимых о классе пациента.
переменных необходимо нажать кнопку «ОК» для Необходимо учитывать, что пример, на котором
получения дерева классификации (рис. 2). иллюстрируется построение деревьев классифика-
Подробнее остановимся на полученном дереве ции, и полученные математические модели не могут
классификации. В самом верху дерева классификации претендовать на истинный научный результат, так
находится «Узел 0» (так называемый корень дерева как данные пациентов являются лишь частью базы
классификации). С данного узла начинается разделе- данных, которая использовалась при проведении
ние единиц наблюдения на подгруппы. Под нулевым оригинального исследования [7].
узлом представлен признак, по которому пациенты в Прежде чем приводить примеры классифика-
первую очередь разделяются на подгруппы. В данном ции пациентов с применением полученного дерева
примере этим признаком является «ИМТ». Далее классификации, рассмотрим еще несколько таблиц,
приведены интервалы значений ИМТ, при которых полученных при его построении. В таблице «Риск»
пациенты относятся в тот или иной узел. Так, если у (рис. 3) в столбце «Оценка» приведена доля неверно
пациента ИМТ меньше или равен значению 18,508, классифицированных единиц наблюдения, то есть
то он относится к «Узел 1», если больше 18,508 при применении полученного дерева классификации
и меньше либо равно 19,805, то к «Узел 2», если неверно классифицировано 19,5 % пациентов.
больше 19,805, но меньше либо равно 21,774, то к
«Узел 3», и т. д.
«Узел 1», «Узел 2», «Узел 5», «Узел 6» и «Узел 7»
являются терминальными узлами, так как после них
разделения на дочерние узлы не происходит. «Узел 3»
далее в соответствии с наличием у пациента такого
фактора риска, как частое переохлаждение, также
разделяется на два дочерних узла: если данный фактор
Рис. 3. Таблица «Риск»
риска отсутствует у пациента, то пациент относится
к «Узел 8», если имеется, то к «Узел 9». «Узел 4» Доля неверно классифицированных пациентов
также имеет разделение на два дочерних узла в со- также подтверждается данными таблицы «Класси-
ответствии с табакокурением пациента: если пациент фикация» (рис. 4). Так, в данной таблице приведены
58
Ekologiya cheloveka (Human Ecology) Research Methodology
2021, 3, pp. 54-64
наблюдаемые классы пациентов и их предсказанные переход к «Узел 3». Так как этот узел не является
классы. На пересечении строки «1» и столбца «1» терминальным, то далее необходимо оценить сле-
приведено количество пациентов, у которых имеется дующий параметр пациента. Пациент имеет фактор
туберкулез, и дерево классификации предсказало, что риска частого переохлаждения. В связи с этим осу-
у них есть туберкулез. На пересечении строки «0» ществляется переход к «Узел 9». Так как «Узел 9»
и столбца «0» – количество пациентов, у которых является терминальным узлом, то для окончательного
отсутствует туберкулез, и дерево классификации пред- прогноза наличия или отсутствия туберкулеза у па-
сказало, что у них его нет. Эти значения составляют циента необходимо проанализировать данные этого
верно предсказанные наблюдения. Общий процент узла. В «Узел 9» входит больше пациентов с наличием
верно предсказанных наблюдений составил 80,5. туберкулеза (88,5 %), в связи с чем можно сделать
прогноз, о том, что у пациента, на основе данных
которого делается прогноз, имеется туберкулез.
Для построения дерева классификации други-
ми методами необходимо произвести те же самые
действия, что и для построения уравнения методом
«CHAID», только необходимо произвести изменения
в поле «Метод построения». Приведем лишь дерево
классификации, которое построено методом «CRT»
и имеет наибольшую точность среди деревьев клас-
сификации, построенных всеми четырьмя методами
Рис. 4. Таблица «Классификация» (рис. 5). Общий процент верно предсказанных наблю-
дений с применением данного дерева классификации
Для иллюстрации примера использования полу- составил 84,1, тогда как метод «Исчерпывающий
ченного дерева классификации методом «CHAID» CHAID» позволил получить 83,1, а «QUEST» –
воспользуемся следующими параметрами одного 83,4. Как видно из представленного на рис. 5 дерева
из пациентов, имеющимися в базе данных: ИМТ – классификации, оно включает лишь два параметра
19,98, частое переохлаждение – да, табакокурение пациента – табакокурение и ИМТ.
– да. Так как ИМТ пациента попадает в интервал Необходимо отметить, что построение деревьев
от 19,805 до 21,774, то от «Узел 0» осуществляется классификации имеет довольно широкий спектр на-
59
Методология научных исследований Экология человека
2021, № 3, с. 54–64
60
Ekologiya cheloveka (Human Ecology) Research Methodology
2021, 3, pp. 54-64
61
Методология научных исследований Экология человека
2021, № 3, с. 54–64
В связи с тем, что с применением статистической пациентов, метод построения дерева классификации.
системы StatSoft Statistica было получено довольно Все это позволит читателю воспроизвести получен-
большое дерево классификации, включающее в себя ный исследователем результат или провести похожее
31 узел, на рис. 9 приведена только часть графическо- исследование.
го представления модели. Затем необходимо перейти Во-вторых, наибольший интерес будет вызывать
на вкладку «Classification» для получения результатов непосредственно дерево классификации. Если размер
оценки качества полученного дерева классификации. дерева классификации позволяет использовать его в
После нажатия кнопки «Tree graph» можно рассмо- тексте статьи или диссертации (как в случае с деревом
треть подробнее полученное дерево классификации. классификации, полученным с применением IBM SPSS
Его использование осуществляется так же, как и Statistics), то лучше непосредственно привести его
использование деревьев классификации, полученных изображение как на рис. 2. В таком случае самосто-
с помощью IBM SPSS Statistics. ятельный анализ читателем такого изображения даст
Для оценки качества полученного дерева класси- ответы на многие возникающие вопросы. Если формат
фикации после перехода на вкладку «Classification» статьи или диссертации не позволяет уместить дерево
необходимо нажать кнопку «Predicted vs. Observed классификации в виде изображения (как в случае с
by classes», после чего будет получена таблица клас- деревом классификации, полученным с применением
сификации, в которой приведены все необходимые StatSoft Statistica), то его стоит как следует описать.
параметры (рис. 10). Степень детализации описания, естественно, опреде-
ляет автор, но максимально, насколько это возможно,
стоит указать следующее: число признаков, которые
включены в дерево классификации, наименование
этих признаков, число уровней дерева, число узлов,
наиболее интересные с позиции автора правила, раз-
деляющие на несколько узлов.
В-третьих, при представлении результатов построе-
ния деревьев классификации важно отразить качество
классификации с применением модели. В качестве
показателей, отражающих качество классификации,
как правило, используются чувствительность, специ-
фичность и точность. В качестве дополнительных
Рис. 10. Таблица классификации показателей могут быть использованы прогности-
ческая ценность положительного и отрицательного
Таблица классификации разбита на три блока. результата, отношение правдоподобия положитель-
В первом блоке представлены результаты клас- ного и отрицательного результата. На расчете данных
сификации пациентов, не имеющих туберкулез показателей и их интерпретации останавливаться
– «Observed=0», во втором блоке – пациентов, не будем, но каждый из них характеризует качество
имеющих туберкулез – «Observed=1», в третьем классификации с разных позиций, а расчет их можно
блоке – всех пациентов – «Observed=All Groups». осуществить с применением онлайн калькуляторов,
Рассмотрим результаты классификации подробнее. используя значения, которые приводятся в таблицах
Данные первого блока свидетельствуют о том, что результатов классификации (см. рис. 4 и 10). Помимо
у пациентов, не имеющих туберкулез, полученным самих показателей желательно снабдить их 95 %
деревом классификации предсказывается отсутствие доверительными интервалами.
туберкулеза («Predicted 0») в 87,05 % случаев, а Какие значения чувствительности, специфичности
наличие туберкулеза («Predicted 1») – в 12,95 %. или точности считать приемлемыми, сказать довольно
Данные второго блока свидетельствуют о том, что сложно, так как это зависит от конкретной области
у пациентов, имеющих туберкулез, полученным де- медицины и даже задачи, которую решает исследо-
ревом классификации предсказывается отсутствие ватель в рамках этой области. К примеру, если в
туберкулеза («Predicted 0») в 12,57 % случаев, а арсенале медицинских специалистов уже существу-
наличие туберкулеза («Predicted 1») – в 87,43 %. ет онкомаркер, использование которого позволяет
установить наличие онкологического заболевания с
Представление результатов построения чувствительностью 87 %, специфичностью 92 % и
деревьев классификации точностью 90 %, то использование дерева классифи-
При представлении результатов построения дере- кации, которое имеет более низкие значения данных
вьев классификации в научной статье или диссертации показателей, не будет иметь смысла. В связи с этим
следует учитывать то, что искушенного читателя будут для каких-то задач будет достаточно и 70–80 %, а
интересовать, во-первых, стартовые условия, при для каких-то задач недостаточно будет и 90–95 %
которых осуществилось построение дерева классифи- значений. Это можно оценить, только сравнивая
кации: число входных признаков, их наименование, результаты, полученные методами, имеющимися в
на какие классы исследователь классифицировал арсенале медицинских специалистов.
62
Ekologiya cheloveka (Human Ecology) Research Methodology
2021, 3, pp. 54-64
Для представления в научной публикации ре- программ IBM SPSS Statistics и StatSoft Statistica.
зультатов, полученных в ходе реализации примера, Применение при анализе данных медико-биологи-
приведенного в данной статье, раздел материалов и ческих экспериментов дерева классификации, как
методов может содержать примерно следующий текст. одного из легко используемых и интерпретируемых
«Для классификации пациентов на больных методов многомерного анализа данных, позволит
туберкулезом и пациентов с отсутствием данного более глубоко изучать закономерности явлений и
заболевания осуществлялось построение математиче- состояний в области медицины и биологии.
ской модели дерева классификации. Для построения
дерева классификации в качестве входных признаков Авторство
использовались 28 параметров пациентов. При этом Наркевич А. Н. внес существенный вклад в концеп-
23 параметра представлены в бинарном виде, где цию и дизайн исследования, получение, анализ и интер-
0 – отсутствие признака, 1 – наличие признака: претацию данных, подготовил первый вариант статьи,
окончательно утвердил присланную в редакцию рукопись;
наличие частого переохлаждения, тяжелого физиче-
Виноградов К. А. внес существенный вклад в концепцию
ского труда, нервно-психической нагрузки, основного и дизайн исследования, получение, анализ и интерпрета-
общего, среднего, средне-профессионального, средне- цию данных, существенно переработал первый вариант
специального, неоконченного высшего и высшего статьи на предмет важного интеллектуального содержания,
образования, наличие контакта с больным туберку- окончательно утвердил присланную в редакцию рукопись;
лезом, ВИЧ-инфекции, сахарного диабета, язвенной Гржибовский А. М. внес существенный вклад в концепцию
болезни желудка и двенадцатиперстной кишки, других и дизайн исследования, анализ и интерпретацию данных,
болезней ЖКТ, психических заболеваний, хронических существенно переработал первый вариант статьи на пред-
неспецифических заболеваний легких, пылевых забо- мет важного интеллектуального содержания, окончательно
леваний, вирусных заболеваний печени, наркомании, утвердил присланную в редакцию рукопись.
пребывание в пенитенциарных учреждениях в течение
Наркевич Артем Николаевич – ORCID 0000-0002-1489-
жизни, злоупотребление алкоголем, табакокурение. 5058; SPIN 9030-1493
Один параметр (пол) представлен в бинарном виде, Виноградов Константин Анатольевич – ORCID 0000-0001-
где 0 – женский пол, 1 – мужской пол, а четыре 6224-5618; SPIN 6924-0110
параметра представлены в количественном виде: рост, Гржибовский Андрей Мечиславович – ORCID 0000-0002-
вес, индекс массы тела и возраст. 5464-0498; SPIN 5118-0081
Классификация осуществлялась на два класса: 0 –
отсутствие туберкулеза, 1 – наличие туберкулеза. Список литературы / References
Построение дерева классификации осуществлялось 1. Гржибовский А. М., Иванов С. В., Горбатова М. А.
методом CHAID. Для оценки качества классификации Однофакторный линейный регрессионный анализ с исполь-
использовались показатели точности, чувствитель- зованием программного обеспечения Statistica и SPSS //
ности и специфичности с 95 % доверительными Наука и здравоохранение. 2017. № 2. С. 5–33.
Grjibovski A. M., Ivanov S. V., Gorbatova M. A. One-factor
интервалами.
linear regression analysis using software Statistica and SPSS.
Несомненно, часть приводимого в материалах и
Nauka i zdravookhranenie [Science and health]. 2017, 2,
методах текста может быть представлена в виде та- pp. 5-33. [In Russian]
блицы (по примеру табл. 1 данной статьи). В разделе 2. Калагина Л. С., Сморкалова В. М., Зобкова Т. И.
результатов при оформлении научной публикации Деревья классификации в прогнозировании исходов ге-
стоит привести в виде рисунка полученное дерево патита А у детей // Медицинский альманах. 2011. № 4.
классификации (если это позволяет его размер, оно С. 207–210.
может быть приведено по примеру рис. 2, 5 или 9 Kalagina L. S., Smorkalova V. M., Zobkova T. I.
данной статьи). Также раздел результатов может со- Classification trees in predicting outcomes of hepatitis A in
держать примерно следующий текст. children. Meditsinskiy al’manakh [Medical almanac]. 2011,
4, pp. 207-210. [In Russian]
«В результате построения дерева классификации
3. Калагина Л. С., Сморкалова В. М., Зобкова Т. И.
для определения наличия или отсутствия у паци- Математическая модель прогнозирования исходов легкой
ентов туберкулеза в качестве входных признаков формы гепатита B у детей // Педиатрия. Журнал им.
в математическую модель включено три признака: Г. Н. Сперанского. 2012. Т. 91, № 4. С. 156–159.
индекс массы тела, наличие частого переохлаждения Kalagina L. S., Smorkalova V. M., Zobkova T. I.
и табакокурения. Данное дерево классификации со- Mathematical model for predicting outcomes of mild
стоит из трех уровней и содержит 11 узлов. Точность hepatitis B in children. Pediatriya (Pediatriya - Zhurnal im.
классификации пациентов с применением данного G. N. Speranskogo). 2012, 91 (4), pp. 156-159. [In Russian]
дерева классификации составила 80,5 (78,9; 81,8) %, 4. Кондрова Н. С., Зулькарнаев Т. Р., Франц М. В.
чувствительность – 84,2 (80,0; 87,7) %, специфич- Потенциал здоровья работников как компонент челове-
ческого потенциала организации // Гигиена и санитария.
ность – 77,2 (72,8; 81,1) %».
2018. Т. 97, № 2. С. 164–171.
Таким образом, рассмотрены вопросы применения Kondrova N. S., Zul’karnaev T. R., Frants M. V. Potential
деревьев классификации в медико-биологических of workers ‘ health as a component of the human potential
исследованиях, а также представлены примеры их of the organization. Gigiena i Sanitariya. 2018, 97 (2),
построения в статистических пакетах прикладных pp. 164-171. [In Russian]
63
Методология научных исследований Экология человека
2021, № 3, с. 54–64
5. Константинова Е. Д., Вараксин А. Н., Жовнер И. В. SPSS. Nauka i zdravookhranenie [Science and health].
Определение основных факторов риска развития неинфек- 2017, 4, pp. 5-26. [In Russian]
ционных заболеваний: метод деревьев классификации // 12. Bamber J. H., Evans S. A. The value of decision tree
Гигиена и санитария. 2013. Т. 92, № 5. С. 69–72. analysis in planning anaesthetic care in obstetrics. International
Konstantinova E. D., Varaksin A. N., Zhovner I. V. Journal of Obstetric Anesthesia. 2016. 27, pp. 55-61. DOI:
Determination of the main risk factors for the development 10.1016/j.ijoa.2016.02.007.
of non-communicable diseases: method of classification trees. 13. Ben-Gal I., Dana A., Shkolnik N., Singer G. Efficient
Gigiena i Sanitariya. 2013, 92 (5), pp. 69-72. [In Russian] Construction of Decision Trees by the Dual Information
6. Наркевич А. Н., Виноградов К. А. Настольная книга Distance Method. Quality Technology & Quantitative
автора медицинской диссертации: пособие. М.: Инфра-М, Management. 2014, 11 (1), pp. 133-147.
2019. 454 с. 14. Bewick V., Cheek L., Ball J. Statistics review 14:
Narkevich A. N., Vinogradov K. A. A reference book of Logistic regression. Critical Care. 2005, 9 (1), pp. 112-118.
the author of a medical dissertation: manual. Moscow, 15. Bewick V., Cheek L., Ball J. Statistics review 7:
Infra-M Publ., 2019, 454 p. [In Russian] Correlation and regression. Critical Care. 2003, 7 (6),
7. Наркевич А. Н., Виноградов К. А., Корецкая Н. М., pp. 451-459.
Наркевич А. А. Использование прогностических матема- 16. Deng H., Runger G., Tuv E. Bias of importance
тических моделей для выявления больных туберкулезом measures for multi-valued attributes and solutions. Proceedings
легких // Туберкулез и болезни легких. 2014. № 9. С. of the 21st International Conference on Artificial Neural
44–45. Networks (ICANN). 2011, pp. 293-300.
Narkevich A. N., Vinogradov K. A., Koretskaya N. M., 17. Distinguin L., Blanchard M., Rouillon I., Parodi M.,
Narkevich A. A. Use of predictive mathematical models for Loundon N. Pediatric cochlear reimplantation: Decision-tree
detecting patients with pulmonary tuberculosis. Tuberkulez efficacy. European Annals of Otorhinolaryngology, Head and
i bolezni legkikh [Tuberculosis and lung diseases]. 2014, 9, Neck Diseases. 2018, 135 (4), pp. 243-247. DOI: 10.1016/j.
pp. 44-45. [In Russian] anorl.2018.05.002.
8. Фомина Е. Е. Возможности метода деревьев класси- 18. Garonzik-Wang J. M., Majella Doyle M. B. Decision
Tree for Liver Resection for Hepatocellular Carcinoma.
фикации при обработке социологической информации //
JAMA Surgery. 2016, 151 (9), pp. 853-854. DOI: 10.1001/
Гуманитарный вестник. 2018. № 11. С. 5.
jamasurg.2016.1149.
Fomina E. E. Possibilities of the method of classification trees
19. Laurent H., Rivest R. L. Constructing Optimal Binary
in the processing of sociological information. Gumanitarnyi
Decision Trees is NP-complete. Information Processing
vestnik [Humanities Bulletin]. 2018, 11, p. 5. [In Russian]
Letters. 1976, 5 (1), pp. 15-17. DOI: 10.1016/0020-
9. Халафян А. А., Виноградов Р. А., Акиньшина В. А.,
0190(76)90095-8.
Кошкаров А. А. Система поддержки принятия решений
20. Schneider A., Hommel G., Blettner M. Linear
при выборе тактики коррекции стеноза внутренних сонных
Regression Analysis. Part 14 of a Series on Evaluation of
артерий // Врач и информационные технологии. 2018. Scientific Publications. Deutsches Ärzteblatt International.
№ 2. С. 29–38. 2010, 107 (44), pp. 776-782.
Khalafyan A. A., Vinogradov R. A., Akin’shina V. A., 21. Suzuki S., Ukiya T., Kawauchi Y., Ishii H., Sugihara N.
Koshkarov A. A. Decision support System for choosing Decision tree analysis for factors associated with dental
tactics for correction of internal carotid artery stenosis. Vrach caries in school-aged children in Japan. Community Dental
i informatsionnye tekhnologii [Doctor and information Health Journal. 2018, 35 (4), pp. 247-251. DOI: 10.1922/
technology]. 2018, 2, pp. 29-38. [In Russian] CDH_4409Suzuki05.
10. Харевич О. Н., Лаптева И. М., Лаптева Е. А., 22. Tayefi M., Esmaeili H., Saberi Karimian M., Amirabadi
Королева Е. Г. Клинические фенотипы тяжелой астмы Zadeh A., Ebrahimi M., Safarian M., Nematy M., Parizadeh
(по результатам кластерного анализа) // Вестник Санкт- S. M. R., Ferns G. A., Ghayour-Mobarhan M. The application
Петербургского университета. Медицина. 2015. № 2. of a decision tree to establish the parameters associated
С. 28–39. with hypertension. Computer Methods and Programs
Kharevich O. N., Lapteva I. M., Lapteva E. A., in Biomedicine. 2017, 139, pp. 83-91. DOI: 10.1016/j.
Koroleva E. G. Clinical phenotypes of severe asthma (based on cmpb.2016.10.020.
the results of cluster analysis). Vestnik Sankt-Peterburgskogo
universiteta. Meditsina [Bulletin of the Saint Petersburg Контактная информация:
University. Medicine]. 2015, 2, pp. 28-39. [In Russian] Наркевич Артем Николаевич – доктор медицинских
11. Шарашова Е. Е., Холматова К. К., Горбато- наук, зав. лабораторией медицинской кибернетики и
ва М. А., Гржибовский А. М. Применение множественного управления в здравоохранении, зав. кафедрой медицинской
логистического регрессионного анализа в здравоохранении кибернетики и информатики ФГБОУ ВО «Красноярский
с использованием пакета статистических программ SPSS государственный медицинский университет им. проф.
// Наука и здравоохранение. 2017. № 4. С. 5–26. В. Ф. Войно-Ясенецкого» Минздрава России
Sharashova E. E., Kholmatova K. K., Gorbatova M. A., Адрес: 660022, Красноярский край, г. Красноярск,
Grjibovski A. M. Application of multiple logistic regression ул. Партизана Железняка, д. 1
analysis in healthcare using a package of statistical programs E-mail: narkevichart@gmail.com
64