Вы находитесь на странице: 1из 94

«Санкт-Петербургский государственный электротехнический университет

«ЛЭТИ» им. В.И.Ульянова (Ленина)»


(СПбГЭТУ «ЛЭТИ»)

Направление 11.03.01 - Радиотехника


Профиль Радиоэлектронные системы
Факультет РТ
Кафедра РС

К защите допустить
Зав. кафедрой

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА


БАКАЛАВРА
Тема: РЕКОНСТРУКЦИЯ И СТРУКТУРНЫЙ АНАЛИЗ ОБЪЕКТОВ
ПО ДАННЫМ ПРОНИКАЮЩЕГО ЛАЗЕРНОГО СКАНИРОВАНИЯ

Студентка Шахнова В.В.


подпись

Руководитель к.т.н., доц., с.н.с. Соколова А.А.


(Уч. степень, уч. звание) подпись

Консультанты к.т.н., доц. Иванов А.Н.


(Уч. степень, уч. звание) подпись

Маругин А.С.
(Уч. степень, уч. звание) подпись

Санкт-Петербург
2020
ЗАДАНИЕ
НА ВЫПУСКНУЮ КВАЛИФИКАЦИОННУЮ РАБОТУ

Утверждаю
Зав. кафедрой РС
_____________________________
« 11 » марта 2020 г.

Студентка Шахнова В.В. Группа 6102


Тема работы: Реконструкция и структурный анализ объектов по данным
проникающего лазерного сканирования
Место выполнения ВКР: СПбГЭТУ «ЛЭТИ», кафедра РС
Исходные данные (технические требования): среда программирования
MATLAB, код алгоритма анализа свойств объектов на основе
предварительной многопороговой обработки цифровых изображений
Содержание ВКР: введение, основы анализа изображений, многопороговая
обработка изображений, безопасность жизнедеятельности, заключение

Перечень отчетных материалов: пояснительная записка, иллюстративный


материал, код алгоритма для реконструкции и структурного анализа
объектов по данным проникающего лазерного сканирования
Дополнительные разделы: Безопасность жизнедеятельности

Дата выдачи задания Дата представления ВКР к защите


« 12 » марта 2020 г. « 12 » июня 2020 г.

Студентка Шахнова В.В.


Руководитель к.т.н., доц. Соколова А.А.
(Уч. степень, уч. звание)

2
КАЛЕНДАРНЫЙ ПЛАН ВЫПОЛНЕНИЯ
ВЫПУСКНОЙ КВАЛИФИКАЦИОННОЙ РАБОТЫ

Утверждаю
Зав. кафедрой РС
_____________________________
« 11 » марта 2020 г.

Студентка Шахнова В.В. Группа 6102


Тема работы: Реконструкция и структурный анализ объектов по данным
проникающего лазерного сканирования
№ Срок
Наименование работ
п/п выполнения
04.03 –
1 Обзор литературы по теме работы
19.03
20.03 –
2 Основы анализа изображений
10.04
11.04 –
3 Многопороговая обработка изображений
30.04
01.05 –
4 Безопасность жизнедеятельности
15.05
16.05 –
5 Оформление пояснительной записки
31.05
01.06 –
6 Оформление иллюстративного материала
12.06

Студентка Шахнова В.В.

Руководитель к.т.н., доцент, с.н.с. Соколова А.А.


(Уч. степень, уч. звание)

3
РЕФЕРАТ

Пояснительная записка 93 стр., 28 рис., 2 табл., 20 ист., 2 прил.


ЦИФРОВЫЕ ИЗОБРАЖЕНИЯ, ОБРАБОТКА ИЗОБРАЖЕНИЙ,
ОБЪЕКТЫ ИССЛЕДОВАНИЯ, СЕЛЕКЦИЯ ОБЪЕКТОВ,
МНОГОПОРОГОВАЯ ОБРАБОТКА
Объектом исследования данной выпускной квалификационной работы
является цифровое изображение, полученное в результате проникающего
лазерного сканирования.
Цель работы заключается в реализации в среде программирования
MATLAB алгоритма для реконструкции и структурного анализа объектов по
данным проникающего лазерного сканирования. Для достижения этой цели
ставятся задачи, а именно: рассмотрение проблемы выделения объектов на
цифровых изображениях, исследование и модификация алгоритма анализа
свойств объектов на основе предварительной многопороговой обработки
цифровых изображений радиотехнических систем по средствам
проникающего лазерного сканирования; получение и анализ статистических
характеристик селектируемых объектов.
Для решения поставленных задач были использованы цифровые
изображения, содержащие объекты исследования, полученные
радиотехническими системами на основе проникающего лазерного
сканирования и машинного зрения; исследован и модифицирован алгоритм
выделения объектов и анализа свойств объектов на основе пороговой
обработки цифровых изображений, произведена реконструкция и
структурный анализ объектов по данным проникающего лазерного
сканирования по восьми различным геометрическим показателям формы,
получены и исследованы статистические свойства выделяемых объектов,
рассмотрены вопросы безопасности жизнедеятельности при эксплуатации
данного алгоритма.

4
ABSTRACT

The object of research of this final qualification work is a digital image


obtained as a result of penetrating laser scanning.
The purpose of this work is to implement an algorithm for reconstruction
and structural analysis of objects based on data from penetrating laser scanning in
the MATLAB programming environment. To achieve this purpose, the tasks are
set, namely: consideration of the problem of selecting objects in digital images,
research and modification of the algorithm for analyzing the properties of objects
based on threshold processing of digital images of radio engineering systems by
means of penetrating laser scanning; obtaining and analyzing the statistical
characteristics of the selected objects.
To solve these tasks, digital images containing research objects obtained by
radio engineering systems based on penetrating laser scanning and machine vision
were used; studied and modified the algorithm of feature extraction and analysis of
the properties of objects based on thresholding of digital images, reconstruction
and structural analysis of the objects according penetrating laser scanning for eight
different geometric figures shapes, are obtained and investigated the statistical
properties of allocated objects, the issues of safety in the operation of this
algorithm.

5
ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ..............................................................................................................7
1. ОСНОВЫ АНАЛИЗА ИЗОБРАЖЕНИЙ......................................................13
1.1. Введение в основы анализа изображений..............................................13
1.2. Цифровое изображение............................................................................15
1.3. Этапы обработки и анализа изображений..............................................19
1.4. Сегментация изображения.......................................................................21
1.4.1. Метод Otsu..............................................................................................22
1.4.2. Метод многопорогового представления изображений......................27
1.5. Количественный анализ...........................................................................29
1.6. Цветовой анализ........................................................................................30
1.7. Анализ текстур..........................................................................................33
1.8. Морфологический анализ........................................................................33
2. МНОГОПОРОГОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ.............................37
2.1. Основы многопороговой обработки.......................................................37
2.2. Методология..............................................................................................40
2.3. Инвариантные геометрические критерии адаптации............................44
2.4. Селекция объектов по площади..............................................................47
2.5. Методы структурного анализа................................................................48
2.6. Множественная линейная регрессия......................................................64
3. БЕЗОПАСНОСТЬ ЖИЗНЕДЕЯТЕЛЬНОСТИ.............................................69
3.1. Необходимость эргономичности.............................................................69
3.2. Человеко-ориентированность программы..............................................69
3.3. Эргономика программного обеспечения................................................73
3.4. Выводы по разделу...................................................................................74
ЗАКЛЮЧЕНИЕ.....................................................................................................75
ПРИЛОЖЕНИЕ А.................................................................................................79
ПРИЛОЖЕНИЕ Б..................................................................................................89

6
ВВЕДЕНИЕ

Анализ изображений – это вездесущая часть современных технологий.


Различные области применения варьируются от дистанционного наблюдения
земной поверхности до систем видеоанализа, полученных с помощью
оптических, радиолокационных, инфракрасных или акустических датчиков,
радаров с синтезированной апертурой (Synthetic Aperture Radars – SAR),
систем CLSM (Confocal Laser Scanning Microscopy) и т. д. В круг задач,
решаемых такими системами, включают идентификацию и селектирование
объектов, слежение за ними, сопоставление и совмещение изображений от
разнородных датчиков, индексацию и восстановление изображений. Эти
задачи актуальны, поскольку указанные объекты обычно имеют
искусственное происхождение и представляют первостепенный интерес [1-
3].
Современные условия ведения деятельности человека стимулируют
исследования по автоматизации систем сканирования объектов. Основной
целью обработки данных сканирования служит извлечение полезной
информации из изображений и превращение содержимого сцены в знания.
Снимки, получаемые с помощью систем наблюдения, должны автоматически
преобразовываться в структурированную информацию, которая может
использоваться в сочетании с другими данными.
Объекты исследования обычно имеют более компактные размеры и
регулярную структуру по сравнению с фоновыми. Разнообразие и
изменчивость форм и текстур объектов, а также интенсивный
нестационарный фон определяют сложность обработки. Для областей
объектов исследования обычно характерны небольшие отношения
сигнал/фон. Кроме того, зарегистрированное цифровое изображение может
иметь низкое качество, малое число уровней квантования, изменчивый
характер и нечеткие границы структур объектов. В таких системах

7
случайный фон сильно отличается от гауссовского, плотности вероятности
достаточно асимметричны, а их асимптотический вид характеризуется
логнормальными или «загрязненными» нормальными закономерностями.
При ограниченной выборке реализация однозначной идентификации таких
плотностей может быть затруднена [2].
По причине разнообразия и изменчивости форм и фактур объектов, а
также интенсивного нестационарного фона, извлечение и анализ этих
объектов в зрительной системе представляет собой сложную задачу.
Типичные ограничения возникают из-за низкого отношения сигнал/шум в
зоне анализа, низкого качества изображений, чрезмерного квантования,
нечетких границ объектов и структур, которые характерны для
биологических структур, наблюдаемых биомедицинскими системами зрения.
Кроме того, свойства фона структурно и часто статистически сходны с
интересующими областями и поэтому могут либо имитировать, либо
маскировать присутствие объектов. Вышеперечисленные условия сильно
ограничивают работоспособность таких традиционных методов, как
адаптивное пороговое значение, так как неправильный выбор порогов часто
приводит к потере полезных объектов на ранней стадии. Еще одной
проблемой является низкое качество генерируемых изображений, пятна,
размытые границы, а также внутренние спекл-шумы, характерные для систем
SAR, когерентных лазерных систем визуализации [1]. Данные сложности
определяют недостаточную изученность вопросов, связанных с задачами
обнаружения, выделения, селекции и локализации объектов различной
формы на изображениях, что говорит об актуальности рассматриваемой темы
и необходимости в более подробном ее исследовании и анализе, чему и
посвящена данная выпускная квалификационная работа.
Современные технологии, основанные на проникающем сканировании
объектов, тесно связаны с биомедицинскими приложениями, где новые
технологии микроскопической визуализации, такие как флуоресцентное
окрашивание с последующей конфокальной лазерной сканирующей
8
микроскопией (CLSM), получили широкое распространение и стали
доступны широкому исследовательскому и лабораторному сообществу.
Доступ к технологиям стимулировал проникновение в ранее
неисследованные области, включая глубокий многослойный анализ
трехмерных биологических структур без ущерба для их целостности и
жизнеспособности. В частности, CLSM с дифференциальным
флуоресцентным окрашиванием выявил внутреннюю организацию
различных сложных трехмерных структур от внутриклеточной молекулярной
организации до субпопуляций клеток в консорциумах, что позволяет
получать динамические картины их взаимодействия, дифференцировки и
адаптивного реагирования на стрессовые условия. Хотя новые технологии
видения действительно позволяют глубже проникнуть в неизведанные
глубины жизни, все еще существуют определенные ограничения в
отношении количественной оценки и интерпретации их результатов. Для
поддержки количественной оценки и принятия решений технологии видения
должны надлежащим образом дополняться сложными решениями по
обработке, визуализации и интерпретации данных. Общие задачи, которые
необходимо решить, включают анализ изображений на различных этапах от
предварительной обработки до отбора, классификации и количественной
оценки объектов с различной окраской, формой и морфологией. К
настоящему времени различные технологии анализа изображений доступны
в виде универсальных инструментов или целенаправленных решений
проблем, реализованных в серии программных средств. Кроме того, новые
методы отбора и локализации объектов интенсивно внедряются в
медицинские приложения, такие как магнитно-резонансная томография
органов, выявление онкологической патологии, а также в диагностику
различных заболеваний внутренних органов [5-7].
Существует большое разнообразие методов сегментации объектов для
различных приложений анализа изображений как в системах дистанционного
наблюдения, так и в других системах анализа данных, например, при
9
микроскопической и биомедицинской визуализации. Не вдаваясь в
подробности, отметим, что, хотя разнообразие доступных методов позволяет
более конкретно выбрать оптимальный алгоритм для данной задачи, это
также усложняет воспроизводимость результатов, особенно учитывая
количество свободных параметров, которыми может управлять пользователь
и которые часто субъективно, если не произвольно, выбираются [1].
Для эффективного многомасштабного анализа традиционные подходы
к сегментации изображений часто оказываются недостаточными, поскольку
обобщенное иерархическое представление объектов уже не позволяет
однозначно присвоить один пиксель одному объекту. В отличие от этого,
один пиксель часто принадлежит иерархии с тонким разрешением объектов и
структур, встроенных в более крупные из них.
Для частичного преодоления вышеуказанных ограничений и более
полного соответствия требованиям объединения данных из различных
источников, путем ранней интеграции результатов визуализации в
специализированные информационные системы, предпочтительно на
объектном уровне, необходимо пересмотреть обсуждаемый подход. В более
общем плане ранний переход от пиксельного представления к объектному
уровню и унификация следующих процедур на объектном уровне требуют
общей структуры анализа и реконструкции изображений с набором четких
правил выбора объектов и унифицированного представления объектов,
которые должны быть универсальными, несмотря на методы,
использованные для их первоначального выбора и количественной оценки.
Соответственно, требования к методологии реконструкции включают ее
универсальность, основанную на общих геометрических принципах,
алгоритмическую прозрачность и простую переносимость между решениями
для методов визуализации, основанных на различных физических
принципах. Расширение от 2D до 3D визуализации различными методами,
начиная от наземных проникающих радиолокаторов до CLSM и
томографических систем, дополнительно обусловливает необходимость
10
определенной универсальной структуры реконструкции 3D-объектов из
совокупности различных 2D-слоев с потенциально широкой областью
применения [8, 9].
Рассматривается подход [1], к анализу изображений, основанный на его
многопороговой обработке. Далее для сегментации и выделения
изображений используются результаты многопорогового анализа,
представленные серией бинарных слоев. Таким образом, одной из
специфических особенностей данного подхода является то, что сегментация
и отбор осуществляются на основе апостериорной информации после
получения бинарных изображений для ряда потенциальных порогов.
Основное преимущество заключается в том, что не требуется никакого
предварительного обучения из подмножества, а параметры алгоритма
корректируются для каждого изображения и далее для каждого объекта в
отдельности за счет общей производительности анализа.
Базовый объект содержит все изображение при нулевом пороге и
теряет часть своего содержания при увеличении порога, пока не распадается
на отдельные изолированные объекты в определенной точке, что приводит к
разрыву в максимальном размере объекта. Расположение таких промежутков
является хорошим ориентиром для выбора пороговых значений, так как они
указывают критические точки (фазовые переходы) между соединенными и
несвязанными фрагментами изображения. Исходя из 3D-структур,
охватывающих ряд бинарных слоев, дальнейшая характеристика возможна
путем подбора определенных слоев, соответствующих пороговому значению,
оптимизированному по определенным геометрическим критериям.
В итоге, в работе показывается, как одна и та же концептуальная
структура может быть использована для представления, анализа и
эффективной характеристики наборов данных более высоких измерений,
иллюстрируемых трехмерными многослойными данными, полученными с
помощью микроскопической визуализации CLSM.

11
Задача выпускной квалификационной работы заключается в том, чтобы
на основе предварительной многопороговой обработки изображений,
полученных при проникающем лазерном сканировании, оценить искажения и
их формы. Для этого произвести оценку параметров формы и исследовать
эффективность их применения для рассматриваемых объектов анализа.
Также необходима разработка программного обеспечения по средствам
MATLAB (Matrix Laboratory), в котором должен быть реализован и
исследован код алгоритма для реконструкции и структурного анализа
объектов по данным проникающего лазерного сканирования. Основными
функциями данной программы будет являться возможность проводить
постобработку изображений с дополнительной селекцией на них объектов по
средствам оценки различных геометрических признаков, в основе которой
лежит анализ логистической модели. Программный модуль предполагается
использовать при проведении исследования объектов, нуждающихся в
селектировании, в связи с чем, по теме работы имеется существенный задел.

12
1. ОСНОВЫ АНАЛИЗА ИЗОБРАЖЕНИЙ

1.1. Введение в основы анализа изображений


Анализ изображений используется в качестве основного инструмента
для распознавания, дифференцирования и количественной оценки различных
типов изображений, включая изображения в оттенках серого и цветные
изображения, мультиспектральные изображения для нескольких дискретных
спектральных каналов или диапазонов волн и гиперспектральные
изображения с последовательностью смежных диапазонов волн,
охватывающих определенную спектральную область (например, видимую и
ближнюю инфракрасную). Более ранние работы по анализу изображений
были в основном ограничены сообществом компьютерных наук, и они в
основном касались простых изображений для таких приложений, как
обнаружение дефектов, сегментация и классификация [4]. В настоящее время
анализ изображений становится все более важным и распространенным,
поскольку он может быть выполнен более удобно, быстро и экономически
эффективно. Анализ изображений в значительной степени опирается на
технологию машинного зрения. Взрывной рост как аппаратных платформ,
так и программных фреймворков привел к значительному прогрессу в
анализе цифровых изображений.
Анализ изображений был применен во многих различных областях
науки и техники. Он использовался для определения или количественной
оценки внешних характеристик (например, цвета, размера, формы и текстуры
поверхности) и внутренних структур (архитектуры и/или связности
материальных составляющих) различных объектов. Коммерческие
устройства машинного зрения легко доступны для удовлетворения
требований автоматического контроля в различных отраслях деятельности
человека. Поскольку научный прогресс не стоит на месте, возрастает

13
потребность в автоматизации процессов опознавания объектов интереса с
помощью машинного зрения.
Важно отметить, что анализ изображений является частью более
широкой области, известной как обработка изображений, где основная идея
заключается в улучшении визуального качества изображения и/или
извлечении полезной информации или функций. Анализ основан на
различных свойствах изображения, таких как цвет, блеск, морфология
объектов и текстура. Действия по обработке изображений могут быть
сгруппированы в три подгруппы [4]:
1. Сжатие изображения, которое снижает требования к памяти,
устраняя избыточность, присутствующую в изображении, то есть
информацию об изображении, которая не воспринимается
человеческим глазом.
2. Предварительная обработка изображения, которая состоит из
улучшения визуального качества изображения за счет уменьшения
шума, калибровки пикселей и стандартизации, улучшения
обнаружения краев и повышения надежности этапа анализа
изображений на основе объективных и хорошо установленных
критериев. Термин «предварительная обработка изображения», в
общем случае, относится ко всем манипуляциям с изображением,
каждая из которых производит новое изображение.
3. Анализ изображения, который обычно возвращает числовые
значения и/или графическую информацию о характеристиках
изображения, пригодных для классификации, обнаружения дефектов
или прогнозирования некоторых качественных свойств
изображаемого объекта. Термин «анализ изображения»
используется, когда выводом является число или решение, а не
изображение.
Эти действия обработки связаны между собой и могут иметь различные
эффекты или выходные данные для каждого приложения. В следующих
14
разделах описываются основные понятия и характеристики цифрового
изображения, а также способы их обработки и преобразования (улучшения),
также дается обзор типичных методов и приемов анализа изображений.

1.2. Цифровое изображение


Цифровое изображение – это численное 2D или 3D представление
реального физического объекта или сцены, из которого мы можем получить
точное пространственное (геометрическое) и/или спектральное (для случая
гиперспектрального изображения) представление с достаточной
детализацией (разрешением) для обработки, сжатия, хранения, печати и
отображения. Цифровое изображение может быть векторного или растрового
типа, в зависимости от того, является ли разрешение изображения
фиксированным. Растровые изображения – это электронные файлы,
состоящие из дискретных элементов изображения, называемых пикселями
(сокращенно от picture elements). С каждым пикселем связано число,
представляющее собой среднюю яркость относительно небольшой области
внутри сцены, которое передает цвет или уровень серого в одной точке
изображения [4].
Форматы векторной графики дополняют растровую графику, которая
являет собой представление изображений на основе математических
выражений, как это обычно используется в компьютерной графике для
изображений, состоящих из векторов (стрелок направления, точек и линий),
которые определяют формы, по сравнению с отдельными пикселями,
используемыми для представления растрового изображения. Векторное
изображение не зависит от разрешения, что означает, что изображение может
быть увеличено или уменьшено без влияния на качество вывода. Термин
«цифровые изображения» обычно относится к растровым изображениям.
Кроме того, он также применяется к данным, связанным с точками,
разбросанными по трехмерной области, например, полученным с помощью

15
томографического оборудования. В этом случае каждая данная называется
вокселем.
Наиболее часто используемым методом создания растровых
изображений (например, цифровой визуализации или сбора изображений)
является цифровая фотография с помощью ПЗС-камеры в процессе,
называемом оцифровкой. Процесс оцифровки требует отображения
изображения на сетке и квантования уровня интенсивности. Оцифровка – это
процесс преобразования аналогового сигнала в цифровой сигнал, известный
как аналого-цифровое преобразование. Для растровых изображений
аналоговый сигнал напряжения (от любого из нескольких типов датчиков
изображения), пропорциональный количеству света, отраженного или
переданного оцифруемым элементом, делится на дискретные числовые
значения. Другими словами, этот процесс преобразует изображение в серию
небольших квадратных элементов изображения или пикселей, которые
являются либо черными, либо белыми (двоичными), определенным оттенком
серого или цветом. Каждый пиксель представлен одной или несколькими
двоичными цифрами, либо 1, либо 0. Измеряя цвет (или уровень серого для
черно-белых фотографий) изображения в большом количестве точек, мы
можем создать цифровую аппроксимацию изображения, из которой может
быть восстановлена копия оригинала [4].
На рисунке 1 показан пример процесса создания цифрового
изображения.

Рис. 1. Пример процесса создания цифрового изображения


16
На этом рисунке показана энергия источника освещения, отраженная
от элемента сцены (яблока). Система визуализации собирает поступающую
энергию и фокусирует ее на плоскости изображения. Передняя часть системы
визуализации представляет собой оптическую линзу, которая проецирует
видимую сцену на фокальную плоскость объектива. Датчик камеры
представляет собой массив фотоэлементов, которые измеряют свет в
дискретных точках. Датчик непосредственно не распознает цвет входящего
света; вместо этого в цветной камере (с 3 ПЗС-датчиками) призма разделяет
свет на три компонента или цветовые каналы, т. е. R (для красного цвета), G
(для зеленого) и B (для синего). Отклик каждого датчика, совпадающий с
фокальной плоскостью, пропорционален интегралу световой энергии,
проецируемой на поверхность датчика. После того, как цифровое
изображение было создано и сохранено на любом носителе, существует
соответствующее цифро-аналоговое преобразование, которое позволяет
компьютеру представить изображение в удобочитаемой форме на дисплее
или принтере. Отображение изображения на мониторе компьютера или
печать изображения на принтере являются примерами аналогового
представления цифрового изображения. Для того чтобы обрабатывать и
анализировать изображения на компьютере, необходимо сначала оцифровать
их.
Рисунок 2 подчеркивает характеристики цифрового цветного
изображения. Отображаемое цветное изображение представляет собой
двумерную матрицу из тысяч или миллионов пикселей, каждый из которых
имеет свой собственный адрес, размер и оттенки серого или цветовое
представление канала. Увеличив масштаб этого цифрового изображения,
можно заметить, что оно состоит из ряда строк и столбцов квадратных
пикселей. Каждый пиксель представляет собой значение яркости или
интенсивности данного цветового канала (или уровня серого) в любой
конкретной точке изображения. Как правило, пиксельная информация
хранится в памяти компьютера в виде растрового изображения или растровой
17
карты, двумерного массива целых чисел. Эти значения часто передаются или
хранятся в сжатом виде [4].

Рис. 2. Характеристики цифрового цветного изображения: а – исходное изображение


(340x256 пикселей), б – увеличенное цветное изображение (x1,600) для визуализации
пикселей, в – числовые значения интенсивности цвета R, G и B для выбранной области
Ограничения оцифрованного представления заключаются в том, что
оно содержит гораздо меньше информации об исходной сцене, поскольку
3D-сцена сводится к 2D-представлению. Датчики в любом приборе приема
(фото- или видеокамеры, сканеры и другие сенсоры) вообще не способны
точно улавливать и воспроизводить, хоть и не чувствительную для
человеческого зрения, всю цветовую информацию с реальной сцены. Кроме
того, размер и расположение объектов на изображении теперь являются

18
оценками, точность и достоверность которых зависят от разрешения
выборки. Преимущества цифровых изображений заключаются в том, что они
могут быть обработаны и проанализированы во многих отношениях
компьютерами.

1.3. Этапы обработки и анализа изображений


Обработка изображений включает в себя ряд операций с
изображениями для повышения качества цифрового изображения, чтобы
устранить такие дефекты, как геометрические искажения, неправильный
фокус, повторяющиеся шумы, неравномерное освещение и движение
камеры. Анализ изображений – это процесс выделения объектов (областей
исследования) из фона и получения количественной информации, которая
впоследствии используется для принятия решений. Обработка и анализ могут
быть выполнены на многих различных типах данных изображения. Они
включают в себя, в возрастающем порядке сложности: бинарные
изображения, изображения в оттенках серого, цветные, поляризованные
светом, мультиспектральные и гиперспектральные, 3D-изображения,
мультисенсорные и мультимедийные системы, а также последовательности
изображений и видео.
Gunasekaran и Ding (1994) [4] определили три уровня обработки
изображений: низкоуровневая обработка, которая включает в себя сбор
изображений и предварительную обработку изображений, обработка
среднего уровня, которая включает в себя сегментацию изображений,
представление и описание изображений, и обработка высокого уровня,
которая включает в себя распознавание областей интереса, интерпретацию
для качественной сортировки и градации. Термины «машинное зрение» или
«компьютерное зрение» часто используются для обозначения всех методов
обработки изображений, включая методы обработки и анализа изображений,
а также методы распознавания образов. Следовательно, процесс принятия
решения включает в себя ряд последовательных шагов. Не все ситуации
19
требуют всех этих шагов или операций, но все они потенциально доступны
для решения конкретных проблем.
Машинное зрение обычно состоит из следующих пяти этапов или
операций (см. рис. 3): 1) операции по получению изображений для
преобразования изображений в цифровую форму, как описано в подразделе
1.2; 2) операции предварительной обработки для получения улучшенного
изображения с теми же размерами, что и исходное изображение; 3) операции
сегментации изображения для разбиения цифрового изображения на
непересекающиеся области; 4) операции измерения объектов для измерения
характеристик объектов, таких как размер, форма, цвет и текстура; 5)
операции сортировки для идентификации объектов путем их классификации
на различные группы [4].

Рис. 3. Обзор этапов эксплуатации системы машинного зрения


Обработка изображений или предварительная обработка включает в
себя широкий спектр операций, которые могут рассматриваться как самоцель
или предназначены для упрощения или улучшения последующего анализа.
Предварительная обработка улучшает качество данных изображения,
20
устраняя непреднамеренные искажения или улучшая некоторые функции
изображения, которые важны для дальнейшей обработки и создания более
подходящего изображения, чем оригинал для конкретного приложения.
Операции, которые могут быть выполнены с цифровыми изображениями,
включают точечные, локальные или соседние и глобальные операции.
Точечные операции преобразуют пиксели без учета соседних пикселей.
Серое значение выходного изображения в определенном пикселе зависит
только от серого значения того же пикселя во входном изображении. Они
отображают пиксели в одном изображении, чтобы сформировать другое,
используя одну функцию отображения. Точечные операции не учитывают
пространственную организацию изображения, которая формирует
фундаментальный характер изображений в отличие от других типов данных.
Примеры таких операций включают контрастное растяжение, сегментацию
на основе серого значения и выравнивание гистограммы. Термин «контраст»
относится к амплитуде изменений уровня серого в изображении.
Локальные или соседние операции, которые также называются
операциями маски, генерируют выходной пиксель, значение которого
зависит от значений пикселей в окрестности соответствующей входной
точки. Примеры включают свертку (например, сглаживание или резкость
изображения) и обнаружение пространственных объектов (например,
обнаружение линии, края и угла). Большой и мощный класс нелинейных
операций соседства — это морфологические методы, они естественным
образом распространяются на изображения серого уровня (и
многополосные).
Наконец, операция является глобальной, если выходное значение в
определенной координате зависит от всех значений во входных
изображениях. Методы обработки пространственной области включают все
три типа, но операции в частотной области являются глобальными
операциями. Конечно, операции в частотной области могут стать операциями
маски, основанными только на локальной окрестности, путем выполнения
21
преобразования на небольших блоках изображения вместо всего
изображения [4].

1.4. Сегментация изображения


Сегментация изображений является одним из наиболее важных этапов
во всей технике обработки изображений, так как последующие извлеченные
данные сильно зависят от точности этой операции. Его основная цель
состоит в том, чтобы разделить изображение на области, которые имеют
сильную корреляцию с объектами или областями интереса. Сегментация
может быть достигнута тремя различными методами: определение
порогового значения, сегментация по краям и сегментация по областям. Эти
алгоритмы, их модификации и комбинации с другими подходами часто
используются в различных приложениях, связанных с выделением объектов
на изображении.
Определение порогового значения или глобального порогового
значения – это простой и быстрый метод для характеристики областей
изображения, основанный на постоянной отражательной способности или
светопоглощении поверхностей этих областей. Сегментация на основе краев
основана на обнаружении краев операторами краев. Краевые операторы
обнаруживают резкие разрывы в сером уровне, цвете, текстуре и т. д., по
образу и подобию. Сегментация на основе областей включает группировку
сходных пикселей для формирования областей, представляющих отдельные
объекты в изображении. Затем сегментированное изображение может быть
представлено в виде границы или области. Представление границ пригодно
для анализа размеров и форм объектов, в то время как представление
областей используется для обнаружения и оценки текстуры, дефектов или
просто областей интереса [4].

1.4.1. Метод Otsu

22
Для иллюстрации процесса сегментации приведены два примера. На
рисунке 4 показан процесс сегментации изображений для зеленых и желтых
бананов с использованием простого глобального порогового значения. В
целом, получены успешные результаты для идентификации истинной
площади обоих бананов, поскольку распределение интенсивности банановой
кожуры и фоновых пикселей достаточно различны. Гистограмма бимодальна,
причем пики для фона высокие и узкие, а от банановых вершин их отделяют
глубокие долины (см. рис. 4б).
В идеале процесс сегментации должен быть полностью
автоматическим, чтобы он мог предоставлять объективные и
непротиворечивые данные. Для автоматического определения порога было
предложено несколько методов. Интересной альтернативой для этого
является метод Otsu, который выбирает порог на основе минимизации
внутригрупповой дисперсии двух групп пикселей, разделенных оператором
порогового значения. Таким образом, если гистограмма бимодальна, то
задача порогового удержания заключается в определении наилучшего порога
t, отделяющего два режима гистограммы друг от друга (как показано на
рисунке 4). Каждый порог t определяет дисперсию для группы значений,
которые меньше или равны t (  t), и дисперсию для группы значений,
которые больше t (> t). Определение наилучшего порога, предложенное
Otsu, – это тот порог, для которого взвешенная сумма внутригрупповых
отклонений минимизируется. Взвешенная сумма внутригрупповых
отклонений – это вероятности соответствующих групп. Применение метода
Otsu для сегментирования одних и тех же изображений бананов в стадиях
созревания 1 и 5 (показано на рисунке 4) дало пороговые значения 56 и 63
соответственно [4].

23
Рис. 4. Процесс сегментации изображений для бананов с использованием простого
глобального порогового значения: а – предварительная обработка цветного изображения
бананов на стадиях созревания 1 и 5, включая предыдущее преобразование оттенков
серого и сглаживание изображения с использованием фильтра Лапласа-Гаусса (LOG filter)
[3x3] для облегчения обнаружения краев, бинаризации и сегментации; б – гистограмма
изображений оттенков серого для обоих бананов, показывающая выбранное пороговое
значение 60
Удаление фона является довольно простой процедурой, но удаление
бесполезных подобластей объекта может оказаться гораздо сложнее.
Сложность сегментации может варьироваться в зависимости от каждой
24
задачи. На рисунке 5 сравниваются результаты сегментирования пор и
клеточного материала яблочной ткани по данным рентгеновской
компьютерной томографии (КТ) с использованием глобального порогового
значения и комбинации с методом сегментации на основе регрессии
(кригинга). Для автоматической сегментации пор яблок из стопки КТ-
изображений распространенной практикой использования простого
глобального порога является выбор порогового значения, которое
соответствовало бы заранее заданному объемному измерению пористости.
Однако эта процедура очень субъективна и может привести к искажениям,
когда человек пытается сегментировать и извлекать воспроизводимую
количественную информацию из нескольких изображений (например, для
бинарных 3D-реконструкций из стеков КТ-изображений). Различие между
пустой и полной фазами в рентгенографических изображениях часто не
является резким (т. е. не показывает бимодального распределения) из-за
количества перекрывающихся пиков в гистограмме коэффициента
ослабления и характера рентгеновской томографии (где обработка и анализ
основаны на вокселях вместо пикселей). Кроме того, полученное двоичное
изображение ткани яблока с использованием глобальных порогов, равных 60,
является зашумленным (см. рис. 5б), а средняя пористость сильно зависит от
выбранного порогового значения. На рисунке 5д показано распределение
интенсивности передаваемого рентгеновского излучения (сплошная линия,
правая ось), измеренное для реконструированных томографических
изображений ткани яблока, а также типичная зависимость пористости
(окружности, левая ось) полученного сегментированного изображения при
выборе простого глобального порога [4].

25
Рис. 5. Процесс сегментации изображений ткани яблока с использованием простых
глобальных методов сегментации на основе порогового значения и кригинга: а – исходное
изображение в оттенках серого; б – сегментированное изображение с использованием
простого глобального порогового значения 60; в – сегментированное изображение после
использования окна порогового значения T0 (=40) и T1 (=70) и индикаторного кригинга для
обнаружения краев; г – сегментированное изображение после очистки в с помощью
операций эрозии и дилатации; и д – распределение интенсивности передаваемого
рентгеновского излучения (сплошная линия, правая ось), измеренное для
томографических изображений ткани яблока, и типичная зависимость пористости
(окружности, левая ось) полученного сегментированного изображения при выборе
простого глобального порога
В качестве альтернативны, существует алгоритм порогового
удержания, разработанный Oh и Lindquist (1999) [4], который представляет
собой непараметрическую формулировку, способную анализировать области
неопределенности на основе оценки пространственной ковариации

26
изображения в сочетании с индикаторным кригингом для определения краев
объекта. Использование индикаторного кригинга делает пороговое значение
локальным на основе двух пороговых значений, T0 и T1, и гарантирует
гладкость в пороговой поверхности. Реализация метода требует априорной
идентификации популяции некоторого процента изображения. Таким
образом, для порогового шага изображения ткани яблока, пороговые
значения серого цвета были установлены на уровне 40 и 70. В соответствии с
этим пороговым окном, поры были идентифицированы как воксели с серыми
значениями менее 40, а воксели с серыми значениями более 70 были
классифицированы как клеточный материал (в общем случае, не краевой).
Наконец, оставшиеся воксели популяции были идентифицированы
индикатором кригинга (см. рис. 5в). Небольшие несвязанные пустотные или
полнофазные компоненты, которые могут являться либо физическими
объектами, либо возникать из-за ошибки сегментации, могут быть очищены
от каждого изображения с помощью морфологической процедуры,
называемой открытием, которая включает в себя простой этап эрозии,
сопровождаемый дилатацией (см. рис. 5г).

1.4.2. Метод многопорогового представления изображений


Также весьма эффективным является метод сегментации изображений
с применением многопороговой обработки. Такая обработка преобразует
исходное монохромное изображение в набор бинарных сечений (срезов). В
случае достаточно большого числа порогов можно считать, что потери
информации при такой трансформации отсутствуют. В то же время бинарные
изображения обрабатываются легче и быстрее, чем многоуровневые.
Эта обработка преобразует исходное монохромное изображение в
набор бинарных компонентов, которые называются сечения или срезы. Если
имеется достаточно большое число порогов, то можно полагать, что при
трансформации не происходит потери информации. При этом, по сравнению

27
с многослойными изображениями, бинарные изображения обрабатываются
куда легче и быстрее.
При объединении полученных бинарных сечений учитываются
изменения площади, занимаемой каждым объектом, при увеличении
порогового уровня. В результате получается трехмерная иерархическая
структура, в которой каждый объект занимает некоторый определенное
количество пространства. В некоторых случаях один пиксел изображения
может принадлежать нескольким объектам. Дальнейшая селекция
осуществляется с использованием различных геометрических критериев.
Результаты селекции объектов при каждом пороговом значении могут быть
использованы для адаптации пороговых уровней и результирующей
сегментации изображения.
Имеется множество литературных источников, рассматривающие
различные вариации использования метода многопороговой обработки для
сегментации изображений, которые достаточно подробно рассмотрены в
работах [1] – [3]. Многопороговая сегментация базируется в основном на
свойствах гистограммы интенсивности исходного изображения. В
большинстве случаев последним шагом становится выбор единственного
(глобального) оптимального порогового значения, тогда как для каждого
объекта часто требуется установить свой (локальный) порог. Свойства
объектов интереса и результаты их селекции при этом никак не учитываются
[2].
Чтобы реализовать селекцию необходимо описать ожидаемые свойства
объектов. Основными требованиями являются связность пикселов в области
интересующего объекта и изолированность одного объекта от другого.
Обычно существует серьезная нехватка информации об объектах, за
исключением типичных размеров и некоторых предположений о площади,
периметре, форме и ориентации.
Существует альтернативная идея, которая состоит в выборе и
установке оптимального порогового значения по критерию максимума
28
гистограммы числа объектов и/или суммарной площади, занятой объектами,
попадающими в заданный диапазон площадей, по результатам
предварительной селекции объектов для множества тестовых пороговых
значений. Такой подход предложен в работах [11], [12] для выделения малых
объектов. Он эффективен, если в анализируемых изображениях имеется
много однотипных объектов, тогда выбор наилучшего порога основан на
достаточной статистике. В отличие от этого, анализ гистограммы суммарных
площадей предпочтителен в условиях небольших выборок.
Развитие данной идеи основано на форме селектируемых объектов. В
случае, если описанная методика не позволяет четко выбрать оптимальный
порог, наиболее простым вариантом является выбор одного из близких по
значению локальных экстремумов гистограммы. В этом случае существует
дополнительный геометрический параметр объекта, например, отношение
квадрата периметра к его площади или отношение квадрата главной оси
описывающего эллипса к площади объекта. Предлагаемый метод был
использован, в частности, для селекции определенных типов клеток на
микроскопических изображениях биологических срезов [1], [13].
Дальнейшее исследование описанного метода изложено в следующих
разделах данной работы и подразумевает под собой оценивание
геометрических параметров объектов на бинарных изображениях после
многопороговой обработки и селекции их по рассчитанным геометрическим
показателям формы. В следующих разделах исследуется метод селекции
объектов по средствам многопороговой обработки изображений.

1.5. Количественный анализ


Большая часть компьютерного зрения связана с извлечением
особенностей из изображений. Методы, с помощью которых численные
измерения извлекаются из изображений, значительно различаются по
технологической сложности. Процесс измерения изображения предполагает
колоссальное сокращение объема данных, путем выделения из исходного
29
изображения тех объектов и параметров, которые важны для дальнейшей
характеристики и классификации объектов. Это выделение и уменьшение
лежит в основе анализа и измерения изображений, и оно достигается путем
игнорирования несущественной информации.
Наиболее часто встречающимися признаками являются цвет, текстура
и морфология. Они легко поддаются измерению, но могут быть трудны для
краткой характеристики. После обработки изображения и определения
интересующей области эта область должна быть описана измеримыми
признаками, основанными на стандартных химических и физических
измерениях (например, цветовые параметры с помощью колориметра или
спектрофотометра, твердость с помощью пенетрометра, содержание
растворимых твердых веществ с помощью рефрактометра и т. д.), или
эмпирические стандарты, разработанные экспертами (стандартные
диаграммы цвета, блеска и текстуры пищевых поверхностей, а также
сенсорные оценки). Многие методы обработки изображений, разработанные
для 2D-изображений, также могут быть расширены до анализа многомерных
изображений, таких как мультиспектральные или гиперспектральные
изображения и томографические изображения. Далее достаточно подробно
описаны три основных подхода и метода, используемые в анализе
изображений: анализ цвета, анализ текстуры изображения и геометрический
или морфологический анализ, сопровождаемый конкретными примерами
применения в контроле качества пищевых продуктов [4].

1.6. Цветовой анализ


Цвет определяется геометрией и спектральными распределениями трех
элементов: источника света, отражательной способности образца и
визуальной чувствительности наблюдателя. Каждый из них был определен
международной комиссией по охране окружающей среды (Commission
Internationale de I’Eclairage – CIE) в 1931 году. Эта комиссия также
определила для целей измерения цвета конус спектральной чувствительности
30
среднего наблюдателя и ввела несколько методов для объективного описания
цвета. Это определение было направлено на стимулирование цветового
восприятия человека на основе 2-х полей зрения, набора первичных функций
(красный, зеленый, синий) и функций подбора цветов (1986). Несколько
стандартных осветительных приборов, которые определяются их цветовыми
температурами, также были определены этой комиссией. Наиболее
распространенным из них является стандартный осветитель D65,
соответствующий излучению черного тела при 6500оК, который
предназначен для представления среднего дневного света [4].
Чтобы точно определить цвета объектов и цветовые различия, CIE
рекомендовала два цветовых пространства, которые менее зависят от
освещения, а именно CIELAB или L*a*b* и CIELUV L*u*v*. Пространство
CIELAB имеет функцию коррекции для хроматической адаптации к белой
точке и предназначено для отображения цвета объекта. Пространство
CIELUV определяется аналогичным образом, и координата (L*, u*, v*)
вычисляется из Y и (u’, v’) данного светового воздействия и белой точки [4].
Цветовая разница в пространстве CIELAB вычисляется как Евклидово
расстояние между точками в этом трехмерном пространстве и задается по
формуле [4]
1/2
  L*    a*    b*   .
2 2 2
Eab
*
(1)
 
*
Уравнение 1 называется формулой разности цветов. Цветность Cab и
*
угол оттенка hab также вычисляются из (L*, a*, b*) по формулам [4]

  a*2  b*2 
* 1/2
Cab , (2)
*
hab  tan 1 (b* / a* ) . (3)

Системы компьютерного зрения, основанные на цветных цифровых


камерах, могут легко и быстро количественно определять цвет любого

31
объекта. Различные цветовые каналы дают различную цветовую
информацию о распределении интенсивности пикселей изображения, и
поэтому оценки с использованием различных цветовых компонентов
представляют собой преимущество в дальнейших задачах качественной
характеристики и классификации. Однако усредненные цветовые результаты
от криволинейных и/или неровных поверхностей, характерные для многих
свежих продуктов, следует интерпретировать с осторожностью. Анализ
чувствительности цветовых измерений с помощью общей системы
машинного зрения для образцов с криволинейными поверхностями (бананы
и красный перец) показал, что L*a*b* более подходит для цветового
представления поверхностей или материалов, освещенных источником света.
Эти цветовые профили менее подвержены влиянию степени кривизны, теней
и блеска поверхностей, чем цветовые системы RGB и HSV, и, следовательно,
более подходят для измерения цвета пищевых поверхностей. Пример
влияния кривизны на желтый банан с использованием цветовых шкал L*a*b*
и HSV проиллюстрирован на рисунке 6. Цветовые шкалы L* и V были очень
чувствительны к кривизне поверхности банана, в то время как шкала S также
была чувствительна к кривизне поверхности, но в меньшей степени. Для
шкал a*, b* и H наблюдались либо минимальные цветовые вариации, либо не
наблюдались вовсе [4].

32
Рис. 6. Цветовые профили, выраженные в цветовых шкалах L*a*b* и HSV для желтого
банана. Профили были построены с использованием средних значений пикселов в
продольном направлении сегментированного изображения и его угловых положениях,
варьирующихся от – 90о до 90о

1.7. Анализ текстур


Текстуру изображения можно определить, как пространственную
организацию вариаций интенсивности в изображении на различных длинах
волн, таких как видимая и инфракрасная части электромагнитного. Текстура
изображения является важным аспектом изображения, и текстурные
особенности играют важную роль в анализе изображений. В некоторых
изображениях она может быть определяющей характеристикой регионов и
критически важной для получения правильного анализа. Эти особенности
дают обобщенную информацию, определяемую из карт интенсивности
сцены, которая может быть связана с визуальными характеристиками
(грубость текстуры, регулярность, наличие привилегированного направления
и т. д.), а также с характеристиками, которые не могут быть визуально
дифференцированы.

33
Текстура – это свойство областей, поэтому для точки нет текстуры.
Текстура включает в себя пространственное распределение уровней серого
цвета, и существует необходимость в значительном количестве единиц
интенсивности (например, пикселей) в регионе для обнаружения текстурных
объектов. Это связано с тем, что текстура включает в себя уровни серого
цвета в пространственной окрестности. Существует множество методов
анализа текстур, которые могут быть применены к изображениям. К числу
наиболее популярных методов, используемых для характеристики и оценки
пищевых поверхностей и биологических структур, относятся: статистика
первого порядка, матрицы встречаемости серого уровня и длины пробега, а
также фракталы [4].

1.8. Морфологический анализ


После того, как набор областей исследования был идентифицирован
сегментацией изображения, отдельные области (объекты) или силуэты могут
быть описаны их геометрическими и фигурными свойствами. Большинство
систем анализа изображений предлагают ряд мер, связанных с размером и
формой, и производят числовой вывод, пригодный для дальнейшей
характеристики и классификации изображений. По сравнению с другими
характеристиками, такими как цвет и текстура изображения, размер и форму
куда легче измерить с помощью методов обработки изображений. К числу
таких морфологических свойств относится подсчет объектов определение их
положения, шероховатости поверхности и ориентации на изображении.
Многие приложения для анализа изображений должны характеризовать
или описывать распределение размеров частиц на бинарных изображениях.
Распространенным способом обобщения данных для конкретной системы
является построение частотной гистограммы количества частиц в
определенном размерном классе. Кроме того, поскольку многие
естественные выборки в целом имеют форму нормального или гауссовского
распределения, это позволяет применять статистические методы для оценки
34
доверительных параметров и давать рекомендации по минимальному
количеству анализируемых частиц для достижения разумного уровня
статистической значимости. Другим широко используемым методом
отображения данных является вычисление кумулятивного распределения,
которое показывает, какой процент материала лежит выше или ниже
определенного размера.
Для измерения размеров объекта обычно используются три признака:
площадь, периметр, длина и ширина. Самым основным измерением размера
является площадь, которая представлена количеством пикселей внутри
области и прямо определяется путем подсчета. Периметр объекта – это длина
его границы, и он особенно полезен для различения объектов с простыми и
сложными формами. Площадь и периметр легко вычисляются по
сегментированному изображению, однако качество измерений сильно
зависит от сложности измеряемых объектов и эффективности метода
сегментации. Длина и ширина объекта также могут быть использованы для
измерения размера объекта. Необходимо найти главную ось объекта и
измерить ее относительную длину и ширину.
Хотя относительные измерения процента пикселей выбранных
областей на изображении могут быть сделаны для различных оценок размера
частиц, в некоторых приложениях нам нужно знать размеры x и y
изображения в его реальных размерных единицах. Следовательно, прежде
чем делать какие-либо измерения, необходимо сначала определить
отношения между размером пикселя и размером объекта известной длины
(например, в мм), который виден на изображении. Масштабный
калибровочный коэффициент (f) для направлений x и y может быть
определен следующим образом [4]:

(4)
Одного измерения размера иногда бывает недостаточно, чтобы
обнаружить важные, но тонкие различия между объектами. Это происходит
35
потому, что объекты с одинаковым составом и/или структурой могут
измерять одну и ту же площадь или периметр, но иметь разные формы.
Часто объекты одного класса можно отличить от других по их форме,
которая представляет собой физические измерения размеров,
характеризующие внешний вид объекта. Особенности формы могут быть
измерены независимо и путем комбинирования измерений размеров. В
таблице 1 приведены некоторые из наиболее широко используемых
характеристик формы с комбинациями измерений размеров для анализа в
логистической модели [4].

36
Таблица 1. Общие показатели формы
Статистический параметр Расчет
Суммарный модуль угла поворота
контура объекта, нормированный к
его длине
Соотношение площадей

Соотношение сторон
Диапазон диаметров

Эксцентриситет

Удлинение
Отклонение от округлости

Аэродинамический коэффициент

Представленные показатели формы используются в дальнейшей работе


при разработке алгоритма реконструкции и структурного анализа объектов
по данным проникающего лазерного сканирования. Фрагменты кода с
использованием вышеуказанных показателей формы представлены в
приложении А.

37
2. МНОГОПОРОГОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ

2.1. Основы многопороговой обработки


В настоящее время сегментация изображения на отдельные объекты
обычно основывается на таких характеристиках, как равномерность
интенсивности и соответствие цветов. Методы, основанные на областях,
построены на предположении, что соседние пиксели в пределах области
объекта демонстрируют более или менее сходные значения. Детальный обзор
методов сегментации объектов, которые достаточно универсальны для
различных приложений анализа изображений, не ограничиваясь системами
дистанционного зондирования, микроскопической и/или биомедицинской
визуализацией, классифицирует методы сегментации в соответствии с
объектами, с которыми они имеют дело, на четыре категории. Каждая из
категорий основана на своем ключевом элементе: 1) пикселях; 2) границах;
3) областях; 4) другом. К первой категории относятся методы пороговой
обработки и кластеризации, ко второй – детекторы границ. Третья категория
включает в себя метод водораздела, разделение и слияние, наборы уровней и
активные контуры. Оставшаяся четвертая категория касается использования
вейвлетов, нейронных сетей и нечетких множеств [1, 2].
Разнообразие доступных методов создает проблему выбора
наилучшего алгоритма для решения задачи в условиях априорной
неопределенности. Оно также усложняет воспроизводимость результатов,
учитывая количество свободных входных параметров, которые
устанавливаются пользователем и часто выбираются субъективно [2].
В подразделе 1.4 были рассмотрены различные методы сегментации
изображений; для дальнейшего исследования необходимо определить, какой
метод лучше всего подходит для решения задач, поставленных в этой
выпускной квалификационной работе. Распознавание изображений в
системах дистанционного наблюдения и компьютерного зрения основано на

38
двух концепциях: компактности объектов, представляющих интерес по
сравнению с фоном, и их изоляции, то есть наличия границ. Если
интенсивность объектов превышает интенсивность окружающего
однородного фона, сегментация по глобальному пороговому уровню
является простым и подходящим решением. Среди известных подходов к
выбору глобального порогового значения пользуется популярностью метод
Otsu [4]. В большинстве практических сцен объекты значительно размыты, а
фон неоднороден, что приводит к значительному перекрытию распределений
интенсивности и к неизбежным ошибкам. Поэтому для эффективного
выделения требуется установка адаптивного порога для каждого отдельного
объекта, что является недостаточно эффективным методом для решения
поставленных задач.
Одним из достаточно простых и универсальных способов установки
адаптивного порога является метод с использованием скользящего окна,
которое несколько больше, чем объекты, представляющие интерес [10].
Выбор правильного размера окна напрямую зависит от знания типичного
размера объекта, используемого для усреднения. Если размеры
потенциальных объектов исследования неизвестны или значительно
различаются между различными объектами, требуется использование
комбинации окон разных размеров. Кроме того, увеличение размера окна
приводит к неизбежному снижению пространственного разрешения, а также
к значительному преобразованию формы выделяемых объектов, что
нежелательно.
В качестве альтернативы подходу со скользящим окном следует
отметить многопороговую обработку изображений [1]. Поскольку цифровое
изображение имеет несколько уровней квантования, оно может быть
представлено серией двоичных слоев, соответствующих всем точкам с
интенсивностью, превышающими определенный порог. Преимущество
представления изображения совокупностью бинарных слоев заключается в
простоте их последующего морфологического анализа. Наиболее простым
39
подходом к использованию многопороговых данных является нахождение
единственного уровня, который наилучшим образом соответствует
определенным критериям, и последующий выбор этого уровня для
дальнейшего анализа. Ключевое отличие от известных методов заключается
в решении, основанном на апостериорной информации о свойствах объектов,
которые можно выбрать из каждого бинарного слоя, и нахождении
наилучшего слоя с точки зрения свойств этих объектов. Несмотря на то, что
это требует некоторых вычислительных усилий, для анализа ряда уровней,
это, по большей части, компенсируется простотой пороговой процедуры.
Предложенный подход обобщает метод многопороговой обработки
изображений. Все объекты, делятся на несколько категорий по объективным
критериям. Типичными критериями классификации являются показатели
формы (см. таблица 1), которые включают в себя площадь объекта, периметр,
ориентацию, длину главной оси и другие. Нормированные характеристики
формы и морфология также могут быть использованы, например, на основе о
соотношении между площадью и периметром или длиной главной оси
описывающего эллипса. Перечисленные критерии характеризуют
компактность селектируемых объектов.
Эти подходы являются конструктивными для сегментации
изображений, полученных системами дистанционного зондирования
(лазерные локаторы, SAR, мульти- и гиперспектральные, панхроматические
и т. д.). Однако они также имеют значительные ограничения. Прежде всего,
это сложность вычислительных процедур, связанных с решением задачи
оптимизации и требованием высокой производительности компьютеров,
поскольку часто количество построенных объектов велико. Кроме того,
результаты, полученные с использованием этих методов, значительно
зависят от выбора исходных точек в последовательности итерации, что часто
приводит к решению в зависимости от изменений начальных условий.
Существует возможность несколько уменьшить данные недостатки,
если лучше использовать специфику выбранных объектов обучения, а также
40
комбинацию различных методов преодоления недостатков каждого из них. В
конечном счете все рассматриваемые методы сводятся к организации
пикселов изображения в некие многомасштабные иерархические структуры,
с помощью которых затем можно использовать различные критерии отбора
объектов. Задача состоит в том, чтобы сделать такую структуру более
прозрачной и менее сложной в использовании.

2.2. Методология
В данной работе рассматриваются подходы, основанные на
многопороговой обработке изображений. При достаточно малом пороговом
шаге результирующие бинарные слои хранят всю информацию,
содержащуюся в исходном изображении. В то же время каждый бинарный
слой морфологически легко обрабатывается при низких расчетных затратах.
Один из методов заключается в установлении порога для каждой
категории интересующих объектов, который выбирается на основе
определенного критерия. В этих случаях мы используем различные
параметры для описания категории объектов, такие как площадь объекта, его
ориентация или характеристики, являющиеся инвариантными, например,
отношение квадрата периметра к площади, степень сжатия эллипса, а также
другие геометрические или текстурные характеристики. Обычно категория
объектов задается соответствующим диапазоном признаков. Тогда каждый
бинарный слой выбирает объекты, соответствующие заданным свойствам, а
порог бинаризации для этих объектов выбирается таким образом, чтобы
максимальное количество объектов данной категории (или их общая
площадь соответственно) было выбрано с учетом требуемого сохранения
формы объекта. Существует возможность автоматизации этого процесса, из
чего следует адаптивный метод установки глобального порога.
Тем не менее такой подход не позволяет установить индивидуальное
пороговое значение для каждого интересующего объекта, если объекты
принадлежат разным категориям. Чтобы выбрать локальный порог,
41
необходимо установить связи между отдельными слоями, причем каждый
пиксел должен принадлежать одному и тому же или новому объекту,
который возникает на месте предыдущего из-за эффекта фрагментации при
увеличении порогового уровня. Необходимо установить связи между
пикселями с одинаковыми координатами на разных бинарных срезах. Если
задать конкретный параметр, определяющий заданные отношения между
пикселями, то появляется возможность сформировать трехмерную
иерархическую структуру, основанную на одном двоичном (белом) объекте,
полученном при нулевом пороговом значении и совпадающем по площади со
всем изображением.
Для частичного преодоления вышеуказанных ограничений,
предлагается структура, основанная на перколяции. Начнем с того, что
рассмотрим ситуацию, когда T = 0, а I(x, y) > 0, что удовлетворяет всему
изображению, образуя тем самым двоичный слой, который содержит один
глобальный изолированный (базовый) объект с площадью S0, равной
полному размеру изображения, что иллюстрируется на рисунке 7 (нижний
слой). Затем пороговое значение T увеличивается на ΔT, так что некоторые
пиксели появляются ниже нового порога ΔT, и выше создается новый
бинарный слой, удовлетворяющий условию I(x, y) > ΔT. Если шаг ΔT
относительно мал и из объекта исключается лишь небольшая часть пикселей,
то глобальный (базовый) изолированный объект остается связанным,
несмотря на уменьшение его площади ST < S0 [1].

42
Рис. 7. Иллюстрация многопорогового 3D-представления изображений, содержащих: а –
поле случайной интенсивности (шум) и в – два регулярных (прямоугольных) объекта с
наложенным (аддитивным) шумом; б – два прямоугольных объекта с наложенным
аддитивным шумом. 3D-реконструкции показывают, как объекты проходят через
несколько бинарных слоев. Изменения от нижнего к верхнему слою показывают
фрагментацию объекта с усилением порога до момента достижения порога перколяции и
полного исчезновения объекта
На каждом шаге отношение площадей объектов, которые
располагаются на соседних срезах (ST+ΔT / ST), характеризует долю связанных
пикселей, которые сохраняются внутри изолированного объекта. До тех пор,
пока это соотношение равно или больше половины, объект в верхнем слое
следует рассматривать как однозначного преемника объекта в нижнем слое,
который в свою очередь оказывается его единственным предшественником.
Дальнейшие добавления к пороговому значению оставляют все большее
число пикселей ниже новых порогов T+k ΔT, где k – номер слоя
(целочисленный), k = 0,1, ..., K, по мере чего площадь объекта уменьшается.
В конечном счете увеличение порога приводит к образованию зазоров
в базовом объекте, что приводит к отделению от него изолированных

43
фрагментов. Отношение ST+ΔT/ST можно считать характеристикой
устойчивости объекта по мере увеличения порога, его следует обозначать Kp.
В определенной критической точке, которая соответствует порогу
перколяции Tc, доля пикселей с интенсивностью ниже порога становится
достаточно большой, и эти пиксели начинают сливаться вместе, при этом
образуя большой глобальный разрыв, который ограничивается только
размером изображения, что приводит к фрагментации и разрушению
базового объекта. Такое событие фазового перехода известно, как
перколяция [1].
Как только параметр устойчивости равен или больше половины
(Kp ≥ 0,5), и объект при этом фрагментирован на две равные части, тогда
всегда будет существовать (учитывая то, что граничные пиксели выпадают
из общей площади) его неоднозначный преемник в верхних для него слоях
вплоть до разрушения исходного объекта и появления вместо него двух или
более новых объектов. Рассмотрение больших значений Kp (выше 0,5)
позволяет увеличить разрешающую способность анализа и количество
объектов, в то время как при меньшем значении параметра устойчивости (Kp
< 0,5) один изолированный объект в нижнем слое может иметь более одного
последовательного изолированного объекта в верхнем для него слое, что
приводит к однозначности. Доля пикселей в объекте, которая рассчитывается
как отношение площади объекта при пороге перколяции к общей площади
исходного объекта (Pc = STc/S0), интенсивность которой превышает порог
перколяции Tc, является коэффициентом перколяции для этого объекта.
Начальный двоичный слой для нового объекта формируется в момент
перколяции предшественника, после чего новый объект накапливает
дальнейшие двоичные представления для различных пороговых значений T
до тех пор, пока выполняется условие I(x, y) > Tk. Фактически коэффициент
перколяции характеризует текстуру поверхности объекта. Если объект имеет
плоскую вершину с постоянным значением интенсивности I(x, y) = const, то
он полностью исчезает за один пороговый шаг, а его коэффициент
44
перколяции становится равен единице, Pc = 1. В таком случае, само значение
интенсивности не влияет на величину коэффициента перколяции, другими
словами, оно оказывается инвариантным к таким преобразованиям, как сдвиг
или масштабирование изображения. Если объект плавно меняет свою
интенсивность, иначе говоря, имеет небольшой градиент интенсивности, то
наследственность между соседними слоями, по мере увеличения порога,
будет сохраняться до тех пор, пока выполняется условие ST+ΔT ≥ Kp·ST.
Чтобы убедиться, что объект имеет единственного преемника, его
значение Kp должно оставаться между 0,5 и 1 в каждом из верхних слоев. Все
остальные отделенные фрагменты при этом рассматриваются как новые
объекты. Каждый из них изначально появляется при базовом пороговом
значении Тb. Чтобы увеличить детализацию, значение Kp должно равняться
единице, что является наиболее жестким требованием, так как потеря даже
одного пикселя исходного объекта приводит к образованию нового объекта.
С другой стороны, выбор Kp = 0,5 приводит к значительному уменьшению
общего числа трехмерных объектов, проходящих через несколько бинарных
слоев.
После применения подхода, описанного выше, формируется
трехмерная иерархическая структура, содержащая все выделенные объекты,
в которой каждый пиксель уже не принадлежит одному бинарному слою, а
может соответствовать нескольким бинарным слоям в структуре k = 0, ..., К.
Основываясь на этой реконструкции, сегментация изображения и выбор
объекта могут быть легко обобщены [1].

2.3. Инвариантные геометрические критерии адаптации


Среди различных практических задач, которые решаются
предложенным трехмерным представлением с использованием
многопороговой обработки, адаптивная пороговая сегментация изображений
и выбор объектов является одной из наиболее простых. В таком случае
каждый пиксель будет присвоен только одному объекту. Для каждого
45
выбранного интересующего объекта, проходящего через несколько бинарных
слоев в трехмерном представлении, оптимальный порог Topt, который
соответствует слою с его лучшим плоским представлением, может быть
выбран по различным геометрическим или текстурным критериям.
Примерами таких критериев являются площади или диапазоны площадей
выбранных объектов. Этот критерий оказывается эффективным, когда
необходимо выбрать множество подобных объектов, и статистика достаточна
для получения достоверной оценки оптимального порогового значения.
Ключевым недостатком является то, что такой подход связан с абсолютными
значениями площадей интересующих объектов и поэтому не может
рассматриваться как масштабно-инвариантный.
Инвариантные геометрические метрики, которые в значительной
степени преодолевают вышеуказанное ограничение, включают коэффициент
удлинения периметра, определяемый как PS = P2/4πS, где P – это периметр
объекта, а S – его площадь. В более общем смысле этот коэффициент
известен как метрика компактности области. Еще одним геометрическим
инвариантом, который также характеризует компактность, является
коэффициент удлинения главной оси L, определяемый как PL = πL2/4S. Эти
метрики нормализуются таким образом, что они равны единице для круглых
(либо квадратных) объектов, при этом увеличиваются в случае удлинения
либо края, либо самого объекта соответственно. Если интересующие объекты
компактны, то для отбора каждого из них может быть выбран один бинарный
слой, что обеспечивает минимум соответствующей оценки указанных мер
[1].
Коэффициенты PS и PL увеличиваются при действии аддитивного
шума, что наглядно прослеживается на рисунке 8. На рисунке 8а приведен
объект круглой формы на фоне аддитивного белого шума. Отношение
сигнал-шум примерно равно единице. Изображение, полученное в результате
моделирования, было преобразовано в 8-битный цифровой формат для
интенсивностей, чтобы получить значения в интервале [0,255]. После
46
сравнения с порогом T было получено несколько двоичных изображений (см.
рис. 8б-д). Широко используемый метод Otsu дает слишком большой шум из-
за низкого порога (см. рис. 8б). С помощью селекции объектов по площади
можно удалить мелкие объекты, в результате чего исчезнет большинство
шумовых выбросов (рисунок 8в). Однако полезный объект при низком
пороге обрастает фрактальными отростками, его границы существенно
искажаются и объект характеризуется повышенными значениями PS за счет
увеличения периметра [10].

Рис. 8. Результаты бинаризации и селекции объекта, где а – тестовое изображение; б – с


порогом Otsu Т = 125; в – после селекции по площади с порогом Otsu Т = 125; г – с
оптимальным порогом Т = 155 после селекции; д – фрагментация объекта с высоким
пороговым значением Т = 160; е – зависимость коэффициента PS от пороговых значений.
Можно видеть, что с увеличением порога наименьшее искажение
границ и формы объекта достигается при некотором оптимальном значении
Topt (см. рис. 8г). В этом случае коэффициент PS минимален. Дальнейшее
увеличение порогового уровня приводит к разрушению объекта, его
дефрагментации (см. рис. 8д), что приводит к росту коэффициента PS.
Типичная зависимость коэффициента PS от пороговых значений приведена на
рисунке 1е. Она позволяет реализовать адаптивную установку порога для
каждого из объектов по минимальному значению коэффициента PS.
47
Реализация алгоритма на основе вышеуказанных геометрических
метрик приведена на рисунке 10. Код, с помощью которого был реализован
алгоритм приведен в приложении А.

2.4. Селекция объектов по площади


При применении селекции объектов по площади считается, что
основным свойством, отличающим объект интереса от шумового фона,
является связность смежных пикселов на бинарном изображении IT. Прежде
всего, рассмотрим пороговую обработку изображений с помощью
глобального порогового значения. Структура алгоритма селекции объектов
по площади приведена на рисунке 9.

Рис. 9. Алгоритм селекции объектов по площади


На вход данной системы подаётся исследуемое изображение, которое
впоследствии подвергается пороговой обработке. В блоке регистрации
происходит приём цифрового изображения, после чего в фильтре F
осуществляется предварительная фильтрация и сглаживание входного
изображения, подчёркивание перепадов и границ, а также устранение
нестационарности фона и различных импульсных помех. Затем квантователи
формируют, полученные путём разбиения трёхмерного изображения,

бинарные слои M с использованием порогов Tm, где 𝑚 = 1, M . После этого


созданные двоичные слои поступают на вход системы из k каналов, каждый
из которых настроен на определённый диапазон площадей изолированных

объектов Sk, где 𝑘 = 1, K . Каналы включают в себя преселекторы и счётчики,

48
которые подсчитывают число выделенных объектов и пикселей, из которых
эти объекты состоят. В результате адаптации для каждого такого канала

выбирается своё значение порога Tmk , то есть свой бинарный срез, который
содержит объекты, отселектированные наилучшим способом, и при этом
имеющие площадь в заданном диапазоне. Соответственно, на выходе каналов
образуется множество отселектированных слоёв. Затем они поступают в
блок, где происходит выбор оптимальных канала и порога с учетом
априорных ограничений, что соответствует максимальному числу пикселов,
отнесенных к объектам. Номер канала и значение порогового уровня (номер
слоя) передаются в выходной селектор. В итоге, на выход передаётся
бинарное изображение, поступившее с первого входа, соответствующее
параметрам, поступившим со второго входа [2].

2.5. Методы структурного анализа


Целью дальнейшей работы является дифференциация ложно
выделяемых объектов от объектов, которые выделяются верно.
На рисунке 10 представлена реализация алгоритма сравнения селекции
клеток по данным референсного массива и селекции, проводимой по
средствам метода адаптивного выделения объектов на цифровых
изображениях. Очень четко прослеживаются пропуски объектов (обозначены
синим цветом, имеют значение, равное -1) и ложно выделенные элементы
объектов (обозначены красным цветом, имеют значение, равное 1).

49
Рис. 10. Селекция объектов с помощью: а – референсного массива, б – метода адаптивного
выделения объектов, в – разница между а и б: -1 – пропуски, +1 – ложное выделение. Слой
№11

50
Помимо этого, была реализована селекция объектов по другим восьми
показателям формы, которые приведены в подразделе 1.8, в таблице 1; а
также построены графики сравнения селекции объектов по указанным
признакам с данными референсного массива.
На рисунке 11 приведен график зависимости значения суммарного
модуля угла поворота контура объекта, нормированного к его длине, от
номера слоя (порогового значения).

Рис. 11. График зависимости значения показателя суммарного модуля угла поворота
контура объекта, нормированного к длине этого контура, от номера слоя: синим указаны
значения показателя формы при выделении объектов, пурпурным – значения
референсного массива, красным – средние значения показателя формы, зеленым – средние
значения референсного массива
На рисунке 12 приведен график зависимости значения соотношения
площадей от номера слоя.

51
Рис. 12. График зависимости значения соотношения площадей от номера слоя: синим
указаны значения показателя формы при выделении объектов, пурпурным – значения
референсного массива, красным – средние значения показателя формы, зеленым – средние
значения референсного массива
На рисунке 13 приведен график зависимости значения соотношения
сторон от номера слоя.

52
Рис. 13 График зависимости значения соотношения сторон от номера слоя: синим указаны
значения показателя формы при выделении объектов, пурпурным – значения
референсного массива, красным – средние значения показателя формы, зеленым – средние
значения референсного массива
На рисунке 14 приведен график зависимости значения диапазона
диаметров от номера слоя.

53
Рис. 14. График зависимости значения диапазона диаметров от номера слоя: синим
указаны значения показателя формы при выделении объектов, пурпурным – значения
референсного массива, красным – средние значения показателя формы, зеленым – средние
значения референсного массива
На рисунке 15 приведен график зависимости значения эксцентриситета
от номера слоя.

54
Рис. 15. График зависимости значения эксцентриситета от номера слоя: синим указаны
значения показателя формы при выделении объектов, пурпурным – значения
референсного массива, красным – средние значения показателя формы, зеленым – средние
значения референсного массива
На рисунке 16 приведен график зависимости значения удлинения от
номера слоя.

55
Рис. 16. График зависимости значения удлинения от номера слоя: синим указаны значения
показателя формы при выделении объектов, пурпурным – значения референсного
массива, красным – средние значения показателя формы, зеленым – средние значения
референсного массива
На рисунке 17 приведен график зависимости значения отклонения от
округлости от номера слоя.

56
Рис. 17. График зависимости значения отклонения от округлости от номера слоя: синим
указаны значения показателя формы при выделении объектов, пурпурным – значения
референсного массива, красным – средние значения показателя формы, зеленым – средние
значения референсного массива
На рисунке 18 приведен график зависимости значения
аэродинамического коэффициента от номера слоя.

57
Рис. 18. График зависимости значения аэродинамического коэффициента от номера слоя:
синим указаны значения показателя формы при выделении объектов, пурпурным –
значения референсного массива, красным – средние значения показателя формы, зеленым
– средние значения референсного массива
Далее были построены графики зависимости вероятности ложного
выделения объекта от значений все тех же показателей формы, где 0 –
означает, что объект выделен верно, а 1 – объект выделен ложно. Ниже, на
рисунках 19 – 25 приведены эти графики.

58
Рис. 19. График зависимости вероятности ложной тревоги от значения суммарного угла
поворота контура, нормированного к его длине: синим указаны значения показателя
формы при выделении объектов; зеленым – объекты, расположенные близко друг к другу,
которые при выделении были опознаны, как один объект; красным – ложно выделенные
объекты

59
Рис. 20. График зависимости вероятности ложной тревоги от значения соотношения
площадей: синим указаны значения показателя формы при выделении объектов; зеленым
– объекты, расположенные близко друг к другу, которые при выделении были опознаны,
как один объект; красным – ложно выделенные объекты

60
Рис. 21. График зависимости вероятности ложной тревоги от значения соотношения
сторон: синим указаны значения показателя формы при выделении объектов; зеленым –
объекты, расположенные близко друг к другу, которые при выделении были опознаны,
как один объект; красным – ложно выделенные объекты

61
Рис. 22. График зависимости вероятности ложной тревоги от значения диапазона
диаметров: синим указаны значения показателя формы при выделении объектов; зеленым
– объекты, расположенные близко друг к другу, которые при выделении были опознаны,
как один объект; красным –ложно выделенные объекты

62
Рис. 23. График зависимости вероятности ложной тревоги от значения эксцентриситета:
синим указаны значения показателя формы при выделении объектов; зеленым – объекты,
расположенные близко друг к другу, которые при выделении были опознаны, как один
объект; красным – ложно выделенные объекты

63
Рис. 24. График зависимости вероятности ложной тревоги от значения удлинения: синим
указаны значения показателя формы при выделении объектов; зеленым – объекты,
расположенные близко друг к другу, которые при выделении были опознаны, как один
объект; красным – ложно выделенные объекты

64
Рис. 25. График зависимости вероятности ложной тревоги от значения аэродинамического
коэффициента: синим указаны значения показателя формы при выделении объектов;
зеленым – объекты, расположенные близко друг к другу, которые при выделении были
опознаны, как один объект; красным – ложно выделенные объекты
На рисунке 22 можно наблюдать, что большое количество близко
расположенных объектов при селекции выделились, как один объект, из чего
можно сделать вывод, что метод селектирования объектов с помощью
диапазона диаметров является малоэффективным.

2.6. Множественная линейная регрессия


Далее в исследовании рассматривается модель множественной
линейной регрессии. Модель множественной регрессии позволяет находить и
изучать зависимости переменной Y от нескольких объясняющих переменных
X1, X2, …, Xn. [14]

65
Множественная линейная регрессия используется для нахождения
статистически значимой связи между наборами переменных, то есть для
поиска тенденций в наборах данных.
Пусть проведено n наблюдений, в результате которых получены
следующие эмпирические наборы данных, тогда модель множественной
линейной регрессии будет иметь вид [15]:
yi   0  1 xi1   2 xi 2 ...   k xik   i , (5)

где i=1, 2, …, n, xi1 , xi 2 ..., xip – это набор переменных, yi – зависимая

переменная,  i – случайная составляющая,  k – коэффициент регрессии.

Переменные y и  являются реализациями случайных величин Y и X.


Единственным источником неопределенности в уравнении (5) является

случайная составляющая модели . Переменные xi1 , xi 2 ..., xik называются

вспомогательными переменными для свободного члена. Эту переменную


вводят для удобства записи множественной линейной регрессии.

Коэффициент регрессии  k является свободным членом и называется

параметром сдвига.
В том случае, когда в модели регрессии имеется множество
переменных, рациональнее использовать матричные обозначения.
Теоретические концепции анализа и необходимые процедуры расчета можно
облегчить матричным описанием регрессии.
Тогда переменные, записанные в матричной форме, будут иметь
следующий вид

 y1  1 x11 ... x1k   1   1 


y  1 x
... x2 k 
   
Y  2
,X  31
,   2
,   2  , (6)
 ...  1 ... ... ...   ...   ... 
       
y
 n 1 xn1 ... xnk  
 k  n 
а модель (5) в матричной форме примет вид
66
Y  X   . (7)
По данным, полученных с помощью показателей формы, был
рассчитан коэффициент регрессии и построен график зависимости
правильного обнаружения объекта от ложного выделения объекта (ложной
тревоги), иными словами, рабочая характеристика. Этот график представлен
на рисунке 27. Он был получен с помощью посчитанных коэффициентов
регрессии, которые были получены на основе данных из рисунков 19 – 25.
Коэффициенты регрессии используемых показателей формы приведены в
таблице 2.
Таблица 2. Полученные коэффициенты регрессии
Показатель формы Коэффициент регрессии
Суммарный модуль угла поворота контура
0,0459
объекта, нормированный к его длине
Соотношение площадей 0,0176
Соотношение сторон -0,133
Диапазон диаметров 3,76∙10-5
Эксцентриситет 0,186
Удлинение 0,0176
Отклонение от округлости -0,0151
Аэродинамический коэффициент 12,04
По полученным коэффициентам регрессии становится понятно, что
наиболее полезным и действенным показателем формы для селекции
объектов в рассматриваемом случае является аэродинамический
коэффициент.
Также были построены гистограммы значений линейной комбинации
этих коэффициентов для правильно (истинно) и ложно выделенных объектов,
и их пересечение (см. рис.26).

67
Рис. 26. Гистограммы значений линейной комбинации коэффициентов регрессии для: а –
правильно (истинно) выделенных объектов, б – ложно выделенных объектов, в –
пересечение а и б

68
Рис. 27. График зависимости правильного обнаружения от ложного выделения объекта
(ложной тревоги), то есть рабочая характеристика
Теперь, ориентируясь на полученные значения ложной тревоги, либо
же правильного обнаружения, появилась возможность установить
оптимальное пороговое значение, при котором пропуски объектов
исследования при их селекции будут сведены к минимуму, что приведет к
увеличению ложно выделяемых объектов, которые можно будет устранить
при вторичной обработке изображения, благодаря разработанному
алгоритму.

69
3. БЕЗОПАСНОСТЬ ЖИЗНЕДЕЯТЕЛЬНОСТИ

3.1. Необходимость эргономичности


Данный раздел посвящён основам безопасности жизнедеятельности, он
включает в себя поиск инженерных и технических решений, направленных
на обеспечение безопасной, безвредной и комфортной работы человека с
разработанным программным обеспечением для достижения необходимой
технологической результативности и экономической эффективности, что
является прямой целью эргономики программного обеспечения. Эти цели,
направленные на благополучие человека и оптимизацию общей
производительности системы, имеют глобальный масштаб распространения,
поэтому при разработке и внедрении новых продуктов важно
руководствоваться принятыми стандартами. Для достижения заданной цели
необходимо учитывать человеческие способности, умения, ограничения и
потребности, когда рассматривается взаимодействие между оператором,
программным обеспечением и рабочими условиями. Эргономичная рабочая
система повышает безопасность, производительность и эффективность труда,
улучшает условия работы и жизни человека, и уменьшает вредное
воздействие на его здоровье [16].

3.2. Человеко-ориентированность программы


Согласно ГОСТ 12.0.003-2015 [17] в процессе работы с программным
обеспечением наиболее опасными и вредоносными факторами являются:
1) Умственная усталость, появляющаяся после перенесения определённой
умственной нагрузки, которая длится некоторое количество времени,
которое, в свою очередь, зависит от индивидуальных особенностей
пользователя и наложенной на него нагрузки за предыдущее время;
2) Факторы, связанные с электромагнитными волнами, неионизирующими
ткани человека;

70
3) Факторы, связанные с освещённостью, которая осложняет безопасное
ведение трудовой и производственной практики.

Также опасными для программного обеспечения факторами являются


различные вредоносные программные обеспечения и вирусы. Поэтому
существуют требования к испытанию программного обеспечения на наличие
вирусов, которое прописано в ГОСТ Р 51188-98 [18].
К программному обеспечению предъявляют требования по
информационной безопасности:
1) Использование как идентификации, так и аутентификации
пользователя, работающего с данным программным обеспечением;
2) Создание, хранение и обновление данных пользователя;
3) Сохранность информации при любых возможных ситуациях;
4) Защита программного обеспечения от взлома.
Ещё одним немаловажным фактором является наличие удобного
интерфейса, при котором не будет создаваться большой нервно-психической
перегрузки на организм пользователя. Для этого существуют нормативные
документы, в которых прописаны требования к создаваемому интерфейсу
программы и организации рабочего места при использовании персонального
компьютера. Конкретным примером служит ГОСТ Р ИСО 9241-100, 2010
[19], который содержит рекомендации по разделению информационных
блоков и характеристики представления необходимой информации.
Для достижения эргономичности разрабатываемые программные
обеспечения необходимо создавать с учетом особенностей пользователей и
их потребностей. Для осуществления принципов эргономики применяется
метод человеко-ориентированного проектирования. Человеко-
ориентированное проектирование (Human Centered Design, HCD) – это
подход к разработке различных продуктов и систем, который на первое место
ставит пользователя с его целями, задачами, ограничениями и контекстом
работы. Он поднимает показатели результативности, эффективности,

71
устойчивости систем, и также предупреждает возможное неблагоприятное
влияние эксплуатации систем на здоровье и безопасность человека.
Принципы этого метода заключаются в следующем:
1. Система должна базироваться на задачах пользователя и условиях
среды;
2. Пользователи должны являться участниками процесса
проектирования системы;
3. Должна выполняться оценка для улучшения проектирования;
4. Улучшение проекта должно проводиться многократными
повторами, то есть итеративно;
5. Проект должна учитывать особенности поведения пользователя;
6. Проектная группа должна состоять, в том числе, из профессионалов
с опытом в разных областях.
На рисунке /номер/ схематично изображена взаимосвязь действий
человеко-ориентированного проектирования. Показано, что результаты
других проектных действий применяются для каждого действия
проектирования.

72
Рис. 28. Этапы человеко-ориентированного проектирования

Процесс HCD состоит из пяти этапов, причем этапы 2-5


составляют цикл:

1. Планирование процесса человеко-ориентированного


проектирования: выбор команды проекта и активностей, которые будут
происходить на каждом этапе.
2. Понимание и определение условий использования: сбор
информации о целях, задачах, ограничениях и контексте работы
пользователей.
3. Определение требований пользователей: обобщение полученной
на предыдущем этапе информации и формулировка пользовательских
требований к продукту.

73
4. Разработка проектных решений, соответствующих требованиям
пользователей: создание макетов, прототипов и различных версий дизайна
в соответствии с пользовательскими требованиями.
5. Оценка соответствия проекта установленным требованиям:
оценка созданных решений силами экспертов или с привлечением реальных
пользователей. Если оценка обнаруживает какие-либо проблемы, то
пользовательские требования необходимо уточнить и доработать макет,
прототип или дизайн продукта в соответствии с новыми данными.

3.3. Эргономика программного обеспечения


ГОСТ Р ИСО 10075-2011 [20] устанавливает термины в области
умственной нагрузки, включая такие, как умственный стресс и умственное
напряжение, и указывает взаимосвязи между рассматриваемыми понятиями.
Программное обеспечение должно быть разработано с учётом
эргономических потребностей операторов в соответствие с ГОСТ Р 55241.1 –
2012/ISO/TR/9241-100:2010 [19]. Так как связь пользователя с программным
обеспечением осуществляется с помощью интерфейса, то необходимо, чтобы
интерфейс программного комплекса был интуитивно понятен, чтобы не
создавать лишнюю умственную нагрузку на пользователя.
Программная среда MATLAB, которая является пакетом прикладных
программ для решения задач технических вычислений, а также
разработанное в ней программное обеспечение, реализующее код алгоритма
для реконструкции и структурного анализа объектов по данным
проникающего лазерного сканирования полностью удовлетворяет
требованиям вышеуказанного ГОСТ Р ИСО 9241-100, 2010 [19].
Разработанное программное обеспечение полностью отвечает
требованиям по информативности и пригодности для индивидуализации и
обучения других людей, так как код исследуемого алгоритма представляет

74
собой сочетание построчного набора команд и функций, разделённые на
отдельные программные блоки, снабжённые пояснительными
комментариями, что соответствует стандартам зрительного восприятия,
касающихся чёткости, разборчивости, понятности и распознаваемости
информации на экране. Программные коды разработанного алгоритма
приведены в приложениях А, Б., а реализация их работы приведены
подразделах 2.5 – 2.6.

3.4. Выводы по разделу


В данном разделе были рассмотрены требования к работе с
программным обеспечением для обеспечения безопасной, безвредной и
комфортной эксплуатации его пользователем.
Можно сделать вывод, что безопасность жизнедеятельности является
одним из важных факторов при разработке и эксплуатации программного
обеспечения. Эргономические принципы устанавливают требования для
комфортного и безопасного взаимодействия человека с разработанным
кодом, которые необходимо учитывать в целях создания и поддержания
безопасной и благоприятной в отношении здоровья пользователя рабочей
среды для решения поставленных инженерно-технических задач. Также
следует учесть, что повышение удобства использования конечного
программного продукта для пользователей может способствовать
повышению их производительности труда, а как следствие, и
профессионального уровня, способствовать приобретению новых навыков
для достижения необходимой технологической результативности и
экономической эффективности.
Учитывая всё вышесказанное, можно заключить, что интерфейс
используемого программного обеспечения, а именно программная среда
MATLAB, и программный код, реализующий алгоритм для реконструкции и
структурного анализа объектов по данным проникающего лазерного
сканирования полностью пригодны для дальнейшей эксплуатации будущими
75
пользователями, а также полностью соответствуют эргономическим
требованиям и стандартам ГОСТ Р ИСО 9241-100, 2010 [19].

ЗАКЛЮЧЕНИЕ

В результате выполнения выпускной квалификационной работы была


рассмотрена задача выделения объектов на цифровых изображениях по
средствам предварительной многопороговой обработки изображений,
полученных при проникающем лазерном сканировании. Были оценены
искажения и их формы, для этого произведена оценка параметров формы и
исследована эффективность их применения для рассматриваемых объектов
анализа. Также было разработано программное обеспечение по средствам
среды программирования MATLAB, в которой был реализован и исследован
код алгоритма для реконструкции и структурного анализа объектов по
данным проникающего лазерного сканирования, в функционал которого
входит дополнительная селекция объектов по средствам восьми
геометрических показателей.
В ходе работы был исследован и модифицирован алгоритм анализа
свойств объектов на основе предварительной многопороговой обработки
цифровых изображений радиотехнических систем по средствам
проникающего лазерного сканирования; получены и проведен анализ
статистических характеристик селектируемых объектов. Были достигнуты
результаты селекции объектов интереса на цифровых изображениях,
полученных радиотехническими системами на основе проникающего
лазерного сканирования и машинного зрения.
Был использован метод множественной линейной регрессии, по
результатам которой можно сделать вывод, что порог при первичной
обработке изображения может быть снижен, что приведет к большему
количеству ложных тревог, но уменьшению пропусков, а на вторичном этапе

76
обработки с помощью разработанного алгоритма появилась возможность
отсеять ложно выделяемые объекты.
Планируется дальнейшее усовершенствование алгоритма, который
будет учитывать положение и количество объектов в каждом слое
исследуемого изображения.

77
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

1. V. Yu. Volkov, M. I. Bogachev, A. R. Kayumov / Object Selection in Computer


Vision: From Multi-thresholding to Percolation Based Scene Representation //
Computer Vision in Advanced Control Systems-5. Advanced Decisions in
Technical and Medical Applications. 2020, вып. № 175, 5. С. 2 – 3, 14 – 17.
2. Волков В. Ю., Маркелов О. А., Богачев М. И. / Сегментация изображений
и селекция объектов на основе многопороговой обработки // Изв. вузов
России. Радиоэлектроника. 2018. Т. 22, вып. № 3. С. 25 – 33.
3. Волков В. Ю. / Адаптивное выделение мелких объектов на цифровых
изображениях // Изв. вузов России. Радиоэлектроника. 2017, вып. № 1. С.
17.
4. Fernando A Mendoza, Renfu Lu / Basics of Image Analysis //
ResearchGate.2015, С. 9 – 53.
5. Schlafer S., Meyer R.L. / Confocal microscopy imaging of the biofilm matrix //
Journal of microbiological methods. 2018, С. 50 – 52.
6. Atale N., Gupta S., Yadav UCS. / Cell-death assessment by fluorescent and
nonfluorescent cytosolic and nuclear staining techniques // Journal of
microscopy. 2014, С. 7 – 10.
7. Daemen S., van Zandvoort M.AMJ, Parekh S.H. / Microscopy tools for the
investigation of intracellular lipid storage and dynamics // Molecular
metabolism. 2016, С. 153 – 157.
8. Beyenal H., Donovan C., Lewandowski Z. / Three-dimensional biofilm structure
quantification // Journal of Microbiological Methods. 2004, С. 395 – 403.
9. Sage D., Donati L., Soulez F., etc. / Deconvolutionlab2: An open-source
software for deconvolution microscopy // Methods, С. 28 – 41.
10. В.Ю. Волков / Адаптивные и инвариантные алгоритмы обнаружения
объектов на изображениях и их моделирование в Matlab // Учебное
пособие. СПб. Изд-во «Лань», 2014., С. 20 – 26.
11. M. Bogachev, V. Volkov, O. Markelov, etc. / Fast and Simple Tool for the
Quantification of Biofilm-Embedded Cells Sub-Populations from Fluorescent
Microscopic Images // PLoS One. 2018, вып. № 13, 3. С. 29 – 48.
12. M. Bogachev, V. Volkov, G. Kolaev / Selection and Quantification of Objects
in Microscopic Images: from Multi-Criteria to Multi-Threshold Analysis //
Bionanoscience. 2019, вып. № 9, 1. С. 59 – 65.
13. Клюев Н. Ф. / Обнаружение импульсных сигналов с помощью
накопителей дискретного действия / М. Сов. радио. 1963. С. 111

78
14. Ade Widyaningsih, Made Susilawati, I Wayan Sumarjaya / Estimasi Model
Seemingly Unrelated Regression (SUR) dengan Metode Generalized Least
Square (GLS) // Jurnal Matematika. [Электронный ресурс] URL:
https://ojs.unud.ac.id/index.php/jmat/article/view/12554 (дата обращения:
12.05.2020).
15. Буховец А.Г., Москалев П.В. / Алгоритмы вычислительной статистики в
системе R // // Учебное пособие. СПб. Изд-во «Лань», 2015., С. 52 – 56.
16. Н.В. Блажко, В.А. Буканин, О.В. Демидович, и др. / Вопросы обеспечения
безопасности в выпускных квалификационных работах: учеб. Пособие. //
СПб: Изд-во СПбГЭТУ «ЛЭТИ». 2014, С. 65 – 74.
17. ГОСТ 12.0.003-2015 Система стандартов безопасности труда (ССБТ).
Опасные и вредные производственные факторы. // Техноэксперт.
[Электронный ресурс] URL: http://docs.cntd.ru/document/1200136071 (дата
обращения: 28.05.2020).
18. ГОСТ Р 51188-98 Защита информации. Испытания программных средств
на наличие компьютерных вирусов. Типовое руководство. // Техноэксперт.
[Электронный ресурс] URL: http://docs.cntd.ru/document/gost-r-51188-98
(дата обращения: 28.05.2020).
19. ГОСТ Р 55241.1-2012/ISO/TR 9241-100:2010 Эргономика взаимодействия
человек-система. Часть 100. Введение в стандарты, относящиеся к
эргономике программных средств. М.: Изд-во стандартов, 2013.
20. ГОСТ Р ИСО 10075-2011. Эргономические принципы обеспечения
адекватности умственной нагрузки. Основные термины и определения. //
Техноэксперт. [Электронный ресурс] URL:
http://docs.cntd.ru/document/1200088262 (дата обращения: 28.05.2020).

79
ПРИЛОЖЕНИЕ А
Ниже приведён код, реализующий сравнение селекции по данным
референсного массива с селекцией, выполненной при уже выбранном
оптимальном глобальном пороге с помощью метода адаптивного выделения
объектов. Также этот код используется для селекции объектов с помощью
различных показателей формы.
clc;
close all;
clear all;

load('M_diff_1.mat');
%% Сравнение селекции по данным референсного массива с селекцией, выполненной
% при уже выбранном оптимальном глобальном пороге с помощью метода
адаптивного выделения объектов
U = cell(N_layer,1);
for L=1:N_layer
M_dif = int16(Z{L} > 0) - int16(I_ref{L} > 0);
figure(L)
imagesc(M_dif)
colormap jet
colorbar('eastoutside')

U{L} = zeros(size(Z{L}));
for k=1:Ct_obj

F = find(Z{L} == k);
if (~isempty(F))
U{L}(F) = total_rotation_mat(L,k);
end
end
figure(100+L)
imagesc(U{L})
colormap hot
colorbar('eastoutside')

h = figure(L);
file_name = strcat('fig_', num2str(L));
saveas(h, file_name, 'jpg');
close(h);

h1 = figure(100+L);
file_name = strcat('fig_', num2str(100+L));
saveas(h1, file_name, 'jpg');
close(h1);
end
%% Селекция с использованием показателя суммарного модуля угла поворота
% контура объекта, нормированного к длине этого контура
S = cell(N_layer,1);
P = cell(N_layer,1);
Ps = cell(N_layer,1);

figure;
xlabel('Слой');
ylabel('Суммарный угол поворота контура, норм. к длине');
grid on;

80
hold on;

SrMass2 = zeros(1,N_layer);
Sr_ref2 = zeros(1,N_layer);
for L=1:N_layer
S{L} = bwconncomp(Z{L} > 0);
S_ref{L} = bwconncomp(I_ref{L} > 0);
P{L} = regionprops(S{L},'Perimeter');
P_ref{L} = regionprops(S_ref{L},'Perimeter');

U{L} = zeros(size(Z{L}));
for i=1:1:S{L}.NumObjects
Ps{L}(i) = P{L}(i).Perimeter * P{L}(i).Perimeter / 4 / 3.1415926 /
length(S{L}.PixelIdxList{i});
U{L}(S{L}.PixelIdxList{i}) = Ps{L}(i);
end

a2 = Ps{L};
plot(L,a2,'b *') %график значений показателя формы по слоям
SrMass2(1,L) = mean(a2);

if S_ref{L}.NumObjects > 0

U{L} = zeros(size(I_ref{L}));
for i=1:1:S_ref{L}.NumObjects
Ps_ref{L}(i) = P_ref{L}(i).Perimeter * P_ref{L}(i).Perimeter / 4 /
3.1415926 / length(S_ref{L}.PixelIdxList{i});
U{L}(S_ref{L}.PixelIdxList{i}) = Ps_ref{L}(i);

end

a2_ref = Ps_ref{L};
plot(L,a2_ref,'m o') %график значений референсного массива
Sr_ref2(1,L) = mean(a2_ref);
else
Sr_ref2(1,L) = NaN;
end

figure(200+L)
imagesc(U{L})
colormap hot
colorbar('eastoutside')

h2 = figure(200+L);
file_name = strcat('fig_', num2str(200+L));
saveas(h2, file_name, 'jpg');
close(h2);
end
plot(1:N_layer,SrMass2,'-r','LineWidth',2) %график средних значений
показателя формы по слоям
ss2=isnan(Sr_ref2);
ii2=find(ss2==0);
plot(ii2,Sr_ref2(ii2),'-.g','LineWidth',2) %график средних значений
референсного массива

hold off;
%% Селекция по соотношению площадей
S = cell(N_layer,1);
Dmax = cell(N_layer,1);
Dmin = cell(N_layer,1);
Ds = cell(N_layer,1);

figure;

81
xlabel('Слой');
ylabel('Соотношение площадей');
grid on;
hold on;

SrMass3 = zeros(1,N_layer);
Sr_ref3 = zeros(1,N_layer);
for L=1:N_layer
S{L} = bwconncomp(Z{L} > 0);
S_ref{L} = bwconncomp(I_ref{L} > 0);
Dmax{L} = regionprops(S{L},'MajorAxisLength');
Dmin{L} = regionprops(S{L},'MinorAxisLength');
Dmax_ref{L} = regionprops(S_ref{L},'MajorAxisLength');
Dmin_ref{L} = regionprops(S_ref{L},'MinorAxisLength');

U{L} = zeros(size(Z{L}));
for i=1:1:S{L}.NumObjects
Ds{L}(i) = length(S{L}.PixelIdxList{i}) / Dmax{L}(i).MajorAxisLength
* Dmin{L}(i).MinorAxisLength;
U{L}(S{L}.PixelIdxList{i}) = Ds{L}(i);
end

a3 = Ds{L};
plot(L,a3,'b*') %график значений показателя формы по слоям
SrMass3(1,L) = mean(a3);

if S_ref{L}.NumObjects > 0

U{L} = zeros(size(I_ref{L}));
for i=1:1:S_ref{L}.NumObjects
Ds_ref{L}(i) = length(S_ref{L}.PixelIdxList{i}) / Dmax_ref{L}
(i).MajorAxisLength * Dmin_ref{L}(i).MinorAxisLength;
U{L}(S_ref{L}.PixelIdxList{i}) = Ds_ref{L}(i);
end

a3_ref = Ds_ref{L};
plot(L,a3_ref,'m o') %график значений референсного массива
Sr_ref3(1,L) = mean(a3_ref);
else
Sr_ref3(1,L) = NaN;

end

figure(300+L)
imagesc(U{L})
colormap hot
colorbar('eastoutside')

h3 = figure(300+L);
file_name = strcat('fig_', num2str(300+L));
saveas(h3, file_name, 'jpg');
close(h3);
end
plot(1:N_layer,SrMass3,'-r','LineWidth',2) %график средних значений
показателя формы по слоям
ss3=isnan(Sr_ref3);
ii3=find(ss3==0);
plot(ii3,Sr_ref3(ii3),'-.g','LineWidth',2) %график средних значений
референсного массива

hold off;
%% Селекция по соотношению сторон
S = cell(N_layer,1);

82
Dmax = cell(N_layer,1);
Dmin = cell(N_layer,1);
Dst = cell(N_layer,1);

figure;
xlabel('Слой');
ylabel('Соотношение сторон');
grid on;
hold on;

SrMass4 = zeros(1,N_layer);
Sr_ref4 = zeros(1,N_layer);
for L=1:N_layer
S{L} = bwconncomp(Z{L} > 0);
S_ref{L} = bwconncomp(I_ref{L} > 0);
Dmax{L} = regionprops(S{L},'MajorAxisLength');
Dmin{L} = regionprops(S{L},'MinorAxisLength');
Dmax_ref{L} = regionprops(S_ref{L},'MajorAxisLength');
Dmin_ref{L} = regionprops(S_ref{L},'MinorAxisLength');

U{L} = zeros(size(Z{L}));
for i=1:1:S{L}.NumObjects
Dst{L}(i) = Dmax{L}(i).MajorAxisLength / Dmin{L}(i).MinorAxisLength;
U{L}(S{L}.PixelIdxList{i}) = Dst{L}(i);
end

a4 = Dst{L};
plot(L,a4,'b*') %график значений показателя формы по слоям
SrMass4(1,L) = mean(a4);

if S_ref{L}.NumObjects > 0

U{L} = zeros(size(I_ref{L}));
for i=1:1:S_ref{L}.NumObjects
Dst_ref{L}(i) = Dmax_ref{L}(i).MajorAxisLength / Dmin_ref{L}
(i).MinorAxisLength;
U{L}(S_ref{L}.PixelIdxList{i}) = Dst_ref{L}(i);
end

a4_ref = Dst_ref{L};
plot(L,a4_ref,'m o') %график значений референсного массива
Sr_ref4(1,L) = mean(a4_ref);
else
Sr_ref4(1,L) = NaN;
end

figure(400+L)
imagesc(U{L})
colormap hot
colorbar('eastoutside')

h4 = figure(400+L);
file_name = strcat('fig_', num2str(400+L));
saveas(h4, file_name, 'jpg');
close(h4);
end
plot(1:N_layer,SrMass4,'-r','LineWidth',2) %график средних значений
показателя формы по слоям
ss4=isnan(Sr_ref4);
ii4=find(ss4==0);
plot(ii4,Sr_ref4(ii4),'-.g','LineWidth',2) %график средних значений
референсного массива

83
hold off;
%% Селекция по диапазону диаметров
S = cell(N_layer,1);
Dmax = cell(N_layer,1);
Dmin = cell(N_layer,1);
D = cell(N_layer,1);

figure;
xlabel('Слой');
ylabel('Диапазон диаметров');
grid on;
hold on;

SrMass5 = zeros(1,N_layer);
Sr_ref5 = zeros(1,N_layer);
for L=1:N_layer
S{L} = bwconncomp(Z{L} > 0);
S_ref{L} = bwconncomp(I_ref{L} > 0);
Dmax{L} = regionprops(S{L},'MajorAxisLength');
Dmin{L} = regionprops(S{L},'MinorAxisLength');
Dmax_ref{L} = regionprops(S_ref{L},'MajorAxisLength');
Dmin_ref{L} = regionprops(S_ref{L},'MinorAxisLength');

U{L} = zeros(size(Z{L}));
for i=1:1:S{L}.NumObjects
D{L}(i) = Dmax{L}(i).MajorAxisLength - Dmin{L}(i).MinorAxisLength;
U{L}(S{L}.PixelIdxList{i}) = D{L}(i);
end

a5 = D{L}; %график значений показателя формы по слоям


SrMass5(1,L) = mean(a5);
plot(L,a5,'b*')

if S_ref{L}.NumObjects > 0

U{L} = zeros(size(I_ref{L}));
for i=1:1:S_ref{L}.NumObjects
D_ref{L}(i) = Dmax_ref{L}(i).MajorAxisLength - Dmin_ref{L}
(i).MinorAxisLength;
U{L}(S_ref{L}.PixelIdxList{i}) = D_ref{L}(i);
end

a5_ref = D_ref{L};
plot(L,a5_ref,'m o') %график значений референсного массива
Sr_ref5(1,L) = mean(a5_ref);
else
Sr_ref5(1,L) = NaN;
end

figure(500+L)
imagesc(U{L})
colormap hot
colorbar('eastoutside')

h5 = figure(500+L);
file_name = strcat('fig_', num2str(500+L));
saveas(h5, file_name, 'jpg');
close(h5);
end
plot(1:N_layer,SrMass5,'-r','LineWidth',2) %график средних значений
показателя формы по слоям
ss5=isnan(Sr_ref5);
ii5=find(ss5==0);

84
plot(ii5,Sr_ref5(ii5),'-.g','LineWidth',2) %график средних значений
референсного массива

hold off;
%% Селекция по эксцентриситету
S = cell(N_layer,1);
Omax = cell(N_layer,1);
Omin = cell(N_layer,1);
Es = cell(N_layer,1);

figure;
xlabel('Слой');
ylabel('Эксцентриситет');
grid on;
hold on

SrMass6 = zeros(1,N_layer);
Sr_ref6 = zeros(1,N_layer);
for L=1:N_layer
S{L} = bwconncomp(Z{L} > 0);
S_ref{L} = bwconncomp(I_ref{L} > 0);
Omax{L} = regionprops(S{L},'MajorAxisLength');
Omin{L} = regionprops(S{L},'MinorAxisLength');
Omax_ref{L} = regionprops(S_ref{L},'MajorAxisLength');
Omin_ref{L} = regionprops(S_ref{L},'MinorAxisLength');

U{L} = zeros(size(Z{L}));
for i=1:1:S{L}.NumObjects
Es{L}(i) = sqrt( 1 - ((Omin{L}(i).MinorAxisLength) * (Omin{L}
(i).MinorAxisLength)) / ((Omax{L}(i).MajorAxisLength) * (Omax{L}
(i).MajorAxisLength )));
U{L}(S{L}.PixelIdxList{i}) = Es{L}(i);

end

a6 = Es{L}; %график значений показателя формы по слоям


SrMass6(1,L) = mean(a6);
plot(L,a6,'b*');

if S_ref{L}.NumObjects > 0

U{L} = zeros(size(I_ref{L}));
for i=1:1:S_ref{L}.NumObjects
Es_ref{L}(i) = sqrt( 1 - ((Omin_ref{L}(i).MinorAxisLength) *
(Omin_ref{L}(i).MinorAxisLength)) / ((Omax_ref{L}(i).MajorAxisLength) *
(Omax_ref{L}(i).MajorAxisLength )));
U{L}(S_ref{L}.PixelIdxList{i}) = Es_ref{L}(i);
end

a6_ref = Es_ref{L};
plot(L,a6_ref,'m o') %график значений референсного массива
Sr_ref6(1,L) = mean(a6_ref);
else
Sr_ref6(1,L) = NaN;
end

figure(600+L)
imagesc(U{L})
colormap hot
colorbar('eastoutside')

h6 = figure(600+L);
file_name = strcat('fig_', num2str(600+L));

85
saveas(h6, file_name, 'jpg');
close(h6)
end
plot(1:N_layer,SrMass6,'-r','LineWidth',2) %график средних значений
показателя формы по слоям
ss6=isnan(Sr_ref6);
ii6=find(ss6==0);
plot(ii6,Sr_ref6(ii6),'-.g','LineWidth',2) %график средних значений
референсного массива

hold off;
%% Селекция по удлинению
S = cell(N_layer,1);
Dmax = cell(N_layer,1);
Dmin = cell(N_layer,1);
Ud = cell(N_layer,1);

figure;
xlabel('Слой');
ylabel('Удлинение');
grid on;
hold on;

SrMass7 = zeros(1,N_layer);
Sr_ref7 = zeros(1,N_layer);
for L=1:N_layer
S{L} = bwconncomp(Z{L} > 0);
S_ref{L} = bwconncomp(I_ref{L} > 0);
Dmax{L} = regionprops(S{L},'MajorAxisLength');
Dmin{L} = regionprops(S{L},'MinorAxisLength');
Dmax_ref{L} = regionprops(S_ref{L},'MajorAxisLength');
Dmin_ref{L} = regionprops(S_ref{L},'MinorAxisLength');

U{L} = zeros(size(Z{L}));
for i=1:1:S{L}.NumObjects
Ud{L}(i) = 1 - length(S{L}.PixelIdxList{i}) / Dmax{L}
(i).MajorAxisLength * Dmin{L}(i).MinorAxisLength;
U{L}(S{L}.PixelIdxList{i}) = Ud{L}(i);
end

a7 = Ud{L}; %график значений показателя формы по слоям


SrMass7(1,L) = mean(a7);
plot(L,a7,'b*');

if S_ref{L}.NumObjects > 0

U{L} = zeros(size(I_ref{L}));
for i=1:1:S_ref{L}.NumObjects
Ud_ref{L}(i) = 1 - length(S_ref{L}.PixelIdxList{i}) / Dmax_ref{L}
(i).MajorAxisLength * Dmin_ref{L}(i).MinorAxisLength;
U{L}(S_ref{L}.PixelIdxList{i}) = Ud_ref{L}(i);
end

a7_ref = Ud_ref{L};
plot(L,a7_ref,'m o') %график значений референсного массива
Sr_ref7(1,L) = mean(a7_ref);
else
Sr_ref7(1,L) = NaN;
end

figure(700+L)
imagesc(U{L})
colormap hot

86
colorbar('eastoutside')

h7 = figure(700+L);
file_name = strcat('fig_', num2str(700+L));
saveas(h7, file_name, 'jpg');
close(h7);
end
plot(1:N_layer,SrMass7,'-r','LineWidth',2) %график средних значений
показателя формы по слоям
ss7=isnan(Sr_ref7);
ii7=find(ss7==0);
plot(ii7,Sr_ref7(ii7),'-.g','LineWidth',2) %график средних значений
референсного массива

hold off;
%% Селекция по отклонению от округлости
S = cell(N_layer,1);
Dmax = cell(N_layer,1);
Os = cell(N_layer,1);

figure;
xlabel('Слой');
ylabel('Отклонение от округлости');
grid on;
hold on;

SrMass8 = zeros(1,N_layer);
Sr_ref8 = zeros(1,N_layer);
for L=1:N_layer
S{L} = bwconncomp(Z{L} > 0);
S_ref{L} = bwconncomp(I_ref{L} > 0);
Dmax{L} = regionprops(S{L},'MajorAxisLength');
Dmax_ref{L} = regionprops(S_ref{L},'MajorAxisLength');

U{L} = zeros(size(Z{L}));
for i=1:1:S{L}.NumObjects
Os{L}(i) = ( 4 * 3.1415926 * length(S{L}.PixelIdxList{i}) ) /
( Dmax{L}(i).MajorAxisLength * Dmax{L}(i).MajorAxisLength * 3.1415926 );
U{L}(S{L}.PixelIdxList{i}) = Os{L}(i);
end

a8 = Os{L}; %график значений показателя формы по слоям


SrMass8(1,L) = mean(a8);
plot(L,a8,'b*')

if S_ref{L}.NumObjects > 0

U{L} = zeros(size(I_ref{L}));
for i=1:1:S_ref{L}.NumObjects
Os_ref{L}(i) = ( 4 * 3.1415926 * length(S_ref{L}.PixelIdxList{i}) ) /
( Dmax_ref{L}(i).MajorAxisLength * Dmax_ref{L}(i).MajorAxisLength * 3.1415926
);
U{L}(S_ref{L}.PixelIdxList{i}) = Os_ref{L}(i);
end

a8_ref = Os_ref{L};
plot(L,a8_ref,'m o') %график значений референсного массива
Sr_ref8(1,L) = mean(a8_ref);
else
Sr_ref8(1,L) = NaN;
end

figure(800+L)

87
imagesc(U{L})
colormap hot
colorbar('eastoutside')

h8 = figure(800+L);
file_name = strcat('fig_', num2str(800+L));
saveas(h8, file_name, 'jpg');
close(h8);
end
plot(1:N_layer,SrMass8,'-r','LineWidth',2) %график средних значений
показателя формы по слоям
ss8=isnan(Sr_ref8);
ii8=find(ss8==0);
plot(ii8,Sr_ref8(ii8),'-.g','LineWidth',2) %график средних значений
референсного массива

hold off;
%% Селекция по аэродинамическому коэффициенту
S = cell(N_layer,1);
Dmax = cell(N_layer,1);
As = cell(N_layer,1);

figure;
xlabel('Слой');
ylabel('Аэродинамический коэффициент');
grid on;
hold on;

SrMass9 = zeros(1,N_layer);
Sr_ref9 = zeros(1,N_layer);
for L=1:N_layer
S{L} = bwconncomp(Z{L} > 0);
S_ref{L} = bwconncomp(I_ref{L} > 0);
Dmax{L} = regionprops(S{L},'MajorAxisLength');
Dmax_ref{L} = regionprops(S_ref{L},'MajorAxisLength');

U{L} = zeros(size(Z{L}));
for i=1:1:S{L}.NumObjects
As{L}(i) = Dmax{L}(i).MajorAxisLength / length(S{L}.PixelIdxList{i});
U{L}(S{L}.PixelIdxList{i}) = As{L}(i);
end

a9 = As{L};
plot(L,a9,'b*') %график значений показателя формы по слоям
SrMass9(1,L) = mean(a9);

if S_ref{L}.NumObjects > 0

U{L} = zeros(size(I_ref{L}));
for i=1:1:S_ref{L}.NumObjects
As_ref{L}(i) = Dmax_ref{L}(i).MajorAxisLength /
length(S_ref{L}.PixelIdxList{i});
U{L}(S_ref{L}.PixelIdxList{i}) = As_ref{L}(i);
end

a9_ref = As_ref{L};
plot(L,a9_ref,'m o') %график значений референсного массива
Sr_ref9(1,L) = mean(a9_ref);
else
Sr_ref9(1,L) = NaN;
end

figure(900+L)

88
imagesc(U{L})
colormap hot
colorbar('eastoutside')

h9 = figure(900+L);
file_name = strcat('fig_', num2str(900+L));
saveas(h9, file_name, 'jpg');
close(h9);
end
plot(1:N_layer,SrMass9,'-r','LineWidth',2) %график средних значений
показателя формы по слоям
ss9=isnan(Sr_ref9);
ii9=find(ss9==0);
plot(ii9,Sr_ref9(ii9),'-.g','LineWidth',2) %график средних значений
референсного массива

hold off;

89
ПРИЛОЖЕНИЕ Б
Ниже приведён код, реализующий построение гистограмм правильного
и ложного обнаружения объектов, построение графика зависимости
правильного обнаружения от ложного выделения объекта, а также расчет
регрессии.
clc;
close all;
clear all;

load('M_diff_1.mat');

load('Flag_1.mat');
load('P_false.mat');

load('Ps.mat');
load('Ds.mat');
load('Dst.mat');
load('D.mat');
load('Es.mat');
load('Ud.mat');
load('Os.mat');
load('As.mat');

table_Pfalse_Param=[]; % P_false Ps Ds Dst D Es Ud Os As Flag_1


for L=1:1:N_layer
ii=find(Flag_1{L}<=2);

P0=P_false{L};
P0=P0';
P0=P0(ii);

P1=Ps{L};
P1=P1';
P1=P1(ii);

P2=Ds{L};
P2=P2';
P2=P2(ii);

P3=Dst{L};
P3=P3';
P3=P3(ii);

P4=D{L};
P4=P4';
P4=P4(ii);

P5=Es{L};
P5=P5';
P5=P5(ii);

P6=Ud{L};
P6=P6';
P6=P6(ii);

P7=Os{L};

90
P7=P7';
P7=P7(ii);

P8=As{L};
P8=P8';
P8=P8(ii);

F=Flag_1{L};
F=F';
F=F(ii);

table_Pfalse_Param=[table_Pfalse_Param; P0 P1 P2 P3 P4 P5 P6 P7 P8 F];
end;

% save table_Pfalse_Param.mat table_Pfalse_Param


N=length(table_Pfalse_Param(:,1));

figure;
ylabel('P_{false}');
xlabel('Суммарный угол поворота контура, норм. к длине');
grid on;
hold on;
for i=1:1:N
if table_Pfalse_Param(i,10)==0
plot(table_Pfalse_Param(i,2),table_Pfalse_Param(i,1),'ro');
elseif table_Pfalse_Param(i,10)==1
plot(table_Pfalse_Param(i,2),table_Pfalse_Param(i,1),'b*');
else
plot(table_Pfalse_Param(i,2),table_Pfalse_Param(i,1),'gd');
end
end
figure;
ylabel('P_{false}');
xlabel('Соотношение площадей');
grid on;
hold on;
for i=1:1:N
if table_Pfalse_Param(i,10)==0
plot(table_Pfalse_Param(i,3),table_Pfalse_Param(i,1),'ro');
elseif table_Pfalse_Param(i,10)==1
plot(table_Pfalse_Param(i,3),table_Pfalse_Param(i,1),'b*');
else
plot(table_Pfalse_Param(i,3),table_Pfalse_Param(i,1),'gd');
end
end
figure;
ylabel('P_{false}');
xlabel('Соотношение сторон');
grid on;
hold on;
for i=1:1:N
if table_Pfalse_Param(i,10)==0
plot(table_Pfalse_Param(i,4),table_Pfalse_Param(i,1),'ro');
elseif table_Pfalse_Param(i,10)==1
plot(table_Pfalse_Param(i,4),table_Pfalse_Param(i,1),'b*');
else
plot(table_Pfalse_Param(i,4),table_Pfalse_Param(i,1),'gd');
end
end
figure;
ylabel('P_{false}');
xlabel('Диапазон диаметров');
grid on;

91
hold on;
for i=1:1:N
if table_Pfalse_Param(i,10)==0
plot(table_Pfalse_Param(i,5),table_Pfalse_Param(i,1),'ro');
elseif table_Pfalse_Param(i,10)==1
plot(table_Pfalse_Param(i,5),table_Pfalse_Param(i,1),'b*');
else
plot(table_Pfalse_Param(i,5),table_Pfalse_Param(i,1),'gd');
end
end
figure;
ylabel('P_{false}');
xlabel('Эксцентриситет');
grid on;
hold on;
for i=1:1:N
if table_Pfalse_Param(i,10)==0
plot(table_Pfalse_Param(i,6),table_Pfalse_Param(i,1),'ro');
elseif table_Pfalse_Param(i,10)==1
plot(table_Pfalse_Param(i,6),table_Pfalse_Param(i,1),'b*');
else
plot(table_Pfalse_Param(i,6),table_Pfalse_Param(i,1),'gd');
end
end
figure;
ylabel('P_{false}');
xlabel('Удлинение');
grid on;
hold on;
for i=1:1:N
if table_Pfalse_Param(i,10)==0
plot(table_Pfalse_Param(i,7),table_Pfalse_Param(i,1),'ro');
elseif table_Pfalse_Param(i,10)==1
plot(table_Pfalse_Param(i,7),table_Pfalse_Param(i,1),'b*');
else
plot(table_Pfalse_Param(i,7),table_Pfalse_Param(i,1),'gd');
end
end
figure;
ylabel('P_{false}');
xlabel('Отклонение от округлости');
grid on;
hold on;
for i=1:1:N
if table_Pfalse_Param(i,10)==0
plot(table_Pfalse_Param(i,8),table_Pfalse_Param(i,1),'ro');
elseif table_Pfalse_Param(i,10)==1
plot(table_Pfalse_Param(i,8),table_Pfalse_Param(i,1),'b*');
else
plot(table_Pfalse_Param(i,8),table_Pfalse_Param(i,1),'gd');
end
end
figure;
ylabel('P_{false}');
xlabel('Аэродинамический коэффициент');
grid on;
hold on;
for i=1:1:N
if table_Pfalse_Param(i,10)==0
plot(table_Pfalse_Param(i,9),table_Pfalse_Param(i,1),'ro');
elseif table_Pfalse_Param(i,10)==1
plot(table_Pfalse_Param(i,9),table_Pfalse_Param(i,1),'b*');
else

92
plot(table_Pfalse_Param(i,9),table_Pfalse_Param(i,1),'gd');
end
end

x1=[];
x2=[];
for i12=1:1:N
x1=[x1; table_Pfalse_Param(i12, 1)];
x2=[x2; table_Pfalse_Param(i12, 2:9)];
end;
[m1,n1]=size(x2);
x2=[ones(m1,1) x2];

b = regress(x1,x2);

x3=table_Pfalse_Param(:, 1);
x4=table_Pfalse_Param(:, 2:9);
X=x2*b;

x_correct=[];
x_false=[];
figure;
hold all;
for (i=1:1:N)
if table_Pfalse_Param(i,10)==0
plot(x1(i,1),X(i,1),'ro');
x_false=[x_false; X(i,1)];
elseif table_Pfalse_Param(i,10)==1
plot(x1(i,1),X(i,1),'b*');
x_correct=[x_correct; X(i,1)];
else
plot(x1(i,1),X(i,1),'gd');
x_correct=[x_correct; X(i,1)];
end
end

x_correct=sort(x_correct);
x_false=sort(x_false);

nf=length(x_false);
nc=length(x_correct);

alpha_1=[];
D_1=[];
for i10=1:1:nf
p1=x_false(i10,1);
jj=find(x_correct<p1,1,'last');
alpha_1=[alpha_1 (i10-1)/nf];
D_1=[D_1 jj/nc];
end;
alpha_1=[alpha_1 1];
D_1=[D_1 1];

figure;
plot(alpha_1,D_1,'LineWidth',2);
xlabel('\alpha');
ylabel('D');
ylim([0 1]);

figure;
h_correct=histogram(x_correct,'Normalization','pdf');
figure;

93
h_false=histogram(x_false,'Normalization','pdf');

x_h_c=h_correct.BinEdges;
x_h_c=x_h_c(1:(end-1))+(h_correct.BinWidth)/2;
y_h_c=h_correct.Values;

x_h_f=h_false.BinEdges;
x_h_f=x_h_f(1:(end-1))+(h_false.BinWidth)/2;
y_h_f=h_false.Values;

figure;
plot(x_h_c,y_h_c,'b-','LineWidth',2);
hold all;
plot(x_h_f,y_h_f,'r-','LineWidth',2);
legend('correct','false');
xlabel('P_{\Sigma}');
ylabel('W');

94