Вы находитесь на странице: 1из 62

УДК

[004.896:681.5](063)
ББК 32.81я431(2Рос)

Т38 Техническое зрение в системах управления – 2019: сб. тез.


докл. научно-техн. конф. 12–13 марта 2019, Москва, ИКИ
РАН. М.: ИКИ РАН, 2019. 64 с.

ISBN 978-5-00015-022-1

Всероссийская научно-техническая конференция «Техническое зрение


в системах управления – 2019» (ТЗСУ-2019) проводится с 12 по 13 марта
2019 г. в Москве, в Институте космических исследований РАН. Органи­
заторами конференции являются Институт космических исследований
РАН (ИКИ РАН), Государственный научно-исследовательский институт
авиационных систем (ГосНИИАС) и Институт прикладной математики
им. М. В. Келдыша РАН (ИПМ им. М. В. Келдыша РАН).
Целью проведения конференции ТЗСУ-2019, как и всех преды-
дущих конференций ТЗСУ, являются обмен информацией между ака-
демической и прикладной наукой, образованием и производством, со-
вместное обсуждение достигнутых научных и практических результатов,
а также обсуждение вопросов, являющихся ключевыми для развития тех-
нического зрения и его использования в системах управления.
Тематика конференции охватывает различные аспекты разработки
и построения систем технического зрения (СТЗ) в системах управления.
Особое внимание уделяется бортовым СТЗ, входящим в состав мобиль-
ных объектов и предназначенным для решения задач автономного и ав-
томатизированного управления в сложной, неопределённой и быстро из-
меняющейся внешней обстановке.
Труды конференции публикуются в рецензируемом электронном
журнале «Техническое зрение»: http://magazine.technicalvision.ru/.

©  Федеральное государственное бюджетное учреждение науки


Институт космических исследований Российской академии наук (ИКИ РАН), 2019
Содержание
Алпатов  Б. А., Бабаян П. В., Ершов М. Д.
Алгоритм обработки видеопоследовательности для обнаружения
и подсчёта автомобилей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Антипов  В. А., Коковкина В. А., Кирнос В. П., Приоров А. Л.
Обнаружение ориентиров с использованием контурного анализа в задаче
SLAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Бабаян  П. В., Рогачиков В. Е.
Алгоритм функционирования системы технического зрения
для измерения размеров экструзионных изделий . . . . . . . . . . . . . . . . . . . . . . 9
Бодунков  Н. Е., Пиндюрина М. О.
Семантическое описание сцен эталонной информации при визуальной
навигации беспилотного летательного аппарата . . . . . . . . . . . . . . . . . . . . . . . 11
Бондаренко  А. В., Бондаренко М. А., Котцов В. А.
Новые возможности применения цифровых камер расширенного
спектрального диапазона . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Ботуз  С. П.
Методы и средства графоаналитического анализа многоспектральных
изображений в интеллектуальных человеко-машинных системах
технического зрения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Ботуз  С. П.
Обработка (кодирование/декодирование и визуализация) изображений
в интеллектуальных человеко-машинных системах технического
зрения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Виноградов  А. Н., Егоров В. В., Калинин А. П., Родионов А. И., Родионов И. Д.,
Родионова  И. П.
Активный многочастотный лазерный сканер ближнего ИК‑диапазона:
конструкция и расчёт энергетического потенциала . . . . . . . . . . . . . . . . . . . . 19
Виноградов  А. Н., Егоров В. В., Калинин А. П., Родионов А. И., Родионов И. Д.,
Родионова  И. П.
Система улучшенного и комбинированного видения с использованием
гиперспектрометра, работающего в режиме перенацеливания . . . . . . . . . . 21
Дорогов  А. Ю.
Регулярные перестраиваемые преобразования с архитектурой глубоких
нейронных сетей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Калинкин  А. И.
Позиционирование мобильного объекта с двумя реперными
излучателями по данным от одной камеры и инклинометра . . . . . . . . . . . . 25
Карпунин  А. А., Титков И. П.
Система идентификации и сопровождения БПЛА в группе на основе
системы технического зрения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Ким  Н. В., Михайлов Н. А.
Формирование управлений группой БЛА при поиске наземных объектов
на основе энтропийного подхода . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Ким  Н. В., Мокрова М. И.
Мониторинг пожарной обстановки группой БЛА . . . . . . . . . . . . . . . . . . . . . 31
Кириллов  С. Н., Покровский П. С., Сконников П. Н.
Алгоритм комплексирования телевизионного и инфракрасного
изображений для систем улучшенного видения беспилотных
летательных аппаратов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Кириллов  С. Н., Покровский П. С., Бауков А. А.
Алгоритм уменьшения влияния атмосферных осадков на качество
видеоизображений в системах управления . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Князь  В. В., Бордодымов А. Н.
Алгоритм обнаружения препятствий для системы улучшенного видения
на основе глубоких свёрточных нейронных сетей . . . . . . . . . . . . . . . . . . . . . 36
Князь  В. В., Мошканцев П. В.
Построение воксельных моделей по одной фотографии на основе
генеративно-состязательных сетей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Ковеленов  Ю. А., Ковеленов А. А., Говоров А. В., Назиров Р. Р.
Интерактивная система визуализации движения ровера на веб-ресурсах . 40
Корнилов  А. С., Сафонов И. В., Якимчук И. В.
Локальная оценка резкости микротомографического изображения . . . . . . 42
Котцов  В. А., Дроханов А. Н.
Структурозональный анализ видеоинформации и его применение
в техническом зрении . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Кудинов  И. А., Павлов О. В., Холопов И. С.
Тест-объект для фотограмметрической калибровки разноспектральных
камер систем технического зрения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Лебедев  М. А., Комаров Д. В., Выголов О. В., Визильтер Ю. В.
Комплексирование изображений разных спектральных диапазонов
на основе генеративной состязательной сети FusionNet . . . . . . . . . . . . . . . . 48
Молчанов  А. С.
Модель зрительного анализатора дешифровщика в виде эквивалентного
фильтра пространственных частот на основе функции передачи
модуляции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Пономарев  А. В., Богословский А. В., Жигулина И. В., Богословский Е. А.
Уменьшение вычислительной сложности алгоритмов цифровой
фильтрации путём предварительного детектирования изображений . . . . . 52
Смолин  В. С., Соколов С. М.
Методы ускорения нейросетевого обучения с повторным
использованием знаний . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Соколов  С. М., Богуславский А. А.
К вопросу об использовании гетерогенных вычислителей в бортовых
системах технического зрения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Стротов  В. В., Смирнов С. А., Корепанов С. Е., Бабаян П. В.
Алгоритмы определения дальности до объекта для стереоскопической
системы технического зрения реального времени . . . . . . . . . . . . . . . . . . . . . 58
Фомин  И. С., Бахшиев А. В.
Исследование свёрточных нейронных сетей для классификации объектов
в составе системы видеонаблюдения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Алгоритм обработки видеопоследовательности
для обнаружения и подсчёта автомобилей
Б. А. Алпатов, П. В. Бабаян, М. Д. Ершов
Рязанский государственный радиотехнический университет, E-mail: aitu@rsreu.ru

Одной из актуальных задач видеоаналитики является оценка параметров


транспортных потоков, что связано с необходимостью управления дви-
жением в условиях постоянно растущего числа автомобилей. Для реше-
ния проблемы в лучшем случае можно выполнить настройку режима ра-
боты светофоров, в других случаях может понадобиться изменение кон-
фигурации перекрёстка или дороги. Одним из перспективных подходов
является использование адаптивной системы управления работой свето-
форов. Для работы такой системы необходимо накапливать статистиче-
скую информацию и оценивать параметры транспортных потоков.
С целью автоматизации систем контроля дорожного движения была
рассмотрена задача обнаружения и подсчёта проезжающих автомобилей.
В результате был предложен соответствующий алгоритм обработки ви­
деопоследовательностей. Решение задачи рассматривается для непод-
вижной видеокамеры, установленной над дорогой. Полученный алго-
ритм также был реализован на встраиваемой платформе интеллектуаль-
ных камер видеонаблюдения.
Предлагаемый алгоритм обнаружения и подсчёта транспортных
средств (ТС) основан на предварительной разметке зон интереса на изо-
бражении. Например, для подсчёта автомобилей, проехавших по полосе
движения, необходимо для этой полосы задать свою зону. Каждая зона
делится на два детектора (на въезд и на выезд), что позволяет определять
направление движения и выполнять грубую оценку скорости движения,
если указан размер зоны в метрах.
Работа алгоритма начинается с оценки фона каждым детектором
путём выделения точек движения на основе разности кадров. На дан-
ном этапе выбирается опорный кадр, на котором движение отсутствует.
Работа двух детекторов зоны синхронизируется с целью определения мо-
мента времени, когда ТС проехало через зону, чтобы исключить выбор
опорного кадра во время остановки ТС. Выбранный опорный кадр на
протяжении небольшого интервала времени проверяется на стабильность
фона.
После инициализации зона переходит в режим основной работы, ко-
торый основан на вычитании фона, яркостной оценке и последующем
разбиении точек на четыре категории: объект, фон, тень, засветка. Точки
тени или засветки отбрасываются для исключения ложных обнаружений.
Счётчик проехавших через зону ТС увеличивается в случае, если фикси-
руется последовательность событий: ТС обнаружено детектором въез-
да, ТС обнаружено детектором выезда, ТС покинуло область детектора
въезда.
Были проведены экспериментальные исследования алгоритма и про-
граммного обеспечения с использованием записанных видеосюжетов
5
и на внутренней платформе видеокамер при наблюдении за дорожной
обстановкой в различных местах и при различных условиях в режиме
круглосуточной работы. Результаты для разных видеосюжетов приведены
в таблице. Сюжеты были получены при разных условиях наблюдения за
участками дорог с числом полос от 2 до 5.

Результаты обнаружения и подсчёта автомобилей

Сюжет Число ТС Верные обнаружения, % Ложные обнаружения, %


1 657 99,69 0,61
2 505 99,29 0,59
3 458 100 0,73
4 1262 98,52 0,65
5 330 96,96 1,35

Дальнейшее совершенствование разработанной системы предпо-


лагает повышение точности обнаружения, оценку параметров и класси-
фикацию ТС. Направление исследований может быть связано с оценкой
геометрии сцены (Liu et al.., 2018), а также с использованием алгоритмов
слежения (Soetedjo, Somawirata, 2018).

Исследования выполнены при финансовой поддержке стипендии


Президента Российской Федерации молодым учёным и аспирантам
(СП‑2578.2018.5).

Литература
Liu K., Wang W., Tharmarasa R., Wang J. Dynamic vehicle detection with sparse point
clouds based on PE-CPD // IEEE Intelligent Transportation Systems. 2018. 14 p.
Soetedjo A., Somawirata K. Improving on-road vehicle detection performance by com-
bining detection and tracking techniques // 3rd Asia-Pacific Conf. Intelligent Robot
Systems. 2018. P. 23–27.

6
Обнаружение ориентиров с использованием
контурного анализа в задаче SLAM
В. А. Антипов, В. А. Коковкина, В. П. Кирнос, А. Л. Приоров
Ярославский государственный университет им. П. Г. Демидова
E-mail: valant777@gmail.com

Метод SLAM (simultaneous localization and mapping) — синхронное опре-


деление местоположения и составление карты. Эта задача связана с по-
строением карты неизвестного пространства мобильным роботом во
время навигации по строящейся карте. Методы одновременной лока-
лизации и сопоставления лежат в основе многих приложений для робо-
тов, и многие подходы используют лазерные дальномеры (LIDAR, Light
Identification Detection and Ranging) из-за их способности точно измерять
дальность до объектов вокруг себя.
Для нахождения ориентиров предложено использовать контурный
анализ. Идея подхода заключается в отказе обработки каждой точки, по-
лученной от лазерного дальномера и переходе к обработке лишь контура.
Целью работы является сравнение различных детекторов ориенти-
ров, работающих с использованием контурного анализа, в задаче SLAM.
Были использованы следующие подходы:
1. Согласованная фильтрация. Для обнаружения ключевых осо-
бенностей на контуре и формирования множества таких особен-
ностей можно использовать фильтры, согласованные с классом
форм. В данной работе применяется фильтры, согласованные
с эталонной формой типа «угол».
2. Алгоритм Teh-Chin. Можно использовать подходы, разработан-
ные для обнаружения доминирующих точек. Доминирующие
точки являются точками, обладающие высокой кривизной, для
оценки которой важно определить область поддержки. Одним из
адаптивных методов поиска области поддержки является метод
Teh-Chin, использующий отношение перпендикуляра и длины
хорды.
3. Алгоритм WU. Алгоритм Teh-Chin не является надёжным в при-
сутствии шума. Чтобы решить данную проблему, было предложе-
но выбирать область поддержки такую, чтобы она имела глобаль-
ное максимальное значение кривизны.
4. Метод масштабного пространства кривизны. Доминантные точ-
ки также можно искать, используя теорию так называемого мас-
штабного пространства кривизны.
Для сравнения подходов был реализован алгоритм одновремен-
ной локализации и построении карты на базе расширенного фильтра
Калмана, который рассматривает состояние системы как гауссовское
распределение, и постоянно оценивает математическое ожидание и кова-
риационную матрицу.
Для оценки месторасположения робота и ориентиров используется
модель, описывающую кинематику движения робота.
7
Экспериментальные исследования проводились в виртуальной среде
Gazebo. Для исследования была разработана тестовая сцена — 3D-модель
обычной комнаты с мебелью. В смоделированной комнате проводился
один заезд и записывались показания лазерной сканирующей системы.
Затем по записанным данным четыре раза запускался алгоритм SLAM
с различными детекторами ориентиров.
Лучшие результаты показали метод детектирования, использующий
согласованную фильтрацию, и алгоритм Wu. Худшие результаты показал
алгоритм Teh-Chin, что связано с тем, что алгоритм чувствителен к шуму.
Также была построена карта комнаты по полученным результатам
работы алгоритма SLAM.

8
Алгоритм функционирования системы технического зрения
для измерения размеров экструзионных изделий
П. В. Бабаян1, В. Е. Рогачиков2
1
Рязанский государственный радиотехнический университет
E-mail: pvbradio@yandex.ru
2
ООО «ПРОФИЛЬ-Р», Рязань, E-mail: vasiliy455@yandex.ru

При производстве экструзионных изделий из ПВХ возникает необхо-


димость в точном измерении их размеров. Как показала практика, пер-
сонал, который обслуживает экструдеры или другие станки, не всегда
справляется с проведением измерений на необходимом уровне, в резуль-
тате чего очень часто на выходе получаются изделия, не соответствующие
заданным размерам.
В связи с этим возникла необходимость автоматического измерения
длины изделия и его вывода на экран с минимальным участием человека.
Для этого разработана система технического зрения (СТЗ), составными
частями которой являются (Рогачиков, 2018):
• системный блок Lenovo ThinkCentre M81;
• видеокамера: JHSM1400f, 1/2.3″ CMOS с разрешением 4384×3288;
• PLC контроллер Omron cp1h x40dt-d.

Допустимая погрешность измерений составляет ±1 мм.


В докладе будет рассмотрен алгоритм функционирования СТЗ, в со-
ответствии с которым после запуска СТЗ на PLCконтроллер производ-
ственной линии отправляется запрос о цвете и номере инспектируемо-
го изделия, после чего алгоритм работает по одному из трёх возможных
вариантов, которые зависят от цвета изделия. Это необходимо для более
точного распознавания местоположения изделия на столе и отделения
объекта от фона. Далее выполняется поиск изделия на области стола,
цветокоррекция, измерение угла поворота изделия, измерение длины из-
делия, затем происходит обработка результатов и их отображение.
Одной из наиболее сложных задач, решаемых в ходе проектирования
алгоритма функционирования СТЗ, является задача измерения размеров
изделий. Выпускаемые изделия из ПВХ достаточно мягкие, вследствие
чего изделия большой длины (1 м и более) сложно расположить на сто-
ле прямолинейно и измерить их длину простым способом. Алгоритм из-
мерения длины изделий криволинейной формы основан на нахождении
взвешенных центров изделия в направлении, перпендикулярном глав-
ной оси, и дальнейшей аппроксимации по методу наименьших квадратов
(Jüttler, 1997).
В настоящее время разработано экспериментальное программное
обеспечение СТЗ с использованием программных пакетов NI Vision­
Builder и MatLab.
Результаты предварительных экспериментов показали достижимость
требуемой погрешности измерений. Планируется модернизация про-
граммного обеспечения СТЗ с целью обеспечения отбраковки продук-
9
ции по необходимым характеристикам, например, по поверхностным
дефектам.

Литература
Рогачиков  В. Е. Система технического зрения для определения размеров изделий
// Новые информационные технологии в научных исследованиях: материа-
лы 23-й Всерос. научно-техн. конф. студентов, молодых ученых и специали-
стов. Т. 1. Рязанский гос. радиотехн. ун-т, 2018. 306 с.
Jüttler B. Shape preserving least-squares approximation by polynomial parametric spline
curves // Computer Aided Geometric Design. 1997. V. 14(8). P. 731–747.

10
Семантическое описание сцен эталонной информации при
визуальной навигации беспилотного летательного аппарата
Н. Е. Бодунков, М. О. Пиндюрина
Московский авиационный институт (национальный исследовательский университет)
(МАИ), Москва, E-mail: boduncov63@hotmail.com; mpindyurina@npomis.ru

В статье рассматривается задача формирования эталонных описаний ори-


ентиров (эталонных сцен) для визуальной навигации беспилотных лета-
тельных аппаратов. Подходы, основанные на сопоставлении растровых опи-
саний (изображений), не устойчивы к изменению условий наблюдения и за-
гораживанию. В работе предлагается использовать семантические описания.
Семантические описания содержат описания объектов эталонной
сцены, их атрибутов и отношений между ними. Таким образом, они
должны быть более компактны по сравнению с растровыми (но содер-
жать достаточно информации для однозначной идентификации сцены,
и оценки координат).
В работе предлагается иерархическая структура семантического опи-
сания. В качестве основных атрибутов объектов предложены атрибуты
формы (служат для распознавания объекта) и навигационные атрибуты
(служат для оценки координат относительно объекта).
Для описания формы используются нечёткие атрибуты:
1) класс геометрического примитива — квадрат, прямоугольник, па-
раллельные линии;
2) относительный размер — большой, средний, малый.
Используемый в семантическом описании набор атрибутов может
быть при необходимости расширен. Например, могут быть добавлены ви-
зуальные атрибуты, содержащие наборы «эталонных» значений визуаль-
ных признаков объекта – распределения яркостей, текстур, сочетаний ха-
рактерных точек или линий и т. п., что позволит адаптировать эталонное
изображение к изменению текущих условий (например, времени суток).
Отношения между объектами увеличивает количество «полезной»
информации об эталонной сцене, позволяя существенно повысить устой-
чивость описания, например к частичному или полному загораживанию
некоторых объектов (искажению описания наблюдаемой сцены).
В качестве примера в статье предложены следующие отношения,
связывающие пары объектов: расстояние — очень близко, близко, дале-
ко, очень далеко; относительный размер; относительная ориентация  —
параллельно, перпендикулярно, диагонально.
На основе предложенных вариантов описаний была сформулирована
методика их формирования и рассмотрен процесс создания семантиче-
ского описания на примере тестовой сцены.
Приведённый пример показал, что предложенные структура и мето-
дика формирования семантического описания, удовлетворяют требова-
ниям компактности, устойчивости и адаптивности ЭИ.
Исследование выполнено при поддержке РФФИ (проект № 19-08-
00613).
11
Новые возможности применения цифровых камер
расширенного спектрального диапазона
А. В. Бондаренко1, М. А. Бондаренко1, В. А. Котцов2
1
ООО «РАСТР ТЕХНОЛОДЖИ», Москва, www.rastr.net
2
Институт космических исследований (ИКИ РАН), Москва, vladkott@mail.ru

Выбор спектрального диапазона чувствительности имеет большое значе-


ние для видеоинформационных систем и в значительной степени опре-
деляет эффективность производимых наблюдений. Для повышения
информативности результатов съёмки широкое распространение полу-
чило использование одновременного наблюдения в нескольких зонах
спектра и получение изображений на основе их комбинации, например,
(Мультиспектральная…, 2018). Для построения таких систем использу-
ют твердотельные матричные фотоприёмники. Однако применяемые
для наблюдения в разных зонах спектра фотоприёмники имеют суще-
ственно различающиеся физические характеристики, что приводит к не-
обходимости решения задачи совмещения изображений, полученных из
различного положения, ориентации, с различающимися полями зрения
и чувствительностью. Это снижает качество получаемой видеоинформа-
ции. Поэтому в настоящее время всё более широкое распространение на-
ходят цифровые камеры расширенного спектрального диапазона, кото-
рые могут во многих приложениях потеснить видеосистемы на двух раз-
носпектральных камерах смежных диапазонов, например, видимый плюс
ближний инфракрасный (ИК) диапазон, за счёт очевидного понижения
массы, габаритов, энергопотребления, стоимости, а также формирова-
ния мультиспектрального изображения без совмещения его составляю-
щих, что позволяет реализовать всю обработку сигналов непосредственно
в цифровой камере полностью на аппаратном уровне.
В докладе рассматриваются возможности применения такого клас-
са видеосистем на примере цифровой камеры RT-2400UV (УФ-камера…,
2019), разработанной компанией «РАСТР ТЕХНОЛОДЖИ» на базе уни-
фицированной аппаратно-программной платформы RT-XDC (Бондарен­
ко и др., 2016). RT-2400UV позволяет формировать изображения расши-
ренного спектрального диапазона в ультрафиолетовой (УФ), видимой
и ИК-областях излучения от 0,2 до 1,0 мкм. Высокая чувствительность
(квантовая эффективность до 81 % в УФ-диапазоне и до 96 % в види-
мом), прогрессивная развёртка кадров с частотой до 48 Гц, большой
размер пикселя 11×11 мкм фотоприёмника RT-2400UV с  разрешением
2048×2048 обеспечивают эффективное решение широкого спектра задач,
в частности следующие:
• обеспечение посадки и  навигации воздушных судов в  сложных
метеоусловиях (туман, снег, дождь);
• работа в составе мультиспектральной системы улучшенного виде-
ния;
• наблюдение объектов на фоне снежного покрова;
• анализ динамики процесса горения, предупреждение о старте ракет;
12
• изучение индустриальных и  естественных источников УФ-излу­
чения;
• диагностику в  УФ-С-диапазоне линий электропередач (ЛЭП),
контактных проводов и трансформаторных подстанций;
• активную оптическую локацию в условиях световых помех;
• астрономические наблюдения в ночное и дневное время;
• изучение световых явлений в  верхней атмосфере (полярные
сияния);
• мониторинг состояния озонового слоя Земли;
• спектральный анализ материалов и природных объектов;
• изучение архивных документов и  криминалистическую экс­
пертизу.

Применение цифровых камер расширенного спектрального диапазо-


на можно разделить на два основных варианта: изучение удалённых объ-
ектов и исследование близких объектов, к которым возможен непосред-
ственный доступ.
В первом случае, например, для астрономических исследований
в ночное и дневное время (Гаранин и др., 2017), предполагается исполь-
зование объектива, пропускающего в диапазоне регистрации фотоприём-
ника и применение колеса светофильтров для спектрального разделения
входящего излучения на два или три спектральных диапазона с целью по-
лучения цветного RGB-мультиспектрального комбинированного изобра-
жения, в котором цветовые компоненты отвечают за энергетику излуче-
ния в каждом диапазоне в соответствии с отработанным алгоритмом объ-
единения разноспектральных данных без информационных потерь (так
как возможно восстановление исходных данных из результата обработки)
с учётом линейной модели человеческого восприятия мультиспектраль-
ной информации (Бондаренко, Бондаренко, 2018).
Во втором случае, например, при изучении оригиналов древних ру-
кописей (Миклас и др., 2017), эффективно производить съёмку в тёмном
помещении в нескольких режимах интеллектуальной светодиодной под-
светки интересующего спектра, что исключает известные недостатки,
связанные с применением оптических фильтров и использованием меха-
ники для их смены.

Литература
Бондаренко  А. В., Бондаренко М. А. и др. Универсальная аппаратно-программ-
ная платформа цифровых видеокамер // 24-я Международная научно-техн.
конф. и шк. по оптоэлектронике и приборам ночного видения: сб. тр. М.:
НПО «Орион», 2016. С. 229–232.
Бондаренко  М. А., Бондаренко А. В. Формирование изображений в мультиспек-
тральных видеосистемах для визуального и автоматического неразрушающе-
го контроля // Успехи прикладной физики. 2018. Т. 6. № 4. С. 325–332.
Гаранин  С. Г., Зыков Л. И. и др. Дневное наблюдение звёзд слабой яркости (7m–8m)
с равнинной местности // Оптич. журн. 2017. Т. 84. № 12. С. 30–37.
13
Миклас Х., Бреннер С., Саблатниг Р. Мультиспектральная съёмка для цифровой
реставрации древних рукописей: устройства, методы и практические аспек-
ты // Историческая информатика. 2017. № 3. С. 116–134. DOI: 10.7256/2585-
7797.2017.3.23697.
Мультиспектральная система улучшенного видения RT-700Combo (2018): техн.
описание. М.: РАСТР ТЕХНОЛОДЖИ, 2018. [Электронный ресурс]. Режим
доступа: URL: http://rastr.net/product/special/multi-sys.html/
УФ-цифровая камера RT-2400UV: техн. описание. М.: РАСТР ТЕХНОЛОДЖИ,
2019. [Электронный ресурс]. Режим доступа: URL: http://rastr.net/product/
digit-cam/rt-xdc-platform/rt-2400uv.html/

14
Методы и средства графоаналитического анализа
многоспектральных изображений в интеллектуальных
человеко-машинных системах технического зрения
С. П. Ботуз
Федеральный институт промышленной собственности (ФИПС)
Е-mail.ru: bsp_serg@mail.ru

В докладе рассматриваются методы и средства графоаналитического


анализа многоспектральных изображений в интеллектуальных челове-
ко-машинных (эргатических) системах технического зрения (ИЭСТЗ)
(рис. 1, 2).

Рис. 1. Структура средств ИЭСТЗ и процесс визуализации изображений графоа-


налитических бинарных полей (ГАБП), которые представляют образ (сечение)
пространства параметров анализируемых кадров изображений контролируемых
объектов

15
Рис. 2. Аппаратная реализация многоканальных устройств Si,j, обеспечивающих
формирования ГАБП, анализируемых кадров изображений контролируемых объ-
ектов ИЭСТЗ

Для ИСТЗ важна не только успешность решения задач, связанных


с обнаружением и распознаванием тех или иных объектов (процессов
и т. п.) по комплексированному изображению, например, важна не толь-
ко констатация факта возникновения пожара, но и экспертная оценка
степени пожароопасности, важно не только распознавание того или ино-
го объекта (или субъекта), но и анализ его состояния на основе оценки
его поведения по набору кадров его изображений — необходима ком-
плексная оценка состояния наблюдаемого объекта и соответствующего
процесса.
Каждое многоканальное устройство Si,j ИЭСТЗ (см. рис. 1, 2) содер-
жит блок 1 нормирующих устройств, коммутатор 2, АЦП 3, первое ЗУ 4,
блок 5 интерполирования, блок 6 выделения экстремума, блок 7 масшта-
бирования, первую 8 и вторую 9 схемы формирования дискретных при-
ращений, блок 10 задания постоянных коэффициентов, блок 11 синхро-
низации, схему 12 формирования адреса записи, блок 13 управления,
блок 14 преобразования, второе ЗУ 15, регистрирующее устройство 16,
оптическую маску 17, оптическую систему 18, фотодатчик или ПЗС-
матрицу 19, блок 20 формирования статистических характеристик анали-
зируемого объекта и блок 21 формирования импульсных воздействий.

Литература
Ботуз  С. П. Системы технического зрения: методы поискового проектирования
// 13-я Международная научная конф. «Физика и радиоэлектроника в меди-
цине и экологии – ФРЭМЭ’2018»: сб. докл. 2018. Кн. 2. С. 257–262.

16
Обработка (кодирование/декодирование и визуализация)
изображений в интеллектуальных человеко-машинных
системах технического зрения
С. П. Ботуз
Федеральный институт промышленной собственности (ФИПС)
E-mail.ru: bsp_serg@mail.ru

В интеллектуальных человеко-машинных (эргатических) системах техни-


ческого зрения (ИЭСТЗ) обнаружение и распознавание целей, как пра-
вило, осуществляется на основе анализа сцен по комплексированному
многоспектральному изображению. Вся обработка изображений произ-
водится в пространственной области. При этом один канал является
опорным, остальные — вспомогательными. Процесс комплексирования
осуществляется относительно опорного канала. Для таких ИЭСТЗ, на-
пример, как системы дистанционного зондирования Земли (ДЗЗ), на
первом этапе производятся аффинные преобразования кадров изображе-
ний во вспомогательных каналах для совмещения их изображений с изо-
бражением опорного канала (Гуров и др., 2016). Основная особенность
этого этапа состоит в том, что в управляющий контур таких ИЭСТЗ вхо-
дят эксперты (или лица, принимающие решения — ЛПР, или Li(tj) — век-
тор состояния i-го ЛПР в tj момент времени, "i, j = 0,1, , n) различных
предметных областей (например, пилоты ЛА, пользователи или специа-
листы в области геоинформационных систем (ГИС), специалисты сель-
ского хозяйства и др.). Этот этап предполагает наличие диалоговых про-
цедур Li (tj) с соответствующими вычислительными и др. средствами об-
работки и представления баз данных и баз знаний (БД/БЗ) ГИС.
В этой связи в докладе основное внимание уделено первому этапу
интеллектуальной обработки изображений на основе применения аппа-
рата графоаналитического исчисления и соответствующего аппарата гра-
фоаналитических бинарных полей (ГАБП) или дискретных кадров ана-
лизируемого изображения (Ботуз, 2014).
Цель настоящей работы – автоматизированный синтез алгоритмов,
обеспечивающих повышение информативности (осведомлённости и т. п.)
Li(tj), необходимых для принятия решения в темпе формирования соот-
ветствующих видеоданных. Тем самым обеспечивая возможность сокра-
тить время обучения и адаптации ИЭСТЗ на этапах решения прикладных
задач, связанных с интеллектуальной обработкой многоспектральных
изображений в реальном масштабе времени.
Основные результаты выполненной работы могут быть сформулиро-
ваны в виде следующих утверждений.
Утверждение 1. Биективное кодирование/декодирование любой точ-
ки A(x(t); y(t)) в R2 ГАБП можно осуществить в нестационарном про-
ективном базисе (НПБ) или в когнитивном базисе Li(tj) или его агента
ИЭСТЗ, используя основные или реперные точки анализируемого кадра
изображения.
17
Утверждение 2. Для случая нормализованного стационарного про-
ективного базиса биективное кодирование/декодирование любой точки
М(x(ti); ti) в R2 ГАБП (или на плоскости экрана монитора) можно осуще-
ствить на основе следующих соотношений:
l1 Þ ∆ti ( x - x(ti )) - ∆xi (t - ti ) = 0; üïï
ý M ( x(ti ), ti ) Î (l1, l2 ) Î R , "∆ti , ∆xi ¹ 0;
2
l2 Þ ∆ti ( x - x(ti )) + ∆xi (t - ti ) = 0;ïï
ïþ
æ ö ææ öö
при ççè sup(∆ti ) ÷÷÷ø = inf(∆ti ) Ù çèççççè sup(∆xi ) = inf(∆xi ) ÷÷÷ø÷ø÷÷ , "ti , i = 0,1, 

Литература
Гуров  В. С. и др. Обработка изображений в авиационных системах техническо-
го зрения / под ред. Л. Н. Костяшкина, М. Б. Никифорова. М.: Физматлит,
2016. 240 с.
Ботуз  С. П. Интеллектуальные интерактивные системы и технологии управления
удаленным доступом. М.: СОЛОН-Пресс, 2014. 340 с.

18
Активный многочастотный лазерный сканер
ближнего ИК‑диапазона: конструкция и расчёт
энергетического потенциала
А. Н. Виноградов1, В. В. Егоров2, А. П. Калинин3,
А. И. Родионов1, И. Д. Родионов1, И. П. Родионова1
1
ЗАО «Научно-технический центр «Реагент», E-mail: irodionov@reagent-rdc.ru
2
Институт космических исследований РАН (ИКИ РАН), E-mail: victor_egorov@mail.ru
3
Институт проблем механики им. А. Ю. Ишлинского, E-mail: kalinin@ipmnet.ru

Одним из актуальных направлений практического использования ла-


зеров явилась лазерная локация, которой присущ ряд важных особен­
ностей:
• когерентность и малая длина волны излучения лазеров позволили
получать узкие диаграммы направленности (от единиц до десят-
ков угловых секунд) даже при небольших размерах излучателей;
• временная и  пространственная когерентность излучения лазеров
обеспечивают стабильность частоты при высокой спектральной
плотности их мощности. Последнее, а также остронаправлен-
ность лазерного излучения обусловливают скрытность и высокую
помехозащищённость лазерных локационных средств;
• высокая частота колебаний приводит к  большим доплеровским
сдвигам частоты при взаимных перемещениях цели и локатора;
• ближний ИК-диапазон обеспечивает возможность работы в  лю-
бое время суток, при наличии плохих метеоусловиях;
• коэффициент спектральной яркости (КСЯ) зондируемых поверх-
ностей и объектов в ближнем ИК-диапазоне существенно выше,
чем в видимом, что позволяет повысить энергетический потенци-
ал локатора.

Использование указанных преимуществ лидаров позволяет получать


детальные изображения зондируемой поверхности и малоразмерных объ-
ектов, а также даёт возможность получать высокую точность измерения
скорости как самого носителя, так и целей, попадающих в поле зрения
локатора. Кроме того, лазерный локатор ИК-диапазона обеспечивает вы-
сокую скрытность работы.
Лазерный локатор на практике исполняется в двух вариантах: с ис-
пользованием принципа прямого детектирования и с применением ге-
теродинного (гомодинного) приёма. Оба варианта локаторов строятся
по традиционным схемам и имеют как определённые преимущества, так
и недостатки. Назовём лишь некоторые их них. Сканер, построенный
по схеме прямого детектирования достаточно прост по своей конструк-
ции однако имеет более низкий энергетический потенциал (сигнал/шум)
чем сенсор с гетеродинированием. Последний же обладает более слож-
ной схемой детектирования в приёмном устройстве и дополнительными
элементами конструкции, включающими в себя: входной узкополосный
фильтр, смеситель, следящий фильтр доплеровского сигнала.
19
Расчёты энергетического потенциала обоих типов сенсоров включа-
ли в себя учёт генерационно-рекомбинационных шумов, фоновых шу-
мов, тепловых шумов и шумов темнового тока. Результаты расчётов по-
казали, что при заданных параметрах работы лазерных сенсоров (высота
полёта носителя 3 км, размер пикселя на земной поверхности 0,5 м, ско-
рость полёта носителя 30 м/c),отношение сигнал/шум будет находиться
в пределах от 6 до 24.

Работа выполнена в рамках государственных заказов АААА-А17-


117021310376-4 и AAAA –A18-1180227900139-1.

20
Система улучшенного и комбинированного видения
с использованием гиперспектрометра,
работающего в режиме перенацеливания
А. Н. Виноградов1, В. В. Егоров2, А. П. Калинин3,
А. И. Родионов3, И. Д. Родионов3, И. П. Родионова3
1
 ЗАО «Научно-технический центр «Реагент», E-mail: irodionov@reagent-rdc.ru
2
 Институт космических исследований РАН (ИКИ РАН), E-mail: victor_egorov@mail.ru
3
 Институт проблем механики им. А. Ю. Ишлинского, E-mail: kalinin@ipmnet.ru

В настоящее время в России и за рубежом всё больший интерес проявля-


ется к разработке и практическому использованию гиперспектрометров
видимого и ближнего ИК-диапазона (400–1000 нм). Особое внимание
уделяется гиперспектрометрам, обладающим узким мгновенным угло-
вым полем зрения, что при их высоком пространственном разрешении
позволяет успешно идентифицировать малоразмерные объекты, а также
определять тип зондируемых природных и антропогенных образований.
В ЗАО НТЦ «Реагент» был создан опытный образец узкоугольного гипер-
спектрометра (УГС), обладающий мгновенным угловым полем зрения
в 4°, работающий в режиме перенацеливания (рис. 1).

Рис. 1. Внешний вид узкоугольного гиперспектрометра


с устройством наведения (УН)

Следует отметить, что для обеспечения оперативности и эффектив-


ности работы УГС необходимо сопровождать его работу информацией
об обнаружении и координатах малоразмерных объектов или о простран-
ственном положении участков зондируемой поверхности, подлежащих
детальному изучению, что обеспечивается комбинацией УГС с широкоу-
гольным сенсором. Эта информация используется для наведения оптиче-
ской оси сенсора на изучаемый объект с помощью специального устрой-
ства наведения (УН) (рис. 2).
21
Рис. 2. Схема, поясняющая работу системы: Здесь δ — угол поля зрения широко-
угольного сенсора); H — высота полёта носителя; V — скорость носителя

Работа комплекса УГС исследовалась в ходе проведения полунатур-


ного эксперимента, в котором в качестве УН использовалась поворотная
платформа. Приводятся результаты исследования работы УГС, а также
результаты оценки пространственного разрешения УГС по полученным
гиперспектральным изображениям.

В части разработки конструкции работа выполнена в рамках государ-


ственного заказа АААА-А17-117021310376-4, а в части проведения экспе-
риментов AAAA –A18-1180227900139-1.

22
Регулярные перестраиваемые преобразования
с архитектурой глубоких нейронных сетей
А. Ю. Дорогов
ПАО «Информационные телекоммуникационные технологии» («Интелтех»)
Санкт-Петербург, E-mail: vaksa2006@yandex.ru

Рассматриваются метод построения сетевой топологии и алгоритм обуче-


ния двумерных регулярных перестраиваемых преобразований с дополни-
тельными плоскостями применительно к задачам распознавания и обра-
ботки изображений.
Регулярные перестраиваемые преобразования обладают уникальной
возможностью аналитического представления топологии реализующей
сети, что позволяет разработать алгоритмы обучения абсолютно-схо-
дящиеся за конечное число шагов. В работе показано, что реализующая
топология легко расширяется дополнительными плоскостями, при этом
число распознаваемых образов кардинально возрастает и покрывает все
элементы выходной плоскости классов. Причём расширение топологии
не нарушает принципа построения обучающего алгоритма. Построенная
топология идеологически близка к топологиям свёрточных нейронных
сетей глубокого обучения (LeCun et al., 1998), но является регулярной
с числом слоёв, устанавливаемым факторным представлением размерно-
стей изображения и выходной плоскости классов.
Типичным примером регулярного преобразования является алго-
ритм быстрого преобразования Фурье. Быстрые алгоритмы основаны на
возможности факторизации преобразования в произведение слабозапол-
ненных матриц. В перестраиваемых быстрых преобразованиях элемен-
ты матриц настраиваются, поэтому каждую слабозаполненную матрицу
можно интерпретировать как слой нейронной сети, где синаптическими
весами являются элементы слабозаполненных матриц. Отличительными
особенностями перестраиваемого преобразования являются линейность
и отсутствие входов смещений у нейронов. Регулярность обеспечивается
ограничениями на выбор размерностей преобразования. В общем случае
значение размерности должно быть представимо в виде произведения
N = p0 p1… pn–1, где pi — целые числа. Число n — определяет количество
слоёв регулярной сети. В отличие от полносвязанных нейронных сетей,
матрица слоя имеет много нулевых значений, а значимые элементы ре-
гулярно размещены в поле матрицы, образуя блоки, называемые нейрон-
ными ядрами. В терминологии быстрых алгоритмов ядро называется ба-
зовой операцией (например, операция «бабочка» для быстрого преобра-
зования Фурье с pi = 2). Размерности ядер в пределах i-го слоя одинаковы
и определяются коэффициентом pi. Благодаря регулярности топологию
сети можно описать аналитически, это позволяет разработать алгоритмы
обучения перестраиваемых преобразований, на основе принципа после-
довательной фрактальной фильтрации образов. Принципиальной осо-
бенностью этих алгоритмов является то, что они абсолютно сходятся за
n шагов (Дорогов, 2014).
23
Анализ показывает, что аналитическое представление топологии ре-
гулярного преобразования, имеет дополнительные степени свободы, ко-
торые позволяют выйти за границы топологий быстрых преобразований
и построить регулярные сети с дополнительными плоскостями, сохранив
при этом возможность использования абсолютно сходящихся алгорит-
мов обучения. При обучении дополнительные плоскости могут переклю-
чаться цифровыми кодами, образуя тесный конгломерат сетей, каждая
из которых обучается к своему образу. В настоящей работе рассмотрен
двумерный вариант регулярных сетей с дополнительными плоскостями.
Результаты легко редуцируются на одномерные образы и обобщаются на
многомерные кубы данных.

Литература
Дорогов  А. Ю. Теория и проектирование быстрых перестраиваемых преобразова-
ний и слабосвязанных нейронных сетей. СПб.: Политехника, 2014. 328 с.
LeCun Y., Bottou L., Bengio Y., Haffner P. Gradient-Based Learning Applied to Docu-
ment Recognition // Proc. IEEE. 1998. V. 86. Iss. 11. P. 1–46.

24
Позиционирование мобильного объекта с двумя реперными
излучателями по данным от одной камеры и инклинометра
А. И. Калинкин
Рязанский государственный радиотехнический университет
E-mail: san_mozart@mail.ru

Задача определения местоположения мобильных объектов с нанесён-


ными на их поверхность светоизлучающими либо световозвращающими
маркерами (реперами) по информации от одной видеокамеры актуальна
при проектировании авиационных систем целеуказания, систем автома-
тической стыковки космических аппаратов, для взаимного позициони-
рования подводных аппаратов, позиционирования беспилотного лета-
тельного аппарата внутри помещения, автоматизации промышленной
погрузки и др.
На практике широкое применение получили алгоритмы восстанов-
ления пространственных координат n реперных излучателей объекта, ос-
нованные на решении задачи Perspective-n-Point (PnP). За последнее де-
сятилетие разработан ряд эффективных алгоритмов решения задачи PnP
(Lepetit et al., 2009).
Для прикладных задач PnP характерна ситуация пропадания одно-
го или нескольких реперных излучателей позиционируемого объекта из
поля зрения камеры (Зейналов и др., 2012). Так, при наблюдении все-
го двух реперов из их общей совокупности (так называемого кластера
(Холопов, 2016)) восстановление их пространственных координат воз-
можно в случае решения задачи P2P. Решение задачи P2P, в общем слу-
чае, не приводит к однозначному решению, позволяющему получить
информацию о положении объекта в пространстве. Указанная неопре-
делённость устраняется введением априорной информации о начальных
условиях: необходимо знать любые два из шести неизвестных параметров
евклидова преобразования. Данными параметрами являются три угла
Эйлера (курс, тангаж, крен) и три элемента вектора параллельного пере-
носа.
Получить оценки углов крена и тангажа регистрирующей камеры
можно с помощью инклинометров на основе инерциальных измеритель-
ных модулей (ИИМ).
В данной работе проведён анализ возможно достижимой погрешно-
сти оценивания матрицы поворота и вектора смещения. Было показано,
что информация об априорном положении объекта (углы крена и танга-
жа), полученная с помощью ИИМ может существенно упростить задачу
абсолютного позиционирования. Результаты моделирования позволяют
утверждать, что определение местоположения объекта по расположен-
ным на нём двум реперным излучателям и априорному знанию ориен-
тации камеры, полученному с помощью внешних измерителей с СКО
0,05°, в условиях искусственно смоделированных данных возможно с по-
грешностью восстановления курса не более 0,2° и погрешностью восста-
новления пространственных координат — не более 1,2 мм.
25
Литература
Зейналов  Р. Ш., Якубенко А. А., Конушин А. С. Оценка траектории движения объек-
та с использованием инфракрасных маркеров // Материалы 14-й междунар.
конф. «Цифровая обработка сигналов и ее применение» (DSPA-12) М.: ИПУ
РАН, 2012. Т. 2. С. 267–271.
Холопов  И. С. Исследование алгоритмов выбора реперных светодиодных класте-
ров в задаче навигации по оптическим маркерам // Информационные техно-
логии. Радиоэлектроника. Телекоммуникации. 2016. № 7. С. 516–521.
Lepetit V., Moreno-Noguer F., Fua P. EPnP: An Accurate O(n) Solution to the PnP Prob-
lem // Intern. J. Computer Vision. 2009. V. 81. No. 2. P. 155–166.

26
Система идентификации и сопровождения БПЛА
в группе на основе системы технического зрения
А. А. Карпунин, И. П. Титков
Московский государственный технический университет им. Н. Э. Баумана (МГТУ)
E-mail: karpunin@bmstu.ru, titkov.ivan.bmstu@gmail.com

Системы идентификации и сопровождения широко применяются для об-


наружения воздушных объектов и последующего сопровождения и отсле-
живания перемещения. Для решения этих задач в основном используют-
ся радиолокационные комплексы.
В тех случаях, когда расстояния до объектов невелики, становится
возможным использовать для этих целей системы на основе технического
зрения.
Следует отметить, что в связи с участившимся использованием мало-
размерных беспилотных летательных аппаратов (БПЛА) в составе груп-
пы, решение отмеченных задач становится всё более актуальным. Плани­
руемое массовое использование БПЛА, например, для доставки заказов,
ставит новые вызовы для решения задач, связанных с обеспечением тра-
екторной безопасности аппаратов и контроля воздушной обстановки.
Целью работы является повышение качества идентификации отдель-
ных БПЛА в сложной воздушной обстановке при наличии динамических
помех.
На рис. 1 представлен состав функциональной схемы предлагаемой
системы идентификации и сопровождения БПЛА в группе на основе си-
стемы технического зрения.

Рис. 1. Функциональная схема системы идентификации и сопровождения БПЛА


в группе на основе системы технического зрения

Модуль сопровождения решает задачи обнаружения и определения


координат видимых воздушных объектов без присвоения им идентифи-
каторов. На основе полученной информации о текущем расположении
воздушных объектов модуль идентификации присваивает им уникаль-
ные идентификаторы, производит слежение за их перемещением от кадра
27
к кадру путём их локализации и решения задачи классификации на ос-
нове метода k-средних. Результат работы этих модулей демонстрируется
на рис. 2.

Рис. 2. Идентификация БПЛА группы

Полученные данные о перемещении БПЛА позволяют организовать


обратную связь по каналу системы технического зрения по положению
и скорости БПЛА и их ориентации. Для определения ориентации БПЛА
в пространстве целесообразно использовать систему разноцветных бор-
товых огней. Это позволит комплексировать данные системы телеметрии
и обеспечит повышение отказоустойчивости системы в случае выхода из
строя модулей передачи или приёма телеметрии.
Вычислительные эксперименты показали возможность применения
описанного подхода для задачи слежения за плотной группой динамиче-
ских аппаратов.

Работа выполнена при поддержке гранта «Фонда содействия разви-


тию малых форм предприятий в научно-технический сфере» (Фонд со-
действия инновациям) (Договор № 12089ГУ2/2016).

Литература
Программный модуль идентификации БПЛА в составе группы: свидетель-
ство о государственной регистрации программ для ЭВМ / И. П. Титков.
№ 2018663278. Дата регистрации 24.10.2018.
Титков  И. П. Применение машинного зрения в задачах координированного
управления группой БПЛА в плоскости. // Молодежный научно-техн. вест-
ник / МГТУ им. Н. Э. Баумана. Электрон. журн. 2014. № 11. URL: http://snt-
bul.bmstu.ru/doc/744623.html.
Титков  И. П. Система дистанционного автоматического управления БПЛА на
основе технического зрения // Молодежный научно-техн. вестн. / МГТУ
им. Н. Э. Баумана. Электрон. журн. 2015. № 12. URL: http://sntbul.bmstu.ru/
doc/826517.html.

28
Формирование управлений группой БЛА при поиске
наземных объектов на основе энтропийного подхода
Н. В. Ким, Н. А. Михайлов
Московский авиационный институт (национальный исследовательский
университет), Москва, E-mail: nkim2011@list.ru; n.mikhaylov.mai@mail.ru

Задача поиска наземных объектов с помощью роботизированных воз-


душных средств является актуальной на сегодняшний день. Как прави-
ло, при разработке таких систем возникает потребность в использовании
группы автономных беспилотных летательных аппаратов (БЛА), которая
могла бы решать поставленную задачу согласованно и с максимальной
эффективностью.
Современные подходы решения данной задачи предлагают исполь-
зовать методы и средства теории информации (Амелин и др., 2009). Тем
не менее в этих работах не учитывается фактор наблюдаемости объекта
интереса (ОИ) в различных областях поиска. Ранее авторами было пока-
зано, что учёт фактора наблюдаемости значительно повышает эффектив-
ность решения задачи поиска наземных объектов (Ким, Михайлов, 2018).
Целью данной работы является повышение эффективности решения
задачи поиска группой БЛА, за счёт разработки алгоритма, учитывающе-
го фактор наблюдаемости.
В работе показан алгоритм решения задачи группой БЛА при усло-
вии полного информационного обеспечения каждого участника поиска
(в каждый момент времени tкаждый член группы знает о положении дру-
гих участников и текущем состоянии поиска). В качестве критерия эф-
фективности поиска принято минимальное время поиска Tп при задан-
ной вероятности обнаружения ОИ:
minTп при Pпо ³ Pтр ,
t
где Pпо — вероятность правильного обнаружения ОИ; Pтр — заданное зна-
чение вероятности.
Выбор траектории поиска для каждого БЛА производится таким об-
разом, чтобы значение общей пропускной способности было максималь-
ным:
N
CΣ (q0 ) = max åC n (q),
qÎQ
n=1
где q Î Q  — индекс варианта распределения ОИ между БЛА в группе.
В работе представлены результаты компьютерного моделирования
разработанного алгоритма и проведён сравнительный анализ эффектив-
ности решения задачи с методом поиска по максимальной априорной ве-
роятности.

Исследование выполнено при поддержке РФФИ (проект № 19-08-


00613а).
29
Литература
Амелин  К. С., Антал Е. И., Васильев В. И., Граничина Н. О. Адаптивное управление
автономной группой беспилотных летательных аппаратов // Стохастическая
оптимизация в информатике. 2009. Т. 5. № 1. С. 157–166.
Ким  Н. В., Михайлов Н. А. Энтропийный подход к решению задачи поиска назем-
ных объектов с учётом фактора наблюдаемости объекта поиска // Техниче-
ское зрение в системах управления – 2018: сб. тез. М., 2018. С. 59.

30
Мониторинг пожарной обстановки группой БЛА
Н. В. Ким, М. И. Мокрова
Московский авиационный институт (национальный исследовательский университет)
E-mail: mary.mokrova@mail.ru

В представленной работе рассмотрен алгоритм расчёта оптимальной вы-


соты полёта БЛА в процессе выполнения задачи мониторинга пожарной
обстановки. Для повышения эффективности мониторинга зоны инте-
реса целесообразно использовать групповое применение БЛА. Однако
площадь, охваченная пожаром, может быть неоднородна относительно
пожарной обстановки: характеристик местности, пламени и дыма, что
влечёт за собой разный уровень наблюдаемости объектов интереса и без-
опасности БЛА. Таким образом, для увеличения эффективности приме-
нения группы БЛА в целях мониторинга пожарной обстановки необходи-
мо учитывать все вышеописанные условия функционирования и их изме-
нения относительно высоты полёта.
Целью данной работы является повышение эффективности монито-
ринга за счёт выбора оптимальной высоты полёта БЛА над каждым оча-
гом пожара, с учётом конкретной пожарной обстановки. Предлагаемый
авторами критерий эффективности мониторинга принимает во внимание
зависимость наблюдаемости объектов и безопасности БЛА при измене-
нии высоты полёта над каждым очагом пожара.
Для решения поставленной задачи указанные зависимости учитыва-
ются через уровни потерь, связанные:
1) с пропуском цели или неправильным обнаружением (ложной тре-
вогой) объектов интереса;
2) с повреждением или потерей БЛА при воздействии на него опас-
ных факторов пожара.
При расчёте критерия эффективности использовались эмпирически
выведенные модели наблюдаемости и безопасности БЛА.
Произведено компьютерное моделирование, на основании которо-
го подтверждена работоспособность описанного алгоритма. Полученные
результаты показывают, что выбранная по предложенному критерию вы-
сота полёта обеспечивает минимум потерь.
Представленные алгоритмы могут использоваться при организации
мониторинга пожарной обстановки с помощью группы БЛА с учётом ре-
шаемых целевых задач и требуемого уровня безопасности.
Исследование выполнено при поддержке РФФИ (проект № 19-08-00613а).

Литература
Евдокименков  В. Н., Ким Н. В., Мокрова М. И. Мониторинг пожарной обстановки
беспилотными летательными аппаратами // Материалы 11-й Всерос. студен-
ческой научно-техн. шк.-семинара «Аэрокосмическая декада». 2018. С. 30.
Мокрова М. И. Алгоритм оптимального выбора высоты полета и разделения функ-
циональной группы БЛА при мониторинге пожарной обстановки: тез. докл.
4-й Общерос. молодежной научно-техн. конф. СПб., 2018. С. 57.
31
Алгоритм комплексирования телевизионного и инфракрасного
изображений для систем улучшенного видения беспилотных
летательных аппаратов
С. Н. Кириллов, П. С. Покровский, П. Н. Сконников
Рязанский государственный радиотехнический университет
E-mail: skonnikovpn@yandex.ru

Одной из актуальных задач, решаемых современными бортовыми си-


стемами улучшенного видения летательных аппаратов, является ком-
плексирование разноспектральных изображений (Инсаров и др., 2014).
В работе предлагается модификация метода комплексирования с выделе-
нием локальных контрастов (Инсаров и др., 2013). Предлагаемый алго-
ритм использует адаптивный выбор угла поворота палитры на различных
участках изображения, а также имеет меньшую вычислительную слож-
ность, что необходимо для обработки изображений в режиме реального
времени.
Общая структура предлагаемого алгоритма комплексирования муль-
тиспектральных изображений имеет следующий вид:
1) яркости пикселей изображений двух каналов откладываются
по двум осям u и v, т. е. для каждого пикселя формируется исход-
ная точка (u(x, y), v(x, y)), где x, y — координаты пикселей;
2) при помощи усреднения значений ближайших пикселей опреде-
ляются координаты вспомогательных точек (ub(x, y), vb(x, y));
3) формируется карта углов поворота палитры φ(x, y);
4) рассчитываются проекции R(x, y) отрезков между исходной
(u(x, y), v(x, y)) и вспомогательной (ub(x, y), vb(x, y)) точкой на на-
правление φ(x, y);
5) производится линейное преобразование для согласования значе-
ний R(x, y) с динамическим диапазоном 8-битных полутоновых
изображений 0,255.
Для сравнения предложенного алгоритма с известным методом
(Инсаров и др., 2013) проведена объективная безэталонная оценка ре-
зультатов комплексирования по четырём показателям качества: метрика
Пиеллы (Piella, Heijmans, 2003), объём восприятия (Бондаренко, Дрын­
кин, 2016), QE (Xydeas, Petrovic, 2000), модификация SSIM (Yang et al.,
2008). Полученные для набора тестовых изображений значения этих по-
казателей качества показывают, что предложенный метод превосходит
известный алгоритм (Инсаров и др., 2013) на 0,9–9,6 %.

Опубликованные результаты получены в рамках государственного


задания № 8.8445.2017/БЧ Минобрнауки на 2017–2019 гг. высшим учеб-
ным заведениям и научным организациям в сфере научной деятельности.

32
Литература
Бондаренко  М. А., Дрынкин В. Н. Оценка информативности комбинированных
изображений в мультиспектральных системах технического зрения // Про-
граммные системы и вычислительные методы. 2016. № 1. С. 64–79.
Инсаров  В. В., Тихонова С. В., Михайлов И. И. Проблемы построения систем техни-
ческого зрения, использующих комплексирование информационных кана-
лов различных спектральных диапазонов // Информационные технологии.
2014. Приложение к № 3. С. 1–32.
Инсаров  В. В. и др. Формирование комплексированных телевизионно-тепло-
визионных изображений в системах переднего обзора летательных аппара-
тов // Вестник компьютерных и информационных технологий. 2013. № 4.
С. 3–10.
Piella G., Heijmans H. A new quality metric for image fusion // Proc. 2003 Intern. Conf.
Image Processing. 2003. V. 3. P. 173–176.
Xydeas  C. S., Petrovic V. Objective image fusion performance measure // Electronics let-
ters. 2000. V. 36. № 4. P. 308–309.
Yang C. et al. A novel similarity based quality metric for image fusion // Information Fu-
sion. 2008. V. 9. № 2. P. 156–160.

33
Алгоритм уменьшения влияния атмосферных осадков
на качество видеоизображений в системах управления
С. Н. Кириллов, П. С. Покровский, А. А. Бауков
Рязанский государственный радиотехнический университет
E-mail: baukov.andrej@yandex.ru

Неблагоприятные погодные явления (дождь, снег, туман) могут приве-


сти к неточному выполнению задач, поставленных перед управляемыми
объектами, использующими видеоизображения. Поэтому является целе-
сообразным использование систем улучшенного видения, предполага-
ющих уменьшение влияния атмосферных осадков на качество видеоин­
формации.
Проанализированы некоторые известные алгоритмы устранения
осадков: алгоритм пространственной медианной фильтрации (Гонсалес,
Вудс, 2012), алгоритм, основанный на фотометрической и динамической
моделях дождя (Garg, Nayar, 2007), двухэтапный алгоритм повышения
качества видеоизображений (Jia et al., 2012). Каждый из данных подходов
имеет свои преимущества и недостатки, поэтому представляется актуаль-
ной задача разработки алгоритма, в котором уменьшено влияние этих не-
достатков.
Предложенный алгоритм является двухэтапным: на первом этапе вы-
полняется обнаружение и устранение частиц осадков, на втором — по-
вышение контрастности с целью снижения туманообразного эффекта на
дальнем плане. При этом в предложенном алгоритме имеются отличи-
тельные особенности, направленные на снижение влияния недостатков
и усиление достоинств известных алгоритмов. К таким особенностям
относятся: модификация обнаружения пикселей осадков по трём после-
довательным кадрам, применение морфологической обработки, исполь-
зование каскада правил размера, формы, ориентации, скорости пере-
мещения и цвета области-кандидата, усовершенствование процедуры
устранения обнаруженных частиц осадков, а также модификация приме-
няемого для увеличения контрастности алгоритма адаптивной эквализа-
ции гистограммы с  ограничением (CLAHE), которая позволяет умень-
шить эффект «ореола», перенасыщение и чрезмерное увеличение яркости
в высокотекстурированных областях.
Выполнено сравнение предложенного алгоритма с известными
по следующим показателям качества обработанных изображений: доля
обнаруженных пикселей осадков; интенсивность осадков на обработан-
ном изображении, определяемая как разность интенсивностей известных
пикселей осадков на обработанном и эталонном изображениях, пиковое
отношение сигнал-шум (PSNR); индекс структурного сходства (SSIM)
(Wang et al., 2004).
По результатам сравнения установлено снижение интенсивно-
сти осадков на обработанном предложенным алгоритмом изображении
по сравнению с известными алгоритмами на 20 % и более, а также улуч-
шение других показателей качества до 27 %.
34
Литература
Гонсалес Р., Вудс Р. Цифровая обработка изображений. 3-е изд., испр. и доп. М.:
Техносфера, 2012. 1104 с.
Garg K., Nayar S. K. Vision and rain // Intern. J. Computer Vision. 2007. V. 75. No. 1.
P. 3–27.
Jia Z., Wang H., Caballero R. E. et al. A two-step approach to see-through bad weather
for surveillance video quality enhancement // Machine Vision and Applications.
2012. V. 23. No. 6. P. 1059–1082.
Wang Z., Bovik A. C., Sheikh H. R. et al. Image quality assessment: from error visibility to
structural similarity // IEEE Trans. Image Processing. 2004. V. 13. No. 4. P. 600–612.

35
Алгоритм обнаружения препятствий для системы улучшенного
видения на основе глубоких свёрточных нейронных сетей
В. В. Князь, А. Н. Бордодымов
Государственный научно-исследовательский институт авиационных систем
(ГосНИИАС), E-mail: vl.kniaz@gosniias.ru, bordodymov@gmail.com

Введение
В настоящее время в гражданской авиации стало широко востребован-
ным решение задачи обнаружения препятствий на сложных этапах по-
лёта, таких как взлёт, посадка, руление (Князь и др., 2017). Данная за-
дача обуславливается увеличением числа рейсов гражданской авиации.
Перспективным средством помощи экипажу является авиационный ди-
сплей.
Мощным инструментом, позволяющим распознавать класс объекта
с вероятностями, близкими к вероятностям распознавания человеком,
являются глубокие свёрточные нейронные сети. Для успешного обучения
свёрточной нейроной сети необходим большой объём и разнообразие об-
учающей выборки изображений. Для получения обучающей и тестовой
выборки была создана реалистичная 3D-сцена аэропорта Сочи. В данной
сцене была реализована симуляция посадки самолёта по разным траекто-
риям (глиссадам), а также был добавлен динамический объект (самолёт)
который пересекал траекторию посадки. Стоит отметить, что изображе-
ния, полученные с помощью 3D-моделирования, в свою очередь, не в
полной мере удовлетворяют требованиям разнообразия фоновой обста-
новки.

Методы
В данной работе рассматривается алгоритм обнаружения препятствий
для системы улучшенного видения на основе глубоких свёрточных ней-
ронных сетей. Для обучения данной сети была создана выборка из 1000
пар изображений. На вход подавались изображения видимого диапазона,
а на выход меточные изображения, на которых были размечены ВПП (зе-
лёный цвет) и самолёт (красный цвет). Для решения поставленной задачи
была использована свёрточная нейронная сеть ObstacleGAN (Мизгинов
и др., 2018), которая производила итеративный подбор выходной кар-
тинки для соответствия выходов нижних слоёв нейронной сети выходам
эталонного изображения. Функционирование сети осуществлялось с по-
мощью библиотеки PyTorch (https://pytorch.org/).

Результаты
Произведено обучение глубокой свёрточной нейронной сети с исполь-
зованием графического процессора NVidia GTX 1080. Для анализа каче-
ства произведено построение тестовой выборки, объёмом 270 пар изобра­
жений.
36
RealA RealB Fake B
Изображения тестовой выборки

Выводы
Сравнение изображений, полученных с использованием глубоких свёр-
точных нейронных сетей, с размеченными изображениями, подтвердило
работоспособность предложенного алгоритма.

Литература
Князь  В. В., Федоренко В. В., Мизгинов В. А., Князь В. А., Пургатхофер В. Использо-
вание глубоких сверточных нейронных сетей для автоматического выделе-
ния препятствий на взлетно-посадочной полосе по данным видимого и ин-
фракрасного диапазона // Научная визуализация: эл. журн. 2017. Квартал 4.
Т. 9. № 4. С. 89–96.
Мизгинов  В. А., Князь В. В., Данилов С. Ю. Обнаружение препятствий на взлётно-
посадочной полосе на основе глубокой свёрточной нейронной сети Obstacle-
GAN // Молодёжь и будущее авиации и космонавтики: Юбилейный всерос-
сийский конкурс научно-технических работ и проектов / МАИ. 2018.

37
Построение воксельных моделей по одной фотографии
на основе генеративно-состязательных сетей
В. В. Князь, П. В. Мошканцев
Государственный научно-исследовательский институт авиационных систем
(ГосНИИАС), E-mail: vl.kniaz@gosniias.ru, vsadnik1997@mail.ru

Автоматическое построение 3D-модели объекта является сложной зада-


чей, если на вход алгоритма подаётся только одно цветное изображение.
Эта проблема всегда представляла большой интерес для исследователь-
ского сообщества, и в последние годы было предложено много новых
подходов, которые включали глубокое обучение. Например, для прогно-
зирования ненаблюдаемых вокселей по одной карте глубины были пред-
ложены несколько методов. Однако предсказание воксельной модели
сложной сцены по одному трёхканальному(RGB) изображению является
ещё более сложной задачей. Очевидно, что для надёжной работы мето-
да с одним изображением требуется предварительное знание 3D-формы
объектов.
В работе (Goodfellow et al., 2014) предложена глубокая нейронная
сеть Z-GAN, решающая задачу построения воксельной модели на основе
генеративно-состязательного подхода. Данная сеть обучалась на выборке
VoxelCity объёмом в  36 416 реальных изображений, содержащая 28 сцен
с эталонными 3D-моделями, картами глубины и оценками положения
камеры. Сеть качественно производила восстановление моделей объек-
тов, присутствовавших в обучающей выборке. Обобщение на новые клас-
сы объектов приводило к появление артефактов. Для улучшения качества
работы сети было предпринято решение дополнить выборку модельными
фотографиями, так как объём выборки с реальными изображениями был
недостаточным.
Целью настоящего исследования является сравнение качества ра-
боты условной генеративно-состязательной сети Z-GAN при обучении
на выборке, составленной их модельных изображений, реальных изо-
бражений и их объединении. Особенностью используемой сети является
использование пирамидальных воксельных моделей (Knyaz et al., 2018).
Элементами пирамидальной воксельной модели являются части усе-
чённой пирамиды видимости. Благодаря этому, каждый элемент пира-
мидальной воксельной модели контурно совпадает с пикселем цветного
изображения, что повышает сходимость процесса обучения.
Для анализа качества работы сети при использовании модельных
и реальных данных произведено обучение и тестирование на подготов-
ленных выборках. Произведено сравнение результатов работы алгоритма
на выборках, содержащих только реальные фотографии, только модель-
ные изображения и на объединённой выборке. Для тестирования были
выбраны 100 реальных фотографий различных машин, не участвующих
в процессе обучения. Анализ результатов показал, что при использовании
смеси модельных и реальных данных обеспечивается наиболее высокое
качество восстановления новых классов объектов.
38
Литература
Goodfellow I. J., Pouget-Abadie J., Mirza M., Xu B., Warde-Farley D., Ozair S., Cour-
ville A., Bengio Y. Generative Adversarial Networks // Proc. 27th Intern. Conf. Neu-
ral Information Processing Systems. 2014. V. 2. P. 2672–2680. arXiv:1406.2661v1.
Knyaz  V. A., Kniaz V. V., Remondino F. Image-to-Voxel Model Translation with Condi-
tional Adversarial Networks // Computer Vision — ECCV-2018: Workshops. 2018.
P. 601–618.

39
Интерактивная система визуализации движения ровера
на веб-ресурсах
Ю. А. Ковеленов1, А. А. Ковеленов1, А. В. Говоров2,3, Р. Р. Назиров2
1
ООО «Софт Эйт Софт», E-mail: yuri@soft8soft.com
2
Институт космических исследований РАН (ИКИ РАН), E-mail: avgff@iki.rssi.ru
3
Московский государственный университет геодезии и картографии (МИИГАиК)
E-mail: gffenator@gmail.com

В 2018 г. был выполнен переход на новую систему 3D-визуализации


(трёхмерный движок) на веб-ресурсах под названием Verge3D. Движок
разработан в России российской компанией «Софт Эйт Софт».
Движок работает в любых современных веб-браузерах без установки
каких-либо дополнительных плагинов. Для создания контента может ис-
пользоваться пакет 3D-моделирования 3ds Max или Blender, а также визу-
альный редактор логики Puzzles. Приложения могут быть развёрнуты на
собственных веб-сайтах, в облачном сервисе Verge3D Network и в соци-
альных сетях.
Сервис Verge3D основан на Three.js — легковесной кроссбраузерной
библиотеке JavaScript, используемой для создания и отображения аними-
рованной компьютерной 3D графики при разработке веб-приложений.
Основными требованиями к параметрам системы визуализации яв-
ляются: максимально приближённая к реальной сцена, показывающая
место нахождения объекта на Марсе, освещённость, тени. Также модель
должна передавать механику взаимодействия ровера с поверхностью
Марса с учётом гравитации, особенностей поверхности и т. д. В соответ-
ствии с поставленными требованиями специалистами компании «Софт
Эйт Софт» при участии сотрудников ИКИ РАН был разработано пилот-
проектное интерактивное демонстрационное веб-приложение Vehicle.
Управление ровером осуществляется нажатием клавишей W — уско-
рение, S — замедление, A — поворот налево и D — поворот направо.
Основным форматом является glTF 2.0, это новейшая версия стан-
дарта для обмена трёхмерной графикой в интернете. Процесс моделиро-
вания выполняется в открытом и повсеместно распространённом про-
граммном обеспечении Blender.
Программа Blender поддерживает три модели материалов: первая мо-
дель, условно, называемая стандартной — по сути множество настроек на
панели редактора материала, вторая, более продвинутая — основана на
встроенном редакторе нод, и третья, самая сложная — встроена в «рей-
трейсинговый» рендерер Cycles. В дополнение к блендеровским матери-
алам, стандартом glTF 2.0 определён фотореалистичный PBR-материал,
основанный на модели освещения MetallicRoughness. Его использование
сводится к добавлению на сцену соответствующей группы нод, которая
в при экспорте заменяется на настройки материала, описанные в стан-
дарте.
Помимо материалов, в освещении большую роль играют источники
света: некоторые из них действуют совершенно не так как, как предпо-
40
лагает разработчик, настраивающий их в Blender — это следствие разли-
чий в математических моделях, используемых для расчёта интенсивности
света. В результате серии экспериментов, а также критической ревизии
блендеровских исходных текстах, авторам удалость привести освещение
к какому-то общему знаменателю.
Анимация также поддерживается и экспортируется из Блендера,
кстати, она довольно неплохо сделана в стандарте glTF 2.0.
Для реализации логики работы приложения используется визуаль-
ный редактор, основанный на библиотеке под названием Blockly для обу-
чения азам программирования.

41
Локальная оценка резкости
микротомографического изображения
А. С. Корнилов1,2, И. В. Сафонов1, И. В. Якимчук1
1
Московский научно-исследовательский центр компании «Шлюмберже»
E-mail: kranton94@mail.ru, isafonov@slb.com, iyakimchuk@slb.com
2
Национальный исследовательский ядерный университет «МИФИ»

В настоящее время для математического моделирования ряда физических


и химических процессов в горных породах применяют технологию «циф-
рового керна» (Berg et al., 2017). Как правило, рентгеновская микротомо-
графия используется для получения трёхмерного изображения образца.
Для моделирования из полного изображения вырезается объёмный фраг-
мент меньшего размера. Требуется взять фрагмент заданного размера из
участка изображения, имеющего наилучшее качество. Качество микро-
томографического изображения зависит от многих факторов, в частно-
сти, от уровня шума, резкости, контраста, наличия кольцевых артефактов
и присутствия частиц высокой плотности. Все данные характеристики
качества анизотропны и изменяются по объёму изображения. В данной
работе рассматривается алгоритм для локальной оценки резкости.
Сложность данной задачи обусловлена следующими тремя причи-
нами. Во-первых, сканированный образец занимает только часть микро-
томографического изображения, и оценку качества необходимо делать
только для области образца, т. е. внутри так называемой области инте-
реса. Во-вторых, существующие критерии резкости или, наоборот, раз-
мытия хорошо работают только для искусственных ситуаций, например,
для размытия изображения фильтром Гаусса и отсутствия шума. В случае
реальных микротомографических изображений характер размытия су-
щественно сложнее, и на размытом изображении может присутствовать
достаточно сильный шум. В-третьих, значительное количество существу-
ющих критериев резкости не являются независимыми от содержимого
изображения, и на их основе нельзя сравнивать друг с другом качество
изображений различных образцов (Safonov et al., 2018).
Предлагается алгоритм автоматического определения области ин-
тереса для 2D-среза, основанный на пороговом ограничении результата
применения фильтра локальной дисперсии и операций математической
морфологии. В качестве критерия резкости в локальном окне вычисля-
ется инверсный критерий размытости, основанный на сравнении гради-
ентов исходного изображения и его размытой копии (Crete et al., 2007).
Шум значительно смещает оценку резкости. По этой причине шум пред-
варительно подавляется путём применения нескольких итераций билате-
рального фильтра. Количество итераций зависит от уровня шума, опре-
деление которого выполняется автоматически на основе статистических
оценок в локальном окне.
Демонстрируются результаты работы предложенного критерия рез-
кости для синтетической модели и реальных микротомографических изо-
бражений. Оценки резкости, данные предложенным алгоритмом, имеют
42
хорошую корреляцию с оценками экспертов, которые получены в ходе
процедуры попарных сравнений изображений из тестового набора. За
счёт независимой параллельной обработки срезов достигается высокая
скорость оценки качества всего 3D-микротомографического изобра­
жения.

Литература
Berg  C. F., Lopez O., Berland H. Industrial applications of digital rock technology // J.
Petroleum Science and Engineering. 2017. V. 157. P. 131–147.
Crete F., Dolmiere T., Ladret P., Nicolas M. The blur effect: perception and estimation
with a new no-reference perceptual blur metric // Human vision and electronic im-
aging. 2007. V. 6492. P. 64920l.
Safonov  I. V., Kurilin I. V., Rychagov M. N., Tolstaya E. V. Adaptive Image Processing Al-
gorithms for Printing // Springer Singapore, 2018. 304 p.

43
Структурозональный анализ видеоинформации
и его применение в техническом зрении
В. А. Котцов, А. Н. Дроханов
Институт космических исследований (ИКИ РАН), Москва
E-mail: vladkott@mail.ru; 123dan45@list.ru

Широкое распространение среди видеоинформационных систем полу-


чила многозональная (спектрозональная) съёмка, одновременное полу-
чение изображений и анализ видеоинформации в разных зонах электро-
магнитного спектра. Она обеспечивает получение большой части инфор-
мации о состоянии природной среды, состава и состояния наблюдаемых
объектов, для ориентации на местности и навигации. Однако значитель-
ная часть информации представлена в текстурах, структурных элементах
изображения.
Для её получения необходимо формировать изображение с высокой
детальностью при большом захвате, что проблематично. Для разреше-
ния этого противоречия была предложена структурозональная съёмка,
одновременное получение и анализ видеоинформации в разных зонах
пространственного спектра. Технология структурозонального преобра-
зования представляет сочетание оптического сканирования и простран-
ственной фильтрации. Структурозональные изображения получают пу-
тём последовательного пофрагментного обзора наблюдаемого поля (опе-
рационная апертура) с преобразованием текущего фрагмента в спектр
пространственных частот, выделении в этом спектре составляющих
по частоте и/или направлению, а по полученным оценкам формирова-
нии соответствующих изображений. Такая технология даёт возможность
расширить качественный состав получаемой информации, а также может
применяться в обработке видеоинформации высокого разрешения для
получения целенаправленных оценок наблюдаемых структур. Для одно-
временного представления результатов, полученных в разных зонах про-
странственного спектра, используется цветокодирование.
Структурозональные изображения позволяют выделять и получать
целевую информацию о размерах или ориентации пространственных
структур на изображениях, для изучения размера и направления волн на
воде или эоловых форм рельефа в пустынях, для классификации облач-
ных структур, получения текстурных оценок для определения видового
и возрастного состава, и плотности лесов. Структурометрический ана-
лиз изображений применим в изучении урбанизированных территорий,
оценках состояния сельскохозяйственных культур, при геологических
изысканиях для выделения линеаментов и их ориентации, кольцевых
структур.
Структурометрический анализ может быть также использован для
контроля различной продукции. Может выполняться контроль степени
очистки светопропускающих жидкостей (вода, авиационный керосин,
бензины, масла и т. д.) от нежелательных микропримесей в промышлен-
ности. А также контроль соответствия стандартам продуктов питания
44
(алкогольная и безалкогольная продукция, растительные масла, молоко
и пр.) или контроль качества жидких препаратов в фарминдустрии.
Структурозональный способ контроля позволяет обнаруживать
не только непрозрачные включения в жидкости, но и такие прозрачные
конгломераты и образования, показатель преломления которых отлича-
ется от основной среды. Отличительной особенностью такого способа
контроля является возможность получения необходимой информации на
потоке, мгновенно со всего исследуемого объёма.
В докладе представлены варианты технических решений структуро-
зонального способа получения видеоинформации, а также примеры его
использования для разных задач.

45
Тест-объект для фотограмметрической калибровки
разноспектральных камер систем технического зрения
И. А. Кудинов 1, О. В. Павлов 1, И. С. Холопов 1,2
1
АО «Государственный рязанский приборный завод», E-mail: hunter@grpz.ryazan.ru
2
Рязанский государственный радиотехнический университет
E-mail: kholopov.i.s@rsreu.ru

Автоматическое совмещение изображений от разноспектральных кана-


лов систем технического зрения является одной из важных задач проек-
тирования систем улучшенного видения (СУВ). Основным ограничением
к применению алгоритмов поиска соответствий точечных особенностей
сцены с помощью их дескрипторов для совмещения таких изображений
является различная физическая природа кадров, формируемых разно-
спектральными камерами. Так для трёхспектральных СУВ, содержащих
телевизионную (ТВ) камеру и камеры коротковолнового (КВ) и длин-
новолнового (ДВ) инфракрасного диапазонов (Бондаренко и др., 2018),
первые два сенсора воспринимают отражённый от объектов свет, а по-
следний — собственное тепловое излучение, поэтому изображения
от различных каналов таких СУВ могут иметь различную контрастность
и резкость (например, изображения объектов в ДВ ИК-диапазоне не со-
держат теней, не имеют, как правило, ярко выраженных контуров на гра-
нице «объект – фон», а их яркость не коррелирована с яркостью тех же
объектов в видимом и КВ- ИК-диапазонах).
При фиксированном взаимном положении разноспектральных сен-
соров СУВ и наличии оценок дальности до наблюдаемых ими объектов
матрицы гомографии, устанавливающие связь между пиксельными коор-
динатами сенсоров различных диапазонов, могут быть вычислены, если
в ходе фотограмметрической калибровки получены оценки матриц вну-
тренних и  внешних параметров (Hartley, Zisserman, 2003). Такой подход
к оцениванию матриц гомографии может быть реализован в лаборатор-
ных условиях и поэтому имеет преимущество по сравнению с техниче-
ским решением (Бондаренко и др., 2018), в котором матрицы гомографии
оцениваются в ходе лётных испытаний по четвёркам опорных точек (ОТ)
на изображениях каждого канала СУВ в соответствии с работой (Ефимов,
Новиков, 2016), а ОТ выступают изображения специальных разноудалён-
ных тест-объектов (мишеней).
Авторами разработан (Кудинов, Павлов, Холопов, 2018) тест-объект
(ТО) для автоматизированной фотограмметрической калибровки ТВ,
КВ ИК и ДВ ИК камер, предполагающей применение популярных про-
граммных продуктов: функций библиотеки Open  CV или инструмента
Camera calibration Toolbox для MatLab. Тест-объект позволяет форми-
ровать в каждом из каналов трёхспектральной СУВ высококонтрастное
изображение типа «шахматное поле» с количеством ОТ в каждом кадре,
равным (Nстр + 1)(Nстлб + 1), где Nстр и Nстлб — количество клеток в строке
и столбце изображения.
46
Применение ТО для фотограмметрической калибровки ТВ и ДВ
ИК‑камер макета распределённой панорамной системы (Кудинов И. А.
и др., 2018) позволило обеспечить абсолютную ошибку совмещения раз-
носпектральных изображений в панорамном кадре не более двух пиксе-
лей.

Лтература
Бондаренко  А. В., Бондаренко М. А., Докучаев И. В., Князев М. Г., Павлов Ю. В., Яд-
чук К. А. Выбор и совмещение информативных видеоканалов в мультиспек-
тральной системе реального времени // Техническое зрение в системах управ-
ления – 2018: тез. докл. научно-техн. конф. М.: ИКИ РАН, 2018. С. 23–24.
Ефимов  А. И., Новиков А. И. Алгоритм поэтапного уточнения проективного пре-
образования для совмещения изображений // Компьютерная оптика. 2016.
Т. 40. № 2. С. 258–265.
Кудинов  И. А., Павлов О. В., Холопов И. С., Храмов М. Ю. Формирование видео-
панорамы по информации от разноспектральных камер // Информаци-
онные технологии и нанотехнологии: сб. тр. 4-й Международной конфе-
ренции и молодежной школы. Самара: Самарский нац. исследоват. ун-т
им. акад. С. П. Королёва, 2018. С. 568–575.
Кудинов  И. А., Павлов О. В., Холопов И. С. Тестовый шаблон для калибровки ви-
деодатчиков многоспектральной системы технического зрения. Патент РФ
№ 2672466. Опубл. 14.11.2018.
Hartley R., Zisserman A. Multiple View Geometry in Computer Vision. 2nd ed. Cam-
bridge: Cambridge University Press, 2003. 656 р.

47
Комплексирование изображений разных спектральных
диапазонов на основе генеративной состязательной
сети FusionNet
М. А. Лебедев, Д. В. Комаров, О. В. Выголов, Ю. В. Визильтер
Государственный научно-исследовательский институт авиационных систем
(ГосНИИАС), E-mail: MLebedev@gosniias.ru

Проблема создания эффективных методов и алгоритмов комплексирова-


ния изображений, регистрируемых датчиками технического зрения в раз-
личных спектральных диапазонах, по-прежнему актуальна как в задачах
обеспечения надёжного автоматического обнаружения и распознавания
объектов в широком диапазоне условий их наблюдения, так и в задачах
человеко-машинного взаимодействия в части информационной под-
держки оператора средствами улучшенного видения операционной сре-
ды. В частности, в авиационных системах улучшенного видения (СУВ)
для обеспечения информационной поддержки экипажа в широком диа-
пазоне условий видимости актуальна задача комплексирования инфор-
мации, получаемой от разноспектральных датчиков технического зрения.
На сегодняшний день основной парадигмой в области обработки
и анализа изображений являются глубокие конволюционные нейронные
сети (ГКНС) и глубокое машинное обучение. Практически во всём спек-
тре задач технического зрения нейросетевые алгоритмы на основе ГКНС
демонстрируют качественно лучшие результаты по сравнению с алгорит-
мами предыдущих поколений, приближая эти результаты к возможно-
стям человека, а в ряде случаев даже превосходя их. ГКНС могут эффек-
тивно применяться в том числе и при решении задач комплексирования
разноспектральных изображений.
В данной работе предлагается новый метод комплексирования раз-
носпектральных изображений на основе генеративной состязательной
нейронной сети. Отличительными особенностями метода являются фор-
мирование комплексного изображения с низким уровнем шумов, сохра-
нение информативных областей со всех входных разноспектральных изо-
бражений, отсутствие артефактов, характерных для классических методов
комплексирования, например, наличие ореолов свечения в случае метода
комплексирования с использованием пирамиды Лапласианов, решение
проблемы локальной инверсии контраста, устранение геометрического
рассогласования входных изображений на комплексном изображении.
В работе приводятся архитектура сети FusionNet, описания методики
построения обучающей и тестовой выборок, а также процесса аугмента-
ции данных. Показаны примеры работы предлагаемого метода комплек-
сирования на реальных телевизионных и инфракрасных изображениях.
Проводится сравнение результатов предложенной сети FusionNet с дру-
гими недавними методами комплексирования, рассмотренными в работе
(Li et al., 2018).
Пример комплексирования изображений сетью FusionNet приведён
на рисунке.
48
Пример комплексирования изображений сетью FusionNet: слева — входное теле-
визионное изображение; в середине — входное инфракрасное изображение; спра-
ва — результат комплексирования сетью FusionNet

Работа выполнена при поддержке РФФИ (проект № 18-07-01275А).

Литература
Li H., Wu X. J., Kittler J. Infrared and Visible Image Fusion using a Deep Learning
Framework // Intern. Conf. Pattern Recognition (ICPR-2018). Beijing, China,
2018. arXiv:1804.06992.

49
Модель зрительного анализатора дешифровщика
в виде эквивалентного фильтра пространственных частот
на основе функции передачи модуляции
А. С. Молчанов
Войсковая часть 15650, 416507 Ахтубинск Астраханской области
E-mail: 9171900070@rambler.ru

Все оптико-электронные системы (ОЭС), создающие изображения, рас-


считываются на совместную работу со зрительной системой операто-
ра-дешифровщика. Поэтому при проведении исследований, испытаний
и оценки изображений полученными ОЭС необходимо учитывать осо-
бенности работы зрительного анализатора. Для наблюдения и регистра-
ции малоразмерных, малоконтрастных или удалённых объектов должны
учитываться острота зрения, функции передачи модуляции (ФПМ) глаза,
инерционность, спектральная чувствительность, интегральная чувстви-
тельность, цветовые характеристики глаза, а также его контрастная чув-
ствительность.
С позиций теории передаточных функций зрительную систему удоб-
но рассматривать как последовательное соединение двух звеньев через
ФПМ: звена формирования изображения и звена получателя информа-
ции. К звену формирования изображения можно отнести оптическую
систему глаза (роговица, хрусталик, стекловидное тело и радужная обо-
лочка, изменяющая диаметр зрачка), светочувствительную систему (сет-
чатку), нервные каналы и систему, управляющую моторными функ-
циями зрения. Получатель информации объединяет отделы головного
мозга, в которых происходят процессы опознания зрительных образов.
Зрительный анализатор дешифровщика является нелинейной системой.
Вводя ряд ограничений (фиксирование условий работы, ограничение ди-
намического диапазона и др.), в проверенных условиях наблюдений воз-
можна линеаризация характеристик зрительного анализатора (Веселов
и др., 2013; Молчанов, 2017).
Данные о ФПМ оптической системы глаза дают представление о ка-
честве изображения на поверхности сетчатки, но они не содержат инфор-
мации о состоянии нервной системы зрительного анализатора и поэтому
имеют ограниченное значение.
Функция ФПМ зрительной системы определяется и основывается
на количественном измерении субъективной реакции глаза, локализо-
ванной в области эффекта Маха при наблюдении перепадов небольшого
контраста с линейным нарастанием яркости внутри перепада. Проведены
измерения распределения яркости в изображении воздействующего сти-
мула и измерена субъективная реакция на этот стимул. Полученные
функция стимула и функция отклика пересчитываются в соответствую-
щие амплитудные спектры.
Зрительный анализатор как преобразователь оптического сигнала
можно представить в виде эквивалентного фильтра пространственных
частот. Оптическая система глаза представляет собой фильтр низких
50
пространственных частот, а сетчатка эквивалентна фильтру высоких про-
странственных частот. Взаимодействие этих двух фильтров и определяет
общую ФПМ зрительного анализатора.

Литература
Веселов  Ю. Г., Гулевич С. П., Молчанов А. С. Исследование линейности аэрофото-
систем, построенных на основе ФППЗ // Наука и образование: электрон-
ное научно-техническое издание / МГТУ им. Н. Э. Баумана. 2013. Вып. 9.
С. 313– 324.
Молчанов  А. С. Иконические системы воздушной разведки: Основы построения,
оценка качества и их применение в комплексах с беспилотными летательны-
ми аппаратами. Ахтубинск, 2017. 216 с.

51
Уменьшение вычислительной сложности алгоритмов
цифровой фильтрации путём предварительного
детектирования изображений
А. В. Пономарев, А. В. Богословский, И. В. Жигулина, Е. А. Богословский
Военный учебно-научный центр Военно-воздушных сил
«Военно-воздушная академия имени профессора Н. Е. Жуковского и Ю. А. Гагарина»
Воронеж, E-mail: cycloida@mail.ru

Несмотря на значительные успехи в области технического зрения, суще-


ствующие в настоящее время методы обработки изображений обладают
рядом недостатков, таких как: большие вычислительные затраты, ограни-
чивающие применение методов в реальном масштабе времени; необходи-
мость достаточно высокой детализации априорных сведений об объекте
интереса для создания эталонного изображения; наличие значительного
числа настраиваемых параметров, влияющих на вероятностные характе-
ристики выполнения задачи обнаружения объектов. Существует возмож-
ность устранения данных ограничений путём предварительного детекти-
рования изображения до начала квазиоптимальной фильтрации.
Для поиска объектов интереса на изображении целесообразно вы-
полнить предварительный этап — обработку исходного изображения де-
текторным полем.
Детекторное поле — это некоторая перестраивающаяся вычисли-
тельная среда для обнаружения объектов, характерной особенностью ко-
торой является уменьшение размерности обрабатываемого изображения.
Детекторное поле представляет собой совокупность двухзоновых
структур, которые могут образовывать перекрытия и варьироваться в раз-
мерах. Прообразом детекторных полей можно считать рецептивные поля
сетчатки глаза.
Главным достоинством предлагаемого подхода является не снижение
размерности, а то, что воздействие детекторного поля приводит к выде-
лению контура объекта, расположенного на изображении, причём, чем
больше апертура детектора, тем меньше размеры выходного изображе-
ния, но форма объекта не искажается.
Для устранения разрыва контуров можно применить механизм, по-
добный дрейфу в зрительном анализаторе человека, который необходим
для выделения тонких границ. В алгоритмах машинной обработки дрейф
предлагается реализовать как небольшое смещение детекторного поля
в горизонтальной и/или вертикальной плоскости. При этом важным па-
раметром является величина смещения. Дрейф детекторного поля, при
котором центральные области соприкасаются, но не перекрываются, обе-
спечивает получение отсчётов, необходимых для сохранения целостности
границ объектов на изображении. За счёт дрейфа поля формируется в де-
вять раз больше отсчётов, чем в случае простейшего детекторного поля.
Выбор размера структурного элемента детекторного поля следует
производить, исходя из типа решаемой задачи и возможного конечного
размера объекта.
52
Для локализации областей, содержащих объект интереса, после
предварительной обработки входного изображения детекторным полем
следует выполнить дискретную фильтрацию. При малой апертуре филь-
тра возникает пропуск цели и появление ложных, при увеличении апер-
туры выделяются все объекты интереса, однако присутствуют ложные
объекты. При формировании апертуры фильтра по размеру прототипа
локализуются все объекты интереса и отсутствуют ложные обнаружения.
Анализ всех полученных результатов показывает, что фильтрация
изображений с использованием детекторных полей позволяет умень-
шить размерность изображения на этапе предварительной обработки
и одновременно выделить все необходимые детали контурного состава.
Представленный подход устойчив к изменению яркости изображений,
инвариантен к масштабу изображений, а также обеспечивает, за счёт
снижения размерности, обработку изображений в реальном масштабе
времени.

53
Методы ускорения нейросетевого обучения
с повторным использованием знаний
В. С. Смолин, С. М. Соколов
Федеральный исследовательский центр Институт прикладной математики
им. М. В. Келдыша Российской академии наук (ИПМ им. М. В. Келдыша РАН)

Основным прорывом последних лет в области машинного обучения


(МО) стала нейросетевая революция, причём наиболее яркие достижения
связаны с обработкой изображений. Нейросетевые подходы в МО про-
должают активно развиваться и наиболее важными проблемами обучения
нейросетей, которые предстоит решить, являются:
• сокращение длительности обучения;
• возможность доучивания на новых данных без переучивания;
• уменьшение объёма данных для обучения;
• применение имеющихся знаний при обучении новым данным.

Распределённое представление информации на структуре современ-


ных нейросетей глубокого обучения преподносится как важнейшее отли-
чие нейросетевой обработки информации от традиционных алгоритмов,
но именно отсутствие локализации данных создаёт проблемы с обучени-
ем. Для распределения по элементам структуры информации о разных
данных требуется длительное адаптивное согласование их представления.
Распределённость представления информации затрудняет контроль за её
сохранением при внесении новой информации. Неструктурированное
представление информации осложняет декомпозицию, а объём инфор-
мации для обучения сложным данным пропорционален произведению
маленьких объёмов информации для описания составляющих сложные
данные простых компонент. Структурированное локализованное пред-
ставление позволяет более эффективно использовать имеющиеся знания
при обучении новым данным по сравнению с аморфным распределён-
ным представлением.
Не следует думать, что при представлении данных есть только две
возможности — локализованное или распределённое. Правильнее гово-
рить про степень локальности или распределённости представления ин-
формации.
Если посмотреть на причины прогресса в нейросетевой обработке
информации последних лет с этой точки зрения, то можно заметить, что
они достигнуты за счёт повышения степени локализации представления
информации. Простейшие многослойные персептроны со случайно рас-
пределённой по однородной структуре информацией почти повсеместно
заменены нейросетевыми моделями со значительно более специализиро-
ванными компонентами, в каждом из которых отображается предсказуе-
мая составляющая обрабатываемых данных.
Не вызывает особых сомнений, что дальнейший прогресс нейросе-
тевых вычислений будет связан с повышением их структурированности,
что приведёт к повышению степени локализации представлений данных
54
по нейрослоям. Следующим шагом в этом направлении должно стать
расширение использования сетей с конкурентной активностью, у кото-
рых выше локальность представления данных в одном нейрослое.
Отсутствие необходимости длительного адаптивного согласования
представления данных в сетях с конкурентной активностью позволяет
повысить скорость обучения на несколько десятичных порядков. Это,
в свою очередь, даёт возможность применять более тонкую адаптацию,
лучше отображающую данные обучения, но требующую большего време-
ни и недоступную по этой причине глубоким нейросетям с распределён-
ным представлением информации.
Для экспериментально проверки этих утверждений была исследова-
на модель с конкурентным обучением, в которой возбуждение формаль-
2
ных нейронов задавалось как Ai = 2Wi X -Wi . Конкурентная активность
выражалась в том, что Oi = max(0,  Ai – C), а величина C на каждом шагу
определяется из соотношения å Qi gi = 1, где gi — максимальная Oi на
i
области определения X. Модель продемонстрировала, что при аппрокси-
мации функции Чебышева на сети с конкурентной активностью уже при
40 формальных нейронах обучение происходит более чем в 1000 раз бы-
стрее по сравнению с аналогичной сетью элементов ReLU без конкурент-
ной активности. В докладе объясняются причины этого явления и воз-
можности, которое оно открывает.
Главной причиной повсеместного использования глубоких нейросе-
тей с распределённой памятью является неразвитость теории по много-
слойному применению сетей с конкурентной активностью. В докладе
излагаются основные принципы формирования многослойной иерархи-
ческой структуры сетей с конкурентной активностью: нижние слои фор-
мируют карты простых компонент входных данных, в картах выявляются
нелинейные оси на основании которых определяются метаданные. С по-
вышением уровня иерархии выявляются и картируются всё более аб-
страктные зависимости между метаописаниями.
Важными свойствами предлагаемой иерархической структуры сетей
с конкурентной активностью являются возможность доучивания на но-
вых данных без переучивания и применения имеющихся знаний при об-
учении. Вместе с повышенной скоростью обучения на сетях с конкурент-
ной активностью это позволяет значительно сократить объём данных, не-
обходимых для обучения сетей формальных нейронов.
Другим, не менее важным, чем повышение локализации представле-
ния данных, направлением совершенствования нейросетевых вычисле-
ний является переход от параллельной к параллельно-последовательной
обработке информации. Предлагаемая иерархическая структуры сетей
с конкурентной активностью позволяет осуществлять такую обработку.
В докладе анализируются преимущества, которые могут быть достигнуты
на этом пути, в том числе и при обработке изображений.

Работа поддержана РФФИ (проект № 19-07-01113).

55
К вопросу об использовании гетерогенных вычислителей
в бортовых системах технического зрения
С. М. Соколов, А. А. Богуславский
Институт прикладной математики имени М. В. Келдыша РАН
E-mail: sokolsm@list.ru, anbg74@mail.ru

В последние годы всё большее развитие получают беспилотные под-


вижные средства. Ключевым элементом обеспечения автономности их
целенаправленных движений являются системы информационного обе-
спечения (СИО). Задача этих систем — предоставить системе управления
данные об объектах внешнего мира и положении подвижного средства
относительно этих объектов. Исследования систем информационного
обеспечения подвижных роботов ведутся несколько десятилетий, парал-
лельно с разработкой самих роботов. В настоящее время создание бес-
пилотных подвижных средств переходит из исследовательской области
в область практического использования, что расширяет и усложняет круг
задач СИО с одной стороны, а с другой — актуализирует вопросы эконо-
мической целесообразности предлагаемых решений.
Задача повышения информационной осведомлённости подвижных
средств решается по двум основным направлениям: подготовка среды
функционирования беспилотного средства и совершенствование адапта-
ционных свойств самих средств. Не умаляя значения первого направле-
ния, в данной работе мы концентрируем внимание на втором из приве-
дённых направлений.
В этом направлении также накоплен значительный опыт и определи-
лись такие тенденции как востребованность интеллектуализации борто-
вых систем, возрастание роли программного обеспечения, и возрастание
роли систем технического зрения среди средств информационного обе-
спечения.
На основе опыта решения различных прикладных задач СТЗ реаль-
ного времени (РВ) мы разработали и успешно используем программно-
аппаратную архитектуру СТЗ РВ на основе крупномасштабного про-
граммного каркаса, который соответствует и интегрируется с такими
продуктам, как ROS (Apollo Open Platform).
В части средств аппаратной поддержки СТЗ активно используют-
ся нетрадиционные вычислители. Наибольшую популярность получили
реализации подходов искусственного интеллекта на основе нейросете-
вых методов (например, NVIDIA Jetson Systems). В нашем институте на-
коплен более чем сорокалетний опыт разработок как в области создания
систем технического зрения реального времени, так и в области про-
граммно-аппаратного обеспечения нетрадиционных вычислителей. Мы
придерживаемся той концепции, что наиболее эффективный результат
в реализации интеллектуальных алгоритмов обработки зрительных дан-
ных дают системы, сочетающие параллельно последовательную обработку.
В ИПМ им. М. В. Келдыша РАН собраны макетные варианты гетеро-
генных вычислительных комплексов СТЗ, в которые входят все известные
56
нетрадиционные и традиционные вычислительные средства. Основной
акцент мы делаем на исследование инструментальных средств реализа-
ции алгоритмического обеспечения и наиболее эффективных сочетаний
программно-аппаратных средств при решении прикладных задач. В до-
кладе приводятся примеры компоновок видеокамер, вычислительных
средств и алгоритмического обеспечения для решения типовых задач
по сбору и обработки зрительных данных. Все программные реализации
осуществляются на основе упомянутого каркаса программного обеспе-
чения СТЗ РВ. Анализируются трудозатраты и стоимость решений при
различных вариантах компоновок СТЗ. Обсуждаются ближайшие пер-
спективы развития описанных подходов и экспериментов по решению
практических задач с помощью действующих макетов в бортовом испол-
нении.

Работа выполнена при поддержке РФФИ (проект № 19-07-01113-а).

57
Алгоритмы определения дальности до объекта
для стереоскопической системы технического зрения
реального времени
В. В. Стротов, С. А. Смирнов, С. Е. Корепанов, П. В. Бабаян
Рязанский государственный радиотехнический университет
E-mail: strotov.v.v@rsreu.ru

Для решения многих задач ЛА необходимо определять дальность до пре-


пятствий или объектов. Сделать это можно с использованием монокуляр-
ной или бинокулярных (стереоскопических) систем технического зрения
(СТЗ). В стереоскопической СТЗ используется информация от двух ви-
деодатчиков, разнесённых между собой на некоторое базовое расстояние.
В данной работе предложен алгоритм определения дальности до объ-
екта для решения задачи относительной навигации двух не кооперируе-
мых летательных аппаратов. Для определения относительного положения
ЛА относительного другого летательного аппарата необходимо сначала
обнаружить данный воздушный объект, а затем осуществить слежение за
ним в процессе сближения в широком диапазоне дальностей. Вопросы
обнаружения и прослеживания воздушных объектов широко освещены
в научной литературе (Алпатов и др., 2008). В бортовой системе управле-
ния ЛА задача должна решаться в режиме реального времени.
Для определения диспаратности в данной работе в качестве базового
алгоритма используется корреляционный алгоритм измерения координат
с двумерной критериальной функцией. Данный алгоритм позволяет из-
мерять положение объекта с большой точностью, но при этом имеет вы-
сокую вычислительную сложность и при больших размерах наблюдаемо-
го объекта выдача информации в режиме реального времени невозможна.
Ввиду того, что зачастую сближение осуществляется в хороших погодных
условиях, воздушный объекта будет наблюдаться на фонах с относитель-
но равномерной яркостью.
Данный факт позволяет для вычисления диспаратности использо-
вать алгоритм, основанный на корреляционном совмещении одномер-
ных функций. Данный алгоритм является гораздо более выгодным с точ-
ки зрения вычислений, но показывает неудовлетворительный результат
при условии малого отличия средней яркости объекта от средней яркости
фона.
Таким образом, необходимо автоматически выбирать алгоритм вы-
числения диспаратности. Для автоматизации выбора введён критерий
работоспособности для алгоритма, основанного на корреляционном со-
вмещении одномерных функций. Данный критерий вычисляет, насколь-
ко средняя яркость объекта отличается от средней яркости фона. После
сравнения значения критерия с выбранным порогом делается вывод о ра-
ботоспособности алгоритма.
Предложена реализация разработанного комплексного алгоритма
для СТЗ ЛА на основе ПЛИС.
58
Результаты исследования эффективности предлагаемого комплекс-
ного алгоритма позволяют сделать вывод, что определение дальности
с использованием алгоритма вычисления диспаратности, основанного
на корреляционном совмещении одномерных функций, при дальностях
не более 600 м не значительно уступает в точности по сравнению с базо-
вым алгоритмом. Использование переключения между алгоритмами вы-
числения диспаратности позволяет без существенной потери точности
в режиме реального времени определить дальность до объекта.

Работа выполнена при поддержке гранта Президента РФ МК-


2211.2019.8 (Конкурс МК-2019).

Литература
Алпатов  Б. А., Бабаян П. В., Балашов О. Е., Степашкин А. И. Методы автомати-
ческого обнаружения и сопровождения объектов: Обработка изображений
и управление. М.: Радиотехника, 2008. 176 с.

59
Исследование свёрточных нейронных сетей для классификации
объектов в составе системы видеонаблюдения
И. С. Фомин1, А. В. Бахшиев2
1
Центральный научно-исследовательский институт робототехники и технической
кибернетики, E-mail: i.fomin@rtc.ru
2
Санкт-Петербургский политехнический университет Петра Великого (СПБПУ)
E-mail: bakhshiev_av@spbstu.ru

Работа посвящена описанию исследования применения свёрточных ней-


ронных сетей для классификации объектов, обнаруженных системой
интеллектуального видеонаблюдения. Данная задача актуальна, так как
применение нейронных сетей для классификации объектов позволит су-
щественно расширить возможности системы интеллектуального видео-
наблюдения (Бахшиев, Михайлов, 2016). Определение класса объекта
с достаточной точностью позволит отсеять существенное число ошибок
первого рода, а также использовать информацию о классе объекта для
построения различных сценариев выдачи сигнала тревоги.
В качестве платформы для построения нейронных сетей для класси-
фикации объектов была выбрана система для построения нейронных се-
тей Keras (https://keras.io/), с библиотекой TensorFlow в качестве основы.
В процессе построения классификатора рассмотрены несколько вариан-
тов обучения архитектуры нейронной сети, основанной на свёрточных
слоях от VGG-16 (Simonyan, Zisserman, 2014), с весами, предварительно
обученными на базе изображений ImageNet. Рассмотрено влияние коли-
чества обучаемых слоёв на качество обучения и количество итераций, не-
обходимое сети для достижения максимального качества.
Так как рассматривается построение классификатора для примене-
ния в составе системы интеллектуального видеонаблюдения, то набор
данных для обучения нейронных сетей в рамках конкретной задачи был
получен с использованием данной системы. Она позволяет обнаружи-
вать различные подвижные объекты на видео со стационарной камеры
с помощью методов накопления фона и интеллектуального анализа раз-
ностного изображения. Изображения были обработаны для формирова-
ния единого порядка цветов и увеличены до разрешения 224×224 пиксе-
ля, которое является стандартным входным разрешением сети VGG-16.
Подготовлено два различных набора данных, каждый разделён на части
для обучения и тестирования.
По результатам тестирования обученных сетей можно сделать вывод
о том, что нейросетевые решения применимы для использования в со-
ставе системы интеллектуального видеонаблюдения. На первом наборе
данных получена точность от 95,082 до 98,361 % для различных вариан-
тов сети, ошибочно классифицированные изображения трудны и для
идентификации человеком. На втором наборе данных, где и обучающий
и тестовый наборы данных существенно больше, удалось достичь точно-
сти от 96,635 до 97,233 % для различных вариантов. Методы фильтрации
60
в составе системы позволяют ещё более повысить точность классифика-
ции и её устойчивость к выбросам.
В докладе приведены следующие результаты решения поставленной
задачи:
1) описание алгоритмов интеграции нейронных сетей для классифи-
кации объектов в систему интеллектуального видеонаблюдения;
2) описание наборов данных для обучения и тестирования нейрон-
ных сетей для классификации объектов;
3) параметры нейронной сети, использованные в экспериментах
по классификации объектов, обнаруженных системой интеллек-
туального видеонаблюдения;
4) результаты обучения описанных архитектур с использованием со-
бранных наборов данных.

Приведены результаты тестирования нейронных сетей для класси-


фикации объектов в составе системы интеллектуального видеонаблю­
дения.

Литература
Бахшиев  А. В., Михайлов В. В. Программный комплекс для разработки систем
технического зрения и принятия решений с динамически изменяемой мо-
дульной архитектурой // Робототехника и техническая кибернетика. 2016.
№ 4(13). C. 38–42.
Simonyan K., Zisserman A. Very deep convolutional networks for large-scale image recog-
nition. 2014. arXiv preprint arXiv:1409.1556.
ПРОГРАММНЫЙ
КОМИТЕТ
ЖЕЛТОВ С. Ю. председатель
акад. РАН, профессор, д-р техн. наук,
генеральный директор ГосНИИАС
НАЗИРОВ Р. Р. зам. председателя
профессор, д-р техн. наук, зав. отделом ИКИ РАН
ВИЗИЛЬТЕР Ю. В. зам. председателя
ст. науч сотр., д-р физ.-мат. наук, нач. подразделения
ГосНИИАС
ГРИШИН В. А. учёный секретарь,
доцент, канд. техн. наук, ст. науч сотр. ИКИ РАН
СОКОЛОВ С. М. профессор, д-р физ.-мат. наук, зав. сектором
ИПМ им. М. В.Келдыша
КРОПОТОВ А. Н. канд. техн. наук, зав. лаб. МГТУ имени Н. Э. Баумана
НОСКОВ В. П. канд. техн. наук, зав. сектором МГТУ им. Н. Э. Баумана
МЕЩЕРЯКОВ А. Ю. доцент, канд. техн. наук, вед. науч. сотр. ИПУ РАН
ВАСИЛЬЕВ Д. В. профессор, д-р техн. наук, вед. науч. сотр.
НПК «Системы прецизионного приборостроения»
КИМ Н. В. профессор, канд. техн. наук, профессор МАИ (ГТУ)
АЛПАТОВ Б. А. профессор, д-р техн. наук, проф. кафедры АИТУ РГРТУ
КОСТЯШКИН Л. Н. доцент, канд. техн. наук, директор – гл. конструктор
НКЦ видеокомпьютерных технологий ГРПЗ
Грязнов Н. А. канд. физ.-мат. наук, зам. директора ЦНИИ РТК
по научной работе
Бабаян П. В. канд. техн. наук, зав. кафедрой РГРТУ

ОРГКОМИТЕТ
НАЗИРОВ Р. Р. председатель
профессор, д-р техн. наук, зав. отделом ИКИ РАН
ГРИШИН В. А. зам. председателя,
доцент, канд. техн. наук, ст. науч. сотр. ИКИ РАН

КОНТАКТНАЯ
ИНФОРМАЦИЯ
ГРИШИН В. А. (495) 333-11-88
tvcs2017@technicalvision.ru
http://tvcs2017.technicalvision.ru