Вы находитесь на странице: 1из 7

Известия ТулГУ. Технические науки. 2017. Вып.

2
УДК 004.021
ПОСТРОЕНИЕ SIFT-ДЕСКРИПТОРОВ И НАХОЖДЕНИЕ ОСОБЫХ
ТОЧЕК НА ИЗОБРАЖЕНИЯХ
А.С. Сафонов
Рассматривается общая схема работы алгоритма SIFT.
Ключевые слова: изображение, особые точки, пирамида гауссианов, локаль-
ный экстремум.

В отличие от человека, машины не могут сравнить изображения и


различить на них какие-либо объекты. Для них это всего лишь набор дан-
ных. Но есть способ, который позволяет немного наделить машины спо-
собностями распознавания.
Существуют методы, в основе которых лежит сопоставление ин-
формации об изображениях. Для каждой точки изображения определяется
значение какой-то конкретной функции, а по этим значениям уже строится
характеристика изображения, которую можно сравнивать с характеристи-
ками других картин. Но есть проблема. Каждая точка изображения будет
вносить свой вклад в характеристику независимо от того, полезный этот
вклад или же наоборот вносящий неопределенности, связанные с наличием
на изображении шумов, размытия или других дефектов. Поэтому характе-
ристика строится не по всем точкам, а только по так называемым особым
точкам (ключевым).
Таким образом, изображения сравниваются по особенным точкам,
то есть по сути вместо картин сопоставляются их модели, построенные на
основе этих ключевых точек. Особыми точками будут являться лишь те
точки изображения, которые с наибольшей вероятностью будут найдены
на другом изображении, с котором сравнивается исходное.
Метод нахождения особых точек называется детектором. Проблема
заключается в том, что детектор может только определить координаты
этих точек, а ведь на сравниваемых изображениях они могут быть различ-
ными. Поэтому кроме детекторов используются дескрипторы – это такие
идентификаторы особых точек, которые выделяют одну ключевую точку
из множества всех остальных таких же точек. То есть алгоритм сравнения
изображений сводится к тому, что сначала на них выделяются особые точ-
ки и их дескрипторы, потом по этим дескрипторам находятся соответст-
вующие друг другу особые точки, а потом по этим парам ключевых точек
сравниваются изображения.
Теперь же рассмотрим то, как выделяются особые точки методом
SIFT. Ключевым аспектом в их нахождении здесь является построение пи-
рамиды гауссианов и разностей гауссианов. Гауссиан – это изображение,
которое было размыто с помощью фильтра Гаусса. Оно получается сле-
дующим образом:
182
Приборы и управление

, ,  = , ,  ∗ ,  1


В формуле (1) , ,  – это значение гауссиана в точке с коорди-
натами ,  и радиусом размытия , , ,  – гауссово ядро, ,  –
значение исходного изображения. Стоит отметить, что гауссово ядро не
перемножается на значение исходного изображения, между ними происхо-
дит операция свертки.
Разностью гауссианов называется изображение, полученное попик-
сельным вычитанием гауссиана изначального изображения из гауссиана, у
которого другой радиус размытия (обозначим его как ):
, ,  = , ,  − , ,  2
Далее строится пирамида гауссианов. Для этого все масштабируе-
мые пространства (наборы различных вариаций исходного изображения,
сглаженных каким-либо фильтром) делятся на участки, называемые окта-
вами. Есть нюанс, заключающийся в том, что часть масштабируемого про-
странства, занимаемого следующей октавой, должна быть вдвое больше
той части, которая занималась предыдущей. Да и при переходе от одной
октавы к следующей размеры изображения в два раза уменьшаются. По-
нятно, что любая октава будет охватывать бесконечное количество гаус-
сианов изображения, поэтому ограничиваются только некоторым количе-
ством  с определенным шагом по радиусу размытия. Далее достраивают-
ся еще два гауссиана, выходящие за пределы октавы (делается это для то-
го, чтобы можно было проверить изображения на наличие экстремумов, но
об этом более подробно будет описано ниже). Масштаб первого изображе-
ния следующей октавы равен масштабу изображения из предыдущей окта-
вы с номером .
Одновременно с пирамидой гауссианов будет строиться и пирамида
разностей гауссианов, количество изображений в которой будет на одно
меньше, чем в первой. На рис. 1 показано формирование этих пирамид.

Рис. 1. Получение пирамид гауссианов и разницы гауссианов


183
Известия ТулГУ. Технические науки. 2017. Вып. 2
После построения пирамид определяются особые точки. Точка счи-
тается особой, если она является локальным экстремумом разности гаус-
сианов. Чтобы было понятно, как это происходит, обратимся к рис. 2.

Рис. 2. Определение особой точки по локальному экстремуму

Если значение разности гауссианов в точке, отмеченной крестом, ли-


бо меньше, либо больше всех значений в точках, помеченных кругом, то
эта точка является точкой экстремума, то есть особой точкой. То есть каж-
дая точка текущего изображения разницы гауссианов сравнивается со
своими восемью соседними точками и с девятью соседними точками, на-
ходящимися на уровень старше и младше в пирамиде. Именно поэтому
нужны были два дополнительных гауссиана, чтобы можно было провести
поиск локальных экстремумов для первого и последнего изображения.
Но на этом поиск особых точек не заканчивается. Далее проводится
их проверка, так как не все эти точки пригодны для дальнейшей работы в
алгоритме. Для этого нужно определить координаты особой точки с по-
вышенной точностью. Для этого используется аппроксимированние функ-
ции разностей гауссианов многочленом Тейлора второго порядка:
 1  
 =  + +   3
 2  
В формуле (3)  = , ,  – вектор смещения точки разложения.
Экстремум многочлена Тейлора вычисляется с помощью приравнивания
производной к нулю. В результате получится смещение точки найденного
экстремума относительно истинного:

   
 = −  4
 
Все производные будут вычислены по формулам конечных разно-
стей. Получится система линейных алгебраических уравнений размерно-
стью 3х3, относительно компонент вектора . Если хотя бы одна из ком-
184
Приборы и управление

понент вектора  получится больше половины шага сетки в направлении


этого вектора, то это говорит о том, что точка экстремума была получена
неверно. Тогда нужно передвинуться к соседней точке в направлении
указанных компонент. Если для соседней точки повторяется эта ситуация,
то надо сдвинуться к следующей точке. Если же таким образом выйти за
пределы октавы, то следует исключить такую точку из списка особых.
Когда положение точки экстремума определено, то проводится
проверка на малость величины разницы гауссианов в этой точке по форму-
ле (5):
1  

 =  + 5
2 
Если эта проверка точкой не будет пройдена, то она тоже исключа-
ется из списка особых.
После предыдущих двух проверок производится последняя. Если
предполагаемая особая точка лежит на контуре объекта, или же эта точка
плохо освещена, то ее тоже следует исключить. Делается это из-за того,
что такая точка имеет большой изгиб вдоль границы и малый в перпенди-
кулярном направлении. Большой изгиб является одной из компонент вто-
рой производной разницы гауссианов и определяется так называемой мат-
рицей Гессе:
"" "#
=! $ 6
"# ##
Если обозначить через &'  след матрицы, а через ()  ее оп-
ределитель, то можно записать следующие соотношения:
&'  = "" + ## = * + + 7
()  = "" ## − "# = *+

8
Если через ' обозначить отношение большего изгиба к меньшему,
то:
* = '+ 9
&'  
* + + 
'+ + + 
' + 1 
= = = 10
()  *+ '+  '
Точка будет рассматриваться как особая, если будет выполняться
следующее условие:
&'  ' + 1
< 11
()  '
Когда же отсеются ложные особые точки и останутся только истин-
ные, то начинается вычисление их ориентаций. Направление одной ключе-
вой точки определяется из направлений градиентов ее соседних точек. Вы
вычисления градиентов происходят на изображении в пирамиде гауссиа-
нов. Величина градиента 1 и направление градиента 2 в точке с координа-
тами ,  определяются так:
185
Известия ТулГУ. Технические науки. 2017. Вып. 2

1,  = 3 + 1,  −  − 1,  + ,  + 1 − ,  − 1 12


,  + 1 − ,  − 1
2,  = tan 7 8 13
 + 1,  −  − 1, 
Первым делом определяется окрестность особой точки, в которой
будут рассмотрены градиенты. На практике это будет круглая область ра-
диуса размытия , необходимая для свертки с гауссовым ядром. В этом
случае радиус  должен быть равен полуторному масштабу особой точки.
Для гауссова ядра действует правило «трех сигм», которое заключается в
том, что значение гауссова ядра стремится к нулю на расстоянии, превы-
шающем 3. Поэтому радиус окрестности особой точки будет равен 3.
Направление особой точки можно определить из гистограммы на-
правлений 2. Гистограмма состоит из 36 компонент, которые покрывают
по 10 градусов от общего промежутка. Формируются эти компоненты так:
каждая точка окрестности ,  вносит вклад, равный 1 ∗ , , , в ту
компоненту гистограммы, которая входит в промежуток, содержащий на-
правление градиента 2, .
Направление особой точки лежит в промежутке, который покрыва-
ется максимальной компонентой гистограммы. Значение максимальной
компоненты и двух соседних с ней интерполируются параболой. Направ-
ление особой точки определяется вершиной этой параболы. Если в гисто-
грамме дополнительно есть такие компоненты, которые имеют величины
не менее 80% от максимума, то они тоже интерполируются. Тогда особой
точке приписываются дополнительные направления.
Теперь что касается дескрипторов. Под дескриптором можно пони-
мать любой объект, который может дать информацию об окрестности осо-
бой точки, так как на малые области меньше влияют различные искажения
и изменения, а иногда не влияют вовсе.
В методе SIFT дескриптором является вектор. Как и направление
особой точки, дескриптор определяется на гауссиане, максимально при-
ближенном по масштабу к особой точке, и исходя из градиентов в некото-
рой области особой точки. Для начала эта область поворачивается на опре-
деленный угол направления особой точки, чем добивается инвариантность
относительно операции поворота.
Для дальнейшего объяснения, обратимся к рис. 3.
На левой части рис. 3 квадратами обозначены пиксели, которые бе-
рутся из квадратной области дескриптора, которая сама поделена еще на
четыре части. Стрелкой в центре каждого пикселя обозначено направление
градиента. Кругом же обозначено окно свертки с гауссовым ядром. На
правой части рис. 3 схематично изображен дескриптор особой точки, раз-
мерности 2х2х8. Первые две цифры говорят о размерности, третья – о ко-
личестве компонент гистограммы этих четырех частей.
186
Приборы и управление

Рис. 3 . Схематичное представление фрагмента изображения (слева)


и полученного на его основе дескриптора (справа)

Каждому градиенту в окне дескриптора можно присвоить три коор-


динаты , , 9, где  - расстояние до градиента по горизонтали,  – рас-
стояние до градиента по вертикали, 9 - расстояние до направления гради-
ента в гистограмме. За точку отсчета берется левый нижний угол окна де-
скриптора и начальное значение гистограммы. За единичные отрезки при-
нимаются размеры частей по горизонтали и вертикали для  и  соответст-
венно, количество градусов в компоненте гистограммы для 9.
Дескриптор особой точки состоит их всех полученных гистограмм.
На практике используются дескрипторы размерности 4х4х8. Они нормали-
зуются, после чего все компоненты, у которых значение больше 0,2, ок-
ругляются до 0,2.
В заключении надо сказать, что SIFT дескрипторы имеют ряд не-
достатков. Не все полученные таким образом точки и их дескрипторы бу-
дут отвечать необходимым требованиям. Но это не опровергает того факта,
что эти дескрипторы хорошо справляются со своей работой во многих
практических задачах.

Список литературы

1. David G. Lowe Distinctive Image Features from Scale-Invariant Key-


points. International Journal of Computer Vision, 2004. P. 91 - 110.
Сафонов Александр Сергеевич, студент, TuaTalf@yandex.ru, Россия, Тула,
Тульский государственный университет

BULDING SIFT DESCRIPTORS AND FIND THE SINGULAR POINTS ON THE IMAGE

A.S. Safonov
187
Известия ТулГУ. Технические науки. 2017. Вып. 2
This article discusses the concepts of SIFT algorithm works scheme.
Key words: image, singular points, Gaussians pyramid, local extremum

Safonov Alexander Sergeevich, student, TuaTalf@yandex.ru, Russia, Tula, Tula


State University

УДК 004.9; 528.87

АВТОМАТИЗИРОВАННЫЙ СИНТЕЗ КАРТЫ ЭКОЛОГИЧЕСКИХ


РИСКОВ В ГИС

А.И. Таганов, А.Н. Колесенков, В.Г. Псоянц, Н.В. Акинина

Предлагается новый подход к повышению оперативности формирования и на-


глядности отображения картины экологических рисков в ГИС защиты окружающей
среды. В основе подхода лежит структурно-символьный метод (ССМ) представления
базовых графических моделей (БГМ) экологических рисков, лингвистические правила и
грамматика построения БГМ на основе заданного набора контуров, граф связности
БГМ и теоретико-множественные операции синтеза карты экологических рисков
средствами ГИС. В число основных методов структурного построения электронной
базы БГМ в статье рассмотрены: прямой ССМ представления графических моделей
экологических рисков; лингвистический метод представления алфавита и моделей эко-
логических рисков; программный и программно-лингвистический методы представле-
ния алфавита БГМ экологических рисков.
Ключевые слова: экологический мониторинг, геоинформационная система,
ГИС, графический элемент, библиотека, риск, структурно-символьный метод, лин-
гвистический метод, программный метод, программно-лингвистический метод.

Современные геоинформационные системы (ГИС) защиты окру-


жающей среды представляют собой важную группу ГИС, которые обеспе-
чивают сбор, хранение, обработку и анализ пространственных, временных
и тематических данных для представления состояния окружающей среды в
условиях ее загрязнения [1]. Для повышения оперативности формирования
и наглядности отображения картины экологических рисков на компьютер-
ном экране предлагается при проектировании программного обеспечения
ГИС использовать ССМ моделирования и отображения экологических рис-
ков [2,3]. Предлагаемый подход заключается в автоматизированном синтезе
картины экологических рисков региона на основе использования электрон-
ной базы ключевых графических моделей (БГМ) и теоретико-
множественных операций преобразования этих БГМ средствами машин-
ной графики ГИС. В связи с этим в статье рассматриваются различные ме-
тоды построения электронной базы БГМ с использованием ССМ модели-
рования [4, 5].
188

Вам также может понравиться