ПОЯСНИТЕЛЬНАЯ ЗАПИСКА
ВЫПУСКНОЙ КВАЛИФИКАЦИОННОЙ РАБОТЫ
Квалификация бакалавр _
(бакалавр, инженер, магистр)
К защите допустить
“___”__________________ 2017 г.
Санкт-Петербург, 2017 г.
Студент_Кравченко И.С. Группа V3416____Кафедра__КФиВИ_____Факультет__ФФиОИ__
(ФИО)
Консультант(ы):
а) ________________________________________________________________ _______________
(Фамилия, И., О., ученое звание, степень) (Подпись)
б) ________________________________________________________________ _______________
(Фамилия, И., О., ученое звание, степень) (Подпись)
УТВЕРЖДАЮ
Зав. кафедрой___________________
_______________________________
(ФИО) (подпись)
«____» «_______________» 20___ г.
ЗАДАНИЕ
НА ВЫПУСКНУЮ КВАЛИФИКАЦИОННУЮ РАБОТУ
Студенту_______________Группа________Кафедра_________Факультет_______________
Кравченко И.С. V3416 КФиВИ ФФиОИ
__Руководитель_________________________________________________________________
Петерсон Максим Владимирович, к.т.н., Университет ИТМО, ассистент
____
(ФИО, ученое звание, степень, место работы, должность)
1 Наименование Исследование методов автоматического детектирования линии симметрии
темы:_____________________________________________________________
лица на цифровом изображении для систем фотоплетизмографии
________________________________________________________________________________
__
________________________________________________________________________________
__ Прикладная информатика
Направление подготовки (специальность)
___________________________________________
Прикладная информатика в информационной сфере
Направленность (профиль)
_________________________________________________________
бакалавр
Квалификация
____________________________________________________________________
(бакалавр, магистр, специалист, инженер)
4
________________________________________________________________________________
__
АН Н О ТАЦ И Я
ВЫПУСКНОЙ КВАЛИФИКАЦИОННОЙ РАБОТЫ
6
Полученные в рамаках данной работы результаты позволяют сделать выводы о сферах
применимости обоих исследованных методов. _
9 Полученные гранты, при выполнении работы _______________________________________
( Название гранта)
________________________________________________________________________________
б) Кравченко И.С. Исследование методов детектирования линии симметрии лица для систем
фотоплетизмографии. В кн.: VI Всероссийский конгресс молодых ученых, Санкт-Петербург,
2017: материалы. Санкт-Петербург: Университет ИТМО, 2017. _
(Библиографическое описание выступлений на конференциях)
Выпускник__________________________ _________________
(ФИО) (подпись)
Руководитель________________________ _________________
(ФИО) (подпись)
“__________”________________20___г.
7
Министерство образования и науки Российской Федерации
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
ОТЗЫВ РУКОВОДИТЕЛЯ
О ВЫПУСКНОЙ КВАЛИФИКАЦИОННОЙ РАБОТЕ
+
конструкторских и технологических решений
2 Степень полноты обзора, обобщения, анализа, систематизации +
3 Степень самостоятельного и творческого участия студента в работе +
4 Корректность формулирования цели и задачи исследования и разработки +
5 Уровень и корректность использования в работе современных методов
+
ая
+
технологий
8 Наличие публикаций, участие в н.-т. конференциях, награды за участие в
+
конкурсах
9 Ясность, четкость, последовательность и обоснованность изложения
Оформительска
+
пояснительной записки
10 Качество оформления пояснительной записки (общий уровень
грамотности, стиль изложения, качество иллюстраций, соответствие +
я
требованиям стандарта)
11 Объем и качество выполнения графического материала, его соответствие
+
тексту записки и стандартам
ИТОГОВАЯ ОЦЕНКА отлично
* - не оценивается (трудно оценить)
8
Отмеченные достоинства: Оригинальность и новизна полученных результатов и
технологических решений, продемонстрирована способность формулирования цели и задач
исследования, высокая степень самостоятельного участия студента в работе, использование
современных пакетов компьютерных программ и технологий, апробация результатов работы
на «VI Всероссийском конгрессе молодых ученых», Санкт-Петербург, 2017 г.
Отмеченные недостатки:
Степень полноты обзора существующих результатов в исследуемой области.
Относительно небольшой размер экспертной группы, которая участвовала в исследовании.
9
Содержание
Содержание ........................................................................................... 4
Введение ................................................................................................. 5
Заключение .......................................................................................... 35
Список литературы............................................................................. 37
10
Введение
Мигрень – распространенное неврологическое заболевание, точные
механизмы которого до сих пор остаются по существу не изученными. Уже в
ранних исследованиях причиной этого недуга называли нарушения работы
сердечно-сосудистой системы. Одним из стандартных признаков мигрени
является односторонний характер головных болей. На сегодняшний день при
лечении этого заболевания асимметричным изменениям лицевого кровотока
уделяется слишком мало внимания. В классических исследованиях на тему
мигрени [1] отмечают тенденцию расширения височной артерии с той стороны
головы, на которой пациент ощущает пульсирующую боль. Тем не менее,
асинхронность лицевых пульсаций крови остается не изученной в
подробностях [2].
Для исследования изменения лицевого кровотока при мигрени может
применяться методика ФПГ (фотоплетизмографии) благодаря своей простоте и
потенциально низкой цене реализации.
В процессе проведения ФПГ-исследования появляется необходимость в
разметке оси лицевой симметрии на анализируемых снимках пациентов. В
настоящее время этой разметкой занимаются вручную [3], что имеет ряд
недостатков:
- увеличивается количество времени, затрачиваемого на обработку
снимков;
- возникает вероятность возникновения ошибок из-за человеческого
фактора, так как человек плохо воспринимает изменения в локальных лицевых
признаках при разных ориентациях лица, о чем, например, свидетельствует
существование так называемого эффекта Тэтчер [4].
Следовательно, появляется необходимость в разработке надежного
метода автоматического детектирования линии лицевой симметрии, что
11
является целью данной работы. В связи с этим, основные задачи работы
заключаются в:
- исследовании существующих подходов к детектированию линии
симметрии на изображении в общем случае;
- разработке метода автоматического детектирования линии лицевой
симметрии на цифровом изображении;
- разработке критерия оптимальности результата детектирования линии
лицевой симметрии;
- тестировании реализации исследованных методов.
Проблема детектирования симметрии в общем случае уже изучалась на
протяжении долгого времени, и существуют методы, предназначенные для
решения подобных задач. Однако ряд отличительных характеристик входных
данных в области ФПГ накладывают определенные ограничения на их
использование. На обрабатываемых снимках глаза пациентов закрыты темными
очками, при этом пациент может лежать на боку. Кроме того, масштаб и
положение лиц на снимках не фиксированы.
Данная работа посвящена разработке и исследованию двух методов
решения поставленной задачи. Один из методов был предложен ранее и
является более универсальным. А второй был разработан в рамках данной
работы с учетом особенностей обрабатываемых изображений. Подробное
описание обоих методов можно найти во второй главе. Также были собраны
экспертные оценки и разработана методика тестирования работы
реализованных методов. С процессом тестирования и полученными
результатами можно ознакомиться в третьей главе.
Апробация результатов исследования данной работы осуществлялась на
уровне академического сообщества в рамках всероссийского мероприятия “VI
Конгресс молодых ученых” в г. Санкт-Петербурге в 2017 г. Тезис доклада был
опубликован в сборнике “Сборник тезисов докладов конгресса молодых
ученых. Электронное издание. – СПб: Университет ИТМО, 2017” в рубрике
12
“Оптико-электронное приборостроение” раздела “ Фотоника, наноматериалы и
оптотехника”.
13
Глава 1. Обзор предметной области
В данной главе приводятся необходимые определения, постановка
задачи, проводится обзор существующих алгоритмов ее решения.
1.1.1 Фотоплетизмография
14
Рис. 1.1 – Примеры входных изображений лиц пациентов в трех возможных
ориентациях.
При проведении исследования пациента просят занять комфортное для
него сидячее положение и поместить голову на специально настроенную опору,
надев защитные темные очки. Лицо человека, освещенное зеленым светом
заданной длины волны, записывается на камеру с одноканальным
фотоприемником. После синхронизации с записанными показаниями ЭКГ
видео обрабатывается при помощи специального программного обеспечения.
Алгоритм оценивает степень корреляции между кардиоциклами ФПГ и ЭКГ в
разных частях лица [5]. В результате анализа изображения выделяются области,
характеризующие синхронность и симметричность лицевого кровотока
пациента. Пример при ручном построении линии оси симметрии показан на
рис. 1.2.
15
Рис. 1.2 – Пример анализируемого изображения в системе ФПГ.
16
участки, называемые ячейками, для пикселей каждой ячейки генерируется
гистограмма направлений градиента. Дескриптор представляет из себя
совокупность таких гистограмм. После измерения перепада яркости в пределах
большего участка картинки, называемого блоком, локальные гистограммы
нормализуются по уровню. После этой нормализации результат детектирования
значительно меньше зависит от изменений затенения и освещенности
обрабатываемого изображения [7].
HOG-дескриптор имеет ряд ключевых преимуществ. Поскольку HOG
работает на локальных промежутках, метод инвариантен к небольшим
геометрическим и фотометрическим искажениям, так как такие искажения
значительно больше проявляют себя на крупных участках изображения. Однако
метод не инвариантен к изменению ориентации распознаваемого объекта.
Метод подходит для детектирования людей, так как сильная фотометрическая
нормализация позволяет пренебрегать движениями пешеходов, если они
поддерживают вертикальную ориентацию тела [8].
17
b c
d
19
каждый из них отображался зеркально. Далее, отображенный и
неотображенный признаки сопоставлялись, в результате давая набор
потенциально симметричных пар признаков. Была введена функция магнитуды
симметрии, отражающая степень двусторонней симметричности пары
локальных признаков. Наконец, информация о линии симметрии изображения
собиралась при помощи преобразования Хафа и находилась ось симметрии.
Этот метод будет подробнее описан во второй главе, так как он был применен к
решению поставленной задачи и протестирован.
Поскольку в данном случае мы имеем дело с изображениями с заранее
известным содержанием, появляется возможность сконцентрироваться на
выделении конкретных локальных признаков, определяющих положение оси
симметрии. В подавляющем большинстве случаев искомая линия соединяет
вершину переносицы с центром губ. Разумеется, из-за личных особенностей
пациента нет гарантии, что эти области будут выглядеть симметричными.
Самым явным и постоянным признаком на этих картинках, скорее всего, можно
считать область переносицы и черных очков, обладающую характерной
параболической формой на карте интенсивности градиента. Стоит отметить,
что большая часть людей из экспертной группы, выполнявших ручную
разметку этих изображений, утверждали, что руководствовались положением
именно этой зоны. На этих наблюдениях основан второй примененный в
данной работе метод, разработанный с опорой на характерные особенности
обрабатываемых изображений. Метод подробнее описан во второй главе.
Широко применяемые методы, основанные на оценке корреляции, не
могут быть использованы в решаемой задаче, так как из-за аффинных и
проекционных искажений корреляционный узор оказывается в значительной
степени подавленным. Задачу также усложняют перепады освещения
помещения, в котором производится съемка, и варьирование настроек
сенсоров. Кроме того, при сопоставлении возникает проблема в том, что
одинаково ориентированные изображения, снятые с разных ракурсов, могут
20
иметь локальные взаимные искажения. В таких случаях представляется
возможным только сравнение примерных взаимных расположений
соответствующих областей объектов, что больше присуще структурному
сопоставлению.
21
Глава 2. Описание исследуемых методов
В этой главе будут описаны исследованные методы. В начале главы будет
описана реализация уже существующего метода на основе SIFT-признаков, а
вторая часть будет посвящена методу, впервые разработанному для решения
представленной в первой главе задачи.
22
Рис. 2.1 – Пример выделения признаков на простом изображении, слева – исходное
изображение, справа – изображение с размеченными признаками.
23
области объекта, изображенного на картинке. На рис. 2.3 можно увидеть
результат такого сопоставления признаков на примере простого изображения.
Стоит заметить, что каждому исходному признаку в данном случае
действительно соответствует его зеркально отображенная версия.
Рис. 2.4 – Схема алгоритма выделения пар симметричных признаков (pi, pj).
24
Симметричность каждой пары задана как функция ее относительного
положения, ориентации и масштаба ее признаков pi и pj. А взвешивающий
коэффициент угловой симметрии определен как функция, описанная формулой:
d 2
Dij exp 2 , Dij 0, 1 (3)
2σ d
25
где d – расстояние между признаками рассматриваемой пары. Данный
коэффициент введен, так как, согласно психофизическим наблюдениям,
ключевые точки, расположенные близко к линии симметрии рассматриваемого
объекта, вносят больший вклад в человеческое восприятие симметрии, нежели
периферийные.
Итоговая формула магнитуды симметрии включает в себя все
вышеперечисленные коэффициенты:
26
Рис. 2.6 – Пример выделения признаков на изображении лица.
27
Рис 2.8 – Пример проведения линии симметрии на изображении лица.
Стоит обратить внимание на то, что, как видно на рис. 2.7, в отличие от
примера с простым изображением, при сопоставлении признаков на более
сложном примере алгоритмом были допущены ошибки, которые, однако, не
сильно сказались на результате, показанном на рис. 2.8. Это произошло из-за
того, что при выделении признаков на зеркальном изображении положение
некоторых точек сильно отличалось от исходного.
28
априорной информации, был создан алгоритм детектирования оси лицевой
симметрии, основанный на том, что на корректном входном изображении
всегда можно обнаружить две однотипные области, опираясь на расположение
которых, можно построить искомую линию. Одной из этих областей является
область губ (рис. 2.10, 2.11), а второй – область соприкосновения очков с
переносицей, напоминающая по форме параболу (рис. 2.12, 2.13). О пользе
применения данных областей свидетельствует еще и тот факт, что люди,
которых попросили провести искомую линию “на глаз”, зачастую строили ось
симметрии, проходящую именно через две вышеуказанные точки. На рис. 2.9
показан пример проведения линии симметрии путем соединения центров этих
двух ключевых зон.
Рис 2.9 – Примеры проведения линии симметрии путем соединения центров областей
переносицы и губ.
29
Для детектирования этих двух областей были обучены два детектора,
основанные на методе HOG, описанном в первой главе. Результаты обучения и
тестирования можно увидеть на рис. 2.10-2.13.
Стоит обратить внимание на то, что, как видно из рис. 2.12, обучающие
изображения для детектора области губ включают в себя нижнюю часть носа.
Это сделано ввиду того, что сама по себе область губ не обладает достаточно
характерной формой. В процессе разработки метода детектор изначально был
30
обучен без учета этого факта и зачастую детектировал брови и другие объекты
продолговатой формы.
Рис 2.12 – Результат обучения детектора области губ, слева – примеры обучающих
изображений, справа – направления матрицы градиентов обученного детектора.
31
ложного детектирования. Для решения этой проблемы был обучен
дополнительный HOG-детектор, направленный на детектирование темных
очков на лице пациента. Результат обучения показан на рис. 2.14.
Рис 2.14 – Результат обучения детектора темных очков, слева – пример обучающего
изображения, справа – направления матрицы градиентов обученного детектора.
32
Рис 2.15 – Пример детектирования лица целиком при помощи детектора Dlib.
34
Глава 3. Методика тестирования и результаты
В этой главе будет описана методика, использованная при тестировании
исследуемых методов, и полученные результаты.
35
Рис 3.1 – Интерфейс программы для разметки экспертных оценок.
36
a pa
pb b
l1
l2
Рис 3.2 – Схема вычисления отклонения от экспертной оценки,
где a, b – расстояние от выделенных ключевых точек pa и pb (переносица, губы) до линии
экспертной оценки, l1 – результат работы алгоритма, l2 – экспертная оценка.
37
При выполнении данной работы использовалось 90 входных
изображений, анализируемых в системах ФПГ. 30 из них составляли
обучающую выборку, а остальные 60 использовались для тестирования. Были
собраны экспертные оценки 15-ти экспертов. Оба исследуемых алгоритма были
запущены на всех изображениях тестовой выборки. Результаты тестирования
приведены ниже.
Первым был протестирован метод на основе SIFT-признаков. При запуске
на некоторых картинках алгоритм давал очень далекие от ожидаемого
результаты. После подробного разбора стало понятно, что причиной этому
являлось то, что функции, выделяющей SIFT-признаки из обрабатываемого
изображения, не удавалось детектировать достаточное количество ключевых
точек. Из-за этого алгоритму недоставало данных для нахождения хотя бы
приблизительно корректной линии симметрии. Картинки, на которых не
сработал алгоритм на основе SIFT-признаков, составляли 30% от всех картинок
тестовой выборки. Примеры таких изображений приведены на рис. 3.3.
38
На остальных 70% изображений метод работал со средним отклонением в 7
пикселей и СКО, равным 12-ти пикселям. В среднем, на черно-белых
изображениях размером 752 на 480 пикселей алгоритм работал 0,09 с. На рис.
3.4 можно увидеть примеры успешной работы алгоритма.
39
Рис 3.5 – Сравнение результатов работы двух методов с экспертной оценкой. Зеленый –
экспертная оценка, красный – HOG-метод, синий – SIFT-метод.
SIFT HOG
СКО, пикселы 12 5
40
Оба алгоритма были запущены на компьютере со следующими
характеристиками:
41
Заключение
Как показали результаты данной работы, задача автоматического
детектирования линии лицевой симметрии на цифровом изображении может
быть эффективно решена при помощи методов, основывающихся на разных
видах детекторов. Было исследовано два алгоритма для нахождения искомой
оси симметрии при разметке анализируемых в системах ФПГ снимков. В
процессе исследования была предложена методика определения качества
работы алгоритмов на основе экспертных оценок.
Первый из методов, метод на основе инвариантных к масштабированию и
повороту признаков SIFT, в среднем показал менее точные результаты, нежели
второй, основанный на HOG-признаках. В некоторых случаях им было
распознано недостаточное количество ключевых точек для проведения линии
лицевой симметрии, в достаточной степени приближенной к экспертной
оценке. Тем не менее, алгоритм на основе SIFT-признаков в среднем работал
примерно в десять раз быстрее, чем HOG-метод, что указывает на то, что, если
при помощи дополнительных модификаций удастся избавиться от случаев
извлечения недостаточного количества признаков из обрабатываемого
изображения, этот метод сможет составить конкуренцию второму
исследованному алгоритму.
Метод на основе гистограмм направленных градиентов, в среднем,
показал более стабильный результат. При тестировании он не только не
демонстрировал полных провалов, но и проводил линию симметрии,
положение которой было более приближено к линии экспертной оценки. Но
применяемые в рамках реализации этого алгоритма детекторы являются
чувствительными к повороту и масштабированию детектируемых зон.
Добавление инвариантности к таким преобразованием увеличивает время его
работы. Во-первых, из-за чувствительности к повороту перед нахождением
непосредственно интересующих ключевых точек приходится определять
42
ориентацию лица на поданном на вход изображении. Во-вторых, из-за
чувствительности к масштабированию при каждой попытке детектирования
только одного прохода скользящим окном недостаточно, поскольку масштаб
искомой области на обрабатываемых снимках не фиксирован.
Стоит предположить, что причиной полученных результатов мог служить
тот факт, что метод на основе HOG-признаков разрабатывался на основе
априорной информации о входных данных, описывающей специфические
особенности подаваемых на вход алгоритма изображений. Но это также делает
его менее универсальным, применимым только в контексте разметки ФПГ-
снимков.
43
Список литературы
1. Wolff H. G. Headache and other head pain. // New York: Oxford University
Press – 1963. – N 8.
2. Asynchronicity of Facial Blood Perfusion in Migraine / N. Zaproudina, V.
Teplov, M. Na ̈ rhi, P. A. Karjalainen, E. Nippolainen, R. Giniatullin, J. A.
Lipponen, A. A. Kamshilin. // PLOS ONE – 2003. – December Vol. 8 – Issue
12, e80189.
3. N. A. Kamshilin, M. A. Volynsky, I. S. Sidorov, O. V. Mamontov. Time delay
in facial blood pulsations. // ESGCO, Programme and abstracts, Lancaster, UK
– 2016. – April.
4. P. Thompson Margaret Thatcher: A New Illusion // Perception – 1980. –Vol. 9.
– Issue 4. – pp. 483 – 484.
5. Плетизмография // Энциклопедический словарь Брокгауза и Ефрона : в 86
т. (82 т. и 4 доп.). – СПб., 1890 – 1907.
6. Пат. 4050242 США. Multiple bypass – duct turbofan and method of operating
same / D.J. Dusa. Опубл. 27.09.77.
7. William T. Freeman, Michal Roth, "Orientation Histograms for Hand Gesture
Recognition", Tech. Rep. TR94-03, Mitsubishi Electric Research Laboratories,
Cambridge, MA, December 1994.
8. N. Dalal B. Triggs Histograms of oriented gradients for human detection //
Proc. IEEE Conf. Comput. Vis. Pattern Recognit – 2016. – Jun . – C. 1-8.
9. Пат. 6711293 США. Method and apparatus for identifying scale invariant
features in an image and use of same for locating an object in an image / D.
Lowe. Опубл. 23.03.2004.
10. Lowe, David G.Object recognition from local scale-invariant features //
Proceedings of the International Conference on Computer Vision. – 1999. –
Vol. 2. – C. 1150–1157.
11. Lowe, David G. Distinctive Image Features from Scale-Invariant Keypoints //
International Journal of Computer Vision. – 2004. – N 60 (2): 91–110.
44
12. Sun C. Symmetry detection using gradient information // Pattern Recognition
Letters. – 1995. – Т. 16. – №. 9. – С. 987-996.
13. Sun C., Si D. Fast reflectional symmetry detection using orientation histograms
//Real-Time Imaging. – 1999. – Т. 5. – №. 1. – С. 63–74.
14. Chen X., Flynn P. J., Bowyer K. W. Fully automated facial symmetry axis
detection in frontal color images // Automatic Identification Advanced
Technologies, 2005. Fourth IEEE Workshop on. – IEEE, 2005. – С. 106-111.
15. Loy G., Eklundh J. O. Detecting symmetry and symmetric constellations of
features // Computer Vision–ECCV 2006. – Springer Berlin Heidelberg, 2006.
– С. 508-521.
45