Академический Документы
Профессиональный Документы
Культура Документы
Антон Конушин
Спонсорская поддержка
Этот курс
подготовлен и
читается при
поддержке
Из чего состоит изображение?
Пример выделенного
(сегментированного)
человека на
изображении
лица
пешеходы
Schneiderman & Kanade ‘00
Мы рассматривали
методы выделения
объектов на основе
скользящего окна Viola & Jones ‘04
Schneiderman & Kanade ‘00
модель
Classify
Эталонная разметка
Сравним подходы
Classify
Ограничивающий
прямоугольник
Slide by Alexey Efros
Насколько важна поддержка?
Признаки
*
Классификатор
Boosted Decision Tree*
D. Hoiem, A.A. Efros, and M. Hebert Geometric Context from a Single Image ICCV 2005.
Насколько важна поддержка?
0.655
0.765
• С чего начинать?
?
• Предлагается начинать с низкоуровневой
сегментации (тесселяции), т.е. без использования
распознавания
• Мы будем рассматривать как раз те алгоритмы
сегментации, которые используются как
предобработка перед дальнейшим анализом
Source by Alexey Efros
Суперпиксели
• «Суперпиксели»
• Суперпиксельная сегментация или пересегментация
• Фрагменты изображения, которые:
• Равномерно распределенные по изображению
• Компактные, примерно одного размера
• Границы сегментов должны соответствовать границам
объектов
• Достаточно большие, чтобы они были информативные
• Небольшие объекты не должны быть частью сегмента, а
описываться своим сегментом
Методы к рассмотрению
• Края и области
• Pb-детектор краёв
• Эвристические методы
• Разрастание регионов (Region growing)
• Разделения и слияния регионов (Split & Merge)
• Водораздел (Watershed)
• Эффективный метод на графах
• Кластеризация
• K-средних
• Сдвиг среднего (Mean shift) и развитие
• Энергетические методы
• Snakes
• Методы уровня
• ТурбоПиксели (TurboPixels)
Сегментация и границы
изображение ручная разметка сила градиента
• «Биологически возможная»
модель
• Банк фильтров + отсечение по
порогу + усреднение по региону
• Разные области отличаются по
откликам разных фильтров из
банка
J. Malik, S. Belongie, T. Leung, and J. Shi, “Contour and Texture Analysis for Image
Segmentation,” IJCV 2001
Пример карты текстонов
D. Martin, C. Fowlkes, and J. Malik. Learning to detect natural image boundaries using
local brightness, color, and texture cues. PAMI 2004.
Схема Pb-детектора
• Берём круг с центром в исследуемом
пикселе
• Выбираем ориентацию края
• Считаем градиент между признаками в
левой и правой половине круга
• Обучаем классификатор края
D. Martin, C. Fowlkes, and J. Malik. Learning to detect natural image boundaries using
local brightness, color, and texture cues. PAMI 2004.
Результат Pb-детектора
Photo Canny Pb-detector Human
• Region growing
• Простая идея – начиная с некоторого “семени”
обходить пиксели и объединять в области пока
выполняется условие однородности
• Варианты:
• Задаём несколько семян на изображении
• Последовательное сканирование изображения
Критерий однородности области
• Гистограмма содержит не больше 1 значительного
пика
Среднее: 1 1 1 1 1 1 1 1 2
Среднее: 1.125 1 1 1 1 1 1 1 0
3 1 4 9 9 8 1 0
1 1 8 8 8 4 1 0
1 1 6 6 6 3 1 0
1 1 5 6 6 3 1 0
1 1 5 6 6 2 1 0
1 1 1 1 1 1 0 0
1
p S I ( p )
N
I ( q) Пример δ = 1
q S
Алгоритм разрастания регионов
1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 0
1
p S I ( p ) I ( q) 3 1 4 9 9 8 1 0
N q S
1 1 8 8 8 4 1 0
1 1 6 6 6 3 1 0
1 1 5 6 6 3 1 0
1 1 5 6 6 2 1 0
1 1 1 1 1 1 0 0
1
p S I ( p )
N
I ( q) Пример δ = 1
q S
Последовательное сканирование
1. |Clavg(B) - Clavg(C)| ≤ δ –
сливаем области B и C.
S
S21 S22
S1
S23 S24 S1 S2 S3 S4
1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 0
3 1 4 9 9 8 1 0
1 1 8 8 8 4 1 0
1 1 6 6 6 3 1 0
1 1 5 6 6 3 1 0
1 1 5 6 6 2 1 0
1 1 1 1 1 1 0 0
Пример
Алгоритм разбиения (split)
1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 0
3 1 4 9 9 8 1 0
1 1 8 8 8 4 1 0
1 1 6 6 6 3 1 0
1 1 5 6 6 3 1 0
1 1 5 6 6 2 1 0
1 1 1 1 1 1 0 0
Первое разбиение
Алгоритм разбиения (split)
1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 0
3 1 4 9 9 8 1 0
1 1 8 8 8 4 1 0
1 1 6 6 6 3 1 0
1 1 5 6 6 3 1 0
1 1 5 6 6 2 1 0
1 1 1 1 1 1 0 0
Второе разбиение
Алгоритм разбиения (split)
1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 0
3 1 4 9 9 8 1 0
1 1 8 8 8 4 1 0
1 1 6 6 6 3 1 0
1 1 5 6 6 3 1 0
1 1 5 6 6 2 1 0
1 1 1 1 1 1 0 0
Третье разбиение
Алгоритм разбиения и слияния
1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 0
3 1 4 9 9 8 1 0
1 1 8 8 8 4 1 0
1 1 6 6 6 3 1 0
1 1 5 6 6 3 1 0
1 1 5 6 6 2 1 0
1 1 1 1 1 1 0 0
Слияние
Алгоритм разбиения/слияния
(split and merge)
1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 0
3 1 4 9 9 8 1 0
1 1 8 8 8 4 1 0
1 1 6 6 6 3 1 0
1 1 5 6 6 3 1 0
1 1 5 6 6 2 1 0
1 1 1 1 1 1 0 0
Результат
Сравним с разрастанием регионов
1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 2
1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0
3 1 4 9 9 8 1 0 3 1 4 9 9 8 1 0
1 1 8 8 8 4 1 0 1 1 8 8 8 4 1 0
1 1 6 6 6 3 1 0 1 1 6 6 6 3 1 0
1 1 5 6 6 3 1 0 1 1 5 6 6 3 1 0
1 1 5 6 6 2 1 0 1 1 5 6 6 2 1 0
1 1 1 1 1 1 0 0 1 1 1 1 1 1 0 0
Результат
Алгоритм водораздела
• Изображение в градация серого можно интерпретировать
как карту высот
• «Будем лить воду на каждый пиксел и смотреть, куда она
стекает» (ищем «стоки»)
• Область водораздела, бассейн (catchment basin):
множество пикселов, поток из которых «стекает» к
одной общей точке («стоку»)
• Можем вычислить градиент изображения для получения
изображения в градациях серого
58 46 50 64 80 88 99 108
ребра
и регуляризационный параметр
• Методы:
• K-средних
• MeanShift – сдвиг среднего
• QuickShift – «быстрый» вариант сдвига среднего
K-cредних
Comaniciu, Dorin; Peter Meer "Mean Shift: A Robust Approach Toward Feature
Space Analysis". IEEE Transactions on Pattern Analysis and Machine Intelligence
(IEEE), 24 (5): 603–619. 2002,
Метод сдвига среднего: общая идея
Область
рассмотрения
Центр масс
Вектор сдвига
среднего
Центр масс
Вектор сдвига
среднего
Центр масс
Вектор сдвига
среднего
Центр масс
Вектор сдвига
среднего
Центр масс
Вектор сдвига
среднего
Центр масс
Вектор сдвига
среднего
Центр масс
Непараметрическое
оценивание градиента
плотности распределения
Ядровые методы (Kernel methods)
• Ядровые методы для оценивания плотности (Окна Парзена):
• Симметрия
xK (x) dx 0
Rd
• Экспоненциальное d
убывание веса с расстоянием lim x K ( x) 0
до точки x
Ядровые функции
1 n
P( x) K ( x - xi ) Функция конечного числа точек из выборки
n i 1 x1…xn
Примеры:
данные
c 1 x
• Epanechnikov Kernel K E ( x)
2
x 1
0 otherwise
c x 1
• Uniform Kernel KU (x )
0 otherwise
1 2
• Normal Kernel K N ( x) c exp x
2
Сдвиг среднего
• Возьмём градиент от оценки плотности распределения:
x - xi 2
g ( x) k ' ( x)
Рассмотрим 2
K (x - x i ) ck x xi
функцию ядра: h g i k ' ( )
h
градиент : Размер окна
n
x g
i i
c n c n
P ( x ) k i g i i 1n x
n i 1 n i 1
i 1
gi
Вычисление сдвига среднего
n
c n
c n xi g i
P (x)
n
k i g i
n i 1
i1
n x
i1
i 1
gi
Сдвиг
среднего
2
• Сложность метода O ( dN T ) , где d – размерность вектора,
N – число точек во множестве, T – число итераций алгоритма. dT
<< N
Примеры
Простые данные
Кластеризация по цвету:
Точки в Полученные
пространстве кластеры
(L*u)
Сегментация по цвету
Сегментация по цвету
Резюме сдвига среднего
Плюсы : Минусы :
A. Vedaldi and S. Soatto. Quick shift and kernel methods for mode seeking. In Proc. ECCV, 2008.
Сравнение
I – изображение
C – контур объекта, параметризованный по t на [0,1]
Cs, Css - первая и вторая производные
M. Kass, A. Witkin, and D. Terzopoulos. Snakes: Active contour models. IJCV, 1988
Вариант алгоритма Snakes
Использование хорошего
детектора границ, такого как Pb-
детектор, позволяет улучшить
качество суперпикселей, и точнее
привязать их к границам
Итого
Методы построения суперпикселей (пересегментации):
• Водораздел (Watershed)
• Эффективный метод на графах [Felzenszwalb &
Huttenlocher]
• Кластеризация K-средними
• MeanShift, QuickShift
• ТурбоПиксели (TurboPixels)
Felzenszwalb &
Shi & Malik Comaniciu & Meer
Huttenlocher
.825
Сегмент #1
Эталон .892
Сегмент t #2
Эталон
Tomasz Malisiewicz, Alexei A. Efros. Improving Spatial Support for Objects via Multiple
Segmentations, BMVC 2007 Slide by Alexey Efros
Проблемы сегментации
Суп сегментаций
D. Hoiem, A.A. Efros, and M. Hebert, "Automatic Photo Pop-up", ACM SIGGRAPH 2005
Как быть?
.659
.804 .567
.816 .862.841
Slide by Alexey Efros
Численные оценки
• Сравним с «лучшим»
прямоугольным окном
• На практике получить сложно