Академический Документы
Профессиональный Документы
Культура Документы
задачах компьютерного
зрения и алгоритмы на
графах
Мини-курс, Computer Science Club, Санкт-Петербург, 2010
Виктор Лемпицкий
Что такое компьютерное зрение?
Компьютерная графика
Изображение сцены Описание сцены
Компьютерное зрение
2
Из истории вопроса...
План на август:
1.Сегментация на объекты
2.Распознавание отдельных объектов
3.
Сегментация
Пример из Berkeley Segmentation Dataset:
f Глубина 1/Смещение
b
Стерео: локальный подход
Стерео: локальный подход
Результаты
Сканлайн
St ereopair from Middlebury st ereo w ebpage
От стерео к кратчайшим путям
смещение
λ
λ
λ +∞
λ
λ
пиксель
Стерео и энергии
Хотим:
Новая конструкция графа
+λ
смещение
+0
+λ
+λ
+λ
+λ
пиксель
Результаты
Оптимизация вдоль сканлайна Ground truth:
Динамическое программирование
Динамическое программирование
Передача сообщений
Передача сообщений
Передача сообщений
Док-во: индукция
Передача сообщений
Распространение сообщений
А в этих случаях?:
Что получилось
Перепады цвета
коррелируют с перепадами
глубины
t
Передача сообщений
i i
Передача сообщений
Доказательство:
1.Назначить t корнем
2.Провести индукцию от листьев
3.
Пересылка сообщений: расписание
Обучается на
тренировочных
данных
2
Pictorial structures
Квадратичная функция
Хотим:
Динамическое программирование?
t
Пересылка сообщений
λ
λ
λ +∞
λ
λ
пиксель
Двойственный граф
s
t
t d
)
U(
+∞
λ
t λ
Оптимизация с помощью разреза
s
смещение
пиксель
t
Оптимизация с помощью разреза
s
t
Стерео с помощью разреза
[Roy&Cox 1998, Ishikawa&Geiger 1998]
Стерео с помощью разреза
[Roy&Cox 1998]
Стерео с помощью разреза
[Roy&Cox 1998]
• Трехмерные данные
(напр. лазерные
сканы)
• Наборы фотографий
Предполагается наличие
•
?
регистрации и
ограничивающего
объема
Энергетический подход к
геометрической реконструкции
•Конструируется пространство «всех»
поверхностей
•Вводится функционал-энергия на пространстве
поверхностей
•Энергия =
соответствие данным + регуляризация
?
функционала
Фотосостоятельность
X
зак
•Фотосостоятельность: ры
т ие
Точка, лежащая на поверхности,
имеет схожие цвета проекции
•Закрытия: невидимые точки не
подчиняются фотосостоятельности
0.6 0.3
0
(X, n)
dS
0.1
0
0
Энергия
общая
фотосостоятельность
U(X)=+∞
U(X)=-∞
«объект на плоскости»
Дискретная глобальная
оптимизация
Пространство «всех»
поверхностей
Конечное
подмножество
Выбор дискретного множества
Увеличение
Истинный глобальный Ближайшая
минимум поверхность Плохая аппроксимация !
Вес
грани
Вес
грани
0 0
S “Внутри” “Снаружи”
3 из 16
изображ
Результ ен ий
ат рек он ст рук ц ии (U(x)
исп ользует ж ест к ие условия):
Улучшенный U(x) [Boykov,Lempitsky
2006]
Формула К оши-К рофтон а
(slide from Yuri Boykov)
Множество прямых,
φ пересекающих C
C 2π
Пространство
LC
прямых ρ
0 +∞
|| C ||ε ≈ 1
2 ∑n k ⋅ ∆ρ k ⋅ ∆φk = || C ||gc
Евклидова k
∆ρ k ⋅ ∆φk
длина Вес ребра в графе:
wk =
Количество пересеченных 2
граней C
«Гео-разрез»
[Boykov&Kolmogorov 2003]
S Можно заменить
на риманову
B метрику
T
Реконструкция по 3Д сканам
Скан 1
Скан 2
На входе: точки поверхности с грубыми оценками нормалей
На выходе: поверхность (треугольная сетка)
Сложности: шумы, выбросы, пропуски, ошибки регистрации
От точек к функционалу
[Lempitsky,Boykov 2007]
nA
A
Ф
Ф
Ф
Ф
Ф
или
Энергия (пример)
≥0
≥0
≥0
s (1 )
t (0 )
Сегментация с помощью разреза
[Boykov & Jolly ‘01]
«Кистевой» интерфейс
[Boykov & Jolly ‘01]
фон
объект
Сегментация с помощью разреза
[Boykov & Jolly ‘01]
S
фон
xp=0
объект
xp=1
http://www.csd.uwo.ca/~yuri/Images/Segm/bone.avi
Реализация более общих энергий
[Kolmogorov & Zabih 2004]
≥0
≥0
≥0
=?
xq = 0 xq = 1
xp = 0 A =Vpq (0,0) B = Vpq (0,1)
A A 0 0 0 D-C 0 B+C-A-D
Достаточное условие:
α-Расширение [Boykov, Veksler, Zabih, 1998]
(слайд Юрия Бойкова)
начальное решение
-расширение
-расширение
-расширение
-расширение
-расширение
-расширение
-расширение
•Гарантии на сходимость
•Гарантии на близость к глобальному минимуму
•На практике быстрее и аккуратнее передачи сообщений
Сравнение моделей/методов
Results from Middlebury benchmark pages
α-расширение
110.20% 100.15%
Сшивка изображений
[Agarwala et al. 2004]
Сшивка изображений с помощью
α-расширений [Agarwala et al. 2004]
Related work and Resources
(including those used to prepare the
slides)
Berkeley Segmentation Dataset,
http://www.eecs.berkeley.edu/Research/Projects/CS/vision/bsds/
Shai Avidan, Ariel Shamir: Seam carving for content-aware image resizing. ACM Trans.
Graph. 26(3): 10 (2007)
Richard Szeliski, Ramin Zabih, Daniel Scharstein, Olga Veksler, Vladimir Kolmogorov,
Aseem Agarwala, Marshall F. Tappen, Carsten Rother: A Comparative Study of Energy
Minimization Methods for Markov Random Fields. ECCV (2) 2006: 16-29
Hiroshi Ishikawa, Davi Geiger: Occlusions, Discontinuities, and Epipolar Lines in Stereo.
ECCV (1) 1998: 232-248
Victor S. Lempitsky, Yuri Boykov, Denis V. Ivanov: Oriented Visibility for Multiview
Reconstruction. ECCV (3) 2006: 226-238
Yuri Boykov and Victor Lempitsky: Form Photohulls to Photoflux Optimization. BMVC,
Edinburgh, 2006
Related work and Resources
(including those used to prepare the slides)
Victor S. Lempitsky, Yuri Boykov: Global Optimization for Shape Fitting. CVPR 2007
Vladimir Kolmogorov, Ramin Zabih: What Energy Functions Can Be Minimized via
Graph Cuts? IEEE Trans. Pattern Anal. Mach. Intell. 26(2): 147-159 (2004)
Yuri Boykov, Olga Veksler, Ramin Zabih: Fast Approximate Energy Minimization via
Graph Cuts. IEEE Trans. Pattern Anal. Mach. Intell. 23(11): 1222-1239 (2001)