Вы находитесь на странице: 1из 34

Сегментация

изображений
Часть 3
Методы теории графов
Чем выгодны

• Теория графов – хороший инструмент для работы


с изображениями
– Хорошая теоретическая база
– Много проработанных методов
– Изображение легко «превращается» в граф

• Математические модели теории графов хорошо


применимы в частности для сегментации
Граф и изображение
• Изображение превращается во взвешенный
неориентированный граф
– Пиксели – вершины графа
– Ребра – связи между соседними пикселями
– Вес ребер пропорционален «похожести» пикселей

ребра
Критерии «похожести» пикселей

• По расстоянию

• По яркости

• По цвету

• По текстуре
Сегментация с помощью
разрезов графа
Этап 1 Создать граф
Этап 2 Разрезать граф
Каждую связную компоненту после разреза рассматривать как
отдельную область
G=(V,E)
– Непересекающиеся подмножества вершин A и B из V
– Удаляем все ребра, связывающие A и B

Cut ( A, B )   w(u, v)
uA,vB

Cut(A,B) – мера «силы связности» множеств A и B


Разрез графа
• Разрез графа превращает граф в два
несвязанных друг с другом подграфа
Разрез графа

Если множества A и B не заданы заранее то разрезать


граф можно по-разному:
– Минимальный разрез – разрез, превращающий граф в
несвязный, с минимальной суммой весов удаленных
ребер

Cut ( A, B )   w(u, v)
u A,vB
Минимальный разрез хорош не всегда
• На данном рисунке вес ребер графа показан
расстоянием между вершинами
Нормализованный разрез графа
(Normalized cut)
Другая мера разреза – измеряет «похожесть» двух
групп вершин, нормированную на «объем», занимаемый ими
в графе

cut ( A, B ) cut ( A, B)
Ncut ( A, B)  
assoc ( A,V ) assoc ( B,V )
 assoc ( A, A) assoc ( B, B) 
Ncut ( A, B)  2    
 assoc ( A,V ) assoc ( B,V ) 
assoc ( A,V )   w(u , t )
uA,tV

Все ребра графа


Минимальный нормализованный разрез

Минимальный нормализованный разрез – разрез,


превращающий граф в несвязный, с минимальной
величиной NCut

– Как его найти?

B
A
Минимальный нормализованный разрез

yt (D  W ) y
MinNcut (G )  min y
y t Dy
При условиях: y i  1,b, 0  b  1, and y T D1  0

Если разрешить y  R задача сводится к задаче на


собственные значения:
( D  W ) y  Dy
D – диагональная матрица n x n:
D(i, i )   w(i, j )
j

W - симметричная матрица n x n
W (i, j )  w(i, j )
Алгоритм сегментации c помощью
normalized cuts
1. Задать граф на изображении.

2. Рассчитать матрицы W и D

3. Решить задачу (D-W)y=Dy, найти вектора с наименьшими


собственными значениями

4. По вектору со вторым наименьшим с.з. разрезать граф на две части

5. Рекурсивно разбить получившиеся области, если требуется


Алгоритм сегментации c помощью
normalized cuts Пример:
Оценка качества работы методов
сегментации
Критерии
 Целостность и однородность по некоторому признаку
 Отличие признака для смежных областей
 Отсутствие мелких отверстий внутри
 Гладкие границы

Тестирование методов на общей базе изображений


Например, Berkeley Segmentation Dataset насчитывает более 1000
изображений, отсегментированных вручную 30 разными людьми.

http://www.eecs.berkeley.edu/Research/Projects/CS/vision/grouping/segbench
Повышение Эффективности сегментации

Использование пространственной обработки на основе


• Сглаживания
• Масштабирования
Сегментация OpenCV

В библиотеке OpenCV есть метод "cvPyrSegmentation",


использующий модифицированный пирамидальный метод
сегментации изображений.
Анализ областей после
сегментации

17
Что нужно выяснить
Какие параметры областей помогут различить
объекты на этом примере?

18
Признаки области
Геометрические признаки
• Характеристики границы области
• Площадь
• Кол-во «дырок» внутри
• Центр масс
• Периметр
• Компактность
• Моменты
• Ориентация главной оси

Фотометрические признаки
• На основе цвета
• На основе интенсивности спектра
Площадь

• Кол-во пикселей в области


m n
A   B ( x, y )
x 0 y 0
Центр масс

• Центр масс:
m n

 xB( x, y)
x 0 y 0
x
A
m n

 yB( x, y)
x 0 y 0
y
A
Периметр и компактность

• Периметр - количество пикселей принадлежащих


границе области

• Компактность (инвариантный параметр)


P2
C
A
– Наиболее компактная фигура – круг, C  4π
Подсчет периметра области

1. Пиксель лежит на границе области, если он сам


принадлежит области и хотя бы один из его соседей
области не принадлежит.
(внутренняя граница)

2. Пиксель лежит на границе области, если он сам не


принадлежит области и хотя бы один из его соседей
области принадлежит.
(внешняя граница)

Периметр зависит также от того 4-х или 8-ми связность


используется для определения соседей.
Пример периметров области

4x

8x
Область

Внутренняя граница Внешняя граница


Моменты

Дискретный момент mij области определяется


следующим образом:

n
mij  x y
x , yS
i j
B ( x, y )

B( x, y ) - значение пикселя изображения ( x, y )


Моменты
n
mij  x y
x , yS
i j
B ( x, y )
X
i j Mij
0 1 2 3 4 5 6 7 8 9
1 0 0 7 Площадь

2 1 0 33
3 0 1 20
4 2 0 159 Моменты
инерции
5 62
0 2
6
1 1 93
Y
Моменты инерции
они определяют так называемые главные оси
инерции.
n n
m20   x B ( x, y )
x , yS
2
m02   y B ( x, y )
x , yS
2

i=2, j=0 или i=0, j=2. моменты инерции (моменты второго


порядка).
твердое тело характеризуется
некоторым эллипсом инерции,
где оси инерции и определяются
этими моментами. угол наклона
главной оси:
Центральные моменты

• Инвариантны к переносу

 pq    ( x  x ) p ( y  y ) q B( x, y ) d ( x  x )d ( y  y )

Центр масс области


Центральные моменты

 pq    ( x  x ) p ( y  y ) q B( x, y ) d ( x  x )d ( y  y ) m ipq    x p y q B( x, y )dxdy

00  m00  
01  0
10  0
20  m20  x 2
11  m11  x y
02  m02  y 2
30  m30  3m20 x  2x 3
21  m21  m20 y  2m11 x  2x 2 y
12  m12  m02 x  2m11 y  2x y 2
03  m03  3m02 y  2y 3
Ориентация главной оси инерции

1  2m11 
θ  arctan 
2  m20  m02 

Главная ось

Центр масс

Y
Моменты

 pq    ( x  x ) p ( y  y ) q B( x, y ) d ( x  x )d ( y  y )
• Инвариантны к повороту, переносу,
масштабированию
1  20  02
2  ( 20  02 )  11 2 2

3  ( 30  312 )  (312  03 )


2 2

4  ( 30  12 ) 2  ( 21  03 ) 2



Инвариантные характеристики области

 Удлиненность, нецентрированность (эксцентриситет)

m20  m02  ( m20  m02 ) 2  4m11


2
elongation 
m20  m02  ( m20  m02 ) 2  4m11
2

B
A
E 
B
Фотометрические признаки области

Для каждой области можно подсчитать некий набор


простейших числовых характеристик:

 Средняя яркость
 Средний цвет (если изображение цветное)
 Гистограмма распределения яркостей (или три гистограммы
распределения R, G, B)
 Дисперсию (разброс) яркостей или цвета

Все это рассчитывается не по бинарному изображению


Основные признаки по яркости

1. Средняя яркость изображения Вср - инвариантна к поворотам и


смещениям
1 - суммируются значения пикселов в
Bcp = 
N i, j
B (i , j )
каждой точке и делятся на их число.

2. Bmax Bmin - Максимальное и минимальное значение яркости


(плохо защищены от помех)
3.  ( B ) =  | B(i, j )  Bcp | - разброс относительно среднего
i, j значения яркости
Bmax B
4. Если B (i , j ) = kB0 (i , j ) тогда инвариантом будет или max
Bmin Bcp
Bmax  Bmin
5. Если B (i , j ) = kB0 (i , j )  C тогда инвариант - p =
Bmax  Bmin  2 Bcp

Вам также может понравиться