Вы находитесь на странице: 1из 22

NHẬP MÔN THỊ GIÁC MÁY TÍNH

Trình bày: TS Trần Thái Sơn; Email: ttson@fit.hcmus.edu.vn


• Heuristic
– Minkowski-form
– Weighted-Mean-Variance (WMV)
• Thống kê phi tham số
– 2
– Kolmogorov-Smirnov (KS)
– Cramer/von Mises (CvM)
• Lý thuyết thông tin
– Kullback-Liebler (KL)
– Jeffrey-divergence (JD)
• Các độ đo khoảng cách nền:
– Histogram intersection
– Quadratic form (QF)
– Earth Movers Distance (EMD)
• Khoảng cách Mahalanobis
• Khoảng cách Hausdoff

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 2
• Công thức khoảng cách Minkowski Lp
1/ p
 p
D( I , J )    f (i, I )  f (i, J ) 
 i 
• Trường hợp đặc biệt:
– L1: giá trị tuyệt đối, khoảng cách
cityblock hay Manhattan.
– L2: khoảng cách Euclidian.

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 3
• Độ lệch trung bình trọng số (Weighted-Mean-
Variance):
– Chỉ chứa một phần rất ít thông tin về phân phối
(distribution).

 I    J   r I   r J 
D (I , J ) 
r r
 r

 r    r 

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 4
• Nonparametric Test Statistics:
• Phương pháp 2
• Độ đo dựa trên độ tương đồng của 2 mẫu:

 f  i; I   fˆ  i  ,
2

DI, J   
i fˆ  i 
where fˆ  i    f  i; I   f  i; J   / 2

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 5
• Khoảng cách Kolmogorov-Smirnov:
– Độ đo dựa trên độ tương đồng của 2 mẫu:

• Kramer/von Mises

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 6
• Kullback-Liebler:
– Chi phí để mã hóa một phân phối thành phân phối
khác.

• Jeffrey divergence:
– Như KL nhưng tính toán số học nhiều hơn.

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 7
• Ground Distance:
• Phép giao 2 histogram:
– Tốt cho so khớp từng phần:

• Dạng bình phương:


– Ký hiệu A là ma trận dương (A  0) là ma trận tương
quan giữ I và J. fI và fJ là vector của I và J.

D I , J   f I  f J  A f I  f J 
t

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 8
• Khoảng cách Earth Mover
Let P  {( p1 , w1 ),..., ( pn , wn )}
Q  {( q1 , w1 ),..., ( qm , wm )}
D(i, j )  dist ( p i , q j )
m n
min   f ij d ij m n
f ij
i 1 j 1  f d
i 1 j 1
ij ij

EMD( P, Q) 
s.t f ij  0 m n

n
 f
i 1 j 1
ij

f
j 1
ij  w pi

f
i 1
ij  wq j
m n m n

 f
i 1 j 1
ij  min( wpi ,  w p j )
i 1 j 1

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 9
• Earth Mover Distance

m clusters
(distance moved) * (amount moved)

Q All movements

n clusters

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 10
• Earth Mover Distance

m clusters
(distance moved) * (amount moved)

n clusters

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 11
• Earth Mover Distance

m clusters
* (amount moved)

n clusters

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 12
• Earth Mover Distance – Linear programming.

m clusters

n clusters

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 13
• Earth Mover Distance – Điều kiện.
1. Chỉ có thể di chuyển “earth” từ P sang Q
P

m clusters
P’

n clusters Q’

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 14
• Earth Mover Distance – Điều kiện.
2. Không thể chuyển nhiều
P “earth” hơn vốn có.

m clusters
P’
Q

n clusters
Q’

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 15
• Earth Mover Distance – Điều kiện.
3. Q không thể nhận nhiều
P “earth” hơn nó có thể giữ.

m clusters
P’
Q

n clusters
Q’

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 16
• Earth Mover Distance – Điều kiện.
4.Phải di chuyển nhiều “earth”
P nhất có thể

m clusters
P’

n clusters
Q’

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 17
• Khoảng cách Euclidian có trọng số trên tất cả các chiều
như nhau, tuy nhiên trong thống kê không phải lúc nào
cũng vậy.
Y

y X
(x,y)

x

Euclidian distance x = y
However statistically x < y
6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 18
Y
x2,y2
y X
(x,y)
x1,y1 x

• Với hiệp phương sai nhỏ hay = 0 ta có thể chuẩn hóa khoảng cách
bằng cách chi cho phương sai.
• 'x = (x2-x1)/ sqrt( xx ) 'y = (y2-y1)/ sqrt( yy )
• Dist = sqrt('x2 + 'y2)
• Ma trận hiệp phương sai là ma trận đường chéo và khoảng cách
giữa 2 điểm có thể viết lại:
• sqrt[(x2-x1,y2-y1)T S-1 (x2-x1,y2-y1)] = khoảng cách Mahalanobis.

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 19
Y
X
(x,y)

• Khoảng cách Mahalanobis = sqrt[(x2-x1,y2-y1)T S-1 (x2-x1,y2-y1)] cũng


tốt cho trường hợp hiệp phương sai lớn.
• Giá trị độ đo thay đổi như cách hiệp phương sai tăng.
•  là ma trận hiệp phương sai.

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 20
• Mahalanobis là phiên bản đa chiều của z-score. Độ đo
của khoảng cách từ trọng tâm (giá trị trung bình đa
chiều) của phân phối, với hiệp phương sai ( phương sai
đa chiều) của phân phối.
• Trường hợp điểm ngoài lề (outlier) nếu xác suất của nó
< 0.0001 hay bé hơn. Giá trị này tuân theo phân phối
chi-square với độ tự do của biến bằng số lượng biến
trong phép tính.
• Mahalanobis yêu cầu các biến là metric, ví dụ biến
khoảng và biến thứ tự được xem là metric.

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 21
[1] Chapter 2, Shape Analysis and Classification: Theory
and Practice, L.D.F. Costa, R.M. Cesar Jr , CRC. Press,
2000.

6/17/2018 Bộ môn Thị Giác Máy Tính & Robot - Khoa CNTT - ĐH Khoa học tự nhiên 22

Вам также может понравиться