Вы находитесь на странице: 1из 18

Análisis de

imágenes
digitales

REPRESENTACIÓN Y DESCRIPCIÓN
Momentos
INTRODUCCIÓN
• En general, la relación entre una imagen ideal f(x,y) y una imagen observada
g(x,y) se describe como g =D( f ) donde D es un operador de degradación.
• El operador D puede ser descompuesto en degradación radiométrica R (i.e.,
color o escala de grises) y en degradación geométrica G (i.e., espacial).

Distorción de perspectiva debido Imagen borrosa por mal Imagen distorcionada por
a una vista no perpendicar enfoque de la cámara una deformación no lineal

2
INTRODUCCIÓN
• El reconocimiento de objetos y patrones que han sido deformados es el
objetivo de muchas investigaciones. Básicamente las tres mayores
aproximaciones a este problema son:
1. Fuerza bruta: se busca en el espacio paramétrico todas las posibles
degradaciones de la imagen, esto significa que el conjunto de
entrenamiento no sólo contiene todas las clases representativas sino todas
sus versiones escaladas, rotadas y deformadas.
2. Normalizada: los objetos se transforman a un estándar específico de
posición antes de realizar la clasificación.
3. Invariantes: describir los objetos a través de un conjunto de rasgos
cuantificables que sean insensibles a cualquier tipo de deformación y que
provea gran poder de discriminación entre clases.

3
INVARIANTES
• Un invariante I es una funcional definida en el espacio de todas las imágenes
admisibles que no cambia su valor bajo la degradación del operador D, es decir,
satisface la condición I( f ) = I(D( f )) para imagen f.

• En la práctica, debido a las Espacio de invariantes


imperfecciones en el método de
segmentación, el ruido y variaciones
intra-clase I( f ) ≈ I(D( f )).
• Otra propiedad importante deseable

x2
de I es el poder de discriminación, de
manera que para objetos diferentes,
sus valores deben ser
significativamente diferentes. x1

4
INVARIANTES
• Categorización de los invariantes de acuerdo a la herramienta matemática
empleada:

Descriptores de formas simples: compacidad, convexidad,


elongación, etc.
Características de coeficientes de transformadas: descriptores de
Fourier, descriptores Hadamard, coeficientes de la transformada
Invariantes

Radon y características basadas en wavelets.


Conjunto de puntos invariantes: usa la posición de puntos
dominantes.

Invariantes diferenciales: emplea derivativas de contorno del objeto.

Momentos invariantes: funciones especiales de los momentos de una


imagen.

5
MOMENTOS

• Los momentos son “proyecciones” de una función sobre una base polinomial, de
manera similar que la transformada de Fourier es una proyección sobre una
base de funciones harmónicas.
• Se han utilizado por mucho tiempo en estadística para describir la forma de
una función de densidad de probabilidad y en mecánica clásica para medir la
distribución de masa de un cuerpo.
• Los momentos invariantes aplicados al procesamiento de imágenes y
reconocimiento de patrones comenzaron a utilizarse en 1962*, cuando Hu
utilizó la teoría de invariantes algebraicos de donde se derivaron sus 7 famosos
invariantes a la traslación, rotación y cambio de escala de objetos 2D.

*M. K. Hu, "Visual Pattern Recognition by Moment Invariants", IRE Trans. Info.Theory, vol. IT-8, pp.179–187, 1962.
6
MOMENTOS
• Definición 1. Una función imagen se puede entender como cualquier función
real continua f(x,y) de dos variables definida sobre un soporte compacto
Ω ⊂ R×R y que posee una integral finita diferente de cero.
• Definición 2. El momento general Mpq de una imagen f(x,y), donde p,q son
enteros no negativos y r = p+q es llamado el orden del momento se define
como:
M pq = ∫∫ p pq (x, y) f (x, y)dx dy
Ω

donde la secuencia p00(x,y), p10(x,y),…, pkj(x,y) son funciones polinomiales


definidas sobre Ω.
• Dependiendo de la base polinomial utilizada pueden definirse momentos
geométricos, momentos complejos y momentos ortogonales.

7
MOMENTOS GEOMÉTRICOS
• La selección más común es un estándar base de potencias donde
pkj (x,y) = xkyk de los cuales se derivan los momentos geométricos:
∞ ∞

m pq = ∫∫ x p y q f (x, y)dx dy
−∞ −∞

• En el caso de una imagen digital los momentos geométricos se definen como:

m pq = ∑ ∑ x p y q f (x, y)
x y

• En el caso de una imagen binaria con valores en {0,1} la ecuación anterior


toma la forma:
m pq = ∑ ∑ x p y q
x y

8
MOMENTOS GEOMÉTRICOS
• En la mayoría de las aplicaciones únicamente los momentos hasta de orden 3
son utilizados.
• Momento de orden cero m00 representa la masa total de la imagen. Para una
imagen binaria, m00 coincide con el área geométrica del objeto, es decir, el
número de píxeles (x,y)∈R. Entonces m00 se define como:
m00 = ∑ ∑ f (x, y)
x y

• Momentos de orden uno m10 y m01 se conocen como momentos estáticos,


siendo utilizados para localizar el centro de gravedad o centroide del objeto
como:
m10 m01
x= y y=
m00 m00
• De esta manera, las coordenadas (x, y ) señalan el punto donde la masa total
del objeto puede ser concentrada sin cambios en los momentos de orden uno
a lo largo de los ejes x y y, respectivamente.
9
MOMENTOS GEOMÉTRICOS
• Momentos de orden dos m20, m02 y m11 se conocen como momentos de
inercia y describen la distribución de masa de la imagen con respecto a los ejes
coordenados, y se pueden calcular las siguientes características.

• A partir de los momentos de orden dos se puede calcular el radio de giro de


un objeto el cual describe la forma en la cual la masa de un objeto se distribuye
alrededor de su eje centroidal y se define como:

m20 m02
rx = y ry =
m00 m00
• Momentos de orden tres m30 y m03 describen el sesgo proyectivo de un
objeto, el cual es una medida estadística del grado de distribución de la
desviación de simetría alrededor del eje centroidal:
m30 m03
sx = y sy =
m20
3
m023

10
MOMENTOS GEOMÉTRICOS
• Momentos de orden cuatro m40 y m04 describen la curtosis del objeto, el
cual es una medida de apuntamiento (i.e., qué tan puntiagudo es):
m40 m04
kx = 2 y ky = 2
m20 m02
256 px 564 px 450 px 566 px
256 px

564 px

750 px

566 px
Forma A Forma B Forma C Forma D

Descriptor Forma A Forma B Forma C Forma D

m00 12849 93671 40395 122446


(x, y ) (129,129) (286.3, 286.6) (248.5, 326.5) (271.1, 264.0)

(rx , ry ) (132.9,132.9) (302.4, 305.9) (269.1, 377.4) (294.8, 280.1)

(Sx , Sy ) (0.0096, 0.0096) (0.0037, 0.0038) (0.0059, 0.0067) (0.0034, 0.0033)

(kx , ky ) (0.9506, 0.9506) (0.1486, 0.1528) (0.3611, 0.4884) (0.1260, 0.1148)

11
MOMENTOS CENTRALES
• Los momentos geométricos no son invariantes a traslaciones, rotaciones ni
cambios de escala.
• Para darle la propiedad de invariante a traslaciones (sin rotaciones y cambios
de escala) se debe desplazar el centroide del objeto al origen del referencial
como:
µ pq = ∑ ∑ (x − x ) p (y − y )q f (x, y)
x y

• Los momentos centrales hasta de orden tres pueden computarse como:

µ00 = m00 µ21 = m21 − 2xm11 − ym20 + 2m01 x 2


µ10 = µ01 = 0 µ12 = m12 − 2ym11 − xm02 + 2m10 y 2
µ20 = m20 − xm10 µ30 = m30 − 3xm20 + 2m10 x 2
µ02 = m02 − ym01
µ03 = m03 − 3ym02 + 2m01 y 2
µ11 = m11 − xm01 = m11 − ym10
12
MOMENTOS NORMALIZADOS
• Los momentos centrales normalizados son invariantes a traslaciones y cambios
de escala, lo cual se obtiene al dividir cada momento por un factor de
normalización que cancela el efecto de escalamiento.
• Recordando que los cambios de escala son causado por transformaciones de
coordenadas de la forma:
⎡ x′ ⎤ ⎡ α 0 ⎤ ⎡ x ⎤
⎢ ⎥=⎢ ⎥⎢ y ⎥
⎢⎣ y ′ ⎥⎦ ⎣ 0 α ⎦ ⎢⎣ ⎥⎦
• Si f'(x',y') es la imagen f(x,y) después de un escalamiento en cada eje por α, de
modo que x'= αx y y'= αy, entonces tenemos que:
m ′pq = ∑ ∑ ( x ′ ) p ( y′ )q f ( x ′, y′ ) = α p+q+2 ∑ ∑ (x) p (y)q f (x, y)
x y x y
• Por tanto, m'pq = αp+q+2mpq, y de forma similar µ'pq = αp+q+2µpq. En particular
µ'00 =α2µ00. Entonces, los momentos centrales normalizados se definen como:
µ pq p+q
η pq = γ donde γ = + 1 para p + q ≥ 2
µ00 2
13
MOMENTOS DE HU
• A partir de los momentos centrales normalizados, Hu derivó un conjunto de 7
invariantes a rotaciones, traslaciones y cambios de escala, los cuales son:

φ1 = η20 + η02
φ2 = (η20 − η02 )2 + 4η112
φ3 = (η30 − 3η12 )2 + (3η21 − η03 )2
φ4 = (η30 + η12 )2 + (η21 + η03 )2
φ5 = (η30 − 3η12 )(η30 + η12 )[(η30 + η12 )2 − 3(η21 + η03 )2 ]
+ (3η21 − η03 )(η21 + η03 )[3(η30 + η12 )2 − (η21 + η03 )2 ]
φ6 = (η20 − η02 )[(η30 + η12 )2 − (η21 + η03 )2 ] + 4η11 (η30 + η12 )(η21 + η03 )
φ7 = (3η21 − η03 )(η30 + η12 )[(η30 + η12 )2 − 3(η21 + η03 )2 ]
+ (3η12 − η30 )(η21 + η03 )[3(η30 + η12 )2 − (η21 + η03 )2 ]

14
MOMENTOS DE HU
Original Trasladada Escalada 50%

Espejo Rotada 45º Rotada 90º

Momento Original Trasladada 50% Espejo 45º 90º

ϕ1 2.8662 2.8662 2.8664 2.8662 2.8661 2.8662

ϕ2 7.1265 7.1265 7.1257 7.1265 7.1266 7.1265

ϕ3 10.4109 10.4109 10.4047 10.4109 10.4115 10.4109

ϕ4 10.3742 10.3742 10.3719 10.3742 10.3742 10.3742

ϕ5 21.3674 21.3674 21.3924 21.3674 21.3663 21.3674

ϕ6 13.9417 13.9417 13.9383 13.9417 13.9417 13.9417

ϕ7 -20.7809 -20.7809 -20.7724 -20.7809 -20.7813 -20.7809

15
MOMENTOS DE HU
Original Trasladada Escalada 50%

Espejo Rotada 45º Rotada 90º

Momento Original Trasladada 50% Espejo 45º 90º

ϕ1 0.1808 0.1808 0.1809 0.1808 0.1808 0.1808

ϕ2 0.0015 0.0015 0.0015 0.0015 0.0015 0.0015

ϕ3 2.03×10−5 2.03×10−5 2.03×10−5 2.03×10−5 2.17×10−5 2.03×10−5

ϕ4 3.04×10−7 3.04×10−7 3.47×10−7 3.04×10−7 3.79×10−7 3.04×10−7

ϕ5 7.14×10−13 7.14×10−13 8.62×10−13 7.14×10−13 1.05×10−12 7.14×10−13

ϕ6 -1.08×10−8 -1.08×10−8 -1.24×10−8 -1.08×10−8 -1.31×10−8 -1.08×10−8

ϕ7 2.50×10−13 2.50×10−13 2.50×10−13 2.50×10−13 2.49×10−13 2.50×10−13

16
MOMENTOS DE INERCIA
• Los momentos centrales pueden • Para ajustar el valor del ángulo θ al
aplicarse para caracterizar medidas intervalo [0, π/2] se hacen las siguientes
geométricas del objeto. comparaciones:
• El momento de inercia es una ⎧ θ si µ20 > µ02 y θ > 0
característica que permite determinar el ⎪
⎪ −θ si µ20 > µ02 y θ < 0
ángulo de orientación de un objeto en
⎪ π
la imagen. θ′ = ⎨ − θ si µ20 < µ02 y θ > 0
⎪ 2
• A partir de los momentos centrales µ20, ⎪ π
µ 02 y µ 11 , se puede calcular la ⎪ + θ si µ20 < µ02 y θ < 0
⎩ 2
orientación del eje principal del objeto Eje mayor
y
como:

1 −1 ⎛ 2 µ11 ⎞
θ= tan ⎜
2 ⎝ µ20 − µ02 ⎟⎠ θ ′ = π2 − θ = 62º
x

θ = 28º

17
MOMENTOS DE INERCIA
• La excentricidad (o elongación)
proporciona la relación entre la
anchura y la longitud del objeto, y se
calcula como el cociente entre el
máximo y mínimo diámetro del ε = 0.95
Diámetro máximo

objeto. Diámetro mínimo

• Se calcula a partir de los momentos


centrales de segundo orden, µ20, µ02
ε = 0.25
y µ11, como:
2

ε=
( µ20 − µ02 ) + 4 µ112
( µ20 − µ02 )2
• La excentricidad está en el rango
[0,1], donde ε = 0 corresponde con
un objeto redondo y tiende a 1 ε = 4.28 × 10 −4
conforme se alarga el objeto.
18

Вам также может понравиться