Pixeles A Objetos

DE PÍXELES A OBJETOS: HACIA UN PROCEDIMIENTO DE CLASIFICACIÓN DE
IMÁGENES MÁS INTELIGENTE.
Eduardo Iturrate
ITT Visual Information Solutions
4990 Pearl East Circle. Boulder, Colorado 80301, USA
eduardo@ittvis.com
Resumen
Este artículo analiza la necesidad de desarrollar algoritmos de clasificación de imágenes
basados no solamente en los valores espectrales de la imagen, sino en otras variables de
tipo espacial, texturas, etc. Se hace un repaso a distintas técnicas propuestas en la literatura
y se presentan nuestras conclusiones, implementadas en la herramienta ENVI FX (ENVI
Feature eXtraction). Nótese que este trabajo es de carácter genérico e ilustrativo y el nivel
de detalle no es muy profundo, por razones competitivas y de confidencialidad.
Abstract
This article analyzes the need to develop image classification algorithms based not just on
spectral signatures, but also on other variables like textures, shapes, etc. A number of
different proposed techniques will be reviewed, particularly those implemented in the
ENVI FX (ENVI Feature eXtraction) commercial software. Please, note that this article is
illustrative in nature, and the level of technical and implementation detail provided will be
limited for both competitive and confidentiality reasons.
Palabras clave: Clasificación, Objetos, Texturas, Segmentación, Teledetección, ENVI FX.
1. INTRODUCCION automática? ¿Cuáles son los mejores

métodos para extraer esa información?
Se dice frecuentemente que las imágenes
satelitales contienen una cantidad ingente A partir de una misma imagen satelital, la
de información. El problema es cómo información útil para una persona
extraer el máximo posible de esa interesada en el análisis de cultivos es
información, de manera automática, muy diferente que la información
cuando lo único que el usuario recibe es requerida por el experto en exploración
una cantidad del orden de millones de minera. El concepto información no es
valores numéricos en forma de píxeles exclusivo del tipo de datos que se tiene,
(datos). Se hace necesario responder a las sino también de la aplicación en la que se
preguntas ¿qué información exactamente trabaje.
se puede o se quiere extraer? ¿Es posible
extraer esa información de manera
1
Se hace necesaria una metodología que Textura: función que representa la
sea fácil de usar, precisa y automática. distribución de los valores de píxeles en
un área determinada.
2. DEFINICIONES CLAVE
Estas son algunos de los conceptos 3. DE PIXELES A OBJETOS

utilizados en este artículo, con su
definición entendida desde el punto de Los algoritmos de clasificación de
vista de la segmentación de imágenes imágenes satelitales por computadora se
satelitales. han basado, en su gran mayoría, en el
análisis de la firma espectral de píxeles
Anexado de Regiones: el proceso de unir individuales, sin tener suficientemente en
varios segmentos en uno, utilizando un cuenta la relación espacial entre puntos
criterio concreto. contiguos.
Característica Espacial: grupo de píxeles Desde el punto de vista de cómo los

contiguos que representan un objeto o humanos perciben información visual,
fenómeno visible en una imagen esto sería equivalente a identificar un
geoespacial. objeto únicamente por su color sin tener
en cuenta su forma, textura, tamaño, y
Clasificación por píxeles: método otras variables que el cerebro utiliza. La
tradicional de cuantificación de imágenes razón por la que los algoritmos de
digitales según la cual cada píxel se clasificación actuales se han
analiza de forma individual y aislada. especializado en este tipo de análisis
claramente limitado es doble:
Clasificación por objetos: método de
cuantificación de imágenes digitales por 1. Facilidad de medición de la firma
la cual se definen regiones de píxeles espectral en distintos puntos de espectro
contiguos que se tratan como entidades por sensores digitales modernos,
independientes con una serie de atributos mejorando incluso las capacidades del ojo
de forma, textura y valores espectrales. humano al incorporar bandas del rango
infrarrojo (invisibles al ser humano).
Segmentación: el proceso de separar áreas
de una imagen en entidades individuales. 2. Los algoritmos de clasificación
basados en discriminación de firmas
Sobre-segmentación: el efecto de dividir espectrales son relativamente sencillos y
una única característica espacial en varios han sido utilizados con éxito por varias
segmentos o entidades. Es un error que décadas.
debe de ser corregido mediante un
proceso de anexado de regiones.
2
Sin embargo, a pesar del éxito relativo de que, a pesar de toda su sofisticación y
este tipo de algoritmos, hay tres razones eficacia, lo que ocurre en un píxel de la
clave por las que se hace imperativo imagen no tiene importancia alguna en el
seguir avanzando en la búsqueda de análisis de sus píxeles contiguos.
algoritmos más sofisticados, basados en
otras características presentes en la El píxel tiene una posición determinada,
imagen: una serie de valores espectrales (un valor
por banda) y un tamaño determinado en la
1. La dificultad de producir imágenes con tierra (resolución espectral), mientras que
información espectral precisa a la vez que el objeto es una combinación de píxeles
espacialmente detallada. Hay que buscar contiguos, con atributos adicionales
un compromiso entre ambas resoluciones como: textura, forma, etc. El objeto
a la hora de diseñar sensores de también tiene un borde con una forma
teledetección. determinada.
2. Los algoritmos de corrección A la hora de seleccionar una metodología

atmosférica, aunque sofisticados, son y flujo de trabajo, se tuvieron en cuenta
todavía relativamente difíciles de utilizar. los siguientes requerimientos:
3. La certeza intuitiva de que si el cerebro 1. Uso de tanta información espacial y

humano puede obtener ciertos resultados espectral disponible en una imagen como
en reconocimiento de patrones, una sea posible.
computadora podría hacerlo también,
mejorando de esta forma los resultados 2. Uso de metodología basada en objetos,
actuales. no en píxeles.
El paquete de software ENVI, de la 3. Precisión de resultados.

empresa ITT Visual Information
Solutions (Boulder, Colorado, Estados 4. Facilidad de uso: pocos parámetros y
Unidos), es probablemente el paquete de previsualización inmediata de resultados
teledetección que incorpora los intermedios.
algoritmos más avanzados y sofisticados
para el análisis puramente espectral de 5. Repetibilidad de resultados.
imágenes. Algoritmos como Píxel Purity
Index, Spectral Unmixing, Maximum 6. Velocidad de ejecución.
Noise Fraction y otros, representan el
máximo exponente del procesamiento La literatura científica proporciona
puramente espectral de imágenes satélite. multitud de técnicas de segmentación de
Lo que resulta interesante de resaltar es imagen, particularmente abundante en los
últimos años. La principal desventaja de
3
todas ellas es su limitación práctica a Generación de Objetos
casos muy concretos. Algunos algoritmos
por ejemplo se especializan en identificar Segmentación
células en imágenes de microscopio, otros
sobresalen en el reconocimiento de
caracteres, pero ninguno ofrece una Generación
Vectorización
solución genérica al problema de De Objetos
segmentación de imágenes digitales.
Una dificultad adicional cuando se trata Clasificación

Clasificación
de analizar imágenes de teledetección es Definición
De Características
que en muchos casos, la separación entre
fondo y objeto no se puede parametrizar
con un único valor o rango reducido; la
variabilidad es demasiado grande. Clasificación Clasificación
Por Reglas Supervisada
Dado que ningún algoritmo es capaz de
resolver todos los problemas de Figura 1: Etapas principales del proceso de
segmentación de imágenes, nuestro clasificación por objetos
enfoque se centra más en desarrollar un
proceso de análisis formado por varios Se pueden diferenciar dos partes
algoritmos probados y robustos, cuyo uso principales: generación de objetos y
se realiza a través de un interfaz intuitivo, clasificación. La primera parte tiene que
con el mínimo posible de parámetros a ver con la segmentación y vectorización
definir por el usuario y con la posibilidad de la imagen en regiones denominadas
de previsualizar resultados intermedios. objetos, que contienen una serie de
atributos asociados. La segunda parte
agrupa objetos en clases en función de su
4. GENERACION DE OBJETOS similitud relativa, con criterios que hacen
uso de los atributos calculados en la
Observemos primeramente el proceso primera fase. Se observa ya que la
completo de análisis de imágenes por clasificación se puede realizar mediante
objetos. dos aproximaciones, un algoritmo
supervisado y otro basado en reglas.
4.1. SEGMENTACION
La segmentación se define como el

proceso de dividir la imagen en un
4
número finito de regiones que tienen escala a la cual la segmentación es óptima
significado geoespacial. para cada situación e imagen. Este
algoritmo está en estos momentos en
Veamos con más detalle los pasos proceso de ser patentado.
necesarios para realizar un proceso de
segmentación de imagen: Otra ventaja de este algoritmo es su
relativa rapidez, lo cual permite
implementar una herramienta de
Imagen Segmentación
Original Multi-Escala previsualización que permite afinar los
parámetros de segmentación a medida
que ésta se va calculando. Esto aumenta
Imagen de forma significativa la utilidad del
Etiquetada
proceso completo, proporcionando
resultados inmediatos a medida que se
trabaja con los parámetros.
Anexado Selección
De Regiones De Umbrales
Los dos errores que se pueden cometer al
no escoger un valor acertado de escala de
Imagen Imagen segmentación son sub-segmentación
Etiquetada Etiquetada (pocos segmentos encontrados) y sobre-
Refinada Refinada
segmentación (más segmentos que los
Figura 2: Pasos intermedios del proceso de
segmentación necesarios). En nuestro procedimiento, se
recomienda forzar el primer paso con una
El algoritmo de segmentación cierta sobre-segmentación que será luego
“watershed” se puede entender compensada con dos técnicas de refinado
imaginando una imagen como una de segmentos.
superficie topológica donde cada valor de
píxel representa una elevación. La imagen El algoritmo de anexado de regiones
tendrá mínimos locales hacia los cuales “Full Lambda Schedule” representa una
convergería proveniente de píxeles manera muy eficiente de mejorar el
circundantes. Estas regiones son el problema de sobre-segmentación.
resultado de la segmentación, Inicialmente desarrollado por Robinsin,
representadas por los bordes entre ellas Redding y Crisp para la segmentación de
[4]. imágenes de radar de apertura sintética
(SAR), el algoritmo mezcla de manera
En ITT VIS implementamos una versión interactiva regiones vecinas,
modificada del algoritmo de considerando para ello todos los pares
segmentación watershed multi-escala. posibles de regiones, hasta conseguir un
Ajustando dicho parámetro de escala, el resultado teóricamente óptimo [3].
usuario puede definir la resolución o
5
El único parámetro controlable en este mientras que el resto será combinado en
paso es el grado de anexado, que varía una o varias regiones de fondo.
entre 0.0 (ninguna región es anexada) a
100.0 (todas las regiones se combinan en Se ha observado en repetidas casos que el
una sola). Es destacable que en este paso, primer método de refinamiento funciona
la velocidad de ejecución del algoritmo mejor en problemas de sobre-
también permitió la implementación de segmentación provocados por zonas de
una herramienta de previsualización, de texturas muy variables, como vegetación
inestimable ayuda para el operador. o nubes. El segundo método es mejor
cuando se desean extraer objetos
Conviene destacar que el algoritmo de específicos como aviones o edificios.
watershed se centra en la selección de
bordes entre segmentos, mientras que el 4.2. VECTORIZACION
Full-Lambda Scheduling se centra en el
análisis de cada región individual. El siguiente paso es la generación de los
Combinando ambos en un procedimiento objetos, propiamente definidos como
interactivo, se consigue una metodología vectores con una serie de atributos
robusta que combina las ventajas de cada asociados.
técnica.
Imagen Conversión
El segundo método de corrección de Etiquetada Raster a Vector
sobre-segmentaciones se denomina
“Selección de Umbral”. Utilizado como Shapefile
método de afinado alternativo y
complementario al mismo tiempo al
Suavizado
algoritmo Full Lambda Schedule, este Douglas Peuker
algoritmo permite refinar un resultado de
segmentación separando el fondo de la Shapefile
imagen de los objetos de interés. Para Suavizado
ello, se utiliza el histograma del nivel Imagen
Etiquetada
digital de cada segmento (correspondiente Cálculo De
Atributos
al nivel digital medio de los píxeles Imagen
contenido en él) a partir del cual el Original
usuario puede seleccionar Shapefile +

Tabla DBF
interactivamente valores máximos y
Figura 3: Procesos intermedios de la generación de
mínimos de umbral. Las regiones con objetos
niveles digitales contenidos entre dichos
valores serán considerados como objetos
de interés y segmentados como tal,
6
Estos atributos se pueden agrupar en tres Definición De
clases: Características
1. Atributos espectrales, como por

ejemplo valores máximos, mínimos, Clasificación
Definición De
Regiones De
medios, por banda, así como ratios de Por Reglas
Entrenamiento
bandas, índices de vegetación, etc.
2. Atributos espaciales, entre los que Resultado De

Clasificación
destacan el área, perímetro, compacidad, Clasificación
Supervisada
elongación, longitudes máximas y NO
mínimas, etc.
¿Resultado Resultado De
2. Atributos de textura, como la Satisfactorio? Clasificación
desviación estándar, entropía, etc.
SI
En algunos casos, se has obtenido Fin
¿Resultado
Satisfactorio?
mejores resultados de segmentación si la
imagen se filtra antes de ser procesada,
SI
por ejemplo, con un filtro Mean Shift [6].
Fin
Sin embargo, se observó que esta técnica
Figura 4: Pasos intermedios del proceso de clasificación
resulta demasiado lenta incluso en de objetos
imágenes relativamente pequeñas, por lo
que fue desechada. El método de clasificación supervisada
requiere que el usuario defina una serie de
características, identificándoles como
5. CLASIFICACION DE OBJETOS representativas de las clases que se
desean obtener. El resultado de este
Tras la generación de objetos, el siguiente proceso se denomina regiones de
paso es el de clasificación de esos objetos entrenamiento y se utilizan como entrada
en clases con significado concreto. La para el algoritmo de clasificación
idea tras esta segunda colección de automática que determinará, para el resto
algoritmos es agrupar objetos en distintas de objetos en la imagen, la clase más
clases, en base a sus atributos y cercana a la que pertenecen, asignándolos
características. a la misma.
Entre los algoritmos de clasificación

supervisada, creemos que dos de ellos
7
producirán los mejores resultados para 6. CONCLUSIONES
clasificar objetos son Support Vector
Machine (SVM) y K-Nearest Neighbor Este artículo describe el funcionamiento
(k-NN). La razón es que estos dos básico y ventajas de un procedimiento de
algoritmos son buenos cuando los valores clasificación de imágenes de
a clasificar son de naturaleza teledetección tomando como elemento
completamente diferente, como es el caso básico el concepto de objeto, en vez de el
de atributos de los objetos generados en la píxel.
segmentación. Por ejemplo, valores de
texturas tendrán un rango completamente La literatura técnica presenta una buena
diferente que los de perímetro, cantidad de métodos que intentan
elongación, o simplemente valores segmentar una imagen digital en áreas
espectrales medios del objeto. que tienen significado semántico para el
observador. Dicha significancia está
El algoritmo SVM tiene sus bases en la íntimamente ligada a la aplicación
teoría de aprendizaje estadístico. Separa concreta y al objeto de estudio de dicha
los resultados con una superficie de imagen.
decisión (llamada hiperplano óptimo) que
maximiza la distancia entre clases [7]. El Ante la limitación de que ningún
algoritmo K-Nearest Neighbor extrae un algoritmo por sí sólo resulta óptimo en
vector de características por cada objeto, todas las situaciones, el uso de un
con el cual se calcula una serie de procedimiento interactivo de varias fases
distancias euclídeas al vector proporciona la robustez y flexibilidad
representativo de cada clase [5]. necesaria para obtener resultados
altamente satisfactorios en una mayor
La clasificación basada en reglas en una parte de los casos.
técnica poderosa para la clasificación de
objetos. Según esta metodología, el La clasificación por objetos no pretende
usuario define características y construye sustituir completamente a la clasificación
reglas para cada una de las clases, basada en firmas espectrales de píxeles
basadas en los atributos de los objetos. individuales. Existen aplicaciones como
Por ejemplo, el usuario será capaz de la exploración minera donde el uso de
definir un edificio como un objeto de un tecnología hiperespectral sigue siendo
tamaño determinado, con un color claramente superior. Ambas técnicas de
establecido y una forma más o menos clasificación son evidentemente
cuadrada. Es una forma poderosa de complementarias.
poder utilizar la intuición y experiencia
humana aplicadas a la resolución del En el momento de escribir este artículo,
problema de clasificación de objetos. los ingenieros de ITT Visual Information
8
Solutions están terminando de
implementar los últimos bloques de lo
que será el nuevo software ENVI FX
(Feature eXtraction) para clasificación de
imágenes por objetos. Creemos que
hemos encontrado un balance muy
interesante entre precisión, facilidad de
uso y sofisticación para resolver
problemas de segmentación de imágenes
satelitales.
REFERENCIAS
[1] Padwick, C. et. al., “Spatial Feature
Extraction R&D Final Report”, October 2006,
ITT Visual Information Solutions, Boulder,
Colorado, USA.
[2] Yang, Z., “Support Vector Machine for High

Resolution Remote Sensing Imagery Spatial
Feature Extraction with Hierarchical
Reasoning”, ASPRS presentation, May 2006.
[3] Robinson, D. et. al., “Implementation of a

Fast Algorithm for Segmenting SAR
Imagery”, January 2002, Defense Science and
Technology Organization – DSTO, Australia.
[4] Beucher, S., Meyer, F., “The morphological

approach to segmentation: the watershed
transformation, Mathematical Morphology in
Image Processing”, 12, 433-481, Marcel
Dekker, New York, 1993
[5] Moore, A. “An Introductory Tutorial on KD-

Trees”, Carnegie Mellon University, PHd.
Thesis, 2003.
[6] Comaniciu, D., “Mean Shift: A Robust

Approach Toward Feature Space Analysis”,
IEEE Transactions on Pattern Analysis and
Machine Intelligence, Vol 24, No. 5, May
2002.
[7] “ENVI User’s Guide”, 2006. ITT Visual

Information Solutions.

Pixeles A Objetos

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Pixeles A Objetos

Загружено:

Авторское право:

Доступные форматы

DE PÍXELES A OBJETOS: HACIA UN PROCEDIMIENTO DE CLASIFICACIÓN DE

IMÁGENES MÁS INTELIGENTE.

Palabras clave: Clasificación, Objetos, Texturas, Segmentación, Teledetección, ENVI FX.

1. INTRODUCCION automática? ¿Cuáles son los mejores

Estas son algunos de los conceptos 3. DE PIXELES A OBJETOS

Característica Espacial: grupo de píxeles Desde el punto de vista de cómo los

2. Los algoritmos de corrección A la hora de seleccionar una metodología

3. La certeza intuitiva de que si el cerebro 1. Uso de tanta información espacial y

El paquete de software ENVI, de la 3. Precisión de resultados.

Una dificultad adicional cuando se trata Clasificación

La segmentación se define como el

usuario puede seleccionar Shapefile +

1. Atributos espectrales, como por

2. Atributos espaciales, entre los que Resultado De

Entre los algoritmos de clasificación

[2] Yang, Z., “Support Vector Machine for High

[3] Robinson, D. et. al., “Implementation of a

[4] Beucher, S., Meyer, F., “The morphological

[5] Moore, A. “An Introductory Tutorial on KD-

[6] Comaniciu, D., “Mean Shift: A Robust

[7] “ENVI User’s Guide”, 2006. ITT Visual

Вам также может понравиться