Академический Документы
Профессиональный Документы
Культура Документы
Eduardo Iturrate
ITT Visual Information Solutions
4990 Pearl East Circle. Boulder, Colorado 80301, USA
eduardo@ittvis.com
Resumen
Este artículo analiza la necesidad de desarrollar algoritmos de clasificación de imágenes
basados no solamente en los valores espectrales de la imagen, sino en otras variables de
tipo espacial, texturas, etc. Se hace un repaso a distintas técnicas propuestas en la literatura
y se presentan nuestras conclusiones, implementadas en la herramienta ENVI FX (ENVI
Feature eXtraction). Nótese que este trabajo es de carácter genérico e ilustrativo y el nivel
de detalle no es muy profundo, por razones competitivas y de confidencialidad.
Abstract
This article analyzes the need to develop image classification algorithms based not just on
spectral signatures, but also on other variables like textures, shapes, etc. A number of
different proposed techniques will be reviewed, particularly those implemented in the
ENVI FX (ENVI Feature eXtraction) commercial software. Please, note that this article is
illustrative in nature, and the level of technical and implementation detail provided will be
limited for both competitive and confidentiality reasons.
1
Se hace necesaria una metodología que Textura: función que representa la
sea fácil de usar, precisa y automática. distribución de los valores de píxeles en
un área determinada.
2. DEFINICIONES CLAVE
2
Sin embargo, a pesar del éxito relativo de que, a pesar de toda su sofisticación y
este tipo de algoritmos, hay tres razones eficacia, lo que ocurre en un píxel de la
clave por las que se hace imperativo imagen no tiene importancia alguna en el
seguir avanzando en la búsqueda de análisis de sus píxeles contiguos.
algoritmos más sofisticados, basados en
otras características presentes en la El píxel tiene una posición determinada,
imagen: una serie de valores espectrales (un valor
por banda) y un tamaño determinado en la
1. La dificultad de producir imágenes con tierra (resolución espectral), mientras que
información espectral precisa a la vez que el objeto es una combinación de píxeles
espacialmente detallada. Hay que buscar contiguos, con atributos adicionales
un compromiso entre ambas resoluciones como: textura, forma, etc. El objeto
a la hora de diseñar sensores de también tiene un borde con una forma
teledetección. determinada.
3
todas ellas es su limitación práctica a Generación de Objetos
casos muy concretos. Algunos algoritmos
por ejemplo se especializan en identificar Segmentación
células en imágenes de microscopio, otros
sobresalen en el reconocimiento de
caracteres, pero ninguno ofrece una Generación
Vectorización
solución genérica al problema de De Objetos
segmentación de imágenes digitales.
4.1. SEGMENTACION
4
número finito de regiones que tienen escala a la cual la segmentación es óptima
significado geoespacial. para cada situación e imagen. Este
algoritmo está en estos momentos en
Veamos con más detalle los pasos proceso de ser patentado.
necesarios para realizar un proceso de
segmentación de imagen: Otra ventaja de este algoritmo es su
relativa rapidez, lo cual permite
implementar una herramienta de
Imagen Segmentación
Original Multi-Escala previsualización que permite afinar los
parámetros de segmentación a medida
que ésta se va calculando. Esto aumenta
Imagen de forma significativa la utilidad del
Etiquetada
proceso completo, proporcionando
resultados inmediatos a medida que se
trabaja con los parámetros.
Anexado Selección
De Regiones De Umbrales
Los dos errores que se pueden cometer al
no escoger un valor acertado de escala de
Imagen Imagen segmentación son sub-segmentación
Etiquetada Etiquetada (pocos segmentos encontrados) y sobre-
Refinada Refinada
segmentación (más segmentos que los
Figura 2: Pasos intermedios del proceso de
segmentación necesarios). En nuestro procedimiento, se
recomienda forzar el primer paso con una
El algoritmo de segmentación cierta sobre-segmentación que será luego
“watershed” se puede entender compensada con dos técnicas de refinado
imaginando una imagen como una de segmentos.
superficie topológica donde cada valor de
píxel representa una elevación. La imagen El algoritmo de anexado de regiones
tendrá mínimos locales hacia los cuales “Full Lambda Schedule” representa una
convergería proveniente de píxeles manera muy eficiente de mejorar el
circundantes. Estas regiones son el problema de sobre-segmentación.
resultado de la segmentación, Inicialmente desarrollado por Robinsin,
representadas por los bordes entre ellas Redding y Crisp para la segmentación de
[4]. imágenes de radar de apertura sintética
(SAR), el algoritmo mezcla de manera
En ITT VIS implementamos una versión interactiva regiones vecinas,
modificada del algoritmo de considerando para ello todos los pares
segmentación watershed multi-escala. posibles de regiones, hasta conseguir un
Ajustando dicho parámetro de escala, el resultado teóricamente óptimo [3].
usuario puede definir la resolución o
5
El único parámetro controlable en este mientras que el resto será combinado en
paso es el grado de anexado, que varía una o varias regiones de fondo.
entre 0.0 (ninguna región es anexada) a
100.0 (todas las regiones se combinan en Se ha observado en repetidas casos que el
una sola). Es destacable que en este paso, primer método de refinamiento funciona
la velocidad de ejecución del algoritmo mejor en problemas de sobre-
también permitió la implementación de segmentación provocados por zonas de
una herramienta de previsualización, de texturas muy variables, como vegetación
inestimable ayuda para el operador. o nubes. El segundo método es mejor
cuando se desean extraer objetos
Conviene destacar que el algoritmo de específicos como aviones o edificios.
watershed se centra en la selección de
bordes entre segmentos, mientras que el 4.2. VECTORIZACION
Full-Lambda Scheduling se centra en el
análisis de cada región individual. El siguiente paso es la generación de los
Combinando ambos en un procedimiento objetos, propiamente definidos como
interactivo, se consigue una metodología vectores con una serie de atributos
robusta que combina las ventajas de cada asociados.
técnica.
Imagen Conversión
El segundo método de corrección de Etiquetada Raster a Vector
sobre-segmentaciones se denomina
“Selección de Umbral”. Utilizado como Shapefile
método de afinado alternativo y
complementario al mismo tiempo al
Suavizado
algoritmo Full Lambda Schedule, este Douglas Peuker
algoritmo permite refinar un resultado de
segmentación separando el fondo de la Shapefile
imagen de los objetos de interés. Para Suavizado
ello, se utiliza el histograma del nivel Imagen
Etiquetada
digital de cada segmento (correspondiente Cálculo De
Atributos
al nivel digital medio de los píxeles Imagen
contenido en él) a partir del cual el Original
6
Estos atributos se pueden agrupar en tres Definición De
clases: Características
7
producirán los mejores resultados para 6. CONCLUSIONES
clasificar objetos son Support Vector
Machine (SVM) y K-Nearest Neighbor Este artículo describe el funcionamiento
(k-NN). La razón es que estos dos básico y ventajas de un procedimiento de
algoritmos son buenos cuando los valores clasificación de imágenes de
a clasificar son de naturaleza teledetección tomando como elemento
completamente diferente, como es el caso básico el concepto de objeto, en vez de el
de atributos de los objetos generados en la píxel.
segmentación. Por ejemplo, valores de
texturas tendrán un rango completamente La literatura técnica presenta una buena
diferente que los de perímetro, cantidad de métodos que intentan
elongación, o simplemente valores segmentar una imagen digital en áreas
espectrales medios del objeto. que tienen significado semántico para el
observador. Dicha significancia está
El algoritmo SVM tiene sus bases en la íntimamente ligada a la aplicación
teoría de aprendizaje estadístico. Separa concreta y al objeto de estudio de dicha
los resultados con una superficie de imagen.
decisión (llamada hiperplano óptimo) que
maximiza la distancia entre clases [7]. El Ante la limitación de que ningún
algoritmo K-Nearest Neighbor extrae un algoritmo por sí sólo resulta óptimo en
vector de características por cada objeto, todas las situaciones, el uso de un
con el cual se calcula una serie de procedimiento interactivo de varias fases
distancias euclídeas al vector proporciona la robustez y flexibilidad
representativo de cada clase [5]. necesaria para obtener resultados
altamente satisfactorios en una mayor
La clasificación basada en reglas en una parte de los casos.
técnica poderosa para la clasificación de
objetos. Según esta metodología, el La clasificación por objetos no pretende
usuario define características y construye sustituir completamente a la clasificación
reglas para cada una de las clases, basada en firmas espectrales de píxeles
basadas en los atributos de los objetos. individuales. Existen aplicaciones como
Por ejemplo, el usuario será capaz de la exploración minera donde el uso de
definir un edificio como un objeto de un tecnología hiperespectral sigue siendo
tamaño determinado, con un color claramente superior. Ambas técnicas de
establecido y una forma más o menos clasificación son evidentemente
cuadrada. Es una forma poderosa de complementarias.
poder utilizar la intuición y experiencia
humana aplicadas a la resolución del En el momento de escribir este artículo,
problema de clasificación de objetos. los ingenieros de ITT Visual Information
8
Solutions están terminando de
implementar los últimos bloques de lo
que será el nuevo software ENVI FX
(Feature eXtraction) para clasificación de
imágenes por objetos. Creemos que
hemos encontrado un balance muy
interesante entre precisión, facilidad de
uso y sofisticación para resolver
problemas de segmentación de imágenes
satelitales.
REFERENCIAS
[1] Padwick, C. et. al., “Spatial Feature
Extraction R&D Final Report”, October 2006,
ITT Visual Information Solutions, Boulder,
Colorado, USA.