Вы находитесь на странице: 1из 15

CLASIFICACIN DIGITAL DE IMGENES POR SATLITE

3 ITT.SE Sistemas de Telemedida lvaro Ybenes Gmez lvaro Giner Sotos

NDICE:
1. Introduccin terica a la clasificacin digital.
1.1 Fase de Entrenamiento.
1.1.1 1.1.2 Mtodo supervisado. Mtodo no supervisado.

1.2 Fase de Asignacin.


1.2.1 1.2.2 1.2.3 1.2.4 Clasificador de mnima distancia. Clasificador de paraleleppedos. Clasificador de mxima probabilidad. Otros criterios de clasificacin.

2. Realizacin de la prctica.
2.1 Introduccin. 2.2 Fase de entrenamiento: Programa STAD.EXE 2.3 Fase de clasificacin: algoritmo de mnima distancia. 2.4 Conclusiones.

Foto portada: satlite QuickSCAT de la NASA Fuente: http://www.allmetsat.com/es/

1.- INTRODUCCIN TERICA A LA CLASIFICACIN DIGITAL


La clasificacin de una imagen digital consiste en categorizar una imagen multibanda. Se pasa de tener unos ND continuos medidos por los sensores a una escala nominal o categrica de manera que cada pxel pertenece a una categora definida previamente. El ND de un pxel clasificado es, en definitiva, el identificador de la clase o categora en la que se haya incluido. Estas clases pueden describir distintos tipos de cubiertas (variable nominal o categrica) o bien intervalos de una misma categora de inters (variable ordinal). Un ejemplo del primer tipo sera una clasificacin de distintos tipos de cubierta vegetal, en cambio uno del segundo tipo sera un intento de clasificar distintos niveles de dao producidos por un incendio. Los primeros intentos de clasificacin digital se basaban exclusivamente en los ND de la imagen que son una traduccin digital de un flujo energtico recibido por un sensor para una determinada banda del espectro. Este tipo de clasificacin tiene como inconveniente que no siempre permite separar cubiertas, ya que pueden existir distintas categoras temticas que tengan un comportamiento espectral similar. En estos casos es conveniente. La clasificacin digital de imgenes es , en cierta medida , parecida a la fotointerpretacin. En este mtodo, se identifica el patrn visual asociado a cada cubierta (categora) de acuerdo a una serie de parmetros como son el tono, la textura, la forma, el contexto, la disposicin, etc. y despus se identifican sobre las fotografas las superficies correspondientes a estas categoras, mediante su semejanza con el patrn-tipo previamente identificado. Por ltimo es necesaria una verificacin de los resultados. En las tcnicas digitales de clasificacin de imgenes se dan estos mismos pasos. De esta forma se distingue entre las siguientes fases: 1. Definicin digital de las categoras (fase de entrenamiento). 2. Agrupacin de los pxeles de la imagen en una de las categoras previamente definidas (fase de asignacin). 3. Comprobacin y verificacin de los resultados.

1.1 Fase de entrenamiento.


La clasificacin digital comienza con la definicin de las categoras que se pretenden distinguir en la imagen. Se trata de una clasificacin basada en los valores numricos. Por lo tanto se trata de obtener el rango de ND que identifica a cada categora para todas las bandas que intervienen en la clasificacin. Las distintas categoras no se definen solo por un ND sino por un conjunto de ND prximos entre s. Existe una cierta dispersin en torno al ND medio de cada categora. Por esto la fase de entrenamiento trata de definir con rigor cada una de las categoras que se pretenden distinguir teniendo en cuenta su dispersin en la zona de estudio. Esto se consigue seleccionando una muestra de pxeles en la imagen que representen adecuadamente a cada categora. A partir de estos se determina el ND medio de cada clase y el rango en el que varan, para todas las bandas que intervienen en la clasificacin. Las estimaciones posteriores se basan sobre la muestra seleccionada por lo cual conviene seleccionarla adecuadamente ya que los resultados de la clasificacin estn mucho ms influidos por la definicin previa de las categoras, que por el criterio por el cual stas son diferenciadas en la imagen. Los mtodos de clasificacin se pueden distinguir en dos grupos: supervisado y no supervisado. El mtodo supervisado parte de un conocimiento previo del terreno del cual se seleccionan las muestras para cada una de las diferentes categoras. En cambio, en el mtodo no supervisado se buscan automticamente grupos de valores espectrales homogneos en la imagen para que despus el usuario intente encontrar las correspondencias entre esos grupos seleccionados automticamente y las categoras que le puedan ser de inters. A propsito de esto, es necesario distinguir entre los dos tipos de clases que pueden intervenir en la clasificacin temtica: informacionales y espectrales. Las clases informacionales se establecen por el usuario y forman la leyenda de trabajo que se intenta discriminar. Las segundas corresponden a grupos de valores espectrales homogneos

(reflectividad similar) y se deducen de los ND de la imagen. Idealmente se debera producir una correspondencia perfecta entre una sola clase informacional, es decir , una sola clase de cobertura y una sola clase espectral pero esto es muy poco corriente y lo ms normal es que se produzca una de las siguientes situaciones: I. Puede ocurrir que una categora informacional este expresada en varias categoras espectrales. Por ejemplo, un bosque de pinos podra aparecer en dos clases espectrales: uno correspondiente a solana y otro a umbra. Para solucionar este problema hay que definir correctamente la dispersin espectral de cada clase perfeccionando el muestreo. II. Otro caso sera que dos o ms clases informacionales compartan una sola clase espectral. Se podra solucionar fundiendo las dos categoras en una ms general. Por ejemplo se podra elegir una clase denominada conferas en lugar de distinguir entre distintos tipos de pinar, o urbana, frente a distintas densidades de edificacin. En caso de no poder fundir las dos categoras en una sola debido a su heterogeneidad se podra analizar una imagen de otra fecha del ao en la cual la confusin sea evitable.

Fig. 1 Relaciones entre clases informacionales y espectrales: I una informacional-varias espectrales; II una espectralvarias informacionales; III mezcla de ambas; IV relacin biunvoca entre ellas.

III. Tambin puede ocurrir que varias clases informacionales compartan varias clases espectrales. En este caso se debe replantear la estrategia de trabajo o probar alguna de las soluciones comentadas anteriormente. Una vez expuesto esto, podemos afirmar que el mtodo de entrenamiento supervisado pretende distinguir clases informacionales, mientras que el no supervisado trata de diferenciar las clases espectrales. Ninguno de los dos mtodos es perfecto ya que en el mtodo supervisado se puede forzar al ordenador a diferenciar categoras sin un claro significado espectral; y en el mtodo no supervisado se pueden distinguir clases que no contengan una informacin de inters.

1.1.1 Mtodo supervisado. Este mtodo de entrenamiento requiere un cierto conocimiento de la zona de estudio que permite delimitar sobre la imagen unas zonas o reas representativas de las distintas categoras que se pretenden discriminar. Estas reas se conocen como training fields (reas de entrenamiento) ya que sirven para entrenar al ordenador para que pueda reconocer las distintas categoras. A partir de estas reas el ordenador calcula diversos parmetros estadsticos de los ND que definen cada clase, para luego clasificar el resto de pxeles en una categora determinada atendiendo a sus ND. Resulta adecuado seleccionar varias reas de entrenamiento por clase para reflejar correctamente su variabilidad en la zona de estudio. Una vez acabada la seleccin de las reas de entrenamiento , el ordenador debe proceder a calcular las estadsticas elementales de cada categora: media , rango, desviacin tpica , matriz de varianza covarianza, etc., a partir de los ND de todos los pxeles incluidos en el rea de entrenamiento de dicha clase. Este clculo es aplicado a cada banda espectral. Las medidas extradas a partir de los ND de cada rea de entrenamiento definen a cada clase, por lo tanto es muy importante su correcta seleccin ya que de otro modo se forzara al ordenador a clasificar reas heterogneas.

Un sencillo ejemplo ilustra lo descrito anteriormente. Disponemos de una imagen en la que se desean distinguir 3 clases: viedo, campos de cereales y encinar. La primera opcin a la hora de definir reas de entrenamiento sera seleccionar una por cada categora. A partir de estas reas de entrenamiento, el ordenador calculara una serie de parmetros estadsticos que seran los que definiran a esa determinada clase. La seleccin de reas de entrenamientos sera incorrecta si alguna de estas se situara entre dos o ms categoras ya que al tratarse de un rea heterognea, sus medidas estadsticas seran una cierta media entre las distintas clases. Otro error que se podra cometer sera seleccionar nicamente como reas de entrenamiento aquellas zonas de la cubierta donde esta sea muy homognea ya que entonces estaramos dejando pasar la variacin real que tenga dicha cubierta. Por ejemplo, al clasificar el encinar deberamos seleccionar como reas de entrenamiento tanto zonas donde el encinar aparezca con una densidad mayor como zonas donde la densidad sea menor. Respecto al tamao que deben tener las reas de entrenamiento, se requiere que tengan un tamao de m + 1 pxeles por categora, siendo m el numero de bandas espectrales que intervienen en la clasificacin. Es conveniente de todos modos superar ampliamente este mnimo. Adems, es mejor elegir varias reas de pequeo tamao que una sola de mayores dimensiones. Otros mtodos que se pueden utilizar son seleccionar pxeles aislados de cada categora o sealar pxeles puros en torno a los cuales el ordenador crea una parcela de modo automtico en funcin de la distancia o la similitud espectral (o ambas) de los pxeles vecinos del inicialmente seleccionado.

1.1.2 Mtodo no supervisado. Este mtodo de clasificacin trata de definir las clases espectrales presentes en la Imagen. No implica ningn conocimiento previo del rea de estudio por lo que la intervencin humana se centra en la interpretacin de los resultados. Este mtodo asume que los ND de la imagen se agrupan en una serie de conglomerados (o clusters) que se corresponden con grupos de pxeles con un 7

comportamiento espectral homogneo y que, por ello, deberan definir unas clases informacionales de inters. Por desgracia estas clases espectrales no pueden ser asimiladas siempre a las categoras temticas que el usuario pretende deducir por lo que es labor de ste interpretar el significado temtico de dichas categoras espectrales. El mtodo para definir los grupos con un comportamiento espectral similar es muy parecido a otras tcnicas de clasificacin automtica de datos. Se basa en la seleccin de tres parmetros: variables que intervienen en el anlisis, criterio para medir la distancia o similitud entre casos, y un criterio para agrupar los casos similares. En nuestro, caso las variables seran las diferentes bandas espectrales. Los casos son los pxeles que componen la imagen y cada uno de ellos esta definido por tantos ND como bandas tengamos. Lo que trata este mtodo es encontrar grupos de pxeles con ND parecidos para asignarlos a alguna de las categoras temticas que deseemos. La delimitacin de cada grupo espectral se inicia sealando dos criterios: uno que marque la similitud entre pxeles, y otro que marque las condiciones del proceso de agrupamiento. Para el primero, el mtodo ms utilizado se basa en la distancia euclidea aunque se pueden utilizar otros criterios como el de la distancia media o la de Mahalanobis. En cuanto al algoritmo de agrupamiento, el ms extendido es el denominado ISODATA.

1.2 Fase de asignacin.


En este momento vamos a exponer los principales algoritmos de clasificacin. Desde un punto de vista estadstico, todos los algoritmos definen un rea de dominio de cada clase en torno a su centro mediante un conjunto de funciones. Un determinado pxel ser asignado a una clase si sus ND se encuentran dentro de los lmites establecidos para dicha clase.

1.2.1 - Clasificador de mnima distancia. El criterio ms sencillo para clasificar un pxel en una categora es incluirlo en la ms cercana a l, es decir, en aquella que minimice la distancia entre ese pxel y el centroide de clase. Esta distancia no es una distancia geogrfica sino espectral consecuencia de comparar los ND de cada pxel con los del centro de las distintas categoras, para todas las bandas que intervienen en el anlisis. Existen varias formas de medir esta distancia espectral entre pxeles y clases pero la ms empleada es la distancia euclidea:

(k ) = d ij
donde k=1,2,3,...,N clases

N bands n =1

n (k ) 2 X X ( ij ij )

(distancia Euclidea)

n Siendo X ij (n = 1,2,3,..., N bandas ) el valor de cada pxel en la banda n, y X (nk ) el valor

del centroide (media aritmtica) de la clase k en la banda n. Los subndices (i,j) corresponden al nmero de fila y nmero de columna en cada pxel de la imagen. Una vez determinadas las distancias a cada clase, se toma la mnima de todas ellas, y se asigna el pxel correspondiente a la clase ms prxima (es decir, a la clase para la cual la distancia es menor).
(k ) = mnimo} clase (i, j ) = {k | d ij

Este algoritmo es relativamente rpido de ejecutar y ofrece buenos resultados cuando no exista un gran solape entre clases. Adems, no deja ningn pxel sin clasificar puesto que siempre existe una clase ms cercana.

1.2.2 Clasificador de paraleleppedos. En este mtodo, el usuario fija un rea de dominio para cada categora teniendo en cuenta sus valores de centralidad y dispersin. Posteriormente cada pxel ser asignado a una clase si sus ND estn dentro del rea de dominio de esa clase, para todas las bandas que intervienen en la clasificacin. El pxel x ser asignado a la clase A si sus ND en las distintas bandas (ND x,k) estn incluidos en el rea de dominio de esa clase:

N D A,n R A,n NDx ,n N D A,n + R A,n


para todo n=1,2,3,...,N bandas RA,n = rango de dispersin sealado para la categora A en cada banda n.

Fig. 2 Clasificador de paraleleppedos. En esta figura se observan algunos de los problemas de este algoritmo: el pxel P1 queda clasificado sin problemas en la clase C1; sin embargo el pxel P2 no est encuadrado en ningn rea de dominio por lo que quedar como no clasificado. El pxel P3 se encuentra en una zona de solape entre el dominio de dos categoras por lo que podr asignarse aleatoriamente a dos categoras distintas.

10

Este algoritmo es muy rpido de ejecutar ya que solamente necesita operadores condicionales del tipo IF... THEN. Pero presenta ciertos problemas inherentes al diseo de las reas de dominio ya que pueden existir ciertos pxeles que queden sin clasificar y otros que se encuentren en zonas comunes a dos o ms categoras. En este ltimo caso el ordenador asignar este pxel a la clase que se encuentre antes en el algoritmo de clasificacin, aunque se puede utilizar conjuntamente el algoritmo de mnima distancia para evitar el solape. La solucin para los pxeles sin clasificar es ampliar el rango de dispersin y repasar la definicin espectral de las categoras ya que la presencia de pxeles no clasificados indica que las clases no estn bien definidas o no incluidas en la leyenda de trabajo.

1.2.3 Clasificador de mxima probabilidad. Este mtodo considera que los ND de cada categora se ajustan a una distribucin normal. Esto nos permite describir esa categora por una funcin de probabilidad, a partir de su vector de medias y matriz de varianza-covarianza. As podemos calcular la probabilidad de que un determinado pxel pertenezca a una categora; el clculo se realiza para todas las categoras definidas y el pxel se clasifica en clase a la cual tenga ms probabilidad de pertenecer. Este clasificador es el ms complejo y, por lo tanto, el que mayor volumen de clculo requiere, pero es el ms robusto y fiable ya que se ajusta fielmente a la distribucin original de los datos. Para calcular la probabilidad asociada a un cierto ND se necesita la media y la desviacin tpica de cada categora. En el caso de trabajar con una sola banda la probabilidad se calcula de la siguiente forma:

p( x / A) =

1
2 2 A

e {( NDx NDA )

2 / 2 A

p(x/A) =probabilidad de que un cierto pxel x (definido por ND x) pertenezca a la clase A, N D A = media de la clase A 11

2 = varianza de la clase A A

Una vez determinada la probabilidad para todas las categoras el pxel ser asignado a la clase A, slo si:

p(x A) p(x B )
AB , con B = 1,2,3,...,m; m = nmero de categoras Para el caso de dos bandas, los lmites de las categoras tienen una forma elipsoidal (Fig. 3). Cada una de estas elipses es una lnea de isoprobabilidad , es decir todos sus puntos tienen la misma probabilidad de pertenecer a la categora asociada.

Fig. 3 : Extensin a dos bandas del algoritmo de mxima probabilidad

Con ms de dos bandas resulta imposible representar grficamente este criterio de clasificacin y se debe extender la frmula de la probabilidad. Una vez que el ordenador haya asignado los pxeles puede establecerse algn criterio que permita asignarlos a una clase slo si la probabilidad correspondiente es superior a determinado umbral. Este criterio asume que las categoras presentan una distribucin normal; sin embargo, la hiptesis de que los datos de reflectividad siguen una distribucin normal no siempre se cumple y debera verificarse siempre.

12

1.2.4 Otros criterios de clasificacin. A continuacin se exponen brevemente otros clasificadores: Clasificador en rbol: suponen un anlisis exhaustivo de las respuestas espectrales de las clases y del conjunto de datos disponibles, consiste en ir haciendo preguntas a cada pxel cuya respuesta positiva o negativa conducir a otra pregunta y as sucesivamente hasta obtener la clase a la que pertenece. Se basa en los mismos principios que los sistemas expertos. Clasificador de contexto espacial: todos los mtodos estudiados hasta ahora utilizan, para clasificar un pixel, slo los valores de reflectividad recogidos en dicho pixel. Este hecho no es demasiado problemtico si el tamao de pixel es mayor que los elementos que los diferentes elementos fsicos que componen el paisaje. Sin embargo si el tamao del pixel es ms pequeo que las unidades de paisaje podra utilizarse la informacin de los pixels de alrededor para estimar la pertenencia a una clase o confirmar la estimacin. Puede resultar un mtodo til en combinacin con el de mxima probabilidad ya que permite incluir la informacin de los pixels circundantes para tomar una decisin en caso de que las probabilidades para dos clases sean similares o no exista una clase con probabilidades de pertenencia suficientemente altas. Se trata de incorporar otras fuentes de informacin distintas a las bandas para la clasificacin. Entre esta informacin estara la altitud, pendiente, litologa, etc. Las distintas formaciones vegetales tienen mayor capacidad para desarrollarse en determinados entornos definidos en parte por estas variables. Por tanto puede ser til establecer cual es la formacin vegetal con mayor probabilidad de desarrollarse en un determinado pixel (en funcin de topografa y litologa) y combinar esta informacin con la de las bandas. Clasificacin borrosa: los mtodos anteriormente expuestos consideran que un pxel solamente puede pertenecer a una determinada clase. Por ejemplo, en el clasificador de mxima probabilidad, un pxel es clasificado en la clase ms probable; da lo mismo que la pertenencia a esta clase sea mucho mayor que al 13

resto (90% frente a un 10%) o que la diferencia sea menor (55 frente a 45). En el primer caso se estara cometiendo un error muy bajo al clasificar el pxel, en cambio en el segundo la asignacin sera muy arriesgada. En estos casos tiene ms sentido no clasificar los pixels de forma unvoca sino establecer cual es su posibilidad de pertenencia a cada una de las clases (el concepto de posibilidad no es exactamente igual al de probabilidad). El pxel ahora no pertenece a una sola clase totalmente sino que tiene distintos grados de pertenencia comprendidos entre 0 y 1, lo que permite una asignacin simultanea a varias categoras. Clasificadores basados en redes neuronales: se basan en el uso de redes neuronales artificiales que, se supone, imitan a las redes neuronales reales en el desarrollo de tareas de aprendizaje. Una neurona artificial es un objeto lgico (se trata de software no de hardware) que recibe diversas entradas, hace una suma ponderada de las mismas y produce una salida a partir de la aplicacin de una funcin umbral a la media ponderada. Si conectamos las salidas de unas neuronas como entradas de otras obtenemos una red neuronal. Uno de los ejemplos ms tpicos de red neuronal es la Back Propagation Neural Network que aparece en el siguiente grfico.

Fig. 4: Red neuronal BPN

Consta de una capa de entrada con tantos neuronas como variables de entrada se vayan a introducir en el modelo (en el caso de la teledeteccin sera una por cada banda utilizada para clasificar), una capa oculta que realiza la mayor parte del clculo y una capa de salida con tantas neuronas como posibles clases existan. En teledeteccin esta salida suele consistir en un valor numrico entre 0 y 1 para cada

14

clase, cuanto mayor sea este valor ms verosimil resulta que el pixel pertenezca a la clase en cuestin Para trabajar con una red neuronal existen varias fases:

Entrenamiento. Se le introducen a la red la respuesta espectral de pixeles cuya clase se conoce y se compara la salida con la realidad. A partir de esta comparacin se modifican los coeficientes de ponderacin de todas las neuronas para que se obtenga la respuesta adecuada (se trata de un procedimiento automtico) es decir un 1 en la clase correcta y ceros en las incorrectas

Estabilizacin. Al principio del entrenamiento, los factores de ponderacin cambian muy deprisa, pero conforme este se desarrolla (y si las areas de entrenamiento se han seleccionado correctamente) se estabilizan (no se modifican aunque se vuelvan a introducir los pixels de entrenamiento). En este momento finaliza la fase de entrenamiento

Clasificacin Se introducen las respuestas espectrales de los pixels cuya clase no se conoce y se adjudican a la clase que de una respuesta ms alta (que no va a ser necesariamente 1).

Se trata en definitiva de un mtodo de clasificacin robusto que da buenos resultados cuando las respuestas espectrales de las clases no siguen una distribucin normal. La clave est en el conjunto de coeficientes de ponderacin que constituyen un conjunto de parmetros que deben ajustarse a unos datos de entrada y salida. Por tanto en cierto modo es equivalente a una regresin.

15

Вам также может понравиться