Вы находитесь на странице: 1из 12

Captulo II: Procesamiento Digital de Imgenes

8

CAPTULO 2
PROCESAMIENTO DIGITAL DE IMGENES

En este captulo se presentan de manera breve, una explicacin de la visin, las
imgenes digitales y como son capturadas por medios electrnicos, el campo
encargado del procesado digital de imgenes (DIP) y las tcnicas de DIP utilizadas en
este trabajo. As mismo se presentan los fundamentos de la morfologa matemtica y
las tcnicas ms comunes utilizadas con operadores morfolgicos. Por ltimo se
detallan dos tcnicas consideradas para la comparacin del mtodo propuesto, la
transformacin Top-Hat y el filtro gaussiano de desvanecimiento.

2.1 Introduccin
Basndose en que una seal de video es una secuencia de imgenes estticas se
determina que es posible realizar un anlisis de una seal de video al procesar una
cierta cantidad de imgenes estticas en un intervalo de tiempo.
Las imgenes pueden ser digitalmente analizadas ya sea por tcnicas de
procesamiento digital de imgenes (DIP) o con teora de conjuntos, denominada
morfologa matemtica. Ambas herramientas son un campo muy amplio de estudio y se
presentan simplemente los fundamentos de ambas teoras, as como las operaciones que
fueron utilizadas en el presente trabajo, sin embargo las capacidades de ambos mtodos
son muy extensas para ser cubiertas en esta tesis.
Se determina que para comparar el mtodo propuesto se debe realizar un
anlisis similar al propuesto pero con dos tcnicas diferentes de anlisis de imgenes.
La primera de ellas es una tcnica DIP, un filtro gaussiano pasa-bajas o tambin
conocido como filtro gaussiano de suavizado y la otra tcnica que se estableci es la
Captulo II: Procesamiento Digital de Imgenes
9

transformada Top-Hat, una transformacin morfolgica que resalta las secciones ms
intensas en una imagen binaria. El uso de tanto tcnicas DIP como transformaciones
morfolgicas determinar las ventajas y desventajas de cada mtodo.

2.2 Visin, imgenes y video
El ojo humano es sensible nicamente a la radiacin contenida en una pequea banda
de frecuencias del espectro electromagntico (desde 380 nm hasta 780 nm) y los
colores son representados por una longitud de onda dentro de este rango. Para la
percepcin de los colores, el ojo humano presenta dos tipos de sensores que son
denominados las clulas foto-receptoras. Estas clulas se dividen en conos y bastones,
los primeros de ellos son sensibles en diferentes proporciones a los colores, rojo 65%,
verde 33% y azul 2%, mientras que los bastones tienen una respuesta espectral menos
selectiva pero ms sensible, como es el caso de la visin nocturna. De esta forma el ojo
humano percibe los estmulos de los 3 colores por accin de los conos que actan como
un banco de filtros de los estmulos que llegan al ojo humano y la sensacin de color es
la respuesta aditiva de estas 3 seales [ALBA06].
Una imagen es la representacin visual de un objeto y est definida como una
funcin bidimensional f (x, y), donde x y y son coordenadas espaciales y la
amplitud f en un par de coordenadas (x, y) se llama la intensidad o nivel de gris de la
imagen en ese punto. Cuando los valores de x y y, as como la amplitud f son
cantidades finitas y discretas se habla de una imagen digital (2.1).

(
(
(
(

=
) 1 , 1 ( ) 1 , 1 ( ) 0 , 1 (
) 1 , 1 ( ) 1 , 1 ( ) 0 , 1 (
) 1 , 0 ( ) 1 , 0 ( ) 0 , 0 (
) , (
N M f M f M f
N f f f
N f f f
y x f
K
M O M M
K
K

(2.1)
Captulo II: Procesamiento Digital de Imgenes
10

En donde el lado izquierdo de la ecuacin denota una imagen digital por
definicin, mientras que en el lado derecho de la ecuacin encontramos que cada uno
de los elementos de la imagen y estos se definen como un elemento de la imagen o
un pixel. La notacin de coordenadas que se utiliza en la mayora de los libros
[GONZ02], y la aceptada para este trabajo, es la mostrada en la ecuacin (2.1), en
donde la imagen contiene M filas y N columnas determinando el origen como el punto
f(0,0).
El proceso de digitalizacin de una imagen consiste en la adquisicin que
normalmente es realizada por cmaras digitales basadas en sensores CCD o CMOS.
Una vez que se adquiere la imagen ocurre el proceso de digitalizacin en el cual se
muestrea (discretizacin espacial) y se cuantifica (discretizacin en amplitud) la seal
analgica. Este muestreo y cuantificacin limitan la resolucin y calidad de la imagen
respectivamente.
El ojo humano retiene una imagen aproximadamente 1/16 de segundo cuando
capta una imagen, de tal manera que si varas imgenes secuenciales son presentadas al
ojo humano en un intervalo de tiempo adecuado (entre 15 y 50 imgenes por segundo
evitan el parpadeo y la discontinuidad en secuencias de video), el cerebro las asocia
como una sola imagen en movimiento. Dado que una seal de video corresponde a una
secuencia de imgenes estticas, es posible realizar el procesamiento de una seal de
video mediante el procesamiento de una cierta cantidad de imgenes de la seal por
segundo.

2.3 Procesado digital de imgenes
El campo que se encarga del procesado de las imgenes digitales por medios de una
computadora digital es el procesado digital de imgenes. La mayor parte de las tcnicas
Captulo II: Procesamiento Digital de Imgenes
11

DIP actan tratando a la imagen como una seal de 2 dimensiones (2D) y despus
aplicando tcnicas estndar de procesamiento de seales de una dimensin (1D).
Dentro de las operaciones ms comunes de procesamiento encontramos
transformaciones geomtricas (reduccin, rotacin, alargamiento), correcciones de
color (ajustes de brillo y contraste), alineacin de imgenes, segmentacin,
interpolacin, reconocimiento de patrones o caractersticas en una imagen, etc.
El desarrollo de tecnologa en los campos de adquisicin de imgenes y
sistemas de cmputo ms eficientes, han logrado que las aplicaciones del DIP se
extiendan a muy diversas reas como lo son aplicaciones mdicas, monitoreo remoto,
reconocimiento de objetos, visin por computadora, manipulacin de fotografas,
aplicaciones militares, etc.

2.4 Interpolacin bicbica
La interpolacin es el proceso de estimar valores intermedios en un evento continuo a
partir de muestras discretas. Este mtodo es ampliamente utilizado en DIP para
aumentar o reducir imgenes y tambin para corregir distorsiones geomtricas.
El algoritmo de interpolacin bicbica propuesto por [KEY81] es uno de los
ms utilizados an hoy en da, debido a su bajo costo computacional y los resultados
que se obtienen en comparacin con la interpolacin bilineal y la interpolacin del
vecino ms prximo [THE00]. Este mtodo estima un pixel analizando la vecindad de
4 x 4 alrededor de l mediante un algoritmo de polinomios cbicos definidos en sub-
intervalos, tal como se muestra en (2.2) en donde u(s) es la funcin ncleo o kernel
de la interpolacin bicbica.

Captulo II: Procesamiento Digital de Imgenes
12

<
< < + +
< < + +
=
s
s s s s
s s s
s u
2 0
2 1 2 4
2
5
2
1
1 0 1
2
5
2
3
) (
2 3
2 3

(2.2)

2.5 Tipos de imgenes
2.5.1 Imgenes RGB
Una imagen RGB se define como un arreglo de 3 x M x N pixeles donde cada pixel
corresponde a los componentes rojo, verde y azul de una imagen de color (R-red, G-
green, B-blue). El propsito principal del modelo RGB es el sensado, representacin y
muestra de imgenes en aparatos electrnicos tal como televisores, computadoras,
celulares, etc.
El modelo RGB puede verse como una pila de 3 imgenes en escala de
intensidades que al ser mostrados por un monitor de color (el cual presenta 3 entradas
de color, rojo, verde y azul) representan una imagen de color tal como la percibe un ser
humano. Los colores, rojo, verde y azul son conocidos como los colores primarios, y la
combinacin de estos en diferentes intensidades produce los colores del espectro
humano visible.

2.5.2 Imgenes en escala de intensidades
Una escala de intensidades es tambin conocida como escala de grises o escala
monocromtica, y para una imagen digital se trata de una sola matriz de M x N valores
en donde cada pixel es una sola muestra que contiene la informacin de la intensidad de
la imagen.
Captulo II: Procesamiento Digital de Imgenes
13

Las 3 caractersticas con que se puede definir un color son el tono o matiz (color
actual), el valor (luminosidad u oscurecimiento) y la saturacin (pureza del color). Por
lo tanto la conversin de una imagen de color a una imagen en escala de grises no se
realiza de una forma nica, sin embargo en su acercamiento ms comn [POS90], se
trata de retener la informacin de la luminosidad y descartar los valores de tono y
saturacin. Asumiendo que los colores, rojo, verde y azul son seales de luminosidad,
la aproximacin de una imagen en escala de grises a partir de una imagen de color est
dada por (2.3) en donde 0 es el valor de menos intensidad, refirindose al color negro y
1 es el valor de mayor luminosidad o el color blanco.

) 11 . 0 ( ) 59 . 0 ( ) 30 . 0 ( B G R GRAY + + =

(2.3)

2.5.3 Imgenes indexadas
Esta es una forma prctica, pero limitada, de representar imgenes en color. Una
imagen indexada almacena una imagen como dos matrices. La primera de ellas tiene el
mismo tamao que la imagen y un nmero para cada pixel. La segunda matriz se
denomina mapa de color y su tamao corresponde al nmero de colores que se desea
que tenga la nueva imagen. Esta tcnica es utilizada para ahorrar memoria de la
computadora, comprimir imgenes y lograr una mejora en el tiempo de muestra
display. La informacin de la imagen pasa de estar guardada en las 3 x M x N
matrices que comnmente se utilizan en el formato RGB a solamente 1 x M x N
matrices de la informacin de la imagen y una matriz de m x 3, en donde m es el
nmero de colores del mapa de color que se desea utilizar [GONZ02].
Las ventajas de utilizar esta tcnica no slo se limitan el ahorro de memoria,
compresin de imgenes y mejora de tiempos de transmisin o muestra de imgenes en
Captulo II: Procesamiento Digital de Imgenes
14

color, si no que puede drsele un enfoque a ciertas aplicaciones como el caso de esta
tesis, en donde se requiere eliminar los detalles de una imagen, que se logra reduciendo
el nmero de tonos del mapa de color para agrupar todos los tonos que estn dentro de
un rango haca un solo color definido. De esta forma aunque normalmente el limitado
nmero de tonos de un mapa de color es una desventaja en el caso de este trabajo se
utiliza como una herramienta en el algoritmo de deteccin de columnas de humo.

2.6 Operaciones morfolgicas
En esta seccin se expone una descripcin bsica de las operaciones morfolgicas ms
comunes para comprender la etapa de cierre de imgenes utilizada en el mtodo
propuesto. Tambin se explica la Transformada Top-Hat, que fue usada para comparar
los resultados de la simulacin generada con el mtodo propuesto.

2.6.1 Fundamentos de morfologa matemtica
La descripcin bsica de la morfologa matemtica se basa en la teora de conjuntos y
en la topologa. Cada conjunto representa la forma de los objetos en una imagen
binaria. Dada esta equivalencia entre conjuntos e imgenes, cualquier transformacin
sobre un conjunto define una nueva imagen utilizando la correspondencia entre los
operadores lgicos bsicos y operaciones bsicas sobre conjuntos [BEU90].
El objetivo de las transformaciones morfolgicas es la extraccin de estructuras
geomtricas en los conjuntos sobre los que se opera, mediante la utilizacin de otro
conjunto conocido como elemento estructurante (EE) (ver Figura 2.1).
Captulo II: Procesamiento Digital de Imgenes
15

El tamao y la forma de este elemento se escogen de acuerdo a la morfologa
del conjunto sobre el que va a interaccionar y de acuerdo a la extraccin de formas que
se desean obtener, existen diversas formas y tamaos del EE (ver Figura 2.2).
Desplazando el EE sobre la imagen, el operador analiza tpicamente su posicin en
relacin al primer plano y fondo de la misma.
Actualmente, el mbito y alcance de los procesos morfolgicos es tan amplio
como el propio procesamiento de imgenes. Se pueden encontrar aplicaciones tales
como la segmentacin, restauracin, deteccin de bordes, aumento de contraste,
anlisis de texturas, compresin, etc. Las aplicaciones bsicas de la morfologa
matemtica son operaciones de erosin, dilatacin, apertura y cierre.

2.6.2 Operaciones bsicas de morfologa matemtica
La transformacin de erosin es el resultado de comprobar si el elemento estructurante
Y est totalmente incluido dentro del conjunto X. Cuando esto no ocurre el resultado de

Figura 2.1 Fundamento del procesado morfolgico



Figura 2.2 Formas tpicas de los elementos estructurantes
Captulo II: Procesamiento Digital de Imgenes
16

la erosin es el conjunto vaco. La erosin de un conjunto X por un EE Y, se define
como el conjunto de puntos o elementos x, pertenecientes a X, de forma que cuando el
EE Y se traslada a ese punto, el elemento queda excluido en X. La ecuacin (2.4)
muestra la definicin de erosin.

{ } X Y x X
X Y
= ) (

(2.4)

La dilatacin es la operacin contraria a la erosin. La dilatacin es el conjunto
de puntos origen del EE Y, tales que el EE contiene algn elemento del conjunto X,
cuando el elemento se desplaza por el espacio que contiene a ambos conjuntos (2.5):

{ } 0 ) ( = X Y x X
X Y


(2.5)

La apertura de una seal f por un EE Y se denota por ( ) f
Y
y se define como la
erosin de f por Y, seguida de la dilatacin por el mismo EE (2.6):
( ) ( ) ( ) f Y f
Y Y
=

(2.6)

El cierre de una seal f por un EE Y se denota por ( ) f
Y
, se define como la
dilatacin de f por Y, seguida por la erosin por el mismo EE (2.7):
( ) ( ) ( ) f f
Y Y Y
=

(2.7)
El efecto de las operaciones de dilatacin, erosin, apertura y cierre pueden ser
observados en la Figura 2.3.


Figura 2.3 Efectos de las operaciones ms comunes de morfologa matemtica
Captulo II: Procesamiento Digital de Imgenes
17

2.6.3 Transformada Top-Hat
La transformacin de Top-Hat consiste en descubrir aquellas estructuras de la imagen
que han sido eliminadas en el proceso de apertura o cierre. Con la eleccin de un EE de
forma, tamao y orientacin adecuado, es posible filtrar la imagen y eliminar
determinados elementos en la imagen original. Esta transformacin puede ser vista
como el residuo entre la identidad y la apertura morfolgica. En la Figura 2.4 se ilustra
un ejemplo de la transformada Top-Hat para una imagen 1-D [ORT02]. La Figura 2.4.a
presenta la seal original a tratar en gris, el EE Y en la parte superior y la seal
generada por el proceso de apertura morfolgica, mientras que la Figura 2.4.b presenta
la seal generada por la Top-Hat, la seal no eliminada por la apertura.

2.7 Filtro gaussiano de suavizado
Se llama filtro gaussiano de suavizado al operador 2-D utilizado para desvanecer
imgenes, removiendo detalles y ruido. Este filtro es un operador de convolucin. La
convolucin de imgenes permite multiplicar dos imgenes de diferentes tamaos para
generar una imagen del mismo tamao. En DIP la operacin de convolucin es
generalmente utilizada para generar pixeles de salida en una combinacin lineal de los
pixeles de entrada.

Figura 2.4 Efecto de la transformacin Top-Hat
Captulo II: Procesamiento Digital de Imgenes
18

Por lo tanto se tiene una matriz a analizar que debe convolucionarse con una
matriz de menor tamao (generalmente) denominada kernel. Este kernel se genera
segn la frmula (2.8) en donde los valores que pueden controlarse son la media (x,y) y
la desviacin estndar . Una distribucin con media (0,0) y desviacin estndar en 2-
D se presenta en la Figura 2.5

2
2 2
2
2
2
1
) , (

y x
e y x G
+

=

(2.8)
Como puede observarse la idea de suavizar una imagen 2D es eliminar las altas
frecuencias aplicando una convolucin de la seal con una funcin gaussiana con la
imagen. Este proceso entrega por tanto una salida de pixeles con un peso ponderado
segn la vecindad de cada pixel, movindose este valor ponderado haca el valor del
pixel central de la ventana definida para la convolucin. El grado de suavizado es
determinado en gran medida por la desviacin estndar de la funcin gaussiana, sin
embargo valores grandes de la desviacin requieren convolucionar kernels de mayor
tamao por lo que este filtro puede llegar a ser bastante complejo computacionalmente
hablando, pero de igual manera tiene ciertas aplicaciones en DIP.


Figura 2.5 Distribucin gaussiana en 2-D
Captulo II: Procesamiento Digital de Imgenes
19

2.8 Discusin
El procesamiento digital de imgenes se define como el campo que se encarga de
manipular imgenes digitales con el objetivo de mejorar stas o identificar cierta
informacin relevante, el desarrollo de nuevas tecnologas, tanto en la adquisicin de
imgenes, como en los sistemas de cmputo para el procesado de dichas imgenes, han
hecho de esta rama un campo de estudio interesante y en constante desarrollo.
Existen una gran cantidad de tcnicas DIP, sin embargo se selecciona la
interpolacin bicbica como el mtodo de mejoramiento de calidad de la imagen tanto
por su relacin costo-beneficio como por la gran cantidad de documentacin de este
algoritmo. As mismo se analizan las ventajas y desventajas de las transformaciones de
una imagen de color a una escala de grises o una imagen indexada, resultando ambas
apropiadas para el desarrollo de esta tesis.
Las operaciones morfolgicas son un campo de estudio que tiene muchas
ventajas sobre algunas tcnicas DIP, las operaciones bsicas son sencillas de entender y
aplicar, es por ello que se selecciona las operaciones de cierre de imagen y la
transformada Top-Hat como parte de las tcnicas utilizadas en el presente trabajo de
tesis.

Вам также может понравиться