Вы находитесь на странице: 1из 8

Captulo 1 Introduccin

Captulo 1 Introduccin .......................................................................................................... 1


1. INTRODUCCIN.......................................................................................................... 1
1.1 Sistema Visual Humano .............................................................................................. 1
1.2 Modelo de Visin por Computadora ............................................................................ 3
1.3 Procesamiento Digital de Imgenes ............................................................................. 3
1.4 Definicin de Imagen Digital ....................................................................................... 4
Problemas ........................................................................................................................... 6
Referencias ......................................................................................................................... 7

Captulo 1 Introduccin

Captulo 1 Introduccin
1. INTRODUCCIN
La visin es conocida como uno de los principales procesos de adquisicin de informacin
utilizado por el ser humano para realizar el proceso de percepcin. Remarcamos el aspecto
de que visin es un proceso, ya que la definicin que tratamos de abarcar no es la de captar
solo una imagen sino la de llegar a percibir e interpretar lo que se ve. Lo cual implica
adems de un proceso fisiolgico, un proceso cognitivo incluso hasta cultural. Es decir si
mostramos una imagen a una persona lo que ver la persona no solo depende de lo que es
captado como energa luminosa sino que intervienen adems procesos deductivos e
interpretativos de acuerdo al conocimiento y cultura de la persona. Respecto al proceso de
la percepcin se puede decir que es la interpretacin de estmulos percibidos por los
sentidos humanos que representan el ambiente en que se encuentra una persona.
Al ser la visin un proceso que le permite a una persona obtener una gran cantidad de
informacin del entorno, la cual a su vez le permitir a la persona poder desenvolverse y
realizar actividades en su ambiente, llega a ser un rea de gran inters como objeto de
investigacin cuyo objetivo es tratar de desarrollar mquinas que en cierto grado imiten el
comportamiento de una persona. De aqu entonces podemos tratar de derivar una definicin
de Visin por Computadora. Indicamos una, ya que generalmente dependiendo del rea
donde se trabaja se tiende a dar la definicin. Tratando de no excluir alguna lnea de
investigacin sobre Visin por Computadora diremos que es todo trabajo enfocado a
generar conocimiento, y desarrollar algoritmos para tratar de lograr que una mquina
simule en cierto gado el proceso de visin de una persona.

1.1 Sistema Visual Humano


Anteriormente se pensaba que la nica funcin del ojo humano era la de proporciona al
cerebro una copia o modelo del mundo exterior. Si bien el ojo humano genera una
trasformacin de energa luminosa a impulsos que alimentan la corteza visual en el cerebro,
el ojo tambin realiza un procesamiento de la imagen que adquiere, ya que los receptores en
la retina en la parte posterior del ojo no estn distribuidos uniformemente ni son sensitivos
al mismo tipo de informacin ptica. Algunos receptores son ms sensitivos al movimiento,
color o intensidad. An ms, estos receptores se encuentran interconectados de manera que
cuando un receptor recibe informacin altera el comportamiento de los receptores vecinos.
Con este comportamiento se tiene que la imagen captada sufre ya un procesamiento an
antes de salir del ojo y dirigirse a la corteza visual. Adems, una vez transmitida a la
corteza cerebral, el ojo recibe retroalimentacin para continuar el proceso de percepcin
visual. Esta retroalimentacin altera la respuesta de los receptores y permite llevar acabo el
proceso de foveo.
Con base a lo anterior podemos decir que el ojo humano forma parte del proceso de
visin, el cual es un proceso que convierte la informacin sensorial visual en conocimiento
de forma, identidad, o configuracin de objetos en el ambiente. La visin es un proceso
1

Captulo 1 Introduccin
creativo ms que mecnico, en el cual podemos diferenciar entre ver y percibir. Ver es el
registro fsico del patrn de energa de luz recibida del mundo que nos rodea. Percepcin es
la interpretacin de lo que vemos.
A continuacin se muestran las partes bsicas del ojo humano y se describen las
funciones principales implicadas en el proceso de visn. La Figura 1.1 muestra las partes
bsicas del proceso de visin, ojo y corteza visual cerebral, y las partes principales del ojo
humano.

Figura1. 1 Partes bsicas del proceso de visin.

La funcin del iris es la de controlar la cantidad de luz que entra al ojo. El lente o
cristalino permite enfocar la imagen sobre la retina. La retina contiene conos y bastones, los
cuales realizan la transformacin de energa luminosa a impulsos elctricos. Los conos que
son aproximadamente 6-7 millones se encuentran principalmente en la parte central de la
retina, llamada fovea y son altamente sensibles al color por lo que se utilizan para captar
detalles finos. Los bastones en un nmero de 75 a 150 millones distribuidos sobre la
superficie de la retina, (M.A. Fischler [1987]), proporciona una imagen general del campo
de visin. Los bastones son sensitivos a niveles bajos de iluminacin. Por eso en ocasiones
se recomienda para ver mejor al entrar a un lugar con baja iluminacin no fijar la vista. Si
fijamos la vista el ojo enfocar la luz principalmente en la fovea donde hay una mayor
concentracin de conos pero que tiene menos sensibilidad que los conos. En cambio si
tratamos de no fijar la vista el sistema de visin captar una visin perifrica la cual es
formada principalmente por los bastones, los cuales son ms sensibles a la luz y como
consecuencia percibiremos una mejor imagen.
Los procesos ms complejos del proceso de visin como el anlisis e interpretacin se
realizan en la corteza visual. En estos procesos intervienen diferentes tipos de neuronas y
redes de neuronas que realizan funciones especializadas sobre la imagen recibida. Para
mayor informacin sobre este punto se puede consultar (M.A. Fischler [1987], Deutch
[1993], Chengiun [2003]).

Captulo 1 Introduccin
1.2 Modelo de Visin por Computadora
Un modelo para realizar visin mediante una computadora define los niveles y procesos
que se realizan sobre una escena para llegar a su interpretacin. La Figura 1.2 muestra que
el modelo se puede dividir en el procesamiento de nivel bajo, nivel intermedio y nivel alto.
En el nivel bajo encontramos acciones sobre la imagen que define a la escena
correspondientes a suavizado, umbralizacin, eliminacin de ruido, definicin de bordes,
anlisis de textura, etc. En el nivel intermedio en cambio tenemos acciones como definicin
de lmites, regiones, superficies, que estn relacionadas a generar objetos presentes en la
imagen. Por ltimo en el nivel alto se entablarn relaciones entre objetos para realizar la
interpretacin o descripcin de la escena.

Nivel bajo:
Operaciones de
preprocesamiento

Nivel
intermedio:
Determinar
objetos

Nivel alto:
Relacin
entre objetos
y descripcin

Figura1. 2 Modelo de Visin por Computadora.

1.3 Procesamiento Digital de Imgenes


Una vez definidos lo que es visin y Visin por Computadora iniciamos un acercamiento al
rea que nos atae en este libro, Procesamiento Digital de Imgenes, PDI. PDI es el
tratamiento de imgenes mediante medios electrnicos y su aplicacin incluye diversas
reas como, la medicina, la manufactura, microscopa, anlisis de imgenes satelitales,
sistemas de seguridad, astronoma, etc.
Un aspecto importante de PDI es que las imgenes con que se trabaja no provienen
nicamente del sensado del espectro de luz visible a la cual responde el ojo humano, las
imgenes pueden provenir del sensado de cualquier rea del espectro electromagntico.
Esto representa una gran ventaja, ya que los sistemas que incorporan la fase de PDI no
estn limitados nicamente a las imgenes que puedan ser capturadas por el ojo humano.
Existen actualmente sistemas que realizan PDI sobre imgenes generadas mediante el
sensado de, rayos X, rayos gama, energa ultravioleta, ultra-violeta Uv, infrarrojo, IR,
microondas, microondas Mo, y ondas de radio, prcticamente todo el espectro
electromagntico, Figura1.3. El rango de la luz visible es solo una pequea parte del
espectro electromagntico, como se aprecia en la Figura1.3, por lo que el poder trabajar con
imgenes adquiridas en otros rangos del espectro enriquece la aplicabilidad del PDI y
permiten visualizar informacin que de otra forma no sera posible ver. La Figura 1.4.
3

Captulo 1 Introduccin
ilustra como se puede generar informacin distinta al sensar diferente tipo de energa de
una misma escena. En la Figura 1.5 y 1.6 se muestran algunas imgenes que muestran
aplicaciones de PDI. La Figura1.5a es referente a la determinacin de la fertilidad humana
mediante el anlisis de trayectorias de espermas. La Figura1.5b, muestra una imagen para
realizar el anlisis de defectos cosmetolgicos en la fabricacin de lentes. La Figura 1.5c es
una imagen de un documento sobre el cual se lleva acabo la tarea de clasificar reas con
texto y reas con imgenes. La Figura1.6a presenta un mejoramiento de una imagen de
rayos X. En la Figura1.6b se ilustra parte del procesamiento de imgenes de autos para la
localizacin de placas. La Figura1.6c muestra procesamiento realizado para la clasificacin
de camarones por talla. En la Figura1.6d se ilustra la aplicacin de la generacin de objetos
en 3D de imgenes de resonancia magntica y su procesamiento por capas y la Figura1.5e
muestra una imagen obtenida durante la noche con una cmara con sensor cercano a
infrarrojo para aplicaciones de seguridad.

Gama

Uv

0.4E-6
Violeta

0.5E-6
Azul

IR

0.6E-6

Verde Amarillo

Mo

Radio

0.7E-6
Naranja Rojo

Figura1. 3 Espectro electromagntico con ampliacin del rango de luz visible.

1.4 Definicin de Imagen Digital


Los trabajos relacionados con PDI estn relacionados al objeto imagen digital.
Consideraremos que una imagen digital es la representacin de una escena del mundo fsico
mediante el proceso de muestreo, transformacin del dominio continuo al discreto. Esta
transformacin permitir la utilizacin de mquinas discretas sobre la representacin de una
escena del mundo fsico. La imagen digital ser el objeto de estudio y tratamiento principal
en el rea de procesamiento digital de imgenes.
Con esto concluimos el contexto en que se desarrollarn los siguientes captulos del libro.

Captulo 1 Introduccin

a)
b)
Figura1. 4 a) Rango infrarrojo b) Rango Radio.

a)

b)

c)

Figura 1. 5 Ejemplos de imgenes y sus aplicaciones. a) Espermas, anlisis de fertilidad, b) Defectos en lente,
calidad de producto c) Documento, anlisis de documentos.

Captulo 1 Introduccin

a)

b)

c)

d)

e)

Figura1. 6 Ejemplos de imgenes y sus aplicaciones, a)Imagen de rayos X, anlisis clnico, e)Localizacin de
placas, sistemas de seguridad, f) Clasificacin de camarn, control de calidad, g) Imagen de resonancia
magntica, anlisis clnico, h) Imagen cercana a infrarrojo, sistemas de seguridad.

Problemas
1.1 Realice una investigacin sobre fuentes bibliogrficas del rea de procesamiento de
imgenes.
1.2 Haga un estudio de investigaciones recientes del funcionamiento del sistema visual
humano.
1.3 Haga un estudio de investigaciones recientes sobre percepcin visual humana.

Captulo 1 Introduccin
1.4 Realice una investigacin sobre productos de sistemas de visin, programas de
desarrollo, cmaras, ptica, accesorios.
1.5 Investigue los principales pasos de diseo de un sistema de visin de mquina.
Referencias
Chacn Murgua Mario I., Jay B. Jordan,[1999], Document region classification using low resolution images:
a human visual perception approach, SPIE International Symposium on Optical Science, Engineering and
Instrumentation.
Chacn Murgua Mario I., Valdez Antonio, [1999],Spermatoza Motion Detection and Trajectory Tracking
Algorithm Based on Orthogonal Search, SPIE International Symposium on Optical Science, Engineering and
Instrumentation.
Chacn Murgua Mario I., Jordan Jay, [1999],Fuzzy Neural Nertwork for Document Region Classification
Using Human Visual Perception Features, International Joint Neural Network, Washington D.C.
Chacn Murgua Mario Ignacio, [1998],Document Segmentation Using Texture Variance and Low
Resolution Images, IEEE Southwest Symposium on Image Analysis and Interpretation , Tucson, AZ, USA.
Chacn Murgua Mario Ignacio,[1997], "Document Segmentation Using a global Fuzzy Edge Detector,"
Artificial Neural Networks in Engineering, St Louis Missouri U.S.A.
Chengjun L. y Wechsler H., [2003], Independent component analysis of Gabor features for face recognition,
IEEE Trans. Neural Networks, Vol 14, pp. 919-928.
Deutsch S. y Deutsch A.,[1993], Understanding the Nervous System, IEEE Press, New York.
Fischler M.A. y Firshcein O., [1987], Intelligence, The Eye, The Brain and the Compute, Addison Wesley,
Reading Massachusetts.
Haber N.R., Hershenson M.,[1973], The Psychology of Visual Perception, Holt, Rinehart and Winston Inc.,
Held R. y Richards W., [1972], Perception: Mechanics and Models, W.H. Freeman and Company, San
Francisco.
Jimnez D., Chacn M., Rivera M.,[1998], Frequency Domain Model of an Error Criterion for Image Noise
Reduction, International Conference on System, Signal, Control and Computers, Durban, South Africa.
Lindblad T. y Kinser j. ,[1998], Image Processing Using Pulse-Coupled Neural Networks, Ed. Springer.

Malamas E., Petrakis E., Zervakis M., Petit L. y Legat J.,[2003], A Survey on Industrial Vision Systems,
Applications and Tools, Image and Vision Computing, 21, pp171-188.
McCafferty J.,[1990], Human and Machine Vision, Computing Perceptual Organization, Ellis Horwood, Ney
York.
Sarkar S. y Boyer K., [1994], Computer Perceptual Organization in Computer Vision, World Scientific
Singapure.
Ullman S.,[1997], High Level Vision, The MIT Press, Cambridge Massachusetts, London England.

Похожие интересы