Вы находитесь на странице: 1из 27

Visin Artificial

Ing. Henry Vallejo

CAPITULO I .- INTRODUCCIN
Qu vamos a aprender?

Qu es una imagen?
Qu es una imagen digital?
Qu es el procesamiento digital de imgenes?
Cules son las principales aplicaciones del procesamiento digital de imgenes?
Cules son los objetivos de los algoritmos de procesamiento digital de imgenes?
Cules son las operaciones de procesamiento de imagen ms comnes?
Qu componentes de hardware y software suelen ser necesarios para construir un sistema de
procesamiento de imgenes

Qu es un sistema de visin artificial (MVS) y cules son sus principales componentes?


Por qu es tan difcil de emular el funcionamiento del sistema visual humano (HVS) el uso de
cmaras y ordenadores

1.1. Motivacin
Los seres humanos han dependido histricamente de su
visin para tareas que van desde las habilidades bsicas de
supervivencia instintiva a un anlisis detallado y
elaborado de obras de arte. Nuestra capacidad para guiar
nuestras acciones y comprometer nuestras capacidades
cognitivas en base a la informacin visual es un rasgo
notable de la especie humana, y mucho de cmo es
exactamente lo que hacemos queda aun por descubrirlo.
La necesidad de extraer informacin a partir de imgenes
e interpretar su contenido ha sido uno de los factores
determinantes en el desarrollo de procesamiento de
imgenes y visin por computador en las ltimas dcadas.

Las aplicaciones de procesamiento de imgenes cubren una


amplia gama de actividades humanas, tales como las
siguientes:
Aplicaciones mdicas: Modalidades de
imgenes diagnsticas como la radiografa
digital, PET (positron emission tomography),
CAT (computerized axial tomography), RM
I(magnetic resonance imaging), y fMRI
(functional magnetic resonance imaging),
entre otros, han sido adoptadas por la
comunidad mdica a gran escala.

Aplicaciones
Industriales:
Sistemas
de
procesamiento de imgenes se han utilizado con
xito en los sistemas de fabricacin para muchas
tareas, tales como sistemas de seguridad, control de
calidad y control de los vehculos guiados
automticamente (AGV).
Aplicaciones militares: Algunos de los escenarios
ms difciles y de rendimiento crtico para las
soluciones de procesamiento de imgenes se han
desarrollado para las necesidades militares, que van
desde la deteccin de soldados o vehculos de gua
de misiles hasta reconocimiento de objetos para
vehculos areos no tripulados (UAV). Adems, las
aplicaciones militares a menudo requieren el uso de
diferentes sensores de imagen, tales como cmaras
infrarrojas (FLIR) y cmaras termogrficas.

Cumplimiento de la Ley y Seguridad: Las


aplicaciones de vigilancia se han convertido en una
de las zonas ms intensamente investigadas dentro
de la comunidad de procesamiento de vdeo.
Tcnicas biomtricas (por ejemplo, huella digital,
cara, iris, y de reconocimiento de la mano), que han
sido el objeto de investigacin de procesamiento de
imagen durante ms de una dcada, estn
disponibles recientemente en el mercado.

Electrnica de consumo: Las cmaras digitales y


videocmaras, han incorporado capacidades de
procesamiento de imagen . Los paquetes de software
para mejorar, editar, organizar y publicar las imgenes y
los vdeos han crecido sofisticadamente, manteniendo
una interfaz fcil de usar. Televisores de alta definicin,
monitores, reproductores de DVD y grabadoras de
video personales (PVR) se estn convirtiendo cada vez
ms populares y asequible. Imagen y video tambin
han realizado con xito el salto a otros dispositivos,
tales como asistentes personales digitales (PDA),
telfonos celulares.

1.2. Bsicos Conceptos y Terminologa


Qu es una imagen?
Una imagen es una representacin visual de un objeto, una
persona, o una escena producida por un dispositivo ptico,
tal como un espejo, una lente, o una cmara. Esta
representacin es de dos dimensiones (2D), aunque
corresponda a una de las infinitas proyecciones de un
mundo real, un objeto tridimensional (3D) o escena.

Qu es una Imagen Digital?


Una imagen digital es una representacin de una imagen de dos
dimensiones utilizando un nmero finito de puntos, por lo
general se hace referencia como elementos de imagen, pels, o
pxeles. Cada pxel est representado por uno o ms valores
numricos: para imgenes monocromas (escala de grises), existe
un nico valor que representa la intensidad del pxel (por lo
general en un intervalo [0, 255]); para imgenes en color, suelen
ser necesarios tres valores (por ejemplo, lo que representa la
cantidad de rojo (R), verde (G) y azul (B)).

Qu es el procesamiento Digital de Imgenes?

Procesamiento digital de imagenes se puede definir como la ciencia de la


modificacin de imgenes digitales por medio de un ordenador digital. Dado
que ambas, las imgenes y los equipos que ellos procesan son de naturaleza
digital, nos centraremos exclusivamente en el procesamiento digital de
imgenes. Los cambios que se producen en las imgenes por lo general se
realizan automticamente y se basan en algoritmos diseados
cuidadosamente. Esto est en claro contraste con otro escenario, tales como
retocar una foto utilizando una herramienta del aergrafo en un software de
edicin de fotos, en el que las imgenes se procesan manualmente y el xito
de la tarea depende de la capacidad y destreza humana. Nos referimos a este
ltimo como la manipulacin de imgenes para hacer que esta distincin sea
ms explcita.

Cul es el alcance de procesamiento de


imgenes?
Alto
nivel

Anlisis e
interpretacin de
los contenidos de
una escena.

Nivel
Medio
Extraccin de
atributos (por
ejemplo, bordes,
contornos,
regiones, etc.) de
las imgenes.

Bajo Nivel
Operaciones primitivas (por ejemplo,
reduccin de ruido, Mejora del
contraste, etc.), donde tanto la
entrada como la salida son imgenes.

1.3. Ejemplos de operaciones de procesamiento de imgenes


tpicos.
Procesamiento de imagen cubre una gama amplia y diversa de tcnicas y algoritmos, que se
describir en detalle en el resto del semestre. En esta seccin, ofrecemos una vista previa de las
operaciones de procesamiento de imgenes ms representativas que usted aprender en los
prximos captulos.
1. Sharpening(nitido): Es una tcnica por la cual los bordes y los detalles finos de una imagen se
mejoran para la visin humana.

2. Eliminacin de ruido : Los filtros de procesamiento de imagen se puede utilizar para reducir la
cantidad de ruido de una imagen antes de ser procesado. Dependiendo del tipo de ruido, se utilizan
diferentes tcnicas de eliminacin de ruido.

3. Deblurring (desenfocado): Una imagen puede aparecer borrosa por muchas razones, que van
desde un impropio enfoque de la lente a una velocidad de obturacin insuficiente para un objeto en
movimiento rpido.

Figura de blurring: Imagen (a) originales (borrosa); (b) despus de quitar el (movimiento) la falta de definicin. Imagen
original: cortesa de The MathWorks

4. Extraccin de borde (Edge Extraction): La extraccin de los bordes de una imagen es un paso
de pre procesamiento fundamental utilizado para separar los objetos entre s antes de identificar su
contenido. Existen Algoritmos y tcnicas de deteccin de borde.

Figura extraccin de bordes: (a) imagen original; (b) despus de extraer sus bordes ms relevantes.
Imagen original: cortesa de The MathWorks.

5. Binarizacin (Binarization): En muchas aplicaciones de anlisis de imgenes, a menudo es


necesario reducir el nmero de niveles de gris en una imagen monocromatica para simplificar y
acelerar su interpretacin. La reduccin de una imagen en escala de grises a slo dos niveles de grises
(blanco y negro) se denomina generalmente como binarizacin.

Figura Binarizacin: (a) la imagen en escala de grises originales; (b) despus de la conversin a una
versin en blanco y negro. Imagen original: cortesa de The MathWorks.

6. Blurring: A veces es necesario desenfocar una imagen con el fin de minimizar la importancia de la
textura y el detalle fino en una escena, por ejemplo, en los casos en que los objetos pueden ser mejor
reconocidas por su forma.

Figura Blurring : imagen original (a); (b) despus de aplicar el desenfoque para eliminar detalles
innecesarios. Imagen original: cortesa de The MathWorks.

7. Mejora del Contraste : A fin de mejorar una imagen para su visualizacin humana, as como
realizar otras tareas de procesamiento de imgenes (por ejemplo, extraccin de bordes) ms
fcilmente, a menudo es necesario mejorar el contraste de una imagen. Existen tcnicas para la
mejora del contraste utilizando funciones de transformacin y procesamiento de histograma.

Figura mejora el contraste: (a) imagen original; (b) despus de la ecualizacin del histograma para
mejorar el contraste.

8. La segmentacin de objetos y Etiquetado (Object Segmentation and Labeling): La tarea de


segmentacin y etiquetado de objetos dentro de una escena es un requisito previo para la mayora de
los sistemas de reconocimiento de objetos y de clasificacin. Una vez que los objetos relevantes han
sido segmentado y etiquetados, sus caractersticas relevantes pueden ser extradas y utilizadas para
clasificar, comparar, o reconocer los objetos en cuestin.

Figura segmentacin de objetos y etiquetado: (a) imagen original; (b) despus de la segmentacin y
etiquetado de objetos individuales. Imagen original: cortesa de The MathWorks.

1.4. Componentes de un Sistema de


Procesamiento Digital de Imgenes

Hardware

Los componentes de hardware de un sistema de procesamiento de imagen digital incluyen tpicamente lo siguiente:

Dispositivos de adquisicin: Responsable de la captura y digitalizacin de imgenes o secuencias de vdeo.


Ejemplos de dispositivos de adquisicin de propsito general incluyen escneres, cmaras y videocmaras.
Dispositivos de adquisicin pueden conectarse con el ordenador principal en un nmero de maneras, por ejemplo,
USB, FireWire, Camera Link, o Ethernet. En los casos en que las cmaras producen salida de vdeo analgico, un
digitalizador de imagen generalmente conocido como capturador de fotogramas se utiliza para convertir a formato
digital.

Equipo de procesamiento: El propio equipo principal, en cualquier tamao, forma o configuracin. Responsable
de la ejecucin de software que permite el procesamiento y anlisis de imgenes adquiridas.

Pantalla y dispositivos de impresin: Es responsable de mostrar el contenido de imagen para la visin humana.
Los ejemplos incluyen monitores a color e impresoras.

Dispositivos de almacenamiento: discos magnticos u pticos responsables de almacenamiento a largo plazo de


las imgenes.

Software

La parte de software de un sistema de procesamiento digital de imagen por lo general se compone de


mdulos que realizan tareas especializadas. El desarrollo y la puesta a punto de soluciones de software para
procesamiento de imgenes es iterativo. En consecuencia, los investigadores de procesamiento de imgenes
y los profesionales confan en los lenguajes de programacin y entornos de desarrollo que apoyan el
desarrollo de software modular, gil, e iterativo.

El software de eleccin es MATLAB (Laboratorio de Matrix), una multi-plataforma, anlisis de datos,


creacin de prototipos, y una herramienta de visualizacin con soporte integrado para las matrices y
operaciones con matrices, ricas capacidades de grficos y un lenguaje de programacin amigable y entorno
de desarrollo. MATLAB ofrece a los programadores la posibilidad de editar e interactuar con las principales
funciones y sus parmetros, lo que conduce a valiosos ahorros de tiempo en el ciclo de desarrollo de
software.

MATLAB se ha vuelto muy popular entre los ingenieros, cientficos e investigadores de la industria y el
mundo acadmico, debido a muchos factores, como la disponibilidad de cajas de herramientas contienen
funciones especializadas para muchas reas de aplicacin, que van desde la adquisicin de datos para el
procesamiento de imgenes.

Sistema de Visin Artificial (SMV. Machine


System Vision)
En esta seccin, presentamos los principales componentes de un sistema de visin
artificial utilizando una aplicacin de ejemplo prctico: El reconocimiento de
placas de matrcula en un peaje de la autopista. El procesamiento de imgenes no
es un proceso de un solo paso: la mayora de las soluciones siguen un esquema de
tratamiento secuencial cuyos pasos principales se describen a continuacin.
Dominio del
problema

Adquisicin

Resultados

Procesamiento

Extraccin de
Caractersticas

Base de
Conocimientos

Clasificacin

El dominio del problema: En este caso, es el reconocimiento automtico de matrculas. El


objetivo es ser capaz de extraer el contenido alfanumricos de la matrcula de un vehculo que
pasa a travs de la cabina de peaje de forma automatizada y sin supervisin, es decir, sin
necesidad de intervencin humana. Requisitos adicionales podran incluir otras operaciones
(como luz artificial), el funcionamiento de todo tiempo, la tasa de xito aceptable, y la mnima y
mxima velocidad del vehculo.
El bloque de adquisicin: A cargo de la adquisicin de una o ms imgenes que contienen una
vista frontal o trasera del vehculo que incluye su matrcula. Esto se puede implementar
utilizando una cmara CCD y el control de las condiciones de iluminacin a fin de garantizar que
la imagen ser adecuada para su posterior procesamiento. La salida de este bloque es una imagen
digital que contiene una vista (parcial) del vehculo. Varios factores deben ser considerados en el
diseo de este bloque y probablemente tendrn un impacto en la calidad de la imagen resultante,
as como el rendimiento de todo el sistema, tales como la velocidad mxima permitida para el
vehculo sin riesgo de borrar las imgenes, los aspectos de iluminacin (por ejemplo, el nmero,
el tipo, y el posicionamiento de las fuentes de luz), la eleccin de lentes, y la especificacin
(resolucin y velocidad) del hardware digitalizador de la imagen.
La etapa de procesamiento: Esta etapa mejora la calidad de la imagen adquirida. Algoritmos
posibles para ser empleadas durante esta etapa incluyen la mejora de contraste, correccin de
brillo, y la eliminacin de ruido

Segmentacin: El bloque de segmentacin es responsable de dividir una imagen en sus


principales componentes: objetos relevantes y el fondo o Subimgenes" Produce en su salida
una serie de regiones marcadas. Es posible que en este caso particular la segmentacin se realiza
a dos niveles: (1) la extraccin de la placa de la matrcula del resto de la imagen original; y (2) la
segmentacin de caracteres en el rea de la placa. La segmentacin automtica de la imagen es
una de las tareas ms difciles en un sistema de visin artificial.
Extraccin de caractersticas: (tambin conocida como la representacin y la descripcin)
consta de algoritmos responsables de la codificacin de los contenidos de las imgenes de una
manera concisa y descriptiva. Las caractersticas tpicas incluyen medidas de color (o intensidad)
de distribucin, textura y forma (previamente segmentadas) objetos ms relevantes dentro de la
imagen. Estas caractersticas suelen agruparse en un vector de caractersticas que a continuacin
se puede utilizar como un indicador numrico de la imagen (objeto) contenidos para la etapa
posterior, en la que se reconocen tales contenidos (Clasificacin).

Clasificacin: Una vez que las caractersticas ms relevantes de la imagen (o sus objetos
relevantes, en este caso los caracteres individuales) se han extrado y codificado en un vector de
caractersticas, el siguiente paso es utilizar esta representacin numrica bidimensional como
una entrada a la clasificacin de patrones (tambin conocido como la etapa de reconocimiento e
interpretacin).
En este punto, el procesamiento de imgenes une el reconocimiento de patrones clsicos y se
beneficia de muchas tcnicas ya probadas y verdaderas, como clasificadores de distancia mnima,
clasificadores probabilsticos, redes neuronales, y muchos ms. El objetivo final de este bloque es
clasificar (es decir, asignar una etiqueta a la letra a) cada carcter individual, produce una cadena
(o archivo ASCII), que contiene los contenidos de la placa.

Todos mdulos estn conectados a un gran bloque llamado base de conocimientos.


Donde la solucin satisfactoria al problema de reconocimiento de matrculas depender de
cmo se ha codificado y almacenado en la MVS y el mucho conocimiento sobre el dominio
del problema. El papel de dicha base de conocimientos en las ltimas etapas es muy
evidente (por ejemplo, el conocimiento de que el primer carcter debe ser una letra puede
ayudar a eliminar la ambigedad entre un "0" y una "O" en la fase de clasificacin de
patrones). De una manera menos obvia, la base de conocimientos debe (idealmente) ayudar
con todas las tareas dentro de la MVS. Por ejemplo, el bloque de segmentacin podra
beneficiarse de reglas que especifican hechos conocidos sobre las placas de matrcula, como
forma y relacin de aspecto, lo ms probable la ubicacin dentro de la imagen original,
nmero de caracteres que se espera que aparecer dentro de la placa, el tamao y la posicin
de la informacin acerca de los caracteres y patrones de fondo pertinentes que puedan
aparecer en el rea de la placa.

Sistema de Visin Humana (HVS) vs Sistema de


Visin Artificial (MVS).

Вам также может понравиться