Вы находитесь на странице: 1из 33

Tratamiento de

Imágenes
PRESENTADO POR: GRUPO 208054_7
PRESENTADO A: ING. PAOLA SABOGAL
UNAD, 2018
Unidad 1
Procesamiento de imágenes
Unidad 2
Clasificadores
Unidad 3
Análisis de resultados
Procesamiento de imágenes

 El procesamiento digital de imágenes se efectúa dividiendo la


imagen en un arreglo rectangular de elementos. Cada elemento
de la imagen así dividida se conoce con el nombre de pixel. El
siguiente paso es asignar un valor numérico a la luminosidad
promedio de cada pixel. Así, los valores de la luminosidad de cada
pixel, con sus coordenadas que indican su posición, definen
completamente la imagen. Se aplica directamente sobre
imágenes en escala de grises, debido al bajo consumo de
cómputo de este; la mayoría de métodos matemáticos están
basados en la diferencia de niveles de grises, por lo que no existen
muchos métodos para procesamiento de imágenes a color.
Identificación de características:

 Existen diferentes modelos de color o representaciones, unos son


modelos sensoriales y otros son modelos preceptúales.
 Modelo Sensorial: El objetivo principal de obtener características es
sacar datos relevantes en formato RGB (Red, Green, Blue) de objetos,
para crear características que puedan ser utilizadas por otros procesos
para llegar a un resultado.
 Este modelo es basado en cámaras y receptores de televisión, sin
embargo tiene problemas al aplicarlo al procesamiento de imágenes
(ecualización: La ecualización de la imagen consiste en tratar de
transformar el histograma de la imagen en un histograma uniforme. Se
consigue utilizando como función de transformación la distribución
acumulativa de la intensidad.).
 Modelo Perceptual: modelo HSI (Hue, Saturation, Intensity). Son mejores
ya que podemos detectar los cambios en estas componentes, sin
embargo, es compleja la implementación de detección de orillas en
croma por no ser lineal
. Implementación de clasificador

 Dominio del espacio


 Se trabaja directamente con los pixeles de la imagen
 Se modifica cada pixel dependiendo de su valor o el de sus vecinos
 Dominio de la frecuencia
 Cambios en la TdF de la imagen
 No se excluyen mutuamente
Resultados y análisis

 pasar la representación de estos pixeles a un monitor de televisión


de alta definición, con el fin de mostrar la imagen procesada
 la base del software de un sistema de visión es la interpretación y
análisis de los pixeles. El resultado final puede ser, desde la medida
de una partícula, a la determinación o lectura de una serie de
caracteres OCR, pasando por cualquier otro proceso que
podamos imaginar sobre las imágenes
Imagen Digital
 La imagen digital es la representación bidimensional de una
imagen empleando bits, unidad mínima de información compuesta
por dígitos binarios (1 y 0), que se emplea a instancias de la
informática y cualquier dispositivo de tipo digital.

Tratamiento de imágenes
 El tratamiento de imágenes tiene por objeto modificar
características de la imagen capturada para:
 Solucionar los problemas que suelen producirse al capturarlas, tales
como falta de luz, colores apagados, tamaño excesivo.
 Restaurar imágenes con defectos, ojos rojos.
 Recortar partes de la imagen para manipularla o transformarla
mediante filtros.
Qué significado tiene un pixel en
una imagen?
 Es la unidad de información que equivale a la elección de dos
posibilidades (cero ó uno). La información que podemos
almacenar en un bit es muy pequeña, por eso los bits se agrupan
en bytes (8 bits). En las imágenes digitales nos podemos encontrar
con las familiarizadas palabras como Kilobyte (KB) que equivale a
1024 bytes, Megabyte (MB) que equivale a 1024 K y Gigabyte (GB)
que equivale a 1024 MB. Éstas representan el peso de una imagen
que va a ocupar en nuestro disco duro y dicho peso dependerá
del tamaño en bits mencionado anteriormente, del modo de color
y de su resolución
¿Qué tonalidad o color almacena
cada nivel de gris?
 En una imagen en escala de grises cada punto de la imagen se
almacena en un Byte, donde su valor numérico representa su tono,
que puede oscilar entre el blanco (255) y el negro (0). Esto quiere
decir que es una imagen donde existen 256 tonos de gris (de 0 a
255, ambos inclusive). Es decir, la profundidad de color es el número
de bits que definen cada píxel, que determinan el máximo número
de colores que puede tener.
diferencia entre los espacios de
color RGB y HSV
 El modelo RBG se utiliza cuando se representa color mediante
haces de luz (pantallas o monitores). Un pixel en un monitor se
representaría mediante tres subpíxeles o células: una roja, una
verde y una azul, correspondiendo cada una a un LED o diodo
emisor de luz del respectivo color.
 Si los tres diodos están apagados, obtendríamos el negro. Si están
encendidos a diferentes intensidades, obtendríamos colores, si
están todos encendidos con la misma intensidad y al máximo,
tendríamos el blanco, y si la intensidad es menor pero igual en los
tres diodos, obtendríamos grises.
 HSV (idem excepto V de value o valor). El control del matiz sería
similar, el control de la saturación nos permitiría llevar un matiz dado
a su expresión más pura, o bajar su saturación hasta llegar el
blanco
Qué es histograma?

 El histograma es una ventana de diálogo que presenta, de forma


gráfica, un resumen estadístico del recuento de los píxeles de una
imagen según su distribución.
Universidad Autónoma de Baja California, U. T. (Diciembre de 2018). Unicauca. Obtenido de ftp://ftp.unicauca.edu.co/Facultades/FIET/DEIC/Materias/Identificacion/matlab_seminar/docs/Matlab6xConatec.pdf

Matlab
 MATLAB es un lenguaje de alto desempeño diseñado para realizar
cálculos técnicos. MATLAB integra el cálculo, la visualización y la
programación en un ambiente fácil de utilizar donde los problemas y
las soluciones se expresan en una notación matemática. MATLAB es un
sistema interactivo cuyo elemento básico de datos es el arreglo que no
requiere de dimensionamiento previo. Esto permite resolver muchos
problemas computacionales, específicamente aquellos que involucren
vectores y matrices, en un tiempo mucho menor al requerido para
escribir un programa en un lenguaje escalar no interactivo tal como C
o Fortran.

 Imagen tomada de: https://icon2.kisspng.com/20180607/qae/kisspng-


matlab-mathworks-simulink-computer-software-eigenf-deep-learning-
5b19640347fa74.3382065815283906592948.jpg
funciones imread, imshow,
rgb2gray, im2double e imhist
 IMREAD (FILENAME, FMT) lee una imagen en escala de grises o en color
del archivo
 IMSHOW (I) muestra la imagen en escala de grises
 RGB2GRAY convierte las imágenes RGB en escala de grises al eliminar
la información de tono y saturación mientras conserva la luminancia.
 IM2DOUBLE toma una imagen como entrada y devuelve una imagen
de clase doble. Si la imagen de entrada es de clase doble, la imagen
de salida es idéntica a ella. Si la imagen de entrada no es doble,
IM2DOUBLE devuelve la imagen equivalente de clase doble, volviendo
a escalar o desplazando los datos según sea necesario
 IMHIST (I) muestra un histograma para la imagen de intensidad y cuyo
número de contenedores está especificado por el tipo de imagen. Si
yo soy una imagen en escala de grises, IMHIST usa 256 contenedores
como valor predeterminado. Si yo soy una imagen binaria, IMHIST usa
solo 2 contenedores. Puede ser 2-D, 3-D o N-D.
Qué es umbralización o
binarización?
Umbralización Binarización
Es el método más simple de segmentación. es una técnica que consiste en la
Ejemplo de aplicación: Separar regiones de realización de un barrido en la matriz de la
una imagen correspondientes a los objetos imagen digital, por medio de bucles o
que queremos analizar. Esta separación se recursividad, con el fin de que el proceso
basa en la variación de la intensidad entre produzca la reducción de la escala de
los píxeles de objetos y los píxeles de fondo. grises a dos únicos valores. Negro (= 0) y
Para diferenciar los píxeles que nos interesa blanco (= 255), o lo que es lo mismo, un
del resto (que eventualmente será sistema binario de ausencia y presencia de
rechazado), se realiza una comparación de color 0-1. La comparación de cada píxel de
cada valor de intensidad de los píxeles con la imagen viene determinada por el umbral
respecto a un umbral (determinado según de sensibilidad (valor T = Threshold). Por
el problema a resolver). ejemplo, los valores que sean mayores que
el umbral toman un valor 255 (blanco) y los
menores 0 (negro).
Métodos de umbralización:
 Histograma: métodos basados en el análisis de los picos máximos y mínimos
de las curvas del histograma del suavizado de la imagen.
 Clustering: métodos basados en discernir como las muestras de los niveles
de gris se agrupan o alternativamente se modelan como una mezcla de
dos gaussianas.
 Entropía: métodos basados en el análisis de los resultados de la aplicación
de algoritmos que utilizan la entropía de las regiones frontal y de fondo, la
entropía cruzada entre la imagen original y binarizada.
 Similitud: métodos basados en la búsqueda de una similitud entre las
escalas de grises, como la tonalidad difusa, los bordes de la imagen, etc.
 Espaciales: métodos analíticos que usan el orden de distribución, la
probabilidad y/o la correlación entre los diferentes píxeles.
 Globales: métodos cuyo valor del umbral es estático.
 Locales: métodos que adaptan el valor del umbral, de forma manual o
automática, a cada píxel dependiendo de las características locales de la
imagen segmentada.
Tipos de Umbralización
 Umbral Binario
Esta operación de umbral puede ser expresado como:

 Umbral Binario Invertido


Esta operación de umbral puede ser expresado como:

 Truncar
Esta operación de umbral puede ser expresado como:
 Umbral a Cero
Esta operación se puede expresar como:
 Umbral a Cero Invertido
 Esta operación se puede expresar como:
Umbralización global Los umbrales locales

Esta técnica de umbralización supone Son determinados dividiendo una imagen


que la imagen posee un histograma en subimágenes y calculando los
bimodal, y por lo tanto, el objeto puede umbrales de dichas subimágenes,
ser extraído del resto de la imagen o examinando las intensidades de la
mediante una simple operación que imagen en los alrededores de cada píxel.
compare los valores de la imagen con el En el primer método, primero, se divide
valor umbral T. una imagen en
La imagen g(x,y), resultante de aplicar la subimágenes rectangulares solapadas, y
umbralización, viene definida por: se obtienen los histogramas de cada
subimagen. Estas subimágenes deben ser
los suficientemente grandes como para
abarcar el fondo, y el objeto en cuestión.
Si una subimagen tiene un histograma
bimodal, el mínimo entre los dos picos
determinará el umbral local. En caso que
el histrograma sea unimodal, el umbral se
obtendrá por interpolación de los
umbrales locales de las subimágenes
adyacentes
Qué es umbral de Otsu?
 La formulación matemática de este método está basado en el histograma.
Por lo cual, normaliza dicho histograma como una función de densidad de
probabilidad del tipo discreta Pr. Donde, N es el número total de pixeles en
la imagen, nq es el número de pixeles que tienen un nivel de intensidad rq,
y L es el número total de posibles niveles de intensidad en la imagen.
𝑛𝑞
𝑃𝑟 𝑟𝑞 =
𝑁
𝑞 = 0,1,2, … , 𝐿 − 1
 Una vez normalizado el histograma, se elige un umbral k tal que C0
represente a un conjunto de pixeles con niveles {0, 1, 2, ..., k-1} y C1 otro
grupo de pixeles con niveles {k, k+1, k+2, …, L-1}. Por lo cual, el método de
Otsu selecciona el valor del umbral maximizando la varianza Ϭ2𝐵 , la cual se
encuentra definida por:
reducción de ruido en una imagen
binaria
 El ruido digital es aparición aleatoria de “rastros” y de variaciones
del brillo o del color en la fotografía digital. Estos rastros, que hemos
entrecomillado, suelen presentarse en la mayoría de los casos
como puntos de tamaño variable, pero también se pueden
considerar otros artefactos producidos en los degradados de color,
etc, incluso algún tipo de aberración cromática.
La reducción de ruido en una imagen consiste en hacer que la
imagen sea más nítida, reduciendo los niveles de luz, de sonido,
aplicando diferentes niveles de color y saturación
Qué es filtro mediano
 Consiste en asignar a cada punto el valor de la mediana local (muestras
alrededor de cada valor de la señal) o sea f(x) = 𝑦𝑚𝑒𝑑 ); sólo cambian aquellos
valores que no corresponden a la mediana de la muestra.
 El filtro mediana en una imagen consiste en reemplazar el valor central u=I(x,y)
por𝑈𝑚𝑒𝑑 , para cada pixel de la imagen. Típicamente W es una vecindad de 3×3
pixeles, con N=8 mas el centro.
 El filtro mediana es el más adecuado para remover ruido impulsivo (de “sal y
pimienta”), alcanzando a veces una eficiencia del 100%.
Para qué sirven los filtros de suavizado en una imagen
Su objetivo es suavizar la imagen, son útiles cuando se supone que la imagen tiene gran cantidad de ruido
y se quiere eliminar. También pueden utilizarse para resaltar la información correspondiente a una
determinada escala (tamaño de la matriz de filtrado); por ejemplo en el caso de que se quiera eliminar la
variabilidad asociada a los tipos de cubierta presentes en la imagen uniformizando de esta manera su
respuesta.
 • Filtro de la media, asigna al pixel central la media de todos los pixeles incluidos en la
ventana. La matriz de filtrado estaría compuesta por unos y el divisor sería el número total
de elementos en la matriz.
 • Filtro de media ponderada, los elementos de la matriz de filtrado no son todos 1 sino
que se da más peso a uno de ellos (generalmente el central) para obtener un resultado
más parecido a la imagen original y evitar que aparezca borrosa.
 • Filtro de la mediana tiene la ventaja de que el valor final del pixel es un valor real
presente en la imagen y no un promedio, de este modo se reduce el efecto borroso que
tienen las imágenes que han sufrido un filtro de media. Además el filtro de la mediana es
menos sensible a valores extremos. El inconveniente es que resulta más complejo de
calcular ya que hay que ordenar los diferentes valores que aparecen en los pixeles
incluidos en la ventana y determinar cuál es el valor central.
 • Filtros adaptativos. Son considerablemente más complejos ya que los coeficientes de
ponderación se recalculan para cada uno de los pixels en función del histograma de los
ND que aparecen en la ventana. Se han utilizado con gran éxito filtros adaptativos para
eliminar el speckle de las imágenes de radar y para detectar, con un solo filtro, diferentes
elementos.
 • Filtros gaussianos. Simulan una distribución gaussiana bivariante. El valor máximo
aparece en el pixel central y disminuye hacia los extremos tanto más rápido cuanto
menor sea el parámetro de desviación típica s. El resultado será un conjunto de valores
entre 0 y 1. Para transformar la matriz a una matriz de números enteros se divide toda la
matriz por el menor de los valores obtenidos
Técnicas de segmentación
 La operación de segmentación trata de distinguir si un píxel pertenece,
o no, a un objeto de interés y, por lo tanto, produce una imagen
binaria. Todavía no hay una teoría unificada de la segmentación de
imágenes, solamente disponemos de un conjunto de algoritmos
 Los métodos de segmentación se pueden agrupar en cuatro clases
diferentes:
 Métodos basados en píxeles
 Métodos basados en bordes
 Métodos basados en regiones
 Métodos basados en modelos
Qué es reconstrucción
morfológica?
 Es una técnica de procesamiento no lineal de la señal, caracterizada
en realzar la geometría y forma de los objetos. Su fundamento
matemático se basa en la teoría de conjunto. Aunque en un principio
se aplicará sobre las imágenes binarizadas, luego se extenderá a las
imágenes en niveles de grises. Este uso a niveles de grises permitirá
vislumbrar que el procesamiento morfológico también se puede utilizar
como técnica de procesado de la señal.
 El objetivo de las transformaciones morfológicos es la extracción de
estructuras geométricas en los conjuntos sobre los que se opera,
mediante la utilización de otro conjunto de forma conocida, al que se
le denomina elemento estructurante. El tamaño y forma del elemento
estructurante se elige, a priori, de acuerdo con la morfología sobre la
que va a interseccionar y en función de la obtención de formas que se
desea extraer. En la figura adjunta aparecen algunos tipos de
elementos estructurantes empleados en el procesamiento morfológico.
Qué es extracción de
características en una imagen?
 Es el proceso mediante el cual por medio el cual se describen
diferentes técnicas las cuales nos permiten ver y representar una
imagen de mejor manera.

Qué es un clasificador de umbral?


 Para asignar un valor de regresión logística a una categoría binaria,
debes definir un umbral de clasificación (también denominado umbral
de decisión). Un valor por encima de ese umbral indica "es spam"; un
valor por debajo indica "no es spam". Resulta tentador suponer que el
umbral de clasificación siempre debe ser 0.5, pero los umbrales
dependen de cada problema y, por lo tanto, son valores que se
deben ajustar.
Qué es un clasificador supervisado
y no supervisado en imágenes?
 Las clasificaciones no supervisadas son aquellas en las que el algoritmo
clasificador no necesita de más información que la escena a clasificar y algunos
parámetros que límiten el número de clases. Estos mecanismos de clasificación
basan su efecto en la búsqueda de clases con suficiente separabilidad espectral
como para conseguir diferenciar unos elementos de otros.
 clasificación supervisados son aquellos en los que, a partir de un conjunto de
ejemplos clasificados (conjunto de entrenamiento), intentamos asignar una
clasificación a un segundo conjunto de ejemplos.

Qué es máquina de soporte vectorial?


 (MSV), pertenecen a la familia de clasificadores lineales. Mediante una función
matemática denominada kernel. Realizan un mapeo de los vectores de entrada
para determinar la linealidad o no de los casos los cuales serán integrados a los
Multiplicadores de Lagrange para minimizar el Riesgo Empírico y la Dimensión de
Vapnik-Chervonenkis
Qué y cuáles tipos de kernels tiene
una SVM?
Funciones en Matlab
 Strel representa un elemento estructurante morfológico plano, que
es una parte esencial de las operaciones de dilatación y erosión
morfológicas.
 Imshow: muestra la imagen generada a partir del código ingresado
 Funcion Prop: La función plot adopta diferentes formas, según los
argumentos de entrada.
 •Si y es un vector, plot(y) grafica los elementos de y contra los
índices de los elementos de y y conecta los puntos con líneas
rectas.
 •Si se especifican dos vectores como argumentos, plot(x,y)
produce un gráfico de y contra x.
Cómo funciona y que datos obtienen
de la función “bwlabel”
Crea la matriz de etiquetas utilizando objetos conectados a 4.
(BW)devuelve la matriz de etiquetas Lque contiene etiquetas L = bwlabel (BW, 4)
para los objetos conectados a 8 que se encuentran en BW.
L=8×8
L = bwlabel(BW,conn) Devuelve una matriz de etiquetas,
donde se connespecifica la conectividad. 11100000
[L,n] = bwlabel(___) También devuelve n, el número de objetos 11102200
conectados que se encuentran en BW. 11102200
11100030
Crea una pequeña imagen binaria. 11100030
BW = lógico ([1 1 1 0 0 0 0 0 0 11100030
11100330
11101100 11100000
11101100
Utilice el findcomando para obtener las coordenadas de fila y columna del objeto
11100010 etiquetado "2".
[r, c] = encontrar (L == 2);
11100010
rc = [rc]
11100010 rc = 4 × 2
11100110 25
1 1 1 0 0 0 0 0]); 35
26
36
Qué valor se obtiene en las
variables “Lo” y en “num”?
 Se obtiene un valor de identificador matriz 630x473 double para Lo
muestra los elementos etiquetados y para num son los números de
elementos que tiene la imagen en este caso es 1

Cómo funciona y que datos obtienen


de la función “regionprops”?
 RegionProps: Función en MatLAB destinada a las propiedades de
región de las imágenes a blanco y negros, como centroide,
perímetro, área, entre otros.
Qué es evaluación cualitativa en
tratamiento de imágenes?
 es aquel que emplea el método observativo donde se encarga de describir la
comparación de los resultados obtenidos del clasificador que se ha diseñado
llevándolo a juicio con el clasificador experto basándose en los datos tomados
de la realidad evaluada. Así mismo bajo una narración argumentativa se
revelas las cualidades que sean significativas que se han observado
Qué es evaluación cuantitativa en
tratamiento de imágenes?
 forma parte esencial del análisis de resultados del procesamiento de imágenes
digitales, donde a partir de los valores obtenidos de un producto final se
entregan resultados ya sean verdaderos o falsos de manera determinada sin
tomar acción alguna sobre estos ni tampoco se intenta realizar alguna acción
para hacer alguna mejora, se asume como veredicto final apoyándose en la
medición de las variables.
Qué es verdaderos positivos, falsos positivos,
verdaderos negativos, falsos negativos, en
tratamiento de imágenes?
 los verdaderos positivos son donde el clasificador identifica la imagen
como enferma concordando con el punto de vista del experto dende
se comprueba que efectivamente la imagen si está enferma.
 El falso positivo es donde le clasificador diagnostica que la imagen es
enferma, pero desde el punto de vista del experto se sabe que la
imagen es enferma arrojando así un error a nivel de clasificador.
 El verdadero negativo es donde el diagnostico que arroja el
clasificador es negativo donde la imagen del cerebro para este caso
es sana y desde el punto de vista de experto se sabe que la imagen es
sana.
 El falso negativo es donde el clasificador arroja que la imagen es sana,
pero desde el punto de vista del experto se conoce que la imagen es
enferma, cuyo resultado es un error.
Qué es precisión y exactitud en
tratamiento de imágenes?
 son conceptos de los resultados estadísticos los cuales son el
producto de los datos observados en la base de datos y de la tabla
Ground Truth esenciales para el análisis de resultados: la precisión es
la división del verdadero positivo sobre el verdadero positivo más el
falso positivo (VP/VP+FP) cuyo fin es arrojar los mismos resultados
bajo diferentes condiciones presentadas; la exactitud es la suma
del Verdadero Positivo con el verdadero negativo sobre el
verdadero positivo más el falso positivo más el falso negativo más el
verdadero negativo (VP+VN/VP+FP+FN+VN) la cual es la diferencia
obtenida entre los valores reales con los valores obtenidos y
medidos en los clasificadores.
Qué es y cómo se realiza la curva
característica operativa del receptor ROC?

 Es una manera gráfica y estadística


que se hace en el análisis de
resultados para poder interpretar el
comportamiento de un clasificador y
de los resultados que este ha
arrojado en cuanto a las
observaciones y mediciones hechas.
Mide a nivel de sensibilidad el
clasificador binario bajo el umbral
de discriminación, de acuerdo con
la cantidad de muestras se
obtendrán la cantidad de datos.

Вам также может понравиться