Вы находитесь на странице: 1из 56

UNIDAD 1

 Lectura de imagen
 Espacios de color
 Niveles de grises
 ¿CUÁL ES LA DEFINICIÓN DE UNA IMAGEN DIGITAL?

Una imagen digital o gráfico digital es una representación bidimensional de una imagen a
partir de una matriz numérica, frecuentemente en binario (unos y ceros). Dependiendo de
si la resolución de la imagen es estática o dinámica, puede tratarse de una imagen matricial
(o mapa de bits) o de un gráfico vectorial. El mapa de bits es el formato más utilizado.
 
 ¿QUÉ ES HISTOGRAMA?

El histograma de una imagen f es una gráfica que representa los niveles de intensidad del
color de f con respecto al número de píxeles presentes en f con cada intensidad de color.
Puede ayudarnos para controlar la exposición en nuestras fotos, así como para corregir los
colores.
 ¿QUÉ ES TRATAMIENTO DE IMÁGENES?

El procesamiento digital de imágenes es el conjunto de técnicas que se aplican a las imágenes


digitales con el objetivo de mejorar la calidad o facilitar la búsqueda de información.

 ¿QUÉ SIGNIFICADO TIENE UN PIXEL EN UNA IMAGEN?

El píxel, por lo tanto, puede definirse como la más pequeña de las unidades homogéneas en color
que componen una imagen de tipo digital. Al ampliar una de estas imágenes a través de un zoom, es
posible observar los píxeles que permiten la creación de la imagen. Ante la vista se presentan como
pequeños cuadrados o rectángulos en blanco, negro o matices de gris.
 ¿QUÉ TONALIDAD O COLOR ALMACENA CADA NIVEL DE GRIS?

Cada píxel de una imagen almacena la información de su tono o luminosidad, donde el tono
negro es el valor 0 y el blanco el valor más alto (normalmente 255 en escala de grises), pero
en formato binario. El formato binario es una notación numérica como puede ser la que
utilizamos normalmente, el decimal, con la diferencia de que la binaria es la única que
entienden los ordenadores.

 DIFERENCIA ENTRE LOS ESPACIOS DE COLOR RGB Y HSV

RGB es un modelo de color aditivo. Significa que se pueden usar diferentes proporciones de
luz roja, azul y verde para producir color. El modelo de color RGB se creó específicamente
para fines de visualización (pantallas de visualización, proyectores, etc.).
UNIDAD 2

 Detección de bordes
 Binarización
 Segmentación de objetos
 Filtrado
 Reconstrucción morfológica
 ¿QUÉ ES MORALIZACIÓN O BINARIZACIÓN?

La umbralización de imágenes es el proceso por el cual se busca un umbral óptimo que


permita distinguir en una imagen los objetos del fondo de los objetos del primer plano.
Este umbral es el punto (o valor) en el cual el histograma de una imagen se divide en dos
picos. Las técnicas de umbralizacion buscan obtener un valor de umbral que permita
binarizar a la imagen separando adecuadamente el fondo (background) y el objeto a
separar (foreground).

 ¿QUÉ ES UMBRAL DE OTSU?

El método de Otsu calcula el valor umbral de forma que la dispersión dentro de cada
segmento sea lo más pequeña posible, pero al mismo tiempo la dispersión sea lo más alta
posible entre segmentos diferentes. Para ello se calcula el cociente entre ambas variancias
y se busca un valor umbral para el que este cociente sea máximo.
 ¿QUÉ ES REDUCCIÓN DE RUIDO EN UNA IMAGEN BINARIA?

El ruido es un defecto de la información no deseado que contamina y degrada la imagen. Se


manifiesta generalmente en pixeles aislados que toman valores distintos de los reales.se reduce el
ruido aplicando filtros en la imagen, la idea es aproximar el valor original del pixel usando
información de la propia imagen o externa.

 ¿QUÉ ES FILTRO MEDIANA Y CÓMO SE IMPLEMENTA EN MATLAB?

Se realiza para atenuar el ruido de una imagen, usualmente se aplica a imágenes en escala de
grises. Los píxeles de la nueva imagen se generan calculando la mediana del conjunto de píxeles
del entorno de vecindad del píxel correspondiente a la imagen origen. De esta forma se
homogeneizan los píxeles de intensidad muy diferente con respecto a la de los vecinos. Este tipo
de filtro es bastante indicado cuando se tiene ruido aleatorio.
 ¿CUÁL ES LA DIFERENCIA ENTRE RUIDO GAUSSIANO Y RUIDO DE SAL Y
PIMIENTA?

Ruido Gaussiano (o normal): En el ruido de tipo Gaussiano, todos los píxeles que
componen la imagen cambian su valor en base a una distribución normal o gaussiana. La
distribución mostrada en la siguiente figura, el ruido está centrado en el valor Z (que se
corresponde con el valor de intensidad del píxel) y tiene una desviación estándar de sigma.

Ruido impulsivo (o sal y pimienta): El ruido Sal y pimienta es un caso particular del
ruido impulsivo. El valor que toma el píxel no tiene relación con el valor original, sino que
toma valores muy altos o muy bajos, es decir, casi blanco o negro.
 ¿PARA QUÉ SIRVEN LOS FILTROS DE SUAVIZADO EN UNA IMAGEN?

Tienen por objeto reducir el ruido y/o efectos espurios que pueden presentarse en una imagen a
consecuencia del proceso de captura, digitalización y transmisión. Su utilización es normalmente
necesaria antes de la aplicación de un detector de bordes.

 TÉCNICAS DE SEGMENTACIÓN DE IMÁGENES

Técnica Umbralización:La umbralización es una técnica de segmentación ampliamente utilizada


en la industria. Se trata de definir un umbral, de forma que separe los objetos de interés respecto
del fondo. Para su aplicación se exige una clara diferencia entre los objetos y el fondo de la
escena. La técnica más utilizada es la segmentación por análisis del histograma. Cuando éste
presenta dos picos y en entre ambos hay un valle, el umbral quedará fijado por la posición del
valle. Los píxeles de los objetos se les aginará ‘1’ y al fondo ‘0’, quedando binarizada la imagen.
UNIDAD 3

 Extracción de característica
 Clasificación de imágenes
 Identificación de tipos o grupos
 ¿QUÉ ES EXTRACCIÓN DE CARACTERÍSTICAS EN UNA IMAGEN?

El proceso de extracción de características estará orientado a la manipulación de imágenes


digitales. Hay características que no percibimos a primera vista, pero que están
implícitamente dentro de las imágenes, para ello se utilizan técnicas de minería de datos, que
extraen dicha información.
 
Las características de las imágenes pueden ser de varios tipos, como por ejemplo: número de
líneas horizontales y verticales, colores típicos, texturas, uniformidad, etc.

La extracción de características en una imagen es uno de los pasos más importantes para una
clasificación de imágenes completa, debido a que mediante la extracción podemos
posteriormente clasificarlas de forma adecuada y sin demasiados errores en una u otra clase.
Las características de las imágenes pueden ser de varios tipos, como, por ejemplo: número de
líneas horizontales y verticales, colores típicos, texturas, uniformidad, etc.
 ¿QUÉ ES UN CLASIFICADOR DE UMBRAL?

Algoritmo utilizado para asignar un elemento entrante no etiquetado en una categoría


concreta conocida. Dicho algoritmo, permite pues, ordenar o disponer por clases elementos
entrantes, a partir de cierta información característica de estos.

Una manera de implementar un clasificador es seleccionar un conjunto de ejemplos


etiquetados y tratar de definir una regla que permita asignar una etiqueta a cualquier otro
dato de entrada.

En ocasiones, el término clasificador también es utilizado para referirse a la función


matemática que implementa el algoritmo de clasificación.
 ¿QUÉ ES UN CLASIFICADOR SUPERVISADO Y NO SUPERVISADO?

El clasificador supervisado es una técnica de aprendizaje artificial que elabora una función
matemática (hipótesis) a partir de datos de entrenamiento previamente etiquetados. Donde el
usuario con unos datos de entrenamiento en una máquina puede deducir entre un conjunto de
datos de entrada a que clase pertenecen los datos de salida.

El clasificador no supervisado, no disponen de un conjunto de entrenamiento que permita


conocer las etiquetas de los datos, así pues, se hace necesario el uso de técnicas de
agrupamiento que intentan construir estas etiquetas.

Este sistema de agrupamiento (o clustering) tiene como finalidad catalogar los objetos en
conjuntos tales que los que estén en el mismo sean muy semejantes entre sí, mientras que el
grado de semejanza entre grupos diferentes sea bajo aun así, uno de los problemas que
presenta este método es la toma de decisiones a la hora de escoger un patrón entre todos los
proporcionados.
 ¿QUÉ ES MÁQUINA DE SOPORTE VECTORIAL?

Son un conjunto de algoritmos de aprendizaje supervisado que se utilizan para resolver


problemas de regresión, agrupamiento y multiclasificación, se basan en la transformación
de un conjunto de datos pertenecientes a una dimensión n, hacia un espacio de dimensión
superior, para que de esta manera se pueda tratar el problema de manera lineal, es decir
resolviendo el problema sin importar la dimensionalidad de los datos.

Una SVM no depende del tamaño de la muestra por cuanto se puede utilizar una cantidad
limitada sin que esto afecte su desempeño, los algoritmos se pueden ajustar a problemas no
lineales.
 QUÉ Y CUÁLES TIPOS DE KERNEL TIENE UNA SVM?

Se denomina kernel a la parte más importante de un sistema operativo, parte encargada de


acceder a los distintos dispositivos de los que una computadora dispone. El kernel también
organiza a la manera en la que se ejecutan los diversos programas que se cargan en memoria.
De esta manera, el kernel se encarga de los aspectos más críticos de un sistema operativo,
sirviendo como mediación entre el software y el hardware. Si bien este tipo de diferenciación
existente entre las diversas partes de un sistema operativo se presenta en aquellos que son más
utilizados, es importante señalar, no obstante, que en algunos casos la misma se omite.
 
SVM funciona correlacionando datos a un espacio de características de grandes dimensiones
de forma que los puntos de datos se puedan categorizar, incluso si los datos no se puedan
separar linealmente de otro modo. Se detecta un separador entre las categorías y los datos se
transforman de forma que el separador se puede extraer como un hiperplano. Tras ello, las
características de los nuevos datos se pueden utilizar para predecir el grupo al que pertenece el
nuevo registro.
UNIDAD 5

 Evaluación cualitativa
 Evaluación cuantitativa
 Análisis de resultados
 Curva ROC
 ¿Qué es verdaderos positivos, falsos positivos, verdaderos negativos, falsos negativos?

  Verdaderos positivo: (VP)


 diagnóstico positivo enfermedad presente.

 Falsos positivos: (FP)


 diagnóstico positivo enfermedad ausente.

 Verdaderos negativos: (VN)


 diagnóstico negativo enfermedad ausente.

 Falsos negativos: (FN)


 diagnóstico negativo enfermedad presente.
 ¿QUÉ ES EVALUACIÓN CUALITATIVA EN TRATAMIENTO DE IMÁGENES?

La evaluación cualitativa se realiza a partir de la captura de las evidencias, es decir en los


datos, el comportamiento, evidencias de carácter axiológico, entre otros, que le permiten al
“evaluador” emitir un juicio de valor.

 ¿QUÉ ES EVALUACIÓN CUANTITATIVA EN TRATAMIENTO DE IMÁGENES?

La evaluación cuantitativa se refleja en resultados numéricos que nos permiten comparar el


resultado obtenido con puntaje máximo para poder evaluar algunos parámetros.
 
Este tipo de evaluación requiere en primera instancia de un instrumento para poder recoger
esa información, para posteriormente evaluar los resultados, comparar con el estándar
deseado y emitir un juicio.
 ¿QUÉ ES Y CÓMO SE REALIZA LA CURVA CARACTERÍSTICA OPERATIVA
DEL RECEPTOR ROC?

 Es una representación gráfica de la sensibilidad frente a la especificidad para un sistema


clasificador binario según se varía el umbral de discriminación. Otra interpretación de este
gráfico es la representación de la razón o ratio de verdaderos positivos (VPR = Razón de
Verdaderos Positivos) frente a la razón o ratio de falsos positivos (FPR = Razón de Falsos
Positivos) también según se varía el umbral de discriminación (valor a partir del cual
decidimos que un caso es un positivo). ROC también puede significar Relative Operating
Characteristic (Característica Operativa Relativa) porque es una comparación de dos
características operativas (VPR y FPR) según cambiamos el umbral para la decisión.

 Para desarrollar la curva ROC se utiliza la información de sensibilidad y 1- especificidad


 La sensibilidad nos indica la capacidad de nuestro estimador para dar como casos
positivos los casos realmente enfermos; proporción de enfermos correctamente
identificados. Es decir, la sensibilidad caracteriza la capacidad de la prueba para detectar la
enfermedad en sujetos enfermos.

 La especificidad nos indica la capacidad de nuestro estimador para dar como casos
negativos los casos realmente sanos; proporción de sanos correctamente identificados. Es
decir, la especificidad caracteriza la capacidad de la prueba para detectar la ausencia de la
enfermedad en sujetos sanos.

 Lo ideal es que los datos obtenidos se encuentren en 1 en sensibilidad y 0 en 1 –


especificidad
DESCRIPCIÓN DEL PROYECTO

 En un cultivo de naranjos de la universidad UNAD, se han presentado diferentes tipos de


enfermedades en la hoja del árbol de naranjo. Diferentes investigadores han detectado 4
tipos de bacterias: mosca blanca, ácaros, pulgones y Huanglongbing.

 Al descubrir las bacterias asociadas a las enfermedades desarrolladas, se ha decidido


buscar a un grupo de estudiantes de la universidad quienes puedan desarrollar un
tratamiento de imágenes para prever específicamente la enfermedad de “PULGONES” y
poder dar una alerta a tiempo de la hoja enferma, en el cual, se podrá aplicar el insecticida
adecuado sin tener falsas alarmas que puedan dañar por completo el fruto o el cultivo.
 Con el fin de dar la alerta temprana de la hoja de naranjo, se deben seguir los siguientes
pasos:

 1. Pre procesamiento de imágenes


 2. Procesamiento de imágenes
 3. Identificación de características
 4. Implementación de clasificador
 5. Resultados
 6. Análisis de resultados
 Enfermedad en las hojas de los naranjos:

Pulgones: Son insectos de 3 milímetros de color verde, rojo, amarillo y negro. Esta plaga
succiona la savia y la melaza secretada, disminuyendo la capacidad fotosintética del árbol
y disminuye su producción. En las hojas aparecen manchas amarillentas, el tallo se enrolla
y de deforma. Estos insectos segregan una sustancia pegajosa que atrae a las hormigas y al
hongo.
Procesamiento, clasificación y análisis de
resultados de las hojas de naranjo.
Por medio del siguiente código se realiza el procesamiento de las imágenes y
extracción de información
 Trabajando con un umbral de 0.2
 Y un numpixel de 50
 >> Hojaenferma=imread ('hojaenferma1.jpg');
 >> Hojaenferma=im2double (Hojaenferma);
 >> figure;
 >> imshow(Hojaenferma);
 >> umbral=0.2;
 >> binHojaenferma=im2bw(Hojaenferma,umbral);
 >> figure;
 >> imshow (binHojaenferma)
 >> numpixels=50;
 >> Filtro=bwareaopen(binHojaenferma,numpixels);
 >> figure;
 >> imshow(Filtro);
 [Lo num]=bwlabel(Filtro);
 prop=regionprops(Lo);
 figure;
 imshow (Filtro);
 MinArea=min([prop.Area])
 MaxArea=max([prop.Area])
Hoja enferma 1
Hoja enferma 2
Hoja enferma 3
Hoja enferma 4
Hoja enferma 5
Hoja enferma 6
Hoja enferma 7
Hoja enferma 8
Sana 1
Sana 2
Sana 3
Sana 4
Sana 5
Sana 6
Sana 7
Sana 8
Sana 9
Extracción de información

 Se lleva a cabo el tratamiento de cada una de las imágenes y la extracción de información


con el fin de llevar a cabo una correcta clasificación.

 A continuación se comparte la tabla con los datos obtenidos de cada imagen por medio de
la SVM.
Base De Datos De Prueba
Lectura de información para la clasificación

 Con la información obtenida se diligencia una tabal en Excel con los datos de cada una de
las imágenes la cual posteriormente vamos a leer en MatLab.
Entrenamiento de la maquina

 Para el entrenamiento de la maquina utilizaremos el código de la fase 5

 >> datos=xlsread('datos.xlsx');
 >> caracteristicas=datos(1:end,1:3);
 >> entrenamiento=datos(1:end,4);
 >>
svmStruct=svmtrain(caracteristicas,entrenamiento,'kernel_Function','linear','showplot',false
);
Evaluación cualitativa
CURVA ROC
 datos y gráfica obtenida.
CURVA ROC
 De acuerdo a con el tratamiento realizado a las imágenes asignadas para el entrenamiento
de la SVM: hojaenferma1, hojaenferma2, hojaenferma3, hojaenferma7, hojaenferma8,
sana1, sana2, sana3, sana12, y sana13, se lleva a cabo la creación del código adecuado para
la clasificación correcta de cada una de las hojas con base en un único código haciendo uso
de un mismo numpixel y un único umbral buscando el más adecuado para todas las hojas,
en este caso se realizó el entrenamiento de la maquina con un valor de 50 numpixels y un
umbral 0.2. Con estos valores se logró obtener la mayor cantidad de moscas en las hojas
enfermas, ya que al variar estos datos se perdía información de las moscas.
 Como resultado se obtuvo una buena clasificación, con solo una de las hojas sanas la
detecto como enferma, pero el resto de hojas tanto sanas como enfermas las detecto igual
que la clasificación de experto.
 Al realizar la evaluación cualitativa de los resultados obtenidos en la fase 3 se obtienen los
siguientes resultados:
 Con el resultado de la sensibilidad (100%) y especificidad-1 (88,89%), se obtiene la curva
característica operativa del receptor ROC:
En la curva característica operativa del receptor ROC, se pueden observar tres líneas:

Línea Verde: Clasificador perfecto.

Línea Azul: Resultado de mi clasificador (obtenido de utilizar el umbral y numpixel de la


fase anterior).

Línea Roja: Limite de mi clasificador.

 En conclusión: Se puede utilizar el clasificador obtenido porque está por encima del límite
de mi clasificador (Línea Roja) y es casi perfecto.
CÓMO EL GRUPO FUE TRABAJANDO DURANTE EL
SEMESTRE PARA DESARROLLAR EL PROYECTO.

 Durante el semestre se realizo una distribución de temas y actividades por unidades, en las
cuales iniciamos a investigar sobre el tratamiento de imágenes y avanzar en el desarrollo
del proyecto, en cada una de las fases se llevo a cabo una investigación de preguntas las
cuales contribuían con la comprensión de la temática, se compartían de manera individual
en el foro, se retroalimentaban y se elegían las mejores respuestas para el consolidado
grupal, así mismo se llevaba a cabo el desarrollo del componente practico haciendo uso del
software Matlab y se trabajo de acuerdo a las instrucciones de la guía y las webconference
de cada unidad.
CONCLUSIONES

 En la investigación el clasificador supervisado es una técnica de aprendizaje artificial que


elabora una función matemática (hipótesis) a partir de datos de entrenamiento previamente
etiquetados, mientras que el clasificador no supervisado, no disponen de un conjunto de
entrenamiento que permita conocer las etiquetas de los datos, así pues, se hace necesario el
uso de técnicas de agrupamiento que intentan construir estas etiquetas.

 En la clasificación de imágenes por medio de SVM se debe tener en cuenta la calificación


de los FP, FN, VP y VN.

 Es importante identificar la mejor combinación de numpixel y umbral en la


implementación del código para de esta manera obtener los mejores resultados con todas
las imágenes ya que no se deben realizar cambios.
 Se lleva a cabo el tratamiento de las imágenes por medio de la maquina de soporte
vectorial, la clasificación en este caso no fue optima ya que no se obtuvo una excelente
clasificación.

 En cuanto al curso se puede buscar algo mas útil a la vida diaria o en cuanto al campo de
las telecomunicaciones, este tratamiento no lo veo enfocado a la carrera y no identifico en
que momento puedo hacer uso de esto.

 La Extracción de características se ocupa de la detección y localización de entidades


geométricas simples y complejas. Desde entidades simples como líneas y puntos hasta
geometrías complejas como curvas y cuadráticas.

 Los Tipos de funciones KERNEL son Polinomial-homogénea, Perceptron, Función de


base radial Gaussiana (separado por un hiperplano en el espacio transformado) y Sigmoid.

Вам также может понравиться