Академический Документы
Профессиональный Документы
Культура Документы
Lectura de imagen
Espacios de color
Niveles de grises
¿CUÁL ES LA DEFINICIÓN DE UNA IMAGEN DIGITAL?
Una imagen digital o gráfico digital es una representación bidimensional de una imagen a
partir de una matriz numérica, frecuentemente en binario (unos y ceros). Dependiendo de
si la resolución de la imagen es estática o dinámica, puede tratarse de una imagen matricial
(o mapa de bits) o de un gráfico vectorial. El mapa de bits es el formato más utilizado.
¿QUÉ ES HISTOGRAMA?
El histograma de una imagen f es una gráfica que representa los niveles de intensidad del
color de f con respecto al número de píxeles presentes en f con cada intensidad de color.
Puede ayudarnos para controlar la exposición en nuestras fotos, así como para corregir los
colores.
¿QUÉ ES TRATAMIENTO DE IMÁGENES?
El píxel, por lo tanto, puede definirse como la más pequeña de las unidades homogéneas en color
que componen una imagen de tipo digital. Al ampliar una de estas imágenes a través de un zoom, es
posible observar los píxeles que permiten la creación de la imagen. Ante la vista se presentan como
pequeños cuadrados o rectángulos en blanco, negro o matices de gris.
¿QUÉ TONALIDAD O COLOR ALMACENA CADA NIVEL DE GRIS?
Cada píxel de una imagen almacena la información de su tono o luminosidad, donde el tono
negro es el valor 0 y el blanco el valor más alto (normalmente 255 en escala de grises), pero
en formato binario. El formato binario es una notación numérica como puede ser la que
utilizamos normalmente, el decimal, con la diferencia de que la binaria es la única que
entienden los ordenadores.
RGB es un modelo de color aditivo. Significa que se pueden usar diferentes proporciones de
luz roja, azul y verde para producir color. El modelo de color RGB se creó específicamente
para fines de visualización (pantallas de visualización, proyectores, etc.).
UNIDAD 2
Detección de bordes
Binarización
Segmentación de objetos
Filtrado
Reconstrucción morfológica
¿QUÉ ES MORALIZACIÓN O BINARIZACIÓN?
El método de Otsu calcula el valor umbral de forma que la dispersión dentro de cada
segmento sea lo más pequeña posible, pero al mismo tiempo la dispersión sea lo más alta
posible entre segmentos diferentes. Para ello se calcula el cociente entre ambas variancias
y se busca un valor umbral para el que este cociente sea máximo.
¿QUÉ ES REDUCCIÓN DE RUIDO EN UNA IMAGEN BINARIA?
Se realiza para atenuar el ruido de una imagen, usualmente se aplica a imágenes en escala de
grises. Los píxeles de la nueva imagen se generan calculando la mediana del conjunto de píxeles
del entorno de vecindad del píxel correspondiente a la imagen origen. De esta forma se
homogeneizan los píxeles de intensidad muy diferente con respecto a la de los vecinos. Este tipo
de filtro es bastante indicado cuando se tiene ruido aleatorio.
¿CUÁL ES LA DIFERENCIA ENTRE RUIDO GAUSSIANO Y RUIDO DE SAL Y
PIMIENTA?
Ruido Gaussiano (o normal): En el ruido de tipo Gaussiano, todos los píxeles que
componen la imagen cambian su valor en base a una distribución normal o gaussiana. La
distribución mostrada en la siguiente figura, el ruido está centrado en el valor Z (que se
corresponde con el valor de intensidad del píxel) y tiene una desviación estándar de sigma.
Ruido impulsivo (o sal y pimienta): El ruido Sal y pimienta es un caso particular del
ruido impulsivo. El valor que toma el píxel no tiene relación con el valor original, sino que
toma valores muy altos o muy bajos, es decir, casi blanco o negro.
¿PARA QUÉ SIRVEN LOS FILTROS DE SUAVIZADO EN UNA IMAGEN?
Tienen por objeto reducir el ruido y/o efectos espurios que pueden presentarse en una imagen a
consecuencia del proceso de captura, digitalización y transmisión. Su utilización es normalmente
necesaria antes de la aplicación de un detector de bordes.
Extracción de característica
Clasificación de imágenes
Identificación de tipos o grupos
¿QUÉ ES EXTRACCIÓN DE CARACTERÍSTICAS EN UNA IMAGEN?
La extracción de características en una imagen es uno de los pasos más importantes para una
clasificación de imágenes completa, debido a que mediante la extracción podemos
posteriormente clasificarlas de forma adecuada y sin demasiados errores en una u otra clase.
Las características de las imágenes pueden ser de varios tipos, como, por ejemplo: número de
líneas horizontales y verticales, colores típicos, texturas, uniformidad, etc.
¿QUÉ ES UN CLASIFICADOR DE UMBRAL?
El clasificador supervisado es una técnica de aprendizaje artificial que elabora una función
matemática (hipótesis) a partir de datos de entrenamiento previamente etiquetados. Donde el
usuario con unos datos de entrenamiento en una máquina puede deducir entre un conjunto de
datos de entrada a que clase pertenecen los datos de salida.
Este sistema de agrupamiento (o clustering) tiene como finalidad catalogar los objetos en
conjuntos tales que los que estén en el mismo sean muy semejantes entre sí, mientras que el
grado de semejanza entre grupos diferentes sea bajo aun así, uno de los problemas que
presenta este método es la toma de decisiones a la hora de escoger un patrón entre todos los
proporcionados.
¿QUÉ ES MÁQUINA DE SOPORTE VECTORIAL?
Una SVM no depende del tamaño de la muestra por cuanto se puede utilizar una cantidad
limitada sin que esto afecte su desempeño, los algoritmos se pueden ajustar a problemas no
lineales.
QUÉ Y CUÁLES TIPOS DE KERNEL TIENE UNA SVM?
Evaluación cualitativa
Evaluación cuantitativa
Análisis de resultados
Curva ROC
¿Qué es verdaderos positivos, falsos positivos, verdaderos negativos, falsos negativos?
La especificidad nos indica la capacidad de nuestro estimador para dar como casos
negativos los casos realmente sanos; proporción de sanos correctamente identificados. Es
decir, la especificidad caracteriza la capacidad de la prueba para detectar la ausencia de la
enfermedad en sujetos sanos.
Pulgones: Son insectos de 3 milímetros de color verde, rojo, amarillo y negro. Esta plaga
succiona la savia y la melaza secretada, disminuyendo la capacidad fotosintética del árbol
y disminuye su producción. En las hojas aparecen manchas amarillentas, el tallo se enrolla
y de deforma. Estos insectos segregan una sustancia pegajosa que atrae a las hormigas y al
hongo.
Procesamiento, clasificación y análisis de
resultados de las hojas de naranjo.
Por medio del siguiente código se realiza el procesamiento de las imágenes y
extracción de información
Trabajando con un umbral de 0.2
Y un numpixel de 50
>> Hojaenferma=imread ('hojaenferma1.jpg');
>> Hojaenferma=im2double (Hojaenferma);
>> figure;
>> imshow(Hojaenferma);
>> umbral=0.2;
>> binHojaenferma=im2bw(Hojaenferma,umbral);
>> figure;
>> imshow (binHojaenferma)
>> numpixels=50;
>> Filtro=bwareaopen(binHojaenferma,numpixels);
>> figure;
>> imshow(Filtro);
[Lo num]=bwlabel(Filtro);
prop=regionprops(Lo);
figure;
imshow (Filtro);
MinArea=min([prop.Area])
MaxArea=max([prop.Area])
Hoja enferma 1
Hoja enferma 2
Hoja enferma 3
Hoja enferma 4
Hoja enferma 5
Hoja enferma 6
Hoja enferma 7
Hoja enferma 8
Sana 1
Sana 2
Sana 3
Sana 4
Sana 5
Sana 6
Sana 7
Sana 8
Sana 9
Extracción de información
A continuación se comparte la tabla con los datos obtenidos de cada imagen por medio de
la SVM.
Base De Datos De Prueba
Lectura de información para la clasificación
Con la información obtenida se diligencia una tabal en Excel con los datos de cada una de
las imágenes la cual posteriormente vamos a leer en MatLab.
Entrenamiento de la maquina
>> datos=xlsread('datos.xlsx');
>> caracteristicas=datos(1:end,1:3);
>> entrenamiento=datos(1:end,4);
>>
svmStruct=svmtrain(caracteristicas,entrenamiento,'kernel_Function','linear','showplot',false
);
Evaluación cualitativa
CURVA ROC
datos y gráfica obtenida.
CURVA ROC
De acuerdo a con el tratamiento realizado a las imágenes asignadas para el entrenamiento
de la SVM: hojaenferma1, hojaenferma2, hojaenferma3, hojaenferma7, hojaenferma8,
sana1, sana2, sana3, sana12, y sana13, se lleva a cabo la creación del código adecuado para
la clasificación correcta de cada una de las hojas con base en un único código haciendo uso
de un mismo numpixel y un único umbral buscando el más adecuado para todas las hojas,
en este caso se realizó el entrenamiento de la maquina con un valor de 50 numpixels y un
umbral 0.2. Con estos valores se logró obtener la mayor cantidad de moscas en las hojas
enfermas, ya que al variar estos datos se perdía información de las moscas.
Como resultado se obtuvo una buena clasificación, con solo una de las hojas sanas la
detecto como enferma, pero el resto de hojas tanto sanas como enfermas las detecto igual
que la clasificación de experto.
Al realizar la evaluación cualitativa de los resultados obtenidos en la fase 3 se obtienen los
siguientes resultados:
Con el resultado de la sensibilidad (100%) y especificidad-1 (88,89%), se obtiene la curva
característica operativa del receptor ROC:
En la curva característica operativa del receptor ROC, se pueden observar tres líneas:
En conclusión: Se puede utilizar el clasificador obtenido porque está por encima del límite
de mi clasificador (Línea Roja) y es casi perfecto.
CÓMO EL GRUPO FUE TRABAJANDO DURANTE EL
SEMESTRE PARA DESARROLLAR EL PROYECTO.
Durante el semestre se realizo una distribución de temas y actividades por unidades, en las
cuales iniciamos a investigar sobre el tratamiento de imágenes y avanzar en el desarrollo
del proyecto, en cada una de las fases se llevo a cabo una investigación de preguntas las
cuales contribuían con la comprensión de la temática, se compartían de manera individual
en el foro, se retroalimentaban y se elegían las mejores respuestas para el consolidado
grupal, así mismo se llevaba a cabo el desarrollo del componente practico haciendo uso del
software Matlab y se trabajo de acuerdo a las instrucciones de la guía y las webconference
de cada unidad.
CONCLUSIONES
En cuanto al curso se puede buscar algo mas útil a la vida diaria o en cuanto al campo de
las telecomunicaciones, este tratamiento no lo veo enfocado a la carrera y no identifico en
que momento puedo hacer uso de esto.