Академический Документы
Профессиональный Документы
Культура Документы
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Aprendizaje de Maquina Y Minera de Datos
Minera de Datos
El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos, de manera automtica o semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Aprendizaje de Maquina Y Minera de Datos
Minera de Datos
Bsicamente la minera de datos surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este n, hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Articial y a las redes neuronales. Clave: Extraccin de conocimiento a partir de fuentes masivas de datos.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Algoritmos de Aprendizaje
Aprendizaje
El origen del aprendizaje de maquina es tratar de emular algunas funciones del cerebro humano por lo tanto es importante entender el concepto de aprendizaje. Segn Wikipedia
El aprendizaje es el proceso a travs del cual se adquieren o modican habilidades, destrezas, conocimientos, conductas o valores como resultado del estudio, la experiencia, la instruccin, el razonamiento y la observacin.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Algoritmos de Aprendizaje
Aprendizaje de Maquina
Aprendizaje de Mquina es una rama de la Inteligencia articial cuyo objetivo es desarrollar tcnicas que permitan a las computadoras aprender. De forma ms concreta, se trata de crear programas capaces de generalizar comportamientos a partir de una informacin no estructurada suministrada en forma de ejemplos. Es, por lo tanto, un proceso de induccin del conocimiento.
El aprendizaje de maquina es es una emulacin de varias caractersticas humanas mediante tcnicas, algoritmos y tecnologas que buscan proveer de un conocimiento articial a un sistema que puede o no ser capaz de construir nuevos criterios o reglas de aprendizaje.
David H. vila Jaimes Minera de Datos - Aprendizaje de Maquina
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Algoritmos de Aprendizaje
Aprendizaje de Maquina
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Algoritmos de Aprendizaje
Aprendizaje de Maquina
Sin embargo un sistema puede mantener invariable su conocimiento en este caso el origen de su experiencia se puede basar solamente en el entrenamiento asistido por un experto, es decir no cambia su comportamiento a travs del tiempo (esto curiosamente contradice una caracterstica intrnseca del cerebro humano).
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Aprendizaje de Maquina
Algoritmos de Aprendizaje
Ejemplo
Caso: Aprender a jugar tiro al blanco (Ambiente natural) Tarea: Lanzar dardos Desempeo: Porcentaje de lanzamientos acertados Experiencia: Base de datos de variables de lanzamiento y sus resultados
clasicados.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Aprendizaje de Maquina
Algoritmos de Aprendizaje
Algoritmos de Aprendizaje
Algunos tipos o taxonomas de algoritmos de aprendizaje son: Aprendizaje Supervisado Produce una funcin que establece una correspondencia entre las entradas y las salidas deseadas del sistema. Un ejemplo de este tipo de algoritmo es el problema de clasicacin, donde el sistema de aprendizaje trata de etiquetar (clasicar) una serie de vectores utilizando una entre varias categoras (clases). La base de conocimiento del sistema est formada por ejemplos de etiquetados anteriores.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Aprendizaje de Maquina
Algoritmos de Aprendizaje
Algoritmos de Aprendizaje
Aprendizaje No supervisado Todo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos formado tan slo por entradas al sistema. No se tiene informacin sobre las categoras de esos ejemplos. Por lo tanto, en este caso, el sistema tiene que ser capaz de reconocer patrones para poder etiquetar las nuevas entradas.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Aprendizaje de Maquina
Algoritmos de Aprendizaje
Algoritmos de Aprendizaje
Aprendizaje Semi-supervisado Este tipo de algoritmos combinan los dos algoritmos anteriores para poder clasicar de manera adecuada. Se tiene en cuenta los datos marcados y los no marcados.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Aprendizaje de Maquina
Algoritmos de Aprendizaje
Algoritmos de Aprendizaje
Aprendizaje por refuerzo El algoritmo aprende observando el mundo que le rodea. Su informacin de entrada es el feedback o retroalimentacin que obtiene del mundo exterior como respuesta a sus acciones. Por lo tanto, el sistema aprende a base de ensayo-error.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Clasicadores
Denicin
Es un elemento o sistema que proporciona una clase etiquetada como salida a partir de un conjunto de caractersticas tomadas como entradas.
Es un elemento o sistema encargado de establecer una conexin entre un grupo de instancias conocidas y otras que no, en general debe predecir el comportamiento de una instancia desconocida.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Clasicadores
Tomando un conjunto de ejemplos etiquetados y tratar de denir una regla que pueda asignar una etiqueta a cualquier otro dato de entrada. ** Ensayando todas las opciones posibles y el resultado consecuente. **
En general [**]Los clasicadores se basan en
un tipo de aprendizaje
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
K- Nearest Neighbors
El Algoritmo de los K vecinos ms cercanos corresponde a la categora de aprendizaje supervisado y se puede aplicar a las temticas de nuestro curso de visin por computador considerando que para cada caso: Se conocen las clases existentes en el problema. Se conoce la clase concreta a la que pertenece cada objeto del conjunto de datos.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
Funcionamiento
El Algoritmo KNN clasica una instancia desconocida dentro de las clases establecidas (entrenamiento) basandoce en la ubicacin de la misma en un espacio establecido por los atributos de las clases conocidas, es decir etiqueta la instancia nueva de acuerdo a su proximidad y similitud con k instancias.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
Ejemplo # 1
Segn el espacio de clasicacin anterior si una nueva instancia ? debiera ser clasicada con un K=3
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
Ejemplo # 2
Segn el espacio de clasicacin anterior si una nueva instancia ? debiera ser clasicada con un K=3
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
Ejemplo # 3
Para evitar errores al seleccionar un valor para K se pueden asignar pesos a los vecinos en su orden de proximidad
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
Ejemplo # 4
Segn el espacio de clasicacin anterior si una nueva instancia ? debiera ser clasicada con un K=3
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
Ventajas
+ Factores positivos Es un algoritmos de baja complejidad. Con valores adecuados de K (>1) se obtienen buenos rendimientos incluso considerando ruido en las instancias de aprendizaje. Permite mltiples y simples modicaciones que se adaptan a problemas especcos.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
Ventajas
- Factores Negativos Es poco eciente en memoria ya que requiere tener almacenada toda la data de entrenamiento. Existen algoritmos con mayor tasa relativa de acierto por ejemplo redes neuronales. Permite mltiples y simples modicaciones que se adaptan a problemas especcos.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
Implementacin WEKA
Para cada contexto se requiere de un conjunto de datos (dataset), este conjunto de ejemplos se divide en dos subconjuntos:
Entrenamiento: Utilizado para aprender el clasicador. 2 Test: Se usa para validarlo. Weka es un proyecto de la universidad de waikato en Nueva
1
Zelanda que permite usar entre otros el algoritmo KNN para crear y probar clasicadores.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
K-NN
Implementacin WEKA
Este documento se acompaa de un vdeo-tutorial que muestra como crear y probar un clasicador usando la implementacin disponible en Weka (IBK) , El caso del ejemplo es la identicacin de personas mediante rostros usando descriptores de textura [Momentos de Haralick], sin embargo el procedimiento es el mismo para otro tipo de descriptores. Vdeo tutorial: http://www.youtube.com/watch?v=JyhIpsYX3v4
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Mtricas de Evaluacin y Desempeo
Existen mtricas que permiten evaluar la calidad de un clasicador as como estimar su calidad respecto a otros. Las siguientes son las principales mtricas de evaluacin y se orientan principalmente a los resultados:
Precisin (porcentaje de casos clasicados correctamente). Sensibilidad (la probabilidad de que una evento sea detectada
cuando realmente ocurre).
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Mtricas de Evaluacin y Desempeo
Las siguientes son las principales mtricas de evaluacin orientadas a la construccin del clasicador y la eleccin de los algoritmos: Robustez (frente a ruido y valores nulos). Escalabilidad (utilidad en grandes bases de datos) .
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Mtricas de Evaluacin y Desempeo
Para evaluar las mtricas se deben considerar sobre los resultados de la clasicacin los siguientes parmetros:
PV: Positivos verdaderos NV: Negativos verdaderos FP: Falsos positivos FN: Falsos negativos
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Mtricas de Evaluacin y Desempeo
Matriz de Confusin
Los parmetros anteriores se pueden obtener de la matriz de confusin propia de los resultados.
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Mtricas de Evaluacin y Desempeo
Para la clase c con base en la matriz de confusin anterior (50 instancias para c, 150 en total):
PV: Positivos verdaderos 46 NV: Negativos verdaderos (50+47)= 97 FP: Falsos positivos 4 FN: Falsos negativos 3
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Mtricas de Evaluacin y Desempeo
Mtricas
Formulas
Minera de Datos Aprendizaje de Maquina Clasicadores Caso de Estudio [VC 2012-1] Mtricas de Evaluacin y Desempeo
Bibliografa