Вы находитесь на странице: 1из 32

Centro Universitario UAEM Texcoco

Redes Neuronales Artificiales


UAEM

Pattern Recognition, Algorithims for Data Mining

J. Jair Vzquez Palma jair_jvp@hotmail.com

Abril - 2010

Tabla de Contenido
Introduction Patter Recongnition. PR in Brief. Knowledge Discovery in Databases KDD. Data Mining. Different Perspectives of Data Mining. Significance of Soft Computing in KDD.

Introduccin
El reconocimiento de patrones (PR) es una actividad que nosotros los humanos lo hacemos todo el tiempo y sin esfuerzo consciente.

Recibimos informacin a travs de nuestros rganos y diversos sentidos la informacin se procesa de forma instantnea por nuestro cerebro.

Introduccin
An ms impresionante es la precisin con la que podemos realizar el reconocimiento de tareas incluso bajo condiciones de no ideales.

Reconocimiento de Patrones
El reconocimiento de patrones es la clasificacin de seales en clases. Se quiere clasificar un seal dependiendo de sus caractersticas. Las seales, caractersticas y clases pueden ser de cualquiera forma.
Clasificar ruidos de cantos de los pjaros en clases de rdenes aviares dependiente de las frecuencias.

Reconocimiento de Patrones
Objetivos del RP: Desarrollo de tcnicas para que las computadoras aprendan. Crea programas que generalizan comportamientos a partir de informacin no estructurada entregada como ejemplos.
Aplicaciones. Motores de bsqueda Diagnstico mdico. Deteccin de fraude Mercado de valores Clasificacin de ADN Reconocimiento de voz Robtica

Reconocimiento de Patrones
Adquisicin de los datos Seleccin y extraccin de caractersticas. Clasificacin / fase de agrupamiento. Este proceso se realiza en dos etapas: Aprendizaje Reconocimiento

Reconocimiento de Patrones
Etapas de un Sistemas de Reconocimiento de Patrones.

Reconocimiento de Patrones
Representacin de los Datos.

Aprendizaje y Reconocimiento

Aprendizaje: reducir la cantidad de errores para el entrenamiento.

Reconocimiento: muestra al clasificador los patrones que se desea reconocer.

Modelos de Aprendizaje
Aprendizaje supervizado:
Dispone de un conjunto de patrones (CE) conjunto de entrada. El clasificador es entrenado con este CE. Realiza la identificacin de la clase correspondiente para nuevos patrones con el menor error posible.

Aprendizaje no supervizado
Tambin conocidos como autoasociativos. No requieren un etiquetado previo de cada uno de los patrones de entrada. Al final los grupos contienen patrones con caractersticas lo ms parecidas entre ellos y lo ms distintas posible con los patrones contenidos en otros grupos.

Modelos de Aprendizaje
Aprendizaje semi-supervizado:
Combina las bases de las dos vertientes clsicas. Parte de un conjunto pequeo de patrones de entrenamiento que, progresivamente puede ir amplindose mediante el uso de un conjunto de nuevos patrones sin etiquetar. Uno de los objetivos de este nuevo modelo de aprendizaje es aumentar el conocimiento durante la fase de clasificacin, permitiendo de este modo, simplificar el costoso proceso para obtener patrones etiquetados.

Enfoques - Reconocimiento de Patrones


Reconocimiento Estadstico de Patrones.- Usa probabilidad y estadstica, supone la existencia de distribuciones de probabilidad a partir de ellas se hace el reconocimiento. Redes bayesianas. Reconocimiento Sintctico de Patrones.- Encuentra relaciones estructurales, utilizando teora de lenguajes formales, construye una gramtica que describe la estructura de objetos. Sistemas basados en conocimiento. Redes Neuronales.- Dada una arquitectura, las red es entrenada para entregar una respuesta cuando se le presentan determinados valores.

Knowledge Discovery in Databases KDD

Knowledge Discovery in Databases KDD


Se define como: La extraccin no trivial de informacin implcita, desconocida, y potencialmente til de los datos. (KDD) apunta a procesar automticamente grandes cantidades de datos para encontrar conocimiento til en ellos, de esta manera permitir al usuario el uso de esta informacin Valiosa para su conveniencia.

Knowledge Discovery in Databases KDD


METAS DEL KDD Procesar automticamente grandes cantidades de datos. Identificar los patrones ms significativos y relevantes y y presentarlos como conocimiento apropiado para satisfacer las metas del usuario.

Knowledge Discovery in Databases KDD


PROCESO GLBAL DE KDD
Data cleaning and preprocessing / Limpieza de datos y pre-procesamiento. Data condensation and projection / Condensacin y proyeccin de datos. Data integration and wrapping / Integracin de los datos. Choosing the data mining function(s) and algorithm(s) / Seleccin, limpieza y transformacin de los datos a analizar. Data mining / Seleccionar y aplicar el mtodo de minera de datos apropiado. Interpretation and visualization / Interpretacin y visualizacin. Using discovered knowledge / Difusin y uso del nuevo conocimiento.

Knowledge Discovery in Databases KDD


PROCESO GLBAL DE KDD

Data Mining / Mineria de Datos

Data Mining
Minera de Datos: La minera de datos consiste en el ajuste de modelos para la determinacin de patrones o datos que nos sirven para reflejar un conocimiento til a partir de grandes cantidades de datos.

Data Mining
Tarea de la Minera de Datos: Clustering / Agrupamiento. Clasificacin . Anlisis de secuencia. Regresin. Sumarizacin.

Data Mining /Clustering


K-means
(agrupamiento exclusivo)

Intenta agrupar una serie de objetos en grupos. Cada objeto es representado por un vector de atributos ndimensional. Los objetos que forman cada grupo deben ser disimilares. La similaridad es medida del grado de proximidad. Luego cada grupo es etiquetado.

Fuzzy C-means
(agrupamiento con traslape)

Mtodo de autoorganizacin (SOM) Razonamiento Adaptativo

Data Minig / Clasificacin


Clasifica objetos en un nmero finito de clases, dado sus propiedades. Busca una funcin de mapeo que permita separar la clase 1 de la clase 2 y esta de la clase 3 El nmero de clases es finito.
rboles de decisin.

Reglas de Asociacin.

Redes Neuronales.

Clasificador Bayesiano.

Data Mining / Minera de Datos


Anlisis de secuencia: secuencia de modelos de patrones, como las series de datos en tiempo. El objetivo es modelar el proceso de generacin de la secuencias para extraer y reportar la desviacin y tendencias en el tiempo. Regresin: Se utiliza en la prediccin y aplicaciones de modelado. Sumarizacin: proporciona una descripcin compacta para un subconjunto de datos.

Data Mining / Minera de Datos


Aplicaciones Data Mining

Otras Aplicaciones
Financial Stock Market Prediction Credit Worthiness Credit Rating Bankruptcy Prediction Property Appraisal Fraud Detection Price Forecasts Economic Indicator Forecasts Medical Medical Diagnosis Detection and Evaluation of Medical Phenomena Patient's Length of Stay Forecasts Treatment Cost Estimation Industrial Process Control Quality Control Temperature and Force Prediction Science Chemical Compound Identification Physical System Modeling Polymer Identification Recognizing Genes Botanical Classification Signal Processing: Neural Filtering Biological Systems Analysis Ground Level Ozone Prognosis Odor Analysis and Identification Educational Teaching Neural Networks Neural Network Research College Application Screening Predict Student Performance Data Mining Energy Electrical Load Forecasting Energy Demand Forecasting Short and Long-Term Load Estimation Predicting Gas/Coal Index Prices Power Control Systems Hydro Dam Monitoring Prediction Classification Change and Deviation Detection Knowledge Discovery Response Modeling Time Series Analysis Sales and Marketing Sales Forecasting Targeted Marketing Service Usage Forecasting Retail Margins Forecasting Operational Analysis Retail Inventories Optimization Scheduling Optimization Managerial Decision Making Cash Flow Forecasting HR Management Employee Selection and Hiring Employee Retention Staff Scheduling Personnel Profiling

http://www.alyuda.com/products/neurofusion/neural-network-applications.htm

Data Mining / Perspectivas


Perspectiva en base de datos Tiene por objeto mejorar las expresiones de lenguajes de consulta (optimizacin de consultas), mejorar la integracin con los datos en sistemas de almacenamiento.

Data Mining / Minera de Datos


Perspectiva Estadstica En la actualidad, las herramientas estadsticas se utilizan en todas las tareas de Minera de Datos como preprocesamiento (toma de muestras, deteccin de valores atpicos, el diseo experimental).

Data Mining / Minera de Datos


Perspectiva Reconocimiento de Patrones El PR analizan automticamente los datos e identificar las relaciones.

Soft Computing / KDD


Importancia del Soft Computing en KDD Soft Computing es un consorcio de metodologas que provee de una forma u otra informacin flexible en la ejecucin de capacidades para el manejo de la vida real. Su objetivo es explotar el razonamiento aproximado y parcial de la verdad con el fin de alcanzar tratabilidad, robustez, soluciones de bajo costo, y lo mas cerca posible a la toma de decisiones humanas.

Referencias
Pattern Recognition Algorithms for Data Mining, Sankar K. Pal & Pabitra Mitra. Chapman & Hall/CRC, 2000. Antologia de Redes Neuronales Artificiales, UAEM V. de Chalco.2009.

FIN CAPITULO 4 Primera Parte

Gracias !
Thanks !
Xie xie ni
Domo arigatou Merci Grazie

Вам также может понравиться