Вы находитесь на странице: 1из 21

Minera de Datos

Por: Geovanny Cudco

CONTENIDOS
Qu es minera de datos? Orgenes de la minera de datos. Clasificacin de la minera de datos. Caractersticas de la minera de datos. Metodologa de la minera de datos. Proceso de la minera de datos. Tcnicas de la minera de datos. Aplicaciones de la minera de datos. Ventajas de la minera de datos.
26/06/2013

Qu es minera de datos?
Es un mecanismo de exploracin consistente en la bsqueda de informacin valiosa en grandes volmenes de datos. La minera de datos se centra en llenar la necesidad de descubrir el porque, para luego predecir y pronosticar las posibles acciones con cierto con cierto factor de confianza para cada prediccin. Es el anlisis de archivos y bitcoras de transacciones, trabaja a nivel del conocimiento con el fin de descubrir patrones, relaciones, reglas, asociaciones e incluso excepciones nicas para la toma de decisiones. 26/06/2013

Orgenes de la Minera de Datos


La minera de datos se ha insertado desde los aos 90 en el contexto de las TICs, algoritmia y desarrollo de software. Las lneas de desarrollo en el mbito de la minera de datos tienen sus orgenes en tres conceptos claves:
Estadstica Clsica Anlisis de regresin, desviacin estndar, varianza, anlisis de clustering, intervalos de confianza, entre otros Basada en heursticas, su implementacin necesitaba de computadoras con un poder de procesamiento alto

Inteligencia Artificial

Aprendizaje Automtico

Se describe como la unin de las estadsticas e Inteligencia Artificial porque conjunta heursticas 26/06/2013 con anlisis estadstico avanzado

Clasificacin de la minera de datos.


Minera de datos predictiva (MDP) Usa primordialmente tcnicas estadsticas
Minera de datos para descubrimiento de conocimiento (MDDC)

Usa principalmente tcnicas de inteligencia artificial

26/06/2013

Caractersticas de la minera de datos (1/2)


Explorar los datos que se encuentran en las profundidades de las bases de datos, o almacenes de datos, que algunas veces contienen informacin almacenada durante varios aos.

El entorno de la minera de datos suele tener una arquitectura clienteservidor.


Las herramientas de la minera de datos ayudan a extraer el mineral de la informacin enterrado en archivos corporativos o en registros pblicos archivados.

26/06/2013

Caractersticas de la minera de datos (2/2)


Las herramientas de la minera de datos se combinan fcilmente y pueden analizarse y procesarse rpidamente. La minera de datos produce cinco tipos de informacin: Asociaciones. Secuencias. Clasificaciones. Agrupamientos. Pronsticos.
26/06/2013

Metodologa de la minera de datos.

26/06/2013

Proceso de la minera de datos(1/3)

26/06/2013

Proceso de la minera de datos(2/3)


Seleccin: A partir de un conjunto de datos, se realiza la Seleccin de estos y se almacenan las variables dependientes y objetivo en un almacn de datos. Preprocesamiento de los datos: se analizan las propiedades de estos mediante histogramas, diagramas de dispersin, valores atpicos Transformacin de los datos: prepararlos para aplicar la tcnica de minera de datos que mejor se adapte a estos.
26/06/2013

10

Proceso de la minera de datos(3/3)


Aplicar tcnica de Minera de Datos: Seleccionar y aplicar la tcnica de minera de datos elegida, esta fase incluye seleccionar la tarea de descubrimiento a realizar (Clasificacin, clustering) y el algoritmo que vamos a aplicar. Al aplicar la minera de datos, se buscarn patrones que puedan expresarse como un modelo de datos. Interpretacin y evaluacin del modelo de datos obtenido: Este modelo debe ser validado y verificado correctamente antes de ser utilizado. Tambin en esta fase se pueden comparar distintos modelos, si hemos obtenido ms de uno para comparar su eficacia y validez.
26/06/2013

11

Tcnicas de la minera de datos (1/2).


Las tcnicas de la minera de datos provienen de la Inteligencia artificial y de la estadstica, dichas tcnicas, no son ms que algoritmos, ms o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados. Las tcnicas ms representativas son:
Redes neuronales. Regresin lineal. rboles de decisin. Modelos estadsticos. Agrupamiento o cluster.
26/06/2013

12

Tcnicas de la minera de datos (2/2).

13

26/06/2013

Aplicaciones de la Minera de Datos (1/2)


Deteccin de fraudes.- Se puede considerar una tcnica de clasificacin. Se usa en corporaciones para prevenir procesos peligrosos. El algoritmo se encarga de analizar transacciones y categorizar las que sean ilegtimas mediante la identificacin de caractersticas comunes. Anlisis de riesgos de crdito.- Aplicacin similar a la anterior pero con la existencia de tcnicas tradicionales para realizarlo. Por ejemplo mejorando el mtodo de asignacin de puntos con minera de datos. Minera de texto.- debido a la gran cantidad de pginas en red, es necesario tecnologas como la minera de datos para clasificar y detectar patrones particulares en la informacin. Negocios.- En lugar de enviar determinadas promociones u ofertas a todos los clientes, mediante tcnica de minera de datos se puede obtener una lista de clientes que tengan una mayor probabilidad de interesarse por una determinada oferta o promocin.
26/06/2013

14

Aplicaciones de la Minera de Datos (2/2)


Patrones de fuga.- Se usa sobre todo en empresas de banca y telecomunicaciones. A travs de caractersticas de personas que anteriormente se dieron de baja en la empresa para pasarse a la competencia, se hace un estudio de que personas son las ms propensas a esto, para poderles hacer ofertas personalizadas con la finalidad de lograr su permanencia. Recursos humanos.- Gracias a la minera de datos se pueden obtener las caractersticas de sus empleados de mayor xito y estos patrones aplicarlos a los futuros empleados de la empresa. Comportamiento en Internet.- Obteniendo la informacin de un usuario (de forma ms o menos legtima) se crea un perfil de usuario para ofrecerle una determinada informacin u otra a la hora de visitar pginas webs. Terrorismo.- Gracias a la minera de datos el ejercito de los EE.UU ha identificado al lder de los atentados del 11-S y a otros tres integrantes.
26/06/2013

15

Ventajas de Minera de Datos


Contribuye a la toma de decisiones tcticas y estratgicas proporcionando un sentido automatizado para identificar informacin clave desde volmenes de datos generados por procesos tradicionales y de e-Business. Proporciona poderes de decisin a los usuarios del negocio que mejor entienden el problema y el entorno y es capaz de medir la acciones y los resultados de la mejor forma. Genera Modelos descriptivos: permite a empresas, sin tener en cuenta el rubro o el tamao, explorar automticamente, visualizar y comprender los datos e identificar patrones, relaciones y dependencias que impactan en los resultados finales de la cuenta de resultados (tales como el aumento de los ingresos, incremento de los beneficios, contencin de costes y gestin de riesgos). 26/06/2013

16

Ventajas de Minera de Datos


Genera Modelos predictivos: permite que relaciones no descubiertas e identificadas a travs del proceso de Minera de Datos sean expresadas como reglas de negocio o modelos predictivos. Estos outputs pueden comunicarse en formatos tradicionales (presentaciones, informes, informacin electrnica compartida, etc.) para guiar la estrategia y planificacin de la empresa.

17

26/06/2013

Software para Minera de datos

18

Es una suite de software para minera de base de datos y aprendizaje automtico basado en componentes que cuenta con un fcil y potente, rpido y verstil front-end de programacin visual para el anlisis exploratorio de datos y visualizacin, y librerias para Python y secuencias de comando. Contiene un completo juego de componentes para preprocesamiento de datos, caracterstica de puntuacin y filtrado, modelado, evaluacin del modelo, y tcnicas de exploracin. Est escrito en C++ y Python, y su interfaz grfica de usuario se basa en la plataforma cruzada del framework Qt. 26/06/2013

Software para Minera de datos

19

Es un ambiente de experimentos en aprendizaje automtico y minera de datos que se utiliza para tareas de minera de datos tanto en investigacin como en el mundo real. Permite a los experimentos componerse de un gran nmero de operadores anidables arbitrariamente, que se detallan en archivos XML y se hacen con la interfaz grfica de usuario de RapidMiner. RapidMiner ofrece ms de 500 operadores para todos los principales procedimientos de mquina de aprendizaje, y tambin combina esquemas de aprendizaje y evaluadores de atributos del entorno de aprendizaje Weka.
26/06/2013

Software para Minera de datos


JHepWork
Diseado para los cientficos, ingenieros y estudiantes, jHepWork es un framework para anlisis de datos libre y de cdigo abierto que fue creado como un intento de hacer un entorno de anlisis de datos usando paquetes de cdigo abierto con una interfaz de usuario comprensible y para crear una herramienta competitiva a los programas comerciales. Esto se hace especialmente para las ploteos cientficos interactivos en 2D y 3D y contiene bibliotecas cientficas numricas implementadas en Java para funciones matemticas, nmeros aleatorios, y otros algoritmos de minera de datos. jHepWork se basa en Jython un lenguaje de programacin de alto nivel, pero codificacin en Java tambin puede ser usada para llamar libreras jHepWork numricas y grficas. 26/06/2013

20

GRACIAS!!!!!!!!

21

26/06/2013

Вам также может понравиться