Вы находитесь на странице: 1из 7

DATAMINING (MINERA DE DATOS) El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos,

de manera automtica o semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algn significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que surge entre la informacin y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso comn a todos ellos se suele componer de cuatro etapas principales:  Determinacin de los objetivos. Trata de la delimitacin de los objetivos que el cliente desea bajo la orientacin del especialista en datamining.  Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de datamining.

 Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para tener una primera aproximacin. Segn los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia Artificial.  Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.

Carga de trabajo en las fases de un proyecto de datamining En resumen, el datamining se presenta como una tecnologa emergente, con varias ventajas: por un lado, resulta un buen punto de encuentro entre los investigadores y las personas de negocios; por otro, ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios. Adems, no hay duda de que trabajar con esta tecnologa implica cuidar un sinnmero de detalles debido a que el producto final involucra "toma de decisiones".

Aplicaciones: 1. 2. 3. 4. 5. 6. 7. 8. Segmentacin del mercado Tendencias de desercin de clientes Descubrimiento de transacciones fraudulentas Mercadeo directo Mercadeo Interactivo Anlisis de canasta Anlisis de tendencias Perfiles de clientes Otras aplicaciones en este sentido del Data Mining pueden ser: Para Comunicarnos con nuestra base de clientes y prospectos de manera directa y masiva (cumpleaos, lanzamientos, cobros) Para contribuir en la conservacin de clientes existentes. Para vender otros productos a nuestra base de clientes y elevar ingresos. Para capturar nuevos clientes con Televisin o Web-Marketing. Entre las variadas aplicaciones de Data Mining que se desarrollan, destacan: Segmentacin de Clientes: Segmentacin de clientes utilizando tcnicas de a agrupamiento difuso.

Clasificacin: Clasificacin de clientes utilizando tcnicas de redes neuronales. Por ejemplo, para aplicaciones de adquisicin de nuevos clientes o deteccin de fuga. Data Mining Son utilizadas habitualmente Data Warehouse para el anlisis explotacin de un

Data Mining puede ser provechoso en el caso de poseer un Data Warehouse que contenga datos sobre sus procesos productivos, datos de seguimiento de clientes, datos externos de mercado, datos sobre la actividad de competidores, etc.

DATA MART Un Data mart es una versin especial de almacn de datos (data warehouse). Son subconjuntos de datos con el propsito de ayudar a que un rea especfica dentro del negocio pueda tomar mejores decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de mltiples formas para que diversos grupos de usuarios realicen la explotacin de los mismos de la forma ms conveniente segn sus necesidades. El Data mart es un sistema orientado a la consulta, en el que se producen procesos batch de carga de datos (altas) con una frecuencia baja y conocida. Es consultado mediante herramientas OLAP (On line Analytical Processing Procesamiento Analtico en Lnea) que ofrecen una visin multidimensional de la informacin. Sobre estas bases de datos se pueden construir EIS (Executive Information Systems, Sistemas de Informacin para Directivos) y DSS (Decision Support Systems, Sistemas de Ayuda a la toma de Decisiones). Por otra parte, se conoce como Data Mining al proceso no trivial de anlisis de grandes cantidades de datos con el objetivo de extraer informacin til, por ejemplo para realizar clasificaciones o predicciones. En sntesis, se puede decir que los data marts son pequeos data warehouse centrados en un tema o un rea de negocio especfico dentro de una organizacin.

CARACTERSTICAS DE UN DATA MART DESTACAN:

   

Usuarios limitados. rea especfica. Tiene un propsito especfico. Tiene una funcin de apoyo. Caractersticas: Son pobladas por usuarios finales. Se optimizan en funcin a procesos transaccionales. Se actualizan constantemente. Contienen mucha informacin de detalle. Herramientas de Explotacin El DataMart est orientado a la toma de decisiones. Un buen diseo de la base de datos favorece el anlisis y la recuperacin de datos para obtener una ventaja estratgica y para facilitar la toma de decisiones. El DataMart no est orientado a procesos relacionados con la operatividad del rea determinada. El DataMart est preparado para ser explotado mediante herramientas especficas que permiten la extraccin de informacin significativa y patrones de comportamiento que permanecen ocultos en un enorme repositorio de datos. Veamos las herramientas software que existen:

     

TECNOLOGA OLAP

El trmino OLAP, que proviene de Online Analitical Processing (Procesamiento Analtico en Lnea), define a una tecnologa que se basa en el anlisis multidimensional de los datos y que le permite al usuario tener una visin ms rpida e interactiva de los mismos. Este anlisis, tambin conocido como anlisis del hipercubo, organiza la informacin segn los parmetros que se consulten, de manera tal que a partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas Transaccionales, conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendr la informacin requerida. Es muy utilizado en el rea de marketing, ventas, informes, etc., especialmente porque las respuestas a consultas complejas se obtienen muy rpidamente y adems porque puede obtener los datos tanto de una fuente externa como de una base interna. Hay diversos tipos de implementaciones de la tecnologa OLAP, las que varan segn el tipo de motor en el que se almacenan los datos. De esta manera, podemos clasificarlas como ROLAP, que almacena los datos en un motor relacional por lo que se puede tener un acceso veloz a ellos; MOLAP, que almacena los datos en una base de datos multidimensional y DOLAP, que guarda los datos en el escritorio, los que obtiene a partir de una base de datos relacional. QU ES OLAP? OLAP simboliza On-Line Analytical Processing (Procesamiento Analtico en Lnea). A diferencia del conocido OLTP (On-Line Transaction Processing Procesamiento Transaccional en Lnea), OLAP describe una clase de tecnologas diseadas para mantener especficamente el anlisis y acceso a datos. Mientras el procesamiento transaccional generalmente confa solamente en las bases de datos relacionales, OLAP viene a ser un sinnimo con vistas multidimensionales de los datos del negocio. Estas vistas multidimensionales se apoyan en la tecnologa de bases de datos multidimensionales. Estas vistas multidimensionales proporcionan la base tcnica para clculos y anlisis requeridos por las Aplicaciones del Negocio Inteligente.

Las aplicaciones OLTP se caracterizan por la creacin de muchos usuarios, actualizaciones o recuperacin de registros individuales. Por consiguiente, las bases de datos OLTP se perfeccionan para actualizacin de transacciones. Las aplicaciones OLAP son usadas por analistas y gerentes que frecuentemente quieren una vista de datos de nivel superior, como las ventas totales por lnea de producto, por regin, etc. Las bases de datos OLAP normalmente se actualizan en lote, a menudo de mltiples fuentes, y proporcionan un back-end analtico poderoso a las aplicaciones de mltiples usuarios. Por tanto, las bases de datos OLAP se perfeccionan para el anlisis. Las aplicaciones OLTP tienden a tratar con datos atomizados registro a un tiempo, considerando que las aplicaciones de OLAP normalmente se tratan de los datos resumidos. Mientras las aplicaciones OLTP generalmente no requieren de datos histricos, casi cada aplicacin de OLAP se preocupa por ver las tendencias y por consiguiente requiere de datos histricos. Como consecuencia, las bases de datos OLAP necesitan la capacidad de ocuparse de datos series de. Mientras las aplicaciones OLTP y bases de datos tienden a ser organizados alrededor de procesos especficos (como ordenes de entrada), las aplicaciones OLAP tienden a ser orientadas al tema, respondiendo a preguntas como Qu productos estn vendiendo bien? o Dnde estn mis oficinas de ventas ms dbiles?. La esencia de la tecnologa del servidor OLAP es el resumen y anlisis de datos rpido y flexible. Mientras las bases de datos SQL van a continuar dominando el procesamiento de transacciones en lnea (por la necesidad de un proceso registro por registro), los servidores OLAP son una tecnologa superior

para aplicaciones Inteligentes del Negocio. El anlisis de los datos eficaz y flexible requiere la capacidad de resumir los datos de mltiples maneras y perspectivas en tiempos cortos. Los servidores OLAP y las bases de datos relacionales pueden trabajar en armona para crear un ambiente servidor que puede enviar rpidamente los datos a los usuarios y pueda permitirles realizar el anlisis necesario para tomar las mejores decisiones de negocio.

Вам также может понравиться