La minera de datos, es una tcnica en la que aplicamos a una gran base de
datos, algoritmos de bsqueda de patrones de comparacin. Para poder trabajar con la minera de datos necesitamos 2 cosas: una base de datos (la del datawarehouse) en una instancia de Analysis Services de SQL Server con un modelo de minera y el complemento de minera de datos de Office 2010. Primeramente necesitamos generar un modelo de datos para trabajar con la minera. Para ello abrimos nuestra base de datos en Analysis Services con SQL Data Tools y seleccionamos la opcin de generar un nuevo modelo de datos de minera de datos.
Minera de datos en un proyecto de Analysis Services de SQL Data Tools Nos aparecer un asistente para generar el modelo de minera. Primeramente debemos indicar desde dnde vamos a obtener los datos:
Asistente de minera de datos: Donde obtener los datos Despus debemos indicar el algoritmo de patrones que queremos utilizar
Algoritmo de minera En este caso vamos a seleccionar la tcnica de rboles de decisin. Seguidamente en el asistente debemos indicar qu tabla tiene los datos sobre los que vamos a aplicar el algoritmo
Tabla del datawarehouse que tiene los datos que queremos anali zar En el siguiente paso del asistente nos aparece la tabla de entrenamiento. La tabla de entrenamiento sirve para indicar sobre qu columnas queremos que se aplique el algoritmo. Para ello aparecen todos los campos de la tabla y 3 columnas: Key, Predictable e Input. La columna Key indica qu columna identifica nicamente todos los datos (tipicamente la clave primaria). La columna Predictable es el dato que queremos predecir o sobre el que queremos obtener algn Patrn. En nuestro caso BikeBuyer que es el campo que dice si el cliente ha comprado o no una bicicleta y sobre el que queremos predecir posibles ventas. La columna Input, son los posibles factores que afectan a la columna Predictable y que sirven para buscar un posible patrn . Por ejemplo la edad, si est casado, si tiene hijos, si tiene coche, y si estos factores afectan o no a la posible compra de motos.
Tabla de entrenamiento con las columnas Key, Input y Predictable En el siguiente paso indicamos el tipo de los datos. Por ejemplo si son valores discretos, continuos, ordenados, cclicos
Tipo de dato que queremos modelar En el ltimo paso del asistente indicamos el porcentaje de los datos reales que queremos analizar.
Porcentaje que queremos analiza Una vez finalizado el asistente, publicamos el proyecto de SQL Data Tools en Analysis Services y desde la pestaa del visor de minera de datos podemos ver el anlisis. En este caso vemos en crculos ms grandes, los factores que ms influyen en la compra de motos.
Prediccin de ventas de motos Para comprobar que estos valores son coherentes a nuestras necesidades de ventas, podemos intentar utilizar otro algoritmo de anlisis y ver los datos que tenemos y compararlos. Para hacer esto, utilizaremos el complemento de minera de datos de Office 2010. El complemento aadir una pestaa nueva a Excel 2010 con todas las herramientas necesarias para la minera. y este es el aspecto que tendra
Complemento de minera de datos para Office 2010 y SQL Server 2012 En el complemento podemos ver que tenemos la posibilidad de lanzar otros algoritmos y compararlos. Por ejemplo, podemos analizar estos mismos datos con la tcnica del modelo de Bayes y el modelo de rbol de decisin y el complemento nos generara un grfico con la comparativa. Para ello usamos el botn de Accuracy Chart.
CRM Un cliente llama por primera vez preguntando acerca de una funcionalidad concreta sobre un GPS. Abre una incidencia (consulta) para registrar su duda. El cliente es atendido por el operador (usuario del sistema). Tras proporcionar su DNI para identificarse en el sistema e identificar la consulta en el HelpDesk. El sistema obtiene los siguientes datos del cliente: DNI: 26589741-F Profesin: Carpintero Tipo de cliente: Sencillo Nombre: Luis Apellidos: Ros Lpez Fecha de nacimiento: 25/04/1949 Cuenta bancaria: 5159-5414-12-2153698547 Domicilio: C/ La Teja 10, 1A Cdigo postal: 26300 Localidad: Logroo Salario: 20.000 Moroso: No N hijos: 3 El mdulo de inteligencia utiliza el conocimiento extrado de anteriores situaciones similares para crear el rbol de decisin. El propio mdulo de inteligencia es capaz de inferir qu atributos son relevantes para tomar la decisin y elegir la accin ms adecuada al perfil de ese cliente. El mdulo de inteligencia genera un rbol que permite elegir a travs de una heurstica la accin a aplicar ms apropiada para el perfil del cliente.
Figura 7.3: Ejemplo de un rbol de decisin alternativo para un hipottico caso de consultas.
Las posibles acciones para el perfil de ese cliente en esta situacin son: Accin 1: Proporcionar ayuda detallada en el momento de la llamada. [7;15) Accin 2: Proporcionar ayuda poco concisa en el momento de la llamada.[2;7) Accin 3: Proporcionar la ayuda en los prximos das.[-7;2) Accin 4: Mantener la consulta sin resolver hasta que se mejore la situacin empresa - cliente.[-15; -7)