Вы находитесь на странице: 1из 9

MINERA DE DATOS SQL SERVER 2012

La minera de datos, es una tcnica en la que aplicamos a una gran base de


datos, algoritmos de bsqueda de patrones de comparacin. Para poder trabajar
con la minera de datos necesitamos 2 cosas: una base de datos (la del
datawarehouse) en una instancia de Analysis Services de SQL Server con un
modelo de minera y el complemento de minera de datos de Office 2010.
Primeramente necesitamos generar un modelo de datos para trabajar con la
minera. Para ello abrimos nuestra base de datos en Analysis Services con SQL
Data Tools y seleccionamos la opcin de generar un nuevo modelo de datos
de minera de datos.

Minera de datos en un proyecto de Analysis Services de SQL Data
Tools
Nos aparecer un asistente para generar el modelo de minera. Primeramente
debemos indicar desde dnde vamos a obtener los datos:

Asistente de minera de datos: Donde obtener los datos
Despus debemos indicar el algoritmo de patrones que queremos utilizar

Algoritmo de minera
En este caso vamos a seleccionar la tcnica de rboles de decisin.
Seguidamente en el asistente debemos indicar qu tabla tiene los datos sobre los
que vamos a aplicar el algoritmo

Tabla del datawarehouse que tiene los datos que queremos anali zar
En el siguiente paso del asistente nos aparece la tabla de entrenamiento. La tabla
de entrenamiento sirve para indicar sobre qu columnas queremos que se aplique
el algoritmo. Para ello aparecen todos los campos de la tabla y 3 columnas: Key,
Predictable e Input.
La columna Key indica qu columna identifica nicamente todos los datos
(tipicamente la clave primaria).
La columna Predictable es el dato que queremos predecir o sobre el que
queremos obtener algn Patrn. En nuestro caso BikeBuyer que es el campo que
dice si el cliente ha comprado o no una bicicleta y sobre el que queremos predecir
posibles ventas.
La columna Input, son los posibles factores que afectan a la columna Predictable y
que sirven para buscar un posible patrn . Por ejemplo la edad, si est casado, si
tiene hijos, si tiene coche, y si estos factores afectan o no a la posible compra de
motos.

Tabla de entrenamiento con las columnas Key, Input y Predictable
En el siguiente paso indicamos el tipo de los datos. Por ejemplo si son valores
discretos, continuos, ordenados, cclicos

Tipo de dato que queremos modelar
En el ltimo paso del asistente indicamos el porcentaje de los datos reales que
queremos analizar.

Porcentaje que queremos analiza
Una vez finalizado el asistente, publicamos el proyecto de SQL Data Tools en
Analysis Services y desde la pestaa del visor de minera de datos podemos ver el
anlisis. En este caso vemos en crculos ms grandes, los factores que ms
influyen en la compra de motos.

Prediccin de ventas de motos
Para comprobar que estos valores son coherentes a nuestras necesidades de
ventas, podemos intentar utilizar otro algoritmo de anlisis y ver los datos que
tenemos y compararlos. Para hacer esto, utilizaremos el complemento de minera
de datos de Office 2010. El complemento aadir una pestaa nueva a Excel 2010
con todas las herramientas necesarias para la minera.
y este es el aspecto que tendra

Complemento de minera de datos para Office 2010 y SQL Server 2012
En el complemento podemos ver que tenemos la posibilidad de lanzar otros
algoritmos y compararlos. Por ejemplo, podemos analizar estos mismos datos con
la tcnica del modelo de Bayes y el modelo de rbol de decisin y el complemento
nos generara un grfico con la comparativa. Para ello usamos el botn de
Accuracy Chart.



CRM
Un cliente llama por primera vez preguntando acerca de una funcionalidad concreta sobre un GPS.
Abre una incidencia (consulta) para registrar su duda. El cliente es atendido por el operador
(usuario del sistema). Tras proporcionar su DNI para identificarse en el sistema e identificar la
consulta en el HelpDesk. El sistema obtiene los siguientes datos del cliente:
DNI: 26589741-F
Profesin: Carpintero
Tipo de cliente: Sencillo
Nombre: Luis
Apellidos: Ros Lpez
Fecha de nacimiento: 25/04/1949
Cuenta bancaria: 5159-5414-12-2153698547
Domicilio: C/ La Teja 10, 1A
Cdigo postal: 26300
Localidad: Logroo
Salario: 20.000
Moroso: No
N hijos: 3
El mdulo de inteligencia utiliza el conocimiento extrado de anteriores situaciones similares para
crear el rbol de decisin. El propio mdulo de inteligencia es capaz de inferir qu atributos son
relevantes para tomar la decisin y elegir la accin ms adecuada al perfil de ese cliente.
El mdulo de inteligencia genera un rbol que permite elegir a travs de una heurstica la accin a
aplicar ms apropiada para el perfil del cliente.


Figura 7.3:
Ejemplo de un rbol de decisin alternativo para un hipottico caso de
consultas.

Las posibles acciones para el perfil de ese cliente en esta situacin son:
Accin 1: Proporcionar ayuda detallada en el momento de la llamada. [7;15)
Accin 2: Proporcionar ayuda poco concisa en el momento de la llamada.[2;7)
Accin 3: Proporcionar la ayuda en los prximos das.[-7;2)
Accin 4: Mantener la consulta sin resolver hasta que se mejore la situacin empresa -
cliente.[-15; -7)

Вам также может понравиться