Вы находитесь на странице: 1из 34

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin Tema 4: Sistemas Especficos Data Warehouse Data Mining
Universidad Pontificia Comillas

Data Warehouse Data Mining


Data Warehouse
Procesos de extraccin, transformacin y carga (ETC) Construccin y gestin del repositorio

Herramientas de acceso, anlisis y presentacin de los datos:


OLAP Data Mining Query y Reporting

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 2

Data Warehouse - Introduccin


El Data Warehouse (en adelante DW) convierte los datos transaccionales de una organizacin en informacin accesible para aquellos usuarios involucrados en el anlisis y toma de decisiones. El objetivo del DW ser el de satisfacer los requerimientos de informacin interna de la empresa para una mejor gestin evitando penalizar el rendimiento de los sistemas transaccionales (o ERPs), debido a lo cual se ha convertido en una de las tendencias tecnolgicas ms significativas en la administracin de informacin. El Data Mart (o Universo) est enfocado a un departamento o rea especifica, como por ejemplo los departamentos de Finanzas o Marketing, o un problema de negocio como Fraude, Fidelizacin... Permitiendo as un mejor control de la informacin que se est abarcando. Al manejar eficientemente la informacin de cada rea de la empresa, se pueden tomar mejores decisiones y as efectuar acciones apropiadas y finalmente conseguir un mejor control sobre la produccin empresarial.
Control Informtico de Gestin - Tema 3 - Pgina 3

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Procesos de Extraccin, Transformacin y Carga


Nos referiremos a ellos como ETC o ETL (extraction, transformation, load) indistintamente Una herramienta ETC es, por definicin, un conjunto integrado de aplicaciones con facilidades para la ejecucin de extracciones, transformaciones y cargas de los datos desde los sistemas transaccionales y fuentes externas en el DW. Problemas asociados a los procesos ETC:
Variedad de plataformas tecnolgicas Multiplicidad de transaccionales no integrados Informacin en los transaccionales incompleta, incoherente o incorrecta. Puede perderse informacin de valor (integridad) No propagacin de las modificaciones de los transaccionales a los procesos de extraccin, transformacin y carga de los datos.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 4

Procesos de Extraccin, Transformacin y Carga


Puntos a tener en cuenta en la eleccin de una herramienta ETL:
Suele ser preferible elegir una herramienta ETL predefinida en lugar de desarrollarla uno mismo. Escoger aplicaciones integradas, es decir, que den soporte completo a los procesos ETL. Capacidad de leer y generar XML (extensible Markup Language) Capacidad de mantener la infromacin de quin y cundo fue cargado el dato mediante metadatos. Escoger herramientas con interfase de diseo grfico intuitivo (GUI), ya que la interface da una representacin visual de las tablas que se est tratando de integrar. Facilidad de uso (intuitivo). Ayudas al usuario.

Los productos ETL integrados reducen el tiempo de desarrollo de un 50% a un 400% y gran parte de este avance se debe diseo visual de la herramienta.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 5

Procesos de Extraccin, Transformacin y Carga - Herramientas


Algunas herramientas del mercado:
Informatica: Power Mart / Power Center (www.informatica.com) Microsoft: Data Transformation Service (DTS) (www.microsoft.com) Acta: ActaWorks (www.acta.com) ETI: ETI*Extract (www.ETI.com) APPLIX: TM1 Data Control / TM1 Process Objetcs (www.applix.com) SAP: Data Extractors (www.sap.com) Cognos-Powerplay Enterprise Server: Architect / DecisionStream (www.cognos.com) Hyperion: Essbase Integration Server Oracle: Oracle 9i Database (www.oracle.com) Computer Associates: DecissionBase Transformer / InfoPump / InfoRefiner / Infotransport / Fast Unload (www.computerassociates.com ) Data Junction: Data junction Integration Suite (www.datajunction.com) ...
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL
Control Informtico de Gestin - Tema 3 - Pgina 6

Repositorio
Puede entenderse el repositorio de datos como el corazn del data warehouse, en el cual desembocan tanto las herramientas de extraccin, transformacin y carga (ETL) como las herramientas de "business intelligence" que analizan los datos (OLAP, Reporting, Data Mining, etc.). Caractersticas ms significativas de una herramienta de repositorio:
Escalabilidad Facilidad de uso Soporte de datos no estructurado Capacidad analtica Disponibilidad

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 7

Repositorio - Caractersticas
Escalabilidad: capacidad para poder manejar la explosin de usuarios y datos. Factores que aumentan la escalabilidad:
Multisistema: soporte en mltiples sistemas operativos. Paralelismo: capacidad de ejecutar queries en paralelo, incluso en diferentes procesadores. Ms procesadores significan DW ms rpidos. Los procesadores tpicamente estn conectados en grupos de 4 formando un nodo.
Bases de datos SMP (Symmetric Multiple Processing): bases de datos de un slo nodo. No requieren el reparto de datos entre mltiples nodos, por lo que resultan ms fciles de administrar, el problema es que pueden producirse cuellos de botella Bases de datos MPP (Massively Parallel Processing) se forman uniendo dos o ms nodos SMP consiguindose una respuesta an ms rpida. Son ms escalables que las SMP aunque resultan ms complejas de administrar debido al problema de distribucin de los datos.

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Capacidad de optimizacin: el optimizador determina la manera de obtener informacin ms eficientemente dentro y fuera del data warehouse mediante la decisin de a qu ndices y tablas se debe acceder. Los optimizadores automticos son preferibles a aquellos que requieren la participacin de DBAs ya que eliminan el error humano. No obstante, normalmente se requiere asistencia para mejorar el rendimiento de las queries.
Control Informtico de Gestin - Tema 3 - Pgina 8

Repositorio - Caractersticas
Escalabilidad (cont.):
Tablas resumen: disminuyen el tiempo de respuesta precalculando respuestas y preguntas y de este modo aumentan el rendimiento. Producen duplicidad de datos aumentando el tamao de la base de datos y presentan problemas de actualizacin, insercin y borrado, ya que ha de actualizarse tanto la tabla fuente como la tabla resumen. La particin posibilita el procesado mediante multiservidores mediante la distribucin de datos en mltiples nodos. La particin es el proceso mediante el cual los datos son asignados en discos de la base de datos, el objetivo es crear una asignacin de los datos para prevenir puntos calientes o cuellos de botella. La priorizacin proporciona un tiempo de respuesta predecible dando preferencia a ciertos usuarios. Cuando muchos usuarios acceden a la vez, prioriza la respuesta a aquellas queries ms importantes frente a otras que lo son menos. Capacidad de los DBAs (Database Administrators) de manejar datos almacenados fuera del data warehouse desde dentro del data warehouse ("Federation").

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 9

Repositorio - Caractersticas
La facilidad de uso tiene dos criterios: la facilidad de realizar tareas administrativas y la eliminacin de la realizacin de algunas tareas va "self-tuning" de la base de datos.
Las bases de datos "self-tuning" contribuyen a la facilidad de uso mediante la transferencia de tareas desde el DBA hacia el gestor de BBDD. Deben de tener una GUI (Graphical User Interface) central de administracin que permita la administracin "point-and-click". Las aplicaciones de ayuda al usuario proporcionan al DBA una manera estructurada de completar tareas complejas. Asistentes para la construccin del data warehouse. Estos paquetes suelen comprender modelos de datos preconstruidos y herramientas ETL. Los modelos preconstruidos reducen el tiempo y costes de construccin del data warehouse proporcionando una estructura inicial para modelos de datos, reports y herramientas.

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 10

Repositorio - Caractersticas
Soporte de bases de datos para datos no estructurados (XML, sonido, vdeo, etc.):
Almacenamiento, composicin XML (conversin de un dato desde la base relacional a un documento XML) y descomposicin XML. Soporte para Java: permite programar con Java en la base de datos. La integracin de una JVM (Java Virtual Machine) en la base de datos puede aumentar el rendimiento. Esta JVM compila JavaScript para que la base de datos pueda entenderlo.

Capacidad analtica: El xito de un repositorio de datos radica en su capacidad de almacenar los datos y permitir a los usuarios que los analicen.
Los procesos de anlisis OLAP (Online Analitic Processing's) posibilitan la realizacin de rpidos anlisis "what-if". Los procesos de "data mining" son esenciales para descubrir relaciones y comportamientos ocultos entre grandes cantidades de datos. El "lenguaje natural" hace la base de datos ms accesible al usuario.

Disponibilidad es un factor esencial del software y hardware, no obstante, el software de la base de datos juega un importante papel.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 11

Repositorio - Herramientas
Algunas herramientas del mercado son:
IBM DB2 Universal Database v.7.2 Oracle 9i Microsoft SQL Server 2000 NCR teradata v2r3 Sybase Adaptive Server IQ 12

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 12

OLAP (On-Line Analytical Processing)


Los anlisis OLAP consisten en un proceso de navegacin intuitiva y anlisis de la informacin a travs de las dimensiones de negocio, independientemente de la forma de almacenamiento de los datos y remarcando las razones o causas de los problemas y oportunidades de negocio. La funcionalidad de un sistema OLAP est proporcionada por tres componentes principales:
Un modelo multidimensional del nivel de negocio para anlisis interactivo. Una arquitectura capaz de procesar queries multidimensionales contra los datos objetivo. Un mecanismo de almacenamiento de los datos que han de ser analizados

La funcionalidad de cualquier herramienta OLAP se ver adems mejorada por otras tres funciones:
Acceso de los usuarios finales. Desarrollo de la aplicacin. Distribucin y reparto de los resultados del anlisis.

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 13

OLAP - Caractersticas
Funcionalidad del usuario final: Los usuarios finales, y principalmente aquellos que no utilicen el sistema habitualmente, necesitan poder encontrar y usar fcilmente los modelos de negocio multidimensionales creados previamente
Bsqueda y comprensin del modelo. Utilizacin del modelo. Grabacin y comparticin de resultados.

Creacin del modelo de negocio: Los diseadores del modelo multidimensional de negocio necesitan herramientas que ofrezcan suficiente flexibilidad para construir el modelo de acuerdo a las necesidades.
Diseo bsico. Construccin de las dimensiones. Definicin de mtricas. Capacidad para mltiples diseadores.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 14

OLAP - Caractersticas
Potencia analtica avanzada: Los usuarios avanzados necesitan una seleccin de funciones estadsticas, financieras y de prediccin ready-to-use, a la vez que posibilidad para crear nuevas.
Integracin con otras herramientas. Definicin de modelos especiales. Definicin de funciones analticas Funcin write-back para anlisis what-if. Incorporacin de datos no numricos. Data Mining.

Soporte Web: Para explotar completamente la funcionalidad Web, las herramientas deben tener soporte para publicacin, exploracin y creacin de modelos va un Web browser.
Funcionalidad para el usuario final va Web. Creacin de modelos va web. Distribucin va Internet y la Web.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL
Control Informtico de Gestin - Tema 3 - Pgina 15

OLAP - Caractersticas
Gestin: Las herramientas deben ofrecer soporte para la gestin de los modelos, informacin y usuarios de una forma sencilla y que reduzca la carga de trabajo del administrador.
Gestin de modelos. Gestin de los datos. Gestin de usuarios. Gestin de metadatos

Adaptabilidad: Las herramientas deben dar soporte para la sincronizacin de las fuentes de informacin, los modelos multidimensionales de negocio (y los informes derivados de ellos) y los metadatos.
Cambio en requerimientos de negocio. Cambio en las fuentes de informacin. Metadatos.

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 16

OLAP - Caractersticas
Rendimiento: El administrador necesita soporte de la herramienta para gestionar el rendimiento de sta mediante el tuning de los procesos de extraccin y manipulacin de la informacin.
ROLAP. MOLAP. Soporte para mltiples usuarios. Procesos.

Customisation: Se considera el soporte de la herramienta para el desarrollo de aplicaciones que incluya informacin multidimensional en forma de tablas y grficos que el usuario pueda explorar interactivamente.
Opciones de utilizacin de interfaces restringidas. Facilidad de creacin de informes tipo EIS. Aplicaciones.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 17

OLAP - Herramientas
Algunas herramientas del mercado son:
Aplix-Aplix TM1 Brio Technology-Brio.Enterprise Business Objects-BusinessObjects 2000 Cognos-PowerPlay Enterprise Server Gentia-Gentia Millennium Applications Platform Hummingbird-BI/Suite Hyperion-Hyperion Essbase Server Information advantage-DecisionSuite Microsoft-SQL Server Microstrategy-DSS Product Suite Oracle-Oracle Express Server Pilot/Accrue-Pilot Decision Support Suite Seagate/Crystal Decisions-Seagate Holos Sterling-Eureka:Suite WhiteLight Systems- WhiteLight Analytic Application Server
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL
Control Informtico de Gestin - Tema 3 - Pgina 18

Data Mining
Data Mining es el proceso de seleccin, procesamiento y modelizacin de grandes cantidades de datos orientado a ayudar a las organizaciones a descubrir comportamientos y relaciones ocultas entre los datos del negocio. El objetivo final de este anlisis es entender como se comporta el negocio y poder realizar predicciones. Para realizar el anlisis de los datos, Data Mining utiliza mtodos estadsticos. Data Mining es un proceso no un producto. Tipos de anlisis:
Anlisis Descriptivo: Analiza comportamientos y relaciones en los datos histricos para ayudar a la toma de decisiones. Anlisis Predictivo: Utiliza los datos histricos para realizar proyecciones y predecir comportamientos futuros.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 19

Data Mining - Metodologa SEMMA


SEMMA es una de las metodologas de Data Mining y proporciona un mtodo para el desarrollo y mantenimiento de sistemas de Data Mining. No siempre ser necesario aplicar todas las etapas, pero la metodologa proporciona un mtodo estructurado para definir, crear y evaluar un sistema de Data Mining. Las metodologa se apoya sobre una BBDD que soporte cargas masivas de datos.

Sample Sample

Explore Explore

Modify Modify

Model Model

Assessment Assessment

DW / Data Mart DW / Data Mart

Seleccin de Anlisis de las datos y caractersticas adquisicin de la de los datos muestra


ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Modificacin y preparacin de los datos

Modelizacin y prueba de las hiptesis

Interpretacin de la informacin y valoracin del resultado


Control Informtico de Gestin - Tema 3 - Pgina 20

Data Mining SEMMA - Sample

Sample Sample

Explore Explore

Modify Modify

Model Model

Assessment Assessment

DW / Data Mart DW / Data Mart

En aplicaciones con grandes cantidades de datos, es preferible utilizar una muestra de datos en lugar de la base de datos entera, ya que esto reduce notablemente el tiempo de procesamiento. Es vital tomar una MUESTRA REPRESENTATIVA del comportamiento total de los datos. Los datos seleccionados son almacenados en una base de datos propia del Data Mining, cuya estructura es la adecuada para los procesos de anlisis de datos. Existen tres mtodos de seleccin de muestras:
Muestreo Aleatorio Simple: Se toman muestras de forma totalmente aleatoria. Muestreo Sistemtico: Se elige un criterio para tomar muestras( tomar una de cada 1000). Muestreo Estratificado: Primero se realiza una segmentacin y luego se aplica uno de los dos mtodos anteriores.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL
Control Informtico de Gestin - Tema 3 - Pgina 21

Data Mining SEMMA - Explore

Sample Sample

Explore Explore

Modify Modify

Model Model

Assessment Assessment

DW / Data Mart DW / Data Mart

Utilizando herramientas de visualizacin se exploran los datos, en busca de tendencias y anomalas con el objetivo de realizar un primer filtrado de datos. Las tcnicas de visualizacin que se utilizan habitualmente son:
Grficos 2D y 3D. Permite una exploracin rpida de grandes cantidades de datos. Clusters y Nubes de puntos. Se suelen emplear para realizar segmentaciones de los datos.
WEEKEND MORNING, EXTERNAL PRODUCTION, SITCOMS

PROGRAM COST (PTAs)

Number of emissions

SHARE

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 22

Data Mining SEMMA - Modify


Modificacin de los datos mediante tcnicas de:

Sample Sample

Explore Explore

Modify Modify

Model Model

Assessment Assessment

DW / Data Mart DW / Data Mart

Filtrado. Normalmente se pretende eliminar valores extremos para conseguir modelos ms estables. Clusterizacin. Se sustituye un grupo de datos por un dato representativo de todos ellos.

Seleccin de variables. Con el objetivo de incluir en el modelo en aquellas con una mayor capacidad predictiva y eliminar el resto. Transformacin de variables. Se realiza para que los datos se ajusten mejor al modelo (Estabilizar varianzas, eliminar no linealidades,...).

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 23

Data Mining SEMMA - Model

Sample Sample

Explore Explore

Modify Modify

Model Model

Assessment Assessment

DW / Data Mart DW / Data Mart

En esta fase se define el modelo utilizado, que basndose en el anlisis de los datos y variables previamente definidos, permita realizar predicciones fiables. Para la creacin del modelo se utilizan las siguientes tcnicas de anlisis:
Redes Neuronales
Se basan en algoritmos informticos que intentan simular el funcionamineto del cerebro humano. Establece relaciones entre datos diferentes. Sigue un proceso de aprendizaje con los resultados obtenidos.

Arboles de decisin
Analizan las decisiones tomadas en el pasado, realizando una segmentacin de los datos. Los resultados sirven para tomar decisines en el futuro.

Regresin
Utilizan modelos lineales y cuadraticos que se ajustan al comportamiento pasado y a travs de ellos se puede realizar una previsin.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL
Control Informtico de Gestin - Tema 3 - Pgina 24

Data Mining SEMMA - Assesment

Sample Sample

Explore Explore

Modify Modify

Model Model

Asse sment Asse sment

DW / Data Mart DW / Data Mart

Seguimiento del modelo de gestin definido, comparando las previsiones con los datos reales, a travs de sistemas integrados de informes y grficos. Con los resultados obtenidos se realiza un proceso de realimentacin del sistema con el objetivo de mejorar el modelo utilizado y por lo tanto las previsiones. A partir del assesment se proceder a realizar, si fuera necesario, ajustes en cualquiera de las etapas del sistema.

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 25

Data Mining Aplicaciones


Algunas aplicaciones del Data Mining son:
Evolucin del mercado Valoracin de clientes Segmentacin de clientes Estrategias de fidelizacin Enfoque de campaas Adecuacin a la demanda Adecuacin de la produccin Gestin del Riesgo Gestin del Fraude

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 26

Data Mining - Herramientas


Algunas de las herramientas y vendedores de aplicaciones de Data Mining son:

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 27

Data Mining - Ejemplos


Caso 1: Fidelizacin de clientes en banca
PROBLEMA: La entidad observ que estaba perdiendo clientes progresivamente y que la fidelidad de sus clientes era baja. OBJETIVO: El objetivo del proyecto era disear un programa de retencin y vinculacin de la base de clientes. SOLUCIN: Se utilizaron tcnicas de Data Mining para generar un modelo que permitiera generar conclusiones con validez estadstica

Fase 1
ANLISIS DE LA RENTABILIDAD CLIENTE

Fase 2
MEDICIN DE LA FUGA DE CLIENTES

Fase 3
CONOCIMIENTO DE CAUSAS DE PRDIDA

Fase 4

Fase 5
DISEO DE ACCIONES CONCRETAS

MODELIZACIN

SEGUIMIENTO POSTERIOR
O B J E T I V O S Segmentacin bsica inicial y determinacin de la aportacin por segmento Identificacin de los colectivos de clientes con mayor aportacin a la cuenta de resultados Definicin de los indicadores que midan la fuga Benchmarking interno Benchmarking externo Desarrollo de encuestas sobre una muestra de clientes perdidos Alimentacin por parte de la red Anlisis de comportamiento de los clientes perdidos en periodos anteriores Identificacin de variables crticas Diseo de un sistema de alertas Definicin de las acciones a desarrollar en funcin de las alertas

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 28

Data Mining - Ejemplos


Caso 1: Fidelizacin de clientes en banca
Seleccin de una muestra de clientes que abandonaron la entidad. Seleccin de las variables a incluir en el modelo (slo las controlables).
NO CONTROLABLES JUSTIFICADAS 27% Defunciones Traslado de domicilio ... Trato Informacin poco clara Concentracin de cuentas Clientes no consolidados Remuneracin de depsitos Aplicacin de comisiones

Definicin de un modelo estadstico basado en tcnicas de regresin lineal y cuadrtica.

CALIDAD DE SERVICIO

13%

CONTROLABLES

FIDELIDAD

38%

ACTIVIDAD

22%

Clasificacin de las variables segn su influencia.


V1

Impacto en la mejora de la fidelidad con la entidad respecto a la mejora de cada variable.


ct

Impacto en la mejora de la fidelidad con la entidad respecto a la mejora conjunta de las variables ms influyentes.
ct

0,16

V2 V3 V4 V5 V6 V7 V8 V9 V 10 V 11
V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11

0,16

0,34 0 ,27 0 ,24 0,16 0,2 0,1 9 0 ,1 9 0 ,18 0,1 7 0,1 7 0 ,16
0 0 ,05 0 ,1 0,1 5 0 ,2 0,25 0 ,3 0 ,3 5 0,4
Todas V2 y V3 V1 y V3

0,48 0,57

V1 y V2

0,38

0,62

0 ,2

0,4

0,6

0 ,8

1,2

1 ,4

1,6

0,1

0,2

0,3

0,4

0,5

0,6

0,7

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 29

Data Mining - Ejemplos


Caso 2: Optimizacin programacin mensual TV
OBJETIVO: Ofrecer la parrilla mensual que maximiza el margen bruto de emisin SOLUCIN: Se utilizaron tcnicas de Data Mining para: Simular diferentes parrillas anuales (mensualizadas) que proporcionen, en trminos de maximizacin del margen bruto de emisin, la distribucin ptima de programas. Estimar y realizar anlisis de sensibilidad de ingresos y costes para diferentes objetivos de audiencia anual (share). Simular las implicaciones de las diferentes parrillas en trminos de uso de recursos.

PREVISIN DE CONSUMO TV (RATING TTV)

SEGMENTACIN

OPTIMIZACIN
RESTRICCIONES: Share y programacin

VARIABLES COMERCIALES

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 30

Caso 2: Cadena de TV
Caso 2: Optimizacin programacin mensual TV
PREVISIN DE CONSUMO
PROC LP

VARIABLES

PARMETROS COMERCIALES

RESTRICCIONES

Horas Tipo de Produccin Horas Tipo de Programa Share obtenido PARRILLA MENSUAL PTIMA

INGRESOS

COSTES

USO DE RECURSOS

MARGEN PTIMO

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 31

Query y Reporting
El proceso de Query y Reporting se basa en proponer una pregunta para ser respondida mediante la recuperacin de datos relevantes del data warehouse, transformacin de los mismos en el contexto apropiado y, por ltimo, su presentacin en el formato adecuado. Este proceso suele llevarse a cabo por analistas, los cuales deben proponer la pregunta y esperar la respuesta. Este proceso es muy diferente a otros mtodos de anlisis de datos expuestos anteriormente, tales como OLAP o data mining. Normalmente las queries involucran al menos dos factores o dimensiones distintos, por ejemplo: cuantas unidades de un producto se han vendido esta semana en un punto de venta concreto?. El flujo del proceso de query y reporting comienza con la definicin de la query, proceso que consiste en tomar la hiptesis o pregunta de negocio y traducirla en el formato de query que pueda ser usado por la herramienta particular. Cuando la query es ejecutada la herramienta genera los comandos de lenguaje apropiados para recuperar los datos solicitados, los cuales son devueltos en lo que suele llamarse answer set.
ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL
Control Informtico de Gestin - Tema 3 - Pgina 32

Query y Reporting
El analizador de datos se encarga entonces de realizar los clculos y manipulacin de los datos requeridos para presentar los resultados deseados. Posteriormente se da formato a tales resultados para adecuarlos a las plantillas de presentacin o report que hayan sido seleccionadas para facilitar su comprensin por el usuario. Esta plantilla puede consistir en combinaciones de texto, grficos, vdeo o audio. Finalmente el report se entrega al usuario final en el soporte deseado bien sea mediante impresin en papel, visualizacin en display o presentacin sonora. Los usuarios finales normalmente estn interesados en procesar valores numricos que usarn para analizar el comportamiento del negocio, tales como ventas, rentabilidad, etc. No obstante tambin pueden usar el proceso de query y reporting para realizar otro tipo de clculos o medidas de calidad, tales como ratios de satisfaccin de clientes, retrasos en procesos, etc. Pueden analizar tambin los efectos de una determinada transaccin o evento en el proceso de negocio, realizar anlisis de tendencias e incluso extrapolar sus propias predicciones.
Control Informtico de Gestin - Tema 3 - Pgina 33

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Query y Reporting - Herramientas


Algunas herramientas del mercado son:
Computer Associates International Cognos SAS Institute Crystal Decisions Hyperion Solutions Microsoft Oracle MicroStrategy Business Objects Brio technology

ESCUELA TCNICA SUPERIOR DE INGENIERA DEPARTAMENTO DE ORGANIZACIN INDUSTRIAL

Control Informtico de Gestin - Tema 3 - Pgina 34

Вам также может понравиться