Академический Документы
Профессиональный Документы
Культура Документы
Hola muchachos: Despues de algunos meses hoy empezamos el desarrollo de un caso de estudio, partiendo de la problematica que enfrentan las organizaciones. La problemtica en una organizacin no solo significa que la organizacin tenga prdidas, como en los escenarios siguientes: Porque las ventas estn cayendo? Que productos no se estn comprando en esta poca del ao? Porque la recaudacin ha disminuido? Porque los clientes manifiestan un nivel de insatisfaccin creciente? Sino que un problema puede significar como seguir avanzando, cumplidas sus metas impuestas, como en los escenarios siguientes Como crecer el 20% en el siguiente ao? Cul de las promociones son las ms efectivas ? Que clientes adquirirn un producto que se va a lanzar a ventas? Como direccionar el marketing a los clientes ? A continuacin proponemos la siguiente solucin de inteligencia de negocios que brindar el caso de estudio ha desarrollar:
Se puede apreciar 4 bloques: Fuentes de Datos A partir de las cuales se obtendrn los diferentes tipos de informacin. Debemos resaltar que la solucin a proponer partir de la BD Transaccional (recordar que es la BD donde se registra las transacciones y operaciones diarias).
La BD transaccional permite generar: o Indicadores de Gestin, o Patrones de Comportamiento o Reportes de Produccin. El Data WareHouse/DataMart permite generar: o Patrones de comportamiento principalmente.Su importancia mayor radica en servir de fuente como soporte para los cubos OLAP. Cubos OLAP permite generar: o Indicadores de Gestin, o Patrones de Comportamiento o Anlisis Dinmico (es su fortaleza!) Tipos de Informacin De acuerdo a la problemtica expuesta nuestra propuesta incluir: Indicadores de gestin (por ejemplo indicador de ventas, indicador de recaudacin, etc). Patrones de comportamiento (por ejemplo: como predecir que clientes nos compraran tal producto, a fin de mandarle un catalogo personalizado). Analisis Dinamico (por ejemplo al tratar de responder al Indicador de Morosidad, si los poblemas son los clientes, sectoristas, tiempo, organizacin o un grupo o combinacin de ellos). Reportes de Produccion (por ejemplo aplicando el principio de pareto, cuando queremos obtener el detalle de clientes morosos) Tipos de Sistemas de Informacion Click para Ver detalles Continuaremos en el siguiente articulo, y agradecindoles como siempre sus comentarios y sugerencias Saludos rimenri Publicado por rimenri en 18:21 12 comentarios
Despues de algunos meses retornando al placer de poder compartir algo que nos apasiona cada vez ms como es BI Inteligencia de Negocios.
Sirva este primer articulo del 2009 para extender mi agradecimiento personal a todos los lugares -Chimbote, Huaraz, Cajamarca, Tarapoto, Piura, Cusco y por supuesto nuestro querido Trujillo - donde tuvimos la posibilidad de intercambiar conocimiento y hacerles extensivos la Metodologia BI/DW->T tanto en universidades como empresas.
Estoy activando algunos links que estaban en mal funcionamiento y poniendo nuevos videos, asi mismo empezaremos el desarrollo de la metodologia propuesta.
--> Planeamiento --> Requerimientos y Anlisis del Negocio --> Diseo --> Construccin --> Implementacin
Parte de ella ha sido extraida de mi tesis de maestria prxima a sustentar. A continucin tenemos los puntos que desarrollaremos por cada fase:
Estos puntos los desarrollaremos con casos aplicativos. Asi mismo para los amantes de codigo, me gustaria proponerles: como leer los proyectos OLAP de un Servidor OLAP de SQL Server y ponerlos en una interfaz, usando Visual Studio .NET
Una de las metas a encontrar podra ser: A qu cliente o grupo de clientes le puedo dar un prstamo con un nivel de riesgo Bueno? Podramos escribir una consulta para buscar cuantos con tipo de Empleo dependiente hay y cuantos no. El impacto de la edad seria otra variable a tener en cuenta o tal vez en funcin a su nivel de ingresos o deuda que tena y seguramente tendramos que escribir miles de consultas cuando queramos combinarlas algunas o todas a la vez, imagine si existiera mas columnas a usar y algunas columnas sean valores numricos como los ingresos mensuales de un cliente. En contraste el DM hace un acercamiento ms simple ha esta pregunta. Todo lo que tiene que hacer es seleccionar el Algoritmo correcto de DM y especificar el uso las columnas a usar, el significado de las columnas de entrada y las columnas predictivas. En el caso anterior las columnas: edad, ingresos, tipo de empleo, nivel de deuda serian las de entrada. La columna Riesgo Crdito seria la columna predictiva. Un modelo de decisin de rbol podra ayudarnos a responder esa preguntar, El algoritmo revisa la data y analiza el impacto de cada atributo ingresado (2)
Volvamos a la pregunta original A qu cliente o grupo de clientes le puedo dar un prstamo con un nivel de riesgo Bueno?
Se imagina llegar a la respuesta de: los clientes con tipo de empleado Dependiente que tengan un nivel de deuda bajo y que tengan ms de 40 aos son los que representan menos riesgo de deuda. El DM proporciona un enorme valor a las organizaciones. En estos tiempos el DM puede implementarse con ms transparencia: Gran cantidad de data disponible: las organizaciones llegaron a implementar sistemas transaccionales (ventas, almacenes, produccin, personal, contabilidad, etc) y estos en el tiempo han ido almacenando informacin aunado a la baja de los costos de almacenamiento han acumulado grandes volmenes de datos. Alto nivel de competencia: la competencia actualmente es alta como resultado de marketing moderno y canales de distribucin como internet y comunicaciones, as como la participacin de corporaciones nacionales y extranjeras en el mercado. En este 2008 en nuestra ciudad Trujillo estamos siendo testigos de la aparicin de 2 malls con una infraestructura bastante atractiva para los clientes, por mencionar un ejemplo de competencia. Tecnologa Lista: el DM anteriormente era mayormente una solucin de laboratorio, ahora ya es una tecnologa madura y est lista para ser aplicada en las organizaciones. Los algoritmos y el equipamiento existente son ms eficientes para trabajar con data complicada si fuera el caso. Las API del DM estn estandarizndose cada vez mas amplitud y esto permite a los desarrolladores construir aplicaciones Realidad! (3) Hace poco conversaba con un Gerente de una empresa comercializadora regional, de gran presencia en el mercado, y me comentaba entre otras cosas que, sino contara con un sistema de informacin, no podra estar competido con estas corporaciones cuenta con gran cantidad de datos y competencia de primera- y que justo haba invertido en un servidor con una configuracin de primera Tecnologa Lista - . Piense la ventaja de conocer la informacin que descubrira un DM Imagine un retail en donde identifique los grupos de clientes que adquieren ciertos grupos de productos. En un casino de juegos las personas mayores de 55 de gnero femenino que permanecen 20 minutos jugando prefieren ciertos juegos rentables. Conocer que clientes son los que continuamente cambian de operador. En algunos pases la inversin de un operador telefnica por cliente representa un promedio de 200 dlares, de ah la importancia de retenerlo Conocer el perfil de los clientes que constantemente realizan reclamos en una empresa de servicios. Tener la posibilidad de plantear un conjunto de promociones a un determinado grupo de clientes.
Disminuir el riesgo de proporcionar un prstamo a un solicitante en una entidad financiera. Qu datos usa Data Mining? Si su organizacin cuenta con un Data WareHouse o Data Mart, que es donde mayormente se aplica DM, donde la data ya se encuentra limpia. En pequeas organizaciones es posible que no exista un Data Warehouse por lo que se podra minar directamente en las tablas transaccionales. En este sentido se recomienda tener una BD a parte con los datos necesarios y validados. Tambin es posible aplicarlo directamente en un Cubo OLAP, que como vimos en captulos posteriores es una BD Multidimensional compuesta por Medidas y Dimensiones. En general el DM busca descubrir y evaluar patrones y tendencias con miras a presentar un nuevo conocimiento de la organizacin.
Ciclo de un Proyecto en DM. Seguramente se estarn preguntando cuales son los pasos para constuir un proyecto de DM, aqui van! Paso 1: Coleccin de Datos Los datos del negocio podran estar en muchos sistemas. Para tener una idea, en Microsoft, existen cientos de Base de Datos y algo de 70 Data WareHouse (1) Paso 2: Limpieza de Datos y Transformacin La data limpia y transformada es el insumo vital para el DM, por lo que solo considerar la data relevante. Paso 3: Construir un Modelo Una vez que la data est limpia y las variables a usar transformadas, podemos empezar a construir modelos comprendiendo la meta que percibe el proyecto de Data Mining para
luego ejecutar el tipo de tarea de DM. La idea es entender a los analistas del negocio que conocimiento intentan descubrir. En el caso de postulantes a la universidad por ejemplo: quienes sern los que tendrn ms xito en su vida universitaria. Esta etapa es clave, conociendo el tipo de anlisis a realizar es relativamente sencillo elegir el algoritmo a aplicar. Seguramente sern varios escenarios a desarrollar. Paso 4: Modelo Preparado Aplicados los algoritmos necesarios con sus respectivos parmetros. La idea es evaluar e identificar el significado de los patrones encontradas y elegir el modelo a seguir. Paso 5: Reportear Entregar reportes de lo encontrado a los usuarios finales para su conformidad respectiva Paso 6: Prediccin En algunos proyectos el entregar los patrones descubiertos es una media mitad del trabajo, la otra corresponde a crear modelos predictivos incorporando nuevos escenarios Paso 7: Integracin de Aplicacin Es necesario crear una aplicacin para integrarla al negocio. Por ejemplo en el caso del CRM la segmentacin de mercado es un tema muy aplicable con DM o en el caso de un ERP o Sistemas Desarrollados el tema de los presupuestos cobran ms exactitud al aplicarse DM Paso 8: Administracin del Modelo En el caso de que exista variacin con los modelos diseados es necesario mantenerse vigilante, lo cual obligara a crear nuevas versiones del DM.
Hasta el prximo artculo en donde tocaremos la Planificacin del Proyecto de BI/DW basado en 3 puntos: Documento Visin del Producto Equipo del Proyecto Cronograma del Proyecto
Bibliografia Utilizada: (1)Data Mining con SQL Server 2005 . ZhaoHui Tang - 2005. USA (2) Curso de Postgrado en IT-ESAN - Nov 2007. Trujillo-Per (3) Experiencia Personal - Abril 2008 . Trujillo-Per Nota: el documento completo lo puede descargar en formato .PDF en la seccion: Descargar Temas BLOG con el titulo: Data Mining (DM)
Si es una empresa comercializadora interesar analizar esos montos vendidos (medidas) por algunas variables (dimensiones) como:
Este reporte tiene ms utilidad los Montos Vendidos (100,000) se puede apreciar en diferentes perspectivas (dimensiones) por ejemplo en el caso del producto: Montos Vendidos por Marca o Lnea, o cuanto se ha vendido a los Clientes Principales. Ntese que se puede combinar los montos vendidos de los Clientes Regulares en la Marca Ace de la Sucursal Norte. Veamos el reporte de otra manera
Analizando el Reporte: Note el posicionamiento de las medidas y Dimensiones En el caso de las Dimensiones se ubican normalmente: Filas ( Producto ) Columnas ( Clientes ) Titulo llamado filtro ( Sucursal , Tiempo ) Las medidas se ubican como interseccin de filas y columnas (montos vendidos) Definiendo Medidas y Dimensiones Bien ahora si definiremos lo que es una Medida y lo que es una Dimensin. Un DWH responde a la solucin de un problema, algo que permite medir gestin: Qu necesito ver, medir o evaluar y Cmo necesito analizarlo? El Qu lo constituyen un sin nmero de cosas como; por ejemplo en el caso de un Control de Calidad: la cantidad de unidades producidas, la cantidad de unidades defectuosas, el costo de produccin entre otras. Estas ltimas mencionadas lo constituyen las medidas o hechos (facts en Ingls). En un Data WareHouse son llamados hechos. Una vez identificado lo que el usuario desea medir la siguiente pregunta corresponde a Como analizar esta medida. Volviendo al Control de Calidad, las respuesta podran corresponder a analizar la data: en un periodo de tiempo determinado, para un producto especifico. Imagine el requerimiento: Necesito conocer las cantidades producidas mensualmente. Esto puede encajar con que muchas medidas pueden ser analizadas por varias dimensiones: Necesito conocer los costos de produccin trimestralmente por cada lnea de productos.
Al respecto COGNOS en sus textos: The Multidimensional Organization y The Dimensional Administrator, -que dicho sea de paso son 2 librazos! - establece una metodologa para encontrar dimensiones basados en preguntas, que ser temas de artculos posteriores (estas preguntas corresponden a Que, Cuando, Como , Donde, de Que Forma, Quien, etc respecto a un Proceso de Negocios o Hechos respectivos). Las medidas: constituyen el que analizar y son numricas y sumarizables a diferente nivel de detalle Las Dimensiones: son perspectivas de anlisis y determinan el como analizar a las dimensiones Vamos a finalizar incluyendo una lista de muestra de medidas y dimensiones segn el proceso de negocios: Proceso de Negocios y Medidas Ventas ->Cantidad de Pedidos -> Comisiones ->Descuentos ->Montos Vendidos ->Cantidades Vendidas ->Devoluciones ->Valores Presupuestados Marketing ->Unidades Vendidas ->Valores Actuales ->Valores Presupuestados Logstica ->Unidades Aceptadas ->Unidades Devueltas ->Peso ->Costo Inventario ->Montos Comprados Produccin ->Tiempo de Produccin ->Capacidad Usada ->Unidades Embarcadas ->Unidades Planificadas ->Unidades Producidas ->Costos de Produccin ->Horas Hombre ->Peso Ingresado
->Peso Procesado
Proceso de Negocios y Dimensiones Ventas ->Producto ->Organizacin ->Tiempo ->Cliente ->Formas de Pago Marketing ->Producto ->Organizacin ->Tiempo ->Segmento de Clientes ->Medios de Entrega ->Territorios Logstica ->Estado de Inventario ->Proveedores ->Materiales ->Productos ->Ubicacin ->Organizacin ->Tiempo Produccin ->Organizacin ->Producto ->Procesos ->Estaciones de Trabajo
Nota: el documento completo lo puede descargar en formato .PDF en la seccion: Descargar Temas BLOG con el titulo: Medidas y Dimensiones
Hola nuevamente. En la ultima sesin, de hace ya varios dias, hablamos de la ubicacion de un Data WareHouse (DWH) dentro de una solucion de Inteligencia de Negocios. A continuacin vamos a mostrar los concepto inciales de lo que es un DWH. Asi mismo al finalizar el mismo tienen Uds la posiblidad de ver y desarrollar el Lab 01 de como poder construir un cubo en SQL Server 2005. Conceptos Iniciales de un Data WareHouse
View Upload your own
SlideShare Link Laboratorio El requisito previo es tener la BD AdventureWorkDW en el SQL Server. Si no la tienes puedes descargarlo en la seccion Descargas Favoritas. Para acceder al laboratorio de COMO CREAR UN CUBO haz Click
Aqui
Luego de completar el laboratorio anterior puedes desarrollar el siguiente laboratorio CREANDO UNA INTERFAZ DE SOPORTE DE DECISIONES CON EXCEL 2007 a partir de un cubo, para ello Clic Aqui Prxima Tema Empezaremos desarrollando la Metodologia de Kimball, mediante un Caso de Estudio Prctico, que me lo han venido solicitando mas de uno.
MIS ), Sistemas Soporte a la Decisin (SSD), o Decision Support Systems ( DSS ), y Sistemas de Informacin para Ejecutivos (SIE), o Executive Information Systems ( EIS ). Veamos el siguiente diagrama de los tipos de sistemas
Como se puede apreciar un Data WareHouse corresponde a la categoria de los sistemas de Soporte de Decisiones propiamente dichos. Es cuando, por ejemplo, un ejecutivo, mediante un Sistema de Informacin para Ejecutivos, al analiza un Indicador de Gestin representado por el KPI de Recaudacin y visualiza un 70% en rojo!
y tenemos la necesidad de preguntarnos donde estamos fallando?? y surgen los: Qu, Cmo , Cundo, de Qu Forma? , Quines
En los clientes (Quines)- tal vez los de tipo de estan adquiriendo los montos pensados,
Los canales de distribucion (Cmo?)- la competencia deja el producto en la puerta de la casa del cliente
Tiempo (Cundo?)- no estamos comercializando algunos productos que tradicionalmente se venden en ciertas epocas del ao.
Cuando respondemos a estas preguntas nos remitimos a los Sistemas de Soporte de Decisiones, donde el DataWareHouse sobre OLAP cubre todas estas respuestas. Hay una serie de metodlogos que ayudan a la construccion de un Data WareHouse entre ellos podemos mencionar a:
Bill Inmon
Ralph Kimball
Podemos resaltar la propuesta de Kimball con su Modelamiento Dimensional como una gran fortaleza y de gran ayuda en la construccin de Data Ware House. En los temas siguientes veremos la construccin de un DataWare House utilizando la metodologa de Kimball, combinando la propuesta del Pensamiento Multidimensional de COGNOS mas nuestro aporte personal, todo implementandolo con MS SQL Server. Asi mismo iremos mencionando los casos de xito donde se han aplicado este tipo de soluciones. De momento los dejo con el ciclo de vida que propone Kimball en su libro The Data Warehouse LifeCycle Toolkit de 1998