Con el presente informe se pretende desarrollar actividades terico prcticas
contenidas en la segunda unidad del Mdulo del curso, referente a las Bases de Datos Distribuidas, las cuales se definen como un conjunto de mltiples bases de datos lgicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lgicos (P.ej. un servidor corriendo 2 maquinas virtuales) e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar procesamiento autnomo, esto permite realizar operaciones locales o distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual mltiples sitios de bases de datos estn ligados por un sistema de comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red exactamente como si estos fueran accedidos de forma local.
DESARROLLO DE LA ACTIVIDAD
En la unidad 1, se desarroll el modelo distribuido del supermercado TODOYA. Ahora, continuando con este ejercicio, se solicita que el grupo colaborativo prepare y presente a las directivas del supermercado una propuesta detallada de implementacin de una bodega de datos en la que se aplicar minera de datos para extraer informacin importante para la toma de decisiones. La propuesta debe presentar informacin suficiente sobre la bodega de datos, como: ventajas para la organizacin, proceso de implementacin, costos, riesgos; de igual manera una descripcin detallada de la aplicacin de algoritmos de minera de datos en dnde se resalte qu informacin especfica se podra obtener mediante esta tcnica que no podra obtenerse de manera convencional. La propuesta la deben elaborar mediante participaciones significativas en el foro, cuando ya tengan la informacin suficiente la consolidarn en el documento final y entregarn teniendo las indicaciones que se dan en esta gua.
IMPLEMENTACIN DE BODEGAS DE DATOS SUPERMERCADO TODOYA
Las bodegas de datos son grandes repositorios integrados de datos que pueden ser alimentados internamente o de fuentes externas, organizados de tal manera que puedan facilitar la toma de decisiones.
Ventajas de la implementacin de una Bodega de Datos: - Se pueden manejar grandes volmenes de datos a travs de sistemas tipo DDS (Sistemas de soporte de toma de decisiones). - Permite mejorar el manejo de informacin que antes estara dispersa y no oportuna con una alta probabilidad de inconsistencias. - Sin una bodega de datos pueden surgir en la organizacin altos volmenes de informacin no estructurada que requieren anlisis. - Facilita el acceso a la informacin histrica. - Facilita la flexibilidad en la manipulacin de informacin.
Esquema del modelo de bodega de datos recomendado:
Etapas del proceso de implementacin: - Definicin de requerimientos. - Definicin de arquitectura. - Presentacin del proyecto. - Anlisis de proveedores. - Evaluacin. - Contratacin. - Capacitacin. - Implementacin. Para la definicin de requerimientos observamos que TODOYA es una organizacin dedicada a la venta al detal de productos de la canasta familiar, por lo cual manejar la informacin del volumen de ventas por artculos, temporadas, lneas, marcas, etc., le permitir tomar decisiones administrativas y de mercadeo ms eficaces. Para esta implementacin, la fuente de la informacin ser interna, pues ya se manejan bases de datos de los detalles de ventas y clientes en el software facturador, de esta manera se desarrollara una herramienta en el motor de bases de datos para que extraiga los datos necesarios de reunir en la bodega de datos. El proceso de implementacin de la bodega de datos inicia con el anlisis de las necesidades del rea ms trascendental para el cumplimiento de las labores misionales de la organizacin. En este caso la organizacin se dedica a la venta de artculos al detal, por lo tanto la primera rea de negocio que se debe construir es el de ventas. Se debe definir la granularidad o nivel de detalle al que se quiere llegar por parte de la organizacin a la hora de realizar un anlisis de ventas. Si se quiere tener una informacin a nivel de artculos o productos vendidos la tabla de hechos a seleccionar para la construccin del primer cubo debe ser basada en la que almacena los detalles de venta de cada factura. Algunas medidas a ser consideradas en nuestra tabla de hechos son las siguientes: Medida Agrupacin Cantidad de artculos vendidos. Suma Valor de Venta Suma Costo de Venta Suma Ganancia de Venta Suma Impuesto de Venta Suma
El siguiente sera el diseo del cubo de datos:
Dimensiones Para el anlisis de ventas se pueden considerar las siguientes dimensiones: Tiempo: Permite realizar anlisis de ventas por ao, semestre, trimestre, mes, semana y da, nos permite responder a interrogantes como el da de la semana en el que se produce el mayor nmero de ventas. Horas Minutos: Dentro de las buenas prcticas en diseo de bodegas de datos se sugiere separar la dimensin de horas minutos de la dimensin de tiempo para evitar tener demasiados registros en la dimensin de tiempo, esta dimensin permite responder preguntas como en qu hora del da se produce la mayor cantidad de ventas. Clientes: La dimensin de clientes permite realizar un anlisis de ventas que arroje resultados como el gnero de los clientes que ms compran, que compran los clientes de acuerdo a su edad, que compran los clientes de acuerdo a su nivel de estudios, etc. Productos: la dimensin de productos permite identificar cules son los productos ms vendidos, cuales generan mayores ganancias, que productos son adquiridos de acuerdo al tipo de cliente, las marcas preferidas, los artculos preferidos, etc. Sedes: permite hacer anlisis de ventas por sede.
Costos
En la parte fsica, se requiere la adquisicin de un servidor de buenas capacidades de almacenamiento, dedicado nicamente al almacenamiento, y otro servidor dedicado a contener el motor de bases de datos y el software necesario para realizar las diferentes transacciones con la informacin almacenada en la bodega de datos.
El costo del servidor de almacenamiento sugerido es de 11.378.448, se adjunta cotizacin de Dell.
El costo del servidor de transacciones sugerido es de 18.479.019, se adjunta cotizacin
Adems se debe adquirir un motor de bases de datos apto para el volumen de datos que se van a manejar, como tambin adquirir los desarrollos de software de ETL, y software de inteligencia de negocios para la generacin de anlisis y reportes sobre los datos guardados en la bodega.
Riesgos
En relacin con el criterio de eficiencia, hay que tener en cuenta los costos de almacenamiento generados a partir del crecimiento permanente de la bodega de datos.
Hay que tener en cuenta que los usuarios quieren acceder tanto a datos histricos como a datos totalizados y en algn momento los histricos pueden llegar a ser menos accedidos, por lo tanto hay que implementar mecanismos para monitorear el uso real de los datos almacenados en la bodega.
Respecto a la confidencialidad, hay que tener en cuenta que las bodegas de datos contienen mucha informacin sensible que es necesario proteger para evitar fugas de informacin, por lo cual hay que implementar controles de acceso sobre la informacin que restrinja quien puede acceder y que informacin puede consultar.
La integridad de la informacin es otra de las preocupaciones a tener en cuenta para cumplir con el criterio de calidad de la informacin, por lo cual es necesario crear un modelo de datos bien diseado, as como crear cuidadosamente los metadatos asegurando que stos sean precisos y completos.
Por el lado de la disponibilidad, es necesario implementar herramientas que aseguren la disponibilidad del sistema mediante procedimientos de respaldo y recuperacin adecuados. Hay que tener en cuenta que a diferencia de los sistemas transaccionales las bodegas de datos contiene datos histricos que no varan en tiempo real, y la frecuencia de los respaldos depender de las necesidades de los usuarios, la informacin se podr respaldar en una sola transaccin o por lotes.
En cuanto al cumplimiento de las normatividades, se debe tener en cuenta la legislacin sobre el tratamiento de la informacin y su propiedad, confidencialidad y distribucin.
La minera de datos para este tipo de negocios, como lo es el supermercado Todoya, le puede aportar de manera muy contributiva al mejorar todas y cada una de las actividades tipo empresarial y comercial, que conlleva de una u otra forma al crecimiento de la misma.
Podemos tener varios casos para la aplicacin directa y de entera relevancia, tomamos como ejemplo cuando ofertamos un producto en donde el precio es muy competitivo y tenemos la opcin de contactar de forma directa nica y exclusivamente a los clientes que tengan la mayor opcin de acceder a este producto porque previamente hemos hecho una consulta de cules son los clientes que se puedan favorecer con este producto, y no acudiendo a todos los clientes porque significara tiempo e inversin. La gran mayora de las empresas en donde se implementa y se ejecuta la minera de datos se ven beneficiadas rpidamente y en donde la inversin se ve totalmente sufragada al momento de crecer tan rpido con la empresa en finanzas y administracin. La minera de datos, hace que se origen prototipos o estndares individualmente, que estn dispuestos para cada regin o sucursal y en consecuencia para diferentes tipos de clientes, lo que se trata es de individualizar por prioridad e individualizar las necesidades de cada cliente que la empresa debe solventar.
CONCLUSIONES
La implementacin de una bodega de datos le permite a las organizaciones contar con una herramienta que le puede dar respuesta a las preguntas ms frecuentes sobre el desempeo de la misma, adems debe ser una decisin basada en el anlisis de las necesidades de la organizacin en cuanto a informacin, poniendo en la balanza los principios de las bodegas de datos frente a los mecanismos de consulta existentes en la organizacin
Uno de los principales riesgos en la implementacin de una bodega de datos es el hecho de que los usuarios no tienen claro lo que esperan obtener del proyecto, para mitigar este riesgo se requiere que el equipo de desarrollo est constantemente retroalimentando al usuario sobre los avances del proyecto y dejar claro la naturaleza del mismo . Optimizar los recursos en la implementacin y funcionamiento de las bodegas de datos puede hacerlas mucho ms atractivas para las organizaciones que por lo general se cuidan en los gastos, y hay que asegurar que las bodegas de datos generen mediante las herramientas dispuestas para la inteligencia de negocios mayores ingresos y oportunidades para la organizacin que compensen en forma absoluta los gastos generados. Los cubos son subconjuntos de datos de un almacn de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se suman de acuerdo a factores de negocio seleccionados, proveyendo el mecanismo para la rpida y uniforme tiempo de respuesta de las complejas consultas.