Вы находитесь на странице: 1из 13

INTRODUCCIN

Con el presente informe se pretende desarrollar actividades terico prcticas


contenidas en la segunda unidad del Mdulo del curso, referente a las Bases de
Datos Distribuidas, las cuales se definen como un conjunto de mltiples bases de
datos lgicamente relacionadas las cuales se encuentran distribuidas en diferentes
espacios lgicos (P.ej. un servidor corriendo 2 maquinas virtuales) e
interconectados por una red de comunicaciones.
Dichas BDD tienen la capacidad de realizar procesamiento autnomo, esto
permite realizar operaciones locales o distribuidas. Un sistema de Bases de Datos
Distribuida (SBDD) es un sistema en el cual mltiples sitios de bases de datos
estn ligados por un sistema de comunicaciones de tal forma que, un usuario en
cualquier sitio puede acceder los datos en cualquier parte de la red exactamente
como si estos fueran accedidos de forma local.







DESARROLLO DE LA ACTIVIDAD

En la unidad 1, se desarroll el modelo distribuido del supermercado TODOYA.
Ahora, continuando con este ejercicio, se solicita que el grupo colaborativo
prepare y presente a las directivas del supermercado una propuesta detallada
de implementacin de una bodega de datos en la que se aplicar minera de
datos para extraer informacin importante para la toma de decisiones. La
propuesta debe presentar informacin suficiente sobre la bodega de datos, como:
ventajas para la organizacin, proceso de implementacin, costos, riesgos; de
igual manera una descripcin detallada de la aplicacin de algoritmos de minera
de datos en dnde se resalte qu informacin especfica se podra obtener
mediante esta tcnica que no podra obtenerse de manera convencional.
La propuesta la deben elaborar mediante participaciones significativas en el foro,
cuando ya tengan la informacin suficiente la consolidarn en el documento
final y entregarn teniendo las indicaciones que se dan en esta gua.

IMPLEMENTACIN DE BODEGAS DE DATOS SUPERMERCADO TODOYA

Las bodegas de datos son grandes repositorios integrados de datos que pueden
ser alimentados internamente o de fuentes externas, organizados de tal manera
que puedan facilitar la toma de decisiones.

Ventajas de la implementacin de una Bodega de Datos:
- Se pueden manejar grandes volmenes de datos a travs de sistemas tipo
DDS (Sistemas de soporte de toma de decisiones).
- Permite mejorar el manejo de informacin que antes estara dispersa y no
oportuna con una alta probabilidad de inconsistencias.
- Sin una bodega de datos pueden surgir en la organizacin altos volmenes
de informacin no estructurada que requieren anlisis.
- Facilita el acceso a la informacin histrica.
- Facilita la flexibilidad en la manipulacin de informacin.


Esquema del modelo de bodega de datos recomendado:












Etapas del proceso de implementacin:
- Definicin de requerimientos.
- Definicin de arquitectura.
- Presentacin del proyecto.
- Anlisis de proveedores.
- Evaluacin.
- Contratacin.
- Capacitacin.
- Implementacin.
Para la definicin de requerimientos observamos que TODOYA es una
organizacin dedicada a la venta al detal de productos de la canasta familiar, por
lo cual manejar la informacin del volumen de ventas por artculos, temporadas,
lneas, marcas, etc., le permitir tomar decisiones administrativas y de mercadeo
ms eficaces.
Para esta implementacin, la fuente de la informacin ser interna, pues ya se
manejan bases de datos de los detalles de ventas y clientes en el software
facturador, de esta manera se desarrollara una herramienta en el motor de bases
de datos para que extraiga los datos necesarios de reunir en la bodega de datos.
El proceso de implementacin de la bodega de datos inicia con el anlisis de las
necesidades del rea ms trascendental para el cumplimiento de las labores
misionales de la organizacin.
En este caso la organizacin se dedica a la venta de artculos al detal, por lo tanto
la primera rea de negocio que se debe construir es el de ventas.
Se debe definir la granularidad o nivel de detalle al que se quiere llegar por parte
de la organizacin a la hora de realizar un anlisis de ventas.
Si se quiere tener una informacin a nivel de artculos o productos vendidos la
tabla de hechos a seleccionar para la construccin del primer cubo debe ser
basada en la que almacena los detalles de venta de cada factura.
Algunas medidas a ser consideradas en nuestra tabla de hechos son las
siguientes:
Medida Agrupacin
Cantidad de artculos vendidos. Suma
Valor de Venta Suma
Costo de Venta Suma
Ganancia de Venta Suma
Impuesto de Venta Suma


El siguiente sera el diseo del cubo de datos:

Dimensiones
Para el anlisis de ventas se pueden considerar las siguientes dimensiones:
Tiempo: Permite realizar anlisis de ventas por ao, semestre, trimestre, mes,
semana y da, nos permite responder a interrogantes como el da de la semana en
el que se produce el mayor nmero de ventas.
Horas Minutos: Dentro de las buenas prcticas en diseo de bodegas de datos
se sugiere separar la dimensin de horas minutos de la dimensin de tiempo para
evitar tener demasiados registros en la dimensin de tiempo, esta dimensin
permite responder preguntas como en qu hora del da se produce la mayor
cantidad de ventas.
Clientes: La dimensin de clientes permite realizar un anlisis de ventas que
arroje resultados como el gnero de los clientes que ms compran, que compran
los clientes de acuerdo a su edad, que compran los clientes de acuerdo a su nivel
de estudios, etc.
Productos: la dimensin de productos permite identificar cules son los productos
ms vendidos, cuales generan mayores ganancias, que productos son adquiridos
de acuerdo al tipo de cliente, las marcas preferidas, los artculos preferidos, etc.
Sedes: permite hacer anlisis de ventas por sede.

Costos

En la parte fsica, se requiere la adquisicin de un servidor de buenas
capacidades de almacenamiento, dedicado nicamente al almacenamiento, y
otro servidor dedicado a contener el motor de bases de datos y el software
necesario para realizar las diferentes transacciones con la informacin
almacenada en la bodega de datos.

El costo del servidor de almacenamiento sugerido es de 11.378.448, se adjunta
cotizacin de Dell.

El costo del servidor de transacciones sugerido es de 18.479.019, se adjunta
cotizacin

Adems se debe adquirir un motor de bases de datos apto para el volumen de
datos que se van a manejar, como tambin adquirir los desarrollos de software
de ETL, y software de inteligencia de negocios para la generacin de anlisis y
reportes sobre los datos guardados en la bodega.

Riesgos

En relacin con el criterio de eficiencia, hay que tener en cuenta los costos de
almacenamiento generados a partir del crecimiento permanente de la bodega
de datos.

Hay que tener en cuenta que los usuarios quieren acceder tanto a datos
histricos como a datos totalizados y en algn momento los histricos pueden
llegar a ser menos accedidos, por lo tanto hay que implementar mecanismos
para monitorear el uso real de los datos almacenados en la bodega.

Respecto a la confidencialidad, hay que tener en cuenta que las bodegas de
datos contienen mucha informacin sensible que es necesario proteger para
evitar fugas de informacin, por lo cual hay que implementar controles de
acceso sobre la informacin que restrinja quien puede acceder y que
informacin puede consultar.

La integridad de la informacin es otra de las preocupaciones a tener en
cuenta para cumplir con el criterio de calidad de la informacin, por lo cual es
necesario crear un modelo de datos bien diseado, as como crear
cuidadosamente los metadatos asegurando que stos sean precisos y
completos.

Por el lado de la disponibilidad, es necesario implementar herramientas que
aseguren la disponibilidad del sistema mediante procedimientos de respaldo y
recuperacin adecuados. Hay que tener en cuenta que a diferencia de los
sistemas transaccionales las bodegas de datos contiene datos histricos que
no varan en tiempo real, y la frecuencia de los respaldos depender de las
necesidades de los usuarios, la informacin se podr respaldar en una sola
transaccin o por lotes.

En cuanto al cumplimiento de las normatividades, se debe tener en cuenta la
legislacin sobre el tratamiento de la informacin y su propiedad,
confidencialidad y distribucin.


La minera de datos para este tipo de negocios, como lo es el supermercado
Todoya, le puede aportar de manera muy contributiva al mejorar todas y cada una
de las actividades tipo empresarial y comercial, que conlleva de una u otra forma
al crecimiento de la misma.

Podemos tener varios casos para la aplicacin directa y de entera relevancia,
tomamos como ejemplo cuando ofertamos un producto en donde el precio es muy
competitivo y tenemos la opcin de contactar de forma directa nica y
exclusivamente a los clientes que tengan la mayor opcin de acceder a este
producto porque previamente hemos hecho una consulta de cules son los
clientes que se puedan favorecer con este producto, y no acudiendo a todos los
clientes porque significara tiempo e inversin.
La gran mayora de las empresas en donde se implementa y se ejecuta la minera
de datos se ven beneficiadas rpidamente y en donde la inversin se ve
totalmente sufragada al momento de crecer tan rpido con la empresa en finanzas
y administracin.
La minera de datos, hace que se origen prototipos o estndares individualmente,
que estn dispuestos para cada regin o sucursal y en consecuencia para
diferentes tipos de clientes, lo que se trata es de individualizar por prioridad e
individualizar las necesidades de cada cliente que la empresa debe solventar.






CONCLUSIONES

La implementacin de una bodega de datos le permite a las organizaciones
contar con una herramienta que le puede dar respuesta a las preguntas ms
frecuentes sobre el desempeo de la misma, adems debe ser una decisin
basada en el anlisis de las necesidades de la organizacin en cuanto a
informacin, poniendo en la balanza los principios de las bodegas de datos
frente a los mecanismos de consulta existentes en la organizacin

Uno de los principales riesgos en la implementacin de una bodega de datos
es el hecho de que los usuarios no tienen claro lo que esperan obtener del
proyecto, para mitigar este riesgo se requiere que el equipo de desarrollo est
constantemente retroalimentando al usuario sobre los avances del proyecto y
dejar claro la naturaleza del mismo
.
Optimizar los recursos en la implementacin y funcionamiento de las bodegas
de datos puede hacerlas mucho ms atractivas para las organizaciones que
por lo general se cuidan en los gastos, y hay que asegurar que las bodegas de
datos generen mediante las herramientas dispuestas para la inteligencia de
negocios mayores ingresos y oportunidades para la organizacin que
compensen en forma absoluta los gastos generados.
Los cubos son subconjuntos de datos de un almacn de datos, organizado y
sumarizado dentro de una estructura multidimensional. Los datos se suman de
acuerdo a factores de negocio seleccionados, proveyendo el mecanismo para
la rpida y uniforme tiempo de respuesta de las complejas consultas.


ANEXO 1
COTIZACIN DEL SERVIDOR



ANEXO 2.
COTIZACIN SERVIDOR DE TRANSACCIONES

Вам также может понравиться