Академический Документы
Профессиональный Документы
Культура Документы
READS
4
1 author:
Jose Bahamon
University ICESI
6 PUBLICATIONS 2 CITATIONS
SEE PROFILE
RESUMEN
El desarrollo de los Sistemas de Informacin Gerencial basados en tecnologas de Data Warehouse y Herramientas Olap, es relativamente reciente y, por lo tanto, no existe una
propuesta metodolgica universalmente vlida y aceptada como tal, por
la comunidad acadmica.
El presente artculo expone una propuesta metodolgica para la realizacin del diseo de una bodega de datos, que utiliza como eje articulador
la identificacin de las necesidades de
informacin por parte de la gerencia,
para el soporte de los procesos de control y de toma de decisiones.
El mtodo propuesto est compuesto
de ocho pasos agrupados en tres fa-
SISTEMAS
& TELEMTICA
13
14
SISTEMAS
& TELEMTICA
INTRODUCCIN
El desarrollo de los Sistemas de Informacin Gerencial basados en tecnologas de Data Warehouse y herramientas Olap, es relativamente reciente y, por lo tanto, no existe una
propuesta metodolgica universalmente vlida y aceptada como tal, por
la comunidad acadmica.
Entre las propuestas ms conocidas
estn: 1. Ralph Kimball,1 con un esquema centrado en la identificacin
de los procesos de la empresa, como
elemento clave para la definicin de
la estructura de variables y dimensiones; 2. W.H. Inmon,2 con un esquema que parte de la construccin del
modelo de datos corporativos, elaborado al ms alto nivel de abstraccin,
para luego derivar la estructura del
modelo de datos, para el diseo de la
bodega; 3. Golfarelli Matteo, Maio
Dario, Rizzi Stefano3 proponen un
esquema que parte de los modelos ER descriptivos de los sistemas transaccionales de la organizacin, para
luego derivar el modelo E-R de la estructura, para la bodega de datos.
En este artculo se presenta una propuesta de sistematizacin del proceso de diseo de una bodega de datos,
que se aparta de los esquemas de diseo referidos, y que utiliza como eje
articulador, la identificacin de la informacin gerencial, para el soporte
de los procesos de control y de toma
de decisiones en los niveles directivos de la organizacin.
MTODO PROPUESTO
El mtodo de diseo propuesto est
centrado en la identificacin de la
informacin clave y relevante para soportar los procesos de direccin y de
toma de decisiones dentro de la organizacin. Este mtodo utiliza, como
punto de partida, la identificacin y
el modelado de: qu es lo que el
negocio est tratando de alcanzar, para luego elaborar una estructura que apoye el proceso de gestin
hacia el logro de las metas definidas.
Una vez que la informacin clave de
apoyo a los procesos de gestin y control de la organizacin ha sido identificada, se inicia la elaboracin del
modelo lgico-conceptual de la estructura de la bodega de datos, que soportar las consultas y la exploracin
de los datos, a partir de los cuales se
construirn los indicadores de gestin
requeridos por los niveles directivos
de la organizacin.
Para darle un orden a este proceso
sistmico de diseo, los pasos del
mtodo propuesto, tal como se presentan en la Figura 1, se han agrupado
en las siguientes fases:
Fase 1: Identificacin de las necesidades de informacin gerencial, desde la perspectiva del negocio.
Fase 2: Elaboracin del modelo lgico-conceptual de la estructura
de la bodega de datos.
1.
Kimball R. The Data Warehouse Toolkit. John Wiley & Sons, 1996.
2.
Inmon W.H. Building The Data Warehouse. QED Press / John Wiley & Sons, 1992.
3.
Golfarelli M., Maio D., Rizzi S. Conceptual Design of Data Warehouse From E/R Schemes.
http//www.csr.unib.it/~golfare/db.html, 1998.
SISTEMAS
& TELEMTICA
15
Fase 1:
Identificacin de las necesidades
de informacin gerencial, desde
la perspectiva del negocio.
La primera fase, a partir de la cual
se realiza el proceso de diseo de la
estructura para una bodega de datos,
comprende la identificacin de las necesidades de informacin gerencial,
lo que significa hacer explcitos los
objetivos y los factores claves de xito de la organizacin, o de un rea
del negocio.
Es bastante comn empezar este proceso de identificacin y modelado
mediante entrevistas a los directivos,
en las cuales la pregunta central es:
4.
Vase Bahamn Jos H. Construccin de indicadores de gestin bajo el enfoque de sistemas. S&T Revista
de la Facultad de Ingeniera, Universidad Icesi. 2003.
16
SISTEMAS
& TELEMTICA
3.2. Definicin del esquema fsico del almacenamiento de las dimensiones y sus jerarquas.
3.3. Definicin de los atributos que conforman las
tablas de hechos.
SISTEMAS
& TELEMTICA
17
Como resultado de esta fase, se tendr una visin del negocio y de la informacin requerida para la direccin
y el control gerencial, representada
fundamentalmente por: Los objetivos
del negocio; los factores clave de xito y, en especial, un conjunto de indicadores clave de la gestin.
Fase 2:
Elaboracin del modelo lgicoconceptual de la estructura de la
bodega.
En esta fase se elabora el modelo lgico de la estructura de la bodega, que
soportar las consultas, mediante las
cuales se obtendr la informacin requerida por los niveles directivos
como apoyo a sus procesos de gestin
y de toma de decisiones.
La elaboracin de este modelo lgico
comienza con los indicadores de ges-
18
SISTEMAS
& TELEMTICA
tin (necesidades de informacin gerencial), identificados en la fase anterior, y termina con la construccin
de una representacin multidimensional de las variables que conforman
cada indicador. En esta representacin multidimensional, cada variable
es modelada mediante un arreglo dimensional (multidimensional) de celdas, como se presenta en la Figura 2.
Para facilitar el proceso de elaboracin del modelo lgico, se utiliza una
representacin grfica denominada
diagrama tipo estrella, donde el elemento central del esquema es la Variable o Tabla de Hechos (Fact), la
cual es referenciada por un conjunto
de ejes, denominados Dimensiones, a
travs de los cuales se seleccionan los
valores contenidos en la tabla de hechos. En la Figura 3, se esquematiza
el modelo de un diagrama en estrella.
SISTEMAS
& TELEMTICA
19
Grfica
Trayectorias cclicas
y acclicas
Tabla de hechos
Dimensin
Las dimensiones corresponden a los ejes con los cuales se construye la vista multidimensional de la informacin clave del negocio, almacenada en la tabla de hechos.
Las atributos almacenados en las dimensiones determinan la
granulacin adoptada para el modelo.
Las dimensiones pueden ser:
Propias: Cuando el conjunto de entidades que conforman
la dimensin se encuentran unidas a la tabla de hechos, en
una trayectoria acclica.
Impropias: Cuando el conjunto de entidades que conforman la dimensin se encuentran unidas a la tabla de hechos, en una trayectoria cclica.
De Informacin: Cuando los atributos contenidos en la
dimensin definen qu tipo de datos se encuentran almacenados en la tabla de hechos.
Jerarquas
20
SISTEMAS
& TELEMTICA
A continuacin se presentan los cuatro pasos propuestos para la sistematizacin del proceso de elaboracin del
modelo lgico:
Paso No. 1:
Definir las tablas de hechos o las
variables de la estructura.
Este paso se realiza a partir del conjunto de los indicadores de gestin,
definidos en la fase de identificacin
de las necesidades de informacin
gerencial, desde la perspectiva del
negocio. El paso se inicia con la evaluacin de las variables (divisores y
dividendos) de cada indicador, para
determinar cules de stas pueden
ser almacenadas en una tabla de hechos, y cules no.
En el Cuadro 2 se presenta, a manera de ejemplo, la informacin obtenida, al aplicar los pasos de la fase 1 al
rea de ventas de una organizacin.
A partir de estos resultados se identifican las variables o tablas de hechos, como lo establece el paso 1 de
esta fase.
Aplicacin del paso 1: Identificacin
de las tablas de hechos
El indicador definido para el monitoreo del objetivo puede ser
construido con una sola tabla de
hechos: Ventas. Se toma una sola
variable, por cuanto las ventas del
ao y las ventas del ao anterior,
que son las dos variables que conforman el indicador, se pueden
almacenar en la misma tabla de
hechos.
SISTEMAS
& TELEMTICA
21
Ventas del ao
I_obj:
-1
Ventas del ao anterior
Ventas del vendedor
I1_FCE1:
Cuota de ventas
Nmero de visitas de venta realizadas
I2_FCE1:
Nmero de visitas presupuestadas
Nmero de clientes nuevos en la base de datos
I1_FCE2:
Nmero de clientes nuevos presupuestados
Nmero de vendedores capacitados que aprobaron los cursos
I1_FCE3:
Nmero presupuestado de vendedores capacitados
22
SISTEMAS
& TELEMTICA
Paso No. 2:
Identificar, para cada tabla de
hechos, las dimensiones que la
referencian.
Para cada variable o tabla de hechos
se identifican, con la colaboracin del
usuario lder del rea de negocio, los
ejes de visualizacin multidimensional los cuales constituyen las dimensiones de la variable.
Paso 3:
Establecer el nivel de granulacin y los niveles de agregacin
de cada dimensin.
Una vez que las dimensiones han sido
identificadas se debe establecer, para
cada una de ellas, el menor nivel de
granulacin, el cual corresponde al
conjunto de atributos que referencian
el mayor nivel de detalle deseado
para la variable o tabla de hechos.
A manera de ejemplo, se aplican los
dos pasos anteriores para la Tabla de
SISTEMAS
& TELEMTICA
23
Dim1: Producto
Jerarqua en la Dim. Producto: Las ventas por productos pueden ser agregadas por grupos de
productos, por lneas de productos y, por el total de la venta. De
esta manera, los niveles de agregacin de la dimensin producto
son:
5.
Paso 4:
Elaborar el diagrama en estrella
que representa la estructura de
la bodega.
Luego de identificar los elementos
que conforman la estructura de la
vista multidimensional, de la informacin gerencial requerida por la
organizacin, se pasa a la elaboracin
de una representacin grfica, en forma de estrella; para ello se puede utilizar la notacin simplificada de los
diagramas E-R, o la notacin denominada Dot modeling.5
Todman, Chris. Designing a Data Warehouse: Supporting Customer Relationship. Prentice Hall, 2001.
24
SISTEMAS
& TELEMTICA
SISTEMAS
& TELEMTICA
25
anterior. En la Figura 8 se representan los mismos elementos de la estructura de la bodega, pero con notacin tipo E-R.
26
SISTEMAS
& TELEMTICA
Fase 3:
Elaboracin de la estructura fsica de la bodega
Durante esta fase, se realiza la transformacin del modelo lgico conceptual en la estructura fsica, que posteriormente ser implementada en
alguna herramienta de Data Warehouse.
Este proceso de transformacin se
realiza mediante los siguientes pasos:
1. Verificacin y refinamiento del
modelo lgico para determinar su consistencia. 2. Definicin del esquema
fsico de almacenamiento de las estructuras jerrquicas de las dimensiones. 3. Identificacin de los atributos que conforman las tablas de
hechos y las dimensiones.
Paso 1:
Verificacin y ajuste
del modelo lgico.
Durante este paso, se realiza la verificacin del modelo lgico, obtenido en
la fase anterior, para garantizar que
el modelo, adems de soportar todas
las consultas requeridas por los niveles ejecutivos, siempre retorne informacin confiable.
Para iniciar este proceso de verificacin se debe elaborar una matriz de
cruce, entre los requerimientos de
informacin gerencial, definidos en la
fase inicial, y las estructuras (estrellas), definidas en la fase anterior. En
la matriz de cruce se confirma si el
requerimiento est completamente
6.
SISTEMAS
& TELEMTICA
27
2. Ajuste para los casos de trayectorias alternas, mezcladas con trayectorias cclicas.
Se presenta cuando la trayectoria de
una dimensin est conformada por
una trayectoria alterna, ms una trayectoria cclica, tal como se esquematiza en la Figura 10.
28
SISTEMAS
& TELEMTICA
7.
SISTEMAS
& TELEMTICA
29
2. Conversin horizontal
En esta conversin, la llave primaria
de la dimensin se conforma como
una llave compuesta por las llaves de
cada una de las entidades que conforman la trayectoria de la dimensin. En la Figura 13 se presenta, de
manera grfica, este esquema de conversin.
30
SISTEMAS
& TELEMTICA
Igualmente, para la especificacin de los atributos que conforman las dimensiones se debe utilizar el formato que aparece en el Cuadro 4.
SISTEMAS
& TELEMTICA
31
Suma
Conteo
Prom.
Mn.
Mx.
Suma
Conteo
Prom.
Mn.
Mx.
Mn.
Mx.
1. Dimensin a
2. Dimensin b
3. Dimensin c
.....
Atributo 2
Dimensiones
1. Dimensin a
2. Dimensin b
3. Dimensin c
Atributo 3
Dimensiones
1. Dimensin a
2. Dimensin b
3. Dimensin c
....
Suma
Conteo
Prom.
32
SISTEMAS
& TELEMTICA
rea de ventas
Tabla de hechos
Ventas
Atributos
Id lugar
Id tiempo
id producto
Unidades vendidas
Pesos-venta
tipo
C(35)
C(12)
C(30)
N(8,0)
N(10,2)
Pk
S
S
S
Descripcin
Identif. de la dimensin lugar
Identif. de la dimensin tiempo
Identif. de la dimensin producto
Valor 1 de la tabla de hechos
Valor 2 de la tabla de hechos
SISTEMAS
& TELEMTICA
33
Tabla de hechos
Ventas
Atributo 1
Unidades vendidas
Dimensiones
Lugar
Tiempo
Producto
Atributo 2
Dimensiones
Lugar
Tiempo
Producto
Suma
Conteo
Prom
Mn
Mx
Conteo
Prom
Mn
Mx
Pesos-venta
Suma
CONCLUSIN
Mediante la aplicacin del enfoque de
Sistemas para la definicin de los indicadores claves de gestin de la organizacin, se ha logrado articular
una propuesta para modelar, de manera ordenada y sistmica, las estructuras de las bodegas de datos que servirn de soporte a la implementacin
de sistemas de informacin gerencial,
hechos a la medida de las necesidades de informacin de la gerencia.
Esta propuesta facilita, ordena y sistematiza un proceso que en algunas
34
SISTEMAS
& TELEMTICA
BIBLIOGRAFA
Mcguff, F. Designing the perfect
Data Warehouse. 1998. http://
members.aol.com/fmcguff/dwmodel/index.htm
CURRCULO
Jos Hernando Bahamn L. Ingeniero Electrnico de la Universidad
del Cauca, especialista en Administracin de la Universidad Icesi y magster en Direccin Universitaria de
la Universidad de los Andes. Profesor investigador de la Universidad
Icesi. Vinculado a la Universidad Icesi desde 1988. Ha sido jefe del Departamento Acadmico de Sistemas
(1988-1998), Director del programa
de Ingeniera de Sistemas (19982000), y en la actualidad es el Director Acadmico de la Universidad.
SISTEMAS
& TELEMTICA
35
36
SISTEMAS
& TELEMTICA