Академический Документы
Профессиональный Документы
Культура Документы
AUTOMVIL
UNIVERSIDAD LIBRE
FACULTAD DE INGENIERA
PROGRAMA DE INGENIERA DE SISTEMAS
BOGOT D.C.
2011
Director
Gilberto Pedraza Garca
Ingeniero de Sistemas y Computacin
UNIVERSIDAD LIBRE
FACULTAD DE INGENIERA
PROGRAMA DE INGENIERA DE SISTEMAS
BOGOT D.C.
2011
Nota de Aceptacin:
_______________________________
_______________________________
_______________________________
_______________________________
_______________________________
_______________________________
_______________________________
Director del Proyecto
_______________________________
Firma del jurado
_______________________________
Firma del jurado
AGRADECIMIENTO
Queremos manifestar nuestro agradecimiento a todas las personas que durante el
proceso nos han apoyado en esta etapa de nuestras vidas, a nuestro director de
proyecto Ingeniero Gilberto Pedraza Garca que gracias a l hemos escogido uno
de los temas interesantes de la Ingeniera de Sistemas como son las Bodegas de
datos, por sus continuas enseanzas y su apoyo en el proceso de este trabajo.
Quisiramos tambin darle las gracias a nuestra familia que nos han brindado todo
el apoyo posible, durante todo este proceso de formacin desde el comienzo hasta
culminacin de nuestra carrera.
Adicionalmente les agradecemos a todas las personas que han intervenido con
este proyecto, ofrecindonos su conocimiento y experiencia sobre el tema
(Bodegas de datos).
CONTENIDO
Pg.
INTRODUCCIN
16
1.
17
17
17
1.3 JUSTIFICACIN
17
1.4 OBJETIVOS
1.4.1 General
1.4.2 Especficos
18
18
18
1.5 ALCANCE
18
1.6 HIPTESIS
19
2.
20
MARCO REFERENCIAL
20
20
20
20
21
21
24
25
26
27
27
28
29
30
30
41
43
43
44
3.
DISEO METODOLGICO
45
45
4. DESARROLLO METODOLGICO
48
48
53
56
57
57
58
65
66
69
79
5.
RESULTADOS
82
6.
CONCLUSIONES
90
7.
RECOMENDACIONES
91
BIBLIOGRAFA
92
ANEXOS
94
LISTA DE FIGURAS
Pg.
Figura 1. Los tres pilares de BI
23
25
27
31
44
51
54
56
64
65
66
67
68
68
69
70
70
71
71
72
72
73
73
74
75
75
76
76
77
77
78
79
80
80
81
83
84
85
86
87
88
89
LISTA DE TABLAS
Pg.
Tabla 1. Marco legal
41
49
50
51
52
55
59
59
60
60
61
61
61
62
62
62
83
84
85
86
87
88
89
LISTA DE ANEXOS
Anexo A. Entrevista
94
96
10
GLOSARIO
11
12
13
14
RESUMEN
El uso de las Bodegas de datos como medio de informacin en una empresa, ha
revolucionado el ambiente empresarial, principalmente en lugares donde se desea
tener un conocimiento ms profundo sobre la manera de poder mejorar sus
estrategias de mercado.
Un problema presentado en la empresa Saln del Automvil es la poca eficiencia
en el uso de la informacin la cual no se pueden sacar conclusiones, ya que esta
informacin no es muy utilizada por la redundancia de los datos y no representan
ninguna ayuda en el mejoramiento de la toma de decisiones y procesos internos
de la empresa Saln del Automvil, as almacenando datos ao tras ao sin darle
un uso adecuado para beneficio de la misma empresa. Adems si la organizacin
requiere generar un informe con estos datos se demoran demasiado tiempo
porque este proceso se realiza manualmente y no pueden saber con exactitud que
clientes compran ms durante cada ao.
El anlisis y diseo de una bodega de datos para ayudar en la toma de decisiones
en la empresa Salon del Automvil genera los informes de los clientes mayoristas,
los productos ms vendidos, las fechas de las mayores compras, los medios de
pago que cancelan los clientes y el promedio de compra por cliente mayorista,
adems lo datos son almacenados y organizados en la herramienta Microsoft SQL
Server 2008.
15
INTRODUCCIN
16
1.1
JUSTIFICACIN
17
OBJETIVOS
1.4.1 General. Elaborar una estrategia para toma de decisiones que permita
describir un comportamiento o plantear un modelo de prediccin relacionado con
la problemtica de los clientes mayoristas de la empresa Saln del Automvil
utilizando Microsoft SQL Server 2008 y su componentes analysis services e
Integration services.
1.4.2 Especficos
Establecer el perfil de los clientes y priorizar un conjunto de requerimientos para
fidelizacin de clientes mayoristas de la empresa Saln del Automvil.
Identificar y valorar la calidad de las fuentes de datos disponibles y requeridas
para implementar el modelo
Modelar e implementar una estrategia de bodega de datos para consolidar la
informacin necesaria.
Aplicar el modelo de anlisis a la bodega para establecer las variables que
determinan la fidelizacin de clientes y evaluar resultados.
1.5
ALCANCE
1.6
HIPTESIS
19
2. MARCO REFERENCIAL
2.1
MARCO HISTRICO
1
2
20
MARCO CONCEPTUAL
21
22
TURBAN Efraim, SHARDA Ramesh, ARONSON Jay, KING David. Business Intelligence: A Managerial Approach.
Pearson Education Canada, 2010
Ibid
23
Una dimensin es modelada de forma copo de nieve cuando los campos de baja
cardinalidad de la dimensin han sido removidos a tablas separadas y unidas a la
tabla original con llaves forneas 7 . En este modelo la tabla de hechos no tendr
llaves forneas a todas las dems tablas como en el caso de la estrella. Las
KIMBALL Ralph, CASERTA Joe. The Data Warehouse ETL Toolkit Practical Techniques for Extracting, Cleaning,
Conforming, and Delivering Data.
6
7
Ibid
Ibid
25
nuevas tablas no estarn conectadas con la tabla de hechos sino con las
dimensionales establecidas.
2.2.4 Modelo multidimensional. Las Bodegas de datos y sistemas OLAP se
basan en un modelo multidimensional. Este modelo permite una mejor
comprensin de los datos con fines de anlisis y proporciona un mejor rendimiento
para consultas complejas de anlisis. Visin del modelo de datos multidimensional
en un espacio n-dimensional, generalmente llamado un cubo de datos o un
hipercubo. 8
Los Datamarts son subconjuntos, que debe ser consistente en la representacin
de los datos, para que pueda asegurar la robustez. Son subconjuntos de datos de
una bodega de datos para reas especficas, los Datamarts son pequeos
datawarehouse encargados de un tema o un rea de negocio especfico dentro de
una organizacin. El sistema de base de datos donde se construye el DW puede
ser multidimensional o relacional. Cuando este sistema es relacional el diseo
lgico puede aplicar tcnicas de de los modelos multidimensionales a bases de
datos relacionales.
OLTP (On-Line Transactional Processing).Los sistemas OLTP son bases de
datos orientadas al procesamiento de transacciones. Cada transaccin genera un
proceso atmico y puede involucrar las operaciones de insercin, modificacin y
eliminacin de datos. Este proceso es tpico en las bases de datos operacionales.
El acceso a los datos optimizado a las tareas de lectura y escritura, un ejemplo de
ello son las transacciones que tiene que soportar una base de datos de un banco.
Los datos estn estructurados segn su nivel de aplicacin, mediante los
programas de gestin ERP o CRM.
Es comn la falta de compatibilidad y la existencia de islas de datos
El historial de datos suele limitarse a los datos actuales 9
OLAP (On-Line Analytical Processing) Los sistemas OLAP son bases de
datos orientadas al procesamiento analtico. Este anlisis implica generalmente la
lectura de amplias cantidades de datos para poder extraer informacin til:
tendencias de ventas, patrones de comportamiento de los consumidoresetc.
Este sistema es tpico de los datamarts.
El acceso a los datos suele ser de solo lectura. Su accin ms comn es la
consulta.
nd
MALINOWSKI Elzbieta - Esteban Zimanyi . Advanced Data Warehouse Design. 2 corrected printing 2009. Springer
SINNEXUS. Bases de datos OLTP y OLAP, [En lnea]. [30 de Septiembre de 2010]. Disponible en la Web:
http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx
26
Los datos se estructuran de acuerdo a sus reas de negocio y los formatos de los
datos estn integrados de una forma uniforme en toda la organizacin.
El historial de datos es a largo plazo, normalmente de dos a cinco aos
Suele alimentar informacin procedente de los sistemas operacionales existentes,
mediante el proceso ETL (Extraccin, transformacin y carga). 10
2.2.5 Modelamiento en Bodegas de Datos: Dimensional Vs Relacional. En los
sistemas transaccionales el objetivo del modelo es brindar la integridad de los
datos, adems elimina todo tipo de redundancia. Este sistema nos permite tener
un mejor entorno del procesamiento transaccional.
En un entorno de bases de datos relacionales se debe bsicamente a esta
disciplina de modelado. Sin embargo, para el propsito de un Data Warehouse, el
modelo relacional (ER) presenta los siguientes problemas:
Legibilidad limitada. Los usuarios finales no son capaces de entender el modelo
ER. Por tanto, no pueden navegar por dicho modelo en busca de informacin.
Dificultad para las herramientas de consulta en el acceso a un modelo ER general.
Las herramientas de consulta a menudo poseen prestaciones mediocres o
inaceptables cuando se trabaja en entornos relacionales de grandes volmenes de
informacin.
La utilizacin de la tcnica de modelado ER frustra el principal atractivo del Data
Warehouse. Al utilizar el modelado ER queda frustrada la recuperacin de
informacin intuitiva y con alto rendimiento.
2.2.6 Arquitectura de la Bodega de Datos
Figura 3. Arquitectura bodega de datos
11
10
SINNEXUS. Bases de datos OLTP y OLAP, [En lnea]. [30 de Septiembre de 2010]. Disponible en la Web:
http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx
27
11
ING. BERNABEU R. DARIO. Data Warehouse Arquitectura, [En lnea]. Publicado Enero de 2009, [17 de Septiembre de
2010]. Disponible en la web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-datawarehouse/31-introduccion
28
12
ING. BERNABEU R. Dario. Datawarehouse manager, [En lnea]. Publicado Enero de 2009, [17 de Septiembre de
2010]. Disponible en la Web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-datawarehouse/34-datawarehouse-manager
29
MARCO METODOLGICO
13
ING. BERNABEU R. Dario. Datawarehouse manager, [En lnea]. Publicado Enero de 2009, [17 de Septiembre de
2010]. Disponible en la Web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-datawarehouse/34-datawarehouse-manager
30
15
14
15
KIMBALL, Ralph.The Data Warehouse Lifecycle Toolkit. John Wiley & Sons. 1998
Ibid
31
32
33
35
36
37
Extraccin. La primera parte del proceso ETL consiste en extraer los datos
desde los sistemas de origen.
Cada sistema separado puede usar una
organizacin diferente de los datos o formatos distintos. Los formatos de las
fuentes normalmente se encuentran en bases de datos relacionales o archivos
planos, pero pueden incluir bases de datos no relacionales u otras estructuras
diferentes. La extraccin convierte los datos a un formato preparado para iniciar el
proceso de transformacin.
Una parte intrnseca del proceso de extraccin es la de analizar los datos
extrados, de lo que resulta un chequeo que verifica si los datos cumplen la pauta
o estructura que se esperaba. De no ser as los datos son rechazados.
Un requerimiento importante que se debe exigir a la tarea de extraccin es que
sta cause un impacto mnimo en el sistema origen. Si los datos a extraer son
muchos, el sistema de origen se podra ralentizar e incluso colapsar, provocando
que ste no pueda utilizarse con normalidad para su uso cotidiano. Por esta razn,
en sistemas grandes las operaciones de extraccin suelen programarse en
horarios o das donde este impacto sea nulo o mnimo.
Transformacin. La fase de transformacin aplica una serie de reglas de
negocio o funciones sobre los datos extrados para convertirlos en datos que
sern cargados. Algunas fuentes de datos requerirn alguna pequea
manipulacin de los datos. No obstante en otros casos pueden ser necesarias
aplicar algunas de las siguientes transformaciones:
Seleccionar slo ciertas columnas para su carga (por ejemplo, que las
columnas con valores nulos no se carguen).
Traducir cdigos (por ejemplo, si la fuente almacena una "H" para Hombre y "M"
para Mujer pero el destino tiene que guardar "1" para Hombre y "2" para Mujer).
Codificar valores libres (por ejemplo, convertir "Hombre" en "H" o "Sr" en "1").
Obtener nuevos valores calculados (por ejemplo, total_venta = cantidad *
precio).
Unir datos de mltiples fuentes (por ejemplo, bsquedas, combinaciones, etc.).
Calcular totales de mltiples filas de datos (por ejemplo, ventas totales de cada
regin).
Generacin de campos clave en el destino.
Transponer o pivotar (girando mltiples columnas en filas o viceversa).
Dividir una columna en varias (por ejemplo, columna "Nombre: Garca, Miguel";
pasar a dos columnas "Nombre: Miguel" y "Apellido: Garca").
La aplicacin de cualquier forma, simple o compleja, de validacin de datos, y la
consiguiente aplicacin de la accin que en cada caso se requiere:
38
39
16
WIKIPEDIA. Mineria de datos, [En lnea].Modificado en Noviembre de 2010, [24 de Noviembre de 2010].Disponible en
la Web: http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#T.C3.A9cnicas_de_miner.C3.ADa_de_datos
40
MARCO LEGAL
LEY O ARTICULO
Ley 1273
DESCRIPCIN
El 5 de enero de 2009, el Congreso de
la Repblica de Colombia promulg la
Ley 1273 Por medio del cual se
modifica el Cdigo Penal, se crea un
nuevo bien Ley 1273 jurdico tutelado
denominado De la Proteccin de la
informacin y de los datos- y se
preservan integralmente los sistemas
que utilicen las tecnologas de la
informacin y las comunicaciones, entre
otras disposiciones.
41
mensuales vigentes.
Artculo 269C:
INTERCEPTACIN DE
DATOS INFORMTICOS
Artculo 269F:
VIOLACIN DE DATOS
PERSONALES.
42
2.5
17
MARCO TECNOLGICO
17
INFORMATICA JURIDICA. Republica de Colombia, [En Lnea].[18 Septiembre de 2010]. Disponible en:
http://www.informatica-juridica.com/legislacion/colombia.asp
43
MARCO GEOGRFICO
19
18
WIKIPEDIA. Microsoft SQL Server, [En lnea].Modificado en Septiembre de 2010, [18 de Septiembre de
2010].Disponible en la Web: http://es.wikipedia.org/wiki/Microsoft_SQL_Serve
19
[18
44
Septiembre
de
2010].
Disponible
en
la
Web:
3. DISEO METODOLGICO
3.1
TIPO DE INVESTIGACION
45
46
47
4. DESARROLLO METODOLGICO
4.1 PLANEACIN DEL PROYECTO
Planeacin y Administracin del proyecto. El proyecto est dirigido a las
empresas Saln del Automvil la cual su objeto social es la venta de repuestos
automotrices. Para este caso se ha escogido el escenario de demasiada demanda
de informacin, porque la empresa a travs de los aos ha guardado sus datos
pero sin darle un uso adecuado para el mejoramiento de la toma de decisiones.
Estos datos que se van a manejar dentro del proyecto fueron suministrados por el
gerente General de la compaa, el cual nos brindo su apoyo para la realizacin
de este.
De acuerdo a Ralph Kimball existen cinco factores que deben existir en una
organizacin para iniciar un proyecto de bodega de datos:
Patrocinio de la gerencia del negocio. Contamos con el aval del Gerente
General de la compaa el cual tiene una visin del mejoramiento de su empresa
con el modelamiento de una bodega de datos.
Motivacin del negocio. La empresa Saln del Automvil es consciente que al
tener un modelo de una bodega de datos como parte de la organizacin esta le
brindara una gran ayuda a la hora de tomar decisiones que le permitan tener un
mayor crecimiento en el mercado.
Acompaamiento del departamento de Tecnologa. La empresa Saln del
Automvil cuenta con una persona encargada del rea de tecnologa la cual nos
brindara su apoyo en caso de ser necesitado.
Presencia de cultura analtica. Por medio de la bodega de datos la empresa
tendr una gran ayuda que le permitir que las decisiones tomadas sean
determinantes y recompensadas para el negocio.
Factibilidad. La empresa Saln del Automvil cuenta con la informacin
detallada para la realizacin de la Bodega de datos.
Luego de haber determinado la factibilidad en la empresa Saln del Automvil en
la elaboracin de una bodega datos, se mirara el enfoque que esta tendr:
El enfoque inicial del proyecto, ser determinar cules son los clientes
mayoristas de la empresa.
Manejaremos inicialmente una sola fuente de datos la cual nos suministro la
empresa Saln del Automvil.
48
Responsabilidad
Proporcionar las diferentes herramientas
y conceptos de
organizacin, que se requieran durante el desarrollo del proyecto
partiendo de una base terica.
Velar por las actividades y cumplimiento ptimo del cronograma
establecido, involucrando al equipo de trabajo y las diferentes
tareas proporcionados al hito de cada entrega de las fases y
metodologa propuesta.
Responsabl Coordinar de forma precisa cada actividad correspondiente al
e de rea cronograma, proporcionando las posibles herramientas logsticas
(Administra requeridas para el xito de la etapa y sus actividades.
dor
del
proyecto)
Coordinar cada recurso tcnico, e incorporarlo con las etapas de la
Lder
metodologa establecida, cumpliendo con las entregas de carcter
tcnico
funcional del Datamart y su arquitectura
Evaluar de forma continua la solucin presentada por el lder
Lder
tcnico, para el tener un producto de alta calidad, estando en
usuario
constante comunicacin con el cliente final
Desarrollo total del proyecto en constante comunicacin con el
rea
lder funcional. Actividades como Administrador de Bases de Datos
desarrollo
y arquitectura del Datamart.
Comunicacin con el cliente final y manejo de la herramienta, para
rea
presentacin de reportes financieros.
usuaria
Rol
Patrocinad
or
del
Proyecto
Gerente del
proyecto
Fuente: Autores
49
Rol
Patrocinador del Proyecto
Gerente del proyecto
Responsable
de
rea
(Administrador del proyecto)
Lder tcnico
Lder usuario
rea desarrollo
rea usuaria
Asignado a
Saln del Automvil
Andrs Pineda Savita
Wilmer Torres Gonzlez
Andrs Pineda
Gonzlez
Andrs Pineda
Andrs Pineda
Gonzlez
Wilmer Torres
Savita
Wilmer
Torres
Savita
Wilmer
Torres
Fuente: Autores
50
Fuente: Autores
Actividad
frecuencia responsable
semanal
Andres Pineda
Andres Pineda
51
Wilmer Torres
Andres Pineda
Fuente: Autores
como
salarios,
Actividad
frecuencia responsable
52
Andres Pineda
Wilmer Torres
semanal
Wilmer Torres
Andres Pineda
Andres Pineda
Fuente: Autores
53
estudio de cmo poder ayudar a ese mejoramiento que desea la empresa Saln
del Automvil. Esta informacin fue complementada con las facturas fsicas de
cada uno de los meses del ao 2009, que nos permiti obtener los productos
vendidos a cada uno de los clientes.
Figura 7. Origen de Datos
Fuente: Autores
54
Nombre
del Descripcin
Fuente de datos
requerimiento
Ventas
por Esta consulta permite explorar el valor
de las ventas del Saln del Automvil,
cliente
discriminando estas ventas por sus
sectores de clientes. Al hacer drill down
se exploran las ventas por clientes
individuales.
Ventas
por Esta consulta permite explorar el valor
de las ventas del Saln del Automvil,
productos
discriminando estas ventas por sus
lneas de productos. Al hacer drill down
se exploran las ventas por productos
individuales
Ventas
por Esta consulta permite explorar el valor Base de datos
de las ventas del Saln del Automvil, Salondelautomovil
tiempos
discriminando estas ventas por las
fechas de venta. Al hacer drill down se
limita ms el criterio del reporte,
permitiendo analizar las ventas por ao,
semestre, trimestre y da.
Ventas
de Se muestran las ventas que se han
productos
por hecho a los clientes con sus respectivos
productos.
cliente
Ventas
cliente
tiempo
Ventas
ciudad
en
55
Fuente: Autores
56
57
58
Grupo NO repetitivo
IDProducto
Nit
Valor
Nivel_Economico
Fecha
Nombre Empresa
Medio de Pago
Departamento
Ciudad
Localidad
Cod_Localidad
Sexo
Edad
Grupo Repetitivo
Producto
Tipo
Marca
Referencia
Fuente: Autores
Grupo 1
IDProducto
Nit
Valor
Nivel_Economico
Referencia
Fecha
Nombre_Empresa
Medio de Pago
Departamento
Ciudad
Localidad
Cod_Localidad
Sexo
Edad
Grupo 2
IDProducto
Producto
Tipo
Marca
Fuente: Autores
59
Grupo 1
IDProducto
Nit
Valor
Nivel_Econ
omico
Grupo 2
IDProducto
Producto
Referencia
Tipo
Marca
Grupo 3 Grupo 4
IDTiempo IDClient
Fecha
e
Nombre
_Empres
a
Sexo
Edad
Grupo 5
IDTransaccio
n
Medio
de
Pago
Grupo 6
IDDepartament
o
Departamento
Ciudad
Localidad
Cod_Localidad
Fuente: Autores
Esto se realiza para que en caso de que se requiera incluir un dato por ejemplo
que un producto se repita 50 veces en diferentes facturas solo se tendra que
incluir en la tabla del Grupo 2 un solo registro. Hasta aqu ya se pueden ver la
estructura de las Dimensiones (Dim.) de la Bodega de datos
Tabla 10. Segunda Forma Normal
Grupo 1
Dim. 1
Dim. 2
Dim. 3
IDProduct
o
Nit
Valor
Nivel_Eco
nomico
IDProducto
Producto
Referencia
Tipo
Marca
IDTiempo IDCliente
Fecha
Nombre
Empresa
Sexo
Edad
Dim. 4
Dim. 5
IDTransaccion IDDepartamento
Medio de Pago Departamento
Ciudad
Localidad
Cod_Localidad
Fuente: Autores
De las dimensiones que se crearon se pueden crear otras tablas como son las
siguientes:
60
Dim. 1
Dim. 6
Dim. 7
IDProducto
Nombre
Referencia
IDTipoProducto
IDTipoProducto
Tipo
IDMarca
Nombre
Fuente: Autores
Dim. 3
Dim 8
Dim 9
IDCliente
Nombre_Empresa
IDSexo
IDEdad
IDSexo
Sexo
IDEdad
Edad
Fuente: Autores
Dim. 5
Dim 10
IDDepartamento IDCiudad
Nombre
Nombre
IDLocalidad
IDCiudad
Dim 11
IDLocalidad
Nombre
Codigo
Fuente: Autores
61
Hechos_Ventas
Dim_Producto
Dim_Tiempo
Dim_Cliente
IDProducto
IDTiempo
IDCliente
IDTransaccion
IDDepartamento
Nit
Valor
Nivel_Economico
IDProducto
Nombre
Referencia
IDTipoProducto
IDTiempo
Fecha
IDCliente
Nombre_Empresa
IDSexo
IDEdad
Fuente: Autores
Dim_Tipo_Transaccion
Dim_Departamento
IDTransaccion
Medio de Pago
IDDepartamento
Nombre
IDCiudad
Fuente: Autores
Tabla conceptual. Una vez analizadas las diferentes fuentes de entrada (figura
8) y revisando cada campo del archivo se genero la siguiente tabla conceptual en
la que se crean cinco dimensiones.
Tabla 16. Tabla Conceptual
TABLA CONCEPTUAL
DIMENSION
Tiempo
JERARQUIA
Fecha
Ao
Mes
Da
EJEMPLOS
14/08/09, 10/01/09
2007, 2008, 2009
Enero, Febrero, Marzo...
1, 2, 3, 4, 5, 6, 7...
62
Cliente
Nombre
Sexo
Sexo
Edad
Edad
Departamento Nombre
Ciudad
Localidad
Producto
Tipo
Marca
Tipo
Transaccin
Nombre
Nombre
Codigo
Nombre
Referencia
Tipo
Nombre
Medio de Pago
Multiservicios
Intercambios..
Tecnicar,
Talleres
Masculino, Femenino
18,19,20,21,22 ..
Cundinamarca, Antioquia, Bolivar
Bogota, Medellin, Cali
Suba, Bosa, Kennedy, Engativa
11, 15, 18, 20.
Pistones, Discos, Mangueras
3001, 3002, 3003.
Exportado, Importado
Federal Nogul, Brigestone, Ingersoll Rand
Contado, Crdito
Fuente: Autores
Dim_Producto. Esta tabla es creada con el fin de almacenar los datos que se
encuentran en el archivo Origen como son: Referencia y Nombre del Producto ya
son datos que se encuentran en el Archivo de Excel de la empresa.
Dim_Tipo. Esta tabla es creada para la almacenar los datos del tipo de
producto (Ej: Exportado o Importado)
Dim_Marca. Se creo con el fin de guardar datos de las diferentes empresas
que crean repuestos automotrices y poder alimentarla a diario
Dim_Tiempo. Se crea esta tabla con el fin de almacenar las fechas que
contiene el archivo del Saln del Automvil, adems toda bodega de datos debe
manejar un tiempo en el cual transcurren los eventos en este caso las Ventas de
la empresa.
Dim_Cliente. Esta tabla es creada segn anlisis realizado al archivo en Excel
y almacenara todos los datos relacionados con los clientes de la empresa.
Dim_Sexo. Esta tabla almacena solo los valores relacionados al sexo de la
persona que realiza la compra
Dim_Edad. Esta tabla almacena todos los valores que puedan generar cierta
edad de un cliente
63
Fuente: Autores
64
Fuente: Autores
65
Fuente: Autores
66
Fuente: Autores
67
Fuente: Autores
Se crean las siguientes tablas temporales para poder almacenar los datos de Nit y
Valor y llevarlos a la tabla hechos al momento de hacer el proceso de ETL
Figura 14. Creacion de tablas Temporales
Fuente: Autores
68
Se crea la tabla Temporal de tiempo para que almacene la fecha del archivo de
Excel y poder extraerlo en la dimensin tiempo por da, mes y ao
Figura 15. Creacion de tabla Temporal Tiempo
Fuente: Autores
69
Fuente: Autores
Fuente: Autores
70
Fuente: Autores
Fuente: Autores
71
Fuente: Autores
Fuente: Autores
72
Fuente: Autores
Fuente: Autores
73
Fuente: Autores
74
Fuente: Autores
Fuente: Autores
75
Fuente: Autores
Fuente: Autores
76
Fuente: Autores
Fuente: Autores
77
Fuente: Autores
78
Microsoft SQL Server 2008 permite desarrollar soluciones de forma rpida con el
nuevo diseador y el fcil uso del cubo. Adicionalmente se pueden crear
diferentes vistas segn la necesidad de la empresa.
La plataforma de Analysis services que tiene incluido Microsoft SQL Server 2008
permite realizar tareas sencillas desde Business Intelligence Development Studio
durante todo el proceso de desarrollo, adems esta herramienta detecta posibles
problemas de diseo que puedan surgir con notificaciones automticas
proporcionadas por mejor diseo de la prctica alertas.
El siguiente es la vista generada en el Proyecto de Analysis Services
Figura 32. Vista en Analysis Services
Fuente: Autores
79
Cubo Ventas
Figura 33. Cubo Ventas Saln Automvil
Fuente: Autores
Fuente: Autores
80
Fuente: Autores
81
5. RESULTADOS
Microsoft SQL Server Reporting Services 2008 es una plataforma que est basada
en un servidor diseado para solucionar una variedad de necesidades para las
empresas y generar diferentes informes o reportes segn sus necesidades.
Esta Herramienta ofrece un entorno grafico familiar, con herramientas de fcil uso
y estructuras para informes bien detallados para generar reportes que se adapten
totalmente al gusto y la necesidad de la empresa
Solucin de las preguntas de negocio. El anlisis de las siguientes preguntas
de negocio, fue acordado con el cliente en nuestro caso el rea de las ventas de la
empresa Saln del Automvil, como entrega final del Prototipo realizado.
Cules son los diez clientes mayoristas de la empresa?
Cules son los productos ms comprados por los clientes mayoristas?
En qu fecha los clientes realizan mayores compras?
Por qu medio es cancelado los productos de los clientes mayoristas?
Cul es el monto promedio de compra de los clientes mayoristas?
Cul es la ciudad que tiene ms demanda con los productos de la compaa?
Dentro de los clientes mayoristas cul es el tipo de gnero que mas compra
los productos?
82
Fuente: Autores
CLIENTES
MULTIVE LTDA
GATE GOURMET COLOMBIA
CORPACERO LTDA
BUSES ARMENIA S.A.
MINCIVIL S.A.
GRAVILLERA ALBANIA
MULTISERVICIOS TECNICARS
ALEGRA ACTIVITY AMERICA
IRAUTOS LTDA
SERVIFORD
Fuente: Autores
83
MEDIDAS
Valor
Tiempo
Ao 2009
16.222.766
14.998.390
13.700.976
13.532.120
12.803.284
12.347.700
12.054.820
11.722.534
10.880.786
9.449.430
Fuente: Autores
MEDIDAS
Valor
Clientes
Ao 2009
PRODUCTOS
COMPRESOR DE AIRE VOLVO
25 C
EJE TRASERO KODIAK
COMPRESOR DE AIRE MOTOR
SUAVIZADOR TOYOTA
CRUCETAS MIXTAS TEREX
12.500.000
2.655.200
1.800.000
1.500.000
1.320.000
Fuente: Autores
84
Fuente: Autores
CLIENTES
RODAMIENTOS Y
BALINERAS LTDA
GATE GOURMET COLOMBIA
ALEGRA ACTIVITY AMERICA
DISTRIBUIDOR A.J.E.M
IRAUTOS LTDA
BUSES ARMENIA S.A.
J.E FILTROS LTDA
IMPORTADORA SOMOS
FORD COLO
REPUESTOS RIMAR CIA
LTDA
GRAVILLERA ALBANIA
Fuente: Autores
85
MEDIDAS
Valor
Tiempo
Mes 1 - 12
SEPTIEMBRE
VALOR
6.171.500
DICIEMBRE
JULIO
DICIEMBRE
AGOSTO
NOVIEMBRE
MAYO
AGOSTO
6.134.486
3.803.750
3.800.600
3.552.800
3.485.534
3.420.000
3.420.000
JUNIO
3.098.000
NOVIEMBRE
3.096.500
Cul es la opcin ms escogida por los clientes para pagar los productos
adquiridos?
En el siguiente grafico se muestra el medio de pago mas utilizado por los clientes
de la empresa Salon del automvil para realizar el pago de sus compras y segn
estos resultados los clientes tienen como preferencia el pago a Credito como se
muestra en la Figura 39.
Figura 39. Informe Medio de pago
Fuente: Autores
Ao 2009
16.222.766
14.998.390
13.700.976
13.532.120
12.803.284
12.347.700
12.054.820
11.722.534
10.880.786
9.449.430
Fuente: Autores
86
Medio de
pago
CREDITO
CREDITO
CREDITO
CREDITO
CREDITO
CREDITO
CONTADO
CREDITO
CREDITO
CREDITO
Fuente: Autores
CLIENTES
MULTIVE LTDA
GATE GOURMET COLOMBIA
CORPACERO LTDA
BUSES ARMENIA S.A.
MINCIVIL S.A.
GRAVILLERA ALBANIA
MULTISERVICIOS TECNICARS
ALEGRA ACTIVITY AMERICA
IRAUTOS LTDA
SERVIFORD
103.329,7197
142.841,8095
80.122,6666
111.835,7024
82.601,8322
107.371,3043
98.006,6666
101.056,3275
109.906,9292
119.613,0379
Fuente: Autores
87
PromedioCiudad
CARTAGENA
PASTO
BOYACA
CIUDADES
BUCARAMANGA
BARRANQUILLA
BOGOTA
0
CALI
Fuente: Autores
MEDIDAS
Valor
Promedio
CIUDADES
Ao 2009
MEDELLIN
40,103,838
CALI
436,064,429
BOGOTA
307,226,068
BARRANQUILLA
251,941,980
BUCARAMANGA
265,565,068
BOYACA
311,244,268
PASTO
335,547,744
CARTAGENA
418,372,151
Fuente: Autores
88
Dentro de los clientes mayoristas cul es el tipo de gnero que mas compra
los productos?
Como se muestra en la figura 42 el gnero que mas compra productos de la
empresa Salon del Automovil es el Masculino.
Figura 42. Informe Promedio Sexo
PromedioSexo
MASCULINO
FEMENINO
SEXO
50
100
Fuente: Autores
MEDIDAS
Valor
Promedio
SEXO
Ao 2009
FEMENINO
23
MASCULINO
87
Fuente: Autores
89
6. CONCLUSIONES
Para establecer el perfil de los clientes de la empresa Saln del Automvil se
generaron unas preguntas de negocio las cuales identifican las necesidades
primarias que tiene la empresa para el mejoramiento de las tomas de decisiones.
Una vez realizado el anlisis de la informacin y la verificacin de la calidad de
esta, permiti realizar un estudio detallado de las necesidades expuesta por la
empresa Saln del Automvil. Obteniendo los resultados esperados, que le
ayudaran en un futuro a tomar diferentes decisiones internas como externas.
Se cre un adecuado diccionario de datos, para luego realizar el modelamiento
de las tablas que son necesarias y as poder consolidar la informacin de una
manera ordenada y fcil de manejar, esto con el fin de obtener los resultados
propuestos por la empresa Saln del Automvil.
El prototipo le brindara a la empresa una manera gil de saber diferentes
entornos por medio de sus datos histricos dndole la informacin necesaria que
le ayudara a ver el comportamiento interno y as tener un mejor control y
argumentacin en las decisiones que sern tomadas en un futuro.
Una bodega de datos es mucho ms que un repositorio de informacin
histrica, es una serie de datos relacionados por procesos bien definidos que
llegan a producir la informacin ms adecuada para una correcta toma de
decisiones.
Este trabajo de grado se realizo con el fin de explorar otras tecnologas no
utilizadas frecuentemente en la universidad Libre, mostrando la viabilidad de una
propuesta metodolgica como es la de Ralp Kimball.
Una bodega de datos es un insumo para soportar objetivamente procesos de
toma de decisiones porque permite analizar y modelar informacin histrica y
actual para proponer modelos predictivos.
90
7. RECOMENDACIONES
En las bodegas de datos siempre se debe tener en cuenta que los
requerimientos de negocio se puedan confrontar con el rea tcnica, para as
poder ofrecer al final reportes que si se puedan generar.
Una bodega de datos debe tener informacin confiable y fcil de acceder en
una empresa y si hay datos en diversas fuentes se debe extraer de la fuente que
sea ms confiable.
Es necesario encontrar una justificacin correcta para el negocio en el momento
de iniciar con el proyecto para poderlo justificar desde un punto de vista financiero
y generar un retorno sobre la inversin. As la empresa estar totalmente de
acuerdo con el Proyecto.
Se debe identificar los roles del proyecto de acuerdo a las capacidades de cada
integrante para llegar a un proyecto exitoso y realizarlo en un menor tiempo
posible.
Para que la bodega de datos funcione correctamente es necesario que el
equipo de computo tengan instalados los aplicativos Microsoft SQL Server 2008
con sus herramientas Analysis Services, integration services y reporting services y
Visual Studio 2008.
Es necesario que el usuario que vaya a administrar la herramienta tenga
conocimientos bsicos de bases de datos y manejo de informacin a gran escala.
Para la implementacin del diseo conceptual propuesto es necesario que la
empresa Saln del automvil lleve un control ms detallado sobre la informacin
de sus clientes (Ej: Nivel econmico, genero, ciudades, etc.).
91
BIBLIOGRAFA
92
93
ANEXOS
Anexo A. Entrevista
Preguntas:
1. Actualmente manejan archivos de Excel que contengan gran informacin?
- Si
- No
2. Cree usted que con la informacin que contienen los archivos de Excel se
puede generar diferentes reportes que beneficien su empresa?
- Si
- No
3. Conoce usted que es una Bodega de Datos y para qu sirve?
- Si
- No
Si la respuesta es Si pasar a la pregunta 5.
4. Le gustara obtener informacin acerca de que es una bodega de datos y
para qu sirve?
-
Si
No
5. Cree usted que una bodega de datos le ayudara a los procesos internos
de la empresa Saln del Automvil?
- Si
- No
- Por qu?
____________________________________________________________
____________________________________________________________
____________________________________________
94
Si
No
Por qu?
____________________________________________________________
____________________________________________________________
____________________________________________
Si
No
Por qu?
____________________________________________________________
____________________________________________________________
____________________________________________
95
Descripcin
Salarios
1 Lder de proyecto
1 Administrador de bases de datos (DBA)
1 Desarrollador ETL
1 Ingeniero de Soporte Tcnico
1 Ingeniero de calidad
Valor
$ 12.350.000
$ 4.500.000
$ 3.000.000
$ 1.850.000
$ 1.500.000
$ 1.500.000
Valor*
$ 2.800.030
Licencia
Nombre
SQL Server 2008 R2 Enterprise
Valor*
$ 2.133.069,96
Sumando todo lo anterior para la elaboracin del proyecto se hace necesario para
la implementacin un valor de $ 17.283.099,96
* Los valores generados en las tablas anteriores son aproximados segn el precio del dlar.
96