Академический Документы
Профессиональный Документы
Культура Документы
ESCUELA DE POSTGRADO
JULIACA PER
2016
CAPTULO I
EL PROBLEMA DE INVESTIGACIN
1.1. Tema
Construccin de un Datamart orientado a las ventas para la toma de decisiones en la
empresa CORPORACION DECSUR SOCIEDAD DE RESPONSABILIDAD
LIMITADA.
Generan grandes cantidades de datos imposibles de analizar, la mayor parte de estos datos
generados no aportan informacin para la toma de decisiones empresariales, pues, para
poder usarlos es necesario que se transformen en informacin til para los usuarios.
A nivel mundial casi todas las empresas de la actualidad disponen de bases de datos que
almacenan datos sobre sus actividades (clientes, proveedores, empleados) mediantes
diferentes programas informticos (de facturacin, proveedura, contabilidad, etc.). Por lo
tanto, podemos decir que las empresas disponen por lo general, de multitud de datos
histricos, fiables y voluminosos de todas las actividades realizadas. Es lgico pensar que
dichos datos pueden ser refinados, agrupados, tratados y analizados para intentar extraer
informacin que permita ayudar en la toma de decisiones de las empresas.
En la empresa CORPORACION DECSUR S.R.L., cuenta actualmente con un sistema de
informacin que gestiona y almacena la informacin de las ventas que se registran en la
misma.
El sistema utiliza como repositorio de informacin una base de datos cuyo diseo
relacional est orientado al almacenamiento no a la consulta y explotacin de la
informacin almacenada, con el paso del tiempo los usuarios necesitan cada vez mayor
cantidad de reportes combinar informacin - y poder analizar la informacin de las
ventas desde una perspectiva histrica y actual, as como tambin la posibilidad de predecir
eventos futuros, como se sucedern las ventas en el prximo mes, semestre, etc.
Por este motivo es necesaria la implementacin del Datamart para ayudar a la toma de
decisiones sobre las ventas que se realiza, esto, ayudar al crecimiento de la empresa
Problema General
Problemas Especificos
1.3. Delimitacin
1.3.1. De Contenidos
rea: Administrativas Informticas
Lnea de Investigacin: Aplicaciones informticas
Sub-lnea de Investigacin: Inteligencia de negocios
1.3.2. Espacial
Se realizar en la provincia de San Romn Juliaca, en la Empresa CORPORACION
DECSUR S.R.L.
1.4. Justificacin
La realizacin del presente proyecto se justifica para mejorar la toma de decisiones por
parte de la empresa, adems, los tiempos de espera de reportes de informacin disminuirn.
La investigacin es de gran utilidad ya que los beneficiarios del proyecto a realizarse son
la empresa CORPORACION DECSUR S.R.L., la misma que podr generar reportes,
combinar la informacin de las ventas desde una perspectiva histrica y actual y adems
puedan predecir eventos futuros as llegarn a tomar las mejores decisiones.
1.5.1. General
Construir un Datamart para la toma de decisiones del departamento de ventas de la
empresa CORPORACION DECSUR SOCIEDAD DE RESPONSABILIDAD
LIMITADA.
1.5.2. Especficos
CAPITULO II
MARCO TERICO
2.1. Antecedentes Investigativos
Una vez revisado los archivos de tesis que se encuentran en la biblioteca de la Facultad de
Ingeniera en Sistemas, Electrnica e Industrial de la Universidad Tcnica de Cajamarca, se
encuentra que si existen temas relacionados al tema propuesto.
Para la presente investigacin en primer lugar se definirn los conceptos de los elementos
que intervienen en la implementacin del Datamart para tener claro cules son las ventajas
de una herramienta de inteligencia que ayuda a la toma de decisiones efectiva en la
empresa CORPORACION DECSUR S.R.L.
Direccin: Esta funcin requiere que los administradores influyan en los individuos para el
cumplimiento de las metas organizacionales y grupales.
Cmo manejo a un grupo de trabajadores que parecen tener una motivacin baja?
Cul es el estilo de liderazgo ms eficaz para una situacin dada?
Cmo afectar un cambio especfico a la productividad del trabajador?
Cundo es adecuado estimular el conflicto?
Segn [3], la estructura jerrquica de la toma de decisiones tiene tres niveles especficos
detallados a continuacin.
- Estratgico: Es el mximo rgano de autoridad y liderazgo, integrado por el consejo
administrativo, presidente y directores donde descansa la conduccin de la empresa.
- Tctico: Es el nivel intermedio de autoridad, compuesto por los responsables de aplicar los
lineamientos dispuestos por los superiores y de dirigir al personal encargado de las tareas.
Tradicionalmente los niveles anteriores se ilustran como una pirmide dividida en tres
partes, para destacar el orden ascendente de autoridad, el impacto de las decisiones y
competencia de las funciones que cada rango realiza.
Como se muestra en la Figura 2.2 se puede observar los niveles o jerarquas de la toma de
decisiones.
En conclusin se puede decir que cada uno de los niveles o jerarquas representa la forma
en que est organizada la empresa empezando por el gerente quien dirige la misma.
Segn [5], los sistemas de soporte a la decisin tienen caractersticas que se detallan a
continuacin:
OLTP - On-Line Transactional Processing. - Los sistemas OLTP son bases de datos
orientadas al procesamiento de transacciones. Una transaccin genera un proceso atmico
(que debe ser validado con un commit, o invalidado con un rollback), y que puede
involucrar operaciones de insercin, modificacin y borrado de datos. El proceso
transaccional es tpico de las bases de datos operacionales.
- El acceso a los datos est optimizado para tareas frecuentes de lectura y escritura. (Por
ejemplo, la enorme cantidad de transacciones que tienen que soportar las BD de bancos o
hipermercados diariamente). [6]
OLAP - On-Line Analytical Processing.- Los sistemas OLAP son bases de datos
orientadas al procesamiento analtico. Este anlisis suele implicar, generalmente, la lectura
de grandes cantidades de datos para llegar a extraer algn tipo de informacin til:
tendencias de ventas, patrones de comportamiento de los consumidores, elaboracin de
informes complejos, etc. Este sistema es tpico de los datamarts.
- El acceso a los datos suele ser de slo lectura. La accin ms comn es la consulta, con
muy pocas inserciones, actualizaciones o eliminaciones.
- Los datos se estructuran segn las reas de negocio, y los formatos de los datos estn
integrados de manera uniforme en toda la organizacin. [6]
Sistemas MOLAP
Sistemas ROLAP
El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional
maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona la
funcionalidad analtica. El nivel de base de datos usa bases de datos relacionales para el
manejo, acceso y obtencin del dato. El nivel de aplicacin es el motor que ejecuta las
consultas multidimensionales de los usuarios.
El motor ROLAP se integra con niveles de presentacin, a travs de los cules los usuarios
realizan los anlisis OLAP. Despus de que el modelo de datos para el datawarehouse se ha
definido, los datos se cargan desde el sistema operacional. Se ejecutan rutinas de bases de
datos para agregar el dato, si as es requerido por el modelo de datos. Se crean entonces los
ndices para optimizar los tiempos de acceso a las consultas.
Los usuarios finales ejecutan sus anlisis multidimensionales, a travs del motor
ROLAP, que transforma dinmicamente sus consultas a consultas SQL. Se ejecutan estas
consultas SQL en las bases de datos relacionales, y sus resultados se relacionan mediante
tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los
usuarios. [6]
Sistemas HOLAP
Se puede concluir que ROLAP son sistemas analticos relacionales que usan SGBD para
extraer la informacin, por el contrario la tecnologa MOLAP son herramientas de anlisis
[6]
2.2.4. DataWarehouse
Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y
depurar informacin de una o ms fuentes distintas, para luego procesarla permitiendo su
anlisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La
creacin de un Datawarehouse representa en la mayora de las ocasiones el primer paso,
desde el punto de vista tcnico, para implantar una solucin completa y fiable de
Inteligencia de Negocios. [7]
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se
almacena la informacin (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc.). Este tipo de persistencia de la informacin es homognea y fiable, y
permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno
diferente a los sistemas operacionales). [8]
Un parte intrnseca del proceso de extraccin es la de analizar los datos extrados, se realiza
un chequeo, el cual verifica si los datos cumplen la pauta o estructura que se esperaba. Si
no es as son rechazados. [7]
Carga: Al final del proceso de transformacin, los datos estn en forma para ser
cargados. Dependiendo de los requerimientos de la organizacin, este proceso puede
abarcar una amplia variedad de acciones diferentes. [7]
Segn [7], existen dos formas bsicas para desarrollar el proceso de carga de los datos:
Acumulacin simple: Consiste en realiza un resumen de todas las transacciones
comprendida en el periodo de tiempo seleccionado y transportar el resultado como una
nica transaccin hacia el Data Warehouse para su almacenamiento.
2.2.5. Datamart
Un Datamart es una base de datos departamental, especializada en el almacenamiento de
los datos de un rea de negocio especfica. Se caracteriza por disponer la estructura ptima
de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a
los procesos de dicho departamento. Un Datamart puede ser alimentado desde los datos de
un datawarehouse, o integrar por s mismo un compendio de distintas fuentes de
informacin.
Por tanto, para crear el Datamart de un rea funcional de la empresa es preciso encontrar la
estructura ptima para el anlisis de su informacin, estructura que puede estar montada
sobre una base de datos OLTP, como el propio datawarehouse, o sobre una base de datos
OLAP. La designacin de una u otra depender de los datos, los requisitos y las
caractersticas especficas de cada departamento. [9]
Como se muestra en la Figura 2.6 el Datamart tiene una estructura ptima para el anlisis
de la informacin.
Figura 2.6: Datamart
Fuente: http://www.datamart.datawarehouse.org/Data Mart y Data Warehouse _ El Blog de Ana
Buigues.htm/
2.2.5.1 Componentes del Datamart
Fuentes de Datos
Son las que alimentan de informacin al DataMart, estn diseadas para registrar
grandes cantidades de transacciones. Entre ella tenemos la base de datos OLTP (Una
base de datos para soportar procesos transaccionales). [9]
Segn [8], los Datamarts que estn dotados con estas estructuras ptimas de anlisis
presentan las siguientes ventajas:
Datamart. [10]
Segn [10], el ciclo de vida de la metodologa de Ralph Kimball se detalla a continuacin.
Cada Modelo Dimensional est compuesta por una tabla con una llave combinada, llamada
tabla de hechos, y con un conjunto de tablas ms pequeas llamadas tablas de dimensiones.
Cada punto de entrada a la tabla de hechos est conectado a una dimensin, lo que
permite determinar el contexto de los hechos.
Adems segn [10], cabe recalcar que para la construccin del Datamart se efectan cuatro
pasos importantes que se debe tomar en cuenta. Pasos en el diseo conceptual del
almacn de datos
3. Decidir las dimensiones a travs del grano. Las dimensiones presentes en la mayora de los
DDW son: tiempo, mercado, producto, cliente. Un grano bien elegido determina la
dimensionalidad primaria de la de hecho.
4. Elegir las mediciones del negocio para la de hecho. Se deben establecer los tems que
quedarn determinados por la clave compuesta de la de hecho.
Diseo fsico
El diseo fsico se focaliza sobre la seleccin de estructuras necesarias para soportar el
diseo lgico. Los elementos principales de este proceso son la definicin de convenciones
estndares de nombres y seteos especficos del ambiente de la base de datos. La indexacin
y las estrategias de particionamiento son tambin determinadas etapas. [10]
Al igual que en una construccin, los planos sirven para comunicar los deseos entre los
clientes y el arquitecto, como as tambin para medir esfuerzos y materiales necesarios
para la obra (comunicacin, planificacin, flexibilidad y mantenimiento, documentacin,
productividad y reuso). [10]
Implementacin
La implementacin representa la convergencia de la tecnologa, los datos y las
aplicaciones de usuarios finales accesible desde el escritorio del usuario del negocio. Hay
varios factores extras que aseguran el correcto funcionamiento de todas estas piezas, entre
ellos se encuentran la capacitacin, el soporte tcnico, la comunicacin. Todas estas tareas
deben ser tenidas en cuenta antes de que cualquier usuario pueda tener acceso al data
warehouse. [10]
El ciclo de vida de Ralph Kimball sigue una serie de paso cada uno de ellos se realiza de
acuerdo a las especificaciones de cada una de las empresas las cuales necesitan tomar
decisiones adecuadas para la toma de decisiones efectiva dentro de una rea especfica para
analizar desde diferentes puntos de vista, desde perspectivas diferentes segn las reglas de
negocios que se definen en cada una de las mismas.
Como se muestra en la Figura 2.7 el ciclo de vida de Ralph Kimball se desarrolla por
etapas o pasos.
Ciclo de Vida - Metodologa Kimball
CAPTULO III
MARCO METODOLGICO
Se recopil la informacin de los Datos del sistema transaccional que actualmente utiliza la
empresa, para analizar la informacin con una perspectiva histrica y actual de las
ventas que realiza la misma.
Jerarquizar los datos que permitirn una clasificacin que responda a los procesos de
procesamiento y toma de decisiones de la empresa.
DESARROLLO DE LA PROPUESTA
Este tipo de arquitectura es aplicable a todo tipo de empresa o industria que tiene
volmenes transaccionales e inventarios importantes, y que utiliza sistemas mecanizados
para las operaciones y transacciones de negocio.
Otro problema que se debe destacar es el gran volumen informacin que maneja el
departamento de ventas cada ao, esto hace que la misma quede almacenada y el gerente
no vea la informacin real del estado de las ventas.
Esta situacin se presenta ya que los gerentes desean informacin en tiempo real que ayude
al proceso y mejor evolucin de las ventas por lo que los mtodos actuales no son
adecuados para minimizar o eliminar el problema y analizar el estado actual de las ventas.
4.3 Justificacin
4.4 Hiptesis
Hiptesis General
Construccin de un Datamart orientado a las Ventas para la toma de decisiones en la
empresa CORPORACION DECSUR S.R.L., en la ciudad de San Romn Juliaca.
Hiptesis Especficos
Definir los requerimientos generales del rea de ventas para la construccin del Datamart.
Identificar los indicadores claves de las ventas que se necesita para la construccin del
Datamart.
Variables
Variable Independiente
Variable Dependiente
1. Matriz de consistencia
2. Construccin de un Datamart orientado a las ventas para la toma de
decisiones en la empresa CORPORACION DECSUR SOCIEDAD DE
RESPONSABILIDAD LIMITADA.
3. PROBLEMA 4. OBJETIVOS 5. HIPTESIS 6. VARIABL
8. Problema General: 15. Objetivo General: 18. Hiptesis general Variable 1: La constru
9. De qu manera la 16. Construir un Datamart 19. Construccin de un
construccin Datamart
para la toma de Datamart orientado a las Datamart
ayudara a la mejora de la
decisiones del Ventas para la toma de 22. Definicin Conce
toma de decisiones en la
23. El uso de p
empresa CORPORACION departamento de decisiones en la empresa virtuales, es la aplicaci
conjunto de ap
ventas de la empresa CORPORACION informticas de tipo sin
DECSUR S..R.L? asincrnicas, que fac
gestin, desarrollo y distr
10. CORPORACION DECSUR S.R.L., en la cursos
(2009)
a travs de Interne
11. Problemas Especficas: 24. Dimensiones:
12. Cmo la construccin de DECSUR ciudad de San Romn Gestin pedaggica de la
plataformas virtuales.
datamar ayudara a la SOCIEDAD DE Juliaca. Gestin Administrativa de
plataformas virtuales.
mejora a la toma de RESPONSABILIDAD
decisiones en la empresa 20. Hiptesis especficas 48. Variable 2: El
LIMITADA.
CORPORACION Definir los requerimientos Business Intelligence
49. Definicin Conce
DECSUR S..R.L? generales del rea de ventas 50. El aprendizaje co
17. Objetivos Especficos:
y multidisciplinario de
Disear el Datamart que para la construccin del
intercambio de informa
13. Cmo el Datamart que los estudiantes, los cu
ayude en la toma de Datamart.
ayudara en la toma de decisiones motivados tanto para
decisiones en la propio aprendizaje co
en la empresa CORPORACION Identificar los indicadores acrecentar los logros de
DECSUR S.R.L.? empresa en diferentes disciplinas
claves de las ventas que se
humano. John Dewey (19
CORPORACION
14. necesita para la 51. Dimensiones:
DECSUR S.R.L. Capacidad autoaprend
construccin del Datamart. Capacidad trabajo en
Implementar el Capacidad de com
21.
Datamart en la entre docente y alumn
empresa
CORPORACION
DECSUR S.R.L.
53.
55. VARIABL
56. DIMENSIONES 57. INDICADORES 58. TEMS
E
60. VARIABL 1. La plataforma virtual posee Foros de Discusin.
62. 1.1 Herramientas 2. Buscador de foros
E1
3. La plataforma virtual tiene herramientas para el intercambio d
orientadas al
4. Soporte de mltiples formatos
61. Uso de aprendizaje 5. La plataforma virtual posee Servicios de Chat.
Plataform 6. La plataforma virtual posee Correo electrnico Interno.
63. 7. La plataforma virtual posee notas de Trabajo en Lnea.
as
8. La plataforma virtual posee servicios de prestacin de multim
virtuales 9. La plataforma virtual posee pizarra (Bookmarks).
67. 1.2 Tiene
carrera
profesional
79. 2.3
Administracin de 1. Tiene manejos de contenidos.
2. Herramientas para la creacin de contenidos.
contenidos del 3. Herramientas de diseo educacionales.
curso o signatura 4. Organizacin de contenidos reutilizables.
92.
34
100. Se define como clave primaria un campo de tipo entero, adems, un dato entero
siempre ocupa menos espacio que un dato de tipo fecha (el campo clave se puede
repetir en millones de registros en la tabla de hechos y eso puede suponer mucho
espacio), por lo que se mejorar el diseo de la tabla de fechas si se utiliza un
campo "idfecha" de tipo entero como clave principal. La dimensin de tiempo va
a ser relacionada con la fecha de las ventas transformada a valor real o doble
adems de ello en esta dimensin se definirn los campos como es el ao, el
semestre, trimestre, semana, mes, da para que al momento de realizar los reportes
el gerente pueda analizar de acuerdo a su criterio e interpretar para tomar una
decisin oportuna al momento de visualizar las ventas obtenidas en todos los aos
analizadas por vendedor, cliente, etc.
- Dimensin de Clientes.- La dimensin Clientes guardar los campos como cdigo del
cliente, nombre del cliente, un campo como clave primaria de tipo auto numrico que
identifique a cada tupla. Cada empresa puede tener N clientes, en esta dimensin
tambin se puede observar la subrogacin que es la creacin de dos claves primarias en
una (codcla, codcli contra idcliente).
35
101. Dimensin de Zona.- La dimensin Zona guardar los campos como cdigo de
la zona, nombre de la zona, idzona de tipo auto numrico que identifique a cada
tupla idzona. Cada empresa puede tener N zonas.
103. Relacin AQL o asociativa es una forma que Qlik View genera las tablas
asociativas mediante la creacin del script para definir las diferentes dimensiones
y hechos, logrando una relacin exitosa para luego extraer los datos y analizarlos
de acuerdo a los requerimientos de la empresa.
104. En el presente proyecto se crea las dimensiones con cada uno de los campos
correspondientes a cada dimensin, las tablas de hechos para analizar los datos de
acuerdo a los reportes que se realizar.
106. Como se muestra en el Grfico 4.1, se crean los hechos y dimensiones del
Datamar
36
107.
d) Diseo y Desarrollo de la presentacin de datos
110.La extraccin convierte los datos a un formato preparado para iniciar el proceso
de transformacin. Se extrae la informacin del sistema transaccional, la base de
datos de la empresa est en Sql Anywhere y de esta pasa al Datamart que es una parte
del datawarehouse para explotarlos de la mejor manera y los datos que se visualicen
sean reales y concisos.
112.Carga: Al final del proceso de transformacin, los datos estn en forma para ser
cargados. Dependiendo de los requerimientos de la organizacin, este proceso puede
abarcar una amplia variedad de acciones diferentes.
37
los datos que se analicen sean en tiempo real y eficientes a la hora de tomar una
decisin.
115. A continuacin se procede a crear las diferentes dimensiones y hechos que
poblaran el Datamart de la empresa para luego ser explotados.
120.
121.
122.
123.
124.
125.
38
126. CAPTULO V
129.
130.
131.
132.
133.
39
134.
136.
Se recomienda al gerente revisar constantemente los indicadores claves de
rendimiento para el anlisis de las ventas realizadas en base a los vendedores,
clientes, artculos para verificar la rentabilidad de las mismas y poder tomar
decisiones oportunas en observar los reportes generados de cada una de las
dimensiones para que la informacin sea real y oportuna e inmediatas.
137.
Se recomienda que al momento de hacer algn cambio en el Datamart se tome en
cuenta siempre el usuario que va a utilizar el sistema y que debe estar orientado
al alto ejecutivo para el anlisis respetivo de la informacin de las ventas
efectuadas.
138.
139.
140.
141.
142.
143.
144.
145.
146.
40
147.
148. Bibliografa
149.
41
159. Mayo 2012. [En lnea]. Available:
http://www.sinnexus.com/business_intelligence/olap_avanzado.aspx. [ltimo
acceso: 27 Enero 2014].
[10] L. Miguel, Ciclo de vida de Ralph Kimball, 9 Febrero 2014. [En lnea]. Available:
http://luisleonin.blogspot.com/2014/02/ciclo-de-vida-de-ralphkimball.html. [ltimo
acceso: 15 Abril 2014].
161.
162.
163.
164.
165.
166.
167.
168.
169.
170.
171.
42
172.
173.
174.
43
son las tablas report, que vienen a ser fact-tables reducidas (que agregan las
dimensiones oportunas), y las vistas materializadas, que se construyen con la misma
estructura que las anteriores, pero con el objetivo de explotar la re escritura de queries
(aunque slo es posible en algunos SGBD avanzados, como Oracle).
44
188.ROLAP.- (Relational Online Analytical Processing) La arquitectura ROLAP cree
que las capacidades OLAP estn perfectamente implantadas sobre bases de datos
relacionales. Es una alternativa a la tecnologa MOLAP que se construye sobre bases
de datos multidimensional. Ambos tipos de herramientas, tanto ROLAP como
MOLAP, estn diseadas para realizar anlisis de datos a travs del uso de modelos
de datos multidimensionales, aunque en el caso de ROLAP estos modelos no se
implementan sobre un sistema multidimensional, sino sobre un sistema relacional
clsico.
189.
190.
191.
192.
193.
194.
45
195.
196.
197.
198.
199.
200.
201.
202.
203.
204.
205.
206.
207. Anexo 1:
46
208. Encuesta realizada a Gerente de la empresa CORPORACION DECSUR S.R.L.
209. DATOS GENERALES:
210. Fecha de la Encuesta.
211. DATOS ESPECFICOS: Marque con X en el parntesis de su eleccin
248.
47