Вы находитесь на странице: 1из 24

PRESENTACIN

El presente trabajo realizado durante el semestre 2017-10 Proyecto Business


Intelligence para la empresa NEPT COMPUTER, ha sido elaborado segn
instrucciones sobre la materia y los requerimientos de la organizacin obtenidos
mediante tcnicas de recopilacin de informacin a detallar ms adelante, esto
con el fin de analizar, desarrollar e implementar el proyecto de Business
Intelligence para la empresa ya nombrada, aplicando los conocimientos
obtenidos sobre las herramientas a utilizar, durante el curso.

1
INTRODUCCIN

Actualmente la mayora de las organizaciones y empresas poseen y generan


diariamente una enorme cantidad de datos imposibles de analizar a simple vista.
La mayor parte de estos datos generados no aportan la informacin necesaria a
la toma de decisiones empresarial, pues para poder usarlos es necesario que se
transformen en conocimiento til para quienes dispongan de ellos.

Estos datos se transforman en informacin cuando se analizan para


estructurarlos de forma inteligente. En la actualidad, poseer un conocimiento
proveniente de informacin comprensible, detallada, relevante y til es vital para
lograr y sostener una ventaja competitiva en el mundo empresarial. Para
transformar los datos y convertirlos en informacin, y sta a su vez, ser
aprovechada como conocimiento, se necesitan distintas tcnicas y procesos. A
todos estos procesos de tratamiento de datos se les atribuye el trmino de
Business Intelligence. Estas herramientas son las encargadas de recibir la
informacin proveniente de las distintas reas de la empresa y organizarla de tal
manera que las personas que toman las decisiones dentro de la compaa
puedan acceder a ella de manera rpida y eficaz, obteniendo lo que realmente
necesitan y ahorrndose la bsqueda dentro de la inmensa cantidad de
informacin que se recibe diariamente de todas las reas de la organizacin.

En el presente informe, se llevarn a cabo las actividades necesarias para


alcanzar los objetivos especficos del proyecto, estas van desde contextualizarse
hasta documentar los resultados de desarrollo de Business Intelligence en la
empresa NEPT COMPUTER, para mejorar la toma de decisiones de esta
organizacin.

2
INDICE

PRESENTACIN ............................................................................................... 1
INTRODUCCIN ............................................................................................... 2
INDICE ............................................................................................................... 3
1. JUSTIFICACION ......................................................................................... 4
1.1. Evaluacin del caso de negocio ............................................................ 5
1.1.1. Objetivos estratgicos de la organizacin ...................................... 5
1.1.2. Objetivos de la aplicacin BI ........................................................... 5
1.1.3. Necesidad o problema del negocio................................................. 6
1.2. Identificacin de las necesidades de informacin ................................. 7
1.2.1. Tipos de fuentes de datos .............................................................. 7
1.3. Anlisis Costo-Beneficio........................................................................ 7
1.4. Anlisis de Riesgos ............................................................................... 8
1.5. Mejora del proceso de Negocio ............................................................. 8
2. PLANEAMIENTO ........................................................................................ 9
2.1. Infraestructura organizacional ............................................................... 9
2.1.1. Tcnica ........................................................................................... 9
2.1.2. No tcnica ..................................................................................... 10
3. ANALISIS DEL NEGOCIO ........................................................................ 11

3
1. JUSTIFICACION

Para facilitar la toma de decisiones en una empresa u organizacin es necesario


analizar los datos, conocer hasta predecir el comportamiento de la organizacin
en el mercado. Las estrategias de BI buscan apoyar a los gerentes o empresarios
con elementos para identificar, medir y seguir estrategias que los lleven al
cumplimiento de la visin de la organizacin.

Para logar las estrategias y tener una ventaja competitiva reaccionando


gilmente ante los cambios del mercado es indispensable utilizar inteligencia de
negocios.

El cmo hacerlo es el objetivo de este proyecto de curso, definir una referencia


que pueda servir para mejorar el anlisis de datos en la empresa NEPT
COMPUTER, utilizando las herramientas BI.

4
DATOS DE LA EMPRESA
Razn Social:
- NEPT COMPUTER EIRL
Rubro Econmico:
- Ventas de Computadoras Online

Clientes:

- Personas naturales y jurdicas

Competidores:

- El principal competidores en el Per DXPer

Ubicacin:

- Jr. Julian de Morales 541 - Huaraz


Visin:

Ser la empresa lder en ventas de computadoras online en el Per.

Misin:

Ser la empresa lder en la venta de computadoras porttiles y de


escritorio con las mejores marcas del mercado, para lo cual
trabajaremos con estndares de calidad bien ejecutados para que los
clientes nos prefieran.

1.1 Evaluacin del caso de negocio


1.1.1 Objetivos estratgicos de la organizacin

Aumentar el nmero de ventas en un 20%


Aumentar el nmero de clientes en las zonas de Trujillo
Conseguir un soporte de informacin adecuado para el proceso de ventas
Ahorrar tiempo en la gestin de ventas

1.1.2 Objetivos de la aplicacin BI

Mejorar el formato de entrega de reportes para un mejor entendimiento


Realizas un anlisis que mes ha tenido ventas ms bajas y altas
Proporcionar reporte que permitan tener conocimiento de nuestros
clientes recurrentes

5
Proporcionar reporte que permitan tener conocimiento detallado de las
ventas
Mostrar reportes estadsticos de clientes por zonas y cantidad de compras

1.1.3 Necesidad o problema del negocio

Actualmente el negocio por internet es una buena forma de llegar ms rpido a


los clientes y ayuda a la empresa a ahorrar diferentes tipos de gastos, pero uno
de sus problemas es la falta de confianza de los clientes a la compra online, otro
problema es que no todos los sectores del pas opten por hacer compras online
a pesar de que es una manera ms rpida de hacer compras y obteniendo
incluso informacin ms detallada, tambin tenemos el problema de las
competencia ya que son muchas empresas dedicadas a este tipo de negocio, lo
que ocasiona prdidas econmicas. De este modo, la empresa requiere tener
informacin necesaria, rpida y detallada para la toma de decisiones

6
1.2 Identificacin de las necesidades de informacin
1.2.1 Tipos de fuentes de datos

Operacional: Base de datos general de la empresa


Privados: No Aplica
Externos : No Aplica

1.3 Anlisis Costo-Beneficio

La viabilidad del proyecto depende mucho de la magnitud en cuanto a beneficios


que la empresa pueda obtener, tanto los beneficios como los costos pueden
manifestarse de diversas formas. Se realizar un anlisis comparativo. El
desarrollo del proyecto va a demandar lo siguiente en donde el rango para la
puntuacin estimada es de 10 a -10. Un puntaje final total por encima de 0 indica
que ms probable que la empresa obtenga un beneficio total.

Beneficios Puntuacin Costos Puntuacin


Mejorar el control de la 10 Dinero requerido para -10
organizacin hardware y software
Mejores informes y 8 Nmero de das de -8
anlisis de resultados adaptacin al cambio
Ahorro en tiempo para 5 Capacitacin de personal -3
consultar informes
Mejora la satisfaccin 8 Tiempo para recuperar la -8
del cliente inversin realizada
Evitar prdidas de 9 Equipo de trabajo -5
informacin
Integracin de la data 7 Migracin de datos -3
Otros costos -2
TOTAL 47 TOTAL -39

7
1.4 Anlisis de Riesgos

Tipo de riesgo Riesgos posibles Probabilidad Impacto


No cumplir con los plazos establecidos en el cronograma 0,2 5
PERSONAS
Abandono por parte de algn miembro 0,1 2
TECNOLOGIA Desconocimiento en la tecnologa 0,5 3
Mala informacin utilizada 0,3 5
PROCESO
Mala manipulacin de las herramientas 0,3 4
Problemas en el uso del producto 0,3 4
PRODUCTO
Producto no cumple el objetivo 0,2 5

Probabilidad de riesgo Impacto de Riesgo


Probabilidad Rango Impacto Valor
Muy baja 00 - 29,99 Muy leve 1
Baja 30 - 49,99 leve 2
Moderada 50 - 69,99 Moderado 3
Alta 70 - 89,99 De consideracin 4
Muy alta 90 - 100 catastrfico 5

1.5 Mejora del proceso de Negocio

Mejorar la atencin y el servicio a los clientes a travs de la mejora de


gestin de ventas
Mejor manejo de informacin, obteniendo informacin precisa, en tiempo
real
Facilitar y agilizar el proceso de ventas
Informacin suficiente para la toma de decisiones.
Mejorar la comprensin de las necesidades del cliente.

8
2 PLANEAMIENTO

2.1 Infraestructura organizacional

2.1.1 Tcnica

Hardware
o Laptop Intel Corel i5 Disco Duro de 500GB, Memoria RAM 4GB
o Laptop Intel Corel i7 Disco Duro de 500GB, Memoria RAM 8GB

Software
o MySQL DataBase
o Office 2016
o Sistema de escritorio para ventas
o Sistema web para ventas
o Sistema de escritorio para almacn

Equipos de intercomunicacin
o 1 Switch
o 2 modem/router TP-LINK

Sistema administracin base de datos


o MySQL Workbench

Sistema Operativo
o Windows 7

9
2.1.2 No tcnica

Modelo Logico de datos


El modelo lgico de datos (LDM) de la empresa fue diseada en la herramienta
MySQL Workbench y se muestra en la siguiente ilustracin:

10
3 ANALISIS DEL NEGOCIO

3.1 Definicin de Requerimientos

3.1.1 Infraestructura Tcnica


Para el desarrollo del proyecto se va a necesitar:
Hardware:
1 Servidor HP ProLiant ML110 G8 de Intel Xeon E5-
2600 2.53 GHz.
2 computadores Intel Core I5 4 Gb de RAM.
Software:
MySQL Database
Office 2016
Pentaho Data- integration
Pentaho Schema Workbench

3.1.2 Infraestructura No Tcnica


Software:
Business Intelligence
Estndares de nomenclatura de datos:
Se utilizar la nomenclatura estndar para el diseo de una
base de datos MySQL.
Los nombres de tablas y campos deben estar compuestos
slo por nmeros y letras. Adicionalmente se puede utilizar
underscore (underscore = _), para separar prefijos.
Los nombres deben tener un largo mximo de 16 caracteres.
Utilizar palabras en minsculas.
Tanto los nombres de tabla como de columnas deben ser
escritos en singular.
Todos los modelos deben encontrarse normalizados y se
deben implementar utilizando la mayor cantidad posible de
reglas de integridad, salvo que se desee intencionalmente lo
contrario.
Los nombres de las tablas deben escribirse de la forma:
prefijo_nombredelatabla. El prefijo est compuesto por 3
caracteres, seguidos de un underscore. El primer carcter
indica el tipo de entidad, es decir, t: tabla, v: vista, p:
procedimiento almacenado, f: funcin, s: secuencia; y los
dos siguientes son una combinacin nica que identifica la
base de datos. Luego se concatena un underscore y
finalmente el nombre de la tabla sin separador.

11
3.1.3 Requerimientos de Reportes

N CONSULTAS UNIDAD

1 Cul es el monto de compras de un cliente en una Monto en soles


determinada cuidad, ao y mes?

Cantidad de pedidos de un producto en una determinada Cantidad de


2
regin? Pedidos

3 Cul es el Monto de los productos que fueron pagados Monto en soles


con una determinada tarjeta?

Cul es la cantidad de ventas de una ciudad que se Cantidad de


4
realizaron con una determinada forma de pago? Ventas

Listar el monto total de los clientes que compraron en un Monto, Cantidad


5
determinado ao. de Ventas

Listar el monto total de total de venta en un ao


6 Monto

3.1.4 Requerimientos de Fuente de Datos


Datos detallados.
Proveer datos entendibles.
Flexibilidad de los datos para su uso en reportes.
Proveer un alto Nivel de granularidad de los datos.
Uso de mtodos para la integracin de los datos.
Integracin de diferentes fuentes de datos.

3.1.5 Requerimientos de Limpieza de Datos


Evaluar anomalas en los datos o contradicciones.
Establecer un plan para la deteccin y retiro de anomalas.
Utilizar herramientas eficaces para la limpieza.

12
3.1.6 Requerimientos de Seguridad
Establecer privilegios de acceso de datos.
Considerar nuevas amenazas y vulnerabilidades.
Confirmar que los controles son efectivos y apropiados.
Utilizar medidores de riesgos.
Controlar el registro de nuevos datos, a travs de cuentas
de usuario.
Autentificacin de Usuario.
Backups.

3.2 Anlisis de Datos

3.2.1 Modelo Lgico de Datos Completo

13
3.2.2 Modelo de Datos Fsico

3.2.3 Especificacin de Limpieza de Datos

TIPO DE ESPECIFICACIN
FUENTE DE Definir el o los orgenes o fuentes de
DATOS donde provendrn los datos. (Registros de
Excel)
1. Exactitud: Los datos deben cumplir
los requisitos de integridad,
consistencia y densidad.
2. Integridad: Los datos deben cumplir
los requisitos de Entereza y validez.
3. Entereza: Alcanzado por la
correccin de datos que contienen
CALIDAD DE anomalas.
LOS DATOS 4. Validez: Alcanzado por la cantidad
de datos que satisfacen las
restricciones de integridad.
5. Consistencia: Alcanzado por la
correccin de contradicciones y
anomalas sintcticas.
6. Uniformidad: Relacionado con
irregularidades.
7. Densidad: Conocer el cociente de
valores omitidos sobre el nmero de
valores totales.
8. Unicidad: Relacionado con datos
duplicados.
Auditora de Datos: Los datos son
revisados con el empleo de
mtodos estadsticos de descubrir
anomalas y contradicciones.
Definicin de Workflow (Flujo de
Trabajo): La deteccin y el retiro de
PROCESO DE anomalas son realizados por una
LIMPIEZA DE secuencia de operaciones sobre los
LOS DATOS datos sabidos como el Workflow.
Ejecucin de Workflow: En esta
etapa, el Workflow es ejecutado
despus de que su especificacin
es completa y su correccin es
verificada.
Post-Proceso y Control: Los datos
que no podan ser corregidos

14
durante la ejecucin del Workflow
debern ser corregidos
manualmente, de ser posible.
Seleccin de una forma para la carga
de datos:
Acumulacin simple
CARGA DE
Realiza un resumen de todas las
DATOS transacciones comprendidas en el
perodo de tiempo seleccionado y
transportar el resultado como una
nica transaccin hacia el data
warehouse, almacenando un valor
calculado que consistir
tpicamente en un sumatorio o un
promedio de la magnitud
considerada.

Rolling
Se aplica en casos que se opta por
mantener varios niveles de granularidad
(jerarquas). Se almacena informacin
resumida a distintos niveles,
correspondientes a distintas agrupaciones
de la unidad de tiempo o diferentes niveles
jerrquicos en alguna o varias de las
dimensiones.

3.3 Prototipos
3.3.1 Datos a ser Usados
ATRIBUTOS TIPOS DE VALORES
DATOS NULOS LONGITUD DESCRIPCION
Cliente_Key int no 12 Dimensin que
contiene toda la
Nombre Completo varchar no 100 informacin
Direccin varchar no 100 detallada de los
Ciudad varchar no 100 Clientes

15
ATRIBUTOS TIPOS DE VALORES LONGITUD DESCRIPCION
DATOS NULOS
Tiempo_Key int no 11
Dimensin que
Ao int no 11 contiene detalle
Mes int no del tiempo

Trimestre int no 11
Semestre int no 11

ATRIBUTOS TIPOS DE VALORES LONGITUD DESCRIPCION


DATOS NULOS
Pedido_Key int no 11
Dimensin que
Nombre_Pedido varchar no 100 contiene detalle
Cantidad int no 11 del Pedido

Precio float no
Tipo varchar no 100

ATRIBUTOS TIPOS DE VALORES LONGITUD DESCRIPCION


DATOS NULOS
Ubigeo_Key int no 11
Dimensin que
Nombre_Ubigeo varchar no 100 contiene detalle
Distrito varchar no 100 del Ubigeo

Provincia varchar no 100


Departamento varchar no 100

3.3.2 Prototipos

3.3.3 Matriz de Habilidades

16
4 PLANEAMIENTO

4.1 Diseo de la Base de Datos


4.1.1 Modelo Fsico de Datos

4.1.2 DDL
-- MySQL Workbench Forward Engineering

SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS,
UNIQUE_CHECKS=0;
SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS,
FOREIGN_KEY_CHECKS=0;
SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='TRADITIONAL,
ALLOW_INVALID_DATES';

-- -----------------------------------------------------
-- Schema NetComputerDW
-- -----------------------------------------------------

-- -----------------------------------------------------
-- Schema NetComputerDW
-- -----------------------------------------------------
CREATE SCHEMA IF NOT EXISTS `NetComputerDW` ;
USE `NetComputerDW`;

-- -----------------------------------------------------
-- Table `NetComputerDW` `DIM_CLIENTE`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `NetComputerDW``DIM_CLIENTE` (
`DIMCLI_ID` INT NOT NULL AUTO_INCREMENT,
`NOMBRE_COMPLETO` VARCHAR(100) NOT NULL,
`DIRECCION` VARCHAR(100) NOT NULL,
`CIUDAD` VARCHAR(100) NOT NULL,
PRIMARY KEY (`DIMCLI_ID`))

17
ENGINE = InnoDB;

-- -----------------------------------------------------
-- Table `NetComputerDW`.`DIM_PEDIDO`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `NetComputerDW`.`DIM_PEDIDO` (
`DIMPE_ID` INT NOT NULL AUTO_INCREMENT,
`NOMBRE_PEDIDO` VARCHAR(100) NOT NULL,
`CANTIDAD` INT(11) NOT NULL,
`PRECIO` FLOAT NOT NULL,
`TIPO` VARCHAR(100) NOT NULL,
PRIMARY KEY (`DIMPE_ID`))
ENGINE = InnoDB;

-- -----------------------------------------------------
-- Table `NetComputerDW`.`DIM_TIEMPO`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `NetComputerDW`.`DIM_TIEMPO` (
`DIMT_ID` INT(11) NOT NULL AUTO_INCREMENT,
`AO` INT(11) NOT NULL,
`MES` INT(11) NOT NULL,
`TRIMESTRE` INT(11) NOT NULL,
`SEMESTRE` INT(11) NOT NULL,
`NOMBRE_MES` CHAR(12) NOT NULL,
`NOMBRE_SEMESTRE` CHAR(12) NOT NULL,
`NOMBRE_TRIMESTRE` CHAR(12) NOT NULL,
PRIMARY KEY (`DIMT_ID`))
ENGINE = InnoDB;

-- -----------------------------------------------------
-- Table `NetComputerDW`.`DIM_UBIGEO`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `NetComputerDW`.`DIM_UBIGEO` (
`DIMUBI_ID` INT(11) NOT NULL AUTO_INCREMENT,
`NOMBRE_UBIGEO` VARCHAR(100) NOT NULL,
`DISTRITO` VARCHAR(100) NOT NULL,
`PROVINCIA` VARCHAR(100) NOT NULL,
`DEPARTAMENTO` VARCHAR(100) NOT NULL,
PRIMARY KEY (`DIMUBI_ID`))
ENGINE = InnoDB;

-- -----------------------------------------------------
-- Table `NetComputerDW`.`VENTAS_HECHOS`
-- -----------------------------------------------------
CREATE TABLE IF NOT EXISTS `NetComputerDW`.`VENTAS_HECHOS` (
`CLIENTE_ID` INT(11) NOT NULL,
`PEDIDO_ID` INT(11) NOT NULL,
`TIEMPO_ID` INT(11) NOT NULL,
`UBIGEO_ID` INT(11) NOT NULL,
`VENTAS` FLOAT NOT NULL,
`CANTIDAD` INT(11) NOT NULL,
INDEX `fk_VENTAS_HECHOS_DIM_CLIENTE_idx` (`CLIENTE_ID` ASC),

18
INDEX `fk_VENTAS_HECHOS_DIM_PEDIDO1_idx` (`PEDIDO_ID` ASC),
INDEX `fk_VENTAS_HECHOS_DIM_TIEMPO1_idx` (`TIEMPO_ID` ASC),
INDEX `fk_VENTAS_HECHOS_DIM_UBIGEO1_idx` (`UBIGEO_ID` ASC),
PRIMARY KEY (`CLIENTE_ID`, `PEDIDO_ID`, `TIEMPO_ID`,
`UBIGEO_ID`),
CONSTRAINT `fk_VENTAS_HECHOS_DIM_CLIENTE`
FOREIGN KEY (`CLIENTE_ID`)
REFERENCES `NetComputerDW`.`DIM_CLIENTE` (`DIMCLI_ID`)
ON DELETE NO ACTION
ON UPDATE NO ACTION,
CONSTRAINT `fk_VENTAS_HECHOS_DIM_PEDIDO1`
FOREIGN KEY (`PEDIDO_ID`)
REFERENCES `NetComputerDW`.`DIM_PEDIDO` (`DIMPE_ID`)
ON DELETE NO ACTION
ON UPDATE NO ACTION,
CONSTRAINT `fk_VENTAS_HECHOS_DIM_TIEMPO1`
FOREIGN KEY (`TIEMPO_ID`)
REFERENCES `NetComputerDW`.`DIM_TIEMPO` (`DIMT_ID`)
ON DELETE NO ACTION
ON UPDATE NO ACTION,
CONSTRAINT `fk_VENTAS_HECHOS_DIM_UBIGEO1`
FOREIGN KEY (`UBIGEO_ID`)
REFERENCES `NetComputerDW`.`DIM_UBIGEO` (`DIMUBI_ID`)
ON DELETE NO ACTION
ON UPDATE NO ACTION)
ENGINE = InnoDB;

SET SQL_MODE=@OLD_SQL_MODE;
SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS;
SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS;

4.2 Diseo ETL


4.2.1 Mapeo Fuente Destino

Mapeo de la dimensin Cliente

19
Mapeo de la dimensin Pedido

Mapeo de la dimensin Tiempo

Mapeo de la dimensin Ubigeo

Mapeo de la Tabla Hechos

20
4.2.2 Diagrama de Flujo de Procesos ETL

Mapeo de la dimensin Cliente

Mapeo de la dimensin Pedido

Mapeo de la dimensin Tiempo

21
Mapeo de la dimensin Ubigeo

4.2.3 Diseo del Repositorio OLAP

5 DESPLIEGUE
5.1 Implementacin
5.1.1 Lista de Entregables
Informe Final del Proyecto de Implantar un BI

Manual de Ejecucin de cada aplicacin

Base de datos Dimensionas

22
CONCLUSIONES
El ambiente del mundo de los negocios de hoy exige una aplicacin cada vez
ms eficiente de la informacin disponible. BI como su nombre en ingls lo
indica, genera un conocimiento al negocio, que se deriva de la correcta
utilizacin de la informacin generada dentro y fuera de la empresa. BI es una
herramienta que pone a disposicin de los usuarios la informacin correcta en
el lugar correcto. Son mltiples los beneficios que ofrece a las empresas, entre
ellos se encuentra la generacin de una ventaja competitiva. Hay una gran
variedad de soluciones de BI que en suma, son muy similares, pero para que
se considere completa debe reunir cuatro componentes: multidimensionaldad,
data mining, agentes y data Warehouse. Son ya muchas las empresas que han
implementado soluciones de BI y se han visto enormemente beneficiadas. Las
funciones que puede traer el sistema de Inteligencia de Negocios son mltiples
y se presenta por una parte como una solucin y por otra como una
metodologa a seguir, para que una empresa genere ventajas competitivas

23
ANEXOS

24