Вы находитесь на странице: 1из 30

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

UNIDAD 1 FASE 1 PLANEACIN

Integrantes

Antonio Gallo Oate

Diana Arrieta

Jessica Fortich

Jaime Vergara

Edwin Hernndez

Director

Yesid Daz

Curso

Soluciones Analticas de Negocios

Universidad Nacional Abierta y a Distancia (UNAD)

Maestra en Gestin de Tecnologas de la Informacin.

Marzo 24 de 2017
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Tabla de Contenido
1. Introduccin............................................................................................................. 4
2. Resultados de la Actividad........................................................................................... 5
2.1. Metodologa Kimball........................................................................................... 5
2.2. Inteligencia de Negocio......................................................................................... 6
2.3. Caso de estudio seleccionado..................................................................................7
Planificacin del proyecto.................................................................................... 7
Definicin de Requerimientos del Negocio.........................................................10
Modelamiento Dimensional................................................................................13
Diseo Fsico...................................................................................................... 22
Diseo e Implementacin del subsistema de Extraccin, Transformacin y Carga
(ETL)................................................................................................................... 22
Implementacin................................................................................................. 23
Mantenimiento y Crecimiento del Data Warehouse...........................................24
Especificacin de aplicaciones de BI..................................................................24
Diseo de la Arquitectura Tcnica......................................................................27
3. Referencias Bibliogrficas......................................................................................... 29
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

TABLA DE ILUSTRACIONES

Ilustracin 1 Nivel de detalle requerimientos del negocio Fuente propia.....................................11

Ilustracin 2 Proceso de admisiones..............................................................................................14

Ilustracin 3 Comparativo modelo relacional y dimensional........................................................15

Ilustracin 4 Diagrama de flujo del proceso dimensional de Kimball (Mundy & Thornthwaite 06)

.......................................................................................................................................................16

Ilustracin 5 Diagrama de arquitectura tcnica de Kimball..........................................................28


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

1. Introduccin

En la actualidad las organizaciones cuentan con muchas bases de datos almacenadas en

lugares diferentes, pero como la informacin es redundante y no est consolidada, no permite ser

analizada para tomar las mejores decisiones.

Es necesario reconocer la importancia que tienen los datos dentro de todas las

organizaciones, muchos de estos se encuentran escondidos de tal manera que pierden su

verdadero valor ya que se toman decisiones con datos incompletos o algunas veces difciles de

encontrar. De esta manera vemos el provecho que toma nuestro curso Soluciones Analticas de

Negocios dentro de nuestra Maestra en Gestin de Tecnologa de la Informacin donde uno de

sus propsitos principales es el aprovechamiento de los mismos por medio de las diferentes

herramientas que permiten potenciar las organizaciones en esta era digital.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

2. Resultados de la Actividad

2.1. Metodologa Kimball

Segn, Pea & Suarez. (2005), La Metodologa Kimball Data Warehouse fue

desarrollada por Ralph Kimball, quien es ampliamente considerado como el padre del

almacn de datos y considerado como uno de los padres de este concepto. Gutirrez,

(2012). Referencia que en la dcada de los 80s Ralph Kimball y Bill Inmon crean dicho

concepto de DataWarehouse, proporcionando una visin del muy completa y la cual se

sigue considerando como base en los desarrollos de Inteligencia de Negocios.

Segn, Kimball. (1997). Es una tcnica de diseo lgico que busca presentar los datos

en un marco estndar e intuitivo que permite un acceso de alto rendimiento. Es

inherentemente dimensional, y se adhiere a una disciplina que utiliza el modelo relacional

con algunas restricciones importantes. La metodologa se basa en lo que Kimball denomina

Ciclo de Vida Dimensional del Negocio.

Dentro de las ventajas se encuentran la Implementacin ms rpida y fcil con menos

riesgo de fracaso, es inherentemente incremental y permite al equipo de trabajo aprender y

crecer. Esta metodologa presenta dentro de sus desventajas el garantizar la conformidad de

las dimensiones, se debe saber que su esquema va a estar bien antes de crear la solucin

debido a que, si se llega a presentar un problema que requiera cambiar algo esto obligara a

replantear nuevamente nuestro proyecto.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Vemos que dentro de las directrices que debe seguir cada almacn de datos de

Kimball incluyen objetivos principales de un almacn de datos deben ser el rendimiento y

la facilidad de uso, Los modelos dimensionales slo pueden desarrollarse una vez que se

han entendido y acordado los requisitos de informacin, Mientras que el almacn de datos

evolucionar constantemente, cada iteracin debe ser considerada como un ciclo de vida

del proyecto que consiste en actividades predecibles con un inicio y fin finito.

Autores como Huamantumba. (2007), Permiten reconocer que la metodologa de

Kimball se enfoca principalmente en el diseo de la base de datos que almacenar la

informacin para la toma de decisiones. El diseo se basa en la creacin de tablas de

hechos (FACTS) que son tablas que contienen la informacin numrica de los indicadores a

analizar, es decir la parte cuantitativa de la informacin.

2.2. Inteligencia de Negocio.

Con respecto a conceptos como inteligencia de negocios vemos que proporciona a

los usuarios poder. El poder del conocimiento. Esto se deriva en muchos beneficios que

pueden transformar la forma de hacer negocios para siempre. Dentro de los beneficios

simples, pero poderosos que la inteligencia de negocio nos puede brindar estn la obtencin

de informacin para tomar decisiones de negocios precisas y oportunas. Eliminar las

conjeturas. Muchas veces, los ejecutivos toman decisiones basadas en su mejor suposicin

y en su presentimiento. A menudo, estas decisiones se demuestran inexactas porque no

estaban completamente informadas.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Usando la inteligencia de negocios, las decisiones sern basadas en datos y no

tomadas por el sentimiento comn. Se puede contar con la capacidad de analizar los datos

en tiempo real para tomar decisiones inmediatas, Identificar nuevas oportunidades de

ingresos, al ser capaz de analizar todos los datos, que a su vez se convierten en

oportunidades potenciales que podran haberse perdido en el pasado. Adems de lo

mencionado se puede mejorar la gestin de inventarios ya que puede ayudar a gestionar las

cantidades, ordenar de manera lgica para una gestin correcta y detectar cualquier

anomala en los datos de inventario. Se puede tambin mejorar la eficiencia. La inteligencia

de negocios permite ahorrar mucho tiempo al ofrecer informacin en cuestin de segundos

y aprovechar el potencial del equipo de trabajo ya que al colaborar y ser capaz de crear

discusiones con otros miembros del equipo cuando detecta un cambio en los datos, se

puede llegar a tomar mejores decisiones en equipo.

2.3. Caso de estudio seleccionado

Diseo de un Data Warehouse DW utilizando la metodologa Kimball y la ayuda de

Power BI Desktop, para almacenamiento centralizado de la informacin de los estudiantes

del Instituto Nacional de Formacin Tcnica Profesional de San Juan del Cesar con la

finalidad de minimizar la desercin Acadmica.

Planificacin del proyecto


Segn Kimball (2008), el ciclo de vida inicia con la planificacin. En esta etapa es

muy importante analizar si la organizacin est preparada para abordar un proyecto de

inteligencia de negocios, pues muchas veces no hay suficiente motivacin o apoyo al


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

proyecto por parte de los patrocinadores, poca calidad en los datos que se tienen o falta

presupuesto para ello.

Las tareas bsicas en la planeacin se describen de la siguiente manera:

Definicin del alcance


Es necesario tener en cuenta que actualmente el Instituto Nacional de Formacin

Tcnica Profesional de San Juan del Cesar, cuenta con un sistema de informacin

acadmica denominada Academusoft, el sistema en mencin se est utilizando para la

gestin de los procedimientos de inscripcin, matrculas y grados entre otras, pero los

reportes que genera el mismo nicamente se estn utilizando para el reporte que de manera

obligatoria deben enviar al Ministerio de Educacin Nacional.

Partiendo de lo anterior y evidenciando la necesidad de la institucin objeto de

investigacin el aumento de la poblacin acadmica o cobertura es uno de los ejes

fundamentales para la continuidad del negocio el cual por medio de proyecto de DW/BI se

espera contribuir de manera significativa en la misma.

Identificar las tareas

Se pretende por medio de la identificacin de las tares conocer el estado actual con

la finalidad de asentar las bases del proyecto y orientarlas de acuerdo a las necesidades

por lo cual se realizar desde la definicin del proyecto, planificacin de las

actividades, Planificacin de los riesgos, Planificacin de la comunicacin y la

Optimizacin del plan del proyecto entre otras.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Programar las tareas

La Programacin es fundamental dentro del proyecto, consiste en la medicin del

tiempo y secuencia de las tareas que se ejecutaran. Vemos que una programacin se

compone de tareas las cuales pueden ser dependientes de otras, Uno de los aspectos

fundamentales son los tiempos con sus delimitaciones e informacin ente otras.

Para la programacin de las tareas del caso de estudio se tienen en cuenta las tareas

identificadas y las cuales se relacionaron dentro del ITEM anterior.

Planificar el uso de los recursos

En todo proyecto los recursos son una pieza fundamental para la ejecucin del mismo y

dentro de los recursos podemos encontrar los de tipo humano, logsticos, fsicos y

econmicos. Usando este Plan de Recursos, seremos capaces de identificar la cantidad de

mano de obra, equipo y materiales necesarios para entregar su proyecto.

Asignar la carga de trabajo a los recursos


La administracin de recursos le da la capacidad de rastrear y revisar cmo se asignan

las personas a travs de todos los proyectos en los que estn trabajando. Se puede utilizar la

administracin de recursos para tomar decisiones y ajustar cargas de trabajo.

Elaboracin de un documento final que representa un plan del proyecto


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

La elaboracin del documento final son los resultados (productos) y los resultados

directos (servicios, eventos, etc.) que el equipo del proyecto espera entregar y que

conducirn a los resultados del proyecto.

Partiendo de lo anterior nuestro documento final es la propuesta de un plan de negocio

para la implementacin de una data warehouse que permita la mejora en cuanto a la

cobertura Acadmica del Instituto Nacional de Formacin Tcnica Profesional de San Juan

del Cesar, La Guajira.

Definicin de Requerimientos del Negocio


Inicialmente se realiza el proceso de entrevista con la finalidad de identificar los

requerimientos que impactan sobre el Instituto Nacional de Formacin Tcnica Profesional

entidad caso de estudio donde la interaccin se enfoca en una muestra de egresados,

Personal administrativo, docente, sector productivo y directivos entre otros.

Es importante reconocer que el almacenamiento de datos debe ser gestionado ms

que cualquier otra base de datos en su entorno. Algunas reas del Instituto Nacional de

Formacin Tcnica Profesional administran las mismas, pero no de manera eficiente. Se

reconoce que el rea de almacenamiento de datos debe ser un entorno controlado. El

arquitecto debe ser capaz de disear o modificar una tabla en el rea de ensayo

Datos Back Room Front Room Infraestructura


El que El como El como El dnde
La informacin Actualmente no se Los principales La institucin caso

necesaria para la cuenta con un retos con que se de estudio no cuenta


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

toma de decisiones proceso definido enfrenta la con un sistema de

en el Instituto que permita el institucin son la apoyo para la

Nacional de apoyo para la toma baja poblacin mejora en cuanto a

Formacin Tcnica de decisiones. estudiantil. la cobertura

Profesional es la La institucin estudiantil. Para

poblacional necesita establecer Los datos se lograr el xito es

estudiantil la cual es un medio sistema requieren con la necesario optar por

administrada por el que permita finalidad de un sistema que

proceso de mantener una analizarlos y permita captar la

Admisin, Registro informacin de generar una informacin

y control gestin accesible, campaa la cual necesaria para el

Acadmico. uniforme y permita aumentar la reclutamiento de

actualizada cobertura acadmica estudiantes.

de la institucin.
Ilustracin 1 Nivel de detalle requerimientos del negocio Fuente propia

Requerimientos de uso de Informacin.

Es necesario reconocer la importancia que tiene el establecimiento de los

requerimientos necesarios para el desarrollo del proyecto donde el tipo de Informacin que
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

se maneja es de tipo acadmica y general de los estudiantes como; nombres, identificacin,

correo electrnico, Genero, programa acadmico y telfonos entre otros.

Requerimientos de los datos.

La fuente de los datos proviene directamente de la dependencia Admisin Registro y

control acadmico del Instituto Nacional de Formacin Tcnica Profesional, los cuales se

generan de manera directa desde el aplicativo acadmico Academusoft 1, dando como

resultado unos datos de calidad, limpios los cuales son generados en formato Excel y

cargados en la nube bajo dos copias.

Con lo que hace parte de los perfiles de datos y tiene que ver con la comprensin de

los datos. Para esto se tiene bien claro de dnde provienen e Incluye la siguiente

informacin:

Diccionario de datos: Se encuentran debidamente enumerados con sus fuentes y los

nombres de los campos en los que se almacenan los datos.


Sistema de automatizado: Permiten los controles de calidad automatizados antes de

un nuevo registro o modificaciones de los mismos


Sistema de almacenamiento: Permite el almacenamiento seguro y los campos estn

correctamente mapeados.

En otras fuentes de datos se tienen el registro de calificaciones de los alumnos y en un

archivo de Excel se posee el resultado de las pruebas aplicadas en el momento del ingreso,

1 Solucin que integra un gran nmero de aplicaciones modulares para el manejo funcional

de cada componente administrativo de la institucin, con entornos grficos que facilitan un

menor tiempo de respuesta, pensados en el usuario final y con las caractersticas de

seguridad y eficiencia imprescindibles para la toma de decisiones.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

que ayudaran a establecer causales de desercin previas al ingreso del alumno a la

institucin educativa.

Modelamiento Dimensional
a. Elegir el proceso de negocio: La Institucin Nacional de Formacin Tcnica
Profesional INFOTEP, maneja el siguiente mapa de procesos, para el desarrollo de
este trabajo se eligi el proceso de admisiones, registro y control acadmico que se
encuentra dentro de los macroprocesos de apoyo, teniendo en cuenta el impacto que
tiene para la institucin la desercin de los estudiantes durante este proceso y
plantearnos Qu est pasando? Por qu est pasando? Qu pasara si tengo la
informacin adecuada? Y Que se puede hacer para tomar decisiones?
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

El proceso de admisiones, registro y


control acadmico se encuentra representado en la siguiente imagen:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Ilustracin 2 Proceso de admisiones


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

La base de datos de la institucin tiene un modelado relacional, por eso antes de continuar presentamos cual es la diferencia del
Modelo Dimensional Vs Modelo Relacional

Ilustracin 3 Comparativo modelo relacional y dimensional


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

El proceso de diseo comienza con un modelo dimensional de alto nivel, un esquema general es
el siguiente

Ilustracin 4 Diagrama de flujo del proceso dimensional de Kimball (Mundy & Thornthwaite 06)

Un modelo dimensional es una adaptacin especializada del modelo relacional que tiene una
estructura adecuada para resolver consultas analticas, usada para almacenar datos de depsitos
de datos, de modo que estos pueden ser extrados fcilmente usando consultas asegurando
buenos tiempos de respuesta: en el modelo dimensional una base de datos consiste en sola tabla
grande de datos que son descritos usando dimensiones y medidas.
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Una dimensin proporciona el contexto de un hecho, estas se toman en cuenta en la formulacin


de las consultas para agrupar hechos que estn relacionados.
El modelo dimensional define un nivel mnimo de detalle a lo que se llama granularidad y se
compone de:
Hechos: Algo que ocurre en el tiempo (operacin o actividad), una fila de una tabla de
hechos corresponde a una o varias medidas estas tienen el mismo nivel de granularidad y
representan la dimensin muchos a muchos que representan las dimensiones

Medidas: Valores numricos que describen el hecho que se est analizando, es decir,
ayuda a medir el desempeo del negocio, encontramos las medidas bsicas que son las
que existen fsicamente en el warehouse junto a los atributos que los caracterizan y las
medidas derivadas o calculadas que se construyen a partir de las medidas bsicas y
pueden o no estar almacenadas fsicamente en el Data warehouse, las medidas ms
usadas son numricas y aditivas

Dimensiones: Son categoras que describen el contexto en el cual se analizan las medidas,
en otras palabras, el rea temtica o sujetos de negocio estas proveen un mtodo general
para organizar la informacin corporativa, se define como un grupo de uno o ms
atributos, las dimensiones no comparten los atributos y definen los niveles de anlisis, es
decir, las jerarquas lo que permite obtener agregacin o sumarizacin.

A continuacin, se relacionan los modelos entidad relacin que hacen parte de este proceso:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

b. Establecer la granularidad:
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

La granularidad significa especificar el nivel de detalle. La eleccin de la granularidad


depende de los requerimientos del negocio y lo que es posible a partir de los datos
actuales. La sugerencia general es comenzar a disear el DW al mayor nivel de detalle
posible, ya que se podra luego realizar agrupamientos al nivel deseado.

Especificar qu contienen los registros: Al identificar el grano, se especifica


exactamente qu contiene un registro de tabla de hechos. El grano muestra el nivel de
detalle asociado a las medidas de la tabla de hechos. Cuando identifique el grano, decida
tambin el nivel de detalle que desea que est disponible en el modelo dimensional. Si se
incluyen ms detalles, el nivel de granularidad ser ms bajo. Si se incluyen menos
detalles, el nivel de granularidad ser ms alto.
Identificar el nivel de detalle: El nivel de detalle disponible en un esquema de estrella se
conoce como grano. Cada tabla de hechos y dimensiones tiene su propio grano o
granularidad. Cada tabla (de hechos o dimensiones) contiene un nivel de detalle con el
que se asocia. El grano del modelo dimensional es el nivel de detalle ms fino que est
implcito al unir las tablas de hechos y dimensiones. Por ejemplo, la granularidad de un
modelo dimensional que consta de las dimensiones de fecha, almacn y producto es
producto vendido en el almacn por da.
Identificar los datos: Cada fila contiene el mismo tipo de datos. Por ejemplo, cada fila
puede contener ventas diarias por almacn, por producto, o elementos de lnea diarios por
almacn.

c. Elegir las dimensiones: Una vez determinado el grano del modelo, identifique las
dimensiones verdaderas para ese grano. Debe crear columnas, jerarquas y casos para el
esquema de copo de nieve.
1. Al identificar tablas de dimensiones, se recopilan los siguientes metadatos:
2. Nombres de dimensin
3. Definiciones de negocio
4. Jerarquas
5. Gestin de cambios de dimensin
6. Frecuencia y estadsticas de carga
7. Estadsticas de uso
8. Reglas y estadsticas de archivado
9. Reglas y estadsticas de depuracin
10. Calidad y precisin de los datos
11. Claves primarias y forneas y manera de generar las claves
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

12. Informacin de origen de datos

d. Identificar medidas y las tablas de hechos: Al definir las medidas, se recopilan los
siguientes metadatos:
1. Nombre de tabla de hechos
2. Alias
3. Grano
4. Definicin de negocio
5. Frecuencia y estadsticas de carga
6. Estadsticas de uso
7. Cmo gestionar los datos archivados
8. Cmo y cundo depurar los datos
9. Calidad y precisin de los datos
10. Grano de dimensiones de fecha y hora
11. Claves y cmo se generan las claves
12. Informacin de origen de datos
13. Medidas
14. Dimensiones
15. Informacin de contacto del propietario de la tabla

Diseo Fsico

Diseo e Implementacin del subsistema de Extraccin, Transformacin y Carga (ETL)


Sea realizado ya un anlisis exhaustivo de nuestras fuentes de datos, y hemos definido el

conjunto de dimensiones y tablas de hecho que formarn nuestra data warehouse, es entonces el

momento de estructurar formalmente los procesos que nos permitirn poblar nuestra data

warehouse desde las fuentes de datos. Definiremos, entonces, procesos que nos permitan mapear
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

los datos desde los sistemas fuentes correspondientes hacia la data warehouse, estos procesos son

llamados procesos ETL. Debemos, en esta etapa, definir dos procesos ETL, el primero definir el

proceso de extraccin, transformacin y carga inicial, es decir, el proceso con el cual poblaremos

inicialmente, desde las fuentes de datos, nuestro sistema, este proceso se ejecutar una sola vez.

El segundo proceso a definir ser el proceso que se encargar de agregar peridicamente la

informacin nueva desde las fuentes de datos a nuestra data warehouse, ambos procesos son

crticos para el xito de nuestro proyecto, y generalmente consumen el mayor porcentaje de

tiempo del proyecto. Definimos tres etapas en cada proceso ETL:

Extraccin: Esta etapa consiste en recolectar los datos de las diferentes fuentes operacionales.

Transformacin: Una vez extrados los datos, en esta etapa realizamos todas las tareas

relacionadas con la calidad de los datos, esto puede consistir en eliminar datos incorrectos,

trasformar datos de manera que sean vlidos para nuestro Data warehouse, limpiar datos etc.

Carga: Etapa final del proceso ETL, en la cual ya contamos con datos consistentes y listos para

la carga al Data warehouse.

Implementacin
Con los requerimientos capturados, los modelos de datos generados y los procesos de carga

definidos debemos implementar el sistema final que estar disponible para los usuarios. El

principal objetivo de esta etapa es obtener como resultado un sistema funcional acorde a las

especificaciones definidas en el diseo y el anlisis de requerimientos.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Mantenimiento y Crecimiento del Data Warehouse


Para la creacin del DW utilizaremos las funciones integradas de Power Query en Power BI

Desktop por su versatilidad a la hora de extraer los datos de diferentes fuentes de informacin

como Pgina Web, Archivo CSV o de Excel

Archivo XML, Archivo de texto, Base de datos de SQL Server, Base de datos SQL de Microsoft

Azure, Base de datos de Access, Base de datos de Oracle, Base de datos de IBM DB2, Base de

datos MySQL, Base de datos PostgreSQL, Base de datos de Sybase, Base de datos de Teradata,

Lista de SharePoint, Fuente de OData, Microsoft Azure Marketplace, Archivo de Hadoop

(HDFS), Microsoft Azure HDInsight, Almacenamiento de tablas de Microsoft Azure, Active

Directory, Microsoft Exchange, Facebook.

De modo que su crecimiento es muy verstil ya que podemos elegir diferentes tipos de

presentacin de los datos y diferentes formas de almacenamiento sin que esto signifique un

impacto significativo si el futuro se desea realizar cambios en estos.

Para el mantenimiento de la DW es consecuente la dependencia del origen de los datos, al ser

proporcionados por ciclos de estudios acadmicos, tiene como significado la renovacin de este

cada semestre, por consiguiente, serian optimo pensar realizar los mantenimientos siguiendo este

ritmo cada seis meses igualmente.

Especificacin de aplicaciones de BI
Una parte fundamental de todo proyecto de DW/BI est en proporcionarles a una gran

comunidad de usuarios una forma ms estructurada y, por lo tanto, ms fcil, de acceder al

almacn de datos. Proporcionamos este acceso estructurado a travs de lo que llamamos

aplicaciones de inteligencia de negocios (Business Intelligence Aplications).


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Las aplicaciones de BI son la cara visible de la inteligencia de negocios: los informes y

aplicaciones de anlisis proporcionan informacin til a los usuarios. Las aplicaciones de BI

incluyen un amplio espectro de tipos de informes y herramientas de anlisis, que van desde

informes simples de formato fijo a sofisticadas aplicaciones analticas que usan complejos

algoritmos e informacin del dominio. Kimball divide a estas aplicaciones en dos categoras

basadas en el nivel de sofisticacin, y les llama informes estndar y aplicaciones

analticas. (Rivadera, SF)

Los informes estndar son la base del espectro de aplicaciones de BI. Por lo general son

informes relativamente simples, de formato predefinido, y parmetros de consulta fijos. En el

caso ms simple, son informes estticos pre-almacenados. Los informes estndar proporcionan a

los usuarios un conjunto bsico de informacin acerca de lo que est sucediendo en un rea

determinada de la empresa. Este tipo de aplicaciones son el caballo de batalla de la BI de la

empresa.

Son informes que los usuarios usan da a da. La mayor parte de lo que piden las personas

durante el proceso de definicin de requisitos se clasificara como informes estndar. Por eso es

conveniente desarrollar un conjunto de informes estndar en el ciclo de vida del proyecto.

Algunos informes estndares tpicos podran ser:

Ventas del ao actual frente a previsin de ventas por vendedor


Tasa de renovacin mensual por plan de servicio
Tasa quinquenal de desercin por unidad acadmica
Tasas de respuestas de correo electrnico por promocin por producto (marketing)
Recuento de audiencia y porcentaje de la audiencia total por la red de televisin por da
de la semana y hora del da (Sistema de marketing televisivo)
Reclamos del ao actual hasta la fecha frente a previsin, por tipo de vehculo
Volumen de llamadas por producto como un porcentaje del total de ventas
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Las aplicaciones analticas son ms complejas que los informes estndar. Normalmente se

centran en un proceso de negocio especfico y resumen cierta experiencia acerca de cmo

analizar e interpretar ese proceso de negocio. Estas aplicaciones pueden ser muy avanzadas e

incluir algoritmos y modelos de minera de datos, que ayudan a identificar oportunidades o

cuestiones subyacentes en los datos.

Otra caracterstica avanzada en algunas aplicaciones analticas es que el usuario puede pedir

cambios en los sistemas transaccionales basndose en los conocimientos obtenidos del uso de la

aplicacin de BI. En el otro extremo del espectro, algunas aplicaciones analticas se venden

como soluciones cerradas o enlatados, y son independientes de las aplicaciones particulares de la

empresa.

Algunas aplicaciones analticas comunes incluyen:

Anlisis de la eficacia de las promociones


Anlisis de rutas de acceso en un sitio Web
Anlisis de afinidad de programas
Planificacin del espacio en espacios comerciales
Deteccin de fraudes
Administracin y manejo de categoras de productos

Es por ende que este proyecto utilizara la aplicacin Power BI Desktop y la presentacin de

informes estndares ya que podemos encontrar las siguientes funciones:

Combinar y dar forma a orgenes de datos para que coincidan con los requisitos de anlisis de

datos o prepararlos para analizarla y modelado con herramientas como PowerPivot y Power

View.

Crear vistas personalizadas de datos. Usar el analizador JSON para crear visualizaciones de datos

en Big Data y HDInsight de Azure. Realizar operaciones de limpieza datos. Importar datos de

varios archivos de registro. Crear una consulta de los me gusta de Facebook que represente un
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

grfico de Excel. Extraer datos en PowerPivot de nuevos orgenes de datos, como XML,

Facebook y carpetas de archivos como conexiones actualizables.

Diseo de la Arquitectura Tcnica


Teniendo en cuenta los requerimientos de negocio definidos anteriormente y que la institucin

educativa cuenta con infraestructura propia suficiente para el almacenamiento y procesamiento

de la informacin a utilizar se procedi a establecer el diseo de la arquitectura tcnica del

entorno del Data Warehouse siguiendo los lineamientos de la metodologa Kimball que

establecen lo siguiente:

Se separan los datos y procesos en 2 partes

Back room encargado de la extraccin, transformacin y carga de datos (ETL) y,

Front room que es el rea de presentacin.

Esto se puede observar en la siguiente imagen


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Ilustracin 5 Diagrama de arquitectura tcnica de Kimball

De acuerdo al KimballGroup (s.f.), la arquitectura tcnica del sistema Kimball se centra en los

siguientes componentes:

- Sistema ETL Backroom: Se encarga de la extraccin de los datos de las diferentes fuentes que

se tienen en la institucin educativa (que provienen de archivos de Excel y bases de datos), la

realizacin de la limpieza y transformaciones, la entrega al servicio de presentacin y la gestin

del proceso de ETL. Este proceso (ETL) se detallar ms adelante.

- rea de presentacin (front room): Para la organizacin de los datos se utilizar Microsoft

Power BI Desktop, el cual incluye toda la funcionalidad de Power Pivot.

- Aplicaciones de BI (front room): Es lo que los usuarios van a visualizar. Se tiene programado

realizar informes estandarizados y cuadros de mando que resuman la informacin para el

anlisis. Para esto tambin se utilizar Microsoft Power BI Desktop, el cual incluye toda la

funcionalidad de Power View.


UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

3. Referencias Bibliogrficas

Rivadera, G. R. (SF). La metodologa de Kimball para el diseo de almacenes de datos (Data

warehouses).

Huamantumba, R. (2007). Datamart paso a paso. Recuperado el 22 de marzo de 2017, de

RUEDA TECNOLOGICA Sitio web: http://www.raynerhd.com/wp-content/uploads/rayner-

datamart.pdf

Gutirrez, P. (2012). Metodologa de uso de herramientas de inteligencia de negocios como


estrategia para aumentar la productividad y competitividad de una PyME. MXICO,
D.F.: Instituto Politcnico Nacional.

Kimball, R. (1997). Drawing the Line Between Dimensional Modeling and ER Modeling
Techniques. Recuperado de 22 de febrero de 2017, de Kimball Group Sitio web:
http://www.kimballgroup.com/1997/08/a-dimensional-modeling-manifesto/

Kimball, R. (2008). The Data Warehouse Lifecycle Toolkit. Indianapolis, IN: Wiley.

Kimballgroup. (s.f). Kimball Technical DW/BI System Architecture. Recuperado de:

http://www.kimballgroup.com/data-warehouse-business-intelligence-resources/kimball-

techniques/technical-dw-bi-system-architecture/
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD MAESTRIA EN GESTIN DE TI

Pea, J. Suarez, J. (2005). Utilizacin de Informacin histrica para decisiones empresariales.


Bogot.: pontificia Universidad javeriana.

Vlez, W. (2016). Gua de recurso educativo Metodologa de Kimball. Recuperado el 22 de

febrero de 2017, de Universidad nacional Abierta y a Distancia UNAD. Sitio web:

http://campus15.unad.edu.co/ecbti15/pluginfile.php/188/mod_folder/content/0/Guia

%20Metodolog%C3%ADa%20de%20Kimball.pdf?forcedownload=1

UNAD. (2016). Syllabus curso Soluciones Analticas de Negocios. Recuperado el 22 de febrero

de 2017, de Universidad nacional Abierta y a Distancia UNAD. Sitio web:

http://campus15.unad.edu.co/ecbti15/pluginfile.php/173/mod_folder/content/0/Syllabus

%20del%20Curso%20Soluciones%20Analiticas%20de%20Negocios.pdf?forcedownload=1

UNIPAMPLONA. (2009). Implantacin de Academusoft. Recuperado el 22 de maro de 2017,

del Sitio web: http://web.mineducacion.gov.co/Proveedores/html/doc/Academusoft.pdf