Академический Документы
Профессиональный Документы
Культура Документы
DATA WAREHOUSE
3.1.
INTRODUCCIN
Teniendo una mejor perspectiva acerca de Business Intelligence, y mediante la apreciacin de la Arquitectura de BI, ya se puede tener una idea del papel que juega un almacn de datos (Data Warehouse) en una solucin de este tipo.
Un Data Warehouse es una base de datos accesible por los usuarios el cual tiene un registro de datos histricos y actuales acerca de todas las entidades importantes que se encuentran en la empresa y de acuerdo a negocios especficos.
El Data Warehouse organiza y aloja los datos necesarios, para ser utilizados en el procesamiento analtico dentro de una perspectiva de tiempo.
Inmon, 1995)
1
Ralph Kimball, conocido en todo el mundo como un innovador, escritor, educador, orador y consultor en el campo de almacenamiento de datos. http://www.kimballgroup.com/html/about.html - 06 de julio de 2009, traducido del idioma Ingls al Espaol.
2
Bill Inmon, experto de renombre mundial, autor y orador de almacenamiento de datos, es ampliamente reconocido como el "padre de almacenamiento de datos." http://www.inmoncif.com/about/ - 06 de julio de 2009, traducido del idioma Ingls al Espaol.
3.2.
CARACTERSTICAS
continuacin
se
muestran
las
caractersticas
principales
de
un
Orientado al tema.
Integrado.
De tiempo Variante.
No voltil.
Orientado al tema:
Integrado:
puede ser vista a problemas de datos con que se puede encontrar en una base
en el almacn.
De tiempo variante:
Se n
refiere
as
debido
al
horizonte
de
tiempo
con
que
funciona
DataWarehouse.
No Voltil:
eliminacin, modificacin, tan solo realizan dos operaciones que son la carga
Fcil accesibilidad a la informacin organizacional. Informacin sumarizada y detallada. Presentacin consistente de la informacin organizacional. Permite realizar anlisis rpidamente.
3.3.
ARQUITECTURA DE UN DATAWAREHOUSE
En cuanto a los Sistemas Origen, son en donde se encuentra los datos de inters y que sern objeto de extraccin, estos orgenes pueden ser desde mltiples lugares como por ejemplo las bases de datos, as como tambin hojas de clculo, archivos planos, Sistemas ERP (Enterprise Resourc Planning), entre otros que sern los que proveern los datos de inters.
Es un rea en la que se almacenar de manera temporal todos los datos que son extrados de los sistemas origen segn las necesidades planteadas del negocio. La funcin primordial es minimizar la afectacin a los sistemas origen, porque cuando se realiza la carga al Data Warehouse, los orgenes de datos no intervendrn hasta que se realice una prxima carga.
Tomado de http://www.dataprix.com/arquitectura-data-warehouse-areas-datos-nuestro-almacencorporativo
reporte o sistema operacional pueda consultar sus datos. El ODS forma parte
vista que va a ser sujeto a la extraccin de los datos que sern cargados en el
Los datos a ser cargados en el Almacn provendrn del Staging Area as como
tambin puede ser desde el ODS. Aqu los modelos de datos no sern tan
OLAP
sobre
cierta
informacin
que
el
usuario
requiera,
dndole
una
2.2.4.
ESTRUCTURA
Figura 2.5: Estructura de un Data Warehouse La estructura de un DataWarehouse, es bsicamente referente a la lgica de
DATOS
integrados.
METADATOS
DataWarehouse.
Con lo descrito anteriormente, se puede dar una idea general en la que los
- 20 -
2.2.5.
almacenarn.
Figura 2.6: Proceso ETL Todo el proceso que se lleva a cabo, se debe especificar los tiempos en los
Este
proceso
general
se
encuentra
subdividido
en
subprocesos
2.2.5.1. EXTRACCIN
bases de datos.
Staging Area, vale recalcar que solo se extraern datos necesarios, es decir de
2.2.5.2. TRANSFORMACIN
esta etapa se realiza el refinamiento de los datos que han sido extrados de las
datos que van a ser tratados dando valor para los usuarios. Este proceso
2.2.5.3. CARGA
los dos subprocesos anteriores para contar con datos de calidad, ahora se
histricos.
Bien, finalizado todo el proceso ETL, lo que se pretende es contar con datos
relevantes para el negocio, los mismos que deben ser de valor sin ningn tipo