Вы находитесь на странице: 1из 10

ÍNDICE

INTRODUCCIÓN .......................................................................................................................... 2

CONCEPTOS FUNDAMENTALES DE DATA WAREHOUSE................................................. 2

VENTAJAS .................................................................................................................................... 2

¿ANTE QUÉ CIRCUNSTANCIAS UNA EMPRESA PODRÍA ADQUIRIR UN DATA


WAREHOUSE? .............................................................................................................................. 3

CARACTERÍSTICAS PRINCIPALES DE UN DATA WAREHOUSE ...................................... 3

OBJETIVOS ................................................................................................................................... 5

PRINCIPALES APORTACIONES: ............................................................................................... 5

ELEMENTOS BÁSICOS ............................................................................................................... 6

PROCESOS BÁSICOS .................................................................................................................. 7

ESTRUCTURAS DE UN DATA WAREHOUSE ......................................................................... 9

1
DATA WAREHOUSE

INTRODUCCIÓN
Un Data Warehouse es un almacén electrónico donde generalmente una empresa u organización
mantiene una gran cantidad de información. Los datos de un data warehouse deben almacenarse
de forma segura, fiable, fácil de recuperar y fácil de administrar. El concepto de data
warehouse se originó en 1988 con el trabajo de los investigadores de IBM, Barry Devlin y Paul
Murphy aunque el término data warehouse fue acuñado por William H. Inmon, el cual es
conocido como el padre de Data Warehousing. Inmon describió un data warehouse como una
colección de datos orientada a un tema específico, integrado, variante en el tiempo y no volátil,
que soporta el proceso de toma de decisiones.

CONCEPTOS FUNDAMENTALES DE DATA WAREHOUSE


El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce literalmente
como almacén de datos. Un Data Warhouse es un repositorio o una base de datos de muy fácil
acceso, alimentado de numerosas fuentes, transformadas en grupos de información sobre temas
específicos de negocios, para permitir nuevas consultas, análisis y toma de decisiones.
La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde
el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence
(Estrategia Empresarial).

VENTAJAS
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se
almacena la información (modelos de tablas en estrella, en copo de nieve, cubos relacionales...
etc). Este tipo de persistencia de la información es homogénea y fiable, y permite la consulta y el
tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas
operacionales).
Uno de los valores más importantes de una organización es la información.
Estos valores normalmente son guardados por la organización de dos formas:
 Los sistemas operacionales de registros
 Y el Data Warehouse

2
¿ANTE QUÉ CIRCUNSTANCIAS UNA EMPRESA PODRÍA ADQUIRIR UN DATA
WAREHOUSE?

 Dificultad para encontrar los datos que se necesitan porque están distribuidos en diferentes
hojas de cálculo.
 Exceso de límite de datos en las hojas de cálculo.
 Pasar mucho tiempo en rastrear los datos y, consecuentemente, en generar informes dado que
hay que verificar en las distintas fuentes si los datos están actualizados (caso contrario, hay que
actualizarlos manualmente).
 Diferencia en los datos e informes y/o duplicación de la información.
 Incertidumbre sobre la exactitud de los datos pueden causar que los ejecutivos corporativos y
los gerentes comerciales cuestionen la veracidad de los informes.

CARACTERÍSTICAS PRINCIPALES DE UN DATA WAREHOUSE

Un Data Warehouse se caracteriza por ser:


 Integrado: Los datos almacenados en el datawarehouse deben integrarse en una estructura
consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales
deben ser eliminadas. La información suele estructurarse también en distintos niveles de
detalle para adecuarse a las distintas necesidades de los usuarios.

 Temático: Sólo los datos necesarios para el proceso de generación del conocimiento del
negocio se integran desde el entorno operacional. Los datos se organizan por temas para
facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los
datos sobre clientes pueden ser consolidados en una única tabla del datawarehouse. De esta
forma, las peticiones de información sobre clientes serán más fáciles de responder dado que
toda la información reside en el mismo lugar.
 Histórico: El tiempo es parte implícita de la información contenida en un datawarehouse. En
los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en
el momento presente. Por el contrario, la información almacenada en el datawarehouse sirve,

3
entre otras cosas, para realizar análisis de tendencias. Por lo tanto, el datawarehouse se carga
con los distintos valores que toma una variable en el tiempo para permitir comparaciones.
 No volátil: El almacén de información de un datawarehouse existe para ser leído, pero no
modificado. La información es por tanto permanente, significando la actualización del
datawarehouse la incorporación de los últimos valores que tomaron las distintas variables
contenidas en él sin ningún tipo de acción sobre lo que ya existía.
 Metadatos: Es decir, datos sobre los datos. Los metadatos permiten saber la procedencia de
la información, su periodicidad de refresco, su fiabilidad, forma de cálculo... etc. Los
metadatos serán los que permiten simplificar y automatizar la obtención de la información
desde los sistemas operacionales a los sistemas informacionales.
Los objetivos que deben cumplir los metadatos, según el colectivo al que va dirigido, son:
- Dar soporte al usuario final, ayudándole a acceder al datawarehouse con su propio
lenguaje de negocio, indicando qué información hay y qué significado tiene. Ayudar a
construir consultas, informes y análisis, mediante herramientas de Business Intelligence
como DSS(Data Distribution Service para sistemas en tiempo real), EIS(Sistemas de
Información Ejecutiva) o CMI (Cuadro de Mando Integral).
- Dar soporte a los responsables técnicos del datawarehouse en aspectos de auditoría,
gestión de la información histórica, administración del datawarehouse, elaboración de
programas de extracción de la información, especificación de las interfaces para la
realimentación a los sistemas operacionales de los resultados obtenidos.

4
OBJETIVOS

 Hace que la información de la organización sea accesible: los contenidos del Data
WareHouse son entendibles y navegables, y el acceso a ellos son caracterizado por el
rápido desempeño. Estos requerimientos no tienen fronteras y tampoco limites fijos. Cuando
hablamos de entendible significa, que los niveles de la información sean correctos y obvios.
Y Navegables significa el reconocer el destino en la pantalla y llegar a donde queramos con
solo un clic. Rápido desempeño significa, cero tiempos de espera.
 Hacer que la información de la organización sea consistente: la información de una parte
de la organización puede hacerse coincidir con la información de la otra parte de la
organización. Si dos medidas de la organización tienen el mismo nombre, entonces deben
significar la misma cosa. Y a la inversa, si dos medidas no significan la misma cosa, entonces
son etiquetados diferentes. Información consistente significa, información de alta calidad.
Significa que toda la información es contabilizada y completada.
 Es información adaptable y elástica: el Data WareHouse está diseñado para cambios
continuos. Cuando se le hacen nuevas preguntas al Data WareHouse, los datos existentes y
las tecnologías no cambian ni se corrompen.
 El Data WareHouse no solamente controla el acceso efectivo a los datos, si no que da a los
dueños de la información gran visibilidad en el uso y abusos de los datos, aún después de
haber dejado el Data WareHouse.
 Es la fundación de la toma de decisiones: el Data WareHouse tiene los datos correctos para
soportar la toma de decisiones. Solo hay una salida verdadera del Data WareHouse: las
decisiones que son hechas después de que el Data WareHouse haya presentado
las evidencias. La original etiqueta que preside el Data WareHouse sigue siendo la
mejor descripción de lo que queremos construir: un sistema de soporte a las decisiones.

PRINCIPALES APORTACIONES:
 Proporciona una herramienta para la toma de decisiones en cualquier área funcional,
basándose en información integrada y global del negocio.

5
 Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar
relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio
de dicha información.
 Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones
futuras en diversos escenarios.
 Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación
con el cliente.
 Supone una optimización tecnológica y económica en entornos de Centro de Información,
estadística o de generación de informes con retornos de la inversión espectaculares.

ELEMENTOS BÁSICOS

 Sistema fuente: Sistemas operacionales de registros donde sus funciones son capturar las
transacciones del negocio. A los sistemas fuentes también se le conoce como Legacy System.
 Área de tráfico de datos: es un área de almacenamiento y grupo de procesos, que limpian
transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos
fuente para ser usados en el Data WareHouse.
 Servidor de presentación: La máquina física objetivo en donde los datos del Data
WareHouse son organizados y almacenados.
 Modelo dimensional: Una disciplina específica para el modelado de datos que es una
alternativa para los modelos de entidad – relación.
 Procesos de negocios: Un coherente grupo de actividades de negocio que hacen sentido a los
usuarios del negocio del Data WareHouse.
 Data Mart: Un subgrupo lógico del Data WareHouse completo.
 Data WareHouse: Búsquedas fuentes de datos de la empresa. Y es la unión de toda la data
matriz que la constituyen.
 Almacenamiento operacional de datos: Es el punto de integración por los sistemas
operacionales. Es el acceso al soporte de decisiones por los ejecutivos.

6
 OLAP: Actividad general de búsquedas para presentación de texto y números del Data
WareHouse, también un estilo dimensional especifico de búsquedas y presentación de
información.
 ROLAP: Un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos
relacional un estilo dimensional.
 MOLAP: Un grupo de interfaces de usuarios, aplicaciones y propietarios
de tecnología de bases de datos que tienen un fuerte estilo dimensional.
 Aplicaciones para usuarios finales: Una colección de herramientas quienes analizan las
consultas y presentan la información objetivo para el soporte de las necesidades del negocio.
 Herramientas de acceso a datos por usuarios finales: Un cliente de Data WareHouse.
 Ad Hoc Query Tool: Un tipo específico de herramientas de acceso a datos por usuarios
finales que invita al usuario a formas sus propias consultas manipulando directamente las
tablas relacionales y sus uniones.
 Modelado de aplicaciones: Un sofisticado tipo de cliente de Data WareHouse con
capacidades analíticas que transforma o digiere las salidas del Data WareHouse.
 Meta Data: Toda la información en el ambiente del Data WareHouse que no son así mismo
los datos actuales.

PROCESOS BÁSICOS

7
 Operacionales: Origen de datos para el componente de almacenamiento físico del Data
Warehouse.
 Extracción: Este es el primer paso de obtener la información hacia el ambiente del Data
WareHouse. selección sistemática de datos operacionales usados, para poblar el componente
de almacenamiento físico del DataWarehouse.
 Transformación: Una vez que la información es extraída hacia el área de tráfico de datos,
hay posible paso de transformación como; limpieza de la información, tirar la basura que no
nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse, combinar
fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves
para cada registro de una dimensión.
 Carga: Al final del proceso de transformación, los datos están en forma para ser cargados.

EL PROCESO DE CONSTRUCCIÓN DE UN DATA WAREHOUSE CONSTA DE UNA


SERIE DE PASOS Y PROCESOS:

El proceso de construcción de un data warehouse consta de una serie de pasos y procesos:


• Primero se debe identificar dónde se almacenan los datos relevantes. Esto puede llegar a
ser un desafío ya que en las organizaciones los datos de los clientes están en decenas de sistemas
diferentes.
• En segundo lugar, los datos deben ser extraídos de esos sistemas. Es posible que cuando se
desarrollaron no se esperara que fuera necesario alinear sus datos con los de otros sistemas.
También es posible que la limpieza de los datos sea distinta en los diferentes sistemas. Por esa
razón la información tiene que ser transformada en un formato estandarizado, consistente y
limpio.
• A continuación, es necesario cargar en el data warehouse. Los datos históricos que tienen
poca relevancia para las operaciones actuales pueden dejarse a un lado, o cargar solo si hay
espacio suficiente. Los datos operacionales y transaccionales más recientes que provienen de las
diversas funciones, canales y puntos de contacto, es muy probable que sean priorizados para su
carga. Es muy importante ir refrescando los datos, lo cual se puede hacer de forma diaria o
semanal, dependiendo de la velocidad de los cambios en el negocio y su entorno.

8
ESTRUCTURAS DE UN DATA WAREHOUSE

La arquitectura de un data warehouse puede ser dividida en tres estructuras simplificadas: básica,
básica con un área de ensayo y básica con área de ensayo y data marts.

 Con una estructura básica, sistemas operativos y archivos planos proporcionan datos en
bruto que se almacenan junto con metadatos. Los usuarios finales pueden acceder a ellos para
su análisis, generación de informes y minería.
 Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y el almacén,
ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almacén. Es
posible personalizar la arquitectura del almacén para diferentes grupos dentro de la
organización.
 Se puede hacer agregando data marts, que son sistemas diseñados para una línea de negocio
en particular. Se pueden tener data marts separados para ventas, inventario y compras, por
ejemplo, y los usuarios finales pueden acceder a datos de uno o de todos los data marts del
departamento.

9
BIBLIOGRAFÍA (LINKS DE REFERENCIA)

https://www.powerdata.es/data-warehouse
https://www.sinnexus.com/business_intelligence/datawarehouse.aspx
https://blog.powerdata.es/el-valor-de-la-gestion-de-datos/que-es-un-data-warehouse-y-como-
saber-cuando-lo-necesitas-implementar
http://www.stratebi.com/datawarehouse
https://colombiadigital.net/actualidad/articulos-informativos/item/9814-que-es-un-data-
warehouse-y-que-beneficios-aporta-a-las-organizaciones.html
https://dataiq.com.ar/blog/es-necesario-contar-con-un-data-warehouse-para-el-analisis-bi/

10