Вы находитесь на странице: 1из 8

Estado del Arte de Data Warehouse

Mija Ferrer, Joel

Universidad Nacional de Trujillo Ingeniería Informática Trujillo - Perú

joelmija_168@hotmail.com

Otiniano Dávila, Luis

Universidad Nacional de Trujillo Ingeniería Informática Trujillo - Perú

sprite_q_napster@hotmail.com

Velásquez Haro César

Universidad Nacional de Trujillo Ingeniería Informática Trujillo - Perú

vehac69@hotmail.com

RESUMEN

En este trabajo se describe la evolución y los diversos cambios que han sufrido los data warehouse desde que hicieron su aparición, así como también el estado en que se encuentra en la actualidad y las proyecciones o tendencias que se esperan de este, almacén de datos, en el futuro.

Este articulo se desarrolló con la intención de investigar el estado del arte de los data warehouse, en otras palabras saber cuáles son sus antecedentes, como se desarrolla y utiliza en actualidad y que perspectivas se tienen de esta tecnología para el futuro.

Palabras clave

Data warehouse, antecedentes, actualidad, tendencias.

1. INTRODUCCIÓN

Debido a la gran dificultad para obtener información relevante de los datos almacenados en los sistemas tradicionales surge el concepto de data warehouse, el cual brinda una solución eficaz y eficiente para satisfacer dicha necesidad.

Un

data warehouse “es una colección

de datos

orientada al

negocio, integrada, variante en el tiempo

y

no

volátil para el

soporte del proceso de toma de decisiones de la gerencia” (Inmon).

Un data warehouse proporciona información integrada que puede ser utilizada de forma informacional o analítica de manera que pueda ser suministrada para la toma de decisiones.

Un data warehouse presenta las siguientes características:

Integrado: La integración implica que todos los datos de diversas fuentes deben ser consolidados en una instancia antes de ser agregados al data warehouse, y deben por lo tanto ser analizados para asegurar su calidad y limpieza, entre otras cosas.

Temático: Sólo los datos necesarios para el proceso de generación del conocimiento del negocio son integrados. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales.

Histórico: La información almacenada en el data warehouse sirve, entre otras cosas, para realizar análisis de tendencias. Por lo tanto, un data warehouse se carga con los distintos valores que toma una variable en el tiempo lo cual permite analizarlos.

No volátil: El almacén de información de un data warehouse existe para ser leído, y no modificado. La información es por tanto permanente.

El éxito de los data warehouse radica en su concepto fundamental, la estructuración de la información. Un data warehouse para que tenga éxito precisa de un claro conjunto de objetivos que puedan reunir los factores críticos de éxito. Algunos de estos objetivos son:

Soporte en la toma de decisiones estratégica: El data warehouse proporciona datos detallados y acumulados que pueden ser utilizadas para análisis de tendencias, comparación del rendimiento y análisis estadístico.

Soporte a la cadena de valor integrada: El data warehouse proporciona datos consistentes y reduce redundancias.

Rapidez de respuesta a las consultas: Mediante OLAP se dispone de rápidas respuestas a las consultas.

Calidad de los datos: La calidad de los datos puede ser mejorada cuando la fuente de los datos es analizada desde el data warehouse. [1]

  • 2. CUERPO DEL ARTÍCULO

    • 2.1 Antecedentes de Data Warehouse

Se distinguen cuatro etapas en la historia del data warehouse, entre estas tenemos:

2.1.1 Data Warehouse Principios de los Ochenta

Durante estos años las tecnologías de la información se esforzaban en automatizar los procesos de tipo repetitivo o administrativo, haciendo uso de los sistemas de información operacional o transaccional en línea (OnLine Transaction Processing (OLTP)). La función de estos sistemas consiste en recoger y almacenar los datos generados a partir de las aplicaciones informáticas que se utilizaban.

Técnicamente los sistemas de información aludidos se caracterizaban por permitir una captura rápida y segura de grandes volúmenes de información detallada, en los que la actualización de los datos, así como el tiempo de respuestas, constituía conceptos importantes.

Desde la visión de la dirección estratégica, los sistemas de información de tipo OLTP estaban diseñados para resolver los problemas de carácter operativo. Esto significa que el tipo de decisiones que soportaban estaban relacionadas con la ejecución y apoyo de las tareas básicas del negocio. Por lo tanto no eran útiles para realizar un análisis más avanzado de tipo estratégico.

2.1.2

Data Warehouse Fines de los Ochenta

Con el tiempo, los requerimientos de información de las organizaciones empezaron a cambiar ya que los responsables de los distintos departamentos realizaban cada vez mas consultas y precisaban de más informes. Los departamentos informáticos no eran capaces de satisfacer la creciente demanda de información, solicitada siempre con carácter urgente. Surge entonces la necesidad de crear unas nuevas bases de datos centrales, con información resumida y detallada.

Pero la creación de base de datos centralizados no fue la solución para satisfacer las necesidades de información ya que en vez de brindar soluciones acarreaba más problemas; entre estos problemas tenemos:

Como centralizar la información que se encontraba dispersa, duplicada, así como en distintas versiones y formatos.

Como cargar esos datos en la nueva base de datos para llegar a obtener una base de datos central y fiable.

Como acceder a esos datos de forma ágil y eficiente.

Es por estos problemas que el 1985 aparece el primer data warehouse, su finalidad era la de integrar y organizar los datos que estaban dispersos en múltiples bases de datos. Este primer almacén de datos central, lo construyo lo construyo Inmon, para un banco en Colorado.

2.1.3

Data Warehouse a Principios de los Noventas

Las organizaciones empiezan a considerar la importancia de los datos, los cuales representan la materia prima de la información, y a esta a su vez es considerada como un activo intangible en las empresas. Es en esta época donde la información junto con otros activos intangibles se convierte en la única generadora real de ventajas competitivas en la empresa.

Es aquí donde los datas warehouse entran a tallar almacenado datos y brindando soporte a la toma de decisiones en la empresa.

2.1.4

Data Warehouse desde Fines de los Noventa

En los últimos años el concepto de data warehouse se ha ido perfeccionando (capacidad de almacenamiento, herramientas de consultas, conexión a internet o a una intranet) y adaptándose a las necesidades crecientes de información en las empresas, de

forma que los actuales almacenes de datos puede proporcionar soluciones a todos tipos de usuarios. [2]

2.2 Data Warehouse en la Actualidad

2.2.1 Que es y Que no es un Data Warehouse:

Inmon define un data warehouse como una colección de datos orientada al negocio, integrada, variante en el tiempo y no volátil para el soporte del proceso de toma de decisiones de la gerencia; con estas características un data warehouse no es una base de datos tradicional.

Un data warehouse representa un motor de los sistemas de información ya que permite integrar datos organizarlos y almacenarlos para su posterior tratamiento analítico, esto no se puede hacer en una base de datos tradicional.

Data warehouse es una tecnología que transforma los datos operacionales en una herramienta competitiva y permite que estos datos sean analizados de un modo más estratégico para lograr encontrar el conocimiento oculto en estos.

La tabla 1 muestra las principales diferencias entre un data warehouse y una base de datos tradicional en una organización.

Tabla 1. Diferencias entre un Data Warehouse y una Base de Datos Tradicional

Base de Datos Tradicional

Data Warehouse

Predomina la actualización

Predomina la consulta

La actividad más importante es de tipo operativo

La actividad más importante es el análisis y la actividad

Predomina el proceso puntual

estratégica. Predomina el proceso masivo

Mayor importancia a la escalabilidad

Mayor importancia al dinamismo

Datos en general desagregados

Datos en distintos niveles de detalle y agregación

Importancia del dato actual

Importancia del dato histórico

Importancia del tiempo de respuesta de la transacción instantánea

Importancia de la respuesta masiva

Estructura relacional

Visión multidimensional

Usuarios de perfiles medios o bajos

Usuarios de perfiles altos

Exploración de la información donde solo es operativa la aplicación

Exploración de la información interna y externa de todo el negocio

Entonces un data warehouse representan una solución adecuada como herramienta para el soporte de la toma de decisiones, lo mismo no se puede decir de una bases de datos relacional. [2]

2.2.2 Estructura de un Data Warehouse 2.2.2.1 Almacenamiento

Los data warehouse estructuran los datos de manera muy particular. Existen diferentes niveles de esquematización y detalle que delimitan el data warehouse. La figura 1 muestra la estructura de un data warehouse.

Entonces un data warehouse representan una solución adecuada como herramienta para el soporte de la toma

Figura 1. Estructura de un data warehouse

Como se observa en la figura 1, los almacenes de datos están compuestos por diversos tipos de datos, que se organizan y dividen de acuerdo al nivel de detalle o granularidad que posean. A continuación se explicará cada uno de estos tipos de datos:

Detalle de Datos Actuales: Son aquellos datos que reflejan las ocurrencias más recientes. Generalmente se almacenan en disco, aunque su administración sea costosa y compleja, con el fin de conseguir que el acceso a la información sea sencillo y veloz, ya que son bastante voluminosos. Su gran tamaño se debe a que los datos residentes poseen el más bajo nivel de granularidad, o sea, se almacenan a nivel de detalle.

Detalle de Datos Históricos: Son aquellos datos antiguos, que no son frecuentemente consultados. Se almacenan a nivel de detalle, normalmente sobre alguna forma de almacenamiento externa. Son muy pesados y no son requeridos con mucha periodicidad. Este tipo de datos son consistentes con los de detalle de datos actuales. [3]

Datos Ligeramente Resumidos: Son los que provienen desde un bajo nivel de detalle y sumarizan o agrupan los datos bajo algún criterio o condición de análisis. Habitualmente son almacenados en disco.

Datos Altamente Resumidos: son aquellos que compactan aún más a los datos ligeramente resumidos. Se guardan en disco y son muy fáciles de acceder.

Metadatos: Representan la información acerca de los datos. De muchas maneras se sitúa en una dimensión diferente al de otros datos del data warehouse, ya que su contenido no es tomado directamente desde el ambiente operacional.

Estos diferentes niveles de detalle o granularidad, se obtienen a través de tablas de hechos agregadas y/o preagregadas.

2.2.2.2 Flujo de Datos

Los

data

warehouse

posee

un

flujo

de

datos

estándar

y

generalizado. En la figura 2 se muestra este flujo de datos.

Entonces un data warehouse representan una solución adecuada como herramienta para el soporte de la toma

Figura 2. Flujo de datos en un data warehouse

Cuando

la

información

ingresa

al

data

warehouse,

esta

se

almacena a nivel

de

detalle

de

datos

actuales.

Los datos

permanecerán allí hasta que ocurra alguno de los tres eventos siguientes:

Sean borrados del depósito de datos.

Sean resumidos, ya sea a nivel de datos ligeramente resumidos o a nivel de datos altamente resumidos.

Sean archivados a nivel de detalle de datos históricos. [3]

  • 2.2.2.3 Utilización del Data Warehouse

Los diversos niveles de data warehouse reciben diversos usos. En general, cuanto más alto sea el nivel del resumen, mas son los datos utilizados y se acceden a estos de forma rápida y eficiente, mientras que los datos detallados más antiguos casi apenas se utilizan. En la figura 3 se representa la utilización del data warehouse. [4]

2.2.2.3 Utilización del Data Warehouse Los diversos niveles de data warehouse reciben diversos usos. En general,

Figura 3. Utilización de un data warehouse

2.2.3 Arquitectura de Data Warehouse

Está integrada por los siguientes componentes:

  • 2.2.3.1 OLTP (On-Line Transaction Processing)

Son aplicaciones que definen el comportamiento habitual de un entorno operacional de gestión y ejecutan las operaciones del día

a día como son: compras, ventas, inventarios, sueldos, etc.

  • 2.2.3.2 Consolidación: Encargado de producir el cambio de

sistemas OLTP a las Bases de Datos OLAP. Consolidan datos de

aplicaciones no integradas, sumarizan datos disgregados y los transforman. Está compuesto por tres pasos:

Validación de Consistencia de Datos, validez de datos e inconsistencia entre aplicaciones. Mecanismos de Consolidación, volcado completo de los datos procedentes del sistema operacional. Factores Técnicos, mecanismos de transporte carga y formateo de datos.

  • 2.2.3.3 Middleware: Software que reside físicamente

en un

Cliente y en un Servidor de Comunicaciones

  • 2.2.3.3 OLAP (On-line Analytical Process): Son aplicaciones

que se encargan de analizar datos del negocio para generar

información táctica y estratégica que sirve de soporte para la toma

de decisiones. OLAP multidimensionales.

opera

sobre

base

de

datos

2.2.3.3 Data Marts: Contando con la base de información integrada a partir de esta se crean subconjuntos de de datos con el propósito de ayudara a que un área específica dentro del negocio

pueda tomar mejores decisiones.

[9]

2.2.4 Tipos de Implementación de un Data Warehouse
2.2.4
Tipos
de
Implementación
de
un
Data
Warehouse

ROLAP (Relational On Line Analytic Processing):

Se implementa sobre tecnología relacional. Los cubos multidimensionales se generan dinámicamente al instante de realizar las diferentes consultas, haciendo de esta manera el manejo de cubos transparente al usuario. Desventaja los datos deben generarse cada vez que se haga una consulta posible solución almacenar los datos en memoria cache.

MOLAP (Multidimentional On Line Analytic Processing):

Almacena físicamente los datos en estructuras multidimensionales de manera que la representación externa y la interna coincidan. Requiere que en una instancia previa se generen y calculen los cubos multidimensionales, para que luego puedan ser consultados. El principal motivo de precalcular los datos de los cubos, es que posibilita que las consultas sean respondidas con mucha rapidez, ya que los mismos no deben ser calculados en tiempo de ejecución, obteniendo de esta manera una muy buena performance. Desventaja si se quiere modificar algún cubo se debe volver a recalcular para que se reflejen las modificaciones.

HOLAP (Hybrid On Line Analytic Processing):

Constituye un sistema híbrido entre MOLAP y ROLAP, que combina estas dos implementaciones para almacenar algunos datos en un motor relacional y otros en una base de datos multidimensional. Los datos agregados y precalculados se almacenan en estructuras multidimensionales y los de menor nivel de detalle en estructuras relacionales. Es decir, se utilizará

ROLAP para navegar y explorar los datos, y se empleará MOLAP para la realización de tableros. Como contrapartida, hay que realizar un buen análisis para identificar los diferentes tipos de datos.

[3]

2.2.5 Herramientas de Consulta y Análisis para Data Warehouse

ROLAP para navegar y explorar los datos, y se empleará MOLAP para la realización de tableros.

Permiten al usuario realizar la exploración de datos del DW. Básicamente constituyen el nexo entre el depósito de datos y los usuarios. Utilizan la metadata de las estructuras de datos utilizadas (cubos multidimensionales, Business Models, etc.) para trasladar a través de consultas SQL los requerimientos del usuario, para luego, devolver el resultado obtenido. A través de una amigable interfaz gráfica y una serie de simples pasos, el usuario genera consultas que son enviadas desde la herramienta de consulta y análisis al Query Manager, este a su vez realiza la extracción de información al DW Manager y devuelve los resultados obtenidos a la herramienta que se los solicitó. Luego, estos resultados son expuestos ante el usuario en formatos que le son familiares.

Herramientas:

Consultas y Reportes

A través de pantallas gráficas intuitivas, posibilidad de generar informes avanzados y detallados del área de interés del negocio que se esté analizando. Algunas prestaciones de este tipo de herramientas son:

o

Parametrización de los datos devueltos.

o

Selección de formatos de salida (planilla de cálculo,

o

HTML, PDF, etc.). Inclusión de gráficos de tortas, barras, etc.

o

Utilización de plantillas de formatos de fondos.

o

Inclusión de imágenes.

o

Formatos tipográficos.

o

Links a otros reportes.

OLAP

información basándose en más criterios que un análisis de forma tradicional. Al contar con muestras grandes, se pueden explorar mejor los datos en busca de respuestas. Permiten realizar agregaciones y combinaciones de los datos de maneras complejas y específicas, con el fin de realizar análisis más estratégicos

Dashboards

Entiéndase como una como una colección de reportes, consultas y análisis interactivos que hacen referencia a un tema en particular y que están relacionados entre sí. Cada uno de ellos tiene sus objetivos particulares. Presentan la información altamente resumida. Se componen de consultas, reportes, análisis interactivos, gráficos (de torta, barras, etc), semáforos, indicadores causa-efecto, etc. Permiten evaluar la situación de la empresa con un solo golpe de vista. Poseen un formato de diseño muy visual y son muy llamativos.

Data Minig:

Esta herramienta constituye una poderosa tecnología con un gran potencial que ayuda y brinda soporte a los usuarios, con el fin de permitirles analizar y extraer conocimientos ocultos y predecibles

a partir de los datos almacenados en un DW o en un OLTP. Algunos modelos matemáticos tales como.

o

Redes Neuronales

o

Sistemas Expertos

o

Programacion Genética

EIS (Executive Information System)

Se utiliza para analizar los indicadores de performance y desempeño del negocio o área de interés, a través de la presentación de vistas con datos simplificados, altamente consolidados, mayormente estáticos y preferentemente gráficos. El concepto principal de esta herramienta, se basa en el simple hecho de que los ejecutivos no poseen tiempo, ni las habilidades necesarias para analizar grandes cantidades de datos.

[3]

2.2.6 Diseño de Data Warehouse

Como en los sistemas de bases de datos tradicionales, el proceso de diseño del DW puede dividirse en tres etapas secuenciales:

diseño conceptual, diseño lógico y diseño físico. En la figura 4 se muestran las etapas con sus respectivas entradas y salidas de información.

Permite recolectar y organizar la información analítica necesaria para los usuarios y disponer de ella en diversos formatos, tales como tablas, gráficos, reportes, tableros de control, etc. Soporta análisis complejos de grandes volúmenes de datos. Presenta al usuario una visión multidimensional de los datos (matricial) para cada tema de interés del negocio. Es transparente al tipo de tecnología que soporta el DW, ya sea ROLAP, MOLAP u HOLAP. No tiene limitaciones con respecto al número máximo de dimensiones permitidas. Permite a los usuarios, analizar la

Figura 4. Diseño de un data warehouse En la etapa de diseño conceptual se construye un

Figura 4. Diseño de un data warehouse

En la etapa de diseño conceptual se construye un esquema conceptual de la realidad a partir de los requerimientos y/o bases fuentes. Dicho esquema conceptual es enriquecido con requerimientos de performance y almacenamiento durante la etapa de diseño lógico, y a partir de él se genera un esquema lógico, que es dependiente del tipo de modelo y tecnología de DBMS. Hay dos familias de esquemas lógicos: relacionales y multidimensionales, y actualmente se están considerando esquemas híbridos. Por último, en la etapa de diseño físico se implementa el esquema lógico en el manejador de bases de datos elegido, teniendo en cuenta técnicas de optimización física, como son: índices, particiones, etc.

Los diseños lógicos y físicos tienen un parecido muy cercano. El modelo físico se diferenciará del modelo lógico en términos de las menciones previstas para la base de datos física, incluidos los nombres de columna física (no tener miedo de usar nombres largos), tipos de datos, y la permisividad de nulos. [8]

2.2.7 Ventajas e Inconvenientes en Data Warehouse

2.2.7.1 Ventajas:

Transforma datos orientados a las aplicaciones en información orientada a la toma de decisiones.[3]

Permite el almacenamiento de datos de diferentes fuentes en un formato común con definiciones coherentes para las claves y los campos [5], que anteriormente formaban islas, en una única plataforma sólida y centralizada. [3]

Permite consolidar muchos sistemas transaccionales.[6]

Provee la capacidad de analizar y explotar las diferentes áreas de trabajo y de realizar un análisis inmediato de las mismas.

[3]

Son resistentes al cambio permitiendo cargar grandes cantidades de datos en muy corto tiempo.[7]

Aumenta la competitividad en el mercado.[3]

 

Elimina la producción y el procesamiento de datos que no son utilizados ni necesarios, producto de aplicaciones mal diseñadas o ya no utilizadas.[3]

Mejora la entrega de información, es decir, información completa, correcta, consistente, oportuna y accesible. [3]

Información que los usuarios necesitan, en el momento adecuado y en el formato apropiado. [3]

Aumento

de

la

eficiencia

de

los

encargados

de tomar

decisiones. [3]

Permite la toma de decisiones estratégicas y tácticas. [3]

2.2.7.2

Inconvenientes:

 

Requiere una gran inversión, debido a que su correcta construcción no es tarea sencilla y consume muchos recursos, además, su misma implementación implica desde la adquisición de herramientas de consulta y análisis, hasta la capacitación de los usuarios.

Existe resistencia al cambio por parte de los usuarios.

 

Los beneficios del almacén de datos son apreciados en el mediano y largo plazo.

Incremento continuo de los requerimientos del usuario.

2.3 Tendencias de Data Warehouse

 

2.3.1 Tendencias futuras respecto al almacenamiento de datos

2.3.1.1

Unstructured Data (Datos no estructurados)

Con los datos que se trabajan normalmente son los datos estructurados donde el sistema de origen es una base de datos relacional, o una base de datos orientada a objetos o una base de datos jerárquica. Sin embargo, todos tienen estructura de datos. Los datos no estructurados, por el contrario, no tiene una estructura de datos como filas y columnas, una estructura de árbol, o las clases y tipos. Ejemplos de datos sin estructurar:

documentos, imágenes (fotos, diagramas y fotos), películas de audio (canciones, discursos, y los sonidos), video (films, animaciones), streaming de datos, texto, correos electrónicos y sitios web en Internet [6].

2.3.1.2

Search (Búsqueda)

 

La búsqueda tanto para imágenes que puede usar las palabras de texto de la imagen, también para tipos de multimedia, como vídeo y música etc., pueden ser costosas de realizar por ejemplo, un

organismo internacional con 100 sucursales ubicadas en 50 países podrían tener 100 data Marts por un total de 100 terabytes de ventas, compras, finanzas, inventarios, recursos humanos, y una enorme cantidad de documentos. Es por eso que actualmente la búsqueda se ha convertido en una tendencia en la inteligencia de negocios y en el data Warehousing [6].

  • 2.3.1.3 Service-Oriented Architecture (SOA)

SOA es un método de desarrollo de una aplicación que utiliza una serie de pequeñas componentes independientes que se comuniquen entre sí ofreciendo servicios. Estos componentes pueden ser distribuidos, de hecho, pueden ser situados en lados diferentes del mundo. SOA nos da más flexibilidad para sustituir los componentes. En otras palabras, usted puede hacer por etapas pieza por pieza sin afectar la funcionalidad. Esto es porque los componentes son independientes. Esto le permite reconstruir un componente con una o más nuevas tecnologías sin afectar a los demás.

Aplicaciones de almacenes en todos los frentes se construyen usando SOA: ETL, presentación de informes, análisis, aplicaciones de BI, minería de datos, metadatos, calidad de datos y depuración de los datos.

En el futuro, sería más fácil de actualizar un componente sin afectar a los demás y para conectar diferentes componentes que se realizan utilizando diferentes tecnologías [6].

  • 2.3.1.4 Real-Time Data Warehouse (Data Warehouse

en Tiempo Real)

Los usuarios desean

ver actualizada cada dos minutos o incluso en tiempo real. Un data warehouse en tiempo real es un almacén de datos que se actualiza en el momento de la transacción que ocurre en el sistema de origen.

los

datos

del

almacén

de

datos

Por ejemplo, usted puede poner desencadenadores en la tabla de transacciones de venta en el sistema de origen de manera que cuando se realiza una operación se inserta en la base de datos, el gatillo dispara y envía el nuevo registro en el almacén de datos como un mensaje. El almacén de datos tiene un oyente activo que capta el mensaje de que llegue el momento, la limpia, el DQS, lo transforma y lo inserta en la tabla de hechos de inmediato. Se habla de una diferencia de tiempo de dos segundos aquí, entre el momento en que un cliente ha comprado un producto en el sitio web y los datos de momento está disponible en la tabla de hechos.

Enfoques en tiempo real se pueden implementar mediante el uso de un mini-lotes con dos a cinco frecuencias por minutos, que extrae los datos del área del escenario en lugar de utilizar los factores desencadenantes. Estos mini-lotes también hace el trabajo normal del ETL transformar los datos y cargarlos en el data warehouse de datos dimensional base. Los mini-lotes también pueden extraer los datos directamente desde el sistema de origen, eliminando la necesidad de modificar el sistema de origen para actualizar el área de ensayo. [6]

3. CONCLUSIONES

Los data warehouse son una herramienta útil y muy usada en la actualidad para dar soporte a la toma de decisiones.

Los data warehouse conforme avance el tiempo seguirá mejorando y acoplando nuevas tecnologías en su desarrollo, lo cual le permitirá dar soluciones a problemas informacionales de forma rápida y óptima.

Los datas warehouse son usadas por las empresas como una herramienta estratégica lo cual les permite ser más competitivas en el mercado.

Las bases de datos tradicionales no son herramientas adecuadas para dar soporte a la toma de decisiones.

Las tecnologías específicamente el Data Warehouse ayudan a la mejor administración de la información en las empresas, mas no tener una buena tecnología garantiza la mejor toma de decisiones por parte de los gerentes, quienes son los encargados de esto, sino, ayudan a tener puntos de vista que antes no se observaban, por eso, el avance en Data Warehousing crece para poder hacer el trabajo más integrado más rápido a las empresas involucradas, ya sea usando datos estructurados y no estructurados, información en tiempo real, transacciones rápidamente actualizadas, búsquedas rápidas, etc., todo estas innovaciones que no son nuevas ayudaran a hacernos las cosas más fáciles.

4. REFERENCIAS

[1] Andrés Boza García, Ángel Ortiz Bas, Eduardo Vicéns Salort y Llanos Cuenca González. Data Warehouse para la Gestión por Procesos en el Sistema Productivo. Second World Conference on POM and 15tn Annual POM Conference, Cancun, México, April 30 May 3, 2004. Universidad Politécnica de Valencia.

[2] Gil Soto Esperanza. Data Warehouse Antecedentes, Situación actual y Tendencias. Universidad de la Laguna. Santa Cruz de Tenerife, Setiembre del 2001.

[3] Bernabeu Ricardo Dario. Data Warehousing: Investigación y Sistematización de Conceptos HEFESTO: Metodología propia para la Construcción de un Data Warehouse. Córdoba, Argentina, 21 de Abril de 2009.

[4] Carlos Osvaldo Medina Guerrero. Aplicaciones de un Data Warehouse Orientado a la Banca. Tesis, Universidad Francisco Marroquín de Guatemala, 2002.

[5]

Michael J.A., Berry Gordon S. Linoff. Data Mining Techniques for Marketing, Sales, and Customer Relationship Management Second Edition.

[6] Vincent Rainardi. Building a Data Warehouse with Examples in SQL Server.

[7]

Claudia

Imhoff

Nicholas

Galemmo

Jonathan

G.

Geiger.

Mastering

Data

Warehouse

Design

Relational

and

Dimensional Techniques.

[8] Ralph Kimball and Margy Ross. The Data Warehouse Toolkit,

Second

Edition,

the

Complete

Guide

to

Dimensional

Modeling.

[9] Méndez, A., Mártire, A., Fundamentos de Data Warehouse. Centro de Actualización permanente en Ingeniería del Software, Escuela de Posgrado, Instituto Tecnológico de Buenos Aires