Вы находитесь на странице: 1из 11

Universidad

Veracruzana

FACULTAD DE CONTADURIA Y ADMINISTRACIN

LICENCIATURA:
Sistemas Computacionales Administrativos

EXPERIENCIA EDUCATIVA:
Sistemas de Apoyo a la Toma de Decisiones

EQUIPO:
Numero Tres

PROFESORA:
Alma Rosa Galindo

EXPOSICION:
Data Warehouse y Data Marts

SECCION:
701

Data Warehouse DW
Un Data warehouse es una base de datos corporativa que se caracteriza por integrar y
depurar informacin de una o ms fuentes distintas, para luego procesarla permitiendo
su anlisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La
creacin de un data warehouse representa en la mayora de las ocasiones el primer paso,
desde el punto de vista tcnico, para implantar una solucin completa y fiable de
Business Intelligence.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se
almacena la informacin (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc.). Este tipo de persistencia de la informacin es homognea y fiable, y
permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno
diferente a los sistemas operacionales).

Segn defini el propio Bill Inmon, una data warehouse se caracteriza por ser:

Integrado: los datos almacenados en el data warehouse deben integrarse en una


estructura consistente, por lo que las inconsistencias existentes entre los diversos
sistemas operacionales deben ser eliminadas. La informacin suele estructurarse
tambin en distintos niveles de detalle para adecuarse a las distintas necesidades
de los usuarios.

Temtico: slo los datos necesarios para el proceso de generacin del


conocimiento del negocio se integran desde el entorno operacional. Los datos se
organizan por temas para facilitar su acceso y entendimiento por parte de los
usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una nica tabla del data warehouse. De esta forma, las
peticiones de informacin sobre clientes sern ms fciles de responder dado
que toda la informacin reside en el mismo lugar.

Histrico: el tiempo es parte implcita de la informacin contenida en un data


warehouse. En los sistemas operacionales, los datos siempre reflejan el estado de
la actividad del negocio en el momento presente. Por el contrario, la informacin
almacenada en el data warehouse sirve, entre otras cosas, para realizar anlisis
de tendencias. Por lo tanto, la data warehouse se carga con los distintos valores
que toma una variable en el tiempo para permitir comparaciones.
No voltil: el almacn de informacin de un data warehouse existe para ser
ledo, pero no modificado. La informacin es por tanto permanente, significando
la actualizacin del data warehouse la incorporacin de los ltimos valores que
tomaron las distintas variables contenidas en l sin ningn tipo de accin sobre
lo que ya exista.

Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido,
son:

Dar soporte al usuario final, ayudndole a acceder al data warehouse con su


propio lenguaje de negocio, indicando qu informacin hay y qu significado
tiene. Ayudar a construir consultas, informes y anlisis, mediante herramientas
de Business Intelligence como DSS, EIS o CMI.

Dar soporte a los responsables tcnicos del data warehouse en aspectos de


auditora, gestin de la informacin histrica, administracin del data
warehouse, elaboracin de programas de extraccin de la informacin,
especificacin de las interfaces para la realimentacin a los sistemas
operacionales de los resultados obtenidos... etc.

Principales aportaciones de un Data Warehouse

Proporciona una herramienta para la toma de decisiones en cualquier rea


funcional, basndose en informacin integrada y global del negocio.

Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para


encontrar relaciones ocultas entre los datos del almacn; obteniendo un valor
aadido para el negocio de dicha informacin.

Proporciona la capacidad de aprender de los datos del pasado y de predecir


situaciones futuras en diversos escenarios.

Simplifica dentro de la empresa la implantacin de sistemas de gestin integral


de la relacin con el cliente.

Supone una optimizacin tecnolgica y econmica en entornos de Centro de


Informacin, estadstica o de generacin de informes con retornos de la
inversin espectaculares.

Data Marts

Un Data marts es una base de datos departamental, especializada en el almacenamiento


de los datos de un rea de negocio especfica. Se caracteriza por disponer la estructura
ptima de datos para analizar la informacin al detalle desde todas las perspectivas que
afecten a los procesos de dicho departamento. Un data marts puede ser alimentado
desde los datos de un data warehouse, o integrar por si mismo un compendio de
distintas fuentes de informacin.

Por tanto, para crear el data marts de un rea funcional de la empresa es preciso
encontrar la estructura ptima para el anlisis de su informacin, estructura que puede
estar montada sobre una base de datos OLTP, como el propio data warehouse, o sobre
una base de datos OLAP. La designacin de una u otra depender de los datos, los
requisitos y las caractersticas especficas de cada departamento. De esta forma se
pueden plantear dos tipos de data marts:

Data Marts OLAP

Se basan en los populares cubos OLAP, que se construyen agregando, segn los
requisitos de cada rea o departamento, las dimensiones y los indicadores necesarios de
cada cubo relacional. El modo de creacin, explotacin y mantenimiento de los cubos
OLAP es muy heterogneo, en funcin de la herramienta final que se utilice.

Pueden basarse en un simple extracto del data warehouse, no obstante, lo comn es


introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las
operaciones ms usuales) aprovechando las caractersticas particulares de cada rea de
la empresa. Las estructuras ms comunes en este sentido son las tablas report, que

vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas
materializadas, que se construyen con la misma estructura que las anteriores, pero con el
objetivo de explotar la reescritura de quiries (aunque slo es posible en algunos SGBD
avanzados, como Oracle).

Los data marts que estn dotados con estas estructuras ptimas de anlisis presentan las
siguientes ventajas:

Poco volumen de datos

Mayor rapidez de consulta

Consultas SQL y/o MDX sencillas

Validacin directa de la informacin

Facilidad para la historizacin de los datos

Las herramientas de cubos bidimensionales permiten a los usuarios ingresar a un data


warehouse desde cualquier dimensin simple para empezar el anlisis, luego navegar a
otra dimensin para un mayor anlisis de la informacin.

OLAP es online analytical processing. Se trata de una forma de almacenar la


informacin en una Base de Datos que permita realizar de forma ms efectiva la
informacin para la toma de decisiones en una Empresa.

MOLAP, Multidimensional OLAP. Tanto los datos fuente como los datos
agregados o precalculados residen en el mismo formato multidimensional.
Optimiza las queries, pero requiere ms espacio de disco y diferente software. El
primer punto esta dejando ser un problema: el espacio de disco cada vez es ms
barato.

ROLAP, Relational OLAP. Tanto los datos precalculados y agregados como


los datos fuente residen en la misma base de datos relacional. Si el
DataWarehouse es muy grande o se necesita rapidez por parte de los usuarios
puede ser un problema.

HOLAP, Hybrid OLAP: Es una combinacin de los dos anteriores. Los datos
agregados y precalculados se almacenan en estructuras multidimensionales y los
de menor nivel de detalle en el relacional. Requiere un buen trabajo de anlisis
para identificar cada tipo de dato.

Los 6 elementos bsicos de un sistema OLAP son: Dimensiones, Valores, Jerarquas,


Niveles, Atributos e Indicadores.

Veamos un ejemplo:
Los datos se almacenan en una estructura de cubo (es como si estuviera totalmente
indexado) y la velocidad de acceso se hace mucho mas eficiente.

En este caso, la primera consulta nos muestra los puntos que han acumulado los titulares
de la tarjeta clsica, en todos los tipos de cabinas y en todos los meses. Mientras, que en
la segunda filtramos el cubo para los que volaron en turista. Este tipo de consultas
devuelve los datos de forma instantnea.

Los sistemas OLAP soportan las siguientes operaciones

Consolidacin: este comprende el conjunto de datos. Esto puede involucrar


acumulaciones simples o agrupaciones complejas que incluyen datos
interrelacionados.

Drill-Down: OLAP puede moverse en la direccin contraria y presentar


automticamente datos detallados que abarcan datos consolidados.

Slicing and Dicing: se refiere a la capacidad de visualizar a la BD desde


diferentes puntos de vista. Tambin se la conoce como operacin de Pivotaje.

Moviendo datos de DW a Data Marts

Ventajas:
Campos Comparativos
Origen Comn
Procesamiento Distribuido

Desventajas:
Tiemplo Lardo de Desarrollo

Moviendo datos de Data Marts a DW

Ventajas:
Simple y Rpido
Datos Departamentales

Desventajas:
Duplicacin de Datos
Data Marts Incompatibles

Вам также может понравиться