Академический Документы
Профессиональный Документы
Культура Документы
Veracruzana
LICENCIATURA:
Sistemas Computacionales Administrativos
EXPERIENCIA EDUCATIVA:
Sistemas de Apoyo a la Toma de Decisiones
EQUIPO:
Numero Tres
PROFESORA:
Alma Rosa Galindo
EXPOSICION:
Data Warehouse y Data Marts
SECCION:
701
Data Warehouse DW
Un Data warehouse es una base de datos corporativa que se caracteriza por integrar y
depurar informacin de una o ms fuentes distintas, para luego procesarla permitiendo
su anlisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La
creacin de un data warehouse representa en la mayora de las ocasiones el primer paso,
desde el punto de vista tcnico, para implantar una solucin completa y fiable de
Business Intelligence.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se
almacena la informacin (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc.). Este tipo de persistencia de la informacin es homognea y fiable, y
permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno
diferente a los sistemas operacionales).
Segn defini el propio Bill Inmon, una data warehouse se caracteriza por ser:
Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido,
son:
Data Marts
Por tanto, para crear el data marts de un rea funcional de la empresa es preciso
encontrar la estructura ptima para el anlisis de su informacin, estructura que puede
estar montada sobre una base de datos OLTP, como el propio data warehouse, o sobre
una base de datos OLAP. La designacin de una u otra depender de los datos, los
requisitos y las caractersticas especficas de cada departamento. De esta forma se
pueden plantear dos tipos de data marts:
Se basan en los populares cubos OLAP, que se construyen agregando, segn los
requisitos de cada rea o departamento, las dimensiones y los indicadores necesarios de
cada cubo relacional. El modo de creacin, explotacin y mantenimiento de los cubos
OLAP es muy heterogneo, en funcin de la herramienta final que se utilice.
vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas
materializadas, que se construyen con la misma estructura que las anteriores, pero con el
objetivo de explotar la reescritura de quiries (aunque slo es posible en algunos SGBD
avanzados, como Oracle).
Los data marts que estn dotados con estas estructuras ptimas de anlisis presentan las
siguientes ventajas:
MOLAP, Multidimensional OLAP. Tanto los datos fuente como los datos
agregados o precalculados residen en el mismo formato multidimensional.
Optimiza las queries, pero requiere ms espacio de disco y diferente software. El
primer punto esta dejando ser un problema: el espacio de disco cada vez es ms
barato.
HOLAP, Hybrid OLAP: Es una combinacin de los dos anteriores. Los datos
agregados y precalculados se almacenan en estructuras multidimensionales y los
de menor nivel de detalle en el relacional. Requiere un buen trabajo de anlisis
para identificar cada tipo de dato.
Veamos un ejemplo:
Los datos se almacenan en una estructura de cubo (es como si estuviera totalmente
indexado) y la velocidad de acceso se hace mucho mas eficiente.
En este caso, la primera consulta nos muestra los puntos que han acumulado los titulares
de la tarjeta clsica, en todos los tipos de cabinas y en todos los meses. Mientras, que en
la segunda filtramos el cubo para los que volaron en turista. Este tipo de consultas
devuelve los datos de forma instantnea.
Ventajas:
Campos Comparativos
Origen Comn
Procesamiento Distribuido
Desventajas:
Tiemplo Lardo de Desarrollo
Ventajas:
Simple y Rpido
Datos Departamentales
Desventajas:
Duplicacin de Datos
Data Marts Incompatibles