Вы находитесь на странице: 1из 19

DATA WAREHOUSE

Presentador Por: Andrs Fabin Cortes Solano

TEMARIO

1. Qu es Data Warehouse? 2. Conceptos bsicos: a. b. Caractersticas Aplicaciones

c.
d. e. f. g. h. i.

Alternativas de Diseo
Herramientas Utilizadas Datamining Base de Datos Multidimensional Metadatos Procesos de Construccin Tcnicas Explotacin

Data Warehouse

Es un repositorio estructurado, a nivel Empresa, de datos orientados hacia reas de negocio, que contiene datos histricos y que est preparado para facilitar la toma de decisiones.

Diferencias

Base de Datos Operacional


Datos Operacionales Orientado a la aplicacin Actual Detallada Cambia continuamente

Data Warehouse
Datos del negocio para Informacin Orientado al sujeto Actual + histrico Detallada + ms resumida Estable

Caractersticas

Entre las principales se tiene: Orientado al tema Integrado Variante en el Tiempo No voltil

Orientado al Tema

Una primera caracterstica del data warehouse es que la informacin se clasifica en base a los aspectos que son de inters para la empresa. Ejemplo: Para un fabricante pueden ser cliente, vendedor y producto.

Integrado

La base de datos contiene los datos de todos los sistemas operacionales de la organizacin, y dichos datos deben ser consistentes.

Variante en el Tiempo

Como la informacin en el data warehouse es solicitada en cualquier momento (es decir, no "ahora mismo"), los datos encontrados en el depsito se llaman variante en el tiempo".

No voltil

La informacin no se modifica ni se elimina, una vez almacenado un dato, ste se convierte en informacin de slo lectura, y se mantiene para futuras consultas.

Aplicaciones

- Sistemas de Marketing - Anlisis de Riesgo Financiero - Anlisis de Riesgo de Crdito - Control de Gestin - Logstica - Recursos Humanos

Alternativas de Diseo

1. Creacin de varios Datamarts independientes, uno por cada dominio o fuente de informacin, y definicin de una Capa Usuario por cada uno de estos Datamarts. 2. Creacin de un nico Datawarehouse que englobe todos los datos, del que se extraigan diferentes Datamarts, uno por cada dominio o fuente de informacin y definicin de una Capa Usuario por cada Datamart. 3. Creacin de un nico Datawarehouse con definicin de una nica Capa Usuario. 4. Creacin de un nico Datawarehouse con definicin de varias Capas Usuario.

Herramientas Utilizadas

- Herramientas para la inteligencia empresarial. - Herramientas para extraer, transformar y cargar datos en el almacn de datos. - Herramientas para gestionar y recuperar los metadatos.

Datamining (Minera de Datos)

Es el conjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos, de manera automtica o semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales.

Base de Datos Multidimensionales

Se utilizan principalmente para crear aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su peculiaridad es que por cada dimensin tienen un campo (o columna), y otro campo por cada mtrica o hecho, es decir estas tablas almacenan registros cuyos campos son de la forma: (d1,d2,d3,...,f1,f2,f3,...) Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y los campos 'fi' a las mtricas o hechos que se quiere almacenar, estudiar o analizar.

Metadatos

Uno de los componentes ms importantes de la arquitectura de un almacn de datos son los metadatos. Se define comnmente como "datos acerca de los datos", en el sentido de que se trata de datos que describen cul es la estructura de los datos que se van a almacenar y cmo se relacionan. El Metadato documenta, entre otras cosas, qu tablas existen en una base de datos, qu columnas posee cada una de las tablas y qu tipo de datos se pueden almacenar.

Procesos de Construccin

ETL (Extraccin, Transformacin y Carga).


Extraccin: Obtencin de informacin de las distintas fuentes tanto internas como externas. Transformacin: Filtrado, limpieza, depuracin, homogeneizacin y agrupacin de la informacin. Carga: Organizacin y actualizacin de los datos y los metadatos en la base de datos.

Tcnicas de Explotacin

La explotacin del Data Warehouse mediante informacin de gestin, se fundamenta bsicamente en los niveles agrupados o calculados de informacin.

Carga de Base de datos

Extraccin, Depuracin, Filtro, Elaboracin

Glosario

Data Warehouse: Es un repositorio estructurado, a nivel Empresa, de datos orientados hacia reas de negocio, que contiene datos histricos y que est preparado para facilitar la toma de decisiones. Datamart: Es una base de datos orientada a un tema especfico. En otras palabras es un subconjunto del Data Warehouse Corporativo. Capa Usuario: Es una vista usuario de la base de datos que permite su aislamiento respecto de la complejidad fsica de la misma. No incluye ningn dato fsico. Es una agrupacin lgica de los datos adaptada a los conocimientos y filosofa del Usuario OLAP: Tecnologa que permite la explotacin de datos en diferentes niveles organizacionales y periodos de tiempo.

GRACIAS POR SU ATENCION

Вам также может понравиться