Вы находитесь на странице: 1из 15

E

D
S
E
N
E
C
A
5 .2 . 1 A L M
)
E
S
U
O
H
E
R
A
W
(
S
O
DAT

ALMACN DE DATOS (DATA WAREHOUSE)


Un almacn de datos es una base de
datos que almacena datos actuales e
histricos de posible inters para los
gerentes de la compaa.

Un

data warehouse tiene una


orientacincorporativa que pretende
conseguir
que
cualquier
departamento pueda acceder a
lainformacin de cualquiera de los
otros mediante un nico medio, as
como obligar aque los mismos
trminos tengan el mismo significado
para todos.

La

implementacin
incremental
reduce riesgos y
asegura que el
tamao del
proyecto
permanezcamane
jable en cada
fase.

PREPARACIN DE LOS DATOS (STAGING REA)

ES UNA COLECCIN DE PROCESOS QUE :

LIMPIAN
TRANSFORMAN
COMBINAN
PREPARAN

DATOS
ORIGINALES

ALMACEN DE
DATOS

EN

LA STAGINGREA LOS DATOS


ORIGINALES SON TRANSFORMADOS
AFORMATOS COMUNES, COMPROBADA
SU CONSISTENCIA Y SU INTEGRIDAD
REFERENCIAL, YPREPARADOS PARA
CARGAR EN LA BASE DE DATOS DEL
DATA WAREHOUSE.

UNA

VEZ LOCALIZADAS LAS


FUENTES DE DATOS, ESTOS SE
DEBEN PREPARAR PARA QUE SE
LESPUEDAN
APLICAR
LOS
MTODOS O HERRAMIENTAS QUE
CONSTRUIRN
EL
MODELO
DESEADO.

EN ESTE PUNTO HAY QUE ASEGURARSE DE UNAS


CUANTAS COSAS:
QUE LOS DATOS TENGAN LA CALIDAD SUFICIENTE: es decir, que no contenganerrores, redundancias
o que presenten otro tipo de problemas.

QUE LOS DATOS SEAN LOS NECESARIOS, quizs pase que no nos harn falta yquizs tendremos que
aadir.

QUE ESTN EN LA FORMA ADECUADA: muchos mtodos de construccin demodelos requieren que
los datos estn en un formato determinado que noha de coincidir necesariamente con el que
estn almacenados.

LAS TCNICAS UTILIZADAS PARA ASEGURAR LOS TRES


ASPECTOS COMENTADOS SON
LA LIMPIEZA DE DATOS

LA REDUCCION DE LA
DIMENSIONALIDAD

LA TRANSFORMACION DE LOS DATOS

LA LIMPIEZA DE DATOS, CONSISTE EN PROCESAR LOS DATOS ELIMINANDO LOS


ATRIBUTOSQUE SEAN ERRNEOS O REDUNDANTES, SIENDO LOS FACTORES DE
DISTORSIN MSIMPORTANTES:

1. DATOS INCOMPLETOS, PUEDE PASAR ESPECIALMENTE EN AQUELLOS

ATRIBUTOSEN QUE CUANDO SE DISE EL PROCESO CORRESPONDIENTE A LA


ENTRADA DEDATOS SE DECIDI QUE NO ERAN OBLIGATORIOS O QUE TENAN
FORMATO LIBRE.

2. DATOS REDUNDANTES, O REPETIDOS.


3. DATOS INCORRECTOS O INCONSISTENTES, MUY COMN CUANDO EL TIPO

DEVALORES QUE PUEDE RECIBIR UN ATRIBUTO NO EST CONTROLADO PORQUE


ESTDECLARADO COMO "TEXTO LIBRE".

TRANSFORMACIN DE DATOS ,
NO SIEMPRE LOS DATOS ESTN EN LA FORMA

MSADECUADA PARA PODER APLICAR LOS MTODOS


QUE HACEN FALTA PARA LA TAREA QUESE HA DE LLEVAR
A CABO Y EL MODELO QUE SE QUIERE OBTENER.

REDUCCIN DE LA DIMENSIONALIDAD
UNA DE LAS JUSTIFICACIONES MS FRECUENTESPARA LA

UTILIZACIN DE TCNICAS DE DATA MINING (EXPLORACIN


DE DATOS) ES SU CAPACIDAD PARA TRABAJARCON GRANDES
CONJUNTOS DE DATOS. AHORA BIEN EL TAMAO DE UN
CONJUNTO DEDATOS, O DE UN PROBLEMA DE DATA MINING, LA
DA TANTO LA CANTIDAD DE REGISTROSQUE TIENE COMO EL
NMERO DE ATRIBUTOS QUE SE MANEJAN.

MODELADO DEL ALMACN


En esta fase, varias tcnicas de
modelado son seleccionadas y
aplicadas y susparmetros son
calibrados a valores ptimos.

Se selecciona en funcin del problema la


tcnica a utilizar, en elcaso que nos ocupa
sobre el almacn construido se aplicarn
tcnicas de anlisis enlnea de la
informacin.
Una vez construido el modelo el diseador
interpreta el modelo de acuerdo a
susconocimientos del dominio y al criterio
de xito del proyecto.

QUINES Y PARA QU LO USAN?


Dadas las caractersticas de un sistema de Data Warehousing, su aplicacin puede

tener variados fines, en una diversidad de industrias. No obstante, en trminos


generales, podemos decir que su aplicacin ms rica corresponde a entornos de
empresas en los que se identifican grandes volmenes de datos, asociados a: cantidad
de clientes, variedad de productos y cantidad de transacciones.

CMO TRABAJA EL DATA


WAREHOUSE?

EXTRAE LA INFORMACIN
OPERACIONAL.

TRANSFORMA LA OPERACIN A
FORMATOS CONSISTENTES.

AUTOMATIZA LAS TAREAS DE LA

INFORMACIN PARA PREPARARLA A


UN ANLISIS EFICIENTE.

EN QU PODEMOS USARLO?
DE RELACIONES
DEMANEJO
MARKETING.
ANLISIS DE
RENTABILIDAD.
REDUCCIN DE COSTOS.

Вам также может понравиться