Вы находитесь на странице: 1из 25

Data Mining ETL - OLAP

Integrantes:
Soto , Anthony
Condor Alvarado, Carlos
Hiplito Melgarejo, Edwin
Cristian

Para poder hacer todo esto utilizaremos el SQL server

Tenemos que tener el data mark debidamente poblado para poder


adjuntar la base de datos

Aqu verificamos que las tablas estn creadas y debidamente pobladas de


datos

Para el siguiente paso utilizaremos el visual studio creando un nuevo


proyecto de tipo analisys service.

Aqu se crearon los cubos olap y seguidamente tenemos que


enlazarlo a la base de datos.

Esta es la forma de como enlazar con


sql server

Ahora seleccionaremos las vistas de las tablas que tablas


deseas representar

Ahora visualizamos las tablas y seguidamente creamos nuestros


cubos con las dimensiones respectivas.

Despus de crear los cubos pasamos a procesar.

Despus de procesar arrastramos las tablas que queremos


graficarlos y seguidamente utilizamos como un visualizador a
Excel.

Al usar Excel ponemos en datos y otras fuentes


como analisys service.

ETL (Extract,
Transform and Load)
El sistema encargado del mantenimiento del
almacn de datos es el Sistema E.T.L
(Extraccin - Transformacin - Carga) o E.T.T
(Extraccin - Transformacin -Transporte)
La construccin del Sistema E.T.T es
responsabilidad del equipo de desarrollo del
almacn de datos.
El
Sistema
E.T.T
es
construido
especficamente para cada almacn de datos.
Aproximadamente 50% del esfuerzo.
En la construccin del E.T.T se pueden utilizar
herramientas del mercado o programas
diseados especficamente.

Funciones de las Herramientas ETL

Ejecucin de la extraccin:
Si los datos operacionales estn en un
sistema propietario (no se conoce el
formato de los datos) o en fuentes
externas textuales, hipertextuales u
hojas de clculo, la extraccin puede
ser muy difcil y puede tener que
realizarse a partir de informes o
volcados de datos proporcionados
por los propietarios que debern ser
procesados posteriormente.
Extraccin: en el mantenimiento /
refresco del DW.
Antes de realizar la extraccin es
preciso Identificar los Cambios.

Mtodos
Carga total: cada vez se empieza de cero.
Comparacin de instancias de la base de datos
operacional.
Uso de marcas de tiempo (time stamping) en
los registros del sistema operacional.
Uso de disparadores en el sistema operacional.
Uso del fichero de log (gestin de
transacciones) del sistema operacional.
Uso de tcnicas mixtas.

Limpieza de datos: eliminar


datos, corregir y completar
datos, eliminar duplicados
Estandarizacin: codificacin,
formatos, unidades de
medida, etc.
Integridad Referencial

Empresas que usan ETL


Sorteo de Visas.Com
Sincronizacin de la informacin de sus 75 oficinas a nivel nacional
De Microsoft Access y SQL Server a MySQL alojado en un servidor de
EEUU
Herramienta Bi-Tool
Laboratorios Grunenthal Peruana
Implementacin de su DatawareHouse
De DB2/400 (Alojada en Chile), Archivos de Texto, Data Entry,Excel a
Oracle 9i
Herramienta Bi-Tool
Interbank
Implementacin de su DatawareHouse
De DB2/400 a Oracle
Herramienta Clover

Вам также может понравиться