Академический Документы
Профессиональный Документы
Культура Документы
Expositor
INDICE
INTRODUCCIN
DEFINICIN INTELIGENCIA DE NEGOCIOS
TECNOLOGA UTILIZADA PARA HACER BI
OBJETIVOS BI
CICLO BI
ALMACN DE DATOS
ANLISIS MULTIDIMENSIONAL
PROCESAMIENTO ANALTICO EN LNEA
SERVICIO DE TRANSFORMACIN DE DATOS
INTRODUCCIN
EMPRESA
Directivos
Inteligen
cia de
Negocios
Estrategias
Organizacio
nales
Profesionales
del
Conocimiento
ar
Tom ne
s io
Deci
s
DEFINICIONES
INTELIGENCIA DE NEGOCIOS
Sistemas
Ejecutivos
de
Informacin
Sistemas de
Gestin de
Base de
Datos
Software OLAP
y
DATAMINING
OBJETIVOS BI
Buscar hechos
cuantitativos
medibles acerca
de la empresa
Usar mtodos y
tecnologas para
el anlisis de
hechos
Desarrollar
modelos que
expliquen la
causa-efecto de
las relaciones
entre las acciones
operacionales y
los efectos que
estas han
alcanzado en las
metas.
CICLO BI
El anlisis
comienza por
determinar los
datos a recopilar.
La medicin
evala los
resultados al
compararlos contra
los estndares y
las expectativas
planteadas
originalmente
La reflexin
implica el estudio
minucioso de los
hechos
La accin se da a
travs del proceso
de toma de
decisiones,
CARACTERSTICAS DEL AD
Datos primarios
Cualquier tipo de
datos
organizacin de
datos(archivo,
ndice, tabla o
bd)
nivel de
agregacin
(transaccin o
consolidado)
Servicios de
transformacin
de datos (DTS)
Modelo de
depsito de
datos
Acceso a fuentes
heterogneas de
datos por medio
de bsquedas,
extraccin,
conversin y
almacenamiento.
Es la
arquitectura de
almacenamiento,
acceso y
administracin
de los datos
importados por el
DTS.
PROCEDIMIENTO PARA
CONSTRUIR UN DW
Determinar los
requerimientos de
informacin del
negocio.
Creacin y
administracin del
modelo de depsito
de datos.
Establece las
actividades de
transformacin que
se aplican a los
datos primarios
Ubicacin de las
fuentes de
informacin.
ARQUITECTURA DE UN ALMACN
DE DATOS
14
EJEMPLO
Tiempo
Marca
Descripcin
Semana
Categora
Departamento
as
Tipo
Da
Trimestre
Ao
Ve
nt
Nro_producto
Mes
importe
unidades
Almacn
Ciudad
Regin
Tipo
Almacn
Esto es un datamart.
15
Producto
ARQUITECTURA DE UN ALMACN
DE DATOS
ARQUITECTURA DE UN ALMACN
DE DATOS
Semana
Descripcin
Categora
Mes
Da
Trimestre
Ao
Ve
nt
Tipo
Nro_producto
as
Departamento
Tiempo
Marca
importe
unidades
Ciudad
Regin
Tipo
Almacn
Almacn
16
Producto
Dimensiones (puntos de
vista) desde los que se
puede analizar la actividad.
ARQUITECTURA DE UN ALMACN
DE DATOS
Modelo multidimensional:
17
Descripcin
Tiempo
hecho
Marca
Semana
Categora
Departamento
Mes
Trimestre
Da
Ao
Ve
nt
as
Nro_producto
Tipo
18
importe
unidades
dimensin
Almacn
medidas
Ciudad
atributos
Tipo
Regin
Almacn
Producto
ARQUITECTURA DE UN ALMACN
DE DATOS
ARQUITECTURA DE UN ALMACN
DE DATOS
Entre los atributos de una dimensin se definen jerarquas
nro. producto
categora
departamento
Almacn
ciudad
regin
almacn
tipo
Tiempo
da
trimestre
mes
semana
ao
19
Producto
ARQUITECTURA DE UN ALMACN
DE DATOS
Este esquema multidimensional recibe varios nombres:
proyecto
tiempo
PERSONAL
equipo
VENTAS
20
ARQUITECTURA DE UN ALMACN
DE DATOS
Se pueden obtener hechos a diferentes niveles de agregacin:
HECHO: El primer
trimestre de 2004 la
empresa vendi en
Valencia por un importe
de 22.000 euros del
producto tauritn 33 cl.
LUGAR:
Murcia
Alicante
ciudad Zaragoza
Madrid
Ventas en
miles de
Euros
Barcelona
Valencia
PRODUCTO:
artculo
Jerarqua de dimensiones:
PRODUCTO
Categora
Cola 33cl. 57
Jabn Salitre 93
Gama
Tauritn 33cl 22
Cerveza Kiel 20 cl 5
1 2 3 4 1 2
2005
2004
TIEMPO:
trimestre
21
Prov.
/
Artculo
LUGAR
TIEMPO
Pas
Ao
Ciudad
Trimestre \
Supermercado
Mes Semana
\
/
Da
|
Hora
ARQUITECTURA DE UN ALMACN
DE DATOS
Se puede recopilar toda la informacin necesaria en un nico esquema
estrella o copo de nieve?
22
producto
tiempo
proveedor
VENTAS
lugar
producto
PRODUCCIN
lugar
tiempo
tiempo
equipo
PERSONAL
lugar
proyecto
producto
CAMPAA
tiempo
Almacn
formado por
4 datamarts.
ARQUITECTURA DE UN ALMACN
DE DATOS
El almacn de datos puede estar formado por varios datamarts y,
opcionalmente, por tablas adicionales.
23
Data mart
subconjunto de un almacn de
datos, generalmente en forma de
estrella o copo de nieve.
CARGA Y MANTENIMIENTO DE UN
A.D.
El sistema encargado del mantenimiento del almacn de datos es
el Sistema E.T.T* (Extraccin - Transformacin -Transporte)
26
CARGA Y MANTENIMIENTO DE UN
A.D.
E.T.T.
Correspondencia
27
Extraccin
Bases de datos
operacionales
Fuentes
Externas
Transporte
Transformacin
Almacenamiento
intermedio
Almacn de
datos
CARGA Y MANTENIMIENTO DE UN
A.D.
E.T.T.
Correspondencia
28
Extraccin
Transporte
Transformacin
Carga
Identificacin de los
datos que han cambiado
Extraccin (lectura) de
datos.
Obtencin de agregados
Mantenimiento de
metadata
Indizacin
Limpieza y transformacin
de datos
Obtencin de datos
agregados.
Integracin de datos
(clculo de datos derivados)
Realizacin de pruebas
de calidad de la carga.
Creacin de claves
Gestin de errores.
Obtencin de agregados
Mantenimiento de
metadata
Mantenimiento de
metadata
CARGA Y MANTENIMIENTO DE UN
A.D.
La calidad de los datos es la clave del
xito de un almacn de datos.
29
CARGA Y MANTENIMIENTO DE UN
A.D.
Extraccin.
30
Correspondencia
Extraccin
Bases de datos
operacionales
Almacenamiento
intermedio
Almacn de
datos
CARGA Y MANTENIMIENTO DE UN
A.D.
Extraccin: lectura de datos del sistema operacional.
b) mantenimiento del AD
Ejecucin de la extraccin:
a) si los datos operacionales estn mantenidos en un SGBDR, la
extraccin de datos se puede reducir a consultas en SQL o
rutinas programadas.
b) si los datos operacionales estn en un sistema propietario
(no se conoce el formato de los datos) o en fuentes externas
textuales, hipertextuales u hojas de clculo, la extraccin puede
ser muy difcil y puede tener que realizarse a partir de informes
o volcados de datos proporcionados por los propietarios que
debern ser procesados posteriormente.
31
CARGA Y MANTENIMIENTO DE UN
A.D.
Extraccin:
Identificacin de Cambios.
CARGA Y MANTENIMIENTO DE UN
A.D.
Transformacin.
33
Correspondencia
Transformacin
Bases de datos
operacionales
Almacenamiento
intermedio
Almacn de
datos
CARGA Y MANTENIMIENTO DE UN
A.D.
Transformacin.
34
12M65431
12M65431
12
65431
12
65431
12-m-65421
12-m-65421
12
65421
12
65421
12m65421
12m65421
12
65421
12m65421
12m65421
12M65431
12M65431
CARGA Y MANTENIMIENTO DE UN
A.D.
Transformacin.
35
cdigo zona de
del pas ventas
nmero de
producto
cdigo de
vendedor
CARGA Y MANTENIMIENTO DE UN
A.D.
Transformacin.
36
v, h
varn, hembra
CARGA Y MANTENIMIENTO DE UN
A.D.
Transformacin.
cm
cm
inches
DD/MM/YY
DD-Mon-YY
MM/DD/YY
1,000 GBP
USD 600
FF 9,990
37
CARGA Y MANTENIMIENTO DE UN
A.D.
Transformacin.
38
ACME Inc
ACME Inc
ACME Inc
ACME Inc
CARGA Y MANTENIMIENTO DE UN
A.D.
Transformacin.
39
Departamento
10
20
30
40
Emp
1099
1289
1234
6786
Nombre
Smith
Jones
Doe 50
Harris
Departamento
10
20
60
CARGA Y MANTENIMIENTO DE UN
A.D.
Transformacin. Creacin de claves.
Venta
1/2/98
$10.00
#2
Venta
1/2/98
$15.00
#3
Venta
1/2/98
$12.00
#4
Devolucin 1/2/98
#5
Venta
1/2/98
- $12.00
$11.00
40
#1
CARGA Y MANTENIMIENTO DE UN
A.D.
Transporte. (carga)
41
CARGA Y MANTENIMIENTO DE UN
A.D.
Transporte. Creacin y mantenimiento de un AD.
42
Base de datos
operacional
T1
T2
T3
CARGA Y MANTENIMIENTO DE UN
A.D.
Procesos posteriores a la carga: indizacin.
43
Durante la carga:
carga con el ndice habilitado
proceso tupla a tupla. (lento)
Despus de la carga:
carga con el ndice deshabilitado
creacin del ndice (total o parcial). (rpido)
Index
Base de datos
operacional
Almacn
de datos
CARGA Y MANTENIMIENTO DE UN
A.D.
Procesos posteriores a la carga: obtencin de agregados.
Extraccin
Base de datos
operacional
44
Durante la extraccin.
Despus de la carga (transporte).
Transporte
Almacenamiento
intermedio
Almacn de
datos
45
47
Actividad: Ventas.
48
49
m1
i
D
id_dim1
m3
i
D
tabla
Dimensin 3
id_dim2
id_dim3
tabla
Dimensin 2
m2
i
D
...
id_dim n
....
(hechos)
mn
i
D
tabla
Dimensin n
50
tabla
Dimensin 1
tabla de
hechos
Grnulo:
define el significado de las tuplas de la tabla de hechos.
determina las dimensiones bsicas del esquema.
pro
c
du
to
producto
da
almacn
ac
m
l
a
ventas
p
i em
52
c
du
to
p
it em
producto
da
53
almacn
ac
m
l
a
ventas
tabla de id_producto
hechos id_fecha
id_almacn
.....
.....
......
Tiempo
54
id_dim1
....
rib
t
(a
)
s
o
ut
55
tabla
Dimensin 1
definicin de
grnulo
dimensiones
bsicas
producto
establecimiento
56
tiempo
57
jerarqua natural:
da - mes - trimestre -ao
58
59
60
Establecimiento
Producto
id_establec
id_producto
da
nro_establec
nro_producto
semana
nombre
descripcin
mes
direccin
marca
ao
distrito
subcategora
da_semana
ciudad
categora
da_mes
pas
departamento
trimestre
tlfno
peso
festivo
fax
unidades_peso
....
superficie
tipo_envase
tipo_almacn
diettico
...
...
61
id_fecha
Establecimiento
id_fecha
id_establec
da
Producto
mes
id_producto
ao
nro_producto
da_semana
descripcin
da_mes
marca
trimestre
subcategora
festivo
categora
....
nombre
direccin
distrito
ciudad
pas
tlfno
Ventas
fax
departamento
id_fecha
superficie
peso
id_producto
tipo_almacn
unidades_peso
id_establec
...
tipo_envase
...
diettico
...
...
...
62
nro_establec
semana
Precio
Unidades
Importe
....
63
Establecimiento
id_fecha
id_establec
da
Producto
mes
id_producto
ao
nro_producto
da_semana
descripcin
da_mes
marca
trimestre
subcategora
festivo
categora
....
nombre
direccin
distrito
ciudad
pas
tlfno
Ventas
fax
departamento
id_fecha
superficie
peso
id_producto
tipo_almacn
unidades_peso
id_establec
...
tipo_envase
importe
diettico
unidades
...
nro_clientes
65
nro_establec
semana
evitar normalizar.
incluir la dimensin Tiempo.
dimensiones que cambian.
definicin de agregados.
66
evitar normalizar.
68
Evitar normalizar:
el ahorro de espacio no es significativo
se multiplican los JOIN durante las consultas.
69
definicin de agregados.
71
LNEAS DE INVESTIGACIN
ABIERTAS
Resmenes:
Widom, J. Research problems in data warehousing
Actas de la International Conference on Information and Knowledge
Management (CIKM95), ACM Press. 1995
72