Академический Документы
Профессиональный Документы
Культура Документы
Sybase Confidential
Preguntas Iniciales
Cul es el objetivo del presidente de su empresa?
Aumentar y preservar el valor de la empresa para los accionistas
Aumentando ingresos
Vendiendo ms a nuevos clientes Vendiendo ms a clientes existentes
Preguntas Iniciales
Qu espera recibir el cliente de su empresa?
Productos y servicios de acuerdo a sus necesidades Interacciones consistentes independientemente del punto de contacto Algo que le agregue valor...
Valor Agregado
El valor tiene que ser percibido El valor tiene que ser reconocido como tal por el cliente Y, lo ms importante, el cliente tiene que estar dispuesto a pagar por l Si algn punto anterior no es verdadero, entonces no hay valor agregado para el cliente!
4
Aplicacin
Aplicacin
Aplicacin
Aplicacin
Aplicacin
5
Gerencia Ejecutiva
Finanzas
Cobro
Pedidos
Manufactura
Shipping
Contabilidad
Servicio al Cliente
7
Y a menores ciclos de negocio, ms variaciones En la prctica, hoy es imposible prever cmo los datos sern utilizados!
10
Corporativo
Datos Operacionales Datos Operacionales
Data Warehouse
Data Mart
Data Mart
Data Mart
DW Vs. ODS
Data Warehouse es un conjunto de datos
orientados a un tema
integrados
no-voltiles variables con el tiempo1
detallados1
Anlisis estratgico
Proyecciones, tendencias Segmentacin del mercado y clientes
Anlisis tctico
Gestin de campaas Servicio al cliente Just in time marketing
DW
ODS
12
1William
H. Inmon
Aplicacin
Aplicacin
Informix
Sybase Rep. Agent
Servidor
Aplicacin
Storage
. . . etc.
Aplicacin
Oracle
Data Warehouse/Marts Datos de clientes Servicios Web Adherencia regulatria
Aplicacin
Sybase
ASE
13
La primera pregunta que alguien de marketing hace, nunca es la pregunta correcta. Es un proceso iterativo de preguntas y respuestas para desarrollar insights acerca del negocio...
- Pete Estler, Presidente, EDS dbIntellect
15
Sybase IQ
Scan de Tablas
Sybase IQ
16
Sybase IQ
2 3
4 ..... 100
Db page 2-32kB
Db page 512kB
4 . 100
17
Forma Tradicional
Fecha Tienda Estado Clase Ventas
32 36 38 41 43 46 47 49
SP MG SP BA SP RJ DF SP
A A B A A B B A
6 9 5 11 9 3 7 12
La forma tradicional:
Selecciona-se un filtro, si disponible
en la tabla
Lem-se as pginas de dados e faz-se a soma das vendas -Los datos distribuidos aleatoriamente exigen ms lecturas de pginas -Los datos irrelevantes de las pginas tambin son ledos
18
800 Bytes por lnea Pginas de datos de 16K 10 Millones de lneas Son necesarios 500.000 I/Os
32 36 38 41 43 46 47 49
SP MG SP BA SP RJ DF SP
A A B A A B B A
6 9 5 11 9 3 7 12
Fecha
Tienda
Ventas
1/3/1996 32 1/3/1996 1/3/1996 36 1/3/1996 1/3/1996 38 1/3/1996 1/3/1996 41 1/3/1996 1/3/1996 43 1/3/1996 46 1/3/1996 1/3/1996 47 1/3/1996 1/3/1996 49 1/3/1996
1/3/1996
32 SP SP 36 MGMG 38 SP SP 41 BA BA 43 SP SP 46 RJ RJ 47 DF DF 49 SP SP
A A A B B A A A A B B B B A A
6 6 99 55 11 11 99 33 77 12 12
Beneficios: Sybase IQ puede reducir en ms de 90% los I/Os solo por eso
32 36 38 41 43 46 47 49
SP MG SP BA SP RJ DF SP
A A B A A B B A
6 9 5 11 9 3 7 12
21
ndices Bit-Mapped
da
row-id Clase
AL Ventas
BA
DF
ES
GO
MG
RJ
SP
2 6 8 1 3 6 7 9
SP MG SP BA SP RJ DF SP
1 A 2 A 3 B 4 A A 5 B 6 B 7 A 8
0 6 0 9 0 5 0 11 0 9 3 0 7 0 12 0
0 0 0 1 0 0 0 0
0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0
0 0 0 0 0 1 0 0
1 0 1 0 1 0 0 1
...
22
ndices Bit-Wise
Ventas en binario
Ventas
Ventas en binario
bit 8 bit 4 bit 2 bit 1
bit 8
bit 4
bit 2
bit 1
6 9 5 11 9 3 7 12
0 1 0 1 1 0 0
1 0 1 0 0 0 1
1 0 0 1 0 1 1
0 1 1 1 1 1 1
0 1 0 1 1 0 0 1
1 0 1 0 0 0 1 1
1 0 0 1 0 1 1 0
0 1 1 1 1 1 1 0
Agregaciones, Promedios y Ranges extremamente rpidos Los datos son comprimidos en hasta 80%
23
$$ $
requirido para RDBMS Clsico DBMS: (DB2, Oracle, MS SQL, NCR, File System )
$1K-$5K/TB
IQ:
=90%
Ahorro en storage
24
Sybase IQ corre en discos ATA con la misma velocidad de discos FC o SCSI Precios=$15K $2K-$5K/TB igual o menor que silos de cintas o pticos Lectura: 400 MB/sec [1.3 TB/h] 1,500 videos de alta definicin o 400 docs/s Proveedores de Storage ATA: Sun (3511, 6130), EMC (AX 100), HP, IBM
4 (100 mm)
25
Empresa C Empresa Z
1000s de usurios
IQ
Unix
SMP
IQ
IQ
Unix SMP
IQ IQ
Unix SMP FC DB
IQ
Unix SMP
26
CX array Primario
mark20
CX array Secondario
mark30
IQ Produc. Desall/Prueba
Snapshots
mark38 mark37
BCV
BCV - copia completa y sincronizacin reversa
Snapshots
Clone
mark10
IQ Produccin
Snap
Delta rollback
mark 11 mark 12
mark40
mark41 B/R de IQ de Produccin mark42 Snapshots Snapshots mark43 Snapshots Snapshots mark44
27
Validacin En Laboratorio
CX700 - 1
Servidores Sun Servidores Sun
200GB
200GB
200GB/h 200GB/h
mark31
100GB
200GB
mark10 10 TB
+400 GB/h (+6 GB/min) +400 GB/h (+6 GB/min)
mark30 200GB/h 10 TB
100GB
mark32
EMC CX 700
EMC CX 700
Servidores Sun
mark21
150GB
200GB/h 200GB/h
mark40 10 TB
Servidores Sun
mark41
mark42
mark22
100GB
mark20 10 TB
28
Backup local completo: (usando 100% clone) <60s Restore local completo: (usando 100% clone) <60s Failover local completo para 100% clone 0s (lectura) Backup remoto completo: (usando 100% clone) 30-60s Refresh remoto completo: (usando 100% clone) 1TB/h ? Restore remoto completo del primario: 1TB/h Restore remoto completo: (usando copia remota 5%-delta) <60s
29
Resumen
Soporte a VLDB
Paralelismo
Durante la carga y las consultas Escalabilidad virtualmente lineal (98%)
30
Resumen
Flexibilidad sin precedentes
Cualquier esquema (el esquema lgico no se traduce directamente en objetos fsicos)
Estrella, desnormalizado, normalizado, archivos o tablas planas con hasta 45.000 columnas (hasta 10.000 es el recomendado)
247
Carga on-line y en tiempo real
Resumen
Ahorro
Alta eficiencia en la utilizacin de disco (normalmente entre 70 e 80% del dato crudo) Mnima necesidad de intervencin del DBA que puede dedicarse a cosas ms nobles Arquitectura escalable con bajo costo de entrada UNIX (Sun, HP, IBM), Linux, Windows
Confiabilidad
Tecnologa de ms de 10 aos Ms de 8 aos en produccin (ms de 20 clientes en Chile, Consalud hace ms de 7 aos)
32
Sybase Confidential
Problema
Base con 700 GB almacenados y creciendo Muchos requerimientos hay que resolverlos en forma ad-hoc
Tiempos de respuesta de reportes demoran desde minutos a varias horas Existe dificultad en la posibilidad de realizar nuevos anlisis Estamos obligados a generar tablas con agregaciones de datos para mejorar algo la performance (igual con tiempos de respuesta alto).
34
Resultados
COMPRESIN DE DATOS Tamao base de datos IQ (incl. 2 ndices extras por columna) Tamao de las mismas tablas en Oracle (data+ndices) Factor de Compresin 2,43 veces menor IQ que Oracle 9i Relacin tamao Sybase IQ vs archivos planos = 77,3% 74,49 GB 180,89 GB
CARGA DIARIA DE DATOS TOTAL Proceso Carga Incremental BT_STOCK Sybase IQ TOTAL Proceso Carga Incremental BT_STOCK Oracle 9i 7 minutos 120 minutos
35
SEGUNDOS
100000 10000 1000 100 10
0,1
1h 29min
5340
16920
660
11 min
4h 42min
Oracle
SybaseIQ
Ag g_ p Ag rod g_ uct o_ p m Ag rod es uc g_ to pr _m Ag od es g_ uc to pr _m Ag od g_ uct es o_ re m Ag p_ e pr g_ od s st uc Ag ock t _p o_d g_ ro i vt du a BT a_ gr ct _b o up o oa _dia BT deg _m a_ _f or nu es e Bt ma _d va _f or e_ m a_ pag Bt _f or de_ o m pa a Bt g _v _d e_ o ta pa Bt s_d go ia _V ria ta s Bt s_D _v ia ta ria s Bt s_d _v ia ria ta Bt s_d s ia _v ri ta s_ a s C di ar ga aria s Ve De St nt oc a Ve Red k m nt ax as x 33 In D fo ia rm 0 p or Ve e C Di lo a nt as seUp Lo Ve c (D nt ia as al P No rod rio) (1 Ph u c 5 to ar D M m es IAS a ) M (0 F po 607 0 rv en 8) de do r lo c
36
al
Sybase Confidential
Lmites
38
Lmites
39