Академический Документы
Профессиональный Документы
Культура Документы
DE NEGÓCIOS
Asterio K. Tanaka
http://www.uniriotec.br/~tanaka/SAIN
tanaka@uniriotec.br
Introdução a OLAP
Material baseado em originais de Maria Luiza Campos – NCE/UFRJ
Atualizado com publicações recentes referenciadas no texto
Asterio K. Tanaka
On Line Analytical Processing
OLAP
• Visão multidimensional de dados
– Estrutura relacional x visão dimensional
– Hierarquias de dimensões
– Agregados
– Problema com agregações: armazenar ou calcular?
• Ferramentas OLAP
– As doze regras de Codd
– Operações dimensionais para OLAP
» Slice & Dice, Drilling, Rotação, etc.
– Tipos de OLAP: MOLAP, ROLAP, HOLAP
Asterio K. Tanaka
Visão multidimensional de dados
Asterio K. Tanaka
Estrutura Relacional
Quantidade de vendas de carros por Modelo e Cor
(do revendedor MAICAR no mês de Janeiro/2014)
Asterio K. Tanaka
Visão matricial ou (bi)dimensional
Quantidade de vendas de carros por Modelo e Cor
(do revendedor MAICAR no mês de Janeiro/2014)
Asterio K. Tanaka
Visão (tri)dimensional - Cubo
Quantidade de Vendas de Carros por Modelo, Cor e Revendedor
no mês Janeiro/2014
M
O 2 4 7
Coupe
D REVENDEDOR
E Mini Van 6 2 3
L Ronycar
O Sedan 6 2 1 Recreio
Maicar
Azul Branco Prata
COR
Asterio K. Tanaka
Visão (tri)dimensional - Cubo
Quantidade de Vendas de Carros por Modelo, Cor e Revendedor
no mês Janeiro/2014
Asterio K. Tanaka
Mais colunas de dimensões ...
Asterio K. Tanaka
Mais de Três Dimensões? Hipercubos
Quantidade de Vendas de Carros
por Modelo, Cor, Revendedor e Mês
REVENDEDOR
M
O
D
Coupe 2 4 7 Coupe Coupe
E
L Mini Van 6 2 3 Mini Van Mini Van
Ronycar
Ronycar Ronycar Recreio
O Sedan 6 2 1 Recreio
Maicar
Sedan Recreio
Maicar
Sedan
Azul Branco Prata
Maicar
Azul Branco Prata Azul Branco Prata
COR COR
Asterio K. Tanaka
Níveis nas dimensões ou Hierarquias
Brasil
Total de Vendas do Produto Alfa Sul Sudeste Nordeste
RS SC PR SP MG RJ ES BA SE ---
Janeiro 1 5 5 2 5 1 --- --- ---
Trimestre 1 Fevereiro 5 9 8 5 6 4 --- --- ---
Março 2 6 9 4 5 --- --- ---
Abril 6 3 2 5 --- --- ---
Trimestre 2 Maio 3 4 3 5 --- --- ---
Junho 8 4 5 3 5 --- --- ---
2013
Julho 9 2 4 7 4 --- --- ---
Trimestre 3 Agosto 2 6 --- --- ---
Setembro 5 7 5 6 3 --- --- ---
Outubro 2 3 7 9 6 --- --- ---
Trimestre 4 Novembro 1 8 4 8 8 --- --- ---
Dezembro 2 9 9 2 7 --- --- ---
Janeiro --- --- --- --- --- --- --- --- --- ---
Trimestre 1 Fevereiro --- --- --- --- --- --- --- --- --- ---
2014
Março --- --- --- --- --- --- --- --- --- ---
--- --- --- --- --- --- --- --- --- --- --- ---
Asterio K. Tanaka
Agregados
Produto
Trimestre
XPTO
...
XPTA
Estado
ES
XPTN SP
RJ Agregados são dados derivados,
ç o ril io isto é, calculados sobre os dados
ar Ab Ma ... básicos (somas, médias, etc.)
M
Mês
Asterio K. Tanaka
Problema com Agregações (1)
Calcular
Calcularos
osagregados
agregadosno
no momento
momento
da
darecuperação
recuperaçãoou
ouarmazená-los?
armazená-los?
Armazenamento Tempo de
X Resposta
BD1
s/ agr
Armazenamento Tempo de
X Resposta
BD2
nBD1
agr
BD1
BD2
Asterio K. Tanaka
Problema com Agregações (3)
Armazenamento Tempo de
X Resposta
BD3
n+k
BD2agr
BD1
BD3
BD1
BD2
Asterio K. Tanaka
Problema com Agregações (4)
Armazenamento Tempo de
X Resposta
BD4
BD3
todos osBD2
possíveis
BD1
agregados
BD4
BD3
BD1
BD2
Asterio K. Tanaka
A Síndrome da Explosão no
Volume de Dados
70000
65536
Número de Agregações
60000
50000
40000
30000
20000
16384
10000
4096
0 16 64 256 1024
2 3 4 5 6 7 8
Número de Dimensões
(supondo 4 níveis em cada dimensão)
Asterio K. Tanaka
Hierarquias e Agregados
Consultas
Produto Tempo Lugar
Select ---
From ---
Group by ---
Marca Ano País
Vendas por
Produto,
Marca,
Categoria Trimestre Região Trimestre
Ano e
eRegião
Região
Asterio K. Tanaka
Ferramentas OLAP
• OLAP: On Line Analytical Processing
– Conjunto de técnicas para tratar informações contidas em DW.
– Visão Multidimensional dos Dados
• Termo proposto por E.F. Codd, em 1993
– Providing OLAP to User-Analysts: An IT Mandate.
• “Doze Regras de Codd” para ferramentas OLAP:
– Visão conceitual multidimensional
– Transparência
– Acessibilidade
– Desempenho de Informações consistentes
– Arquitetura Cliente Servidor
– Dimensionalidade genérica
– Manipulação de dados dinâmicos
– Suporte a multiusuários
– Operações ilimitadas em dimensões cruzadas
– Manipulação intuitiva de dados
– Flexibilidade nas consultas
– Níveis de dimensão e agregação ilimitados
Asterio K. Tanaka
“Doze Regras de Codd” para ferramentas OLAP
Asterio K. Tanaka
“Doze Regras de Codd” para ferramentas OLAP
• Arquitetura Cliente Servidor
– OLAP deve ser construída em arquitetura C/S para que possa
atender a qualquer usuário em qualquer ambiente operacional
• Dimensionalidade genérica
– Deve ser capaz de tratar informações em qualquer
quantidade de dimensões
• Manipulação de dados dinâmicos
– Devido ao grande volume de informações armazenadas nas
diversas dimensões de um modelo multidimensional, é
comum a esparsidade dos dados, e então essas células nulas
devem ser tratadas para evitar custos com memória.
• Suporte a multiusuários
– Nas grandes organizações, é comum vários analistas
trabalharem com a mesma massa de dados.
Asterio K. Tanaka
“Doze Regras de Codd” para ferramentas OLAP
Asterio K. Tanaka
Operações OLAP
• Ferramentas OLAP fornecem suporte para funções
de análise de dados, típicas de aplicações avançadas
de planilhas eletrônicas.
• Operações dimensionais de ferramentas OLAP:
– Slice and Dice (Ponto, Plano, Cubo)
– Rotation (Rotação ou Pivotamento)
– Drilling
» Drill Down
» Drill Up (Roll Up)
» Drill Across (Drill Around)
» Drill Through
– Ranking (Classificação por uma coluna - “Top N”)
Vide Wikipedia
http://en.wikipedia.org/wiki/OLAP_cube
http://en.wikipedia.org/wiki/Online_analytical_processing
Asterio K. Tanaka
Operadores Dimensionais (sobre “cubos de dados”)
Asterio K. Tanaka
Operadores Dril Down e Drill Up (Roll Up)
Drill-down
Asterio K. Tanaka
Operadores Drill Across e Drill Through
Drill
Across
Drill Sistema
Through OLTP
http://www.kimballgroup.com/1996/03/01/drilling-down-up-and-across/
Asterio K. Tanaka
Tipos de ferramentas OLAP
• OLAP Multidimensional (MOLAP)
– Utilizam estrutura de dados multidimensional e permitem a navegação pelos
níveis de detalhamento em tempo real.
– O BD e o SGBD são multidimensionais
– Estrutura de dados é um array com um número fixo de dimensões. O
(hiper)cubo é uma metáfora visual, onde as dimensões coexistem para todo
ponto e são independentes entre si.
• OLAP RELACIONAL (ROLAP)
– Decorrência do uso consagrado de SGBDs relacionais nos BDs operacionais
(transacionais), com as vantagens da tecnologia aberta e padronizada
(SQL).
– Utiliza os metadados no apoio à descrição do modelo de dados e na
construção de consultas. Através de uma camada semântica acima do
esquema relacional, os dados são apresentados ao usuário com visão
multidimensional.
• OLAP HÍBRIDO (HOLAP)
– Tendência dos modernos SGBDs relacionais de adicionar uma arquitetura
multidimensional para prover facilidades a ambientes de suporte a decisão.
– Proporciona o desempenho e flexibilidade de um BD multidimensional e
mantém a gerenciabilidade, escalabilidade, confiabilidade e acessibilidade
conquistadas pelos BDs relacionais.
http://en.wikipedia.org/wiki/Comparison_of_OLAP_Servers
Product Reviews: http://www.bi-verdict.com/the-bi-verdict-content/products-covered/
Asterio K. Tanaka
A seguir ???
Modelagem
Processo Dimensional
de ETL de DW
Meta Dados
FERRAMENTAS
FONTES DE DADOS DE CONSULTA
OLAP
Análise
Extração
Transformação
BDs Operacionais Data Mining
Carga Data Warehouse
Atualização
Relatórios
Fontes Externas