Вы находитесь на странице: 1из 17

RAFAEL PITON

Glossrio
de

BUSINESS
INTELLIGENCE
64 termos que um bom
profissional de BI deve saber
Glossrio de Business Intelligence

INTRODUO

O Glossrio de Business Intelligence tem 64 termos com as Como usar?


suas definies.
O glossrio pode ser usado tanto como um ponto de partida
Tudo de forma simples e direta, para voc poder consultar e para quem est comeando como um material de consulta
tirar suas dvidas. para quem j atua na rea.

As definies comeam em conceitos bsicos e vo at os


mais avanados.
Ao longo do e-book voc vai encontrar links em azul para
acessar mais contedo. 2
Voc pode usar ele da forma que melhor se adequar ao seu
E no topo das pginas voc vai encontrar links para acessar
nvel de conhecimento:
as redes sociais, onde pode encontrar mais contedos como
esse.
Ler todo o glossrio para comear a aprender

Conhecer novos termos

Descobrir o que voc ainda no conhece e precisa estudar

Consultar sempre que cruzar com alguma palavra nova

RAFAEL PITON .com


Glossrio de Business Intelligence

NDICE

BI / Business Intelligence / Inteligncia de Negcio 5 Data Integration 8


Dashboard 5 ETL 8
Mtrica 5 Stage Area 8
KPI 5 Data Analysis (OLAP) 8
Dado 5 Data Visualization 8
Informao 6 Surrogate key 8

Conhecimento 6 Primary Key 9 3


Sabedoria 6 Natural key 9

Data Source 6 SQL 9


Data Warehouse 6 Reporting 9
Data Mart 6 Cubo 9
Big Data 7 Analysis OLAP 9
Data Mining / Minerao de Dados 7 Ad-hoc 10
Web Analytics 7 Pivot 10
Agile Data Warehouse Design 7 Slice e Dice 10
Gro 7 Drill up / Roll-up 10
Granularidade 7 Drill down 10

RAFAEL PITON .com


Glossrio de Business Intelligence

Drill through / perfurar os dados 10 Fato Consolidada 13

Dados normalizados 10 Fato Snapshot Peridico 14


Dados desnormalizados 11 Fato Snapshot Acumulado 14
Modelagem dimensional 11 Fato Sem Fato / Factless Fact Tables 14

Schema 11 Dimenso Hierrquica 14

Star Schema / Modelo Estrela 11 Dimenso Degenerada / Degenerate Dimension 15

Snowflake Schema / Modelo Floco de Neve 11 Static Dimension 15 4


Fact Constellation Schema / Modelo Constelao de Fatos 11 Slowly Changing Dimension 15

Tabela Fato 12 Dimenso No Qualificada 15

Tabela Dimenso 12 Role-Playing Dimension 16


Atributo 12 Conformed Dimension 16
Mtrica Aditiva 12 Junk Dimension 16

Mtrica Derivada 12 BUS Matrix 16

Mtrica Semi-aditiva 13
Mtrica No-aditiva 13

Fato Transacional 13

Fato Agregada 13

RAFAEL PITON .com


Glossrio de Business Intelligence

GLOSSRIO

BI / Business Intelligence / Inteligncia de Negcio Mtrica


Um conjunto de tcnicas e conceitos. Esse processo passa Tudo que a empresa for mensurar uma mtrica. Elas so
por coleta, organizao e anlise dos dados, elaborao de utilizadas para metrificar algo e so sempre nmeros, porque
relatrios ou dashboards e todo o acompanhamento, possi- precisam ser contveis. Esses nmeros so provenientes de
bilitando a tomada de deciso inteligente utilizando dados transaes da empresa.
passados.
Veja mais em: Tipos de mtricas
IMPORTANTE: BI conceito e no ferramenta.
Veja mais em: O que BI? KPI / Key Performance Indicator / Indicador-chave de 5
Desempenho
ndice para medir percentualmente as variaes que ocorrem
Dashboard na empresa.

Uma das ferramentas de visualizao de dados. um painel IMPORTANTE: diferente de mtrica.


que apresenta visualmente as informaes mais importantes
e necessrias para a tomada de deciso.
Dado
Uma pequena parte sem contexto da informao, que sozi-
nho no faz sentido.

RAFAEL PITON .com


Glossrio de Business Intelligence

Informao Data Source


Dados agrupados, organizados e lapidados com o objetivo So as planilhas, ERPs, CRMs, etc, locais de onde os dados
de tomar decises inteligentes. so retirados para serem inseridos no Data Warehouse. Os
data source so geralmente compostos por dados estrutura-
dos ou semiestruturados, onde no se pode ter redundn-
Conhecimento cia, e so modelados para a insero e edio dos dados,
no para a consulta.
Interpretao das informaes geradas que possibilita o
aprendizado com elas. Veja mais em: Business Intelligence Framework 6

Sabedoria Data Warehouse


Toma decises com base no leque de conhecimento. Um repositrio de dados. quem centraliza os dados da
empresa e elimina os rudos de comunicao entre os
departamentos, deixando tudo unificado. O objetivo princi-
pal do Data Warehouse garantir a entrega de dados confi-
veis para dar suporte tomada de deciso.

Veja mais em: O que um Data Warehouse?

Data Mart
Uma parte do Data Warehouse que abrange determinado
assunto ou departamento.
RAFAEL PITON .com
Glossrio de Business Intelligence

Big Data Agile Data Warehouse Design


Uma grande quantidade de dados no estruturados, como Uma metodologia de desenvolvimento gil para criao de
dados de redes sociais, web logs e dados de texto. No BI ele Data Warehouse. A ideia diminuir as horas de reunies
entra como mais uma fonte de dados, que precisa passar improdutivas e focar nos requisitos que realmente precisam
pelo processo de transformao e ser armazenados no Data ser levantados para desenhar o Data Warehouse.
Warehouse para ser analisado.
Veja mais em: BI vs. Big Data Veja mais em:
Passo a passo para modelar um Data Warehouse
7
Data Mining / Minerao de Dados
Enquanto o BI supre as necessidades j conhecidas do neg- Gro
cio, o Data Mining busca por informaes que no esto O menor nvel da hierarquia da dimenso. a informao
sendo monitoradas ainda, percorrendo os dados em busca base, o menor detalhe da informao.
de padres e anomalias.

Web Analytics Granularidade


Coleta de dados de navegao e interao e anlise sobre a O nvel de detalhamento do dado. Alta granularidade o
experincia de usurios em um site com o objetivo de otimi- gro, o menor nvel do dado.
zar seu uso.

RAFAEL PITON .com


Glossrio de Business Intelligence

Data Integration Data Analysis (OLAP)


Estgio onde acontece o ETL / EL-T. a etapa onde os dados Onde entram os cubos e as anlises comeam a ser feitas,
so retirados das fontes de origem, transformados de forma identificando padres e fazendo projees. Tudo em tempo
que faam sentido juntos e inseridos no Data Warehouse. de execuo. Serve para analisar e identificar padres passa-
dos e problemas futuros.

Veja mais em: Business Intelligence Framework


ETL / Extract, Transform, Load / Extrair, Transformar,
Carregar 8
Processo de extrair os dados do data source, transformar e Data Visualization
carregar no Data Warehouse ou Stage Area.
Etapa onde a informao apresentada, com dashboards,
grficos e reports.

Stage Area Veja mais em: Business Intelligence Framework


Uma rea temporria que geralmente est em um banco de
dados relacional e fica desacoplado da origem. Ela tem Surrogate key
tabelas soltas e sem relacionamento, onde os dados so
transformados para serem enviados ao Data Warehouse. A Surrogate Key nada mais que o campo de Primary Key
da dimenso, uma chave artificial e auto incremental. a
Veja mais em: Business Intelligence Framework chave utilizada para conectar a dimenso na fato.

Veja mais em: Para que serve a Surrogate Key?


RAFAEL PITON .com
Glossrio de Business Intelligence

Primary Key Cubo


Coluna utilizada para identificar cada linha da tabela de Serve para manipular e analisar um grande volume de dados
forma nica. Garante a integridade dos dados. sob mltiplas perspectivas e hipteses. Os Cubos permitem
filtrar, cortar e pivotar os dados em tempo real, como em
uma tabela dinmica.
Natural key
IMPORTANTE: cubo conceito.
A Natural Key uma chave utilizada na dimenso que serve
para identificar o cdigo daquele dado na origem, de onde 9
ele foi retirado.

SQL / Structured Query Language / Analysis OLAP


Linguagem de Consulta Estruturada
So formatos de cubos.
OLAP = Online analytical processing / Processamento anal-
Linguagem utilizada para realizar consultas em banco de
tico em tempo real (online)
dados relacional.
IMPORTANTE: OLAP a tecnologia utilizada no cubo.
Reporting
Transforma uma variedade de fontes de dados em informa-
es compreensveis que possam ser apresentadas em
diversos formatos.

RAFAEL PITON .com


Glossrio de Business Intelligence

Ad-hoc Drill down


Quando o usurio final tem acesso ao cubo e pode montar Quando voc desce no nvel de hierarquia do dado, aumen-
suas prprias anlises. Normalmente o usurio de negcio tando a granularidade e o nvel de detalhamento.
recebe uma tela em branco com o cubo e monta suas anli-
ses selecionando as tabelas que precisa, tambm conhecido
como Self-service BI e Data Discovery. Drill through / perfurar os dados
Ao invs de mover verticalmente, como drill down e drill up,
Pivot o drill through se move horizontalmente, passando de um
10
relatrio para outro enquanto analisa a mesma amostra de
Cruzar os dados no cubo, explorando combinaes e possi-
dados.
bilitando novas perspectivas para anlise.

Dados normalizados
Slice e Dice Dados que esto na terceira forma normal, utilizada em
Operaes que criam um novo sub-cubo a partir de uma banco de dados relacional. Eles permitem um armazena-
seleo de dados do cubo original. mento consistente e acesso eficiente aos dados. Esse estilo
de banco tem como foco inserir, alterar e deletar os dados.

Drill up / Roll-up
Quando voc sobe no nvel de hierarquia do dado, dimi-
nuindo a granularidade e o nvel de detalhamento.

RAFAEL PITON .com


Glossrio de Business Intelligence

Dados desnormalizados Star Schema / Modelo Estrela


Dados organizados de forma a melhorar o desempenho das O modelo estrela composto no centro por uma tabela fato
consultas. No garante a consistncias dos dados e deixa o que rodeada por dimenses. E por isso tem o nome de Star
banco maior que com os dados normalizados. Schema, porque parece uma estrela.

Veja mais em: O que Star Schema?

11
Modelagem dimensional Snowflake Schema / Modelo Floco de Neve
Uma forma de modelagem de dados que busca simplificar o O modelo Snowflake tambm tem uma tabela fato rodeada
banco de dados e tornar as consultas mais rpidas para por dimenses, mas segue o princpio de normalizar as
sistemas de apoio deciso. dimenses, removendo atributos de baixa cardinalidade e
criando tabelas separadas.
Veja mais em: O que modelagem dimensional?
Fact Constellation Schema /
Modelo Constelao de Fatos
Schema Modelo com mltiplas tabelas fato que compartilham
uma descrio lgica de todo o banco de dados. dimenses, tambm conhecido como Galaxy Schema.

RAFAEL PITON .com


Glossrio de Business Intelligence

Tabela Fato Atributo


A principal tabela do Data Warehouse, ela fica no centro do So os campos das dimenses e servem para qualificar as
Star Schema e rodeada por dimenses. A tabela fato arma- mtricas, porque elas sozinhas na fato no fazem sentido.
zena o que ocorreu, o fato propriamente dito.
A fato armazena 2 coisas:
Mtrica Aditiva
As mtricas
As chaves das dimenses So as mtricas que permitem operaes matemticas
como soma e subtrao por todas as dimenses. Dentro da
fato h diversas linhas, e as mtricas aditivas devem poder 12
Veja mais em: Tipos de fatos somar todas elas. Ela tem que fazer um cruzamento comple-
to e perfeito na linha da fato, ento a mtrica precisa fazer
Tabela Dimenso sentido com cada uma das dimenses sozinha.

Descreve o fato ocorrido, ela contm as caractersticas do Veja mais em: Tipos de mtricas
evento. Ela vai qualificar, classificar ou descrever as mtricas
que esto na fato. Mtrica Derivada
A dimenso armazena 3 coisas:
A Surrogate Key uma mtrica calculada. Esse clculo sempre em cima de
A Natural Key mtricas que j esto na fato, no no que est no legado
Os atributos
Veja mais em: Tipos de dimenses Veja mais em: Tipos de mtricas

RAFAEL PITON .com


Glossrio de Business Intelligence

Mtrica Semi-aditiva Fato Agregada


Mtricas que podem ser somadas por todas as dimenses uma fato que consolida informaes de uma outra fato em
exceto a tempo. Voc s vai conseguir somar pela tempo se um tempo diferente. Ela serve para quando voc no quer
colocar um filtro que diga que s seja usado o ltimo regis- analisar o tempo no nvel do gro.
tro.
IMPORTANTE: essa fato tem a funo de acelerar o
Veja mais em: Tipos de mtricas desempenho das consultas.
Veja mais em: Tipos de fatos
13
Mtrica No-aditiva
So mtricas tipo percentual, algum clculo feito em tempo
de execuo, e no podem ser somadas por nenhuma
dimenso.
Veja mais em: Tipos de mtricas
Fato Consolidada
Fato Transacional Serve para consolidar duas fatos, mas no feito nenhum
join com elas. No processamento do ETL, na hora de carre-
Fatos transacionais so as mais comuns. A maioria dos gar a fato, voc vai carregar uma, carregar a outra, e misturar
bilhes de linhas que temos no Data Warehouse so de as duas.
tabelas fato transacionais. Elas geralmente utilizam mtricas
aditivas. IMPORTANTE: o gro das fatos precisa ser o mesmo.
Veja mais em: Tipos de fatos Veja mais em: Tipos de fatos

RAFAEL PITON .com


Glossrio de Business Intelligence

Fato Snapshot Peridico Fato Sem Fato / Factless Fact Tables


Uma fato com fotografias de uma outra fato em determina-
uma fato sem mtricas. Serve para fazer uma interseco
do momento no tempo.
de dimenses. s vezes voc precisa comparar ou cruzar
Ex: se a fato original for trabalhada no minuto, a fato snap-
algo somente entre duas dimenses e no tem uma mtrica
shot peridico pode ser no dia.
para fazer essas comparaes.
Veja mais em: Tipos de fatos
IMPORTANTE: essa fato a exceo, s usada quando se
precisa fazer uma interseco entre as dimenses. 14
Veja mais em: Tipos de fatos

Fato Snapshot Acumulado


Essa fato vai ser dividida em etapas de atualizao (que no
update na fato). A fato snapshot acumulado tambm faz Dimenso Hierrquica
uma fotografia de outra fato, mas em mais de um momento.
Uma forma hierrquica de organizar os dados nas dimen-
Veja mais em: Tipos de fatos ses. comum existir apenas uma hierarquia por dimenso,
mas no erro ter duas na mesma. A contagem de nveis
comea no gro, que o nvel zero e ento vai subindo.

Veja mais em: Tipos de dimenses

RAFAEL PITON .com


Glossrio de Business Intelligence

Dimenso Degenerada / Degenerate Dimension Slowly Changing Dimension


a dimenso que no mereceu ser uma dimenso e foi uma tcnica para atualizar a dimenso.Todas as dimenses
inserida como coluna na fato. so SCD, porque elas vo precisar ser atualizadas para se
manterem sincronizadas com o transacional. A nica exce-
Veja mais em: Tipos de dimenses o so as Static Dimensions, que so chamadas de SCD tipo
0, porque depois que os dados forem inseridos, no mais
Static Dimension necessrio atualizar.
Dimenses que no so extradas do legado, mas criadas
para o prprio Data Warehouse. Normalmente so carrega- Veja mais em: Tipos de dimenses 15
das manualmente ou geradas atravs de um processo. So
dimenses como as de tempo, data ou cdigo de status.
Dimenso No Qualificada
Veja mais em: Tipos de dimenses
Existem dois tipos de dimenses no qualificadas, a que no
foi identificada e a que no se aplica.
Se for nulo: -1 No identificado
Essa acontece quando voc no encontra na dimenso a
informao que vem l do legado.
Se no deve cruzar: -2 No se aplica
Essa acontece quando voc no quer monitorar algum
dado.
Veja mais em: Tipos de dimenses

RAFAEL PITON .com


Glossrio de Business Intelligence

Role-Playing Dimension Junk Dimension


No Data Warehouse, as dimenses muitas vezes so utiliza- Essas dimenses tm basicamente 3 colunas, a Surrogate
das para mltiplos objetivos. Quando voc quer fazer uma Key, a Natural Key e uma descrio. Ela usada para quando
anlise de vendas e nessa anlise precisa mensurar quanti- voc tem diversas tabelas semelhantes e cada uma com
dade vendida, voc quer ver essa quantidade pela data do apenas uma coluna. Ento voc utiliza uma junk dimension
pedido, data do envio do pedido e data do recebimento do para agrupar elas em uma s.
pedido.
Quando acontece essa situao, ns precisamos ter as Surro- IMPORTANTE: essa soluo apenas para quando no tem
gate Keys na fato para que voc possa analisar de forma onde colocar as coisas. 16
separada.
Veja mais em: Tipos de dimenses

Veja mais em: Tipos de dimenses

BUS Matrix

Uma tabela com a relao completa de todas as fatos e


Conformed Dimension dimenses e como elas se relacionam entre si, garantindo
uma viso nica de todos as informaes da empresa. Pro-
uma dimenso que tem o mesmo significado para todas as
porciona uma viso geral do Data Warehouse e ajuda a
fatos com que se relaciona. Uma boa prtica deixar todas
manter a conformidade entre as dimenses.
as dimenses conformadas, porque assim todo mundo fala a
mesma lngua.
Veja mais em: Tipos de dimenses

RAFAEL PITON .com


SOBRE O AUTOR

Rafael Piton
Meu objetivo eliminar as barreiras de acesso ao
conhecimento no mundo de BI

CEO & Fundador da Raizzer, criador do BI Academy e idealizador do BI &


Analytics Summit.

Arquiteto de BI & Big Data, especialista em tomada de decises orientadas a


dados e um dos principais expoentes da revoluo do Agile BI & Analytics no
pas.

Utiliza suas mais de 35.000 horas de experincia em projetos de BI para dar


suporte a quem entra nessa rea hoje e educar o mercado sobre a importn-
cia da anlise de dados.

Вам также может понравиться