Вы находитесь на странице: 1из 22

Inteligência de

negócios para
a detecção de
anomalias nos
registros de
abastecimento
de combustível
Conteúdo
 Introdução
 Referências teóricas
 Preliminares
 Metodologia proposta
 Experimentos e Resultados
 Conclusões
Introdução

11,800 LITERS OF DIESEL OIL IS DESTINED TO PERU


January, 19 (ANH)
Introdução
 Bolívia
subsidia mais de 50% dos custos do
combustível. FUEL PRICES
Diesel oil 42% 58%

Natural Gas
Vehicle GNV 72% 28%

Jet Fuel 42% 58%

Special Gasoline 43% 57%

 Origina
à existência de pessoas sem escrúpulos
dedicadas ao contrabando

Source: ANH, 2017)


Source: ANH, 2017)
Introdução
A Agência Nacional de Hidrocarbonetos (ANH),
implementou o chamado sistema B-SISA.
1 574 552
vehicles 300 transactions / min
B-SYSA ADRF modelo Sistema de
Soporte de
desicão

Model

Machine
learning

Anomalies
Introdução
 ANH precisa gerenciar recursos inteligentes do
modelo proposto em [1].
 Além de sua implementação em uma estrutura
aberta de fontes flexíveis às necessidades da
instituição no futuro.
 ANH deve atualizar as anomalias nos registros de
combustível e também no controle de vendas de
combustível
 A coleta e análise dessa informação, dado seu
caráter heterogêneo e seu volume é um
problema.

BUSINESS INTELLIGENCE
BUSINESS INTELLIGENCE
 Sistemas
de Suporte da "tomada de decisão
humana".
 baseada no modelo de detecção de anomalia para
desenvolver uma ferramenta com fines de atingir
necessidades da ANH.

 Open Source Pentaho Business Intelligence, uma das


mais utilizadas atualmente e também a estrutura cobre
as operações de análise e relatórios de dados.
 Uma solução flexível para cobrir nosso caso de estudo
Inteligência de Negócios
Soluções que garantem a obtenção de
informações úteis, corretas e no tempo,
geralmente tiradas de fontes de dados diferentes.
Lidam com enorme quantidade de dados
disponíveis para o fator de decisão e a análise do
relatório apresentada de forma sugestiva que
deve apoiar o processo de tomada de decisão
[3].
O BI oferece tecnologias sofisticadas de análise de
informação e descoberta de informações, como (i)
Data Warehouse, (ii) Processamento Analítico On-line
(OLAP), (iii) Mineração de Dados, etc.
Figure A arquitetura de uma solução de BI

O processo começa usando qualquer ferramenta de cliente,


consolidando dados de fontes diferentes em uma única fonte
canônica e otimizando-as para as métricas desejadas para serem
analisadas; criando um esquema de análise para descrever os
dados; melhorar iterativamente esse esquema para que atenda
às necessidades dos usuários; e criar tabelas de agregação para
visualizações calculadas com frequência [7].
Sobre as Anomalias
 Fraudadoresacumulam combustível fazendo
várias compras altas em curtos períodos de tempo
(por exemplo, quinze vezes por dia).

Anomaly Fueling (Local


Records)

Normal Fueling (Global Records)


Anomaly Fueling (Global Records)
Sobre os dados
 190 456 registros de amostras de veículos de forma
aleatória.
 Os veículos correspondem a locais em toda a
Bolívia
 Após o processo de limpeza, temos os seguintes
atributos:
Sobre o modelo ADRF
 Processode quatro etapas, A-D, conforme
mostrado na Figura .

Em uma prova de uso do modelo, os resultados da precisão são


• 82,75% para Anomalias Locais e
• 99,7% para Anomalias Globais.
Experiments and results
 Modelagem Multidimensional

Level of
ADRF Dimensions Indicators
datail

•Time (until year) •Time •Sum of Anomaly


•Type Anomaly •Vehicle Type Scores
•Locations •Maxium Anomlay
•Vehicle Id Scores
•Both for Local and
Global
Experiments and results
 ETL 1
Experiments and results
 ETL 2
Experiments and results
 Anomalies Data Warehouse
Experiments and results
 OLAP

TRUCKS

BUS
Diesel
VAN

TANK

CAR
Gasoline
MOTORCYCLE

VOLLET
Natural
Gas MINI BUS
Measures
MINI VAN
Maximun Global Anomaly
Maximun Local Anomaly VOLLET 2
Sum of Global Anomaly
Sum of Local Anomaly
2015 2016
Time
Conclusoes
• A proposta visa contribuir para a detecção de
anomalias no sistema RFID da Bolívia considerando
solução de BI devido à grande quantidade de
dados do modelo ADFR.
• Contribuição deste artigo ilustra a aplicabilidade
do uso do BI como uma ferramenta para tomar
decisões que detectam anomalias de
abastecimento, um problema real e sócio-
econômico na Bolívia.
• Foi possível analisar, projetar e construir as
tecnologias a partir de uma solução de BI:
ETL – OLAP – Cubos - Personalizar e Painel de controle
Sistema de
B-SYSA ADRF modelo Soporte de
desicão

Model

Machine
learning

Anomalies
References
 [1] B. L. N. Fernando, G. A. Vanessa , C. S. Eduardo. Self-organizing Maps for
Anomaly Detection in fuel consumption. 4th IEEE Latin American Conference on
Computational Intelligence LA-CCI. (2017).
 [2] S. David, "Data visualization and discovery for better business decisions." TDWI
Research, pages 30-31, 2013.
 [3] D. Tarnaveanu, M. Muntean, ”Free Business Intelligence – An Easy and Reliable
Alternative”, Mathematical Models & Methods in Applied Sciences, WSEAS Press, pp.
158-164.
 [4] M. Muntean., C. Brandas, ”Business Intelligence Support Systems and
Infrastructures”, Economy Informatics, 2007, No. 7, pp. 100-104, 2007.
 [5] A. Butuza, I. Hauer, C. Muntean, A. Popa, ”Increasing the Business Performance
using Business Intelligence”, Analele Universităţii “Eftimie Murgu” Reşiţa, anul XVIII,
nr.3 , pp. 67-72, 2011.
 [6] M. Mircea, A.I. Andreescu, ”Agile Development for Service Oriented Business
Intelligence Solutions”, Database Systems Journal, vol.II, no.1/2011.
 [7] http://www.pentaho.com/.
 [8] M. Golfarelli, ”Open Source BI Platforms: a Functional and Architectural
Comparison”, Proceeding DaWaK '09 Proceedings of the 11th International
Conference on Data Warehousing and Knowledge Discovery, pages 287 - 297.

Вам также может понравиться