Вы находитесь на странице: 1из 16

SIMPLIFICANDO O BUSINESS INTELLIGENCE Andre de Freitas Tasca Bacharel em Analise de Sistemas pela Unisinos Diretor da empresa SoftSystem IT Porto

Alegre, 2013 Resumo Todos os dias so tomadas decises para a conduo dos mais diversos tipos de negcios. Os gestores das empresas so pressionados pela alta competitividade do mercado a oferecerem aos seus clientes produtos e servios com qualidade e preos atrativos. A anlise de dados de sistemas transacionais vem se tornando cada vez mais necessria para o entendimento das necessidades dos clientes direcionando produtos e servios adequados a cada perfil. Essa anlise tende a transformar dados em informao e informao em conhecimento para que as decises sejam tomadas da forma mais acertada possvel. O presente artigo tem como objetivo apresentar conceitos relacionados ao tema Business Intelligence e os itens importantes de sua arquitetura, trazendo a viso dos principais tericos sobre os assuntos estudados e tambm uma comparao entre a abordagem tradicional de Business Intelligence versus uma nova abordagem chamada de associativa. Palavras-chave: Business Intelligence ETL Data Mart - Arquitetura 1. INTRODUO Ao contrrio do que se possa imaginar, o conceito de Business Intelligence no recente. Fencios, persas, egpcios e outros povos do Oriente utilizavam esse princpio h milhares de anos, quando cruzavam informaes obtidas junto natureza em benefcio prprio. Observar e analisar o comportamento das mars, os perodos de seca e de chuvas, a posio dos astros, entre outras, eram formas de obter informaes que eram utilizadas para tomar as decises que permitissem a melhoria de vida de suas respectivas comunidades (LOPES, 2006). Para que as empresas possam conhecer mais e assim administrar melhor seu negcio, elas esto dando maior importncia s informaes estratgicas que podem ser extradas da base de dados gerada por um ERP ou Sistemas Integrados de Gesto. Significa dizer que toda a informao poder ser tratada como objeto a ser arquivado, posteriormente consultado e analisado, permitindo que os executivos visualizem comportamentos, tendncias e desvios de forma rpida, segura e confivel, possibilitando uma gesto aprimorada e eficiente. Afirma Reinhard (1996) que os dirigentes passaram a utilizar recursos de informtica como ferramentas para tomada de decises estratgicas, devido a muitas mudanas no ambiente externo e interno das empresas. A alta

competitividade do mercado exige planejamento, coordenao e controle da empresa, alm do acompanhamento do mercado em relao aos concorrentes, aos aspectos econmicos, legais, polticos e culturais em mbito global. Segundo Porter (1986), a leitura dos sinais do mercado exige tcnicas. preciso determinar uma metodologia para a deciso sobre quais so os dados particularmente cruciais e sobre o modo como eles podem ser analisados. A anlise que pode levar a uma compreenso mais profunda de um determinado segmento e de seus concorrentes exige um grande volume de dados, alguns dos quais sutis e de difcil obteno. A compilao dos dados para uma anlise sofisticada da concorrncia exige mais do que um trabalho duro: exige um mecanismo organizado, algum tipo de sistema de inteligncia. Na obra Estratgia Competitiva, o autor salienta que, qualquer que seja o mecanismo escolhido para coletar dados de inteligncia sobre o concorrente, existem benefcios com um mecanismo que seja formal e envolva documentao. Desde a dcada de 80, o autor se preocupava em desenvolver uma metodologia para a anlise da concorrncia, tornando um dos temas principais da inteligncia competitiva. A metodologia proposta por Porter envolve quatro momentos principais: 1) anlise das necessidades, definio dos alvos; 2) coleta de informaes aps definio das fontes teis; 3) anlise e avaliao das informaes com os especialistas da rea; 4) difuso das informaes aos decisores para a ao. Salientam-se algumas operaes preliminares importantes, como a anlise da posio da empresa no mercado e a determinao das necessidades de informaes crticas da empresa para guiar a coleta, o tratamento e a difuso de informaes. As informaes crticas seriam aquelas reas ou temas a vigiar de modo prioritrio (PORTER, 1986). Decises so tomadas a todo instante nas organizaes. Existem instituies que utilizam sistemas de informaes somente a nvel operacional, no direcionando para o topo da hierarquia os dados colhidos pela prpria organizao. Para esses gestores, a maioria das decises tomada com base em conhecimento emprico adquirido com o passar dos tempos. Para Davenport e Marchand (2004) a aplicao e o uso do conhecimento envolvem diversas dimenses: uma delas cultural. A empresa recompensa decises tomadas com base em conhecimentos compartilhados ou fica satisfeita com as decises e aes tomadas com base na intuio e adivinhao das pessoas com experincia e competncia. O BI uma metodologia que permite a extrao e estruturao de informaes dos sistemas operacionais para o processo decisrio. Este artigo visa simplificar os conceitos de Business Intelligence. 2. BUSINESS INTELLIGENCE Para competir no mercado global de hoje, as empresas precisam deter mais conhecimento do que antigamente e, ainda, para obter sucesso, elas precisam saber mais sobre seus clientes, mercados, tecnologias e processos, e necessitam ter essas informaes antes que seus concorrentes (HEINRICHS e LIM, 2003).

A essncia do Business Intelligence supre as necessidades de quem est procura de vantagem competitiva por meio da administrao de dados e pode auxili-lo na construo de melhores relaes comerciais e de sucesso (SERRA, 2002). Segundo Barbieri (2001), o conceito de BI comea a ganhar grande espessura no cenrio de negcios. Ele pode ser entendido como um conjunto de conceitos que envolve Inteligncia Competitiva (CI), Gerncia de Conhecimentos (KMS), IBI (Internet Business Intelligence), pesquisa e anlise de mercados, etc., tudo relativo nova era da Economia da Informao, dedicada captura dos dados, informaes, e conhecimentos que permitam s empresas competirem com maior eficincia. O Autor afirma ainda que de forma mais ampla, pode ser entendido como a utilizao de variadas fontes de informao para se definir estratgias de competitividade nos negcios da empresa. 2.1 Diferena entre Dados Operacionais e Informacionais Para diferenciar melhor os dados de natureza informacional e operacional, e estabelecer fontes importantes para o conceito de Business Intelligence, a Tabela 1 mostra algumas dessas diferenas: Tabela 1 - Diferena entre Dados Operacionais e Informacionais. Caractersticas Contedo Dados Operacionais Valores Correntes Dados Informacionais Valores Sumarizados, Calculados, Integrados de Vrias Fontes Por Assuntos/Negcios

Organizao dos Dados

Por Aplicao/sistema de informao

Natureza dos Dados

Dinmica

Esttica at a atualizao dos dados Dimensional, simplificado, prprio para atividades analticas Acesso, sem update

Formato das Estruturas

Relacional, prprio para computao transacional Atualizao campo a campo

Atualizao dos Dados

Uso

Desestruturado, com Altamente estruturado, processamento processamento repetitivo analtico/heurstico Otimizado para 2 a 3 seg. Anlises mais complexas, com tempos de respostas maiores

Tempo de Resposta

Fonte: BARBIERI, 2001, p.47.

3. DATA WAREHOUSE E DATA MARTS Inmon (1996), afirma que o Data Warehouse uma coleo de dados no volteis, crescente no tempo, integrada e orientada ao negcio para dar suporte s informaes gerenciais. a fonte de dados para consulta da organizao (KIMBALL, 1998). Ele possui as seguintes caractersticas (BERSON e SMITH, 1997): um banco de dados projetado para anlise, que usa dados de vrias aplicaes; projetado para um pequeno nmero de usurios com iteraes longas; usado basicamente para leitura; atualizado periodicamente, principalmente para adio de dados; Contm dados atualizados e histricos para fornecer informaes do fluxo do negcio no tempo; formado por poucas e grandes tabelas; Destina-se realizao de consultas que resultam em um conjunto grande de dados e geralmente devolvem leitura de tabelas inteiras e vrios relacionamentos. O Data Warehouse deve ter os seguintes objetivos (KIMBALL, 1998): Tornar a informao mais acessvel; Tornar a informao mais consistente, ou seja, informao de qualidade em toda a organizao. Os termos usados em uma parte da empresa devem ter o mesmo significado em toda empresa; Ser uma fonte de informao adaptvel e malevel. Deve ser projetado para mudana constante sem que todo sistema tenha que ser alterado; Ser uma fonte segura para proteger a informao da empresa; Deve ser a base para a tomada de deciso. O Data Mart possui definies diferentes junto aos autores, especialmente Kimbal e Inmon (1996). Segundo Inmon (1996), o Data Mart uma coleo de dados relacionados rea da empresa, organizados para dar suporte deciso e baseados nas necessidades de um determinado departamento ou processo, podendo ser de uma determinada rea da empresa. Ele afirma que um conjunto de Data Marts dificilmente pode ser integrado, e mesmo que for no resultar em um Data Warehouse (INMON,1998). Para Inmon (1998), o Data Mart derivado do Data Warehouse. Sob a tica de Kimball (1998), o Data Mart como um subconjunto lgico do Data Warehouse, e o Data Warehouse a unio de todos os Data Marts. Essa diferena de opinies se reflete em diferentes formas de implantao. Kimball (1998) prope a implantao de um Data Mart por vez desde que seja feito uma prvia modelagem da organizao. J Inmon (1996) prope que o sistema comece pequeno e v evoluindo progressivamente em espaos curtos de tempo. Ambos concordam que a implantao completa muito complexa para ser feita de uma vez, e que a sustentao do projeto

5 depende da entrega rpida de uma soluo parcial que agrade os usurios e justifique o investimento. 4. ETL EXTRAO, TRANSFORMAO E CARGA DE DADOS 4.1 Extrao de Dados A extrao dos dados se faz a partir das mais diversas fontes de dados, que podem ter os mais variados formatos, em diferentes plataformas. Para isso, necessrio uma fonte de dados temporria com padronizao de ambiente de desenvolvimento que permita a recepo dos dados das diferentes bases, sendo que as configuraes das tecnologias de hardware, sistema operacional e banco de dados sejam o primeiro padro a ser aplicado ao DW em construo (LELES, 2004). KIM (1995), prev que para possibilitar o acesso a dados de diversas fontes heterogneas, previsto que a integrao seja feita em um novo banco de dados. Essa consolidao geralmente feita atravs de Interfaces padro do tipo ODBC (Open Data Base Conectivity) padro para acesso a BDs do SQL Access Group Consortium adotado pela Microsoft, ou outras. Ainda segundo o autor, existem outros tipos de abordagens, os quais propem a integrao dos dados e das bases de dados apenas durante o processamento das consultas, somente selecionando resultados vindos destas consultas, sem materializao, isto , sem a criao de rplicas dos repositrios locais integrados. Conforme Silberschatz (1999), os dados de um SGDB podem ser extrados para um arquivo por meio de ferramentas de aplicao utilizando a linguagem SQL, pois ela utiliza uma combinao de construtores em lgebra e clculo relacional para a manipulao de dados em BDs, possuindo recursos para: consulta, modificao, definio da estrutura de dados e especificao de restries de segurana. Entretanto, se a formatao dos arquivos no conhecida necessrio gerao de relatrio ou criao de arquivo para descarregar os dados do sistema de produo. 4.2 Transformao dos Dados Essa etapa consiste em retirar redundncias e inconsistncias advindas dos vrios formatos que podem existir nas fontes de dados. As rotinas de limpeza e transformaes de dados so necessrias e as suas caractersticas devem ser armazenadas e documentadas como metadados1 (LELES, 2004). Para melhor entender esse processo, um exemplo simples de incompatibilidade de dados a codificao para gnero feminino e masculino. Em uma base de dados, a entrada deste dado pode estar codificada em m/f e em outra base de dados em 0/1, para que fique transparente para o usurio,
1

Qualquer dado mantido para sustentar as operaes ou a utilizao de um data warehouse; funciona como uma enciclopdia para o data warehouse.

6 necessria a padronizao da entrada deste dado de forma coerente como, por exemplo, especificando a codificao como M/F (LELES, 2004). 4.3 Carga de Dados Neste processo, os dados padronizados na etapa de transformao so transferidos para o DW, e sero utilizados para a montagem das anlises que sero disponibilizadas aos gestores. Existem trs desafios para a carga dos dados do ambiente operacional para DW (INMON, 1997): I) Frequncia de carregamento dos dados histricos; II) Carga dos dados do valor corrente do ambiente operacional; III) Carga dos dados depois de ter ocorrido atualizaes dos dados no ambiente transacional. No item I, o autor afirma que o desafio menor, pois a carga no feita com muita frequncia. O item II, tambm no representa muito problema, pois essa carga feita somente uma vez. O item III, considerado pelo autor o mais difcil, devido a dificuldade de rastreabilidade das alteraes. 5. OLAP A anlise multidimensional para OLAP surgiu aps a publicao de A Programming Language (Ken Iverson,1962). Com base nessas ideias a IBM desenvolveu e implementou a primeira linguagem com anlise multidimensional, no final da dcada de 60, chamada de APL. Definida matematicamente, baseada em smbolos gregos, utilizadas por usurios finais e grande consumidora de recursos computacionais, foi amplamente utilizada nas dcadas de 80 e 90 em aplicaes de negcio. Acompanhando a evoluo dos sistemas, na dcada de 90, introduziu-se uma nova classe de ferramentas no mercado, que foi chamada de OLAP. As ferramentas de OLAP possuem a maioria dos conceitos introduzidos pela linguagem APL, porm, com maior integrao na utilizao dos dados fontes. Existe um grupo de empresas que desenvolveu e ainda desenvolve ferramentas OLAP e arquiteturas nela baseada como a IBM, a Computer Associates, MicroSoft, MicroStrategy, Cognos, IRI, Oracle, entre outras (ANZANELLO, 2002). Segundo Anzanello (2002), a aplicao OLAP oferece visualizaes das informaes de negcio a partir de muitas perspectivas diferentes por manter uma estrutura adequada e eficiente. Os dados so armazenados na forma dimensional, e as dimenses podem ser hierrquicas. Sua finalidade apoiar os executivos em suas decises estratgicas. Thomsen (1997) demonstra que utilizando somente consultas SQL e planilhas eletrnicas difcil consultar e disponibilizar as informaes analticas do DW. Para suprir estas necessidades surgiram os softwares multidimensionais, tambm conhecidos como ferramentas OLAP. Ele define algumas funcionalidades para trabalhar com dados no estruturados como: Associao de frmulas nas dimenses;

7 Exibio das dimenses do modelo em qualquer configurao tridimensional composta de linhas colunas e pginas; Habilidade de lidar com a natureza hierrquica das dimenses.

O conceito de hypercubo, cubo com mais de trs dimenses, a base da abordagem das ferramentas OLAP que podem utilizar SGBDs relacionais dando a eles um sabor dimensional (ROLAP) ou usar tecnologias proprietrias de banco de dados multidimensionais (MOLAP) (KIMBALL, 1998). Barbieri (2001) nota que na modelagem dimensional as informaes residem na interseo de vrias dimenses. Os valores dos fatos residem na interseo das diversas dimenses que formam um ponto no hypercubo. O hypercubo pode ser fatiado (slice) isolando uma ou mais dimenses. O pivotamento (rotao) permite girar o hypercubo com a mudana do eixo de dimenses analisado. O conceito de dicing permite a criao de hypercubos menores restringindo as ocorrncias de interesse em cada dimenso. Evidentemente, esses conceitos so mais facilmente demonstrados quando consideramos um cubo com trs dimenses, mas na maioria das consultas aos data marts mais de trs dimenses so utilizadas. 5.1 Arquiteturas Segundo Nigel Pendse (2002), conforme o mtodo de armazenamento de dados utilizado para uma aplicao OLAP, ser elaborada a arquitetura da aplicao. Os mtodos de armazenamento de dados so MOLAP, ROLAP, DOLAP e HOLAP. Cada um deles tem uma funo especfica e deve ser utilizada quando melhor atender s necessidades de anlise pela ferramenta de OLAP. Anzanello (2002), afirma que no MOLAP (Multidimensional On-Line Analytical Processing) os dados so armazenados de forma multidimensional, sua implementao varia de acordo com a sua ferramenta de OLAP, mas freqentemente implementado em um banco de dados relacional, porm no na terceira forma normal. Alm disto, o acesso aos dados ocorre diretamente no banco de dados do servidor multidimensional. Os gerenciadores de banco de dados tm um limite prtico quanto ao tamanho fsico de dados que eles podem manipular. As restries de armazenamento e desempenho limitaro o tamanho do banco de dados, no esquecendo o limite das dimenses que tambm restringem sua manipulao. A complexidade que existe no processo de carga de um banco de dados multidimensional, pode acarretar a demora no processo. O processo de carga complexo devido srie de clculos que devem ser realizados para agregar os dados s dimenses e preencher as estruturas do banco. Depois do processo concludo, ainda realizado uma srie de mecanismos para melhorar a capacidade de pesquisa. J no ROLAP (Relational On-Line Analytical Processing) os dados so armazenados no modelo relacional como tambm suas consultas so processadas pelo gerenciador do banco relacional (ANZANELLO, 2002). Por outro lado, o DOLAP (Desktop On-Line Analytical Processing) uma variao que existe para fornecer portabilidade dos dados. A vantagem que oferece esta arquitetura a reduo do trfico na rede (ANZANELLO, 2002).

8 A arquitetura mais recente a HOLAP (Hybrid On-Line Analytical Processing), na qual ocorre uma combinao entre ROLAP e MOLAP. A vantagem que com a mistura de tecnologias pode-se extrair o que h de melhor de cada uma, a alta performance do MOLAP e a escalabilidade do ROLAP (ANZANELLO, 2002). 5.2 Ferramentas OLAP A grande maioria dos softwares oferecidos no mercado trabalha, no mnimo, sob duas abordagens: A ferramenta de desenvolvimento, que utilizada para a montagem do modelo dimensional de negcios e a interface de iterao com o usurio, e a ferramenta de visualizao e anlise dos dados destinada ao usurio final. Algumas caractersticas dessas ferramentas so: Consultas ad-hoc: so consultas geradas pelos usurios finais atravs do cruzamento de informaes que os levem a encontrar tendncias, padres e comportamentos sob os itens analisados de uma forma no vista. Segundo Inmom (2002), so consultas com acesso casual nico e tratamento de dados segundo parmetros nunca antes utilizados de forma iterativa e heurstica. Slice and Dice: possibilita a alterao da perspectiva de viso. Serve para modificar a posio de uma informao, trocar linhas por colunas de maneira facilitar a compreenso dos usurios e girar o cubo sempre que houver necessidade (ANZANELLO, 2002). Drill down/up: consiste em realizar explorao em diferentes nveis de detalhes da informao. Com drill down divide-se um item de resumo em seus componentes detalhados, como por exemplo, ano, semestre, trimestre, mensal e dirio. Alm das principais caractersticas apresentadas necessrio que estas aplicaes forneam vrios modelos de visualizao em uma variedade de formatos, e no apenas em simples tabelas, sendo muitas vezes apresentados atravs de grficos (ANZANELLO, 2002). Devido suas caractersticas e funcionalidades, as ferramentas constituem parte importante em uma estrutura de Business Intelligence, pois elas permitem que as informaes do DW sejam exploradas de maneira eficiente. 6. MODELAGEM DIMENSIONAL A Modelagem Dimensional de dados uma tcnica de projeto que traz os dados para uma forma prxima do entendimento do usurio, onde o modelo dimensional formado por informaes que podero vir de diversas fontes de dados. Essa tcnica nasceu para modificar alguns conceitos cristalizados nos projetos tradicionais de Bancos de Dados, principalmente aps a fase relacional. O produto final da Modelagem Dimensional a produo de um modelo conceitual dimensional, formado de tabelas Fato e tabelas Dimenso (BARBIERI, 2001).

9 As tabelas Fato servem para armazenar medidas numricas associadas a eventos de negcio. Uma tabela Fato contm vrios fatos, correspondentes a cada uma de suas linhas. Cada fato pode armazenar uma ou mais medidas numricas, que constituem os valores objetos da anlise dimensional. Possuem como chave primria, normalmente um campo multi-chaves, formado pelas chaves-primrias das dimenses que com ela se relacionam. Normalmente armazenam muito mais linhas do que as tabelas Dimenso, e merecem cuidado especial em funo do seu alto volume. Contm dados normalmente aditivos (manipulados por soma, mdia, etc.) e relativamente estticos. As tabelas Dimenso representam entidades de negcios e constituem estruturas de entrada que servem para armazenar informaes como tempo, geografia, produto, cliente, etc. As tabelas Dimenso tem uma relao 1:N com a tabela Fato. Possuem mltiplas colunas de informao, algumas das quais representam a sua hierarquia. Apresentam sempre uma chave primria, que lhes confere unicidade, chave essa que participa da tabela Fato, como parte de sua chave mltipla. Devem ser entendidas como as tabelas que realizam os filtros de valores aplicados na manipulao dos fatos e por onde as consultas entram no ambiente de DW/DM. A seguir, a Figura 2 ilustra a composio da tabela Fato, onde cada linha representa um fato e as colunas chaves so herdadas das tabelas Dimenso associadas. Alm das chaves, apresenta as colunas com valores das medidas definidas para o modelo (BARBIERI, 2001). Figura 1 - Exemplo de um Modelo Dimensional.

Fonte: BARBIERI, 2001, p.82. O autor afirma que a estrutura dimensional modifica a ordem de distribuio de campos por entre as tabelas, permitindo uma formatao estrutural mais voltada para muitos pontos de entradas especficos (as chamadas dimenses) e menos para os dados granulares em si (os chamados Fatos). Isso significa que numa estrutura dimensional os dados estaro numa

10 forma quase estelar, onde vrias tabelas de entrada estaro se relacionando com algumas (poucas) tabelas de informaes, criando uma notao mais sinttica, legvel e objetiva. O modelo dimensional oferece clara e diretamente os elementos que se precisa para buscar as informaes sobre fatos via dimenses de referncia, diferindo da malha relacional, ou de rede. O modelo dimensional, embora mais leve do que o modelo relacional, pode se tornar mais complexo, na medida em que novas extenses forem sendo agregadas a resoluo do problema. A necessidade de relacionamentos M:N entre tabelas Fato e tabelas Dimenso, bem como a resoluo de estruturas recursivas nas dimenses podero acrescentar complexidade ao modelo (BARBIERI, 2001). 6.1 Comparao entre Relacional e Dimensional As diferenas os modelos Relacional e Dimensional so apresentas na tabela 2. Tabela 2 - Comparao entre Modelo Relacional E/R e Modelo Dimensional. Modelo Dimensional Padro de estrutura mais fcil e intuitiva Anterior ao MER, anos 60 Tabelas Fato e tabelas Dimenso Tabelas Fato so o ncleo normalizadas Tabelas Dimenso so os pontos de entrada Tabelas Dimenso opcionalmente normalizadas Modelo mais facilmente joined Leitura mais fcil do modelo por usurios no especializados Fonte: BARBIERI, 2001, p.38. Modelo Relacional E/RU: Modelo mais complexo nfase nos Bancos de Dados Relacionais, anos 70 Tabelas que representam Dados e Relacionamentos Todas as tabelas so comumente normalizadas As tabelas so indistintamente acessadas e de filtro inicial Todas as tabelas so comumente normalizadas Maior dificuldade de join pelo nmero maior de tabelas Maior dificuldade de leitura pelo usurio no especializado

Os passos da Modelagem Dimensional so: Definio da rea de Negcio

11 Deve ser escolhida de acordo com as prioridades emergentes da empresa. Aps a escolha, parte-se para definir aqueles que sero os processos alvos do projeto. Definio de Granularidade Define de forma combinatria os nveis dimensionais que sero usados para o armazenamento dos dados. Os fatores de definem a escolha da granularidade esto relacionados com o volume de dados a ser mantido e com o processamento necessrio para produz-los. A granularidade pode variar na dimenso temporal entre dia, ms e anos, por exemplo. Definio das Tabelas Dimenso Devem ser definidas em funo da granularidade e reas de negcio. Normalizao2 das Tabelas Dimenso. As tabelas Dimenso, diferentemente das tabelas Fato, esto mais sujeitas ao processo de desnormalizao3. Existem duas correntes diferentes com relao aos aspectos de normalizao das tabelas Dimenso: Star Schema ou Esquema Estrela: Abordagem que recomenda a no normalizao das tabelas Snowflake Schema ou Esquema de Flocos de Neve: Abordagem que recomenda a normalizao das tabelas. A utilizao do esquema estrela extremamente recomendvel, pelos aspectos de ganho de desempenho quando comparado ao esquema de flocos de neve. Isso acontece porque a reduo dos comandos de juno que seriam necessrios para recompor a informao desejada buscando-a em outra tabela. Relacionamento de Atributos das Tabelas Dimenso As tabelas Dimenso carregam atributos que estabelecem relacionamentos entre si. necessrio um esquema cuidadoso de modelagem para melhor distribudos no esquema dimensional (BARBIERI, 2001). 6.2 MODELAGEM DIMENSIONAL ASSOCIATIVA A modelagem dimensional associativa funciona de forma diferente dos demais modelos de arquiteturas de BI, ela constri e mantm um banco de dados no relacional associado atravs de chaves compactada em disco e descompactada na memria quando o banco aberto. Os dados so armazenados na memria (RAM) e analisados conforme as necessidades, isso feito sem qualquer apoio de leitores de disco.

Tcnica de modelagem lgica que remove redundncia de dados separando os dados em muitas entidades distintas, cada uma das quais se torna uma tabela e um SGBD relacional. 3 Aceitao de redundncia em uma tabela para que ela permanea simples e no normalizada. Esse procedimento tem por objetivo melhorar o desempenho e facilitar a utilizao.

12 Atualmente a nica tecnologia que implementa nesse formato o QlikView. Segundo seu Tutorial (2011), a ferramenta possui as seguintes caractersticas: Armazenamento dos Dados

No necessrio montar um DW, o QlikView possui seu prprio arquivo de dados gerado a partir da carga. Possui funes embutidas para a carga (ETL) e limpeza (Data Cleansing) dos dados. Por esse motivo, reduz consideravelmente o custo de todo um projeto de ETL e modelagem do DW. Nmero ilimitado de dimenses

Os cubos so no tem limitao de dimenso, eles so relacionados atravs de chaves associativas e so orientados ao negcio, portanto qualquer varivel pode servir como item de anlise em um objeto da interface. Por esse motivo, cada tabela do modelo dimensional chamada de hypercubo. Possibilidade para que diversos Hypercubos "conversem" um com o outro Aps serem montados os hypercubos, as informaes podero ser visualizadas atravs de objetos de interface (grficos, tabelas, velocmetros, etc.) e todos esses objetos podem ser combinados em uma mesma anlise, podendo todos os objetos estar se relacionando ou no. Flexibilidade

A alterao ou criao de novas anlises totalmente transparente, no requerendo alteraes em bases de dados ou redefinio de cubos. O tempo para a criao de novos atributos extremamente reduzido por no precisar alterar a base de dados, qualquer campo da fonte de dados pode ser adicionado como uma dimenso instantaneamente, assim como novas medidas e indicadores podem ser criados. Amigvel para o usurio

A navegao intuitiva, no requerendo praticamente nenhum treinamento mais especfico na ferramenta. As possibilidades grficas so avanadas e de fcil compreenso. Espao em disco

A base de dados do QlikView pode trabalhar com uma compactao de at 80%, isso faz com que no seja necessrio muito espao em disco para o armazenamento das informaes. Mesmo com alta compactao, a performance das consultas extremamente elevada por trabalhar com clculos em memria RAM. Acessibilidade

13 O QlikView pode ser utilizado atravs dos principais navegadores de internet sem que seja instalado nenhum plugin. Tambm possui navegao nativa para dispositivos mveis sem que seja necessrio nenhuma programao adicional pelos desenvolvedores. Os sistemas convencionais de pesquisa de informaes normalmente requerem uma abordagem top-down, enquanto o QlikView permite iniciar com quaisquer dados, independentemente de sua localizao na estrutura de dados. A recuperao de dados em sistemas convencionais geralmente uma tarefa complexa que requer conhecimento abrangente da estrutura das bases de dados e da sintaxe da linguagem de consulta. Normalmente, o usurio est limitado a rotinas de pesquisa pr-definidas. Pode-se dizer que o QlikView utiliza uma arquitetura hbrida para anlise dos dados; a MOLAP devido ao relacionamento das chaves associativas entre os hypercubos para montagem do modelo de negcios, a DOLAP por permitir uma anlise off-line dos dados, e a OLAP por permitir uma anlise on-line se a verso utilizada for a cliente-servidor. Outra caracterstica que faz com que o modelo de negcios fique mais simples, que campos de sumarizaes no precisam ficar nos hypercubos, eles so calculados em tempo de execuo, com isso a carga dos dados fica extremamente rpida. Os usurios podem criar suas prprias vises utilizando qualquer varivel do modelo de negcios diretamente via navegador de internet. 6.3 Arquitetura Tradicional de BI x Arquitetura Associativa Conforme mostra a Figura 7, a construo de um ambiente de Business Intelligence requer dados de vrias fontes de dados existentes na empresa ou fora dela. O conjunto de dados coletados matria-prima para uma srie de transformaes feitas antes da carga no Data Warehouse, cujo produto final carregado no Data Warehouse (depsito de dados). So criadas visualizaes gerenciais que possibilitam que as decises gerenciais sejam tomadas em tempo real. Figura 2 - Arquitetura Tradicional de Business Intelligence.

14 Nesse ambiente tradicional, necessrio o investimento em um novo banco de dados, uma ferramenta para fazer ETL e, alm disso, para posterior manuteno desse banco de dados um DBA (Administrador de Banco de Dados). Isso faz com que o custo fique bastante elevado. Na Figura 8, o ambiente de Business Intelligence fica mais simplificado, no necessrio o investimento em um novo banco de dados, e o ETL feito dentro da prpria ferramenta de desenvolvimento QlikView que gera seu prprio Data Warehose (QVW). Nessa base gerada por ele, no necessrio nenhuma manuteno para melhoria de performance. Essas caractersticas fazem que o custo para implantar e manter o sistema fique muito atrativo. Figura 3 - Arquitetura Associativa de Business Intelligence.

15 Referncias ANZANELLO, C. A. M. OLAP: Conceitos e Utilizao. Instituto de Informtica Universidade Federal do Rio Grande do Sul (UFRGS), 2002. Disponvel em: <http://www.inf.ufrgs.br/~clesio/cmp151/cmp15120021/MaterialSeminarios.html >. Acesso em: 15 jul. 2006. BARBIERI, C. BI Business Intelligence: Modelagem e Tecnologia. Rio de Janeiro: Axcel Books, 2001. BERSON, A.; SMITH, S. J. Data warehousing, Data mining & OLAP. New York: McGraw-Hill, 1997. CORRA, H. L.; GIANESI, I. G. N. e CAON, M. (1999). Planejamento, Programao e Controle da Produo: MRP II / ERP. So Paulo: Editora Atlas. DAVENPORT, T. H. Mission critical: realizing the promise of enterprise systems. Boston, Massachusetts: Harvard Business School Press, 2000. DAVENPORT, T. H.; MARCHAND, D. A.; DICKSON, T. Dominando a gesto da informao. Porto Alegre: Bookman, 2004. 407p. DAVENPORT, T. H.; MARCHAND, D. A. A Gesto do conhecimento uma boa gesto da informao? In: Dominando a gesto da informao. Traduo de Bellini C.G.P. e Soares C.A.S.N. Porto Alegre: Bookman, 2004. p.189-194. HEINRICHS, J. H.; LIM, J. S. Integrating web-based data mining tolls with business models for knowledge management. Decision Support Systems, v.35, n.1, p.103-112, 2003. INMON, W. H. Como Construir o Data Warehouse. Rio de Janeiro: Editora Campus, 1997. INMON, W. H. Building the Data Warehouse. 2d. New York: John Wiley & Sons, 1996. 401p. KIM, W. Modern Database Systems: the Object Model, Interoperability and Beyond. ACM press, Addison Wesley, 1995. KIMBALL, R. The Data Warehouse Tollkit: practical techniques for buiding. LOPES, C. Conceito e histria do BI. Disponvel em: <http://www.celedo.com.br/portal/modules.php?name=News&file=article&sid=1 >. Acesso em: 7 maio 2006. MACHADO, F. N. R.; ABREU, M. P. Projeto de Banco de Dados: uma viso prtica. So Paulo: rica, 1996.

16 MANUAL QlikView: Verso 10 para Microsoft Windows Primeira Edio, Lund, Sucia, fevereiro de 2011 De autoria da QlikTech International AB /HIC/KHN/JNN/MSJ MARKUS, M. L. e TANIS, C (2000). .The enterprise system experience. from adoption to success., em Zmud, R. Ed., Framing the domains of IT research: glimpsing the future through the past. Cincinnati, Pinnaflex. PENDSE, N. What Is OLAP? The OLAP Report. Disponvel <http://www.olapreport.com/fasmi.htm>. Acesso em: 29 set. 2006. PESQUISA em Administrao. Trimestre/2000, p.46-57. So Paulo, FEA/USP, v.1, n.11, em:

PORTER, M. Estratgia Competitiva: Tcnicas para Anlise de Indstrias e da Concorrncia. Rio de Janeiro: Campus, 1986. REINHARD, N. Evoluo das nfases gerenciais e de pesquisa na rea de tecnologia de informtica e de comunicaes aplicada nas empresas. Revista da Administrao. So Paulo: v. 4, 1996. p.5-6. SERRA, L. A. Essncia do Business Intelligence. So Paulo: Editora Berkeley, 2002. THOMSEN, E. OLAP Solutions: Building John Wiley & Sons, Inc., 1.ed., 1997.

Вам также может понравиться