Академический Документы
Профессиональный Документы
Культура Документы
Formado em Sistemas de Informao e atualmente Mestrando na UnB - Universidade de Braslia, assim resumo minha vida acadmica. Profissionalmente, passei por diversas empresas e rgos. Nos ltimos anos fui Desenvolvedor de Novos Projetos na Presidncia da Repblica e Analista de Sistemas no Ministrio do Trabalho atravs da Politec. Tambm fui Comissionado no Ministrio do Planejamento e atualmente sou Pesquisador Snior da UnB.
Sumrio
1.Introduo....................................................................................................................................... 1.1. 04 Informaes Relevantes da Sute Pentaho............................................................................. 1.2. Business Intelligence.................................................................................................................. 2.Arquitetura...................................................................................................................................... 2.1. PUC / PAC e Ferramentas de Desenvolvimento......................................................................... 3.Instalao e Configurao............................................................................................................... 3.1. Instalao Pr Configurada (PCI)............................................................................................... LAB 01.............................................................................................................................................. 3.2. Gerenciando o Repositrio de Solues..................................................................................... 3.3. Drivers JDBC.............................................................................................................................. 3.4. Configurando Pentaho Administration Console......................................................................... LAB 02.............................................................................................................................................. 4. Avanado........................................................................................................................................ Segurana - Trocando o DAO pela segurana do LDAP ................................................................... Active Directory ................................................................................................................................. Configurando EMail ......................................................................................................................... LAB 03 .............................................................................................................................................. Auditoria e Log.................................................................................................................................. Referncias ......................................................................................................................................
2. Arquitetura
A Sute se divide em duas partes: Pentaho BI Platform (a plataforma) e ferramentas. A plataforma responsvel pela execuo da Soluo de BI, provendo controle de processos, visualizao, segurana e auditoria. As ferramentas do produtividade na
Descreveremos as principais ferramentas, alm de alguns dos recursos da plataforma. 2.1. PUC - A Plataforma BI Platform - Core da suite, tem a funo de controlar o repositrio e a execuo de solues, os acessos a banco de dados, agendamentos, permisses, servios de e-mail e mais algumas atividades fundamentais de background, grande parte da sua funcionalidade pode ser configurada atravs do PAC.
A Plataforma uma aplicao que roda sobre um servidor de aplicaes Java, como o JBoss ou o Tomcat. A Plataforma se divide em duas partes: O Solution Engine, ou mecanismo de solues, o responsvel pela execuo e controle das solues. Ele funciona baseado em uma mquina de workflow interna. O Portal, a poro do Pentaho visvel ao cliente final. Por meio dele o cliente acessa as solues. O portal oferece alguns servios recm-configurados, como registro de solues, controle de acesso, relatrios ad-hoc, agendamentos, etc. Outros servios podem ser montados no portal, como dashboards, envio de e-mails programados etc. Finalmente, a modularidade do Portal permite que novos servios sejam criados e implementados livremente. O principal mecanismo de programao do portal so metacomandos chamados
2.5. Mondrian Mondrian - Motor OLAP do Pentaho, faz com que consultas escritas na linguagem MDX (Dimensional) sejam convertidas para SQL (Relacional).
2.7. Pentaho Metadata Editor (PME) Pentaho Metadata Editor (PME) - Interface grfica para a definio de metadados, os metadados so arquivos XML que "traduzem" as tabelas do banco de dados para um formato mais intuitivo para os usurios finais, a finalidade principal do PME publicar metadados que sero utilizados pelo WAQR.
2.8. Pentaho Report Designer (PRD) Pentaho Report Designer (PRD) - Gerador de relatrios "pixel perfect" da suite, facilita a criao de relatrios "ricos" com uma aparncia mais profissional e personalizada, adicionalmente permite a publicao desses relatrios no PUC, permite inclusive que filtros simples sejam publicados diretamente sem a criao de xactions no PDS.
2.9. Pentaho Design Studio (PDS) Pentaho Design Studio (PDS) - Plugin para a plataforma eclipse que funciona como uma interface grfica para a criao de xactions que so arquivos xml interpretados pelo BI Server, so como instrues "passo-a-passo" que dirigem a execuo das atividades pelo BI Sever, permitem, por exemplo, a definio de filtros avanados para relatrios e o envio de e-mails com os relatrios executados.
2.10. Community Dashboard Framework (CDF) Community Dashboard Framework (CDF) - Framework para a criao de dashboards (painis de indicadores), utiliza basicamente HTML, JavaScript e CSS para criar dashboards.
2.11. WEKA Weka - Ferramenta de Data Mining (Minerao de Dados), atravs do Weka possvel utilizar algoritmos de mining para encontrar padres no triviais nos dados.
3. Instalao e Configurao
3.1. Instalao Pr Configurada (PCI) A Instalao Pre-Configurada (PCI) uma instalao completa de servidor projetada para avaliar as caractersticas da Plataforma de BI Pentaho. Inclui um servidor preconfigurado de servidor web de aplicao, bases de dados de aplicao povoadas, dados de amostra, e amostras plenamente funcionais. Se escolhe a distribuio PCI, voc querer baixar o Guia do Iniciante, tambm disponvel e, de http://www.sourceforge.net/projects/pentaho , que o guiar pela instalao simples, configurao e execuo das amostras da plataforma.
LAB 01 Criar diretrio pentaho $ mkdir pentaho Entre no diretrio e faa o download da suite $ cd pentaho $ wget -c http://ufpr.dl.sourceforge.net/project/pentaho/Business%20Intelligence
Java Toda a Suite Pentaho foi escrita em Java, e a verso oficialmente requerida pela gerao 3.0 dos programas da Suite Pentaho a JVM da Sun, verso 1.6.x. Essa VM
3.2. Gerenciando o Repositrio de Solues O Pentaho possui um diretrio especifico de solues. O pentaho-solutions, tambm conhecido com diretrio dos mecanismos de solues o responsvel pela execuo e controle das solues. Arquitetura Orientada a Servios (SOA) Isso est rapidamente se tornando um termo sem sentido pois todas as aplicaes que aceita URLs esto alegando ter uma SOA. A Plataforma Pentaho BI tem vrias opes disponveis para a execuo das atividades. O mecanismo de execuo padro um built-in e Flow Sequencer. Isso permite que o desenvolvedor realize seguencias de solues para construir resultados a partir de coletas dos fluxos de negcios que geralmente so lineares e orientados a sucesso. Sequncias de ao Uma seqncia de ao um documento XML que define a menor tarefa completa que o mecanismo de soluo pode executar. Ele executado por um leve fluxo de processo e define a ordem de execuo de um ou mais componentes da plataforma Pentaho BI. Por exemplo: um Diretor necessita executar uma consulta para saber quais servios esto acima do oramento, gerar um relatrio de oramento para cada um desses departamentos, e, finalmente, enviar e-mails de todos os relatrios para o gerente de cada departamento. O motor workflow pentaho utiliza uma linguagem padro XML
3.3. Drivers JDBC Java Database Connectivity ou JDBC um conjunto de classes e interfaces (API) escritas em Java que fazem o envio de instrues SQL para qualquer banco de dados relacional.Por definio, a Suite Pentaho acessa qualquer base de dados para qual haja um driver JDBC.
A performance de cada conexo afetada por uma srie de fatores e parmetros. Um desses fatores a qualidade de driver JDBC. O Pentaho empacota alguns drivers JDBC em cada aplicao. A tabela abaixo lista todos os bancos suportados.
Os drives na Sute so armazenados no diretrio biserver-ce/tomcat/lib. 3.4. Configurando Pentaho Administration Console
Como uma aplicao independente, que possui seus prprios drivers JDBC para ser instalado (coloc-los no diretrio jdbc). As configuraes so armazenadas no banco de dados Hibernate do servidor de BI Pentaho.
O Pentaho Administration Console oferece uma localizao central a partir da qual o administrador possa realizar algumas implantaes no Pentaho. O console simplifica muitas tarefas administrativas comuns, tais como: gerenciamento de usurios, perfis, agendamento de trabalhos e servios de gesto.
HOME A partir do seu console home page, voc capaz de acessar informaes importantes sobre a implantao do Pentaho. Por exemplo, os indicadores de status aparecem na barra de ferramenta quando h um erro crtico, um processo que est atualmente em execuo ou um aviso que voc deve pesquisar.
O console fornece uma barra de ferramentas com cones que ajudam a determinar o status do seu servidor. A tabela abaixo contm uma breve descrio de cada cone na barra de ferramentas, da esquerda para a direita:
Requisitos de Sistema O Pentaho Administration Console requer Java SE Runtime verso 1.5 ou posterior. Os parmetros padro de memria do sistema da JVM (tais como os parmetros que especificam o tamanho mximo de heap) so adequados para o funcionamento do console. Especificamente, a Pentaho recomenda que voc tenha, pelo menos, 100 Mbs de memria fsica.
Iniciando o Pentaho Administration Console Siga as instrues abaixo para iniciar o Pentaho Administration Console no sistema operacional de sua escolha.
Se voc estiver usando este sistema operacional ... Windows Ento, siga estas instrues ... 1. Abra a janela de comando. 2. V para o diretrio de instalao. Este diretrio contm o
4. Avanado
1. Senha para publicaes de novas solues. Edite o arquivo pentaho-solutions/system/publisher_config.xml <?xml version="1.0"?> <publisher-config> <publisher-password>coloqueumasenha</publisher-password> </publisher-config>
2. IP e Porta desejada Altere o arquivo tomcat/webapps/pentaho/WEB-INF/web.xml para a porta desejada <context-param> <param-name>base-url</param-name> <param-value>http://localhost:<porta>/pentaho/</param-value> </context-param>
2. Inicie todos o biserver-ce 3. Importe o LDIF - O Spring XML possui uma amostra applicationContextspring-security-ldap.xml e applicationContext-pentaho-security-ldap.xml que define os registros abaixo. Se voc j possui um diretrio existente, ou se voc deseja alterar a amostra arquivos LDIF, voc precisa ajustar as consultas LDAP no referido arquivos XML. Para fazer uso da amostra de arquivo LDIF, use um navegador LDAP, como o Apache Directory Studio ou JXplorer, para importlo. Veja em Exemplo LDIF: version: 1 dn: uid=joe,ou=users,ou=system mail: joe.pentaho@pentaho.org objectclass: inetOrgPerson objectclass: organizationalPerson objectclass: person objectclass: top uid: joe cn: joe businesscategory: cn=ceo,ou=roles,ou=system businesscategory: cn=Admin,ou=roles,ou=system userpassword:: cGFzc3dvcmQ= sn: Pentaho dn: uid=suzy,ou=users,ou=system
Naturalmente, os usurios que iro utilizar o BI Server tero que estar no grupo direito do usurio. (Admins em ambos os grupos). Ento voc pode editar o arquivo de configurao: pentaho-solutions/system/pentaho-spring-beans.xml Neste arquivo, configurar a fonte de autenticao. Trocar *-security-hibernate.xml por *-security-ldap.xml. <!-- <import resource="applicationContext-acegi-security-hibernate.xml" /> <import resource="applicationContext-pentaho-security-hibernate.xml" /> --> <import resource="applicationContext-acegi-security-ldap.xml" /> <import resource="applicationContext-pentaho-security-ldap.xml" />
pentaho-solutions/system/applicationContext-acegi-security.xml Este o lugar onde o acesso a pginas individuais ou diretrios no servidor Pentaho pode ser configurado. Voc precisa procurar por "Admin" e "Authenticated" e substitu-los com seus nomes de usurio e administrador do grupo normal em maisculas; <property name="objectDefinitionSource"> <value> <![CDATA[ CONVERT_URL_TO_LOWERCASE_BEFORE_COMPARISON \A/docs/pentaho_ce_user_guide.*\Z=Anonymous,COMPANYUSERS \A/mantlelogin/.*\Z=Anonymous,COMPANYUSERS \A/mantle/mantleloginservice/*\Z=Anonymous,COMPANYUSERS \A/mantle/.*\Z=COMPANYUSERS ... \A/admin.*\Z=BISERVERADMINS \A/auditreport.*\Z=BISERVERADMINS \A/auditreportlist.*\Z=BISERVERADMINS \A/versioncontrol.*\Z=BISERVERADMINS ...
pentaho-solutions/system/applicationContext-acegi-security-ldap.xml Este arquivo contm os parmetros de conexo e reas de pesquisa Spring/Acegi security LDAP module.
<bean id="initialDirContextFactory" class="org.acegisecurity.ldap.DefaultInitialDirContextFactory"> <constructor-arg index="0" value="ldap://adsrv.domain.tld:389" /> <property name="managerDn" value="pentahoaduser@COMPANY" /> <property name="managerPassword" value="changeme" /> <property name="extraEnvVars"> <map><entry><key><value>java.naming.referral</value> </key><value>follow</value> </entry> </map> </property> </bean> <bean id="userSearch" class="org.acegisecurity.ldap.search.FilterBasedLdapUserSearch"> <constructor-arg index="0" value="OU=Company,DC=domain,DC=tld" /> <constructor-arg index="1" value="(sAMAccountName={0})" /> <constructor-arg index="2"> <ref local="initialDirContextFactory" /> </constructor-arg> <property name="searchSubtree"> <value>true</value> </property> </bean>
pentaho-solutions/system/applicationContext-pentaho-security-ldap.xml O BI Server recupera dados de usurios adicionais com estes parmetros: <bean id="allUsernamesSearch" class="org.pentaho.platform.plugin.services.security.userrole.ldap.search. GenericLdapSearch"> <constructor-arg index="0" ref="initialDirContextFactory" /> <constructor-arg index="1"> <bean class="org.pentaho.platform.plugin.services.security.userrole.lda p.search.LdapSearchParamsFactoryImpl"> <constructor-arg index="0" value="OU=Company,DC=domain,DC=tld" /> <constructor-arg index="1" value="(samAccountType=805306368)" /> <constructor-arg index="2"> <bean class="javax.naming.directory.SearchControls"> <property name="searchScope" value="2" /> </bean> </constructor-arg> </bean>
<!-<!--
Configurando E-Mail A Plataforma Pentaho BI envia mensagens de e-mail usando um servidor SMTP. Para isso a plataforma precisa saber o endereo de um servidor SMTP que voc est autorizado a usar. Na maioria dos casos, tambm requer uma identificao de usurio, uma senha e um e-mail para resposta vlido. Geralmente um servidor algo como "smtp.company.com" Para modificar suas configuraes, basta editar o arquivo email_config.xml. O caminho padro : pentaho-solutions/system/smtp-email/email_config.xml Nota. Para fazer um teste simples, o Pentaho fornece um exemplo de configurao atravs do Gmail 'Google'. Para isso, basta entrar no arquivo email_config_gmail.xml e finalizar algumas configuraes bsicas. mail.smtp.host - O DNS ou o endereo IP do servidor SMTP que voc est autorizado a usar. mail.smtp.auth - Defina para "true" se o seu servidor requer uma identificao de usurio e senha para enviar e-mail. Na maioria dos casos isso deve ser verdade. Se a autenticao no necessria definido como "false". mail.from.default - Quando a plataforma Pentaho BI envia um e-mail, este endereo aparecer caso no seja especificado no documento de seqncia de ao. A maioria dos servidores SMTP exigem que este seja um endereo de email vlido. mail.userid - Se mail.smtp.auth " definido como verdadeiro, um ID de usurio vlido para o seu servidor de e-mail deve ser definido aqui. mail.password - Se mail.smtp.auth " definido como verdadeiro, a senha para o ID de usurio acima deve ser definido aqui.
Referncias Grupo Pentaho de Gois - http://pentahogo.blogspot.com/ SERPRO - http://www.serpro.gov.br/imprensa/publicacoes/tematec/2008 Pentaho community http://wiki.pentaho.com/display/ServerDoc2x/The+Pentaho+Administration+Console http://wiki.pentaho.com/display/COM/Architecture http://wiki.pentaho.com/display/ServerDoc2x/Using+Active+Directory http://wiki.pentaho.com/display/ServerDoc2x/Active+Directory+configuration+exam ple+%28CE+3.0RC1%29+2.x-3.0.x http://wiki.pentaho.com/display/ServerDoc2x/Changing+to+the+LDAP+Security+D AO http://wiki.bizcubed.com.au/xwiki/bin/view/Pentaho+Tutorial/Pentaho+LDAP+troubl eshooting http://openpdf.com/ebook/pentaho-security-pdf.html http://code.google.com/p/pentahoanalysistool/