Академический Документы
Профессиональный Документы
Культура Документы
www.it4biz.com.br
PDI
O Pentaho Data Integration ( PDI / Kettle) uma ferramenta para
integrao de dados, responsvel pelo processo de Extrao,
Transformao e Carga (ETL Extract, Transform, Load).
Pode ser usado como uma aplicao independente ou como parte da sute
do Pentaho.
Por se tratar de uma ferramenta de ETL, suas funcionalidades costumam
ser direcionadas para o desenvolvimento de Data Warehouse; porm
podem ser utilizadas nos seguintes aspectos:
Migrao de dados entre aplicaes ou base de dados;
Exportao de dados de banco para arquivos.
Limpeza de dados;
Integrao de aplicaes;
Automatizao de Processos.
www.it4biz.com.br
Instalao e Configuraes
www.it4biz.com.br
Instalao
Baixe e descompacte a verso compatvel com seu computador.
www.it4biz.com.br
Painel de Ferramentas
PAINEL DE
FERRAMENTAS
www.it4biz.com.br
rea de Desenvolvimento
rea de
Desenvolvimento
www.it4biz.com.br
Configurao do Repositrio
Ao abrir o PDI ser exibida a tela de conexo ao repositrio:
A conexo ao repositrio permite que voc salve suas Transformaes e Jobs
em um local de sua preferncia.
Caso no queira especificar um caminho neste momento, feche a janela de
conexo .
Esta ao, armazenar suas Transformaes e Jobs na mquina local.
Para adicionar o repositrio clique no sinal (+)
www.it4biz.com.br
Configurao do Repositrio
www.it4biz.com.br
Configurao do
Repositrio
Selecione uma das duas opes e clique em Ok.
www.it4biz.com.br
Configurao do
Repositrio
Clique em Novo para configurar uma nova conexo com seu
servidor.
www.it4biz.com.br
Configurao do
Repositrio
O software permite conexo com os principais banco de dados: Oracle, SQL
Server, MySQL, PostgreSQL, Firebird , IBM DB2, entre outros.
www.it4biz.com.br
Configurao do Repositrio
www.it4biz.com.br
Configurao do Repositrio
Clique em Ok, para prosseguir com a
configurao.
www.it4biz.com.br
Configurao do Repositrio
www.it4biz.com.br
Configurao do Repositrio
Clique em Create or upgrade para criar a estrutura necessria no
banco.
Clique em Execute Ok CancelOk
www.it4biz.com.br
Configurao do Repositrio
Clique em Create or upgrade para criar a estrutura necessria no
banco.
Clique em Execute Ok CancelOk
Organizando Pastas
www.it4biz.com.br
Repositrio Texto
Selecione a opo, conforme a imagem abaixo para configurar o repositrio
no modo texto (.ktr e .ktb). Clique OK
www.it4biz.com.br
Exportando Repositrio
Clique em Tools Repositrio Export Repository...
Salve no local desejado
www.it4biz.com.br
Importando Repositrio
www.it4biz.com.br
Importando Repositrio
Aps selecionar o arquivo a ser importado clique em Ok para informar o diretrio de
armazenamento do repositrio.
www.it4biz.com.br
Transformaes
www.it4biz.com.br
Jobs
O Job uma rotina que permite a execuo de uma ou mais transformaes
ou Jobs, alm de diversas outras aes.
www.it4biz.com.br
Step (Passo)
O step (passo) a unidade mnima dentro de uma Transformao.
Fundamentalmente existem trs tipos bsicos de passos:
1. Entrada;
2. Transformao;
3. Sada.
Os passos so facilmente criados utilizando o recurso de drag and drop
(arrastar e largar).
Uma lista agrupada em vrias categorias de passos, fica disponvel na rea
de ferramentas.
www.it4biz.com.br
Hop
Hop uma representao grfica do fluxo de dados entre dois passos.
A conexo entre dois steps pode ser criada clicando no passo de origem,
pressionando o boto shift, e arrastando o cursor at o passo destino.
www.it4biz.com.br
Transformaes e
Principais Steps (Passos)
Table Input
Crie sua conexo nomeie o step -- > Coloque sua consulta SQL (SQL Query)
Clique em Preview para verificar o resultado do select (Consulta SQL), Ok
para finalizar.
Table Output
Insert / Update
Configurar a conexo -- > informe que
tabela ser atualizada.
Dontt perform any update:
Se ativado, os valores no banco de
dados nunca sero atualizados, apenas
execuo de insert;
Informe a chave primria da tabela que
fonte dos dados e a chave primria da
tabela de destino;
Informe o nome do campo de origem e
o nome do campo que voc deseja
preencher com a informao.
Selecione Y ou N para configurar os
campos que sero atualizados
www.it4biz.com.br
Database Lookup
Configura a conexo, tabela de destino, chave e a condio para executar a
pesquisa no banco de dados.
Switch / Case
www.it4biz.com.br
Frmula
Este step permite a criao de formulas como campos calculados, campos com
valores constantes, condies lgicas, formatao de string, data, operadores de
comparao, entre outros.
www.it4biz.com.br
Replace in String
Java Script
Calculator
Call Procedure
Value Mapper
Mapping (sub-transformation)
Mapping (Input)
Input source step name: Nome do step de entrada na transformao Pai (No do
mapeamento);
Mapping target step name: Nome do step de entrada do mapeamento ( linha de
dados a ser mapeada);
Is this the main data path: Verifica se os campos acima esto vazios;
Ask these values to be renamed back on: Renomeia os arquivos antes de serem
enviados para o mapeamento.;
Step mapping description: Descrio do mapeamento.
www.it4biz.com.br
Mapping Output
Excel Input
Na aba Content, selecione o formato do arquivo ser importado (xls, xlsx ou ods).
www.it4biz.com.br
Excel Input
Excel Input
TXT Input
www.it4biz.com.br
TXT Output
TXT Output
CSV Input
Select Values
Get fields to select:
Seleciona os dados
automaticamente
Select & Alter: Altera o nome e especfica a ordem exata que os campos devem
aparecer na sada;
Remove: Especifica os campos que no sero exibidos na sada do step;
Meta-data: Altera nome, tipo, comprimento e preciso dos campos
www.it4biz.com.br
Jobs
Start
Transformation
Job
www.it4biz.com.br
File Exists
File Exists
www.it4biz.com.br
Table Exists
www.it4biz.com.br
SQL