Вы находитесь на странице: 1из 7

1.

INTRODUCCIN
Pentaho
es
un
conjunto
de
programas libres para
generar inteligencia
empresarial (Business Intelligence). Incluye herramientas integradas para generar
informes,
Spoon es el diseador grfico de transformaciones y trabajos del sistema de ETTLs de
Pentaho Data Integration (PDI. Est diseado para ayudar en los procesos ETTLs,
que incluyen la Extraccin, Transformacin, Transporte y Carga de dato, PDI facilita la
construccin, actualizacin, y mantenimiento de Data Warehouses.
En el siguiente informe realizaremos los pasos necesarios para crear nuestro cubo de
informacin o data Werehouse y los resultados para un posterior consulta de los
mismos.

2.

OBJETIVOS
1.

General
Generar un cubo de informacin de la base de datos FacturacionBD con la
herramienta spoon de Pentaho

2.

Especficos
Empezar a familiarizarse con la herramienta spoon de PDI para realizar el cubo
de informacin
Mostrar toda informacin indispensable de las facturas, para realizar consultas
de nuestro caso de estudio.

3.

MARCO TERICO
INTALACION DE SPOON EN LINUX - CENTOS
Para instalar Spoon seguir las siguientes instrucciones
1. Creamos un carpeta en /usr llamada pentaho y dentro de esta otra carpeta llamada
server y ubicamos todo el contenido de pdi-ce-5.0.1.A-stable,
2. Abrimos una consola.
3. Ingresamos a la siguiente direccin /usr/pentaho/server/data.integration
4. Una vez ah hacemos un ls para ver todos los archivos que contiene la carpeta.
5. Nos aparecer un archivo llamado spoon.sh al cual lo vamos a ejecutar poniendo el
siguiente comando ./spoon.sh.
6. Nos aparecer la pgina principal de spoon

7. Hacemos clic en cancelar ya que no tenemos ningn ejercicio realizado.


8. Iniciamos PG ADMIN III
9. Seleccionamos el esquema de ventas de la base de datos facturacin_db.
10. Nos ubicamos en la pestaa graphical query builder.
11. En la pantalla que nos aparece seleccionamos todos los campos a utilizar para
realizar nuestro cubo de informacin.

12. Una vez haber identificado los campos que queremos mostrar regresamos a la
herramienta spoon
13. Nos ubicamos en la pestaa Desing para iniciar con el diseo de nuestro cubo

14. Hacemos clic derecho en la opcin Conexiones a base de datos y creamos una
nueva yy le ponemos el nombre Facturacion_conexion

15. Probamos la conexin que est correcta y hacemos clic en ok

16. Hacemos otra conexin a la base de datos donde se va a almacenar los datos que
vamos a extraer con el nombre de dw_facturas_conexion de la misma manera.
17. Nos ubicamos en la carpeta entrada y arrastramos el icono entrada tabla.
18. Se nos mostrara la pantalla de configuracin de una entrada, colocamos el
nombre: extraer_informacion_facturas.
19. En conexin seleccionamos facturacin_conexion que se cre anteriormente.
20. En sql ponemos la sentencia sql para mostrar los datos que requeridos.
21. Damos clic en vale
21. Copiamos la consulta sql del pgadmin III

22. Nos ubicamos en la carpeta salida y arrastramos el icono salida de Excel. Y le


colocamos el nombre exportar_excel.
23. En la pestaa campos seleccionamos traer campos y clic en vale

24. En la carpeta transformar arrastramos el icono ordenar filas y en la pantalla de


configuracin ponemos el nombre ordenar filas
25. Seleccionamos el campo por qu se va a ordenar los datos.
26. En la opcin ascendente seleccionamos S en la opcin sensitive seleccionamos N
y damos clic en vale.

27. Nos ubicamos en la carpeta salida y arrastramos el icono salida tabla.


28. Colocamos el nombre: llenar_mi_dw.
29. En el esquema destino de mi base de datos selecionamos dw_facturas.
30. Creamos una nueva tabla con el nombre nuevas_facturas.

31. Seleccionamos la opcin Sql y le damos clic en execute, y luego en vale


32. Nos vamos a la opcin ejecutar de la pantalla principal y le damos clic
32 Si todo est correcto nos saldr los iconos con vistos de lo contrario verificar la
configuracin

33. Finalmente nos dirigimos a pgAdmin II y verificamos que los datos que extrajimos
estn correctos

4.

CONCLUSIONES
Hemos aplicado los conocimientos adquiridos en la catedra de base de datos III en el
tema de migracin de informacin hacia una nueva tabla

Para realizar la unin de datos utilizamos los INNER JOIN que con postgres en
sencillos realizarlos ya que tenemos la herramienta Graphical Query Builder
Con la herramienta spoon podemos tambin realizar una extraccin de datos hacia
una hoja de calculo
Para poder trabajar con la base de datos en la herramienta spoon tenemos que
realizar una conexin tanto a las bases que tengamos la informacin y a la base
donde vamos a extraerla.
5.

BIBLIOGRAFA (Normas APA)


Pentaho, disponible en:
http://wiki.pentaho.com/pages/viewpage.action?pageId=14844841