Академический Документы
Профессиональный Документы
Культура Документы
Da 2.
ETL. Pentaho Data Integration (Kettle)
Da 3.
Herramientas de anlisis. Mondrian. Agregation Designer
Da 4.
Pentaho Reporting. Report Designer. Pentaho Metadata
Da 5
Resolucin de ejercicios. Dudas. Repaso
Otras funcionalidades y herramientas ( Minera de Datos, Design
Studio, Dashboards)
Herramientas disponibles
VMWare Player
Mquina Virtual Windows XP
Introduccin
Proyectos OSBI
Datawarehouse
Pentaho.
Caractersticas
Arquitectura
Requisitos. Costes
Recursos.
Introduccin
Proyectos OSBI
Datawarehouse
Pentaho.
Caractersticas
Arquitectura
Requisitos. Costes
Recursos. Webs. Foros.
Informacin:
Conocimiento:
HIS
RIS
BD
Ficheros
Datawarehouse
Datamarts
Productos BI
Introduccin
Proyectos OSBI
Datawarehouse
Pentaho.
Caractersticas
Arquitectura
Requisitos. Costes
Recursos. Webs. Foros.
Proyectos OSBI
Pentaho
JasperSoft
BIRT
Talend
SpagoBI
Vanilla
OpenI
Introduccin
Proyectos OSBI
Datawarehouse
Pentaho.
Caractersticas
Arquitectura
Requisitos. Costes
Recursos. Webs. Foros.
Datawarehouse
BD OLTP (On-Line Transactional Processing)
Orientadas al procesamiento de transacciones
Optimizadas para Insercin, modificacin y
borrado de datos
Tpico en las bases de datos operacionales
Datos estructurados segn a nivel de aplicacin
Falta de uniformidad en el formato de los datos
Islas de datos
Historial de datos limitado
Datawarehouse
BD OLAP (On-Line Analytical Processing)
Orientadas al procesamiento analtico
Organizar informacin es una estructura dimensional
Optimizadas para accesos de lectura (consultas)
Pocas inserciones, actualizaciones o borrados
Lecturas de grandes cantidades de datos
Datos estructurados segn reas de negocio
Formato de datos uniforme
Historial de datos a largo plazo (2-5 aos)
Alimentadas desde procesos ETL
Utilizadas para implementar datawarehouse
Cubos OLAP: MEDIDAS Y DIMENSIONES
Datawarehouse
Datawarehouse
Datamarts
Versin especial de datawarehouse
Subconjunto de datos de un rea especfica
Orientado a consulta (OLAP). Rapidez.
Estructura ptima para anlisis del rea
Se alimenta de sus propias fuentes o del
datawarehouse
Poco volumen de datos
Datawarehouse
Caractersticas
Integrado
Temtico
Datos organizados por temas
Histrico
El tiempo es parte implcita en la informacin
No voltil
Los datos se leen, pero no se modifican
Metadatos (datos sobre los datos)
Datawarehouse
Construccin
Procesos ETL
Extraccin
Transformacin
Carga
Datawarehouse
Implementaciones OLAP
ROLAP ( Relational OLAP)
Datawarehouse
Operaciones OLAP
Roll (agregacin): permite eliminar un criterio
de agrupacin en el anlisis, agregando los
grupos actuales.
Datawarehouse
Drill (disgregacin): permite introducir un nuevo
criterio de agrupacin en el anlisis, disgregando
los grupos actuales.
Datawarehouse
Datawarehouse
Variantes Roll & Drill
Dimensiones sobre las que se ha definido una
jerarqua: DRILL-DOWN, ROLL-UP
Datawarehouse
Datawarehouse
Implantacin de ROLAP (La que utilizaremos)
Tabla de hechos (fact table)
Datawarehouse
Modelo de datos en estrella
Datawarehouse
Modelo de datos en copo de nieve
Datawarehouse
Modelo con dimensiones degeneradas
Campo de la tabla de hechos es criterio de anlisis
No existe una tabla de dimensin asociadas
Suelen ser valores nicos y poco agrupables
!"#
#)*
,-.
$%&
&+
&
'!('!("'!'
!'
&
'!('!("'!'
#'
'!('!("'!'
)'
Datawarehouse
Tabla de hechos Recomendaciones
No utilizar claves compuestas
Definir correctamente la clave primaria (ndice)
Utilizar tipos de datos apropiados
Utilizar si es necesario, campos de apoyo
No guardar campos que se puedan calcular
Nombres de campo amigables
Introduccin
Proyectos OSBI
Datawarehouse
Pentaho.
Caractersticas
Arquitectura
Requisitos. Costes
Recursos
Pentaho
Caractersticas
Plataforma BI Open Source y Libre
Versin 5.0 (Pentaho Business Analytics)
Tecnologa Java
Integra proyectos solventes (Kettle, Mondrian)
Extensa y activa comunidad
Desarrollo activo. Versionado frecuente
Versin Enterprise ms completa
Marketplace. Permite crear plugins a terceros
Enfoque hacia Big Data (Hadoop, NoSQL..)
Pentaho
Comparativa entre versiones(I)
Pentaho
Comparativa entre versiones(II)
Pentaho
Novedades:
Version 5, repositorio basado en Apache
Jackrabbit
0 JCR (Content Repository for Java )
0 JSR 170 y JSR 283
0 Contenido jerrquico, bsquedas, versiones...
Anteriores, repositorio basado en archivos.
0 Carpeta pentaho-solutions
0 Ms accesible. Menos caja-negra
Arquitectura
Pentaho
Pentaho
Bi Server
Java 100%. (Tomcat, Jetty)
Extensible, adaptable y configurable
Consola de administracin integrada (v. 5)
Mejora notablemente la consola de usuario
Permite webservices para integrar y explotar sus recursos
Ampliable mediante plugins de terceros y propios
Traduccin al espaol mejorable
Ms completo en versin EE
Consola de administracin ms completa en EE.
Pentaho
Bi Server
Pentaho
Informes. Pentaho Reporting
Motor basado en JFreeReport
Pentaho Report Designer. Intuitivo y sencillo
Informes con grficos, parmetros, etc.
Diferentes formatos (html, pdf, excel, csv)
Multiples origenes de datos
Puede utilizarse standalone.
Cdigo certificado y soporte solo en versin Enterprise
Pentaho
Informes. Pentaho Reporting
Pentaho
Pentaho Data Integration. ETL (Kettle)
Solucin ETL muy extendida y valorada
Solida y robusta
Gran facilidad de uso
Facilidad de mantenimiento
Flexibilidad en las transformaciones y trabajos
Se puede utilizar de manera independiente
Data Integration Server en Pentaho EE
Pentaho
Pentaho Data Integration. ETL (Kettle)
Pentaho
Anlisis OLAP. Mondrian
Mondrian. Motor OLAP de Pentaho
Se puede integrar de forma independiente
Mondrian es un motor HOLAP.
Pentaho
Visores OLAP - Anlisis
Jpivot. Robusto, fiable pero algo desfasado.
Version Community
Pentaho
Visores OLAP - Anlisis
Pentaho Analyzer. Ajax. Ms moderno y fcil.
Versin Enterprise
Pentaho
Visores OLAP - Anlisis
Saiku
Pentaho
Cuadros de Mando (Dashboards)
Dashboard Designer solo en EE.
Community Dashboards Framework
Html
Css
JavaScript
No permite cuadros de mando ad-hoc.
Ad-Hoc
Webdetail es la empresa que est detrs
Pentaho
Cuadros de Mando (Dashboards)
Pentaho
Minera de Datos
Pentaho utiliza Weka
Libreras para tareas de minera de datos
Herramientas de preproceso de datos
Algoritmos
De clasificacin
De segmentacin
De asociacin entre variables
Pentaho
Minera de Datos. Weka
Pentaho
Pentaho
1 Marketplace
Plugins de terceros
Conexin a internet sin proxy
Recursos
Pentaho
www.pentaho.com
http://infocenter.pentaho.com/
http://community.pentaho.com
www.todobi.com (Stratebi, partner Pentaho-Espaa)
http://forums.pentaho.com/ (Foro imprescindible)
http://wiki.pentaho.com/
www.dataprix.com/
IRC. Canal ##pentaho en Freenode
Libros
Pentaho
Algunos ejemplos
BI Hospital de Tomelloso
BI Demo Stratebi
Plataforma BI Pentaho
Instalacin y Configuracin de BI Server
Pentaho
Utilidad no oficial - Pentaho Launcher
Lanzador de aplicaciones Pentaho
Desarrollado para versiones anteriores
Configurar Java
JAVA_HOME=C:\Archivos de programa\Java\jdk1.6.0_01
PATH=C:\Archivos de programa\Java\jdk1.6.0_01\bin
Windows (biserver-ce\tomcat\bin\service.bat)
Linux (etc/rc.d/init.d/pentaho)
Iniciamos BI Server
Se inicia Tomcat
BD por defecto Hypersonic (HSQLDB)
URL http://localhost:8080
3 43 5 6
(78
( 6 9*:
78
:3 :
; 2( 3 43 5
mysql5.hibernate.cfg.xml
<property name="connection.driver_class">com.mysql.jdbc.Driver</property>
<property
name="connection.url">jdbc:mysql://<hostname>:3306/hibernate</property>
<property
name="dialect">org.hibernate.dialect.MySQL5InnoDBDialect</property>
<property name="connection.username">hibuser</property>
<property name="connection.password">password</property>
Descomentar:
<FileSystem class="org.apache.jackrabbit.core.fs.db.DbFileSystem"> <param
name="driver" value="com.mysql.jdbc.Driver"/> <param name="url"
value="jdbc:mysql://<hostname>:3306/jackrabbit"/> <param name="user"
value="jcr_user"/> <param name="password" value="password"/>
<param name="schema" value="mysql"/> <param
name="schemaObjectPrefix" value="fs_repos_"/>
</FileSystem>
Descomentar:
<DataStore
class="org.apache.jackrabbit.core.data.db.DbDataStore">
<param name="url"
value="jdbc:mysql://<hostname>:3306/jackrabbit"/>
<param name="user" value="jcr_user"/>
<param name="password" value="password"/>
<param name="databaseType" value="mysql"/>
<param name="driver"
value="com.mysql.jdbc.Driver"/>
<param name="minRecordLength" value="1024"/>
<param name="maxConnections" value="3"/>
<param name="copyWhenReading" value="true"/>
<param name="tablePrefix" value=""/>
<param name="schemaObjectPrefix"
value="ds_repos_"/>
</DataStore>
Descomentar:
<FileSystem class="org.apache.jackrabbit.core.fs.db.DbFileSystem">
<param name="driver"
value="com.mysql.jdbc.Driver"/>
<param name="url"
value="jdbc:mysql://<hostname>:3306/jackrabbit"/>
<param name="user" value="jcr_user"/>
<param name="password" value="password"/>
<param name="schema" value="mysql"/>
<param name="schemaObjectPrefix" value="fs_ws_"/>
</FileSystem>
Descomentar:
<PersistenceManager
class="org.apache.jackrabbit.core.persistence.bundle.MySqlPersistenceMan
ager">
<param name="url" value="jdbc:mysql://<hostname>:3306/jackrabbit"/>
<param name="user" value="jcr_user" />
<param name="password" value="password" />
<param name="schema" value="mysql"/>
<param name="schemaObjectPrefix" value="${wsp.name}_pm_ws_"/>
</PersistenceManager>
Descomentar:
<FileSystem class="org.apache.jackrabbit.core.fs.db.DbFileSystem">
<param name="driver" value="com.mysql.jdbc.Driver"/>
<param name="url" value="jdbc:mysql://localhost:3306/jackrabbit"/>
<param name="user" value="jcr_user"/>
<param name="password" value="password"/>
<param name="schema" value="mysql"/>
<param name="schemaObjectPrefix" value="fs_ver_"/>
</FileSystem>
52
4
;:
? 9 8@
2(
5 2(
EC :
:
(:
:
(
8
6@$
9
?@$
7
=
Renombrar el servidor
<param-name>fully-qualified-server-url</param-name>
<param-value>http://BISERVER1:8086/pentaho/</param-value>
Browse Files
Cada usuario tiene su propia carpeta personal
Carpetas pblicas
Asignar permisos sobre las carpetas y los archivos
4
4
B 4 (
(F 8
;:
7
7(
(7
(F
En pentaho-solutions/system
pentaho-solutions/system/pentaho-spring-beans.xml
pentaho-solutions/system/applicationContext-spring-security.xml
pentaho-solutions/system/applicationContext-spring-securityldap.xml
pentaho-solutions/system/applicationContext-pentaho-securityldap.xml
pentaho-solutions/system/pentaho.xml
Ms informacin
http://ramathoughts.blogspot.com/2010/02/bi-server-msactive-directory-in-10.html
http://wiki.pentaho.com/display/ServerDoc2x/Changing+to+
the+LDAP+Security+DAO
BI Server. Documentacin
Ayuda Documentacin
1 Ubicacin: biserver-ce\tomcat\webapps\pentaho\docs
Gracias