Академический Документы
Профессиональный Документы
Культура Документы
Datawarehouse
CEDW - Buenas Prcticas
Documento de Buenas Prcticas ODI
Versin: 1.0
Documento de Buenas Prcticas ODI : CEDW - Buenas Prcticas
1. Tabla de Contenidos
3. Alcance
Este documento aplica al desarrollo y aplicaciones de integracin de ODI, para el CEDW.
Lo definido en este documento debiera ser el ideal a considerar, para el buen desarrollo
de aplicaciones de integracin de sus datos y lograr finalmente un Data Warehousing que
responda con las expectativas del negocio, de la empresa y la toma de decisiones.
4. Audiencia
Este documento se encuentra dirigido a programadores, analistas, jefes de proyecto y
especialistas tcnicos del departamento de Reporting Corporativo, que tengan entre sus tareas
realizar el diseo de las aplicaciones, ejecucin de los procesos y carga de la metadata.
5. Qu es Integracin de Datos?
La integracin de datos la podemos definir como el proceso de combinar datos que
residen en diferentes fuentes y permitirle al usuario final tener una vista unificada de todos sus
datos. La habilidad de transformar datos interdepartamentales de fuentes heterogneas en un
plan de accin que se convertido en un reto y en una ventaja competitiva para compaas que
requieran la integracin de datos.
Oracle Data Integrator es una plataforma de integracin completa que cubre los
requisitos de integracin de datos. Maneja alto volumen, provee lotes de alto desempeo a
procesos dirigidos a eventos, a servicios de integracin basados en una arquitectura orientada
a servicios y con la capacidad de procesar eventos en tiempo real.
Ejemplo de Repositorio
9. Interfaces Grficas
Las Interfaces grficas de ODI son interfaces basadas en Java. Se pueden instalar en
cualquier plataforma que soporte una Mquina Virtual Java 1.4 (Windows, Linux, HP-UX,
Solaris, pSeries, etc.)
10. Repositorio
Los Repositorios de ODI generalmente se componen de un Master Repository,
principal y varios Work Repository. Los objetos desarrollados o configurados en ODI a
travs de las GUI, se almacenan en lo Work Repository.
Cuando el equipo de Desarrollo finaliza una versin del proyecto, este es exportado en
una nica versin al Master Repository. El equipo de Test importa esta versin para pruebas a
un Work Repository, lo cual le permite al equipo de desarrollo continuar con el trabajo en una
nueva versin. Cuando las pruebas de validacin realizadas por el equipo de Test son exitosas,
el equipo de Produccin importa los ejecutables de esta versin, ms bien llamados
escenarios, al repositorio final Execution Repository.
Sistemas de programacin externos tambin pueden llamar al agente para que ejecute los
escenarios desarrollados.
Gracias a la arquitectura E-LT de Oracle Data Integrator, el Scheduler Agent rara vez
realiza transformaciones. Por lo general, simplemente recupera el cdigo desde el Execution
Repository, y pide que los servidores de bases de datos o sistemas operativos lo ejecuten.
Despus de la ejecucin, el agente actualiza los registros en el repositorio, reportando
mensajes de error y las estadsticas de ejecucin del proceso.
En estricto rigor los roles en una empresa no son tan definidos ni exclusivos, como se
muestran en el cuadro anterior.
La vista lgica describe esquemas lgicos que representan los esquemas fsicos de las
aplicaciones existentes, independientemente de su implementacin fsica. Estos esquemas
lgicos son entonces vinculados a los recursos fsicos a travs de contextos.
Sistema de Teradata
Instancia Oracle
Base de datos IBM DB2
IBM DB2 iSeries Instancia
ODI utiliza controladores JDBC para conectarse a las fuentes de datos siguientes:
Bases de datos relacionales, tales como servidores Teradata, Oracle, IBM DB2,
Microsoft SQL Server, Sybase, Informix, MySQL, PostgreSQL, etc
Bases de datos de escritorio como Microsoft Access, Hypersonic SQL, Dbase, FoxPro,
Microsoft Excel, etc
Los archivos binarios ASCII o cuando se utiliza el controlador JDBC DE ODI para
archivos. Este requiere que el archivo sea cargado por un Agente ODI. Este controlador
no se utiliza cuando el agente llama a cargadores de bases de datos nativas como
FastLoad, multicarga, SQL * Loader, BCP, etc
Los archivos XML, utilizando ODI JDBC Driver para XML. Cualquier estructura de
archivos XML es convertido por este controlador en una estructura de base de datos
relacional (ya sea en la memoria o persistentemente en cualquier otra base de datos)
Directorios LDAP, utilizando ODI abierto Conector para LDAP.
Las bases de datos no relacionales, tales como IMS, ADABASE, DATACOM, VSAM, etc,
mediante el uso de adaptadores de otras marcas (iWay, Attunity, Software Hit son
ejemplos de proveedores de soluciones)
Definicin de cuentas de usuario o inicios de sesin de ODI para acceder a los servidores
de datos.
En los servidores de datos de destino, se debe crear un esquema dedicado a esta rea.
Con el fin de una mejor administracin de esta rea y evitar la contaminacin a los esquemas
fuentes o de destino. Aqu se almacenar:
Tablas temporales y vistas creadas durante la fase de carga si la fuente de datos no
estn en el mismo servidor que el objetivo (C $ tabla)
Tablas temporales creadas durante la fase de integracin en determinados Mdulos de
Conocimiento Integracin (I $ tabla)
Tablas de errores permanentes creadas durante la fase de control de calidad de los
datos usada por el KM de Check (E $ tabla)
Carga de tablas temporales creadas por los Mdulos de Conocimiento de carga -LKM
(generalmente precedido por C $)
Tablas de Integracin temporales creados por los mdulos de integracin de
conocimientos - IKM (por lo general prefijado por I $)
Tablas de errores permanente al utilizar datos de los mdulos de conocimiento de
calidad CKM (por lo general prefijado por E $)
16. Contextos
Los contextos se utilizan para agrupar los recursos fsicos que pertenecen al mismo
entorno. Una vez creado en topologa, se debe evitar el borrado o la modificacin del cdigo de
un contexto, ya que puede ser referenciado en uno o ms repositorios de trabajo. Un proyecto
tpico tendr muy pocos contextos (menos de 10). Estos pueden ser, por ejemplo:
A partir de este ejemplo, podemos ver que el servidor SRV_DEV tiene que ser definido en
dos ocasiones en la arquitectura fsica para que coincida con el entorno fsico real en produccin.
Por lo tanto los servidores de datos definidos SRV_DEV_CRM y SRV_DEV_SFA ambos referencian al
mismo servidor de datos SRV_DEV. De esta manera, el servidor de datos SRV_DEV se maneja
como 2 servidores independientes en la generacin de cdigo en el contexto del Desarrollo. As
este cdigo ser vlido cuando se ejecute en los servidores de produccin.
Un agente fsico puede ejecutar varias sesiones en paralelo (multi-threaded). Para fines
de optimizacin, se recomienda que ajuste el nmero mximo de sesiones simultneas que se
permite para ejecutar. Cuando este nmero mximo es alcanzado, cualquier nueva sesin
entrante se pondr en cola por el agente y ejecutado ms tarde cuando otras sesiones han
terminado.
Los agentes fsicos son parte de la arquitectura fsica. Por lo tanto, se puede optar por
tener diferentes agentes de acuerdo con su entorno y contextos. Para ello, definir un agente
lgico y vincularlo a varios agentes fsicos de acuerdo con el contexto. Al iniciar una sesin,
basta con indicar que el agente lgico y el contexto y ODI se traducirn a la direccin fsica del
agente.
ODI no distingue entre los modelos de origen y destino. Los modelos se guardan en el
Repositorio de trabajo y son la base para la creacin de reglas de negocio. Ellos centralizan los
metadatos del ncleo de sus sistemas.
Esta abstraccin permite ODI para conectar tericamente a cualquier fuente de datos.
Modelos referencia a una base de datos relacional se pueden rellenar automticamente de
las tablas y vistas de definicin del RDBMS a travs de la API JDBC. Para otros modelos,
debern definir los metadatos de forma manual o escribir una reverseengineering especfica KM
que pueble el repositorio de trabajo ODI desde una metadatos provista.
Carpetas: Las carpetas se utilizan para organizar los objetos desarrollados dentro de
un proyecto. Tenga cuidado al hacer referencia a los objetos a travs de las carpetas,
ya que puede conducir a importar temas / exportacin. Por ejemplo, trate de evitar la
referencia a las interfaces de otra carpeta dentro de un paquete de su carpeta actual
tanto como sea posible. Dentro de las carpetas tenemos:
o Interfaces: Los principales objetos donde el diseo de su transformacin
como reglas de negocio. Interfaces asignan varios almacenes de datos
heterogneos a una fuente almacn de datos de destino.
o Procedimientos: Compuesto por un conjunto de pasos que le permiten
ejecutar su propia cdigo especfico. Este cdigo puede ser SQL de base de
datos especfica (por ejemplo, PL / SQL o Transact SQL), los comandos del
sistema operativo, Java, Jython, o ODI comandos integrados (API ODI). Pasos
dentro de un procedimiento pueden mezclar llamadas a cualquiera de estos
idiomas programticas. Un mecanismo de control de transaccin es Tambin
disponible para los comandos de base de datos especfica.
o Packages: Los paquetes se utilizan para implementar un flujo de trabajo
tcnico integrado de varios pasos unidos entre s. Ellos definen la secuencia de
ejecucin de puestos de trabajo que va a liberar en la produccin.
Mdulos de Conocimiento, KM: La piedra angular para las interfaces de
construccin para rellenar objetivo almacenes de datos de fuentes heterogneas
Variables: Las variables definidas en un proyecto pueden ser utilizados en cualquier
lugar dentro de la alcance de ese proyecto. Ellos se pueden actualizar o consultar en
tiempo de ejecucin. Paquetes puede evaluar o cambiar su valor actual para
implementar estructuras de control. Las variables se pueden fijar como persistente que
se mantiene en tiempo de ejecucin mltiple sesiones.
Secuencias: Secuencias son objetos que pueden ser utilizados por el agente como un
ODI contrarrestar. Se pueden utilizar, por ejemplo, para asignar una calculada
automticamente nmero de serie a un campo de un almacn de datos. Sin embargo,
como los valores de secuencias son gestionados por el agente, usando los obliga una
carga de trabajo a procesar fila por fila en lugar de a granel, lo que puede dar lugar a
Nota:
Proyectos en la terminologa ODI no necesariamente coinciden con la definicin de empresa de un
proyecto. Se puede tener varios proyectos definidos en ODI, todos ellos pertenecientes al mismo
Proyecto "Almacenamiento de datos", por ejemplo, se puede tener un proyecto por reas de
negocio en lugar de un gran proyecto que contiene todo. Incluso se recomienda dividir su
desarrollo en varios proyectos pequeos que contengan menos de 300 objetos. De esta forma
mejorar la eficiencia de sus operaciones de control de versiones de importacin / exportacin.
Oracle Data Integrator provee una plataforma de integracin con capacidad de alto
desempeo y productividad el cual provee un alto grado de flexibilidad y modularidad. El Oracle
Data Integrator cumple con todas aquellas necesidades asociadas a la integracin de datos
incluyendo data Warehouse e inteligencia de negocios, integracin de procesos, migraciones y
todas aquellas iniciativas donde se requieran los datos correctos, en el lugar correcto en el
momento correcto