Вы находитесь на странице: 1из 22

Cmo utilizar PowerCenter con Teradata para cargar y

descargar datos

2009-2011 Informatica Corporation. Ninguna parte de este documento puede ser reproducida o transmitida en cualquier forma y por cualquier medio (electrnico,
fotocopia, grabacin o de otro tipo) sin el consentimiento previo de Informatica Corporation.
Abstracto

En este artculo se explica cmo mover datos entre bases de datos PowerCenter y Teradata. En l se explica cundo utilizar Teradata conexiones relacionales,
Teradata carga y descarga de los servicios pblicos, o la optimizacin de pila para mover datos. Tambin enumera los problemas que pueden surgir al cargar
datos desde o descarga de datos de Teradata y las soluciones.

Tabla de contenido

Visin de conjunto ................................................. .................................................. .................................................. ...................... 3

Requisitos previos ................................................. .................................................. .................................................. ............ 4

Conexiones Teradata relacionales ............................................... .................................................. ..................................... 5

Creacin de una conexin relacional Teradata ............................................. .................................................. .................. 6

Carga y descarga de utilidades independiente ............................................. .................................................. ................................ 6

Teradata FastLoad ................................................ .................................................. .................................................. ... 7

Teradata MultiLoad ................................................ .................................................. .................................................. ... 7

Teradata TPump ................................................ .................................................. .................................................. ....... 7

Teradata FastExport ................................................ .................................................. .................................................. . 8

Teradata Transportador paralelo ............................................... .................................................. .......................................... 8

Optimizacin de pila ................................................ .................................................. .................................................. 9

Lograr el pleno Pushdown sin afectar el sistema de origen .......................................... ....................................... 12

Lograr el pleno Pushdown con bsquedas paralelas ............................................ .................................................. .......... 13

El logro de Pushdown con Ordenada agregacin ............................................. .................................................. ............ 14

El logro de Pushdown para una transformacin Aggregator ............................................ ................................................ 14

El logro de Pushdown cuando una transformacin Contiene un puerto variable ......................................... ........................... 14

Mejora del rendimiento Pushdown en Asignaciones con objetivos mltiples .......................................... ............................ 14

Extraccin temporales Vistas cuando una sesin Pushdown falla .......................................... ........................................ 15

Cuestiones que afectan a la optimizacin Pushdown .............................................. .................................................. ................... diecisis

Problemas que afectan a la carga y descarga de Teradata .......................................... .................................................. . 17

Haciendo carga de 32 bits y descargar Utensilios de trabajo con 64 bits PowerCenter .................................... ................................ 17

Aumento del rendimiento de bsqueda ............................................... .................................................. ................................ 17

Realizar Bsquedas sin almacenar en cach con Fecha / Hora Puertos en la condicin de bsqueda ...................................... ................... 18

Reinicio de un Error MultiLoad trabajo manualmente ............................................ .................................................. ................. 19

Configuracin de sesiones que se carga a la misma mesa .......................................... .................................................. ....... 19

Ajuste del punto de control cuando se carga a canalizaciones con nombre .......................................... .................................................. . 20

Cargando con particiones de Sesiones .............................................. .................................................. ............................. 20

Cargando a los objetivos con columnas Fecha / Hora .......................................... .................................................. ................. 20

Ocultando las contraseas ................................................ .................................................. .................................................. ... 21

Uso de tablas de error para identificar los problemas durante la carga .......................................... .................................................. 21

2
Visin de conjunto
Teradata es un lder mundial en tecnologa de almacenamiento de datos de la empresa, anlisis de negocios y servicios de almacenamiento de datos. Teradata
ofrece un potente conjunto de software que incluye la base de datos Teradata, herramientas de acceso y gestin de datos y aplicaciones de minera de datos.
PowerCenter trabaja con la base de datos Teradata y las herramientas de Teradata para proporcionar una solucin de integracin de datos que le permite
integrar datos de prcticamente cualquier sistema de negocio en Teradata, as como datos de Teradata apalancamiento para su uso en otros sistemas
empresariales.

PowerCenter utiliza las siguientes tcnicas al extraer datos de, y la carga de datos a la base de datos Teradata:

ETL ( extraer, transformar, y la carga). Esta tcnica extrae datos de los sistemas de origen, transforma los datos dentro de PowerCenter, y lo carga a
TARGET tablas. El Servicio de Integracin PowerCenter transforma todos los datos. Si se utiliza la opcin PowerCenter creacin de particiones, el
Servicio de integracin tambin paraleliza la carga de trabajo.

ELT ( extraer, de carga, y luego transformar). Esta tcnica extrae datos de los sistemas de origen, cargas a UserDefined estadificacin tablas en la base
de datos destino, y transforma los datos dentro del sistema de destino mediante SQL generado. Las consultas SQL incluyen una insercin definitiva en
las tablas de destino. El sistema de base de datos transforma todos los datos y paraleliza la carga de trabajo, si es necesario.

ETL-T ( ETL y hbrido ELT). Esta tcnica extrae datos de los sistemas de origen, transforma los datos dentro de PowerCenter, carga los datos a tablas de
etapas definidas por el usuario en la base de datos de destino y, adems, transforma los datos dentro del sistema de destino mediante SQL generado. Las
consultas SQL incluyen una insercin definitiva en las tablas de destino. La tcnica ELT-T est optimizado dentro de PowerCenter para que las
transformaciones que llevan a cabo mejor en el sistema de base de datos se pueden realizar all y la integracin de servicios realiza las otras
transformaciones.

Para llevar a cabo las operaciones de ETL, configurar sesiones de PowerCenter para utilizar una conexin relacional Teradata, una carga independiente
de Teradata o descargar la utilidad, o Teradata Transportador paralelo. Para utilizar tcnicas ELT o ETL-T, configurar sesiones de PowerCenter a utilizar la
optimizacin de pila.

Utilizar una conexin relacional Teradata para comunicarse con Teradata cuando PowerCenter carga sesiones o extraer pequeas cantidades de datos (<1 GB
por sesin). Teradata conexiones relacionales utilizan ODBC para conectarse a Teradata. ODBC es una interfaz nativa para Teradata. Teradata ofrece 32 y
controladores de 64 bits ODBC para plataformas Windows y UNIX. El modo de punta de destornillador debe ser compatible con el modo de bits de la plataforma
en la que se ejecuta el Servicio de Integracin PowerCenter. Por ejemplo, 32 bits PowerCenter slo funciona con controladores de 32 bits.

Utilice una carga independiente o descargar utilidad cuando el extracto de sesiones PowerCenter o cargar grandes cantidades de datos (> 1 GB por sesin). carga
y descarga de utilidades independiente pueden aumentar rendimiento de la sesin por la carga o la extraccin de datos directamente desde un archivo o una
tubera en lugar de ejecutar los comandos SQL para cargar o extraer los mismos datos. Todos carga Teradata independiente y descarga de utilidades son
totalmente paralelo para proporcionar un rendimiento ptimo y escalable para la carga de datos a o extraccin de datos de la base de datos Teradata.
PowerCenter trabaja con el Teradata FastLoad, MultiLoad, y los servicios pblicos de carga TPump y el Teradata FastExport descargar la utilidad.

Utilizar Teradata Transportador paralelo para sesiones de PowerCenter que deben cargar rpidamente o extraer grandes cantidades de datos (> 1 GB por
sesin). Teradata Transporter paralelo proporciona todas las capacidades de la carga independiente y descarga de utilidades, adems de que proporciona un
control ms granular sobre la carga o la descarga de proceso, las capacidades de vigilancia mejoradas, y la capacidad de soltar automticamente de registro,
error, y mesas de trabajo cuando una sesin se inicia . Teradata Transporter paralelo es un entorno paralelo, extracto de multi-funcin y carga que proporciona
acceso a PowerCenter usando una API abierta. Se puede cargar decenas de archivos a travs de un nico archivo de control. Tambin le permite distribuir la
carga de trabajo entre varias CPUs, lo que elimina los cuellos de botella en los procesos de carga y extraccin de datos.

Utilizar la optimizacin de pila para reducir la cantidad de datos transmitidos entre Teradata y PowerCenter o cuando la base de datos Teradata puede procesar
lgica de transformacin ms rpido que PowerCenter. optimizacin de pila mejora el rendimiento de la sesin empujando tanto lgica de transformacin posible
de la fuente de Teradata o base de datos de destino. PowerCenter procesa cualquier lgica de transformacin que no puede ser empujado a la base de datos. Por
ejemplo, empujando lgica de transformacin de filtro a la base de datos fuente puede reducir la cantidad de datos que se pasan a PowerCenter, que disminuye el
tiempo de la sesin de ejecucin. Cuando se ejecuta una sesin configurada para la optimizacin de pila, traduce el PowerCenter

3
la lgica de transformacin en las consultas SQL y enva las consultas a la base de datos de Teradata. La base de datos Teradata ejecuta las consultas
SQL para procesar la lgica de transformacin.

Requisitos previos

Antes de ejecutar las sesiones que se mueven datos entre PowerCenter y Teradata, es posible que desee instalar las herramientas de cliente de Teradata.
Tambin es necesario localizar el Teradata TDPID.

Herramientas de cliente de Teradata

herramientas de cliente de Teradata ayudan a comunicarse con las bases de datos y depurar problemas de Teradata que tienen lugar cuando se carga
una sesin de datos a los datos o extractos de la base de datos de Teradata.

Puede instalar las siguientes herramientas de cliente de Teradata:

BTEQ. Una de propsito general, la utilidad de lnea de comandos (similar a Oracle SQL * Plus) que le permite comunicarse con una o ms bases de
datos de Teradata.

Asistente SQL Teradata. Una herramienta basada en GUI que le permite recuperar datos de cualquier servidor de base compatible con ODBC y
manipular y almacenar los datos en las aplicaciones de escritorio. Teradata Queryman es la versin ms antigua de esta herramienta.

Instalar BTEQ o Teradata SQL Asistente para ayudarle a depurar los problemas que se producen al cargar y extraer a partir de Teradata. Ambas herramientas
estn incluidas en el paquete de utilidades de Teradata, que est disponible de Teradata.

TDPID

El Teradata TPDID indica el nombre de la instancia de Teradata y define el nombre de un cliente utiliza para conectarse a un servidor. Cuando se utiliza un
Transportador paralelo Teradata o una carga independiente o descargar la utilidad con PowerCenter, se debe especificar el TDPID en las propiedades de
conexin.

El Teradata TDPID aparece en el archivo hosts en las mquinas en las que el Servicio de Integracin y PowerCenter de ejecucin de cliente. Por defecto, el
archivo de hosts aparece en la siguiente ubicacin:

UNIX: / etc / hosts

De Windows:% SystemRoot% \ system32 \ drivers \ etc \ hosts *

* La ubicacin real se define en la clave de registro


HKEY_LOCAL_MACHINE \ SYSTEM \ CurrentControlSet \ Services \ Tcpip \ Parameters \ DatabasePath

El archivo hosts contiene la informacin de configuracin del cliente de Teradata. En una entrada del archivo hosts, la TDPID precede a la cadena COP1.

Por ejemplo, el archivo hosts contiene las siguientes entradas:

127.0.0.1 localhost demo1099cop1


192.168.80.113 td_1 custcop1
192.168.80.114 td_2 custcop2
192.168.80.115 td_3 custcop3
192.168.80.116 td_4 custcop4

La primera entrada tiene el demo1099. TDPID Esta entrada le dice a la base de datos de Teradata que cuando una herramienta de cliente hace referencia a la
instancia de Teradata demo1099, debe dirigir peticiones a localhost (direccin IP 127.0.0.1).

Las siguientes entradas tienen el mismo TDPID, Cust. Mltiples archivo hosts entradas con el mismo TDPID indica la instancia de Teradata est configurado
para equilibrar la carga entre los nodos. Cuando una herramienta de cliente intenta hacer referencia a Teradata instancia cust, la base de datos Teradata dirige
peticiones al primer nodo de la lista de inscritos, td_1. Si se tarda demasiado tiempo para el nodo que responde, la base de datos redirige la peticin a la
segunda nodo, y as sucesivamente. Este proceso evita que el primer nodo, td_1 se sobrecargue.

4
Conexiones Teradata relacionales
Teradata conexiones relacionales utilizan ODBC para conectarse a Teradata. PowerCenter utiliza el controlador ODBC para Teradata para recuperar metadatos
y leer y escribir en Teradata. Para establecer la conectividad ODBC entre Teradata y PowerCenter, instalar el controlador ODBC para Teradata en cada mquina
PowerCenter que se comunica con Teradata. El controlador ODBC para Teradata se incluye en las herramientas de Teradata y utilidades (TTU). Puede
descargar el controlador del sitio web de Teradata.

Utilizar una conexin relacional Teradata al extraer o cargar conjuntos de datos pequeos, generalmente <1 GB por sesin. En las sesiones que extraen o cargar
grandes cantidades de datos, una carga o descarga independiente de servicios pblicos o de Teradata Transportador paralelo es generalmente ms rpido que
una conexin relacional Teradata.

PowerCenter trabaja con el controlador ODBC para Teradata disponible en las siguientes versiones de TTU:

Versiones de PowerCenter Versiones TTU

7.0 - 8.1.1 8.1

8.5 y posteriores 8.2, 12.0

Para obtener ms informacin acerca de las versiones de TTU que trabajan con PowerCenter, consulte la TTU plataformas y versiones de los productos
compatibles documento, que est disponible desde Servicio @Your Teradata.

Sesiones que realizan bsquedas en las tablas de Teradata deben utilizar una conexin relacional Teradata. Si una sesin realiza una bsqueda en una tabla
grande, Teradata esttica, que podra ser capaz de aumentar el rendimiento mediante el uso de FastExport para extraer los datos a un archivo plano y la
configuracin de la sesin para buscar datos en el archivo plano.

Si experimenta problemas de rendimiento cuando se utiliza una conexin relacional Teradata, y que no desea utilizar una utilidad de carga o descarga, es
posible que pueda configurar sesiones de PowerCenter a utilizar la optimizacin de pila.

Si carga o extraer datos mediante una conexin relacional Teradata en UNIX, debe verificar la configuracin de variables de entorno y el archivo odbc.ini en la
mquina en la que se ejecuta el Servicio de Integracin. Para comprobar la configuracin variable de entorno, asegurar la ruta de Teradata ODBC precede al
conductor informacin de la ruta directa de datos en el PATH y variables de entorno de la ruta de biblioteca compartida. Coloque el camino Teradata antes de la
ruta directa de datos debido a que ambos conjuntos de software de ODBC utilizar algunos de los mismos nombres de archivo.

Para comprobar la configuracin del archivo odbc.ini, asegrese de que hay una entrada para el controlador Teradata ODBC en la seccin [orgenes de datos
ODBC] de odbc.ini. El siguiente extracto de un archivo odbc.ini muestra una entrada de controlador Teradata ODBC (tdata.so) en Linux:

[Orgenes de datos ODBC] intdv12


= tdata.so

[Intdv12]
Driver = / usr / ODBC / drivers / tdata.so Descripcin = NCR Teradata 3600
corriendo V12 DBCNAME = intdv12 SessionMode = Teradata de
Caracteres = UTF8 StCheckLevel = 0 = DateTimeFormat AAA LastUser =
Nombre de usuario Contrasea = = = Base de datos DefaultDatabase =

Para obtener ms informacin sobre la configuracin odbc.ini, consulte la Gua de configuracin PowerCenter y el ODBC Driver para Gua del usuario de
Teradata.

5
Creacin de una conexin relacional Teradata

Cuando se crea un objeto de conexin de Teradata (relacional) en el Administrador de flujo de trabajo, elegir la opcin Teradata, y no ODBC, como el tipo de
conexin en las propiedades de conexin. Cuando se elige Teradata como tipo de conexin, el Servicio de Integracin todava utiliza Teradata ODBC para
conectarse a Teradata.

Aunque ambos tipos de conexin ODBC y Teradata pueden funcionar, la integracin de servicios se comunica con la base de datos Teradata ms eficiente
cuando se elige el tipo de conexin de Teradata. Esto es especialmente cierto si se utiliza la optimizacin de pila en una sesin. Si utiliza la optimizacin de pila
en una sesin de Teradata con un tipo de conexin ODBC, el Servicio de Integracin genera mensajes de alerta al conductor de conexin de base de datos.

Para obtener ms informacin sobre cmo crear objetos de conexin en el Administrador de flujo de trabajo, consulte la Gua bsica de flujo de trabajo de
PowerCenter.

Carga y descarga de utilidades independiente


carga y descarga de Teradata independiente utilidades son herramientas rpidas y confiables que le ayudan a exportar grandes cantidades de datos de las bases
de datos de Teradata y archivos de destino de la sesin de carga en bases de datos de Teradata. Utilice una carga independiente o descargar utilidad cuando el
extracto de sesiones PowerCenter o cargar grandes cantidades de datos. carga y descarga de utilidades independiente son ms rpidas que las conexiones
relacionales de Teradata porque cargar o extraer datos directamente desde un archivo o una tubera en lugar de ejecutar comandos SQL para cargar o extraer los
datos.

PowerCenter trabaja con la siguiente carga y descarga de Teradata independiente utilidades:

FastLoad. Inserta grandes volmenes de datos en tablas vacas en una base de datos de Teradata.

MultiLoad. Actualizaciones, inserciones y eliminaciones upserts grandes volmenes de datos en tablas de Teradata vacos o pobladas.

TPump. Inserciones, actualizaciones, upserts, y borra los datos de las tablas de Teradata en-casi en tiempo real.

FastExport. Exporta grandes conjuntos de datos de las tablas de Teradata o vistas a PowerCenter.

Todos estos carga y descarga los servicios estn incluidos en las herramientas de Teradata y utilidades (TTU), disponible a partir de Teradata.

PowerCenter soporta todos estos carga independiente y descarga de servicios pblicos. Soporte para MultiLoad y TPump ha estado disponible desde
PowerCenter 6.0. Se agreg el soporte para FastLoad en PowerCenter 7.0. Se agreg el soporte para FastExport en PowerCenter 7.1.3.

Antes de poder configurar una sesin de utilizar una carga o descarga de servicios pblicos, crear un cargador o FastExport conexin (aplicacin) en el
Administrador de flujos de PowerCenter e introduzca un valor para el TDPID en los atributos de conexin. Para obtener ms informacin sobre cmo crear
objetos de conexin en PowerCenter, consulte la Gua bsica de flujo de trabajo de PowerCenter.

Para usar un programa de carga en una sesin, configurar la asignacin asociada a cargar a un objetivo de Teradata, configurar la sesin para escribir en un
archivo plano en lugar de una base de datos relacional, y seleccione la conexin del cargador para la sesin. Para utilizar FastExport en una sesin, configurar la
asignacin de extraer de una fuente de Teradata, configurar la sesin para leer desde FastExport en lugar de una base de datos relacional, y seleccione la
conexin FastExport para la sesin. Para obtener ms informacin sobre cmo configurar una sesin de utilizar una carga o descarga de utilidad, consulte la Gua
de flujo de trabajo avanzado PowerCenter.

Cuando se crean unas transferencias de datos de sesin entre Teradata y PowerCenter los siguientes archivos:

Un archivo de ensayo o tubo. PowerCenter crea un archivo de ensayo o canalizacin con nombre para la transferencia de datos en funcin de cmo
configurar la conexin. Las canalizaciones con nombre son generalmente ms rpido que la organizacin de archivos porque los datos son transferidos tan
pronto como aparece en la tubera. Si utiliza un archivo de ensayo, los datos no se transfiere hasta que todos los datos aparece en el archivo.

Un archivo de control. PowerCenter genera un archivo de control que contiene instrucciones para la carga o la extraccin de datos. PowerCenter crea el
archivo de control basado en el cargador o atributos FastExport configura para la conexin y la sesin.

Un archivo de registro. La utilidad de carga o de descarga crea un archivo de registro y escribe mensajes de error a la misma. El registro de la sesin
PowerCenter indica si la sesin se ejecut correctamente, pero no contiene la carga o la descarga de mensajes de error de servicios pblicos. Utilice el
archivo de registro para depurar los problemas que se producen durante la carga de datos o extraccin.

6
Por defecto, la estadificacin del cargador, control y archivos de registro se crea en el directorio de archivos de destino. La puesta en escena FastExport, el
control y los archivos de registro se crean en el directorio de archivos temporales PowerCenter. Para obtener ms informacin sobre estos archivos, consulte la
Gua de flujo de trabajo avanzado PowerCenter.

Teradata FastLoad
Teradata FastLoad es una utilidad de lnea de comandos que se carga rpidamente grandes cantidades de datos a tablas vacas en una base de datos de
Teradata. Utilice FastLoad para una carga inicial de alto volumen o para truncado de alto volumen y recargar operaciones.

FastLoad es la utilidad de carga ms rpido, pero tiene las siguientes limitaciones:

FastLoad utiliza varias sesiones para cargar datos, pero puede cargar datos en una sola tabla en una base de datos Teradata por puesto de trabajo.

Se bloquea tablas durante la carga de datos, evitando que otros y otras instancias de FastLoad el acceso a las tablas durante la carga de datos.

FastLoad slo funciona con mesas vacas sin ndices secundarios.

Slo se puede insertar datos.

Teradata MultiLoad
Teradata MultiLoad es una utilidad dirigida por rdenes de mantenimiento rpido y de alto volumen en varias tablas y vistas de una base de datos Teradata.
Cada instancia MultiLoad puede realizar mltiples insercin de datos, actualizar y borrar las operaciones en un mximo de cinco tablas o vistas diferentes.
MultiLoad optimiza las operaciones que rpidamente adquirir, procesar y aplicar los datos a las tablas de Teradata. Utilice MultiLoad de gran volumen, cargas de
datos incrementales.

MultiLoad tiene las siguientes ventajas:

MultiLoad es muy rpido. Puede procesar millones de filas en unos pocos minutos.

MultiLoad soporta inserciones, actualizaciones, upserts, elimina, y las operaciones basadas en datos en PowerCenter.

Se pueden utilizar variables y lgica condicional incrustar en archivos de control MultiLoad.

MultiLoad compatible con la recuperacin de error sofisticado. Se permite que los trabajos de carga que se reinicie sin tener que rehacer todo el trabajo
previo.

MultiLoad tiene las siguientes limitaciones:

MultiLoad est diseado para el ms alto rendimiento posible, lo que puede ser muy intensivo en recursos.

Se bloquea tablas durante la carga de datos, evitando que otros y otras instancias de MultiLoad el acceso a las tablas durante la carga de datos.

Debido a su naturaleza por etapas, hay potencialmente incmodas ventanas de tiempo cuando MultiLoad no puede ser detenido sin perder el
acceso a las tablas de destino.

Teradata TPump
Teradata TPump es una utilidad altamente paralelo que se puede mover continuamente los datos de fuentes de datos en tablas de Teradata sin bloquear la tabla
afectada. TPump soporta inserciones, actualizaciones, elimina, y las actualizaciones de controladores de datos. TPump adquiere bloqueos de hash de fila en una
tabla de base de datos en lugar de bloqueos de nivel de tabla, por lo que varias instancias TPump pueden cargar datos simultneamente a la misma mesa.
TPump se utiliza a menudo para goteo de carga una tabla de base de datos. Utilice TPump de bajo volumen, cargas de datos en lnea.

TPump tiene las siguientes ventajas:

TPump puede actualizar las tablas de bases de datos en tiempo casi real.

TPump carga continuamente los datos en tablas de Teradata sin bloquear las tablas afectadas, por lo que los usuarios pueden ejecutar consultas cuando
TPump se est ejecutando.

7
TPump es menos intensivas en recursos de MultiLoad porque no escribe en las tablas temporales.

Los usuarios pueden controlar la velocidad a la que se envan las declaraciones a la base de datos Teradata, lo que limita el consumo de recursos.

Es compatible con el procesamiento en paralelo.

TPump siempre se puede detener y todas sus cerraduras dej caer sin ningn efecto.

TPump no es tan rpido como los otros cargadores independientes para grandes cargas de volumen, ya que cambia el mismo bloque de datos varias veces.

Teradata FastExport
Teradata FastExport es una utilidad dirigida por rdenes, que utiliza mltiples sesiones de transferir rpidamente grandes cantidades de datos a partir de
fuentes de Teradata a PowerCenter. Utilice FastExport para extraer rpidamente los datos a partir de fuentes de Teradata.

FastExport tiene las siguientes ventajas:

Es ms rpido que las conexiones relacionales de Teradata en la extraccin de grandes cantidades de datos.

FastExport se puede ejecutar en modo de transmisin, lo que evita la necesidad de organizar el archivo de datos.

Puede cifrar la transferencia de datos entre FastExport y el servidor Teradata.

FastExport est disponible para las fuentes y de las actualizaciones de tuberas.

Cuando se crea una conexin FastExport, compruebe la configuracin de los siguientes atributos de conexin:

Cifrado de datos. Habilitar este atributo para cifrar la transferencia de datos entre el servidor y FastExport Teradata para que los usuarios no autorizados
no puedan tener acceso a los datos que se transfieren a travs de la red.

fracciones de segundo. Este atributo especifica la precisin de la parte decimal de los datos de fecha y hora. Para evitar el fracaso de sesin o la posible
corrupcin de datos, asegrese de que este valor coincide con la precisin marca de tiempo de la columna en la base de datos de Teradata.

Para obtener ms informacin sobre la configuracin de los atributos de conexin FastExport, consulte la Gua de flujo de trabajo avanzado PowerCenter.

Teradata Transportador paralelo


Teradata Transporter paralelo (PT) es una aplicacin de cliente que proporciona escalable, de alta velocidad, la extraccin de datos en paralelo, la carga, y
actualizacin. Utiliza y ampla las funciones y capacidades de la carga Teradata independiente y descarga de servicios pblicos. Teradata PT soporta un entorno
de programacin individual con diferentes operadores del sistema para la extraccin y carga de datos. Tambin es compatible con la extraccin masiva en
paralelo y la carga, por lo que si la particin de una sesin de Teradata PT, PT varias instancias de Teradata puede extraer o cargar grandes cantidades de
datos en las mismas tablas de bases de datos al mismo tiempo.

Para proporcionar la funcionalidad de la carga independiente y descarga de servicios pblicos, Teradata PT extractos o carga datos usando uno de los siguientes
operadores del sistema:

Exportar. Exporta grandes conjuntos de datos de las tablas de Teradata o vistas e importa los datos a PowerCenter para procesar utilizando
el protocolo FastExport.

Carga. cargas a granel grandes volmenes de datos en tablas de bases de datos de Teradata vacas usando el protocolo FastLoad.

Actualizar. Las actualizaciones por lotes, insertos, upserts, y borra los datos en tablas de bases de datos de Teradata utilizando el protocolo
MultiLoad.

Corriente. Continuamente actualizaciones, inserciones upserts, y borra los datos en tiempo casi real utilizando el protocolo TPump.

Teradata PT tiene las siguientes ventajas:

Teradata PT es de hasta 20% ms rpido que la carga Teradata independiente y descarga de servicios pblicos, a pesar de que utiliza los protocolos
subyacentes de las utilidades independientes.

8
Teradata PT compatible con la recuperacin de las sesiones que utilizan el operador corriente cuando la fuente de datos es repetible. Esta
caracterstica es especialmente til cuando se ejecuta sesiones en tiempo real y la transmisin de los cambios en Teradata.

Los usuarios pueden invocar Teradata PT a travs de un conjunto de APIs abiertos que se comunican con la base de datos directamente,
eliminando la necesidad de un archivo de ensayo o tubo y un archivo de control.

Teradata PT elimina la necesidad de invocar carga diferente y descargar utilidades para extraer y cargar datos.

PowerCenter comunica con Teradata PT usando PowerExchange para Teradata Transporter paralelo, que est disponible a travs de la solucin de
almacenamiento de datos de la empresa Informatica-Teradata. PowerExchange para Teradata Transportador paralelo fue lanzado con PowerCenter
8.1.1.

PowerExchange para Teradata Transporter paralelo proporciona una integracin entre bases de datos de PowerCenter y Teradata para la extraccin de datos y
de carga. PowerExchange para Teradata Transportador Paralelo ejecuta operadores Teradata PT directamente a travs de llamadas a la API. Esto mejora el
rendimiento mediante la eliminacin del archivo de ensayo o conexin con nombre. Tambin mejora la seguridad al eliminar el archivo de control, lo que no hay
necesidad de sobrescribir o almacenar las contraseas en el archivo de control. PowerExchange para Teradata Transportador paralelo compatible con la
recuperacin de sesin y flujo de trabajo. Tambin captura mensajes de error Teradata PT y los muestra en el registro de la sesin, por lo que no es necesario
para comprobar el archivo de registro de utilidad cuando se producen errores.

Antes de poder configurar una sesin para utilizar Teradata PT, debe debe crear una conexin Teradata PT (relacional) en el Administrador de flujo de trabajo e
introduzca un valor para el TDPID en los atributos de conexin. Para configurar una sesin para extraer los datos, configurar la asignacin asociada a leer de
Teradata, cambiar el tipo de lector para la sesin de Teradata lector Transportador paralelo, y seleccione la conexin de Teradata PT. Para configurar una
sesin para cargar datos, configurar la asignacin asociada a cargar a Teradata, cambiar el tipo de escritor para la sesin de Teradata paralela escritor
Transportador, y seleccione la conexin de Teradata PT. En las sesiones que se cargan a Teradata, tambin se puede configurar una conexin ODBC que se
utiliza para crear automticamente la tabla de recuperacin de la base de datos de destino y eliminar las tablas de registro, de error y de trabajo si falla una
sesin.

Para obtener ms informacin sobre el uso PowerExchange para Teradata Transportador paralelo, consulte la PowerExchange para Teradata Gua del
usuario Transportador paralelo.

Optimizacin de pila
Cuando se ejecuta sesiones que mueven datos entre bases de datos PowerCenter y Teradata, que podra ser capaz de mejorar el rendimiento de sesin
mediante la optimizacin de pila. optimizacin de pila le permite empujar lgica de transformacin PowerCenter para la fuente o base de datos Teradata
objetivo. El Servicio de Integracin PowerCenter traduce la lgica de transformacin en las consultas SQL y enva las consultas SQL a la base de datos. La base
de datos Teradata ejecuta las consultas SQL para procesar la lgica de asignacin. La integracin de servicios procesa cualquier lgica de asignacin no puede
empujar a la base de datos.

9
La siguiente figura ilustra cmo la optimizacin de pila que funciona con un sistema de base de datos Teradata:

ETL
servidor de datos
Repositorio
Repositorio , Entorno visual sin rendimiento ELT
Servidor cdigo. MPPbased.

el control de trabajos y la

explotacin forestal. escalabilidad

Completa metadatos
automtica.

linaje de extremo a Los datos de co-ubicacin.


extremo.

Hoy Procesamiento
ETL ELT
de pila
Instruccin Instruccin
s s

SQL

Puesta en escena Almacn

Teradata Fuente Teradata Target


Base de datos Base de datos

La siguiente figura muestra un mapeo en el que se puede aumentar el rendimiento mediante la optimizacin de pila:

Si configura este mapeo para la optimizacin de pila, el Servicio de Integracin genera una consulta SQL basada en la lgica de transformacin de filtro y
de bsqueda y empuja la consulta a la base de datos fuente. Esto mejora el rendimiento de la sesin, ya que reduce el nmero de filas enviadas a
PowerCenter. La integracin de servicios procesa la lgica de transformacin de Java, ya que no se puede empujar a la base de datos y carga los datos a
la meta.

Utilizar la optimizacin de pila para mejorar el rendimiento de las sesiones que utilizan conexiones relacionales de Teradata para conectarse a Teradata.
En general, la optimizacin de pila puede mejorar el rendimiento en la sesin de las siguientes circunstancias:

Cuando se reduce el nmero de filas pasaron entre Teradata y PowerCenter. Por ejemplo, empujando una transformacin de filtro a la
fuente de Teradata puede reducir el nmero de filas PowerCenter extrae de la fuente.

Cuando el servidor de base de datos es ms poderoso que el servidor de PowerCenter. Por ejemplo, empujando una transformacin expresin
compleja a la fuente o el destino mejora el rendimiento cuando el servidor de base de datos puede llevar a cabo la expresin ms rpido que el servidor
en el que se ejecuta el Servicio de Integracin.

Cuando la consulta generada puede tomar ventaja de los ndices creados previamente. Por ejemplo, empujando una transformacin Joiner a la
fuente de Teradata mejora el rendimiento cuando la base de datos puede unir tablas que utilizan los ndices y las estadsticas que PowerCenter no
puede tener acceso.

10
optimizacin de pila est disponible con la opcin de optimizacin de pila PowerCenter y ha sido apoyado desde PowerCenter 8.0. Para configurar una
sesin de utilizar la optimizacin de pila, elija un tipo de Pushdown optimizacin de las propiedades de sesin. Puede seleccionar uno de los siguientes
tipos de optimizacin de pila:

Ninguna. La integracin de servicios no empuja ninguna lgica de la transformacin de la base de datos.

Lado de la fuente. La integracin de servicios analiza el mapeo desde la fuente hasta el destino o hasta que se alcanza una transformacin aguas abajo
no se puede empujar a la base de datos. Empuja tanto lgica de transformacin posible de la base de datos fuente.

La integracin de servicios genera SQL en la forma siguiente:


SELECCIONAR DE fuente DNDE ( filtro / condicin de unin) AGRUPAR POR

Del lado del objetivo. La integracin de servicios analiza el mapeo de la diana de nuevo a la fuente o hasta que se alcanza una transformacin de aguas
arriba que no puede empujar a la base de datos. Empuja tanto lgica de transformacin posible de la base de datos destino.

La integracin de servicios genera SQL en la forma siguiente:


INSERTAR EN objetivo( ...) VALUES (? 1, SUPERIOR (?))

Completo. El Servicio de Integracin intenta empujar toda la lgica de la transformacin de la base de datos de destino. Si el Servicio de Integracin
no puede empujar toda la lgica de la transformacin de la base de datos, se realiza tanto del lado de la fuente y la optimizacin de pila del lado del
objetivo.

La integracin de servicios genera SQL en la forma siguiente:


INSERTAR EN objetivo( )SELECCIONAR DE fuente ...

$$ PushdownConfig. Le permite ejecutar la misma sesin con diferentes configuraciones de optimizacin de pila en diferentes momentos.

La integracin de servicios puede empujar la lgica para las siguientes transformaciones a Teradata:

Transformacin Tipos pushdown

agregador Lado de la fuente, completa

Expresin* Fuente lado, Target lado, completa

Filtrar Lado de la fuente, completa

Carpintero Lado de la fuente, completa

Lookup, conectado Lado de la fuente, completa

Operaciones de bsqueda, sin conectar Fuente lado, Target lado, completa

Router Lado de la fuente, completa

Clasificador Lado de la fuente, completa

fuente Calificador Lado de la fuente, completa

Objetivo -Lado de destino, completa

Unin Lado de la fuente, completa

actualizacin de la Estrategia Completo

* PowerCenter expresiones pueden ser empujados hacia abajo slo si hay una funcin de base de datos equivalente. Para solucionar
este problema, se puede introducir una anulacin SQL en el calificador fuente.

Cuando se utiliza la optimizacin de pila con sesiones que extraen de carga o de Teradata, es posible que tenga que modificar las asignaciones o
sesiones para aprovechar al mximo las posibles mejoras en el rendimiento con la optimizacin de pila. Tambin pueden surgir problemas si falla una
sesin de pila.

11
Por ejemplo, puede que tenga que realizar las siguientes tareas:

Lograr la optimizacin de pila completa sin afectar a la fuente. Para lograr la optimizacin de pila completo para una sesin en la que el origen y el
destino residen en diferentes sistemas de gestin de base de datos, puede organizar los datos de origen en la base de datos Teradata objetivo. Para
obtener ms informacin, consulte lograr el pleno Pushdown sin afectar el sistema de origen en la pgina 12.

Lograr la optimizacin de pila completa con las bsquedas paralelas. Para lograr la optimizacin de pila completo para una asignacin que contiene
las bsquedas paralelas, redisear el mapeo para serializar las operaciones de bsqueda. Para obtener ms informacin, consulte lograr el pleno
Pushdown con bsquedas paralelas en la pgina 13.

Lograr la optimizacin de pila con la agregacin ordenada. Para lograr la optimizacin de pila para una asignacin que contiene una transformacin
Clasificador antes de una transformacin Agregador, redisear el mapeo para eliminar la transformacin Clasificador. Para obtener ms informacin,
consulte El logro de Pushdown con Ordenada agregacin en la pgina 14.

Lograr la optimizacin de pila para una transformacin agregador de puertos de paso a travs. Para lograr la optimizacin de pila para una
asignacin que contiene una transformacin Aggregator con puertos de paso a travs, redisear el mapeo para eliminar el paso a travs de los
puertos de la transformacin Aggregator. Para obtener ms informacin, consulte El logro de Pushdown para una transformacin agregador en la
pgina 14.

Lograr la optimizacin de pila cuando una transformacin contiene un puerto variable. Para lograr la optimizacin de pila para una asignacin que
contiene una transformacin con un puerto variables, actualizar la expresin de eliminar el puerto variable. Para obtener ms informacin, consulte El
logro de Pushdown cuando una transformacin Contiene un puerto de variables en la pgina 14.

Mejorar el rendimiento de pila en asignaciones con mltiples objetivos. Para aumentar el rendimiento al utilizar la optimizacin de pila completo para
asignaciones con mltiples objetivos, puede organizar los datos de destino en la base de datos de Teradata. Para obtener ms informacin, consulte
Mejora del rendimiento Pushdown en Asignaciones con objetivos mltiples en la pgina 14.

Retire vistas temporales despus de una sesin que utiliza un SQL falla consulta. Si ejecuta una sesin de pila que utiliza una consulta SQL, y falla la
sesin, el Servicio de Integracin podra no dejar caer las vistas que crea en la base de datos fuente. Puede eliminar los puntos de vista de forma manual.
Para obtener ms informacin, consulte Extraccin temporales Vistas cuando una sesin Pushdown falla en la pgina 15.

Para obtener ms informacin acerca de la optimizacin de pila, consulte la Gua de flujo de trabajo PowerCenter avanzada y el PowerCenter Gua de
ajuste de rendimiento.

El logro de Pushdown completa sin afectar el sistema de origen


Puede organizar los datos de origen en la base de datos Teradata objetivo de lograr la optimizacin de pila completa. datos de origen etapa en el objetivo
cuando el mapeo contiene una fuente que no residen en el mismo sistema de gestin de base de datos como el objetivo de Teradata.

Por ejemplo, el siguiente asignacin contiene una fuente OLTP y un objetivo Teradata:

Dado que las tablas de origen y destino residen en diferentes sistemas de gestin de base de datos, no se puede configurar la sesin para la optimizacin de pila
completo tal y como es. Se podra configurar la sesin para la optimizacin de pila lado de la fuente, lo que empujara el filtro y la lgica de transformacin de
bsqueda a la fuente. Sin embargo, empujando lgica de transformacin a una fuente transaccional podra reducir el rendimiento de la base de datos fuente.

Para evitar los problemas de rendimiento causados por la lgica de transformacin empujando a la fuente, puede volver a configurar el mapeo para
organizar los datos de origen en la base de datos de destino.

12
Para lograr la optimizacin de pila completa, redisear el mapeo de la siguiente manera:

1. Crear un simple, de paso a travs de la asignacin de pasar todos los datos de origen a una tabla de ensayo en la base de datos Teradata objetivo:

Configurar la sesin para utilizar Teradata PT o una utilidad de carga independiente para cargar los datos en la tabla provisional. No configure la sesin
para utilizar la optimizacin de pila.

2. Configurar la asignacin original al leer de la tabla de ensayo:

Configurar la sesin para utilizar la optimizacin de pila completa. empuja la integracin de servicios de toda lgica de transformacin de la base de datos
Teradata, el aumento de rendimiento de la sesin.

Lograr el pleno Pushdown con bsquedas paralelas

El Servicio de Integracin PowerCenter no puede empujar hacia abajo la lgica de asignacin que contiene transformaciones de bsqueda paralelas. La
integracin de servicios procesa todas las transformaciones despus de una ramificacin del oleoducto cuando mltiples transformaciones de bsqueda estn
presentes en diferentes ramas de la tubera, y las ramas se unen aguas abajo.

Por ejemplo, la integracin de servicios no puede empujar a fondo la siguiente asignacin:

Para lograr la optimizacin de pila completa, redisear el mapeo de manera que las bsquedas son serializados de la siguiente manera:

Al serializar las transformaciones de bsqueda, la integracin de servicios genera una consulta SQL en el que las operaciones de bsqueda se convierten en
parte de una subconsulta. El Servicio de Integracin a continuacin, puede empujar toda la consulta a la base de datos fuente.

13
El logro de Pushdown con Ordenada Agregacin

La integracin de servicios no puede empujar una transformacin agregador de Teradata si se trata de aguas abajo de una transformacin Clasificador.
La integracin de servicios procesa la transformacin agregador.

Por ejemplo, la integracin de servicios no puede empujar hacia abajo la transformacin Agregador de la siguiente asignacin:

Redisear esta asignacin para lograr la optimizacin de pila completo o lado de la fuente, configurar la transformacin agregador de modo
que no utiliza la entrada ordenada, y retire la transformacin Clasificador. Por ejemplo:

El logro de Pushdown para una transformacin Aggregator

La integracin de servicios no puede empujar una transformacin agregador de Teradata si la transformacin agregador contiene puertos de paso a travs.
Para lograr lado de la fuente o la optimizacin de pila completo para una asignacin que contiene una transformacin Aggregator con puertos de paso a travs,
redisear el mapeo para eliminar el paso a travs de los puertos de la transformacin Aggregator.

El logro de Pushdown cuando una transformacin Contiene un Puerto Variable

La integracin de servicios no puede empujar hacia abajo lgica de transformacin cuando la transformacin contiene un puerto variable. Para lograr la
optimizacin de pila para una asignacin que contiene una transformacin con un puerto variables, actualizar la expresin de transformacin para eliminar el
puerto variable. Por ejemplo, una transformacin contiene una variable y un puerto de salida con las siguientes expresiones:

expresin de orificio variable: NET_AMOUNT = CANTIDAD - Tarifa

expresin puerto de salida: DOLLAR_AMT = NET_AMOUNT * TASA

Para lograr la optimizacin de pila para el mapeo, retire el puerto variable y volver a configurar el puerto de salida de la siguiente manera:

expresin puerto de salida: DOLLAR_AMT = (IMPORTE - FEE) * TASA

Mejora del rendimiento Pushdown en Asignaciones con objetivos mltiples

Si configura una asignacin que contiene lgica de transformacin compleja y mltiples objetivos para la optimizacin de pila completa, la integracin de servicios
genera una INSERT ... SELECT ... consulta SQL para cada objetivo. Esto hace que la optimizacin de pila ineficaz, ya que puede causar el procesamiento
duplicado de la lgica compleja transformacin dentro de la base de datos. Para mejorar el rendimiento de la sesin, redisear el mapeo inicial para organizar los
datos de destino en la base de datos de Teradata. A continuacin, crear una segunda cartografa que utiliza la tabla de etapas como la fuente.

14
Por ejemplo, el siguiente mapeo contiene dos fuentes de Teradata y dos objetivos Teradata, todos en el mismo RDBMS:

Para lograr la optimizacin de pila completa, redisear el mapeo de la siguiente manera:

1. Configurar la asignacin original al escribir en una tabla de etapas en la base de datos Teradata objetivo:

Configurar la sesin para utilizar la optimizacin de pila completa.

2. Crear un segundo mapeo para pasar todos los datos del objetivo a partir de la tabla de etapas a los objetivos de Teradata:

Configurar la sesin para utilizar la optimizacin de pila completa.

Extraccin temporales Vistas cuando una sesin Pushdown se produce un error

En una asignacin, la transformacin Fuente Calificador ofrece la opcin de consultas SQL para anular la consulta por defecto. Puede introducir una instruccin
SQL con el apoyo de la base de datos fuente. Cuando se reemplaza la consulta SQL predeterminada para una sesin configurada para la optimizacin de pila, el
Servicio de Integracin crea una vista para representar la anulacin de SQL. A continuacin, ejecuta una consulta SQL en esta vista para empujar la lgica de
transformacin de la base de datos.

Para utilizar una anulacin de SQL en una sesin configurada para la optimizacin de pila, habilitar la vista temporal para la opcin Pushdown en las propiedades
de sesin Permitir. Esta opcin permite la integracin de servicios para crear objetos de vista temporales en la base de datos cuando se empuja la sesin a la base
de datos. El Servicio de Integracin utiliza un prefijo de PM_V para los objetos de vista que crea. Cuando la sesin termina, el Servicio de Integracin cae la vista
desde la base de datos. Si la sesin no se realiza correctamente, la integracin de servicios podra no eliminar la vista.

Para buscar puntos de vista generados por la integracin de servicios, ejecute la siguiente consulta en la base de datos Teradata fuente:

NombreTabla SELECT DBC.Tables DONDE CreatorName


= USUARIO

15
Y TableKind = 'V'
Y NombreTabla COMO 'PM \ _V%' ESCAPE '\'

Para evitar problemas cuando se ejecuta una sesin de pila que contenga una anulacin de SQL, utilice las siguientes directrices:

Asegrese de que la sintaxis SQL de anulacin es compatible con la base de datos Teradata fuente. PowerCenter no valida la sintaxis, por lo que
probar la consulta antes de empujarlo a la base de datos.

No utilice una orden por clusula en la anulacin de SQL.

Usar combinacin externa ANSI sintaxis en la anulacin de SQL. Si la transformacin Fuente Calificador contiene Informatica combinacin externa de
sintaxis en la anulacin de SQL, el Servicio de Integracin procesa la lgica de transformacin Fuente Calificador.

Si la transformacin Fuente Calificador est configurado para una especie distinta y contenga una anulacin de SQL, el Servicio de Integracin ignora la
configuracin de una especie distinta.

Si el calificador Fuente contiene varias particiones, especifique la anulacin de SQL para todas las particiones.

No utilice una transformacin Secuencia generador en el mapeo. Teradata no tiene una funcin de generador de secuencias o el operador.

Cuestiones que afectan a la optimizacin Pushdown

Tenga en cuenta las siguientes cuestiones que pueden surgir cuando se utiliza la optimizacin de pila para mejorar el rendimiento de la sesin:

Cuando se ejecuta una sesin configurada para la optimizacin de pila completa y la sesin procesa una gran cantidad de datos, la base de datos debe
ejecutar una transaccin larga. Los siguientes problemas de rendimiento de base de datos pueden resultar de transacciones largas:

- Una transaccin de larga utiliza ms recursos de bases de datos.

- Una transaccin largo bloquea la base de datos durante periodos de tiempo ms largos, lo que reduce la concurrencia base de datos y aumenta
la probabilidad de interbloqueo.

- Una transaccin de tiempo puede aumentar la probabilidad de que se puede producir un evento inesperado.

Cuando el servidor de base de datos realiza las transacciones, la informacin del tiempo de sesin en los registros de sesin se basa en la hora del
servidor de base de datos. La informacin de tiempo como el tiempo de inicio de la sesin, la zona horaria y la fecha y hora generados cuando una
transaccin se ejecuta en el servidor de base de datos puede ser diferente de la informacin de tiempo generada cuando la transaccin se ejecuta en el
servidor que aloja PowerCenter.

Las transacciones realizadas por la base de datos pueden producir resultados diferentes a las transacciones realizadas por el Servicio de
Integracin. Los resultados pueden diferir en las siguientes reas:

- flotar aritmtica

- Los valores nulos

- orden de clasificacin

- maysculas y minsculas

- Numrico para la conversin de caracteres

- Precisin

Por ejemplo, la precisin numrica predeterminada para Teradata es diferente de la precisin numrica predeterminada para PowerCenter. Un tipo de
datos PowerCenter transformacin decimal tiene una precisin de 1-28. El tipo de datos de Teradata correspondiente decimal tiene una precisin de 1-18.
Los resultados pueden variar si la base de datos utiliza una precisin diferente a la integracin de servicios.

La integracin de servicios no puede realizar un seguimiento de los errores que se producen en la base de datos. Cuando el Servicio de Integracin dirige
una sesin configurada para la optimizacin de pila llena y se produce un error, la base de datos maneja los errores. Cuando la base de datos se encarga
de errores, el Servicio de Integracin no escribe rechazar filas en el archivo de rechazo.

diecisis
La integracin de servicios no puede rastrear todos los eventos que ocurren en el servidor de base de datos. La integracin de servicios no escribe los
detalles de las transformaciones procesados por la base de datos para el registro de la sesin. Las estadsticas que la integracin de servicios puede
rastrear dependen del tipo de optimizacin de pila y determinar el contenido del registro de la sesin.

El registro de la sesin tiene los siguientes contenidos basados en el tipo de optimizacin de pila utilizada en la sesin:

- El registro de la sesin no contiene el porcentaje ocupado hilo cuando la sesin est configurado para la optimizacin de pila completa.

- El registro de la sesin no contiene el nmero de filas ledas de la fuente cuando el Servicio de Integracin utiliza la optimizacin de pila
completa.

- El registro de sesin contiene el nmero de filas ledas despus de que fuentes se optimiza cuando el Servicio de Integracin utiliza la optimizacin
de pila lado de la fuente.

Problemas que afectan a la carga y descarga de Teradata


En esta seccin se describen los problemas que pueden surgir al mover datos entre PowerCenter y Teradata.

Hacer 32 bits carga y descarga de los utensilios de trabajo con 64 bits PowerCenter

Se aplica a: FastLoad, MultiLoad, TPump, FastExport

Si utiliza 64 bits PowerCenter, es necesario restablecer la ruta de la biblioteca para hacer el trabajo PowerCenter con la carga de Teradata the32 bits y
descarga de los servicios pblicos. Debe restablecer la ruta de la biblioteca antes de poder ejecutar una sesin que invoca una carga o descarga elctrica.

Para restablecer la ruta de la biblioteca, es necesario sustituir el cargador o ejecutable FastExport con un script de shell. El siguiente procedimiento explica
cmo restablecer la ruta de la biblioteca de TPump en AIX. Se puede utilizar el mismo mtodo para restablecer la ruta de biblioteca para las otras utilidades en
Linux u otros sistemas operativos UNIX.

Para restablecer la ruta de la biblioteca:

1. Crear un script como el siguiente llamado < ejecutable> _infa, por ejemplo, tpump_infa:
# ! / Bin / sh
LIBPATH = / usr / lib; exportacin LIBPATH COPLIB = /
usr / lib; COPLIB exportacin COPERR = / usr / lib;
COPERR exportacin
PATH = $ PATH: $ INFA_HOME / servidor / infa_shared / TgtFiles ejecutivo tpump "$ @"
salida $?

2. En la conexin del cargador en el Administrador de flujo de trabajo, establezca el atributo externo del cargador ejecutable (para un programa de carga) o
el atributo nombre del ejecutable (por FastExport) al nombre del script de shell. As que para Tpump, cambiar el cargador externo ejecutable de tpump a
tpump_infa.

Aumento del rendimiento de bsqueda

Se aplica a: Teradata conexiones relacionales, FastExport

Sesiones que realizan bsquedas en las tablas de Teradata deben utilizar conexiones relacionales de Teradata. Si experimenta problemas de rendimiento
cuando se ejecuta una sesin que realiza bsquedas en contra de una base de datos Teradata, es posible que pueda para aumentar el rendimiento de las
siguientes maneras:

Utilice FastExport para extraer datos a un archivo plano y realizar la bsqueda en el archivo plano.

Activar o desactivar la cach de bsqueda.

17
Usando FastExport extraer los datos de bsqueda

Si una sesin realiza una bsqueda en una tabla grande, Teradata esttica, que podra ser capaz de aumentar el rendimiento mediante el uso de FastExport
para extraer los datos a un archivo plano y la configuracin de la sesin para buscar datos en el archivo plano.

Para ello, redisear el mapeo de la siguiente manera:

1. Crear un simple, de paso a travs de la cartografa para pasar los datos de bsqueda en un archivo plano. Configurar la sesin para extraer datos
en el fichero plano utilizando FastExport.

2. Configurar la asignacin original al realizar la bsqueda en el archivo plano.

Nota: Si a redisear el mapeo utilizando este procedimiento, puede aumentar an ms el rendimiento mediante la especificacin de una clusula ORDER BY
en la FastExport SQL y permite la propiedad de entrada ordenados para el archivo de bsqueda. Esto evita PowerCenter de tener que ordenar el archivo
antes de rellenar la cach de bsqueda.

Cmo activar o desactivar la cach de bsqueda

En las sesiones que realizan bsquedas en las tablas de Teradata, tambin puede ser capaz de aumentar el rendimiento mediante la activacin o desactivacin de
la cach de bsqueda. Cuando se habilita el almacenamiento en cach de bsqueda, el Servicio de Integracin consulta la fuente de consulta una vez, almacena
en cach los valores, y mira hacia arriba los valores en la memoria cach durante la sesin. Las operaciones de bsqueda utiliza ODBC para poblar la memoria
cach. Al deshabilitar el almacenamiento en cach de bsqueda, cada vez que una fila pasa a la transformacin, la integracin de servicios emite una instruccin
de seleccin de la fuente de consulta para los valores de bsqueda.

Activacin de la cach de bsqueda tiene las siguientes ventajas:

La integracin de servicios puede buscar en la memoria cach muy rpidamente.

Cachs pueden mantenerse completamente en la memoria.

El uso de un cach de bsqueda impide la integracin de servicios de hacer muchas llamadas separadas en el servidor de base de datos.

El resultado de la consulta de bsqueda y el procesamiento es el mismo, si est o no en cach la tabla de bsqueda. Sin embargo, el uso de un cach de
bsqueda puede aumentar el rendimiento de la sesin de datos relativamente estticos en las tablas de bsqueda ms pequeos. En general, es mejor para
almacenar en cach las tablas de bsqueda que necesitan menos de 300 MB.

Por los datos que cambian con frecuencia o se almacena en las tablas de bsqueda ms grandes, deshabilitar el almacenamiento en cach puede mejorar el
rendimiento global. No almacenar en cach las tablas de consulta en las siguientes circunstancias:

Las tablas de bsqueda son tan grandes que no se pueden almacenar en el sistema local.

No hay suficientes nodos o bloques para guardar los archivos de cach.

No se le permite guardar archivos de cach en el sistema de Informatica.

La cantidad de tiempo necesario para construir la memoria cach es superior a la cantidad de tiempo ahorrado por el almacenamiento en cach.

Para activar o desactivar la cach de bsqueda, activar o desactivar el almacenamiento en cach de bsqueda de opcin Activado en las propiedades de
transformacin de bsqueda. Para obtener ms informacin acerca de la cach de bsqueda, consulte la Gua Transformacin PowerCenter
y el Gua de ajuste del rendimiento de PowerCenter.

Realizar Bsquedas sin almacenar en cach con la fecha / puertos de horario en la condicin de bsqueda

Se aplica a: conexiones relacionales de Teradata

Cuando el Servicio de Integracin realiza una bsqueda en cach en una base de datos Teradata, la sesin falla si cualquier puerto transformacin en la
condicin de bsqueda contiene un puerto de fecha / hora. El Servicio de Integracin escribe el siguiente mensaje de error Teradata para el registro de la
sesin:

[] [Controlador ODBC Teradata] [Teradata RDBMS] operacin no vlida en una fecha y hora ANSI o valor de intervalo.

18
Para solucionar este problema, realice cualquiera de las siguientes acciones:

Aplicar el parche Teradata ODBC 3.2.011 o posterior y retire NoScan = S a partir del archivo odbc.ini.

Configurar la transformacin Bsqueda usar una cach de bsqueda o eliminar el puerto de fecha / hora a partir de la condicin de bsqueda.

No se pudo reiniciar un trabajo manualmente MultiLoad

Se aplica a: MultiLoad

Al cargar los datos, MultiLoad pone la tabla de destino en el estado MultiLoad y crea una tabla de registro de la tabla de destino. Despus de cargar
correctamente los datos, devuelve la tabla de destino al estado normal (no MultiLoad) y borra la tabla de registro. Al cargar datos utilizando MultiLoad, y el trabajo
MultiLoad falla por cualquier razn, MultiLoad informa de un error, y deja la tabla de destino en el estado MultiLoad. Adems, MultiLoad consulta la tabla de
registro para comprobar si hay errores. Si una tabla de destino est en el estado MultiLoad o si existe una tabla de registro de la tabla de destino, no se puede
reiniciar el trabajo.

Para recuperarse de un trabajo MultiLoad fallado, debe liberar la tabla de destino del estado MultiLoad y soltar la tabla de registro MultiLoad. Para
ello, escriba los siguientes comandos utilizando BTEQ o Teradata Asistente SQL:

eliminar la tabla <nombre de tabla> mL; liberacin


mload <nombre de tabla>;

Tenga en cuenta que PowerCenter aade el prefijo mL al nombre de la tabla de registro MultiLoad. Si utiliza un archivo de control MultiLoad codificado a
mano, la tabla de registro puede tener cualquier nombre.

Por ejemplo, para recuperarse de un trabajo fallido que intent cargar los datos a la mesa td_test propiedad de usuario infatest, introduzca los siguientes
comandos utilizando BTEQ:

BTEQ - Introduzca su solicitud DBC / SQL o BTEQ comando: drop table


infatest.mldlog_td_test;

caer infatest.mldlog_td_test mesa;

* * * Tabla se ha cado.
* * * tiempo total transcurrido fue 1 segundo.

BTEQ - Introduzca su solicitud DBC / SQL o BTEQ comando: liberacin infatest.td_test


mload;

liberar infatest.td_test mload;

* * * Mload ha sido puesto en libertad.


* * * tiempo total transcurrido fue 1 segundo.

Sesiones Configuracin que se carga a la misma mesa

Se aplica a: MultiLoad

Mientras que las cargas de Teradata MultiLoad datos a una tabla de base de datos, bloquea la tabla. MultiLoad requiere que todas las instancias manejan esperar
acontecimientos para que no se tratan de acceder a la misma mesa al mismo tiempo.

Si tiene varias sesiones de PowerCenter que se cargan a la misma tabla de Teradata utilizando MultiLoad, establezca el atributo Tenacidad para la sesin en un
valor que es mayor que el tiempo de ejecucin esperado de la sesin. El atributo Tenacidad controla la cantidad de tiempo que un ejemplo MultiLoad espera a
que la mesa est disponible. Tambin configurar cada sesin para utilizar nombres de archivo de registro nico.

Para obtener ms informacin sobre el atributo Tenacidad, consulte la Gua de flujo de trabajo avanzado PowerCenter.

19
Ajuste del punto de control cuando se carga a canalizaciones con nombre

Se aplica a: FastLoad, MultiLoad, TPump

Si configura una sesin para cargar a Teradata utilizando una tubera con nombre, establezca el atributo del cargador puesto de control a 0 para evitar que el
cargador pueda realizar operaciones de punto de control. cargadores de Teradata utilizan los valores de punto de control para recuperar o reiniciar un trabajo
cargador fallado. Cuando un trabajo de cargador que utiliza un archivo de ensayo falla, puede reiniciar desde el ltimo punto de control. Cuando el cargador utiliza
una tubera con nombre, no se utilizan puntos de control.

Estableciendo el atributo puesto de control a 0 el rendimiento aumenta cargador, ya que el trabajo de cargador no tiene que llevar un registro de los puntos de
control. Tambin evita los errores de tubera rota y fracasos de sesin que pueden ocurrir cuando un puesto de control distinto de cero se utiliza con una tubera
con nombre.

Carga de Sesiones con particiones


Se aplica a: FastLoad, MultiLoad

Al configurar varias particiones en una sesin que utiliza archivos de ensayo, la integracin de servicios crea un archivo plano separado para cada particin. Desde
FastLoad y MultiLoad no pueden cargar datos de mltiples archivos, utilice la particin de round-robin para enrutar los datos a un nico archivo. Al hacer esto, el
Servicio de Integracin escribe todos los datos a la primera particin y comienza slo una instancia de FastLoad o MultiLoad. Se escribe el mensaje siguiente en el
registro de la sesin:

Mapping> DBG_21684 Target [TD_INVENTORY] no soporta mltiples particiones. Todos los datos sern enviados a la primera particin.

Si no lo hace la ruta de los datos en un solo archivo, la sesin se produce el siguiente error:

WRITER_1 _ * _ 1> WRT_8240 de error: El cargador externo [Teradata Mcarga cargador] no admite sesiones con particiones. WRITER_1 _ *
_ 1> Jue Jun 16 de 2005 11:58:21

WRITER_1 _ * _ 1> inicializacin WRT_8068 escritor fracasado. terminacin escritor.

Para obtener ms informacin sobre la carga de las sesiones de particiones, consulte la Gua de flujo de trabajo avanzado PowerCenter.

Cargando a los objetivos con Fecha / Hora Columnas

Se aplica a: FastLoad, MultiLoad, TPump, Teradata PT

El formato de fecha objetivo determina el formato en el que las fechas se pueden cargar en la columna. PowerCenter slo admite un conjunto limitado de
formatos de fecha Teradata. Por lo tanto, debe comprobar el formato de fecha objetivo de evitar problemas al cargar los datos de fecha / hora.

Cuando se crea una columna de fecha / hora en una tabla de base de datos Teradata, se especifica el formato de visualizacin de los valores de fecha / hora. El
formato que seleccione determina el formato en el que los valores de fecha / hora se visualizan mediante herramientas de cliente de Teradata, as como el
formato en el que los valores de fecha / hora se pueden cargar en la columna. Por ejemplo, una columna de una tabla de Teradata tiene el formato de fecha
aaaa / mm / dd. Si ejecuta una sesin de PowerCenter que carga una fecha con el formato dd / mm / aaaa en la columna, la sesin falla.

Antes de ejecutar una sesin que carga los valores de fecha / hora a Teradata, verificar que el formato de cada columna de fecha / hora en el mapeo coincide
con el formato de la columna de fecha / hora correspondiente en el objetivo de Teradata. Si los valores de las cargas de sesin en varias columnas de fecha /
hora, comprobar el formato de cada columna de fecha / hora en el objetivo, porque diferentes mesas menudo utilizan diferentes formatos de fecha / hora. Puede
utilizar Teradata BTEQ o Asistente SQL para comprobar el formato de una columna de fecha / hora en una base de datos Teradata.

Si alguna columna en el destino de Teradata utiliza el formato de fecha AAAADDD (ao de 4 dgitos seguido por el da 3 dgitos), debe redefinir el formato de
fecha en la tabla de Teradata o convertir la fecha a una cadena de caracteres en PowerCenter. Redefinir el formato de fecha en la tabla de Teradata no cambia la
forma de Teradata almacena la fecha internamente.

20
Para convertir una columna de fecha de Teradata AAAADDD a una columna de caracteres en PowerCenter:

1. Editar la definicin de tabla de destino en PowerCenter y cambiar el tipo de datos de columna fecha a partir de fecha a char (7).

2. Crear una transformacin Expresin con la siguiente expresin para convertir la fecha en una cadena con el formato
AAAADDD:

to_char (date_port, 'yyyy') || to_char (date_port, 'ddd')

Nota: La expresion to_char (date_port, 'AAAADDD') no funciona.

3. Enlazar el puerto de salida en la transformacin de expresiones para el char (7) columna en la definicin de objetivos.

ocultando las contraseas

Se aplica a: FastExport, FastLoad, MultiLoad, TPump, Teradata PT

Cuando se crea un cargador o un objeto conexin de la aplicacin (FastExport), se introduce el nombre de usuario y la contrasea de base de datos en las
propiedades de conexin. El Servicio de Integracin escribe la contrasea en el archivo de control en texto plano y el cargador de Teradata no cifra la contrasea.
Para evitar que la contrasea de aparecer en el archivo de control, introduzca PMNullPasswd como contrasea. Al hacer esto, el Servicio de Integracin escribe
una cadena vaca para la contrasea en el archivo de control.

Si no desea utilizar PMNullPasswd, realizar cualquiera de las acciones siguientes:

Bloquear el directorio de archivo de control.

Para las compaas de carga, configurar PowerCenter para escribir el archivo de control en un directorio diferente, y luego asegure ese directorio.

Por defecto, el Servicio de Integracin escribe el archivo de control de la cargadora en el directorio de archivos de destino y el archivo de control FastExport al
directorio de archivos temporales. Para escribir el archivo de control de la cargadora en un directorio diferente, establezca la LoaderControlFileDirectory
propiedad personalizada al nuevo directorio para la integracin de servicios o sesin. Para obtener ms informacin sobre cmo establecer las propiedades
personalizadas para la integracin de servicios, consulte la Gua del administrador de PowerCenter. Para obtener ms informacin sobre cmo establecer las
propiedades personalizadas para la sesin, consulte la Gua bsica de flujo de trabajo de PowerCenter.

Por ltimo, MultiLoad y TPump admiten el comando RUN FILE. Este comando dirige el control del fichero de control actual en el fichero de control especificado en
la secuencia de comandos de inicio de sesin. Colocar las declaraciones de inicio de sesin en un archivo en un lugar seguro, y luego agregar el comando RUN
FILE para el archivo de control generada llamarlo. Ejecutar chmod -w en el archivo de control para evitar que se sobrescriban PowerCenter ella.

Por ejemplo, cree una secuencia de comandos de inicio de sesin de la siguiente manera (en el archivo login.ctl en una ruta de directorio seguro):

. LOGON demo1099 / infatest, infatest;

Modificar el archivo de control generada y reemplace la instruccin de inicio de sesin con el siguiente comando:

. ARCHIVO ejecutar <secure_directory_path> /login.ctl;

Uso de tablas de error para identificar los problemas durante la carga

Se aplica a: FastLoad, MultiLoad, TPump

Cuando se producen problemas durante la carga de datos, las utilidades de carga independiente de Teradata generar tablas de error. (FastExport genera un
archivo de registro de errores.) Las utilidades de carga generan diferentes errores durante las diferentes fases de la carga de datos.

empleos FastLoad ejecutan en dos fases principales: la carga y la carga final. Durante la fase de carga, FastLoad inicia el trabajo, cierra la tabla de destino y
carga los datos. Durante la fase de carga final, la base de datos Teradata distribuye las filas de datos a la tabla de destino y lo desbloquea. FastLoad requiere un
bloqueo exclusivo en la tabla de destino durante la fase de carga.

MultiLoad tambin carga los datos durante dos fases principales: la adquisicin y aplicacin. En la fase de adquisicin, MultiLoad lee los datos de entrada y lo
escribe en una mesa de trabajo temporal. En la fase de aplicacin, MultiLoad escribe los datos de la mesa de trabajo a la tabla de destino real. MultiLoad
requiere un bloqueo exclusivo en la tabla de destino durante la fase de aplicacin.

21
carga datos Tpump en una sola fase. Convierte el SQL en el archivo de control en una base de datos macro y aplica la macro para los datos de entrada.
TPump utiliza SQL estndar y bloqueo de tablas estndar.

La siguiente tabla muestra las tablas de errores se puede comprobar para solucionar los errores de carga o descarga de servicios pblicos:

Utilidad Carga de datos de fase por defecto Tabla Nombre del error Tipos de error

FastLoad Cargando Et_ <target_table_name> violacines de restriccin, los errores de conversin,


las condiciones de AMP no disponibles

carga en los extremos UV_ <target_table_name> nicas violacines ndice primario

MultiLoad Adquisicin Et_ <target_table_name> Todos los errores de fase de adquisicin, los errores de fase
solicitud, si la base de datos de Teradata no se puede construir
un ndice primario vlida

Solicitud UV_ <target_table_name> violacines singularidad, desbordamiento de campo


sobre columnas distintos campos de ndice primarios,
los errores de restriccin

TPump n / a (monofsica) Et_ <target_table_name> Todos los errores TPump


<nmero_particin>

Cuando una carga falla, compruebe la tabla de errores et_ en primer lugar para obtener informacin especfica. La columna ErrorField o ErrorFieldName indica
la columna en la tabla de destino que no se pudo cargar. El campo ErrorCode proporciona detalles que explican por qu la columna fall. Para MultiLoad y
TPump, los ErrorCodes ms comunes son:

2689: intentar cargar un valor nulo en un campo no nulo

2665: formato de fecha no vlida

En la tabla de errores UV_ MultiLoad, tambin se puede comprobar la columna de la DBCErrorField y el campo DBCErrorCode. La columna
DBCErrorField no se ha inicializado en el caso de violacines primarias singularidad clave. El DBCErrorCode que corresponde a una violacin principal
singularidad clave es 2794.

Para obtener ms informacin acerca de los cdigos de error de Teradata, consulte la documentacin de Teradata.

autores

Chai Pydimukkala
Gerente de Producto Senior de Informatica Corporation

Stan Dorcey
Especialista Senior de Producto, Informatica Corporation

Lori Troy
Escritor tcnico senior de Informatica Corporation

Expresiones de gratitud

Los autores desean agradecer individuo Boo, Ashlee Brinan, Eugene Ding, Anudeep Sharma, Lalitha Sundaramurthy, Raymond A, Rama
Krishna Tumrukoti, Sonali Verma, Rajeeva Lochan Yellanki, y Marissa Johnston en Informatica por su ayuda con este artculo. Adems, los
autores desean agradecer a Edgar Bartolome, Steven Greenberg, John Hennessey, y Michael Klassen en Teradata y Stephen Knilans y
Michael Taylor en LoganBritton por su asistencia tcnica.

22

Вам также может понравиться