Вы находитесь на странице: 1из 5

INTEGRACIÓN DE DATOS

CONCEPTO

La integración de datos es el proceso que permite combinar datos heterogéneos de


muchas fuentes diferentes en la forma y estructura de una única aplicación. Este
proceso de integración de datos facilita que diferentes tipos de datos, tales como
matrices de datos, documentos y tablas, sean fusionados por usuarios, organizaciones
y aplicaciones para un uso personal, de procesos de negocio o de funciones.

La integración de datos soporta el procesamiento analítico de grandes conjuntos de


datos alineando, combinando y presentando cada conjunto de datos de departamentos
organizacionales y fuentes de datos remotas y externas, para cumplir con los objetivos
del integrador.

La integración de datos se implementa generalmente en un data warehouse mediante


software especializado que aloja grandes repositorios de datos de recursos internos y
externos. Los datos se extraen, se mezclan y se presentan de forma unificada. Por
ejemplo, el conjunto completo de datos de un usuario puede incluir datos extraídos y
combinados de marketing, ventas y operaciones, que se combinan para formar un
informe completo.

Un proyecto de integración de datos generalmente implica los siguientes pasos:

 Acceso a los datos desde todas las fuentes y localizaciones tanto si se trata de
locales, en la nube o de una combinación de ambos.
 Integración de datos de modo que los registros de una fuente de datos mapean
registros en otra. Por ejemplo, incluso si un conjunto de datos utilizara “nombre,
apellidos” y otro “nom, ape”, el conjunto integrado se asegurará de que en ambos
casos los datos van al lugar correcto. Se trata de un tipo de preparación de datos
esencial para que las analíticas y otras aplicaciones sean capaces de utilizar los datos
con éxito.
 Entrega de datos integrados al negocio justo en el momento en que la empresa los
necesita, ya sea por lotes, casi en tiempo real o en tiempo real.
TÉCNICAS DE INTEGRACIÓN DE DATOS

DATA WAREHOUSE

Con data warehouse todos los datos de las diferentes bd que van a ser integrados son
extraídos, transformados y cargados. data warehouse convierte todos los datos a un
formato común para que el conjunto de datos sea compatible con otro luego los carga
en su propia base de datos. Data
warehouse responde a las consultas localizando, recuperando y presentando datos en
una visión integrada

BASES DE DATOS EN RED

Son las ideales para sistemas de integración de datos que se basan en información que
cambia con frecuencia, son sistemas que extraen los datos directamente de las fuentes
de datos individuales ya que no hay base de datos centralizada dedicada a analizar,
categorizar e integrar los datos para las consultas de los usuarios, dichas
responsabilidades caen a otras partes del sistema.

APLICACIONES ANALITICAS

Las aplicaciones analiticas se especializan en localizar, recuperar e integrar la


información por ti manipulando los datos para que la información de una fuente sea
compatible con la información de otra fuente. El problema de este enfoque radica en
que las aplicaciones se vuelven complejas y difíciles de programar ya que el número de
fuentes de datos aumenta.

TECNOLOGIAS DE INTEGRACIÓN DE DATOS


Los crecientes volúmenes de datos en las compañías conllevan a una serie de retos
para la organización de TI, a fin de mantener y mejorar la seguridad, la accesibilidad y
la veracidad de la información.
La gobernabilidad de los datos consiste en la gestión de éstos, en pro de los objetivos
empresariales, y representa una convergencia de la calidad de datos, gestión, políticas,
gestión de procesos de negocio y gestión de riesgos, que comprende el tratamiento de los
datos de una organización.

PENTAHO

Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una


infraestructura de herramientas de análisis e informes integrado con un motor de
workflow de procesos de negocio. La plataforma será capaz de ejecutar las reglas de
negocio necesarias, expresadas en forma de procesos, actividades, además es capaz
de presentar y entregar la información adecuada en el momento adecuado.

SISENSE

Sisense es una plataforma de inteligencia de negocios que permite a los usuarios unirse,
analizar y visualizar la información que necesitan para tomar decisiones comerciales
mejores y más inteligentes y elaborar planes y estrategias viables.
Con Sisense, los usuarios pueden unificar todos los datos que necesitan y desean en
tableros visualmente atractivos mediante una interfaz de usuario de arrastrar y
soltar. Sisense básicamente permite a los usuarios convertir los datos en ideas de gran
valor y luego compartirlos con colegas, socios comerciales y clientes a través de paneles
interactivos.

SAP BUSSINES SUITE

conjunto de programas que permiten a las empresas ejecutar y optimizar distintos aspectos
como los sistemas de ventas, finanzas, operaciones bancarias, compras, fabricación,
inventarios y relaciones con los clientes. Ofrece la posibilidad de realizar procesos
específicos de la empresa o crear módulos independientes para funcionar con otro software
de SAP o de otros proveedores. SAP está basado en una plataforma de tecnología integrada
llamada. La suite puede soportar sistemas operativos, bases de datos, aplicaciones y
componentes de hardware de casi cualquier proveedor.
DOMO

Suite de gestión empresarial que se integra con múltiples fuentes de datos, incluidas
hojas de cálculo, bases de datos, redes sociales y cualquier solución de software
existente en la nube o in situ.

SOLUCIONES EN LA NUBE

Son servicios de visualización y análisis predictivo de datos inteligente que puede utilizar
para descubrir patrones y significado en sus datos de forma rápida y por su cuenta. Con
el descubrimiento de datos guiado, la analítica predictiva automatizada y las
funcionalidades cognitivas como el diálogo en lenguaje natural, puede conversar con los
datos y obtener respuestas comprensibles. Tanto si necesita detectar una tendencia
rápidamente como si tiene un equipo que necesita visualizar los datos de un informe en
el panel de control. Ejemplos:

PROCESOS ETL

Los procesos ETL son una parte de la integración de datos, pero es un elemento
importante cuya función completa el resultado de todo el desarrollo de la cohesión de
aplicaciones y sistemas.

La palabra ETL corresponde a las siglas en inglés de:

EXTRAER: EXTRACT.
TRANSFORMAR: TRANSFORM.
CARGAR: LOAD.

FASE DE EXTRACCIÓN

Para llevar a cabo de manera correcta el proceso de extracción, primera fase del ETL,
hay que
seguir los siguientes pasos:
● Extraer los datos desde los sistemas de origen.
● Analizar los datos extraídos obteniendo un chequeo.
● Interpretar este chequeo para verificar que los datos extraídos cumplen la pauta o
estructura que se esperaba. Si no fuese así, los datos deberían ser rechazados.
● Convertir los datos a un formato preparado para iniciar el proceso de transformación

FASE DE TRANSFORMACIÓN

La fase de transformación de un proceso de ETL aplica una serie de reglas de negocio


o funciones, sobre los datos extraídos para convertirlos en datos que serán cargados.
Estas directrices pueden ser declarativas, pueden basarse en excepciones o
restricciones pero, para potenciar su pragmatismo y eficacia, hay que asegurarse de
que sean:

● Declarativas.
● Independientes.
● Claras.
● Inteligibles.
● Con una finalidad útil para el negocio.

PROCESO DE CARGA

En esta fase, los datos procedentes de la fase anterior (fase de transformación) son
cargados en el sistema de destino. Dependiendo de los requerimientos de la
organización, este proceso puede abarcar una amplia variedad de acciones diferentes.

Existen dos formas básicas de desarrollar el proceso de carga:

● ACUMULACIÓN SIMPLE: esta manera de cargar los datos consiste en realizar un


resumen de
todas las transacciones comprendidas en el período de tiempo seleccionado y
transportar el resultado como una única transacción hacia el data warehouse,
almacenando un valor calculado que consistirá típicamente en un sumatorio o un
promedio de la magnitud considerada. Es la forma más sencilla y común de llevar a
cabo el proceso de carga.

● ROLLING: este proceso sería el más recomendable en los casos en que se busque
mantener varios niveles de granularidad. Para ello se almacena información resumida a
distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo o
diferentes niveles jerárquicos en alguna o varias de las dimensiones de la magnitud
almacenada (por ejemplo, totales diarios, totales semanales, totales mensuales, etc.).

Sea cual sea la manera elegida de desarrollar este proceso, hay que tener en cuenta
que esta fase interactúa directamente con la base de datos de destino y, por eso, al
realizar esta operación se aplicarán todas las restricciones que se hayan definido en
ésta. Si están bien definidas, la calidad de los datos en el proceso ETL estará
garantizada.

Вам также может понравиться