Вы находитесь на странице: 1из 11

ETL

Sistemas de Gestión 2

Integrantes: Rodrigo Valenzuela Moya


Carlos Sepúlveda
Marcelo Roa
Profesora: Angélica Urrutia
Fecha: 02.05.2019
Introducción

Un ETL, es el proceso de extraer datos de múltiples sistemas de origen,


transformarlos para adaptarlos a las necesidades del negocio y cargarlos
en una base de datos de destino.
La gran mayoría de empresas poseen grandes cantidades de datos, a
menudo acumulados desde años. Sin embargo, es muy probables que
estos datos estén almacenados en distintos lugares y en formatos
diferentes, lo que dificulta su explotación y la extracción de
conocimiento.
Si queremos beneficiarnos al máximo de las oportunidades que nos
ofrecen los datos, necesitamos antes combinarlos y consolidarlos en un
único lugar, típicamente un almacén de datos (Data Warehouse). Y
nuestra herramienta para conseguir esto, son los ETL.
los beneficios principales que una herramienta ETL puede proporcionar a
nuestra empresas son el poder extraer y consolidar datos de múltiples
fuentes, proporcionar un contexto histórico profundo sobre nuestra
empresa y negocio, aumentar la productividad y facilitar el trabajo en
equipo, permitir la toma de decisiones estratégicas basadas en datos por
parte de los directivos de la empresa, entre otros beneficios.

Por ello, en el siguiente informe, veremos la aplicación de 10 ETL


aplicados a una base de datos. Con esto, podremos ver detallados el
objetivo y el procedimiento que realizara cada ETL, así como también los
datos que obtendremos gracias a ellos, para de esta forma comprender
los grandes beneficios que podremos obtener gracias al uso de esta
herramienta, lo que nos otorgará una ventaja estratégica a la hora de
tomar decisiones, adaptarse al cambio, etc.
Desarrollo

Para poder aplicar las distintas ETL, hemos trabajado sobre una base de
datos Northwind, la cual corresponde a una base de datos de una
compañía que se dedica a la venta de productos a distintos clientes, los
cuales son compañías, empresas, restaurantes, etc. A su ves, también se
considera los proveedores, los empleados, así como también los
productos que se disponen.
A continuación, podemos observar el diagrama de la base de datos:
ETL para Cantidad de Ventas de cada Empleado
El siguiente ETL va a la tabla “Orders”, donde están almacenadas todas
las ordenes de venta realizadas, y extrae las columnas de ID de la venta y
el ID del empleado que realizó dicha venta, para luego realizar un
ordenamiento de los datos extraídos. Luego se realiza un agrupamiento
del el ID del Empleado, para luego contar dichos datos, y de este modo
obtener las ventas realizadas por este, ya que se estará contando las
veces que aparece cada ID en el total de boletas.
Paralelamente, también se extraen datos de la tabla “Employees”, donde
extraemos el ID del empleado, el nombre y el apellido.
Posteriormente, se realiza un join entre los datos obtenidos
recientemente de la tabla “Employees” y los datos extraídos en el
proceso anterior, realizando el join a través del ID del empleado, para así
poder agregar información de cada uno.
Finalmente realizamos un último ordenamiento por la cantidad de
ventas, de mayor a menor, y cargamos los datos en una tabla final
llamada “SalidaETL1”.
El modelo es el siguiente:

Y a continuación, podemos ver el ETL en funcionamiento:


Por último, vemos como queda la nueva tabla donde se cargan los
resultados del ETL:
ETL para cantidad de repartos realizados por cada compañía de Delivery
EL siguiente ETL, nos otorgará información relacionada con la cantidad
de repartos que hace cada compañía de delivery con la que se trabaja.
Esto, pues para la venta de cada producto, se posee 3 compañías de
delivery que se encargaran de realizar su despacho, por ello, queremos
obtener la cantidad de despachos realizados por cada una.
Para ello, extrae información de la tabla “Orders”, de donde extrae el ID
de la orden, y el código de la compañía de despachos.
Realizamos un ordenamiento por ID de la orden, luego un agrupamiento
por el código de la compañía de envío y se procede a contar los
despachos de cada una.
Luego, se ordena por el ID de la compañía, y se realiza un join con los
datos extraídos de la tabla “Shippers”, donde extraíamos la Id de la
compañía de envíos y el nombre de esta.
Realizamos un ordenamiento por cantidad de envíos de cada una, de
mayor a menor, y cargamos los datos de una tabla final llamada
“SalidaETL2”.
El modelo es el siguiente:

Y a continuación, podemos ver el ETL en funcionamiento:


Por último, vemos como queda la nueva tabla donde se cargan los
resultados del ETL:
ETL para Compras realizadas por cada País
El siguiente ETL, se encargará de proporcionarnos información sobre la
cantidad de compras que realiza cada país de nuestros productos.
Para ello, se extraen datos de la tabla “Orders”, donde obtenemos el Id
de la orden y el Id del cliente y luego los ordenamos por Id del cliente.
También, extrae datos de la tabla “Customers”, donde obtenemos la Id
del cliente y el país de donde es, y luego realizamos un ordenamiento
por Id del cliente.
Luego de esto, realizamos un join de ambos datos, a través de ID del
cliente. Luego agrupamos por país y realizamos un conteo de estas
tuplas.
Finalmente, se ordena por cantidad de compras de cada país de mayor a
menor y se carga en una tabla final llamada “SalidaETL3”.
El modelo es el siguiente:

Y a continuación, podemos ver el ETL en funcionamiento:


Por último, vemos como queda la nueva tabla donde se cargan los
resultados del ETL:
Conclusión

Вам также может понравиться