Вы находитесь на странице: 1из 16

Inteligencia de

Negocios
Data warehouse



Ao de la Promocin de la Industria
Responsable y del Compromiso Climtico
Integrantes:

- MALDONADO SANCHEZ, Estefanie Solange
- REYNOSO ALVINO, A. Paola
- SALAZAR GARCIA, Oscar
- SANTA CRUZ SANTA CRUZ, Liz
- TARAZONA NIETO, Diego
EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
1






INTRODUCCIN


Hoy en da toda empresa necesita depositar mucha confianza en la toma
de decisiones sobre los negocios por lo que requerimos hechos y cifras,
con las que tomaremos decisiones en nuestra empresa y estas debern
ser ms aceleradas; por este motivo se requieren herramientas que nos
ayuden a minimizar el tiempo para analizar mucha informacin con
mayor velocidad y precisin.
El Componente de Bussines Intelligence que resuelve este caos de los
datos es el Data Warehouse.














EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
2


DEFINICIN
Un Datawarehouse es una base de datos corporativa que se caracteriza por
integrar y depurar informacin de una o ms fuentes distintas, para luego
procesarla permitiendo su anlisis desde infinidad de perspectivas y con
grandes velocidades de respuesta. La creacin de un datawarehouse
representa en la mayora de las ocasiones el primer paso, desde el punto de
vista tcnico, para implantar una solucin completa y fiable de Business
Intelligence.
Los datos y la informacin del Data Warehouse provienen frecuentemente de
mltiples fuentes u orgenes, como tambin relaciona datos de diferentes tipos,
lo que hace ms fcil ejecutar bsquedas ya que dicha tecnologa permite
aplicar mecanismos de estructuracin y organizacin.
Tambin es conocido como una coleccin resumida de datos provenientes de
fuentes u orgenes diferentes, estructurada y optimizada para ser accesada a
travs de herramientas de bsqueda.

EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
3




- Contraste entre las definiciones de los ms importantes autores de
Data Warehouse:

William Inmon:




Inmon defiende una metodologa descendente (top-down) a la hora de
disear un almacn de datos, ya que de esta forma se considerarn
mejor todos los datos corporativos.
En esta metodologa los Data marts se crearn despus de haber
terminado el data warehouse completo de la organizacin.

Ralph Kimball:




Tambin fue Kimball quien determin que un data warehouse no era
ms que: "La unin de todos los Data marts de una entidad".
Defiende por tanto una metodologa ascendente (bottom-up) a la hora de
disear un almacn de datos.
El Data Warehouse es una coleccin de datos,
orientados a un tema, integrados, no voltiles,
variantes en el tiempo, organizados para el apoyo a
toma de decisiones.
Un Data Warehouse es una copia de
los datos transaccionales,
especficamente diseada para realizar
consultas y anlisis.
EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
4



CARACTERSTICAS

El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y se
traduce literalmente como almacn de datos. No obstante, y como cabe
suponer, es mucho ms que eso. Segn defini el propio Bill Inmon, un
datawarehouse se caracteriza por ser:

Integrado: los datos almacenados en el datawarehouse deben
integrarse en una estructura consistente, por lo que las inconsistencias
existentes entre los diversos sistemas operacionales deben ser
eliminadas. La informacin suele estructurarse tambin en distintos
niveles de detalle para adecuarse a las distintas necesidades de los
usuarios.

Temtico: slo los datos necesarios para el proceso de generacin del
conocimiento del negocio se integran desde el entorno operacional. Los
datos se organizan por temas para facilitar su acceso y entendimiento
por parte de los usuarios finales. Por ejemplo, todos los datos sobre
clientes pueden ser consolidados en una nica tabla del
datawarehouse. De esta forma, las peticiones de informacin sobre
clientes sern ms fciles de responder dado que toda la informacin
reside en el mismo lugar.

Histrico: el tiempo es parte implcita de la informacin contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre
reflejan el estado de la actividad del negocio en el momento presente.
Por el contrario, la informacin almacenada en el datawarehouse sirve,
entre otras cosas, para realizar anlisis de tendencias. Por lo tanto, el
datawarehouse se carga con los distintos valores que toma una variable
en el tiempo para permitir comparaciones.

No voltil: el almacn de informacin de un datawarehouse existe para
ser ledo, pero no modificado. La informacin es por tanto permanente,
significando la actualizacin del datawarehouse la incorporacin de los
ltimos valores que tomaron las distintas variables contenidas en l sin
ningn tipo de accin sobre lo que ya exista.

Otra caracterstica del datawarehouse es que contiene metadatos, es decir,
datos sobre los datos. Los metadatos permiten saber la procedencia de la
informacin, su periodicidad de refresco, su fiabilidad, forma de clculo... etc.
EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
5

Los metadatos sern los que permiten simplificar y automatizar la obtencin de
la informacin desde los sistemas operacionales a los sistemas
informacionales.

OBJETIVOS

De acuerdo a Ralph Kimball, en su libro The Data Warehouse Toolkit, estos
son los objetivos de un Data Warehouse:


El Data Warehouse debe hacer la informacin de la organizacin
fcilmente accesible.

El contenido del Data Warehouse debe ser comprensible, intuitivo y
obvio para el usuario de negocio. La comprensibilidad implica
legibilidad, por lo que el contenido del Data Warehouse necesita ser
etiquetado de manera significativa. El usuario de negocio debe estar
habilitado para extraer porciones del Data Warehouse y combinar esta
informacin de todas las formas posibles, utilizando herramientas
simples y fciles de usar, con un tiempo de respuesta mnimo.


El Data Warehouse debe presentar la informacin de la organizacin
consistentemente.

La informacin del Data Warehouse debe ser creble. Los datos deben
ser cuidadosamente reunidos de una variedad de orgenes de toda la
organizacin, deben ser limpiados, con calidad asegurada, y liberados
cuando sean aptos para el consumo del usuario. La informacin de un
proceso de negocio debe coincidir con la informacin de otro proceso.
Si dos mtricas tienen el mismo nombre, entonces deben significar lo
mismo. Y a la inversa, si dos mtricas no significan lo mismo, entonces
deben ser nombradas de forma distinta. Informacin consistente
significa informacin de alta calidad. Esto significa que todos los datos
se contabilizan y estn completos. La consistencia tambin implica que
las definiciones comunes del contenido del Data Warehouse estn
disponible para todos los usuarios.


El Data Warehouse debe ser adaptable y resistente a cambios.

Simplemente no podemos evitar los cambios. Las necesidades de los
usuarios, las condiciones del negocio, los datos, y la tecnologa, estn
sujetos a las cambiantes arenas del tiempo. El Data Warehouse debe
estar diseado para manejar estos inevitables cambios. Los cambios
en el Data Warehouse no deben invalidar los datos existentes o las
aplicaciones. Los datos y las aplicaciones existentes no deben ser
alterados o quebrantados cuando la comunidad de usuarios realicen
nuevas preguntas o se agreguen nuevos datos al Data Warehouse. Si
EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
6

los datos descriptivos del Data Warehouse son modificados, debemos
tener en cuenta esos cambios adecuadamente.



El Data Warehouse debe ser un bastin seguro que proteja nuestra
informacin.

Las joyas de la corona de informacin de la organizacin estn
almacenadas en el Data Warehouse. Como mnimo, el Data
Warehouse probablemente contiene informacin sobre qu le
vendimos a quin a qu precio detalles potencialmente peligrosos en
las manos de la gente inapropiada. El Data Warehouse debe controlar
efectivamente el acceso a la informacin confidencial de la
organizacin.


El Data Warehouse debe servir como base para una toma de
decisiones mejorada.

El Data Warehouse debe contener la informacin correcta para
soportar la toma de decisiones. Solo hay una salida real para un Data
Warehouse: Las decisiones que son hechas despus de que el Data
Warehouse ha presentado su evidencia. Estas decisiones entregan al
negocio el impacto y valor atribuible al Data Warehouse.


La comunidad de negocio debe aceptar al Data Warehouse para que
se considera un xito.

No importa que hayamos construido una elegante solucin usando los
mejores productos y plataformas de su clase. Si la comunidad de
usuarios no adopta el Data Warehouse y contina usndolo
activamente seis meses despus de la capacitacin, entonces hemos
fallado en la prueba de aceptacin. A diferencia de las nuevas
implantaciones de sistemas operacionales, donde los usuarios no
tienen otra opcin que usar el nuevo sistema, el uso del Data
Warehouse es a veces opcional. La aceptacin de los usuarios tiene
ms que ver con la simplicidad que con cualquier otra cosa.





EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
7




QUINES Y PARA QU LO USAN?

Su aplicacin puede tener variados fines, en una diversidad de industrias. No
obstante, en trminos generales, podemos decir que su aplicacin ms rica
corresponde a entornos de empresas en los que se identifican grandes
volmenes de datos, asociados a: cantidad de clientes, variedad de productos
y cantidad de transacciones. Veremos algunas aplicaciones tpicas en distintas
industrias.

Comercio Minorista: Utilizan grandes sistemas de Procesamiento
Paralelo Masivo para acceder a meses o aos de historia transaccional
tomada directamente en los puntos de venta de cientos, o miles, de
sucursales.

Manufactura de Bienes de Consumo Masivo: Las empresas de este
sector necesitan hacer un manejo cada vez ms gil de la informacin
para mantenerse competitivas en la industria. Los Data Warehouses se
utilizan para predecir la cantidad de producto que se vender a un
determinado precio y, por consiguiente, producir la cantidad adecuada
para una entrega "justo a tiempo". Ejemplo: Coca Cola, Nike, Procter &
Gamble, Walt Disney.

Transporte de Cargas y Pasajeros: Se utilizan Data Warehouses para
almacenar y acceder a meses o aos de datos de clientes y sistemas de
reservas para realizar actividades de marketing, planeamiento de
capacidad, monitoreo de ganancias, proyecciones y anlisis de ventas y
costos, programas de calidad y servicio a clientes.

Telecomunicaciones: Estas empresas utilizan sus Data Warehouses
para operar en un mercado crecientemente competitivo, desregulado y
global que, a su vez, atraviesa profundos cambios tecnolgicos. Se
almacenan datos de millones de clientes

Muchas otras industrias y actividades utilizan actualmente, o estn
comenzando a instalar, Data Warehouses: entidades gubernamentales,
especialmente para el control impositivo, empresas de servicios pblicos, de
entretenimiento, editoriales, fabricantes de automviles, empresas de petrleo
y gas, laboratorios farmacuticos, drogueras, etc.
EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
8








PRINCIPALES APORTACIONES DE UN DATAWAREHOUSE

Proporciona una herramienta para la toma de decisiones en cualquier
rea funcional, basndose en informacin integrada y global del
negocio.

Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin
para encontrar relaciones ocultas entre los datos del almacn;
obteniendo un valor aadido para el negocio de dicha informacin.

Proporciona la capacidad de aprender de los datos del pasado y de
predecir situaciones futuras en diversos escenarios.

Simplifica dentro de la empresa la implantacin de sistemas de gestin
integral de la relacin con el cliente.

Supone una optimizacin tecnolgica y econmica en entornos de
Centro de Informacin, estadstica o de generacin de informes con
retornos de la inversin espectaculares.



EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
9







LOS PROCESOS BSICOS DEL DATA WAREHOUSE (ETL)
Para comprender ntegramente el concepto de datawarehouse, es importante
entender cul es el proceso de construccin del mismo, denominado ETL
(Extract, Transform & Load).Estas siglas significan (extraer, transformar y
cargar) a partir de los sistemas operaciones de una compaa:


Extraccin: Este es el primer paso de obtener la informacin hacia el
ambiente del Data WareHouse, consiste en leer los datos de la base de
datos original.

Transformacin: Una vez que la informacin es extrada hacia el rea de
trfico de datos, hay posibles paso de transformacin como; limpieza de
la informacin, tirar la basura que no nos sirve, seleccionar nicamente
los campos necesarios para el Data WareHouse, combinar fuentes de
datos, hacindolas coincidir por los valores de las llaves, creando
nuevas llaves para cada registro de una dimensin.
EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
10


Carga: Al final del proceso de transformacin, los datos estn en forma
para ser cargados (se refiere al hecho de guardar los datos en el formato
adecuado dentro del Data Warahouse).



ARQUITECTURA DE UN DATA WAREHOUSE
Elementos que constituyen la arquitectura de un Data Warehouse, explicamos
uno a uno la funcin de cada nivel.

Base de datos operacional y base de datos externa
Las organizaciones adquieren datos de bases de datos externas a la
propia organizacin, que incluyen datos demogrficos, econmicos,
datos sobre la competencia, etc.
Los procesos bsicos del Data WareHouse denominado ETL (Extraccin, Transformacin y Carga)
EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
11

Mediante el proceso de data warehousing se extrae la informacin que
est en la bases de datos operacionales y se mezcla con otras fuentes
de datos.

Nivel de acceso a la informacin
Es la capa con la que trata el usuario final. La informacin almacenada
se convierte en informacin fcil y transparente para las herramientas
que utilizan los usuarios. Se obtienen informes, grficos, diagramas, etc.
Nivel de acceso a los datos
Comunica el nivel de acceso a la informacin con el nivel operacional, es
el responsable de la interfaz entre las herramientas de acceso a la
informacin y las bases de datos.
La clave de este nivel est en proveer al usuario de un acceso
universal a los datos, es decir, que los usuarios sin tener en cuenta la
ubicacin de los datos o la herramienta de acceso a la informacin,
deberan ser capaces de acceder a cualquier dato del data
warehouse que les fuera necesario para realizar su trabajo.
Nivel de directorio de datos (metadatos)
Para proveer de un acceso universal, es absolutamente necesario
mantener alguna clase de directorio de datos o repositorio de
informacin de metadato que ayude a mantener un control sobre los
datos. El metadato aporta informacin sobre los datos de la
organizacin, de dnde proviene, qu formato tena, cul era su
significado y si se trata de un agregado, cmo se ha calculado ste.
Para mantener un almacn completamente funcional, es necesario
disponer de una amplia variedad de metadatos, informacin sobre las
vistas de datos para los usuarios finales y sobre las bases de datos
operacionales.
EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
12

Nivel de organizacin de datos
Incluye todos los procesos necesarios para seleccionar, editar, resumir,
combinar y cargar en el data warehouse y en la capa de acceso a la
informacin los datos operacionales y/o externos.


Nivel de gestin de procesos
Este nivel tiene que ver con la planificacin de las tareas que se deben
realizar, no slo para construir, sino tambin para mantener el data
warehouse y la informacin del directorio de datos. Es o el controlador
de alto nivel de los procesos que se han de llevar a cabo para que
el data warehouse permanezca actualizado.

Nivel de mensaje de la aplicacin
Este nivel es el encargado del transporte de la informacin a lo largo del
entorno, se puede pensar en l como un middleware.

Nivel Data Warehouse (fsico)
Es el ncleo del sistema, el repositorio central de informacin donde los
datos actuales usados principalmente con fines informacionales residen.
En el data warehouse fsico se almacenan copias de los datos
operacionales y/o externos, en una estructura que optimiza su acceso
para la consulta y que es muy flexible.
ARQUITECTURA DE UN DATA WAREHOUSE
EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
13



GLOSARIO

OLAP (on-line analitical processing): Anlisis de datos complejos del almacn
de datos.

Los DSS (decission support systems) proporcionan a las personas que han de
tomar decisiones importantes dentro de una organizacin, datos de nivel
superior para la toma de decisiones complejas.

La minera de datos: se emplea para el descubrimiento de conocimiento, es un
proceso de bsqueda, a partir de los datos, de conocimientos nuevos y no
anticipados.

OLTP:
Operaciones de insercin, actualizacin y borrado que implican slo algunas
tuplas por relacin. Aunque tambin soporta requisitos de consultas de
Informacin, estn optimizadas para procesar consultas que abarcan una
pequea parte de la base datos. Por lo tanto, no pueden ser optimizadas para
OLAP, DSS o minera de datos.


















EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
14


CONCLUSIONES

- Los mercados, ya maduros y exigentes, demandan de un mejor
conocimiento del cliente para poder ofrecerle una respuesta mucho ms
individualizada. Los avances tecnolgicos permiten hoy obtener
rendimientos ptimos en el uso de sistemas de informacin para la
direccin.

- El Data Warehouse aparece precisamente como una herramienta a
disposicin de las organizaciones que pretende subsanar los problemas
clsicos de los sistemas de informacin tradicionales, costes,
redundancias de datos, dispersin de la informacin, escasa visin
global corporativa y falta de fiabilidad.























EL XITO DE DW NO EST EN SU CONSTRUCCIN, SINO EN USARLO PARA
MEJORAR PROCESOS EMPRESARIALES, OPERACIONES Y DECISIONES.
15









BIBLIOGRAFIA


http://inteligenciadenegocio.mx/blog/objetivos-de-un-data-warehouse

http://www.monografias.com/trabajos17/data-warehouse/data-
warehouse.shtml

http://www.slideshare.net/guest10616d/que-es-un-data-warehouse-
3209873

http://anabuigues.com/2010/03/05/arquitectura-de-un-data-warehouse/


Data warehouse.pdf (autores: Karina Gabriela Bringas Garca, Raquel
Reza Snchez, Alfonso Villegas Vergara.)

Ralph Kimball, Laua Reeves, Margy Ross, Warren ....The Data
WareHouse Lifecycle Toolkit


INTELIGENCIA DE NEGOCIOS: ESTADO DEL ARTE.PDF
(SCIENTIA ET TECHNICA AO XVI, NO 44, ABRIL DE
2010.UNIVERSIDAD TECNOLGICA DE PEREIRA. ISSN 0122-1701)