Вы находитесь на странице: 1из 24

Introducción a Data Warehousing

● Una aplicación de base de datos es un


software que provee a los usuarios de
una interface para insertar, modificar,
borrar, y consultar datos.
● Un data warehouse es un sólo origen de
información corporativa clave para la toma
de decisiones.
Conflictos de Ingeniería: Consulta y
Actualización
● Siempre han habido conflictos cuando hay
datos actualizándose y consultas largas
ejecutándose.
● En algunos casos van haber usuarios
intentando actualizar datos, en espera,
hasta que las consultas largas se terminen
de ejecutar.
● Una forma de evitar esto es entonces
crear una copia de sólo lectura de la base
de datos.
Conflictos de Ingeniería: Consulta y
Actualización

Data Warehouse

Database System
Data Data de
para Actualizar Lectura
Aplicación
Definición de OLTP y DSS
● OLTP (On-Line Transaction Processing)
se refiere a aplicaciones de
procesamiento de transacciones en línea.
● DSS (Decision Support System) son las
aplicaciones que realizan consultas a una
aplicación de base de datos de solo
lectura.
Definición de OLTP y DSS
● La mayoría de las organizaciones tienen muchas aplicaciones
OLTP/DSS dispersas en varias bases de datos.
Independientes vs Integrados
● Es común que en muchas empresas, bases de datos
evolucionen como sistemas de información independientes.
● Estos sistemas de información independientes, son
subsistemas incapaces de brindar una visión consolidada a
la empresa.
● Los sistemas que fácilmente comparten datos, son llamados
sistemas integrados.
Problemas con Sub-Sistemas Ind.
● Problemas
– Usuarios que quieren consultar datos a nivel global
deben acceder a diferentes DSS
– Pueden haber conflictos fundamentales de
información entre diferentes DSS
● Un código en la tabla de productos de un DSS
puede diferir con el respectivo código de
otra DSS.
● Una medida puede estar registrada en m en
un DSS y en Km en otro DSS.
● Solución
– Utilizar un data warehouse donde la información es
integrada de diferentes sub-sistemas de
información independiente.
La Solución de Data Warehouse
● Un Data Warehouse es un intento para integrar diferentes
DSS con el fin de que usuarios puedan realizar consultas en
un solo sitio cuando quieran encontrar respuestas a sus
preguntas.
● Un Data Warehouse contiene la información clave o
estratégica de una empresa.
● Un Data Warehouse mantiene información histórica
● Data Warehousing es el proceso de extraer y filtrar datos de
las operaciones comunes de la empresa, procedentes de los
distintos subsistemas operacionales (OLTP), para
transformarlos, integrarlos, sumarizarlos y almacenarlos en
un depósito o repositorio y crear un solo (DSS), para poder
acceder a ellos cada que vez que se necesite.
Wal-Mart: Ejemplo exitoso de un DW
● Wal-Mart actualmente contiene la DW más grande del
mundo.
● En el 2004 tenía más de la mitad de un petabyte. Es decir
más de 500 terabytes.
● Usos del Data Warehouse de Wal-Mart:
– Identifica donde una nueva tienda debería ser construida
basado en la demanda de los consumidores.
– Evalua el performance de todas las tiendas.
– Almacena cada registro escaneado en cada compra.
● Beneficios obtenidos
– Le dio ventaja competitiva sobre su competidor K-Mart
– Redujo el exceso de inventarios en tiendas individuales.
– Evitó invertir en nuevas tiendas que hubiesen fracasado
Construyendo un DW útil
● Se necesita:
● Un fuerte apoyo ejecutivo
● Conocimiento total de la información
● Software
● Estabilidad de los sub-sistemas de información
independientes como fuente de datos.
● Usuarios que quieren el éxito.
Servidor de Inteligencia de Negocios
● Un servidor de inteligencia de negocios, permite a los
usuarios realizar consultas en un data warehouse.
● De esa manera los usuarios pueden acceder a información
estratégica y clave en un data warehouse.

SERVIDOR DE
INTELIGENCIA DE
NEGOCIOS

DATA WAREHOUSE
Usos de un Servidor de Inteligencia
de Negocios
● Un servidor de Inteligencia de Negocios atiende a diferente
tipo de usuarios.
● Algunos usuarios solo quieren reportes predefinidos que tan
solo con un click generen la información que ellos desean
ver.
● Otros usuarios quieren involucrarse en la información y
construir sus propias consultas.
Usos de un Servidor de Inteligencia
de Negocios
● Ejecutivos
– Quieren un alto nivel de información reducida y una
simple herramienta.
– Debe ser fácil de usar. Ellos tan solo quieren apretar
algunos clicks y ver la información que necesitan
en pantalla o en reportes de archivos de texto, de
hojas de cálculo, de documentos PDF, etc.
– Algunos resultados deben ser gráficos para ilustrar
categorias, tendencias, etc., a través de gráficos de
columnas, de líneas de serie de tiempo, etc.
– En algunos casos también se debe también permitir a
los usuarios taladrar adentro a través de las
categorias de resultados.
Usos de un Servidor de Inteligencia
de Negocios
● Presentar a los usuarios resultados en gráficos:
Usos de un Servidor de Inteligencia
de Negocios
● Permitir a los usuarios taladrar adentro (drill-down):
Usos de un Servidor de Inteligencia
de Negocios
● Usuarios Generales
– Quieren una herramienta que proporcione
información detallada pero que sea simple de usar.
– Quiere acceso al DW para hacer trabajos de rutina
como encontrarme el teléfono de Pepe.
– No están orientados a reportes grandes, sino a
respuestas simples.
Usos de un Servidor de Inteligencia
de Negocios
● Usuarios Generales
– Quieren una herramienta que proporcione
información detallada pero que sea simple de usar.
– Quiere acceso al DW para hacer trabajos de rutina
como encontrarme el teléfono de Pepe.
– No están orientados a reportes grandes, sino a
respuestas simples.
Data Warehouse & SIN
Necesidad de Data Warehouses
● El data warehouse proporciona una ubicación única, donde
almacenar información corporativa estratégica.
– La idea es que los usuarios puedan ir a un sólo lugar
para encontrar esta información clave, usando el
servidor de inteligencia de negocios.
● El data warehouse, también es un lugar donde almacenar y
acceder a información histórica:
– Los usuarios puede así medir objetivos de
desempeño o performance corporativo a lo largo
de un periodo de tiempo.
– Permite el cálculo de estadísticas.
– La información que no es guardada en un solo lugar,
es difícil de ser ubicada, compara y es fácilmente
perdible.
– Consultas sencillas pueden ejecutarse para acceder
a la información clave.
Seguridad en Data Warehouses
● Construir un DW involucra incrementar los riesgos de la
seguridad, porque la información estratégica corporativa se
encuentra toda en un solo lugar.
● Para disminuir ese riesgo, se debe utilizar componentes de
bases de datos para proteger un data warehouse:
– Vistas
– Control de Accesos
– Administración de seguridad
– Encriptación
– Auditoria
Moviendo Información a un
Data Warehouses
● Mover la información de las origines en las aplicaciones
OLTP al Data Warehouse es la parte más díficil.
● Actualizaciones al Data Warehouse pueden ser ejecutadas
periódicamente:
– Semanalmente
– En las noches
– Mensualmente
– Cada 15 minutos
● Ocasionalmente información en tiempo real es necesitada en
Data Warehouses, pero esto no es muy común.
Utilizando Middleware
para mover la información
● La información puede ser movida a la data warehouse
mediante software de migración.
● Esto se llama a menudo middleware porque reside al medio
entre el origen de las aplicaciones OLTP y el data warehouse

Software
Sistemas De Data
OLTP Migración Warehouse
“Middleware”
Necesidad de un Data Mart
● Un data mart es un sub-conjunto del data warehouse que
hace más sencillo a los usuarios acceder a información
corporativa estratégica.
– Algunas veces los usuarios solamente necesitan un
pedazo de información del data warehouse.
● El data mart es tipícamente alimentado del data warehouse.
Data Mart en Acción

Вам также может понравиться