Вы находитесь на странице: 1из 13

Objetivos solucin BI

Disponer de una infraestructura que permita a los decisores


obtener la informacin que necesitan.
Decisores pueden estar en niveles superiores u operativos. Tambin podra
darse a externos como valor agregado.
En cuanto a la info, importa su contenido, que sea correcta, la oportunidad
(en el momento requerido para tomar la decisin) y el formato y los estilos
de exploracin, segn el grado de detalle que se busque.
Que la organizacin haga uso eficaz de la infraestructura.
Requisito que el fin sea tomar una decisin para que sea til.
La empresa no tiene una base de datos que integre los datos de la
compaa. DW: Un tipo de base de datos ms herramientas (aplicaciones,
tableros, anlisis multidimensional, reportes) que trabajan contra el DW.
reas de trabajo: Construccin de la solucin

Analisis del negocio: Relevamiento, entender el alcance, planificacin


y el diseo de la info que se requiere.
Desarrollo del DW: Formalizar fuentes de datos, procesos de
extraccin, transformacin y carga.
Desarrollo del entorno de exploracin: construir metadatos y
herramientas de usuarios
Implementacin de la solucin: implementacin de hw y sw y la
dinmica con los usuarios.

Beneficios esperados
Para la organizacin

Para

Aumentar el potencial de los datos almacenados


Aumentar la calidad de la toma de decisiones
Unificar conceptos de negocios en toda la institucin
Visualizar la realidad organizacional en forma integrada
los usuarios

Disminuir el tiempo dedicado a elaborar la info, permitiendo dedicar


mayor tiempo al anlisis.
Disponer de una fuente nica y confiable.
Aumentar la autonoma y facilidad para acceder a la informacin
Para el rea de Tecnologa de la informacin

Mayor capacidad para dar respuesta a las necesidades de informacin


Menor intervencin en el da a da.

Decisiones
Proceso mental deliberado, voluntario, sistemtico, racional. Puede haber
racionalidad limitada. Soluciones realistas. Se establecen, analizan y
evalan alternativas con el fin de seleccionar solo una.
Decisor (sist. Sujeto) afectado por condicionamientos, informacin y
conocimiento decide para modificar el universo (sist. Objeto). Trae
consecuencias.
Dato info conocimiento decisin accin
El dato se procesa, el sujeto le da valor en un determinado contexto. El
conocimiento es el paso siguiente a la informacin, entiendo qu pasa y
cmo accionar contra eso, entiendo que accin debo tomar.
Proceso decisorio
Inteligencia diseo eleccin revisin
Detectar problema, desarrollar alternativas, seleccin de un curso de accin,
implementar curso de accin y evaluar la eleccin y sus consecuencias.
Clases de decisiones segn:
Programacin

Programada: Otorgar descuento a partir de cierto monto


o

Habito, procedimientos operativos estndar, estructura


organizativa. Aporte de TI: automatizacin de procedimientos
administrativos a travs de sistemas de procesamiento de
transacciones.

No programada: Cambiar de rubro comercial


o

Criterio, intuicin y creatividad. Reglas empricas, seleccin y


entrenamiento de ejecutivos. Aporte TI: Brindar infraestructura
tecnolgica para proveer de la informacin para la toma de
decisiones. IA y Tecnicas heursticas para la solucin de
problemas.

Reversibilidad

Reversible: Tercerizar el servicio de limpieza

Irreversible o poco reversible: Trasladarse a otro pas

Plazo de efectos futuros:

Corto o largo plazo

Impacto o alcance

Bajo o alto

Jerarqua

Inferior

Superior

Centralizacin y descentralizacin
Centralizacin: La autoridad para la toma de decisiones se concentra en los
niveles superiores.
Descentralizacin: La autoridad para la toma de decisiones se traslada a
niveles inferiores.
Decisiones mientras mas arriba en la pirmide:Poco programables, difciles
de revertir, efectos a mediano y largo plazo, impacto mltiple, jerarqua
superior.
Info: Ad hoc, resumida, ocasional, externa e interna, integral.
Decisiones abajo en la pirmide: Programables, fciles de revertir, efectos a
corto plazo, impacto nico, jerarqua inferior.
Info: especificada con anterioridad, detallada, frecuente, interna, especfica.
Monitoreo - Managers: Info grafica, BI: Tableros
Anlisis lnea media: Info agregada. BI anlisis multidimensional,
datamining,
Detalle trabajadores operativos: Info detallada. BI: Reporting

OLTP OLAP (Online Transactional / Analytical processing)


OLAP: Herramienta de anlisis multidimensional
OLTP: Sistemas transaccionales operacionales.
Caractersticas transacciones:

Actualizan y/o consultan un conjunto de pocos registros.

Alto nivel de concurrencia de las transacciones que consultas y


actualizan.

Actualizacin y consultas on-line, que deben tener una respuesta


instantnea para no trabar las operaciones de la organizacin.

Reciben muchas transacciones de pocos registros, alto desempeo en


el acceso a los registros y su actualizacin.

Alta disponibilidad

Normalizadas, para favorecer la actualizacin en lnea y disminuir la


probabilidad de inconsistencias que podran generarse.

Indices que favorezcan la actualizacin en lnea (ndices b+)

Incluyen mtodos de recuperacin y protocolos de control de


ocncurrencia que aseguren la consistencia de la base de datos ante
fallos y actualizaciones concurrentes

Los tres problemas del OLTP


Informacin no integrada, inadecuados tiempos de respuesta, consultas adhoc no amigables y la inexistencia de herramientas.
Los datos que representan la realidad de la organizacin se encuentran
muchas veces dispersos. Tienen diseos conceptuales y fsicos
independientes entre s. Diferentes visiones de una misma realidad entre los
decisores de la org. Imposibilidad de obtener informacin integrada que
permita comparar, clasificar y consolidar la informacin de las distintas
reas, sectores, procesos para analizar a la organizacin como un todo.
Se puede entorpecer el nivel de respuesta de los sist de nivel operativo,
debido al uso intensivo de los recursos que genera el procesamiento de las
consultas para la toma de decisiones.
Poder acceder a la informacin sin necesitar conocimientos profundos sobre
el uso de la tecnologa.
Si existen los problemas 1 y 2 (descentralizacin de la bd e inadecuados
tiempos de respuesta) el DW es la solucin. Si existe el problema 3, se debe
explorar las tecnologas de BI.
Reporte: Formato especfico para impresin. Principalmente nmeros.

Analisis multidimensional: Visin flexible y menos estructurada con


selectores que combinen distintas vistas del mismo cubo, con la posibilidad
de navegar, cambiar filtros, dril down/up.
Dashboard: combinando grilla, grficos e indicadores grficos con filtros pre
definidos.

Como trabajar el rea de anlisis del negocio


Necesidades vs datos existesntes. Anlisis de las necesidades de info,
alcance, formalizar datos existentes, necesidades de info, diseo del data
warehouse.
Generar una relacin con los usuarios (niveles superiores) desde el inicio,
pensando en la implementacin. Debe dedicarse mucho tiempo a esta
relacin y resistirse a avanzar sin ellos.
Desarrollo del entorno de exploracin
Definicin de metadatos

Construir las dimensiones: jerarquas y atributos

Construir mtricas e indicadores

Realizar pruebas internas de navegacin y calidad de datos.

Diseo de los front-end

Esquema y look and feel

Construir los reportes y dems salidas bsicas de acceso

Realizar pruebas internas

Implementacin de la solucin
Usuarios

Capacitacin y exploracin conjunta, ajustes finales y soporte.

Tecnologa

Diseas la infraestructura tecnolgica


o

Relevar y documentar requerimientos de la arquitectura

Diseo modelo de arquitectura de alto nivel.

Seleccin de productos

Determinar fases para implementar arquitectura

Implantar la infraestructura
o

Configurar el hardware

Instalacin y configuracin del software

Puesta a punto de la arquitectura y solucin

Pasaje a produccin

El DW

Integra datos de los distintos sistemas OLTP

Incorpora datos externos para analizar variables del entorno

Incorpora datos histricos que no existan en los sistemas OLTP (por


ventana operacional y/o update de datos)

El diseo y administracin de la base de datos pensado para un


procesamiento OLAP eficiente:

Guardar datos pre calculados

Indices que optimicen este tipo de consultas

Estructuras de datos redundantes

Independizar la base de datos de la alta concurrencia del OLTP

Posibilita diseos que faciliten su exploracin por parte de los


usuarios

Criterios de diseo

Construccin iterativa e incremental


o

Redundancia
o

Para mejorar la performance

Diseo relacional y multidimensional


o

Basada en un modelo de datos unificado que sea el roadmap


de todo el desarrollo

El segundo suele estar apuntado a necesidades de info. Pueden


convivir

Granularidad
o

Alta o baja

Redundancia
Propiedad
Acelerar consultas con datos
precalculados
Mayor tiempo en actualizacin de datos
Mayor probabilidad de generar
inconsistencias
Mejorar controles
Espacio de almacenamiento

Efectos
Base OLTP
DW
O
X

O
X

X
O
X

X
O
X

Caracteristicas:
Inmon: Orientado a temas, integrados, no voltiles, histricos.
EL ODS: Operational data store
Base de datos complementaria: pretende lograr alta performance de
acceso, cuando el DW no puede darlo.
Integrada, ambiente separado al operacional, para realizar procesamiento
analtico (OLAP).
Datos corrientes, no histricos. Datos pre calculados de la historia del DW.
Puede ser real time con pequeas actualizaciones de poco tiempo.
Inmon vs Kimball
DW vs Data Mart. Foco en la integracin de los datos vs explorar
informacin desde las necesidades del negocio.
Area de trabajo -> dw objetivo -> dw subjetivo -> data marts
Area de trabajo
Restringida solo al equipo de desarrollo de ETL.

Tomar los datos de los OLTP tal cual estn: minimiza el tiempo de acceso, si
falla el proceso no es necesario volver a ingresar a los OLTP.
DW Objetivo
Copia de datos de los sistemas OLTP, generar una base de datos OLTP
integradas, no es el ODS de Inmon. Mismo nivel de desagregacin. Puede
omitir algunos atributos. Los cambios al ETL se realizan por cambios en los
sistemas OLTP, no por las necesidades de informacin.
Objetivo buscado del dw objetivo
o

Generar reportes operativos

Permitira actualizacin en tiempo real

No estar focalizado en las necesidades de areas de usuarios en


particular.

No es necesario realizar ETL de integracin ante nuevas necesidades


de informacin

DW Subjetivo
Se organizan los datos en funcin a la exploracin de la informacin. Modelo
dimensional: tablas de hechos y dimensiones.
Objetivo buscado del dw subjetivo
o

Armar tantas tablas de hechos como necesiten los anlisis de


informacin dimensionales

Realizar distintas construcciones en base a los mismos datos

Integracin de datos: ETL


Es pasaje de datos simplemente? No. Ajusta las multiples fuentes de datos,
proporciona medidas sobre la calidad y confianza en los datos. Elimina
errores, corrige faltantes de ser posible, estructura los datos para ser
usados por herramientas de usuario final, documenta los flujos de datos
que alimentan el DW.
ETL: Problemtica
Las aplicaciones transaccionales fueron pensadas en sus propios
requerimientos
Esquemas heterogneos, codificacin divergente, Datos redundantes,
distintas tecnologas, calidades de datos heterogneas.
Distintas unidades de medida, mismo nombre y diferente contenido,
criterios sintcticos o semnticos diversos. Mismo dato con distintas
identificaciones en los repositorios, las claves al ser distintas no pueden
referenciarse. Identificar cual es el atributo valido.
Tomar los datos de los sist operacionales sin afectar su operatoria. Como
extraer los cambios que han sido realizados en los sistemas operacionales
desde el ltimo refresh del DW.
Importa el volumen de datos, la secuencia y la periodicidad de
procesamiento y actualizacin.
ETL
E:

Identificar las fuentes de datos multiples

Entender diversos modelos de datos heterogneos

Conectarse y accedr sin interferir

Capturar los datos cambiados durante extracciones

Disponibilizar los datos extraidos en disco

Limpieza de datos

T:

Validar la estructura

Validar dominio

Elegir la fuente mas confiable

Corregir u omitir valores incorrectos

Generar meta data que describa la calidad de datos

Disponibilizar datos limpios en disco y manejo de errores.

Integracin y homogeneizado
o

Mapear las columnas del dw con las columnas de las fuentes,


algoritmos

Consolidar duplicaciones

Unificar claves con equivalencias

Homogeneizar niveles de agregacin

Moldear datos para su navegacin


o

Adecuaciones para poder integrar denominaciones de negocios


(dimensiones), mtricas e indicadores de performance

L: cargar los datos que sern consumidos por los usuarios.

Cargar dimensiones y tablas de hecho

Generar dimensiones de tiempo

Cargar y modificar agregaciones

Disponibilizar los datos para ser consumidos

Mapeo lgico
Documentar la lgica del ETL. Logical data map document. Tiene formato de
tabla. Se llenan filas por cada columna que hay que cargar en el destino.
Destino -> origen -> transformacin a realizar.

Analisis multidimensional
Hechos -> medidas. Cunto.
La dimensin sera el contexto, qu, dnde, cundo.
Las dimensiones tienen jerarquas, de gruesa a fina, las cuales tienen
mtricas e indicadores. El indicador es ms elaborado que la mtrica,
presenta un estado de situacin.
Concepto de cubo
Tres dimensiones o ms.
Medidas

Aditivas: pueden agregarse por cualquiera de las dimensiones. Ej:


cantidad comprada

Semi aditivas: pueden agregarse por algunas de las dimensiones, no


todas. Ej: stock puede ser aditiva para producto pero no para tiempo

No aditivas: no se pueden agregar por ninguna dimensin. Ej:


temperatura.

Las semi y no aditivas pueden ser resumas en mtricas utilizando otas


operaciones como MaX, MIN, promedio.
Mtricas
Directas: funciones sobre una medida o atributo. Ej suma, promedio, contar,
max, min.
Mtricas calculadas: funciones sobre clculos entre medidas y atributos
Analisis multidimensional: armado de la info en forma dinmica. Consultas
ad-hoc
Entorno grfico y amigable, el usuario necesita conocer principalmente el
lenguaje del negocio. La realidad del negocio se modela en trminos de
medidas y dimensiones.
Medidas/Metricas: ventas Q, ventas$, precio promedio, costos
Dimensiones: Tiempo, producto, geografa
Jerarquias: dentro de tiempo: ao, trimestre, mes.

Modelado dimensional conceptual


Objetivo: representar las necesidades de informacin sobre una temtica
del negocio que debe resolver la solucin
Sobre l basa: modelo dimensional lgico y herramientas de exploracin.
Desde la perspectiva del negocio se definen mtricas y dimensiones con
jerarquas relevantes.
Dimensiones recursivas: No es posible establecer niveles jerrquicos. La
jerarqua se construye dinmicamente a partir de las relaciones padre-hijo
que existen entre los miembros. Como empleado o rea.
Pasos

Trabajar de un area tematica a la vez

Identificar decisores claves para dicha temtica

Definir junto a dichos decisores las mtricas sobre las que al negocio
le interesa saber para decidir. Identificar las dimensiones sobre las
que al negocio le interesa analizar las mtricas. Identificar las
jerarquas ms relevantes por dimensin e identificar la granularidad
de exploracin.

Graficarlo en el diagrama y reconfirmar y ampliar

Evaluar las mtricas y su relacin con las dimensiones: agregar


propiedades en el modelo.

Вам также может понравиться