Вы находитесь на странице: 1из 57

BI Hospital de SUBA

Maryluz Martinez Restrepo


Candidata a Magister en Ciencias de la
Computacion
Universidad del Valle

Que?
Mejoramiento

del recurso

humano
Mejoramiento de procesos
internos
Percepcin e imagen ante el
cliente; incluyendo su nivel de
satisfaccin
Como hacer viable
financieramente la institucin
Seguimiento a objetivos

Como?
Herramientas

de BI como
sistemas de soporte a la toma de
decisiones estratgicas:

Reportes dinmicos
Bodegas de datos
KDD y minera de datos
BSC

Que es BI?
La inteligencia de negocios o Business
Intelligence (BI) se puede definir como
el proceso de analizar datos
acumulados en la empresa y extraer
conocimiento de ellos.
BI no puede presentarse como una
solucin nica y completa, por el
contrario abarca gran nmero de
necesidades de anlisis de informacin
que son resueltas por diferentes
tecnologas y herramientas.

Que encontramos?
Informes

dinmicos, flexibles e
interactivos: No listados predefinidos.
No requiere conocimientos tcnicos:
No pedir ayuda en el dpto. de informtica.
Rapidez en el tiempo de respuesta:
Orientado al anlisis de grandes
volmenes de informacin.
Integracin entre todos los
sistemas/departamentos de la
compaa: Integridad referencial
absoluta. ETLs previos que lo permiten.

Que encontramos?
Como

se reflejan los objetivos


corporativos en los datos. Es
posible medir.
Cada usuario dispone de
informacin segn su perfil.
Disponibilidad de informacin
histrica. No voltiles en el
tiempo.

Piramide de conocimiento

Conocimiento
Conocimiento

evidente: SQL.
Conocimiento multidimensional: Datos con
estructuras avanzadas.
Conocimiento oculto:
Informacin no evidente,
desconocida a priori y
potencialmente til

BI

Bodegas de datos
OLAP:

On-Line Analytical
Processing.
Datawarehousing
Datamarts
MOLAP - Cubos
ROLAP - Estrellas
HOLAP - Hibridos

Datawarehouse: Que es?


Conjunto

de datos orientados a
temas, integrado, no volatil en el
tiempo, que se usa para el
proceso de toma de decisiones.
No operativo.
Datos integrados.
Variable tiempo es importante.

Datawarehouse: Que no
es?
No

procesa transacciones
operativas ni en tiempo real.
No orientado al registro y edicion
de campos.
No es un sistema de reporting.

Diferencias

Diferencias

Diferencias

Diferencias

Diferencias

Diferencias

Relaciones

Datamart
Surgen

para optimizar tiempos


de consulta y problemas de
acceso.
Almacenes de datos
especializados por area que
reciben datos de la bodega
central
Dependientes o independientes.

MOLAP - Cubos
Usa

una BD propietaria multidimensional, en la que la


informacin se almacena para ser visualizada en varias
dimensiones de anlisis.
Utiliza una arquitectura de dos niveles: la BD multidimensional
y el motor analtico.
Carga mediante una serie de rutinas por lotes. Una vez cargado
el dato elemental en la (MDDB), se calculan los datos
agregados. se generan ndices
Una vez que el proceso de compilacin se ha acabado, la MDDB
est lista para su uso. Los usuarios solicitan informes a travs
de la interface, y la lgica de aplicacin de la MDDB obtiene el
dato.
La arquitectura MOLAP requiere unos clculos intensivos de
compilacin. Lee de datos pre compilados, y tiene capacidades
limitadas de crear agregaciones dinmicamente o de hallar
ratios que no se hayan pre calculados y almacenados
previamente; pero provee un acceso rpido

MOLAP

CUBO

CUBO

ROLAP - Estrellas
Capacidades

OLAP implementadas sobre bases de datos relacionales.


La base de datos relacional maneja los requerimientos de
almacenamiento de datos, y el motor ROLAP proporciona la
funcionalidad analtica.
los datos se cargan desde el sistema operacional, ejecutando rutinas
SQL para agregar nuevos datos.
Se crean entonces los ndices para optimizar los tiempos de acceso a
las consultas.
Los usuarios finales ejecutan sus anlisis multidimensionales, a travs
del motor ROLAP, que transforma dinmicamente sus consultas a
consultas SQL. Se ejecutan estas consultas SQL en las bases de datos
relacionales, y sus resultados se relacionan mediante tablas cruzadas y
conjuntos multidimensionales para devolver los resultados a los
usuarios.
Es capaz de usar datos pre calculados si estos estn disponibles, o de
generar dinmicamente los resultados desde los datos elementales si
es preciso. Esta arquitectura accede directamente a los datos del
datawarehouse, y soporta tcnicas de optimizacin de accesos para
acelerar las consultas.

ROLAP

ROLAP

HOLAP - Hibridos
Combina

las arquitecturas ROLAP y


MOLAP para brindar una solucin
con las mejores caractersticas de
ambas: Desempeo superior y gran
escalabilidad. Un tipo de HOLAP
mantiene los registros de detalle
(los volmenes ms grandes) en la
base de datos relacional, mientras
que mantiene las agregaciones en
un almacn MOLAP separado.

KDD
Descubrimiento

de conocimiento
en bases de datos
Knowledge discovery in
databases
Data mining
Mineria de datos
Asociacion
Clasificacion y regresion
Clustering

KDD
El

KDD es considerado como el


proceso no trivial de la extraccin
de datos ocultos, previamente
desconocidos y potencialmente
tiles

KDD

Mineria de datos
Clasificacion
Prediccion
Asociacion
Clustering

Clasificacion
Consiste en examinar las
caractersticas de una entidad nueva
y asignarle una clase predefinida.
rboles de decisin de un nivel
Clasificador 1R
Tabla de decisin
ID3
C4.5
PART

Estimacion / prediccion
Asignar un valor a una variable
dependiente que toma valores
numricos continuos. Esto lo
diferencia de la clasificacin.

Asociacion
Identificar patrones de
comportamiento a travs de
relaciones entre datos.

Algunas herramientas
Intelligent Miner (IBM)
KDD Project (GTE laboratories)
Datamind (Datamind Inc),
Saxon (PMSI).
Data Surveyor (www.ddi.nl)
IDIS (

http://datamine.inter.net/datamin
e
)
VisDB (
http://www.informatik.uni-halle.d
e/dbs/Research/VisDB

BSC

Despus

de realizar un anlisis estratgico, establecer objetivos y


metas generales y propias de cada nivel gerencial e identificar
claves de xito para todos los procesos; se deben realizar
actividades de seguimiento a cada uno de los objetivos planteados
que permitan medir su nivel de cumplimiento y tomar medidas
correctivas en caso de ser necesario.
Generalmente estas actividades de seguimiento se realizan
definiendo un conjunto de indicadores para cada objetivo
planteado, por medio de los cuales pueda medirse el cumplimiento
de estos.

El BSC es la herramienta adecuada para desarrollar estos procesos


a travs del despliegue de un cuadro de indicadores agrupado por
objetivos, y clasificado haciendo uso de colores que permitan
identificar si el indicador esta por encima o por debajo de los
valores esperados para el cumplimiento de las metas establecidas.

Ejemplo BSC

Ir

al ejemplo en salud charla_bsc


en salud
Ejemplo 2

BSC

Despus

de realizar un anlisis estratgico, establecer objetivos y


metas generales y propias de cada nivel gerencial e identificar
claves de xito para todos los procesos; se deben realizar
actividades de seguimiento a cada uno de los objetivos planteados
que permitan medir su nivel de cumplimiento y tomar medidas
correctivas en caso de ser necesario.
Generalmente estas actividades de seguimiento se realizan
definiendo un conjunto de indicadores para cada objetivo
planteado, por medio de los cuales pueda medirse el cumplimiento
de estos.

El BSC es la herramienta adecuada para desarrollar estos procesos


a travs del despliegue de un cuadro de indicadores agrupado por
objetivos, y clasificado haciendo uso de colores que permitan
identificar si el indicador esta por encima o por debajo de los
valores esperados para el cumplimiento de las metas establecidas.

DW Procesos
Para

ayudar a ubicar los


contenidos del datawarehouse.
Mapping de transformacin de
datos.
Gua de los algoritmos usados.
Mecanismos de sumarizacion.
Definicin de la estructura de
datos.
Definiciones del sistema de
registro.

DW Metadatos
Para

ayudar a ubicar los


contenidos del datawarehouse.
Mapping de transformacin de
datos.
Gua de los algoritmos usados.
Mecanismos de sumarizacion.
Definicin de la estructura de
datos.
Definiciones del sistema de
registro.

DW Metadatos
Modelo

de datos del DW.


Niveles de sumarizacion
Informacin de cubos.

Creacion del DW
Organizacion
Desarrollo
Limpieza
Implementacion
Evalucacion

Organizacion
Establecer

una asociacin de
usuarios, gestin y grupos
Implementacin incremental
Reportar activamente y publicar
los casos exitosos

Desarrollo
Revisar

alcance, redundancia de
datos, tipo de usuario final
Arquitectura
Hardware
Sistemas DB
Front
Sofrware

Limpieza y transformacion

Limpieza y transformacion

Limpieza y transformacion
1.

Analizar sus datos corporativos para


descubrir inexactitudes, anomalas y
otros problemas.
2 Transformar los datos para asegurar
que sean precisos y coherentes.
3 Asegurar la integridad referencial,
que es la capacidad del data
warehouse, para identificar
correctamente al instante cada objeto
del negocio, tales como un producto,
un cliente o un empleado.

Limpieza y transformacion
4

Validar los datos que usa la aplicacin


del datawarehouse para realizar las
consultas de prueba.
5 Producir la metadata, una descripcin
del tipo de datos, formato y el significado
relacionado al negocio de cada campo.
6 Finalmente, viene el paso crucial de la
documentacin del proceso completo
para que se pueda ampliar, modificar y
arreglar los datos en el futuro con ms
facilidad.

Extraer
Convierte

los datos a un formato


preparado para iniciar el proceso
de transformacin.
Analizar los datos extrados
Impacto mnimo en el sistema
origen

Transformar
Seleccionar

slo ciertas columnas para su carga (por


ejemplo, que las columnas con valores nulos no se
carguen).
Traducir cdigos (por ejemplo, si la fuente almacena
una "H" para Hombre y "M" para Mujer pero el destino
tiene que guardar "1" para Hombre y "2" para Mujer).
Codificar valores libres (por ejemplo, convertir
"Hombre" en "H" o "Sr" en "1").
Obtener nuevos valores calculados (por ejemplo,
total_venta = cantidad * precio).
Unir datos de mltiples fuentes (por ejemplo,
bsquedas, combinaciones, etc.).
Calcular totales de mltiples filas de datos (por
ejemplo, ventas totales de cada regin).

Transformar
Generacin

de campos clave en el destino.


Transponer o pivotar (girando mltiples columnas en
filas o viceversa).
Dividir una columna en varias (por ejemplo, columna
"Nombre: Garca, Miguel"; pasar a dos columnas
"Nombre: Miguel" y "Apellido: Garca").
La aplicacin de cualquier forma, simple o compleja,
de validacin de datos, y la consiguiente aplicacin de
la accin que en cada caso se requiera:
Datos OK: Entregar datos a la siguiente etapa (Carga).
Datos errneos: Ejecutar polticas de tratamiento de
excepciones (por ejemplo, rechazar el registro
completo, dar al campo errneo un valor nulo o un
valor centinela).

Carga
Incremental
Con

reemplazo

Carga
Acumulacin

simple: La acumulacin
simple es la ms sencilla y comn, y
consiste en realizar un resumen de
todas las transacciones comprendidas
en el perodo de tiempo seleccionado y
transportar el resultado como una
nica transaccin hacia el data
warehouse, almacenando un valor
calculado que consistir tpicamente
en un sumatorio o un promedio de la
magnitud considerada.

Carga
Rolling:

El proceso de Rolling por su parte,


se aplica en los casos en que se opta por
mantener varios niveles de granularidad.
Para ello se almacena informacin
resumida a distintos niveles,
correspondientes a distintas agrupaciones
de la unidad de tiempo o diferentes
niveles jerrquicos en alguna o varias de
las dimensiones de la magnitud
almacenada (por ejemplo, totales diarios,
totales semanales, totales mensuales,
etc.).

Por que falla un proyecto


de BI
La

bodega crece de forma desproporcionada porque


los tcnicos no consiguen decir 'no' a las 'excesivas'
demandas de los usuarios.
Se prefiere realizar el proyecto con gente de la propia
empresa, cuando stos no tienen ni tiempo, ni
conocimientos para poder abarcarlo.
Se fijan unas fechas de entrada en produccin del
sistema poco realistas, que provoca nuevas fechas y
ms retrasos.
El presupuesto destinado para el proyecto es escaso en
comparacin con el grado de complejidad que se quiere
desarrollar.
La seleccin del software y hardware a veces se realiza
siguiendo criterios de acuerdos generales o
compromisos, antes que puramente tcnicos.

Por que falla un proyecto


de BI
Antes

del proyecto, no se realizan benchmarks o '


pruebas de concepto' para determinar la viabilidad.
Los datos de origen no estn limpios. Duplicidades,
errores, carcteres errneos.. implican un proceso ETL
ms costoso, mayor tamo de la Base de datos y peor
rendimiento.
Mala eleccin de los consultores y excesiva rotacin
entre ellos.
Escasa involucracin de los usuarios finales que les lleva
a sentir cierta frustraccin con los resultados obtenidos.
Caer en el error de 'en informtica todo se puede hacer'
y empezar con customizaciones, escribir cdigo fuera de
las funcionalidades standard.
No alinear el proyecto dentro de una estrategia de
negocio.

Вам также может понравиться