Вы находитесь на странице: 1из 18

Bases de datos OLTP y OLAP

http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx

OLTP - On-Line Transactional Processing

Los sistemas OLTP son bases de datos orientadas al procesamiento de transacciones. Una
transacción genera un proceso atómico (que debe ser validado con un commit, o invalidado
con un rollback), y que puede involucrar operaciones de inserción, modificación y borrado
de datos. El proceso transaccional es típico de las bases de datos operacionales.

El acceso a los datos está optimizado para tareas frecuentes de lectura y escritura.
(Por ejemplo, la enorme cantidad de transacciones que tienen que soportar las BD de
bancos o hipermercados diariamente).

Los datos se estructuran según el nivel aplicación (programa de gestión a medida,


ERP o CRM implantado, sistema de información departamental...).

Los formatos de los datos no son necesariamente uniformes en los diferentes


departamentos (es común la falta de compatibilidad y la existencia de islas de datos).

El historial de datos suele limitarse a los datos actuales o recientes.

OLAP - On-Line Analytical Processing

Los sistemas OLAP son bases de datos orientadas al procesamiento analítico. Este análisis
suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer
algún tipo de información útil: tendencias de ventas, patrones de comportamiento de los
consumidores, elaboración de informes complejos… etc. Este sistema es típico de los
datamarts.

El acceso a los datos suele ser de sólo lectura. La acción más común es la consulta,
con muy pocas inserciones, actualizaciones o eliminaciones.

Los datos se estructuran según las áreas de negocio, y los formatos de los datos están
integrados de manera uniforme en toda la organización.

El historial de datos es a largo plazo, normalmente de dos a cinco años.

Las bases de datos OLAP se suelen alimentar de información procedente de los


sistemas operacionales existentes, mediante un proceso de extracción, transformación
y carga (ETL).
OLTP vs. OLAP

http://datawarehouse4u.info/OLTP-vs-OLAP.html

We can divide IT systems into transactional (OLTP) and analytical (OLAP). In general we can
assume that OLTP systems provide source data to data warehouses, whereas OLAP systems help
to analyze it.

- OLTP (On-line Transaction Processing) is characterized by a large number of short on-line


transactions (INSERT, UPDATE, DELETE). The main emphasis for OLTP systems is put on very fast
query processing, maintaining data integrity in multi-access environments and an effectiveness
measured by number of transactions per second. In OLTP database there is detailed and current
data, and schema used to store transactional databases is the entity model (usually 3NF).

- OLAP (On-line Analytical Processing) is characterized by relatively low volume of transactions.


Queries are often very complex and involve aggregations. For OLAP systems a response time is an
effectiveness measure. OLAP applications are widely used by Data Mining techniques. In OLAP
database there is aggregated, historical data, stored in multi-dimensional schemas (usually star
schema).

The following table summarizes the major differences between OLTP and OLAP system design.
OLTP System OLAP System
Online Transaction Processing Online Analytical Processing
(Operational System) (Data Warehouse)
Operational data; OLTPs are the Consolidation data; OLAP data comes
Source of data
original source of the data. from the various OLTP Databases
Purpose of To control and run fundamental To help with planning, problem
data business tasks solving, and decision support
Reveals a snapshot of ongoing Multi-dimensional views of various
What the data
business processes kinds of business activities
Inserts and Short and fast inserts and updates Periodic long-running batch jobs
Updates initiated by end users refresh the data
Relatively standardized and
Often complex queries involving
Queries simple queries Returning
aggregations
relatively few records
Depends on the amount of data
involved; batch data refreshes and
Processing
Typically very fast complex queries may take many hours;
Speed
query speed can be improved by
creating indexes
Larger due to the existence of
Space Can be relatively small if
aggregation structures and history data;
Requirements historical data is archived
requires more indexes than OLTP
Typically de-normalized with fewer
Database Highly normalized with many
tables; use of star and/or snowflake
Design tables
schemas
Backup religiously; operational
Instead of regular backups, some
data is critical to run the business,
Backup and environments may consider simply
data loss is likely to entail
Recovery reloading the OLTP data as a recovery
significant monetary loss and legal
method
liability
source: www.rainmakerworks.com
Persistencia MOLAP, ROLAP, HOLAP
http://www.sinnexus.com/business_intelligence/olap_avanzado.aspx

Los cubos, las dimensiones y las jerarquías son la esencia de la navegación


multidimensional del OLAP. Al describir y representar la información en esta forma, los
usuarios pueden navegar intuitivamente en un conjunto complejo de datos. Sin embargo, el
solo describir el modelo de datos en una forma más intuitiva, hace muy poco para ayudar a
entregar la información al usuario más rápidamente.

Un principio clave del OLAP es que los usuarios deberían obtener tiempos de respuesta
consistentes para cada vista de datos que requieran. Dado que la información se colecta en
el nivel de detalle solamente, el resumen de la información es usualmente calculado por
adelantado. Estos valores precalculados son la base de las ganancias de desempeño del
OLAP.

En los primeros días de la tecnología OLAP, la mayoría de las compañías asumía que la
única solución para una aplicación OLAP era un modelo de almacenamiento no relacional.
Después, otras compañías descubrieron que a través del uso de estructuras de base de datos
(esquemas de estrella y de copo de nieve), índices y el almacenamiento de agregados, se
podrían utilizar sistemas de administración de bases de datos relacionales (RDBMS) para el
OLAP.

Estos vendedores llamaron a esta tecnología OLAP relacional (ROLAP). Las primeras
compañías adoptaron entonces el término OLAP multidimensional (MOLAP), estos
conceptos, MOLAP y ROLAP, se explican con más detalle en los siguientes párrafos. Las
implementaciones MOLAP normalmente se desempeñan mejor que la tecnología ROLAP,
pero tienen problemas de escalabilidad. Por otro lado, las implementaciones ROLAP son
más escalables y son frecuentemente atractivas a los clientes debido a que aprovechan las
inversiones en tecnologías de bases de datos relacionales preexistentes.
Sistemas MOLAP

La arquitectura MOLAP usa unas bases de datos multidimensionales para proporcionar el


análisis, su principal premisa es que el OLAP está mejor implantado almacenando los datos
multidimensionalmente. Por el contrario, la arquitectura ROLAP cree que las capacidades
OLAP están perfectamente implantadas sobre bases de datos relacionales Un sistema
MOLAP usa una base de datos propietaria multidimensional, en la que la información se
almacena multidimensionalmente, para ser visualizada en varias dimensiones de análisis.

El sistema MOLAP utiliza una arquitectura de dos niveles: la bases de datos


multidimensionales y el motor analítico. La base de datos multidimensional es la encargada
del manejo, acceso y obtención del dato.

El nivel de aplicación es el responsable de la ejecución de los requerimientos OLAP. El


nivel de presentación se integra con el de aplicación y proporciona un interfaz a través del
cual los usuarios finales visualizan los análisis OLAP. Una arquitectura cliente/servidor
permite a varios usuarios acceder a la misma base de datos multidimensional.

La información procedente de los sistemas operacionales, se carga en el sistema MOLAP,


mediante una serie de rutinas por lotes. Una vez cargado el dato elemental en la Base de
Datos multidimensional (MDDB), se realizan una serie de cálculos por lotes, para calcular
los datos agregados, a través de las dimensiones de negocio, rellenando la estructura
MDDB.

Tras rellenar esta estructura, se generan unos índices y algoritmos de tablas hash para
mejorar los tiempos de accesos a las consultas. Una vez que el proceso de compilación se
ha acabado, la MDDB está lista para su uso. Los usuarios solicitan informes a través de la
interfase, y la lógica de aplicación de la MDDB obtiene el dato.

La arquitectura MOLAP requiere unos cálculos intensivos de compilación. Lee de datos


precompilados, y tiene capacidades limitadas de crear agregaciones dinámicamente o de
hallar ratios que no se hayan precalculados y almacenados previamente.

Sistemas ROLAP

La arquitectura ROLAP, accede a los datos almacenados en un datawarehouse para


proporcionar los análisis OLAP. La premisa de los sistemas ROLAP es que las capacidades
OLAP se soportan mejor contra las bases de datos relacionales.

El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional
maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona la
funcionalidad analítica. El nivel de base de datos usa bases de datos relacionales para el
manejo, acceso y obtención del dato. El nivel de aplicación es el motor que ejecuta las
consultas multidimensionales de los usuarios.
El motor ROLAP se integra con niveles de presentación, a través de los cuáles los usuarios
realizan los análisis OLAP. Después de que el modelo de datos para el datawarehouse se ha
definido, los datos se cargan desde el sistema operacional. Se ejecutan rutinas de bases de
datos para agregar el dato, si así es requerido por el modelos de datos. Se crean entonces los
índices para optimizar los tiempos de acceso a las consultas.

Los usuarios finales ejecutan sus análisis multidimensionales, a través del motor ROLAP,
que transforma dinámicamente sus consultas a consultas SQL. Se ejecutan estas consultas
SQL en las bases de datos relacionales, y sus resultados se relacionan mediante tablas
cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios.

La arquitectura ROLAP es capaz de usar datos precalculados si estos están disponibles, o


de generar dinámicamente los resultados desde los datos elementales si es preciso. Esta
arquitectura accede directamente a los datos del datawarehouse, y soporta técnicas de
optimización de accesos para acelerar las consultas. Estas optimizaciones son, entre otras,
particionado de los datos a nivel de aplicación, soporte a la desnormalización y joins
múltiples.

Sistemas MOLAP

Un desarrollo un poco más reciente ha sido la solución OLAP híbrida (HOLAP), la cual
combina las arquitecturas ROLAP y MOLAP para brindar una solución con las mejores
características de ambas: desempeño superior y gran escalabilidad. Un tipo de HOLAP
mantiene los registros de detalle (los volúmenes más grandes) en la base de datos
relacional, mientras que mantiene las agregaciones en un almacén MOLAP separado.
Diferencias entre un sistema OLTP y
OLAP

Las características que diferencian a los sistemas OLTP y OLAP se muestran a


continuación con su respectiva explicación:

Sistemas OLTP Sistemas OLAP

Objetivo Garantizar la consistencia Consolidar los datos ya


de los datos. validados y adecuados a las
necesidades para la toma
de decisiones.

Orientación Orientado a la aplicación, Orientado al sujeto, se


hace cumplir las reglas del define en base a lo que el
negocio. analista necesita ver.

Vigencia de los datos Los datos se usan a medida Se guardan los datos
que se van produciendo y actuales y los históricos
dejan de ser importantes a para poder realizar análisis
corto plazo. comparativos.

Granularidad de datos Es dada por controles Estará dado por el tipo de


definidos por la análisis que se requiera
organización, así como por analizar.
normas legales
importantes.
Organización Es normalizado. Se basa en estructuras
jerárquicas
desnormalizadas
modeladas de acuerdo a
como se analizaran los
datos.

Cambios en los datos Modifica sus datos en forma No tiene como objetivo la
constante porque maneja presentación de los datos
las transacciones de la en línea ni tampoco
empresa. modificar datos originales,
solo consultarlos.
Tabla comparativa OLTP y OLAP
http://bdavanzada.bligoo.com.mx/tabla-comparativa-oltp-y-olap#.V0N1geT53Vs

Top 10 Business Intelligence Trends New For 2016. Read Free Report!

OLTP OLAP
 Procesamiento de transacciones en  Es el acrónimo en ingles de
línea es un tipo de sistemas que procesamiento analítico en línea es
facilitan y administran una solución utilizada en el campo de
aplicaciones transaccionales la llamada inteligencia
usualmente de datos.

 Objetivos principales
 Objetivos principales
Los OLTP tienen como objetivos
principales asistir a aplicaciones Apuntan a asistir en el análisis del negocio
específicas, p.e. ATM, y Mantener identificando tendencias comprando
integridad de los datos. periodos , gestiones ,mercados índices
mediante el almacenamiento de datos
 Alineación de datos
 Alineación de los datos
Los OLTP están alineados por aplicación.
Diferentes sistemas tienen distintos tipos de Los sistemas OLAP están alineados por
datos, Los cuales son estructurados por dimensión. Todos los tipos de datos
aplicación. Se focaliza en el cumplimiento integrados en un solo sistema. Los datos
de requerimientos de una aplicación en son organizados definiendo dimensiones del
especial o una tarea específica. negocio (áreas temáticas o sujetos). Se
focaliza en el cumplimento de
 Integración de datos requerimientos del análisis del negocio.

En los OLTP, los datos se encuentran  Integración de datos


típicamente no integrados, son calificados
como datos Los datos deben estar integrados. Son
conocidos como datos derivados o datos
Primitivos o datos operacionales. Los DSS dado que provienen de sistemas
mismos son estructurados transaccionales o sistemas de archivos
independientemente uno de otros, pudiendo maestros preexistentes en las mismas
tener diferentes estructuras de claves y organizaciones o de sistemas externos de
convenciones de nombres. Son usualmente información.
almacenados en diferentes formatos de
archivos.  Historia

 Historia Almacenan tanta historia como sea


necesario para el análisis del negocio,
típicamente dos a cinco años de datos
Los OLTP usualmente retienen datos para históricos. Retienen valores para cada
60 a 90 días, después son resguardados por período (el atributo más atómico de la
los administradores de base de datos en dimensión tiempo) en la base de datos.
almacenamientos secundarios fuera de
línea (p.e. cintas o en disco a nivel de back  Acceso y manipulación de los datos
up). También es común que contengan sólo
valores corrientes. Los DWs tienen una carga y acceso masivo
de datos, no se realizan inserts, updates o
 Acceso y manipulación de los datos deletes. La carga y refresco es batch (lo que
se conoce como proceso BULK COPY). La
Los sistemas operacionales realizan una validación de datos se realiza antes o
manipulación de datos registro por registro después de la carga.
con grandes cantidades de inserts, updates
y deletes. Además necesitan de rutinas de  Patrones de uso
validación y transacciones a nivel registro
(OLTP on-line TRANSACTION Tienen un patrón de uso liviano con picos
processing). de usos eventuales en el tiempo (afectados
por la disponibilidad de los datos y el flujo
 Patrones de uso de trabajo del negocio).Los picos de uso
suceden el mismo día de cada semana y el
Los sistemas transaccionales normalmente mismo día de cada mes.
mantienen un patrón de uso constante
requiriendo grandes cantidades de recursos  Granularidad de los datos
y consumiendo sólo el tiempo referido a la
transacción. Contenían información sumarizada hasta
cierto nivel con el avance en el desarrollo
 Granularidad de los datos de las bases de datos durante la década de
los 90.
En los sistemas operacionales se
encuentran los datos a nivel detallado o
nivel transaccional.

Una transacción incluye a nivel atómico


cada uno de los componentes de su  Perfil de usuario
estructura (fecha, hora, código de cliente,
código de movimiento, importe, etc.) Dado el objetivo estratégico y el nivel de
información que manejan los DW, el perfil
 Perfil de usuario de usuario sobre este tipo de sistemas
corresponde a la comunidad gerencial, la
Dado que los OLTP tienen como objetivo cual esta a cargo de la toma de decisiones.
asistir a aplicaciones específicas y asegurar
la integridad de los datos, el perfil de
usuario que interactúa con dichos sistemas
se encuadra dentro de los empleados
operacionales de una organización
(comunidad operativa).
http://www.classora.com/
Diferencia entre OLTP y OLAP
https://oltp.wikispaces.com/Diferencia+entre+OLTP+y+OLAP

Las aplicaciones OLTP se caracterizan por la creación de muchos usuarios, actualizaciones o


recuperación de registros individuales. Por consiguiente, las bases de datos OLTP se perfeccionan
para actualización de transacciones. Las aplicaciones OLAP son usadas por analistas y gerentes que
frecuentemente quieren una vista de datos de nivel superior, como las ventas totales por línea de
producto, por región, etc. Las bases de datos OLAP normalmente se actualizan en lote, a menudo
de múltiples fuentes, y proporcionan un back-end analítico poderoso a las aplicaciones de
múltiples usuarios. Por tanto, las bases de datos OLAP se perfeccionan para el análisis.
Mientras las bases de datos relacionales son buenas al recuperar un número pequeño de archivos
rápidamente, ellas no son buenas al recuperar un número grande de archivos y resumirlos on-the-
fly. Un tiempo de respuesta lento y el uso excesivo de recursos del sistema son las características
comunes de las aplicaciones de soporte de decisión construidas exclusivamente sobre la
tecnología de bases de datos relacionales. Debido a la facilidad con la cuál se puede emitir un
“ejecutar una consulta SQL externa”, muchos distribuidores IS (Information Systems) no brindan
acceso directo a los usuarios a sus bases de datos relacionales.
Muchos de los problemas que las personas intentan resolver con la tecnología relacional son
realmente multidimensionales en naturaleza. Por ejemplo, una consulta SQL para crear resúmenes
de ventas del producto por la región, las ventas de la región por producto, y así sucesivamente,
podrían involucrar la revisión de la mayoría, si no todos, de los registros en una base de datos de
mercadeo y podría tomar horas de proceso. Un servidor OLAP podría ocuparse de estas preguntas
en unos segundos.

OLTP (Relational) OLAP(Multidimensional)

Atomized Summarized
Present Historical
Record-at-a-time Many records at a time
Process oriented Subject oriented

Las aplicaciones OLTP tienden a tratar con datos atomizados “registro a un tiempo”, considerando
que las aplicaciones de OLAP normalmente se tratan de los datos resumidos. Mientras las
aplicaciones OLTP generalmente no requieren de datos históricos, casi cada aplicación de OLAP se
preocupa por ver las tendencias y por consiguiente requiere de datos históricos. Como
consecuencia, las bases de datos OLAP necesitan la capacidad de ocuparse de datos series de.
Mientras las aplicaciones OLTP y bases de datos tienden a ser organizados alrededor de procesos
específicos (como ordenes de entrada), las aplicaciones OLAP tienden a ser “orientadas al tema”,
respondiendo a preguntas como “¿Qué productos están vendiendo bien?” o “¿Dónde están mis
oficinas de ventas más débiles?”.

Característica OLTP OLAP


Tamaño BBDD GigaBytes Giga a TeraBytes

Origen Datos Interno Interno y Externo

Actualización On-Line Batch

Periodos Actual Histórico

Consultas Predecibles Ad Hoc

Actividad Operacional Analítica


Bases de datos multidimensionales: OLAP
vs OLTP
http://blog.classora.com/2013/06/25/bases-de-datos-multidimensionales-olap-vs-oltp/

2013 junio 25

by classora

Las bases de datos multidimensionales son una variación del modelo relacional que
utiliza cubos OLAP para organizar los datos y expresar las relaciones entre ellos. Las
principales ventajas de este tipo de bases de datos son la versatilidad para cruzar
información y la alta velocidad de respuesta. Esto las convierte en herramientas básicas
para soluciones de Business Intelligence o de Big Data, donde el análisis de los datos
resulta crucial.

En general, estamos acostumbrados a trabajar con bases de datos orientadas a transacciones


(conocidas como bases de datos OLTP). A continuación veremos las principales
diferencias con las bases de datos multidimensionales (conocidas como bases de datos
OLAP).

OLTP – On-Line Transactional Processing

Los sistemas OLTP son bases de datos relacionales (RDBMS) orientadas a transacciones.
Una transacción es una secuencia de operaciones llevada a cabo por una base de datos de
manera atómica. Las operaciones pueden ser de cuatro tipos diferentes: SELECT, INSERT,
DELETE y UPDATE. Al tratarse de un proceso atómico, cada transacción solo tiene dos
posibles finales: commit (si se han llevado a cabo correctamente todas las operaciones) o
rollback (cuando una operación de la secuencia ha fallado, en cuyo caso hay que deshacer
los cambios producidos por el resto de las operaciones de la transacción y alertar del error).
Las transacciones son el pilar de prácticamente cualquier programa de gestión o página web
del mundo. Su necesidad se ve muy clara, por ejemplo, en el sector de la banca.

Garantizando las transacciones: las características ACID


Para que una base de datos OLTP pueda asegurar las transacciones es necesario que sea
ACID compliant. ACID es un acrónimo de Atomicity, Consistency, Isolation and
Durability:

 Atomicidad: asegura que la operación se ha realizado correcta y completamente, de


forma que no pueda quedar a medias en caso de que surja cualquier error.
 Consistencia: asegura la integridad de la base de datos, es decir, que solo se ejecutan
aquellas operaciones que no van a romper las reglas, restricciones y claves foráneas. La
propiedad de consistencia sostiene que cualquier transacción llevará a la base de datos
desde un estado válido a otro también válido.
 Aislamiento: asegura que dos transacciones que afectan a la misma información (tabla,
fila o celda) son independientes y no generan errores ni deadlocks. Existen cuatro posibles
niveles de aislamiento: READ UNCOMMITTED, READ COMMITTED, REPEATABLE READS y
SERIALIZABLE, en función del tipo de bloqueos que se crean para proteger la
información.
 Durabilidad: asegura que una vez realizada la operación, ésta persistirá y no se podrá
deshacer aunque falle el sistema. Será almacenada en disco, no solo en memoria.

Propiedades de las bases de datos OLTP


Los sistemas OLTP son la versión tradicional de una base de datos: se diseñan utilizando
un modelo entidad-relación, se implementan en los motores típicos de base de datos
(Oracle, SQLServer, MySQL… etc.) y dan soporte a la mayor parte del software del
mercado:

 Optimizadas para lecturas y escrituras concurrentes: gracias a las propiedades ACID, el


acceso a los datos está adaptado para tareas frecuentes de lectura y escritura.
 Organizadas según la capa de aplicación: las tablas y los datos se estructuran según el
software que los maneja: programa de gestión a medida, ERP, CRM, BPM… etc.
 Adaptadas a cada empresa o departamento: dado que en muchas ocasiones se utiliza
software no integrado, los formatos de los datos no suelen ser uniformes en los diferentes
departamentos. Es común la falta de compatibilidad y la existencia de islas de datos.
 Consultas realizadas en SQL, modificaciones en DML: el SQL (Standard Query Language)
es el lenguaje de consulta universal para leer bases de datos relacionales (cláusula
SELECT), mientras que DML (Data Manipulation Language) es el estándar para realizar
modificaciones (cláusulas INSERT, UPDATE y DELETE).
 Gestión de datos históricos inexistente: el historial de cambios suele limitarse a datos
actuales o recientes. Salvo sistemas de backup, o que el software tenga una funcionalidad
específica para ello, no se suelen manejar valores históricos para cada campo.

OLAP: On-Line Analytical Processing

Los sistemas OLAP son bases de datos orientadas al procesamiento analítico. Este análisis
suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer
algún tipo de información útil: tendencias de ventas, patrones de comportamiento de los
consumidores, elaboración de informes complejos… etc.

Representando la información: los cubos OLAP


Un cubo OLAP no es más que un vector de varias dimensiones. Desde un punto de vista
relacional, puede verse como una tabla de hechos (fact table) que tiene dos tipos de
columnas:

 Indicadores: también denominados métricas o ratios, son los valores numéricos con los
que se opera. Por ejemplo: nº de clientes, nº de proveedores, importe de las ventas, nº de
ventas, importe de las compras, nº de compras… etc.
 Dimensiones: son las características por las que se pueden filtrar y cruzar los indicadores.
Por ejemplo: tiempo (fijando un determinado día, mes o año), geografía (fijando un
determinado país, región o ciudad), proveedor, cliente, modo de pago… etc.
Las columnas correspondientes a las dimensiones tienen claves foráneas a tablas de
dimensión, que generalmente son tablas de maestros con clave-valor (esquema en estrella)
o tablas organizadas en jerarquías (esquema en copo de nieve) como: ciudad – provincia –
país.

En general suele resultar necesario dimensionar la volumetría de los cubos para conseguir
que generen los informes deseados, y monitorizar su tamaño para garantizar que los
resultados se obtienen en el tiempo esperado. En este sentido suele resultar fundamental
tener en cuenta dos características básicas: la cardinalidad del cubo, posibles
combinaciones de todos los valores de todas las dimensiones, y la granularidad del cubo,
nivel de detalle máximo de los datos, o lo que es lo mismo, nivel de agregación mínimo de
la información.

Propiedades de las bases de datos OLAP


Así como los sistemas OLTP son típicos para bases de datos convencionales y data
warehouses, los sistemas OLAP son propios de los datamarts.

 Optimizadas para operaciones de lectura: dado que la acción más común es la consulta,
estas bases de datos disponen de valores agregados y resultados precalculados que les
permiten responder en tiempo récord. Evitar las restricciones ACID les da agilidad.
 Organizadas según las necesidades analíticas: los datos están estructurados según las
áreas de negocio, y los formatos de los datos están integrados de manera uniforme en
toda la organización. Se busca evitar islas de datos.
 Asíncronas: no siempre se actualizan en tiempo real, sino que se suelen alimentar con
información procedente de las bases de datos relacionales mediante un proceso de
extracción, transformación y carga (ETL).
 Consultas realizadas en MDX: este lenguaje, MDX (MultiDimensional eXpressions) fue
desarrollado inicialmente por Microsoft y adoptado posteriormente como estándar para
leer cubos OLAP. Un cliente puede manipular el cubo de distintas formas: rotarlo,
rebanarlo cortarlo en dados… etc.
 Gestión de datos históricos a largo plazo: una de las exigencias analíticas consiste en
realizar estudios de evolución a lo largo del tiempo, esto requiere que estas bases de
datos mantengan un histórico a largo plazo, normalmente no inferior a cinco años.

Tipos de persistencia OLAP


En los orígenes de la tecnología OLAP la mayor parte de las compañías asumió que la
única solución para una aplicación OLAP era un modelo de almacenamiento no relacional.
Sin embargo, otras compañías no tardaron en descubrir que a través del uso de estructuras
de base de datos (esquemas de estrella y de copo de nieve), índices y el almacenamiento de
agregados, se podrían utilizar sistemas de administración de bases de datos relacionales
(RDBMS) para el OLAP.

Estos vendedores llamaron a esta tecnología OLAP relacional (ROLAP). En consecuencia,


las primeras compañías adoptaron entonces el término OLAP multidimensional (MOLAP).
Ambos conceptos, MOLAP y ROLAP, se explican con más detalle en los siguientes
párrafos. Las implementaciones MOLAP normalmente tienen mejor rendimiento y
velocidad que la tecnología ROLAP, pero tienen problemas de escalabilidad. Por otro lado,
las implementaciones ROLAP son más escalables y son frecuentemente atractivas a los
clientes debido a que aprovechan las inversiones en tecnologías de bases de datos
relacionales preexistentes.

Sistemas MOLAP: la información procedente de los sistemas operacionales se carga en el


sistema MOLAP mediante una serie de rutinas por lotes. Una vez cargado el dato elemental
en la Base de Datos multidimensional (MDDB), se realizan una serie de cálculos para
obtener los datos agregados, a través de las dimensiones de negocio, rellenando la
estructura MDDB.

Tras rellenar esta estructura, se generan unos índices y algoritmos de tablas hash para
mejorar los tiempos de accesos a las consultas. Una vez que el proceso de compilación se
ha acabado, la MDDB está lista para su uso. Los usuarios solicitan informes a través de la
interfaz, y la lógica de aplicación de la MDDB obtiene el dato.

La arquitectura MOLAP requiere unos cálculos intensivos de compilación. Lee de datos


precompilados, y tiene capacidades limitadas de crear agregaciones dinámicamente o de
hallar ratios que no se hayan precalculados y almacenados previamente.

Sistemas ROLAP: los usuarios ejecutan sus análisis multidimensionales, a través del
motor ROLAP, que transforma dinámicamente sus consultas a consultas SQL. Se ejecutan
estas consultas SQL en las bases de datos relacionales, y sus resultados se relacionan
mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los
usuarios.

La arquitectura ROLAP es capaz de usar datos precalculados si estos están disponibles, o


de generar dinámicamente los resultados desde los datos elementales si es preciso. Esta
arquitectura accede directamente a los datos del datawarehouse, y soporta técnicas de
optimización de accesos para acelerar las consultas. Estas optimizaciones son, entre otras,
particionado de los datos a nivel de aplicación, soporte a la desnormalización y joins
múltiples.

Sistemas HOLAP: un desarrollo un poco más reciente ha sido la solución OLAP híbrida
(HOLAP), la cual combina las arquitecturas ROLAP y MOLAP para brindar una solución
con las mejores características de ambas: desempeño superior y gran escalabilidad. Un tipo
de HOLAP mantiene los registros de detalle (los volúmenes más grandes) en la base de
datos relacional, mientras que mantiene las agregaciones en un almacén MOLAP separado.

Más información

Como en otras ocasiones, si te interesa conocer más información sobre este tema no dudes
en contactar con nosotros para que te enviemos documentación adicional. Cuenta con
Classora Technologies para estar informado sobre bases de datos multidimensionales.

Вам также может понравиться