Вы находитесь на странице: 1из 15

DATAWAREHOUSE

Un Datawarehouse es una base de datos corporativa que se caracteriza por


integrar y depurar informacin de una o ms fuentes distintas, para luego
procesarla permitiendo su anlisis desde infinidad de pespectivas y con
grandes velocidades de respuesta. La creacin de un datawarehouse
representa en la mayora de las ocasiones el primer paso, desde el punto de
vista tcnico, para implantar una solucin completa y fiable de Business
Intelligence.

La ventaja principal de este tipo de bases de datos radica en las estructuras en


las que se almacena la informacin (modelos de tablas en estrella, en copo de
nieve, cubos relacionales... etc). Este tipo de persistencia de la informacin es
homognea y fiable, y permite la consulta y el tratamiento jerarquizado de la
misma (siempre en un entorno diferente a los sistemas operacionales).

El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y se
traduce literalmente como almacn de datos. No obstante, y como cabe
suponer, es mucho ms que eso.

UN DATAWAREHOUSE SE CARACTERIZA POR SER:

Integrado: los datos almacenados en el datawarehouse deben integrarse


en una estructura consistente, por lo que las inconsistencias existentes
entre los diversos sistemas operacionales deben ser eliminadas. La
informacin suele estructurarse tambin en distintos niveles de detalle para
adecuarse a las distintas necesidades de los usuarios.

Temtico: slo los datos necesarios para el proceso de generacin del


conocimiento del negocio se integran desde el entorno operacional. Los
datos se organizan por temas para facilitar su acceso y entendimiento por
parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes
pueden ser consolidados en una nica tabla del datawarehouse. De esta
forma, las peticiones de informacin sobre clientes sern ms fciles
deresponder dado que toda la informacin reside en el mismo lugar.

Histrico: el tiempo es parte implcita de la informacin contenida en un


datawarehouse. En los sistemas operacionales, los datos siempre reflejan
el estado de la actividad del negocio en el momento presente. Por el
contrario, la informacin almacenada en el datawarehouse sirve, entre
otras cosas, para realizar anlisis de tendencias. Por lo tanto, el
datawarehouse se carga con los distintos valores que toma una variable en
el tiempo para permitir comparaciones.

No voltil: el almacn de informacin de un datawarehouse existe para ser


ledo, pero no modificado. La informacin es por tanto permanente,
significando la actualizacin del datawarehouse la incorporacin de los
ltimos valores que tomaron las distintas variables contenidas en l sin
ningn tipo de accin sobre lo que ya exista.

1
Otra caracterstica del datawarehouse es que contiene metadatos, es decir,
datos sobre los datos. Los metadatos permiten saber la procedencia de la
informacin, su periodicidad de refresco, su fiabilidad, forma de clculo... etc.
Los metadatos sern los que permiten simplificar y automatizar la obtencin de
la informacin desde los sistemas operacionales a los sistemas
informacionales.

Los objetivos que deben cumplir los metadatos, segn el colectivo al que va
dirigido, son:

Dar soporte al usuario final, ayudndole a acceder al datawarehouse


con su propio lenguaje de negocio, indicando qu informacin hay y qu
significado tiene. Ayudar a construir consultas, informes y anlisis,
mediante herramientas de Business Intelligence como DSS, EIS o CMI.

Dar soporte a los responsables tcnicos del datawarehouse en


aspectos de auditora, gestin de la informacin histrica,
administracin del datawarehouse, elaboracin de programas de
extraccin de la informacin, especificacin de las interfaces para la
realimentacin a los sistemas operacionales de los resultados
obtenidos... etc.

DATAMINING (MINERA DE DATOS)

El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que


permiten explorar grandes bases de datos, de manera automtica o
semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o
reglas que expliquen el comportamiento de los datos en un determinado
contexto.

Bsicamente, el datamining surge para intentar ayudar a comprender el


contenido de un repositorio de datos. Con este fin, hace uso de prcticas
estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la
Inteligencia Artificial y a las redes neuronales.

De forma general, los datos son la materia prima bruta. En el momento que el
usuario les atribuye algn significado especial pasan a convertirse en
informacin. Cuando los especialistas elaboran o encuentran un modelo,
haciendo que la interpretacin que surge entre la informacin y ese modelo
represente un valor agregado, entonces nos referimos al conocimiento. Vea
ms diferencias entre datos, informacin y conocimiento.

Aunque en datamining cada caso concreto puede ser radicalmente distinto al


anterior, el proceso comn a todos ellos se suele componer de cuatro etapas
principales:

Determinacin de los objetivos. Trata de la delimitacin de los


objetivos que el cliente desea bajo la orientacin del especialista en data
mining.

2
Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza,
el enriquecimiento, la reduccin y la transformacin de las bases de
datos. Esta etapa consume generalmente alrededor del setenta por
ciento del tiempo total de un proyecto de data mining.

Determinacin del modelo. Se comienza realizando unos anlisis


estadsticos de los datos, y despus se lleva a cabo una visualizacin
grfica de los mismos para tener una primera aproximacin. Segn los
objetivos planteados y la tarea que debe llevarse a cabo, pueden
utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia
Artificial.

Anlisis de los resultados. Verifica si los resultados obtenidos son


coherentes y los coteja con los obtenidos por los anlisis estadsticos y
de visualizacin grfica. El cliente determina si son novedosos y si le
aportan un nuevo conocimiento que le permita considerar sus
decisiones.

BUSINESS INTELLIGENCE
Business Intelligence es la habilidad para transformar los datos en informacin,
y la informacin en conocimiento, de forma que se pueda optimizar el proceso
de toma de decisiones en los negocios.

La inteligencia de negocio acta como un factor estratgico para una empresa


u organizacin, generando una potencial ventaja competitiva, que no es otra
que proporcionar informacin privilegiada para responder a los problemas
de negocio: entrada a nuevos mercados, promociones u ofertas de productos,
eliminacin de islas de informacin, control financiero, optimizacin de costes,
planificacin de la produccin, anlisis de perfiles de clientes, rentabilidad de
un producto concreto, etc...

Los principales productos de Business Intelligence que existen hoy en da son:

Cuadros de Mando Integrales (CMI)


Sistemas de Soporte a la Decisin (DSS)
Sistemas de Informacin Ejecutiva (EIS)

BASES DE DATOS ORIENTADOS A OBJETOS


En una base de datos orientada a objetos, la informacin se representa
mediante objetos como los presentes en la programacin orientada a objetos.
Cuando se integra las caractersticas de una base de datos con las de
un lenguaje de programacin orientado a objetos, el resultado es un sistema
gestor de base de datos orientada a objetos (ODBMS, object database
management system).
Un ODBMS hace que los objetos de la base de datos aparezcan como objetos
de un lenguaje de programacin en uno o ms lenguajes de programacin a los
que d soporte. Un ODBMS extiende los lenguajes con datos persistentes de

3
forma transparente, control de concurrencia, recuperacin de datos, consultas
asociativas y otras capacidades.
Las bases de datos orientadas a objetos se disean para trabajar bien en
conjuncin con lenguajes de programacin orientados a objetos como Java,
C#, Visual Basic.NET y C++. Los ODBMS usan exactamente el mismo modelo
que estos lenguajes de programacin.
Los ODBMS son una buena eleccin para aquellos sistemas que necesitan un
buen rendimiento en la manipulacin de tipos de dato complejos.
Los ODBMS proporcionan los costes de desarrollo ms bajos y el mejor
rendimiento cuando se usan objetos gracias a que almacenan objetos en disco
y tienen una integracin transparente con el programa escrito en un lenguaje
de programacin orientado a objetos, al almacenar exactamente el modelo de
objeto usado a nivel aplicativo, lo que reduce los costes de desarrollo y
mantenimiento.
Los principales conceptos que se utilizan en las Bases de Datos Orientada a
Objetos son las siguientes:

Identidad de objetos
Constructores de tipos
Encapsulamiento
Compatibilidad con los lenguajes de programacin
Jerarquas de tipos y herencia
Manejo de objetos complejos
Polimorfismo y sobrecarga de operadores y
Creacin de versiones.

Una base de datos orientada a objetos es una base de datos que incorpora
todos los conceptos importantes del paradigma de objetos:

Encapsulacin Propiedad que permite ocultar la informacin al resto de


los objetos, impidiendo as accesos incorrectos o conflictos.
Herencia Propiedad a travs de la cual los objetos heredan
comportamiento dentro de una jerarqua de clases.
Polimorfismo Propiedad de una operacin mediante la cual puede ser
aplicada a distintos tipos de objetos.

PAQUETE ETL
Es muy necesario para las aplicaciones de almacenamiento de datos. Por
ltimo, destacar que para comprender ntegramente el concepto de
datawarehouse, es importante entender cual es el proceso de construccin del
mismo, denominado ETL (Extraccin, Transformacin y Carga), a partir de los
sistemas operaciones de una compaa:

Extraccin: obtencin de informacin de las distintas fuentes tanto


internas como externas.
Transformacin: filtrado, limpieza, depuracin, homogeneizacin y
agrupacin de la informacin.

4
Carga: organizacin y actualizacin de los datos y los metadatos en la
base de datos.

Tambin se utiliza para realizar operaciones como la carga de los datos en


funcin de la necesidad, la realizacin de diferentes transformaciones de los
datos, como los clculos que hacen (Suma, Promedio, entre otros) y para
definir un flujo de trabajo de cmo debe fluir el proceso.

BASE DE DATOS OLE


OLE DB (algunas veces escrito como OLEDB u OLE-DB) es la sigla de Object
Linking and Embedding for Databases ("Enlace e incrustacin de objetos para
bases de datos") y es una tecnologa desarrollada por Microsoft usada para
tener acceso a diferentes fuentes de informacin, o bases de datos, de manera
uniforme.

OLE permite separar los datos de la aplicacin que los requiere. Esto se hizo
as ya que diferentes aplicaciones requieren acceso a diferentes tipos y
almacenes de datos, y no necesariamente desean conocer cmo tener acceso
a cierta funcionalidad con mtodos de tecnologas especficas. OLE DB est
conceptualmente dividido en consumidoresy proveedores; el consumidor es la
aplicacin que requiere acceso a los datos y el proveedor es el componente
de software que expone una interfaz OLE DB a travs del uso del Component
Object Model (COM)

BASE DE DATOS MULTIDIMENSIONAL (MDB)

Una base de datos multidimensional (MDB) es un tipo de base de datos que se


ha optimizado para data warehouse y aplicaciones de procesamiento analtico
en lnea (OLAP). Las bases de datos multidimensionales se crean con
frecuencia usando entradas de las bases de datos relacionales existentes.
Mientras que a una base de datos relacional se accede normalmente mediante
una consulta de Lenguaje de Consulta Estructurado (SQL), una base de datos
multidimensional permite a un usuario hacer preguntas como: "Cuntas
Aptivas se han vendido en Nebraska en lo que va del ao?" y cuestiones
similares relacionadas a resumir operaciones y tendencias de negocios. A una
aplicacin OLAP que accede a los datos desde una base de datos
multidimensional se le conoce como una aplicacin MOLAP (OLAP
multidimensional).

Una base de datos multidimensional o un sistema de gestin de base de


datos multidimensional (MDDBMS) implica la capacidad de procesar
rpidamente los datos en la base de datos a fin de que las respuestas se
pueden generar rpidamente. Varios proveedores ofrecen productos que
utilizan bases de datos multidimensionales. Los enfoques de cmo se
almacenan los datos y la interfaz de usuario pueden variar.

Las bases de datos multidimensionales (BDMB) son un tipo de base de datos


optimizada para Data Warehouse que se utilizan principalmente para crear
5
apliaciones OLAP, una tecnologa asociada al acceso y anlisis de datos en
lnea.

A diferencia del modelo relacional, el modelo de datos ms extendido, -donde


la informacin se almacena a travs de campos y registros-, las BDMD se
basan en la creacin de aplicaciones OLAP y pueden verse como bases de
datos contenidos en una sola tabla.

ESQUEMA DE ESTRELLA Y MODELO DE CONSTELACION


ESQUEMAS DE ESTRELLA

Un esquema de estrella es un tipo de esquema de base de datos relacional que


consta de una sola tabla de hechos central rodeada de tablas de dimensiones.
En la siguiente figura se muestra un esquema de estrella con una sola tabla de
hechos y cuatro tablas de dimensiones. Un esquema de estrella puede tener
cualquier nmero de tablas de dimensiones. Las ramas situadas al final de los
enlaces que conectan las tablas indican una relacin de muchos a uno entre la
tabla de hechos y cada tabla de dimensiones.

Esquema de estrella con una sola tabla de hechos con enlaces a varias tablas
de dimensiones.

ESQUEMAS DE CONSTELACIN

Un esquema de constelacin es una combinacin de un esquema de estrella y


un esquema de copo de nieve. Los esquemas de constelacin son esquemas
de copo de nieve en los que slo algunas de las tablas de dimensiones se han
desnormalizado.

6
El objetivo de los esquemas de constelacin es aprovechar las ventajas de los
esquemas de estrella y de copo de nieve. Las jerarquas de los esquemas de
estrella estn desnormalizadas, mientras que las jerarquas de los esquemas
de copo de nieve estn normalizadas.

Los esquemas de constelacin estn normalizados para eliminar las


redundancias de las dimensiones. Para normalizar el esquema, las jerarquas
dimensionales compartidas se colocan en outriggers.

En la siguiente figura se representa un esquema de constelacin de ejemplo:


Esquema de constelacin con un hecho y dos dimensiones que comparten un
outrigger

SISTEMA DE SOPORTE DE DECISIONES

Sistemas de Soporte a la Decisin (DSS)

Un Sistema de Soporte a la Decisin (DSS) es una herramienta de Business


Intelligence enfocada al anlisis de los datos de una organizacin.

En principio, puede parecer que el anlisis de datos es un proceso sencillo, y


fcil de conseguir mediante una aplicacin hecha a medida o un ERP

7
sofisticado. Sin embargo, no es as: estas aplicaciones suelen disponer de una
serie de informes predefinidos en los que presentan la informacin de manera
esttica, pero no permiten profundizar en los datos, navegar entre ellos,
manejarlos desde distintas perspectivas... etc.

El DSS es una de las herramientas ms emblemticas del Business


Intelligence ya que, entre otras propiedades, permiten resolver gran parte de
las limitaciones de los programas de gestin. Estas son algunas de sus
caractersticas principales:

Informes dinmicos, flexibles e interactivos, de manera que el


usuario no tenga que ceirse a los listados predefinidos que se
configuraron en el momento de la implantacin, y que no siempre
responden a sus dudas real.
No requiere conocimientos tcnicos. Un usuario no tcnico puede
crear nuevos grficos e informes y navegar entre ellos,
haciendo drag&drop o drill through. Por tanto, para examinar la
informacin disponible o crear nuevas mtricas no es imprescindible
buscar auxilio en el departamento de informtica.
Rapidez en el tiempo de respuesta, ya que la base de datos
subyacente suele ser un datawarehouse corporativo o un datamart, con
modelos de datos en estrella o copo de nieve. Este tipo de bases de
datos estn optimizadas para el anlisis de grandes volmenes de
informacin (vease nalisis OLTP-OLAP).
Integracin entre todos los sistemas/departamentos de la
compaa. El proceso de ETL previo a la implantacin de un Sistema de
Soporte a la Decisin garantiza la calidad y la integracin de los datos
entre las diferentes unidades de la empresa. Existe lo que se
llama: integridad referencial absoluta.
Cada usuario dispone de informacin adecuada a su perfil. No se
trata de que todo el mundo tenga acceso a toda la informacin, sino de
que tenga acceso a la informacin que necesita para que su trabajo sea
lo ms eficiente posible.
Disponibilidad de informacin histrica. En estos sistemas est a la
orden del da comparar los datos actuales con informacin de otros
perodos histricos de la compaa, con el fin de analizar tendencias,
fijar la evolucin de parmetros de negocio... etc.

8
CONSULTAS Y VISTAS DE ORACLE

1. Obtener el nombre y apellido de todos los empleados.

2. Obtener el nombre, apellido y el monto de sus donaciones

9
3. obtener todo los datos de los empleados que se apellidan Lpez

4. obtener todos los datos de los empleado que se apellidan Lpez y


Prez utilizando OR como tambin IN

10
5. obtener todos los empleados que pertenecen al departamento de IT

6. Obtener todos los datos de los empleados que pertenezcan al


departamento recursos humano y auditoria

11
7. Obtener el nombre de todos los empleados cuyo apellido
comiencen con P

8. obtener de la entidad donacin la suma total de todas las


aportaciones del departamento IT

12
9. obtener el numero de empleados en cada departamento

10. obtener un listado de todos los empleados al departamento que


pertenece

13
11. obtener todos los empleados con los numeros de telefonos que
tienen y a la conpaia que pertenece

12. realizar una vista con el nombre y apellido el sueldo y el


departamento cuyo sueldo sea mayor o = 5000

14
13. Trigger movimiento de donacin

15

Вам также может понравиться