Академический Документы
Профессиональный Документы
Культура Документы
Motivations
Mettre en œuvre un Data Warehouse
Modèles de représentation
Claude Duvallet
Université du Havre
UFR Sciences et Techniques
25 rue Philippe Lebon - BP 540
76058 LE HAVRE CEDEX
Claude.Duvallet@gmail.com
http://litis.univ-lehavre.fr/∼duvallet/
Plan du cours
Introduction et définition
Pourquoi un Data Warehouse ?
Mettre en œuvre un Data Warehouse
Modélisation et implémentation
Conclusion
Introduction et contexte
Entrepôt de données :
Ensemble de données
historisées variant dans le temps,
organisées par sujets,
consolidées dans une base de données unique,
gérées dans un environnement de stockage particulier,
aidant à la prise de décision dans l’entreprise.
Trois fonctions essentielles :
Collecter des données de bases existantes et les charger,
Gérer des données dans l’entrepôt,
Analyser les données en de la prise de décision.
Magasin de données (Data Mart) :
C’est un sous-ensemble de l’entrepôt de données qui contient les
données pour un secteur particulier de l’entreprise.
Exemple : un département, une direction, un service, une gamme
de produit,...
Claude Duvallet — 5/37 Les Data WareHouse
Introduction
Motivations
Mettre en œuvre un Data Warehouse
Modèles de représentation
Définitions :
Ce sont des informations qui définissent et décrivent les
structures, opérations et le contenu du système d’informatique
décisionnelle.
Il existe trois types de méta-données : technique, d’affaire et de
processus.
Méta-données techniques :
ETL (Extract-Transform-Load) : ce sont les sources et les cibles
pour les transferts de données, les transformations, les règles
d’affaires, etc.
Stockage : Ce sont les tables, les champs, les types, les indexes,
les partitions, les dimensions, etc.
Présentation : Ce sont les modèles de données, les rapports, les
privilèges d’accès, etc.
Définitions
Trois étapes :
Déterminer et recenser les données à entreposer : recherche des
données dans les sources de données de l’entreprise
Nettoyage des données :
conversions de données,
filtrages,
intégration
Alimentation :
Incrémental ou total,
Hors ligne ou en ligne,
Fréquence de chargement : chaque nuit, 1/mois...
Détermination de la taille de l’historique (5 ans, 10 ans...).
Réalisée généralement par des outils dédiés (e.g. Powermart, Info
Suite...)
Les obstacles
La structure multi-dimensionnelle
Trois méthodes :
1 Relational OLAP (ROLAP)
Les données sont stockées dans un SGBD relationnel.
Un moteur OLAP permet de simuler le comportement d’un SGBD
multi-dimensionnel.
2 Multidimensional OLAP (MOLAP)
Structure de stockage en cube
Accès direct aux données dans le cube
3 Hybrid OLAP (HOLAP)
Les données sont stockées dans SGBD relationnel (données de
base).
La structure de stockage en cube (données agrégées).
ROLAP
Idées :
Données stockées en relationnel.
La conception du schéma est particulière : schéma en étoile,
schéma en flocon.
Des vues (matérialisées) sont utilisées pour la représentation
multidimensionnelle.
Les requêtes OLAP (slice, rollup...) sont traduites en SQL.
Utilisation d’index spéciaux : bitmap.
Administration (tuning) particulier de la base de données.
Avantages/Inconvénients :
Souplesse, évolution facile, permet de stocker de gros volumes.
Mais peu efficace pour les calculs complexes
MOLAP
Idées :
Modélisation directe du cube.
Ces cubes sont implémentés comme des matrices à plusieurs
dimensions.
Le cube est indexé sur ses dimensions.
Avantages/Inconvénients :
rapide.
formats propriétaires.
ne supporte pas de très gros volumes de données.
HOLAP
Idées :
MOLAP + ROLAP.
Les données sont stockées dans des tables relationnelles.
Les données agrégées sont stockées dans des cubes.
Les requêtes vont chercher les données dans les tables et les
cubes.
Implémentation :
ROLAP
MOLAP
HOLAP
Structure de la base de données :
Les données sont redondantes et normalisées.
Cela permet de faciliter l’utilisation et d’améliorer les
performances lors de l’analyse des données.
Modèle de représentation :
Cubes.
Étoile et Flocon.
Constellation de faits.
Hyper Cube
Les faits
Conclusions