Академический Документы
Профессиональный Документы
Культура Документы
P la n
1. Introduction et problmatique de l!OLAP
! ! ! ! Entrept et OLAP OLAP versus OLTP Exemple d!analyses d!un entrept Problmatique de l!OPAL
(3)
2010 Bernard ESPINASSE
Professeur l'Universit d'Aix-Marseille
Bibliographie
Ouvrages : ! Benitez-Guerrero E., C. Collet, M. Adiba, Entrepts de donnes : Synthse et analyse , Rapport de recherche IMAG NIMAG-RR - 99-1017-I, 1999. ! Franco J-M., Le Data Warehouse (Le Data Mining) . Ed. Eyrolles, Paris, 1997. ISBN 2-212-08956-2 ! Gardarin G., Internet/intranet et bases de donnes , Ed. Eyrolles, 1999, ISBN 2-212-09069-2. ! Han J., Kamber M., Data Mining: Concepts and Techniques , Morgan Kaufmann Publishers, 2004. ! Kimball R., M. Ross, Entrepts de donnes : guide pratique de modlisation dimensionnelle , 2dition, Ed. Vuibert, 2003, ISBN : 2-7117-4811-1. ! Cours : ! Cours de F. Bentayeb, O. Boussaid, J. Darmont, S. Rabaseda, Univ. Lyon 2 ! Cours de P. Marcel, Univ. de Tours ! Cours de G. Gardarin, Univ. de Versailles ! Cours de M. Adiba et M.C. Fauvet, Univ. Grenoble !
OLAP - Bernard ESPINASSE
Entrept et OLAP
! un entrept de donnes (ED) contient des donnes nombreuses, homognes,
Exemple d!entrept
Soit l!entrept en schma toile suivant : OLTP
Transaction Entit-Relation Dtail Relationnelle
OLAP
Analyse Etoile/flocon Rsumes, agrges Multidimentionnelle Historises, recalcules 100 Go/To Requte complexe Lecture Millions Temps de rponse Analyste/dcideur Centaines 7
! ! ! !
ventes(codeProduit, date, vendeur, montant) produits(codeProduit, modle, couleur) vendeurs(nom, ville, dpartement, tat, pays) temps(jour, semaine, mois, trimestre, anne)
Traitements
Utilisateurs
Actualises, mises jour Taille 100 Mo/Go Unit de travail Transaction simple Accs Lecture/criture Nb de tuples accds Dizaines Mtrique Dbit de transactions Utilisateur Agent oprationnel Nombre d!utilisateurs Milliers
Besoins d!analyse
Analyse des ventes de divers produits
Exemple de questions associes : ! Quels sont les produits dont les ventes ont chut l!an dernier?
! Quelles sont les quinze meilleures ventes par magasin et par semaine durant le premier trimestre de l!anne 2001? ! Quelle est la tendance des chiffres d!affaire (CA) par magasin depuis 3 ans? ! Quelles prvisions peut-on faire sur les ventes d!une catgorie de produits dans les 6 mois venir ?
10
11
12
13
14
15
16
Problmatique de l!OLAP
! Supporter des oprations tableur sur des BD de plusieurs Go (Chaudhuri et Dayal 97) ! Besoins spcifiques :
! langages de manipulation ! organisation des donnes ! fonctions d!agrgation !
De la table au cube
De la table Table Ventes :
VENTES pices crous clous vis crous crous total Rgions est est ouest est total total Annes 1999 1997 1998 total total total quantits 50 100 50 220 390 1200
17
18
Hirarchies de granularit
Valeur Ventes ecrous, est, 1997, 100 ecrous, est, 1997 100 est lieu rgion
19
20
21
22
1 - Oprations de restructuration
Permettent un changement de points de vue, une rorientation selon diffrentes dimensions de la vue multidimensionnelle Oprations lies la structure, la manipulation et la visualisation du cube :
! rorientation : ! slection graphique ! flexibilit du schma ! membres complexes ! symtrie membres/mesures ! manipulations : ! bijectives ! relatives ! niveau d!information constant Oprations de restructuration : ! rotate/pivot ! switch ! split, nest, push, pull
1 - Oprations de restructuration
Rotate ou Pivot :
! effectuer un cube une rotation autour d!un de ses trois axes passant par le centre de 2 faces opposes, de faon prsenter un ensemble de faces diffrent ! une sorte de slection de faces et non des membres.
Switch ou permutation :
! consiste inter-changer la position des membres d!une dimension.
Split ou division :
! consiste prsenter chaque tranche du cube et de passer d!une prsentation tridimensionnelle d!un cube sa prsentation sous la forme d!un ensemble de tables ! sa gnralisation permet de dcouper un hypercube de dimension 4 en cubes.
Nest ou l!embotement :
! imbrication des membres partir du cube. ! Permet de grouper sur une mme reprsentation bi-dimensionnelle toutes les informations (mesures et membres) d!un cube quelque soit le nombre de ses dimensions.
Push ou l!enfoncement :
! consiste combiner les membres d!une dimension aux mesures du cube, i.e. de faire passer des membres comme contenu de cellules. 23 24
Ici sont interchangs les membres nord et sud de la dimension rgions la visualisation rsultante est souvent 2D :
25
26
27
28
Visualisation 1
29
30
Visualisation 2
1 - Oprations de granularit
Granularit :
! hirarchisation de l!information en diffrents niveaux de dtails appels niveaux de granularit. ! un niveau est un ensemble nomm de membres ! le niveau le plus bas est celui de l!entrept Des oprations d!agrgation successives sur ces donnes permettent de nouveaux points de vue de moins en moins dtaills de l!information et constituent autant de niveaux suprieurs : ! navigation entre les niveaux : ! groupements ! agrgation ! manipulations : ! relatives ! ncessitant des informations non contenues dans le cube de dpart
31
32
1 - Oprations de granularit
Oprations de granularit : ! roll-up, ! drill-down
Les oprations agissant sur la granularit d!observation des donnes caractrisent la hirarchie de navigation entre les diffrents niveaux.
Remarque : une fonction d!agrgation (somme, moyenne, ) en paramtre de l!opration indique comment sont calculs les valeurs du niveau suprieur partir de celles du niveau infrieur
OLAP - Bernard ESPINASSE
! L!oprateur cube est une gnralisation N-dimensionnelle de fonctions d!agrgations simples. C!est un oprateur relationnel : Select pices, annes, rgions, Sum(quantit Ventes) FromVENTES Group-By CUBE pices, annes, rgions;
35
36
37
38
Oprations ensemblistes
Objet des oprations ensemblistes :
! concernent l!extraction ! manipulations classiques ! extension plusieurs dimensions
39
40
41
42
Exemple de traitements
! quels sont les 10 produits les plus performants ? ! calculer la moyenne glissante des ventes par rgion et par pices, pour une fentre de 2 annes ! calculer les prvisions de ventes pour les annes 2000 `a 2002 avec comme hypothse un accroissement annuels des ventes de 10%
43
44