Вы находитесь на странице: 1из 22

OUTILS

DÉCISIONNELS
DATA-MINING & DATA-WAREHOUSE

BEL MRHAR Mohamed Amine


Introduction
■ On qualifie d'informatique décisionnelle (en anglais «Business
intelligence », parfois appelé tout simplement « le décisionnel »)
l'exploitation des données de l'entreprise dans le but de faciliter la prise
de décision par les décideurs, c'est-à-dire la compréhension du
fonctionnement actuel et l'anticipation des actions pour un pilotage
éclairé de l'entreprise.

■ Les outils décisionnels comme le Data Warehouse et le Data Mining


sont basés sur l'exploitation d'un système d'information décisionnel
alimenté grâce à l'extraction de données diverses à partir des données
de production, d'informations concernant l'entreprise ou son entourage
et de données économiques.
Architecture
1- Qu’est-ce qu’un Data warehouse? L'Entrepôt de
Données
■ Définition de Bill Inmon (1996)
«Le Data Warehouse est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support d’un
processus d’aide à la décision.»

■ Une base de données d’aide à la décision qui est entretenue de


manière séparée de la base de données opérationnelle de
l’organisation
■ Aide au traitement de l’information en fournissant une plateforme de
données historiques consolidées pour l’analyse.
■ Data warehousing: Le processus de construction et d’utilisation du data
warehouse.
2-Caracteristiques du Data-
Warehouse:
■ Base de Données utilisée à des fins d’analyse.
■ Caractéristiques :
• Orientation sujets («métiers»)
• Données intégrées
• Données non volatiles
• Données datées
• Regroupe les informations des différents métiers
• Ne tiens pas compte de l’organisation fonctionnelle des
données
• Définition d’un référentiel unique.
• Normalisation des données
• Traçabilité des informations et des décisions
prises
• Copie des données de production
Les données datées:

■ Les données persistent dans le temps


■ Mise en place d’un référentiel temps
L'Entrepôt de Données (DW)
3- Objectifs:

■ Les datawarehouse sont des systèmes conçus pour l’aide à la prise


de décision. (Mode de travail: OLAP On-Line Analytical Processing)
■ La plupart du temps sont utilisés en lecture (utilisateurs)
■ Les objectifs principaux sont
regrouper, organiser des informations provenant de
■ sources diverses,
■ les intégrer et les stocker pour donner à l’utilisateur une vue orientée
métier,
■ retrouver et analyser l’information facilement et rapidement.
Objectifs:

• Les datawarehouse sont des systèmes conçus pour l’aide à la prise de


décision. (Mode de travail: OLAP On-Line Analytical Processing)
• La plupart du temps sont utilisés en lecture (utilisateurs)
• Les objectifs principaux sont
regrouper, organiser des informations provenant de
• sources diverses,
• les intégrer et les stocker pour donner à l’utilisateur une vue orientée
métier,
• retrouver et analyser l’information facilement et rapidement.
4- Trois modèles de data-Warehouse
■ Entreprise Warehouse:
– Collecte de toutes les informations concernant les sujets traités au niveau
de l’organisation
■ Data Mart:
– Un sous ensemble d’un entreprise warehouse. Il est spécifique à un groupe
d’utilisateurs (ex: data mart du marketing)
■ Data Warehouse virtuel:
– Un ensemble de vues définies à partir de la base opérationnelle
– Seulement un sous ensemble des vues sont matérialisées
5- Architecture des serveurs OLAP

■ Relational OLAP (ROLAP)


– Utilise un SGBD relationnel pour stocker les données
ainsi qu’un middle-ware pour implémenter les opérations
spécifiques de l’OLAP
■ Multidimensional OLAP (MOLAP)
– Basé sur un stockage par tableaux (techniques des
matrices creuses)
– Indexation rapide de données calculées
5-2- Deux types de traitements: OLAP / OLTP
■ OLTP (on-line transaction processing)
 Tâche majeure des Bdd relationnelles traditionnelles
 Opérations quotidiennes enregistrées.

■ OLAP (on-line analytical processing)


 Tâche majeure des systèmes
de data warehouse
 Analyse de données et décision
II. Data-Mining:
1. Définition du Data Mining:
 Data-Mining est le processus de recherche de modèles dans un
ensemble de données donné. Ces modèles peuvent souvent fournir des
données significatives et perspicaces à quiconque s'intéresse à ces
données. L'exploration de données est utilisée aujourd'hui dans une
grande variété de contextes - dans la détection de la fraude, comme une
aide dans les campagnes de marketing, et même les supermarchés
l'utilisent pour étudier leurs consommateurs.
 Processus inductif, itératif et interactif de découverte dans les BD larges
de modèles de données valides, nouveaux, utiles et compréhensibles.
■ Itératif : nécessite plusieurs passes
■ Interactif : l’utilisateur est dans la boucle du processus
■ Valides : valables dans le futur
■ Nouveaux : non prévisibles
■ Utiles : permettent à l’utilisateur de prendre des décisions
■ Compréhensibles : présentation simple
2- Pourquoi le Data Mining ?
■ Explosion des données:
• Masse importante de données
• Données multi-dimensionnelles
• Collecte de masses importantes de données
• Besoin raitement en temps réel de ces données
■ Améliorer la productivité:
• Forte pression due à la concurrence du marché
• Brièveté́ du cycle de vie des produits
• Besoin de prendre des décisions stratégiques efficaces
- Exploiter le vécu (données historiques) pour prédire le futur et anticiper le marché
- Individualisation des consommateurs (dé-massification).
■ Croissance en puissance/coût des machines capables:
• de supporter de gros volumes de données
• d’exécuter le processus intensif d’exploration
• hétérogénéité des supports de stockage
3- Démarche méthodologique

1. Comprendre l’application
2. Sélectionner un échantillon de données
3. Nettoyage et transformation des données
4. Appliquer les techniques de fouille de données (DM)
5. Visualiser, évaluer et interpréter les modèles découverts
6. Gérer/déployer la connaissance découverte
4- Data Mining et aide à la décision:
5- objectifs:

■ Développer des techniques et systèmes efficaces et extensibles pour l’exploration de :


o BD larges et multi-dimensionnelles
o Données distribuées

■ Faciliter l’utilisation des systèmes de DM


o Limiter l’intervention de l’utilisateur
o Représentation simple de la connaissance
o Visualisation sous forme exploitable
III. Data-mining # Data-Warehouse
■ Data Warehouse: base de données résumant diverses BD
transactionnelles pour servir de support à la prise de décision
■ Data mining : effectué sur des entrepôts de données aussi bien que
sur des BD transactionnelles.
Le DW est un processus qui doit avoir lieu avant que l'exploration de données puisse
avoir lieu. En d'autres termes, DW est le processus de compilation et d'organisation des
données dans une base de données commune, et DM est le processus d'extraction de
données significatives à partir de cette base de données. Le processus DM repose sur
les données compilées dans la phase de stockage de données afin de détecter des
modèles significatifs.
Conclusion:

La conception d'entrepôts de données est donc un processus en


perpétuelle évolution. Sous cet angle, on peut finalement voir l'entrepôt
de données comme une architecture décisionnelle capable à la fois de
gérer l'hétérogénéité et le changement et dont l'enjeu est de transformer
les données en informations directement exploitables par les utilisateurs
du métier concerné.
Bibliographie:

■ Systèmes d’information décisionnels (Data Warehouse / Data Mining) E. GRISLIN-LE


STRUGEON et D. DONSEZ 1996-2006
■ www.programmerinterview.com/.../data-mining-vs-warehousing
■ Datawarehouse C. Vangenot « Laboratoire de Base de données » Database Laboratory
■ Cours d’aide à la décision : Du datawarehouse au datamining « L. Jourdan »
■ Data Mining, fouille de données: Data Mining, fouille de données « Marius Fieschi Faculté
de Médecine de Marseille »
■ https://fr.wikipedia.org/wiki/Entrepôt_de_données

Вам также может понравиться