Вы находитесь на странице: 1из 2

BI For Masses !!! (#1 : Functional Design) , Page 2 - Tech Head Brothers http://www.techheadbrothers.com/Articles.aspx/bi-for-masses-1-functi...

Accueil Articles Astuces Vidéos Actualités Auteurs A propos Contact S'enregistrer | S'identifier

BI For Masses !!! (#1 : Functional Design)


L'objectif de cette série d'articles est d'illustrer la mise en oeuvre des outils de BI avec Analysis
Services 2005 (SSAS2005). Ce premier article pr
Par Renaud Harduin publié le 19/05/2005 à 23:49, lu 11049 fois, 7 pages

0 commentaire(s) Tags: SQL Server 2005

2 | I - Notion de Data Warehouse


I - Notion de Data Warehouse
Comme vous avez pu le comprendre le premier enjeu de la BI est la collecte des données de l'entreprise.
Cette base est dénommée Data Warehouse (DW) ou encore entrepôt de données. Dans son design, une telle base devra être :

Intégrée
Non volatile
Historisée

Et ...

Orientée sujet
Organisée pour le processus d'aide à la décision.

1.1 - Une Base de Données Intégrée


Le principe est de collecter toutes les données de votre entreprise pour donner une vue intégrée de l'activité. Exemple :
J'ai un système de saisie de commande. Je dois pouvoir retrouver une commande dans ce système mais aussi être capable d'aller
chercher l'information correspondante dans mon système de production, et enfin retrouver ce même produit dans mon système de
facturation.

Par nature, ces systèmes sont orientés « saisie » et les données orientées « application ». La pierre angulaire de l'intégration sera votre
capacité à collecter les données, à les réconcilier et à les intégrer les unes par rapport aux autres, en s'appuyant notamment sur des
référentiels partagés.
Cette collecte de données, et la mise en place de référentiels, se feront par l'utilisation d'ETL (pour Extract Transform and Load). Ces
outils permettent la synchronisation des données opérationnelles par rapport à des référentiels et des métadonnées mais aussi la
relecture et le mapping de données externes.
Parmi les outils les plus utilisés sur le marché, vous trouverez SAS de SAS Intitute (ne pas confondre avec MS SSAS 2005, notre cube
justement !), Microsoft Integration Services, Informatica, Genio ...

1.2 - Non Volatile


Avoir une donnée non volatile souligne le fait que l'information soit tracée dans le temps :
Un produit 1 enregistré dans une table des faits F (nous en reparlons tout de suite) doit rester produit 1 dans une table des faits B

1.3 - Historisée
Cette base doit être historisée. La collecte des données va nous permettre de créer des tables de faits. Ces tables sont là pour enregistrer
tout l'historique des systèmes opérationnels (ERP, Facturation etc.)
Le fait est un évènement important pour l'entreprise que nous devons mémoriser pour analyse :
Une vente, une commande, un ordre de production, une écriture comptable ...

Les faits sont enregistrés dans des tables sur plusieurs années. Un historique hors ligne de 5 à 10 ans est courant. Un accès en ligne sur
3 ans au détail fin (au détail d'une commande) là aussi est envisageable fonction des serveurs.
Ce qu'il faut bien sentir à ce niveau, c'est que l'accès en ligne sera coûteux en terme de ressources au vue de la volumétrie. La
préparation des données, leur stockage et la pré agrégation des données fonction de la navigation est donc très important pour l'accès
dynamique à l'information.

1.4 - Alimentation du DW

1 sur 2 13/03/2011 22:00


BI For Masses !!! (#1 : Functional Design) , Page 2 - Tech Head Brothers http://www.techheadbrothers.com/Articles.aspx/bi-for-masses-1-functi...

En termes d'architecture, je vous propose un schéma qui reprend les 3 premiers critères de design d'un DW

On distingue notamment un ETL qui fait le lien entre nos données transactionnelles et notre entrepôt.
Les données transactionnelles sont aussi qualifiée d'OLTP pour « On Line Transaction Processes », c.a.d justement orientée saisie et
application par opposition à orientée sujet.
Elles sont déversées dans un ODS (Operational Data source) qui est ni plus ni moins qu'un espace intermédiaire dans lequel l'ETL lit et
transforme les données.

On retrouve la table des faits et la notion de table de dimensions qui va progressivement se substituer à la notion de référentiel. Dans
tous les cas, les faits devront être synchrones par rapport aux référentiels (dimensions)

1 2 3 4 5 6 7
» Démarrer une discussion

Tech Head Brothers © - Portail d'informations et d'articles techniques sur les technologies Microsoft .NET.
Copyright 2001-2011 Laurent Kempé & Mathieu Kempé. Tous droits réservés.
Location de serveur dédié

2 sur 2 13/03/2011 22:00