Вы находитесь на странице: 1из 7

Concepts de l'informatique dcisionnelle

Business Intelligence : Informatique Dcisionnelle


On appelle aide la dcision , dcisionnel , ou encore business intelligence , un ensemble de solutions informatiques permettant lanalyse des donnes de lentreprise, afin den dgager des informations qualitatives nouvelles, qui seront la base de dcisions tactiques ou stratgiques. Une entreprise brasse dans son systme dinformation dimmenses volumes de donnes, auxquelles il est trs difficile de donner un sens, de comprendre ce quelles expriment tendances sous!"acentes, faiblesses ou forces cac#es, toutes c#oses que lon devrait conna$tre pour prendre de bonnes dcisions%. &insi, les outils daide ' la dcision, avant daider la dcision, aident dabord ' analyser les donnes afin de dceler des informations macroscopiques cac#es dans de gros volumes de donnes.

Infocentre
()infocentre est un concept commercial *+, de la fin des annes -./0. (es informaticiens et les utilisateurs spcialiss dans la rdaction de requ1tes pouvaient accder rapidement ' des donnes demandes par les dirigeants. &vant l)infocentre, la rponse ' une requ1te supposait le dveloppement d)un programme informatique qui gnrait des dlais d)attente importants et l)incompr#ension des dcideurs qui avaient le sentiment que leurs demandes taient pourtant plut2t simples. 3ans l)infocentre les requ1tes taient ralises sur des rplicats des bases de production ' l)aide de langage de requ1tes grap#iques tel le le 4+5, query by example.

La chane dcisionnelle

(es informations issues des applications de gestion...

..sont collectes, stoc6es et agrges dans un 3ata7are#ouse afin de fournir les indications sou#aites ...

...sous le format de restitution le plus adapt

Collecte des donnes


(e systme d)information de l)entreprise est souvent b8ti sur des donnes rparties sur des systmes #trognes. +ien que la standardisation des c#anges entre les divers outils informatiques se dveloppe, la disparit des formats des donnes est une ralit. &vant de pouvoir exploiter ces donnes il faut les nettoyer, les formater et les consolider. (es outils d)59( 5xtract 9ransform load% permettent d)automatiser ces traitements et de grer les flux de donnes alimentant l)entrep2t de donnes. (es outils d)59( 5xtract 9ransform (oad% ont en c#arge de collecter et de prparer des donnes.

-:/

Concepts de l'informatique dcisionnelle

Extraire ; &ccder ' la ma"orit des systmes de stoc6age de donnes <=+3, 5>?, fic#iers ' plat...% afin de rcuprer les donnes identifies et slectionnes. ?rendre en compte les questions de sync#ronisation et de priodicit des rafra$c#issements. Transformer ; 9outes les donnes ne sont pas utilisables telles qu)elles. 5lle mritent d)1tre vrifies, reformates, nettoyes afin d)liminer les valeurs aberrantes et les doublons, et consolides. Charger ; *nsrer les donnes dans le 3ata @are#ouse.

(a gestion des donnes est une des fonctions primordiales de l)entreprise. *l est en effet important de garantir la qualit des donnes circulant au sein du systme d)information et plus particulirement du systme dcisionnel. &vant d)utiliser une information, le dcideur se posera les questions suivantes ; 4uelle est cette information A 3)oB provient!elle A Comment est!elle calcule A 3e quand date la dernire mise ' "ourA 4uelles sont les prcautions d)usage A... 9outes ces informations sur la donne sont contenues dans un rfrentiel global ; le rfrentiel de mta-donnes utilisant le standard C@, Common @are#ouse ,etamodel%, specification dcrivant les c#anges de meta donnes entre les applications formant un <*&3 <ystme d)&ide ' la 3cision%.

Stockage des Donnes


(es bases de donnes de production ne sont pas utilisables pour une exploitation dcisionnelle. (es donnes brutes ne sont pas pr1tes ' cet usage et les requ1tes dcisionnelles sont particulirement gourmandes en ressources mac#ines.

Data-warehouse
Un entrep2t de donnes est une base de donnes dans laquelle sont recopies des donnes oprationnelles, mais ' laquelle aucune application oprationnelle systme oprant% n)accde. (e 3ata@are#ouse 5ntrep2t de 3onnes% est le lieu de stoc6age intermdiaire des diffrentes donnes en vue de la constitution du systme d)information dcisionnel. (e crateur du concept de 3ata@areDouse, Bill Inmon, le dfinit comme suit ; Un datawarehouse est une collection de donnes thmatiques, intgres, non volatiles et historises pour la prise de dcisions.

Caractristiques des donnes


rient su!et (es donnes sont organises pour rpondre ' des besoins mtiers ; elles sont classes par t#me. (es donnes propres ' un t#me, les ventes par exemple, seront rapatries des diffrentes bases O(9? Online transaction processing% de production et regroupes. Intgr (es donnes proviennent de sources #trognes utilisant c#acune un type de format. 5lles sont intgres avant d)1tre proposes ' utilisation. Un nettoyage pralable des donnes est ncessaire dans un souci de rationalisation et de normalisation. "on #olatile (es donnes une fois intgre dans l)entrep2t ne sont pas appeles ' 1tre supprimes. >ead!Only% $istoris (es donnes mmorises sont dates. *l est ainsi possible de visualiser leur volution dans le temps. (e degr de dtail de l)arc#ivage est bien entendu relatif ' la nature des donnes. 9outes les donnes ne mritent pas d)1tre arc#ives.

E:/

Concepts de l'informatique dcisionnelle

Datamart
(es entrep2ts de donnes partiels, limits ' un domaine particulier sont qualifis de datamart . ?ar exemple, dans le domaine mar6eting, se trouvent des datamart contenant une base clients et prospects. (es datamarts, peuvent 1tre considrs comme des sous!rfrentiels de donnes ou vues par mtier de l)entreprise service client, etc.%. Cet clatement permet aux outils d)analyse d)accder plus facilement au datawarehouse.

Les enjeux de l'approche entrept de donnes


(es bnfices peuvent 1tre trs diffrents suivant les entreprises et les contextes. %#antages 5n sparant les systmes oprationnels des systmes dcisionnels, les entrep2ts de donnes offrent aux entreprises plusieurs avantages; Consolidation de donnes disparates et disperses. &mlioration des flux de donnes en permettant une #omognit des informations pour l)ensemble des utilisateurs. &ssurer des gains de productivit par une meilleure connaissance du fonctionnement interne et des coFts de l)entreprise. ?lus grande autonomie des utilisateurs. &rinci'aux facteurs de risques (es facteurs de risques sont multiples et l)entreprise doit imprativement les intgrer dans son diagnostic initial; ()approc#e entrep2t de donnes engage l)entreprise dans un vritable saut tec#nologique qui devra 1tre abord par un rel c#angement culturel. *l existe un risque au niveau de la non utilisation ou de la mauvaise utilisation. 3)oB la ncessit de mise en place d)une politique de communication et de formation de l)ensemble des acteurs informaticiens, oprationnels et dcideurs%. (e risque de scurit des informations est galement ' prendre en compte en raison de la diffusion largie de donnes. ()entreprise devra mettre en place de nouvelles procdures permettant la scurit du systme d)information. >isques lis ' l)actualisation du systme ; les applications dcisionnelles voluent en permanence et .l) entreprise doit 1tre capable d)anticiper et d)actualiser son systme d)information.

!"ploitation des Donnes


Une fois les donnes stoc6es, nettoyes, consolides et accessibles, elles sont utilisables. <elon les besoins, diffrents types d)outils d)extraction et d)exploitation seront envisags.

Analyse multidimensionnelle
()anal(se multidimensionnelle consiste ' modliser des donnes selon plusieurs axes. ()exemple le plus classique ; le calcul du c#iffre d)affaires par catgorie de client sur une gamme de produit donne combine trois axes le c#iffre ralis, la catgorie de clients et la ligne de produits%. 3e nombreux autres axes supplmentaires peuvent 1tre dfinis ; Gone gograp#ique ou quipe commerciale en c#arge des oprations par exemple. (e cube HO(&?H pour #nline anal$tical processing% dsigne la tec#nologie analytique qui s)applique ' ce modle de reprsentation. (es structures multidimensionnelles L%& On (ine &nalytical ?rocessing% permettent d)analyser des indicateurs ventes, c#iffre d)affaires, transactions...% et de les explorer suivants plusieurs dimensions temps, produit, Catgorie...%. (es c#oix de l)arc#itecture O(&? vont influer sur toutes les composantes du systme dcisionnel ; performance, volumtrie, temps de requ1te.

I:/

Concepts de l'informatique dcisionnelle

5volution du c#iffre d)affaire ralis pour un 5volution du c#iffre d)affaire ralis pour une produit par catgorie de client catgorie de client

>partition du c#iffre d)affaire par produit et par C#iffre d)affaire pour un produit avec une catgorie de client sur une priode catgorie de client ' une priode donne.

Les diffrents modes de stocka e !LA"


) L%& ,ultidimentional O(&?%, est une solution de stoc6age qui garantit les temps de rponses, mais se traduit par des temps d)alimentation et de stoc6age plus importants. * L%& >elational O(&?% stoc6e les donnes dans une base de donnes relationnelle, mais dtriore les temps de rponse, puisque les calculs sont effectus en dynamique lors de l)analyse. (e stoc6age est optimis et laisse une plus grande libert de requ1te. (es plates!formes dcisionnelles volues permettent au"ourd)#ui une solution de continuit entre ces c#oix, en prvoyant notamment un c#oix #ybride $ L%&% oB seule une partie des donnes sont pr! calcules et stoc6es.

#echerches corrlati$es % dataminin & fora e de donnes


(e data mining dsigne lensemble des algorit#mes et des mt#odes destins ' lexploration et lanalyse de grandes bases de donnes informatiques en vue de dtecter dans ces donnes, des rgles, des associations, des tendances inconnues non fixes a priori %, des structures particulires

J:/

Concepts de l'informatique dcisionnelle

restituant de faKon concise lessentiel de linformation utile pour laide ' la dcision <tp#ane 9uffry ; #ttp;::data.mining.free.fr% 5n bout de course, les applications analytiques se c#argent de recueillir les requ1tes de l)utilisateur dans le langage de ce dernier puis de les communiquer ' l)entrep2t, avant de produire les indicateurs de performance voulus. &u final, les rsultats issus de ce traitement sont restitus et diffuss par le biais d)outils de reporting.

'a(leaux de (ord
Un tableau de bord est un instrument de mesure de la performance facilitant le pilotage Hpro!actifH d)une ou plusieurs activits dans le cadre d)une dmarc#e de progrs. (e tableau de bord contribue ' rduire l)incertitude et facilite la prise de risque in#rente ' toutes dcisions. C)est un instrument d)aide ' la dcision qui dynamise la rflexion et facilite la communication

#eportin
(es outils de reporting proposent la ralisation de rapports selon un format prdtermin. (es bases de donnes sont interroges selon les requ1tes <4( prpares lors de l)laboration du modle. (e rapport peut ensuite 1tre diffus sur l)*ntranet, priodiquement en automatique ou ponctuellement ' la demande. ()outil d)laboration du modle du rapport offre des fonctions spcifiques de calcul et de prsentation grap#iques% afin de concevoir des comptes rendus adapts et pertinents.

LT& et

L%&

(e terme O(9? On (ine 9ransaction ?rocessus regroupe les concepts mis en place par un systme destin ' l)automatisation d)un processus. On utilise pour cela une base de donnes transactionnelles, dont la mise ' "our est faite en ligne. (e terme O(&? On (ine &nalysis ?rocessus regroupe les concepts mis en place par un systme d)analyse en ligne des donnes. On utilise pour cela une base de donnes dcisionnelles, destine ' la prise de dcision. (es deux systmes diffrent pour ; les utilisateurs L le contenu des donnes L la structure de la base de donnes L l)administration du systme. LT& )tilisateurs (es utilisateurs sont les rouages de l)entreprise +eaucoup d)utilisateurs concurrents Une seule vision mtier (es utilisateurs l)entreprise observent les rouages de L%&

?eu d)utilisateurs dcideurs% 9raite plusieurs visions mtier

5xcutent un grand nombre de fois la m1me (isent uniquement les donnes qui sont souvent t8c#e rcapitules. (isent et modifient les donnes systme vivant% 5xigent des performances temps rel pour augmenter la productivit% 5>?, =?&O, >D... Contenu des donnes Mcessaire au fonctionnement de l)entreprise Mormalisation en INM Mon #istoris Utilis pour analyser le fonctionnement de l)entreprise. &grge dnormalise% (e temps est fondamental *tructures (es demandes sont similaires mais diffrentes.

O:/

Concepts de l'informatique dcisionnelle

LT& +eaucoup de tables ?etites requ1tes sur sur une seule table 9emps de rponses instantans temps rel%

L%& ?eu de tables mais de grande taille >equ1tes larges sur une grosse quantit de donnes 9emps de rponse de quelques secondes ' plusieurs minutes.

Administration Norte disponibilit <auvegardes frquentes +eaucoup de petites transactions ?eu de maintenance off!line 3isponibilit faible <auvegardes peu volumineuses. frquentes, mais trs

5n rgle gnrale, une transaction par "our. +eaucoup de maintenance off!line

)od+le dimensionnel
(a modlisation consiste ' transformer les rsultats de l)analyse des besoins en un modle dimensionnel. Ce type de modlisation diffre fortement de la modlisation entit!association. (a modlisation entit!association vise ' liminer les redondances et est particulirement bien adapt aux transactionsL (e modle dimensionnel est lui conKu pour 1tre interrog de manire particulirement efficace.

%e schma en toile

&a'le des (aits


Une table des faits est une table qui contient les donnes ' analyser. Ce type de table comporte un grand nombre de cls trangres afin de la lier avec des tables de dimension.

)inesse ou grain
()unit de temps la plus petite est appele grain ou finesse de la table des faits. <i le grain est trop fin, la table rsultante est gigantesque. <i le grain est trop petit, on ne peut revenir en arrire et on perd de l)information.

P:/

Concepts de l'informatique dcisionnelle

%es (aits
(es c#amps qui ne sont pas cls trangres sont les faits. *ls doivent 1tre valoriss de faKon continue et 1tre additifs. %es valeurs discr*tes sont rserves au" dimensions.

&a'le de dimensions
(es tables qui entourent la table des faits sont appeles tables de dimension . Ces tables sont composes d)attributs qui sont la plupart du temps de type caractre et discret. Ces attributs servent ' stoc6er la description des dimensions et sont utiliss comme source de contraintes et d)en!t1te de ligne dans le "eu de rponses de l)utilisateur.

Dimension et hirarchie
Une dimension est un ensemble de valeurs dcomposables. (es valeurs d)une dimension sont gnralement organises ' l)intrieur d)une #irarc#ie. ()accs au niveau suprieur dans une #irarc#ie est appel rolling up , et au niveau infrieur drill do7n . Une #irarc#ie peut 1tre simple ou multiple. 5lle est rpute simple , lorsque c#aque enfant n)a qu)un seul pre.

/:/