Академический Документы
Профессиональный Документы
Культура Документы
BD : Base de données
CI : Cellule d'infrastructures
DW : Data Warehouse
ED : Entrepôt de Données
ETL : Extract-Transform-Load
IT : Information technology
ISO : International Organization for Standardization
SI :Systèmed'Information
SIG : Systèmed'InformationGéographique
Figure 3 Décideur
Liste de tableau
INTRODUCTION
Avec la révolution et le changement que l'informatique a apporté dans la plus part des
secteurs de la vie, la République Démocratique du Congo pourrait considérablement
profité de ses atouts. Avec son défi de construction et modernisation des infrastructures
routières, l'utilisation des outils modernes de gestion est d'une grande nécessité.
De son temps, Stanley avait dit « sans le chemin de fer le Congo (RDC) ne vaut pas un
pénis ». A travers cette pensée, nous pouvons comprendre l'importance de voies de
communication pour ce pays à la dimension continentale.Elle garde tout son sens pour ce
qui est du domaine routier.
L'enjeu pour la RDC consiste à parvenir à conserver en bon état les routes existantes et
d'en construire de nouvelles pour permettre le développement économique et désenclaver
l'ensemble du territoire national.
Malheureusement le pays débourse beaucoup d'argent dans ce secteur pour un résultat non
proportionnel. La Cellule d'Infrastructures, organe du ministère d'Infrastructure, Travaux
Public et Reconstruction en charge de la gestion de passation de marchés et d'inspection
des travaux routiers ne dispose pas d'un système informatique approprié permettant une
gestion informatisée d'immense données dont elle dispose pour en extraire des éléments
statistiques nécessaires à l'amélioration de la prise de décision.
Ø Une appréciation estimative lors de passation de marchés qui n'est guère soutenue par
des statistiques, cachées pourtant dans leurs immenses bases de données ;
Ø Une mauvaise cotation des inspecteurs qui sont senséssuperviser les travaux et procéder
aux contrôles ;
Ø L'absence de mécanisme pour contrer les actes de corruption qui caractérisent certains
fonctionnaires ;
Il est alors nécessaire de bien conserver le flux d'information du réseau routier. Le réseau
routier génère un volume significatif de données complexes qui nécessite un système
efficace pour le stockage, le traitement et les analyses.
C'est pour cette raison que nous avons été motivé de travailler autour du thème intitulé
« Mise en place d'un Data Warehouse et d'une application de Webmapping pour la gestion
du réseau routier : Cas De la République Démocratique du Congo».
Notre objectif est d'avoir un système d'aide à la prise de décision qui permettra à l'Etat
congolais d'avoir un aperçu clair et à temps utile sur la performance des différents acteurs
intervenant activement dans le secteur des infrastructures, en vue d'une gestion moderne et
efficace du réseau routier.
Parmi plusieurs techniques existantes pour la collecte des données servant à alimenter
notre système informatique, nous avons eu recours à la technique documentaire et
interview qui nous a permis à déceler les difficultés qui acculent le secteur, mais aussi
apprécier les avancées qui y sont réalisées.
Pour réaliser ce présent travail, nous nous sommes inspiré d'une documentation constituée
d'un grand nombre d'ouvrages, notes de cours et articles.
Notre travail comptera au-delà de l'introduction six chapitres puis une conclusion offrant
des perspectives.
Le premier chapitre portera sur les notions de base sur les Bases de Données, utiles pour
ce travail. Il contient des points essentiels sur les bases de données, le modèle entité-
association et les systèmes de gestion des bases de données.
Le deuxième chapitre est consacré au Système Décisionnel. Nous nous focaliserons plus
sur les concepts de base du système décisionnel, ses avantages et sur la Modélisation
Multidimensionnelle.
Le troisième aborde les notions sur les technologies web. Nous présenterons de manière
simple et concise l'essentiel des langages de programmation et techniques utilisées dans
cet univers du web.
Une base de données permet de stocker et de récupérer facilement des informations. Ces
informations sont structurées de manière à refléter la réalité tout en respectant quelques
règles (unicité de l'information, chaque élément doit pouvoir être identifié de manière
unique ...).
Ø le SGBD interne :
Ø le SGBD externe :
1.1.4Typologie
L'usage qui est fait des données diffère d'une base de données à l'autre. Les bases de
données peuvent être classifiées en fonction du nombre d'usagers, du type de contenu,
notamment s'il est faiblement ou fortement structuré, ainsi que selon l'usage qui est fait de
la base de données, notamment l'utilisation opérationnelle ou à des fin d'analyse.
La manière la plus populaire de classer les bases de données est selon l'usage qui en est
fait, et l'aspect temporel du contenu.
Ø Les bases de données dites opérationnelles ou OLTP (de l'anglais Online Transaction
Processing) sont destinées à assister des usagers à tenir l'état d'activités quotidiennes. Elles
permettent en particulier de stocker sur le champ les informations relatives à chaque
opération effectuée dans le cadre de l'activité. Dans de telles applications l'accent est mis
sur la vitesse de réponse et la capacité de traiter plusieurs opérations simultanément.
Ø Les bases de données d'analyse dites aussi OLAP (de l'anglais online
analyticalprocessing), sont composées d'informations historiques telles que des mesures
sur lesquelles sont effectuées des opérations massives en vue d'obtenir des statistiques et
des prévisions. Les bases de données sont souvent des entrepôts de
données (anglais datawarehouse): des bases de données utilisées pour collecter des
énormes quantités de données historiques de manière quotidienne depuis une base de
données opérationnelle. Le contenu de la base de données est utilisé pour effectuer des
analyses d'évolution temporelle et des statistiques telles.
1.2L'approche SGBD
Cette approche est venue résoudre un problème de gestion de données. A l'époque c'était
l'approche fichier, il s'est avérée que cette solution avec des imperfections pour palier à ce
souci ; on a inventé une nouvelle approche qu'on a appelé approche SGBD.
Ø Indépendance physique :
Le SGBD offre une structure canonique permettant la représentation des données réelles
sans se soucier de l'aspect matériel.
Ø Indépendance logique :
C'est l'une des innovations, car avec cette indépendance cette indépendance chaque groupe
peut se concentrer sur ce qui les intéresse. D'où chaque utilisateur a son propre aperçu
lorsqu'il travail.
Un SGBD doit permettre d'obtenir des données par des langages non procéduraux ou non.
D'où la facilité pour un informaticien de l'utiliser. Compatible avec des langages des
programmations (java , C++, pascal, vb , delphi , etc .).
Un SGBD doit offrir des outils pour permettre la mise à jour des données qui est le
premier rôle d'un SGBD
Un SGBD doit permettre d'éviter la redondance des données, car lorsqu'on élabore une
base de données, on doit tenir compte de l'espace mémoire.
Il doit respecter les contraintes d'intégrité. Une contrainte d'intégrité est une contrainte sur
les données de la base de données, qui doit toujours être vérifiée pour assurer la cohérence
dans cette base de données.
Ø Sécurité
Un SGBD doit être capable de protéger les données qu'il gère contre toute sorte
d'agressions extérieures.
L'importance première d'une base de données est de partager des données entre plusieurs
applications.
1.3.1Définition
Les tables systèmes contiennent les définitions de données que les utilisateurs peuvent
consulter à tout moment sans être autorisés à les modifier. Le composant de gestion
comporte essentiellement un langage relationnel de définition et de manipulation des
données. Ce composant englobe aussi des fonctions utilitaires telles que la restauration de
la base de données en cas de panne, la protection et la sécurité des données.
251607040
Ø Un SGBDR permet une organisation structurée des données, fondée sur une base
formelle claire. Toutes les informations sont stockées dans des tables. Des dépendances
entre les valeurs d'attributs dans une table, ou la présence d'informations redondantes sont
identifiées.
Un modèle de données est une description formelle et structurée des données et de leurs
relations dans un système d'information.
Entités et associations
Une entité est un objet spécifique (c'est-à-dire qui peut être identifié distinctement parmi
d'autres objets) dans le monde réel ou dans notre pensée. Elle peut désigner une personne,
un objet, un concept abstrait ou un événement. Les entités de même type forment un
ensemble d'entités caractérisées par un certain nombre d'attributs.
Pour chaque ensemble d'entités, nous définissons une clé d'identification, formée d'un
attribut ou d'une combinaison d'attributs, qui permet de distinguer chaque entité de
manière unique.
Les associations désignent les liens qui existent entre différentes entités.
Association simple
Dans une association simple (type 1), à chaque entité dans l'ensemble d'entités EE_1
correspond «une et une seule» entité dans l'ensemble EE_2.
Association conditionnelle
À chaque entité dans l'ensemble d'entités EE_1 correspond «zéro ou une entité», c'est-à-
dire au plus une entité dans l'ensemble EE_2.
Association multiple
Dans une association multiple (type m), à chaque entité dans l'ensemble d'entités EE_1
correspondent «une ou plusieurs» entités dans l'ensemble EE_2.
À chaque entité dans l'ensemble d'entités EE_1 correspondent «aucune, une ou plusieurs»
entités dans l'ensemble EE_2. Le type d'association multiple conditionnelle distingue du
type d'association multiple par le fait que chaque entité dans EE_1 n'est pas forcément
reliée aux entités dans EE_2.
Première phase
Deuxième phase
Dans ce modèle, les ensembles d'entités sont représentés graphiquement par des
rectangles, et les ensembles de liens par des losanges. Il convient de souligner ici qu'il
n'est pas toujours facile d'identifier des ensembles d'entités et de liens ainsi que leurs
attributs de manière unique. Bien au contraire, la phase de conception exige de la
compétence et de l'expérience pratique de la part de l'architecte de données.
Troisième phase
Tellement la liste est exhaustifs, on peut que citez qu'une partie dont les plus connus sont :
Ø Oracle
Ø Mysql
Ø Sql server
Ø PostgreSQL
Ø Paradox
Ø Sybase
Ø Dbase
Ø Visuel Dbase
Ø Access
Pour interroger une base de données, on a besoin d'un langage de base de données, sur ce
le plus connu et les plus utilisé est le langage SQL (StructuredQuery langage).
C'est un langage conçu par le mathématicien americaincodd en 1970. Il fait appel à des
opérations élémentaires qui manipulent les tables ainsi que leurs données. Il prépare la
conception de requêtes qui seront traduite en SQL.
Ø La destruction.
Ø La recherche.
CHAP II SYSTEME DECISIONNEL
[3] [5] [8] [9] [10] [16] [20] [21]
2.2.1 Entreprise
Une entreprise est une organisation dotée d'une mission et d'un objectif métier. Elle doit
gérer sa raison d'être et/ou sa pérennité au travers de différents objectifs (sécurité,
développement, rentabilité). Par voie de conséquence, cette organisation humaine est
dotée d'un centre de décision.
2.2.2 Décideur
Le décideur est une personne dotée d'un pouvoir de décision, il peut-être le responsable
d'une entreprise, le responsable d'une fonction ou d'un secteur. Il est donc celui qui engage
la pérennité ou la raison d'être de l'entreprise. Pour ces raisons, il doit être doté de
différents moyens lui permettant une prise de décision la plus pertinente et la plus
appropriée possible. Parmi ces moyens, les data warehouses ont une place primordiale et
privilégié. En effet, ils contiennent les données de toute l'activité de l'entreprise jugée utile
pour la prise de décision. Le principal problème réside dans l'exploitation de ces
informations. Pour cela, il est primordial de bien penser le datamining.
Leur rôle : Ces décideurs définissent les grandes lignes que l'entreprise doit prendre et
mobilisent les moyens nécessaires pour y parvenir. Donc ils orientent la politique et les
valeurs de l'organisation.
Leur rôle : les décideurs tactiques sont les relais des caps stratégiques, fixés par les
décideurs stratégiques.
Ce sont eux qui fixent les objectifs de leur direction ou de leur territoire, qui élaborent et
choisissent la meilleure tactique pour atteindre ces objectifs.
À ces trois profils de décideurs s'ajoute celui des analystes. Le rôle des analystes est de
récolter et de travailler l'information, fiabiliser les données, expliquer les résultats. Leur
rôle est d'aider à la prise de décision des décideurs. Les analystes varient suivant le type
d'organisation (industrie, négoce, service public...) et le service auquel ils appartiennent.
251595776
Figure 3 Décideur
Ø La représentation du présent.
Ø L'anticipation du futur.
Les informations permettant d'appréhender ces facteurs peuvent être de deux natures
différentes :
Ø Les informations quantitatives : ce sont toutes les données chiffrées telles que les
montants, quantités, pourcentages, délais...
Ø Les informations qualitatives : ce sont toutes les informations non quantifiables telles
qu'un commentaire accompagnant un rapport, des mécontentements, un sentiment, une
directive, une nouvelle procédure...
2.2.1 Définition
2.2.3 Catégorie
Ce sont les outils que nous utilisons chaque jour. Ils assurent le bon fonctionnement de
l'ensemble d'organisation.
Le principe même de la prise de décision est de s'appuyer sur des informations précises
pour en déduire des comportements et passer à l'action.
De part cette définition nous pouvons relève plusieurs concept qui caractérise un entrepôt
de données : Intégrées- Orientées sujet - Non volatiles - Historisées - Résumées
Intégrées
Les données de l'entrepôt proviennent de différentes sources éventuellement hétérogènes.
L'intégration consiste à résoudre les problèmes d'hétérogénéité des systèmes de stockage,
des modèles et de la sémantique de données.
Orientées sujet
Après leur intégration dans une sorte de source globale, les données sont réorganisées
autour de thèmes tels que : les itinéraire, inspecteur, matériaux...etc.
Chaque décideur d'une organisation doit disposer d'une vue sur les informations qui lui
sont pertinentes, et qui peuvent influer dans ses décisions pour une meilleure exploitation
de ces données.
Non volatiles
Tout se conserve, rien ne se perd : cette caractéristique est primordiale dans les ED. En
effet, et contrairement aux bases de données classiques, un ED est accessible en ajout ou
en consultation uniquement. Les modifications ne sont autorisées que pour des cas
particuliers (correction d'erreurs...etc.).
Historisées
Résumées
Les informations issues des sources de données doivent être agrégées et réorganisées afin
de faciliter le processus de prise de décision.
Les utilisateurs doivent pouvoir consulter les données en fonction de leurs droits d'accès.
L'ED doit comporter un module de traitement des requêtes, exprimées dans un langage,
doté d'opérateurs puissants, pour l'exploitation de la richesse du modèle.
Au début des années 60, le data mining s'appelait l'analyse statique. A la fin des années 80,
une sérié de méthodes éclectiques est venue rejoindre l'analyse statistique classique : la
logique floue, le raisonnement heuristique et les réseaux neuronaux.
Les objectifs du Data Mining peuvent être regroupés dans trois axes importants :
Ø Prédiction (What-if) : consiste à prédire les conséquences d'un événement (ou d'une
décision), se basant sur le passé.
Les modèles basés sur le concept multidimensionnel, sont les plus appropriés, à capturer
les caractéristiques des DW. Ils permettent en effet, de donner une vision simple, et
facilement interprétable par des non informaticiens, et de visualiser les données selon
différentes dimensions.
Mesure
251598848
251597824
L'atout principal d'une entreprise réside dans la quantité et qualité d'informations qu'elle
possède. Ralph Kimball, l'un des de précurseur du data warehouse, nous parlent des
objectifs fondamentaux d'un data warehouse, il s'agit de:
Les informations provenant d'une branche de l'entreprise peuvent être mises en corrélation
avec celles d'une autre branche. Si deux unités de mesure portent le même nom, elles
doivent alors signifier la même chose. A I' inverse, deux unités ne signifiant pas la même
chose doivent être définies différemment.Une information cohérente suppose une
information de grande qualité. Cela veut dire que l'Information est prise en compte et
qu'elle est complète.
L'entrepôt de données ne contrôle pas seulement l'accès aux données, mais il offre à ses
gestionnaires une bonne visibilité des Utilisateurs.
L'entrepôt de données recèle en son sein les Informations propres à faciliter la prise de
décisions. Il n'y a qu'un seul véritable résultat concret à attendre du data warehouse : les
décisions prises grâce aux données obtenues.
2.4.2 Composantes
Cette zone de présentation de données est l'emplacement ou les données sont organisées,
stockées et ouvert aux requêtes des utilisateurs, aux logiciels de reporting. La zone de
présentation est l'entrepôt de données, tel qu'il est perçu par les utilisateurs.
Il est à noter que la majorité d'entrepôt de données sont implémentés sur des bases de
données relationnelles, ce qui explique le pourquoi, de l'omniprésence de principe des
bases de données relationnelles.
2.4.2.4 Terminologie
Data mart
Sous-ensemble logique d'un data warehouse. Au-delà de cette définition relativement
simple, on considère souvent le data mart comme la réduction de l'entrepôt de données à
un seul processus ou à un groupe de processus ciblant un groupe métier spécifique.
Il est constitué :
Ø D'un tableur ;
Systèmes sources
Systèmes opérationnls
Traitement
Stockage temporaire.
Dimensionnel
Peut stocker des données atomiques Peut être rafraichi régulièrement Conforme au bus du
data warehouse
Générateurs d'états
Application utilisateur
Application de modélisation
Prévisions Scoring
Affectation budgétaire
Autres paramètres
Peupler
Répliqur
Récupér
Extraire
Extraire
Alimenter
Alimenter
Alimenter
Alimenter
Peupler
Répliquer
Récupérer
Peupler
Répliquer
Récupérer
Bus décisionnel
Bus décisionnel
Dimensions conformes
Faits conformes
Dimensions conformes
Faits conformes
PORTAIL DE RESTITUTION
Dans ce domaine d'entrepôt de données deux auteurs ont défini deux philosophies sur le
plan architectural différente, il s'agit de : Bill Inmon et Ralph Kimball. Deux philosophies
tout à fait différentes mais qui convergent bien.
Ø L'architecture de haut en bas: selon Bill Inmon, l'entrepôt de données est une base de
données au niveau détail, consistant en un référentiel global et centralisé de l'entreprise.
En cela, il se distingue du DataMart, qui regroupe, agrège et cible fonctionnellement les
données.
Ø L'architecture de bas en haut: Pour Ralph Kimball, l'entrepôt de données est constitué
peu à peu par les Data Mart de l'entreprise, regroupant ainsi différents niveaux
d'agrégation et d'historisation de données au sein d'une même base.
251599872
L'architecture d'un ED, représentée dans la figure 1, s'articule autour de trois phases :
l'intégration, la restructuration, et l'exploitation.
Intégration
Cette première étape, est assez délicate, car elle consiste à extraire et regrouper les
données, provenant de sources multiples, et hétérogènes. Un certain nombre de problèmes
est à résoudre à ce niveau : les données doivent être filtrées, triées, homogénéisées et
nettoyées.
Structuration
Cette étape consiste à réorganiser les données, dans des magasins afin de supporter
efficacement les processus d'analyse et d'interrogation, et d'offrir aux différents
utilisateurs, des vues appropriées à leurs besoins.
Interrogation et Analyse
La modélisation dimensionnelle considère les données comme des points dans un espace à
plusieurs dimensions. Ces points représentent les centres d'intérêts décisionnels (sujets)
analysés en fonction des différents axes d'analyse.
2.5.1 Terminologie
Une dimension peut être définie comme l'axe sur lequel on porte les différentes analyses.
Lorsqu'on fait un schéma de Base de données pour un système d'information classique, on
parle en termes de tables et de relations, une table étant une représentation d'une entité et
une relation une technique pour établir des liens entre ces entités.
Un fait est tout ce qu'on voudra analyser. Les faits, en complément aux dimensions, sont
ce sur quoi va porter l'analyse. Ce sont des tables qui contiennent les mesures de
performance qui relatent la vie de l'entreprise.
Ø Détermination du Fait.
Pour arriver à la sélection de processus clé vous devez arriver à répondre à un certain
nombre de question :
Ø Quel est l'objectif que nous voulons atteindre avec la mise en place d'un entrepôt de
données par rapport au but premier de notre entreprise ?
Au niveau de cette étape nous devons faire le choix du niveau de détail de l'information
que nous souhaitons conserver. Prendre ce qui peutinfluence la prise de décision.
Le but de cette étape est de choisir quels sont les axes d'analyse adéquats pour le processus
en question.
Pour trouver les dimensions adéquates au processus mesuré, posez-vous les questions
suivantes :
Détermination du Fait
Nous devons définir les mesures sur lesquels les analyses doivent se base .En effet, le
système décisionnel se limitera toujours à des faits tangibles.
2.5.2 Schématisation
Une étoile est une façon de mettre en relation les dimensions et les faits dans un entrepôt
de données. Le principe est que les dimensions sont directement reliées à un fait
(schématiquement, ça fait comme une étoile).Ce nom vient faite qu'il y a la table de fait
qui jouer le rôle de l'élément centralisateur sur laquelle les dimensions sont reliées
251602944
Le schéma en étoile est reconnu comme une approche de Ralph Kimball. Il se prête mieux
à la modélisation des data mart.
C'est un autre modèle de mise en relation des dimensions et des faits dans un entrepôt de
données. Le principe étant qu'il peut exister des hiérarchies de dimensions et qu'elles sont
reliées aux faits, ça fait comme un Flocon.
251603968
Ce modèle s'inscrit dans l'approche de Bill Inmon. Son principal avantage est la
performance des Updates et aussi un atout du côté de l'espace disque.
Le schéma en constellation consiste à placer plusieurs schémas en étoile avec des tables de
faits reliées hiérarchiquement. Les liens entre les différentes tables de faits permettent de
visionner les différents niveaux de détail.
Donc ce schéma consiste à fusionner plusieurs modèles en étoile qui utilisent des
dimensions Communes.
Des technologies complémentaires sont apparues par la suite : l' Intégration d'applications
d'entreprise (EAI), puis l' ESB (Enterprise Service Bus).
Les règles de transformation pouvant être parfois très compliquées, il est important
qu'elles puissent être représentées simplement afin que n'importe quel informaticien,
disposant d'une formation ETL, puisse lire et comprendre le déroulement d'un flux de
données.
Le propre d'un ETL est d'être ouvert et pouvoir disposer d'une certaine universalité de
connexion.
Tout se passe au sein de fichiers de configuration qui peuvent être de natures diverses
(XML, base de données...). Les flux se lancent et se planifient, soit par le biais de l'agent
SQL, soit par le biais d'une ligne de commande exécutable, si vous disposez de votre
propre ordonnanceur d'entreprise.
Ø Code-generators : les transformations sont conçues et un code est généré. Ce code est
déployablé indépendamment de la base de données
Extraction
Les données appropriées sont obtenues à partir des sources dans la phase d'extraction. On
peut employer l'extraction statique quand un entrepôt de données a besoin d'être chargé
pour la première fois. Conceptuellement parlant, ceci ressemble à un chargement
instantané des données opérationnelles. L'extraction par accroissement, employée pour
mettre à jour des entrepôts de données régulièrement, saisit les changements appliqués
aux données de base depuis la dernière extraction. L'extraction par accroissement est
souvent basée sur la notation maintenue par le système de gestion de bases de données
opérationnel.
Transformation
A chaque table de la base décisionnelle correspond une table tampon qui contient :
Ø Une colonne Valide de type oui ou non qui dira si le membre existe déjà ou non.
Chargement
Comme les données sont chargées dans la base décisionnelle qui est muni d'un schéma
relationnel, il faut charger ses tables dans cet ordre :
Ø Ensuite les tables qui ne contiennent que des clés étrangères vers des tables déjà
chargées.
Définition
Internet
Le World Wide Web est un grand très grand systèmed'information réparti sur un ensemble
desitesconnectés par le réseau Internet. Cesystème est essentiellement constitué
dedocuments hypertextes, ce terme pouvant êtrepris au sens large : textes, images, sons,
vidéos, etc. Chaque site propose un ensembleimportant de documents, transmis sur le
réseau par l'intermédiaire d'unprogramme serveur.
Site web
Un site ou site web (de l'anglais web site, qui se traduit littéralement en français par site de
la toile) est un ensemble de pages web hyperliens entre elles et accessible à une adresse
web. On dit aussi site internet par métonymie, le World Wide Web reposant sur l' Internet.
Ø En 1996, la guerre des navigateurs (Internet Explorer gagne en 1999). Ainsi le web ne
fait que prendre de l'ampleur.
L'HyperText Transfer Protocol, plus connu sous l' abréviation HTTP littéralement
« protocole de transfert hypertexte » est un protocole de communication client-
serveur développé pour le World Wide Web. HTTPS (avec S pour secured, soit
« sécurisé ») est la variante du HTTP sécurisée par l'usage des protocoles SSL ou TLS.
SMTP a été l'une des premières applications Internet. Il définit une messagerieélectronique
relativement simple, qui se sert des adresses Internet, où la deuxième partie représente le
nom du domaine qui gèrele serveur de messagerie.
FTP est un protocole de transfert de fichiers, qui permet de garantir une qualité de service.
Le transfert s'effectue entre deux adresses extrémité du réseau Internet. L'application FTP
est de type client-serveur, avec un utilisateur, ou client, FTP et un serveurFTP.
3.2.4 Telnet
Telnet est une application de connexion à distance, qui permet de connecter un terminal à
une machine distante. C'est l'application de terminal virtuel.
3.3 Fonctionnement d'un site web
L'Internet est un réseau composé d'ordinateurs. Ceux-ci peuvent être classés en deux
catégories.
Ø Les clients : ce sont les ordinateurs des internautes. Votre ordinateur fait donc partie de
la catégorie des clients.
Ø Les serveurs web: Il s'agit des serveurs permettant à des clients web d'accéder à
l'application à partir de tout navigateur (exemple internet explorer). Installé sur leur poste
connecté à internet/intranet distant du serveur. Un serveur web a donc pour rôle
d'interpréter les requêtes http arrivant sur le port associé par défaut le port 80 et de fournir
une réponse par le même protocole.
Sur un site statique, il ne se passe rien d'autre. Le serveur stocke des pages web et les
envoie aux clients qui les demandent.
Lorsque le site est dynamique, il y a une étape intermédiaire : la page est générée par un
serveur web.
La page web est générée à chaque fois qu'un client la réclame. C'est précisément ce qui
rend les sites dynamiques vivants : le contenu d'une même page peut changer d'un instant
à l'autre.
3.4.1 HTML
3.4.2 XHTML
Parmi ces caractères de marquage, certains correspondront à des liens vers d'autres pages
web : ce sont des liens hypertexte. Le « X » de XHTML vient de XML, soit «
eXtensibleMarkupLanguage », langage plus complexe et plus strict que le HTML. C'est
lui qui a inspiré la transition du HTML vers la forme plus rigoureuse qu'est le XHTML.
3.4.3 CSS
CSS, cela signifie « Cascading Style Sheets », ce qui se traduit en Français par feuilles de
style en cascade. La feuille de style fournit la mise en forme des éléments de la page, qui
auront été écrits en XHTML. Elle s'applique à une ou plusieurs pages du site.
Le terme « en cascade » indique que la mise en forme d'une page peut faire appel à
plusieurs feuilles de style. Les différentes propriétés affectées à un même élément
s'ajoutent alors pour lui donner sa mise en forme finale.
3.4.4 PHP
3.4.5 JavaScript
Ø Afficher/masquer du texte ;
Le Javascript est un langage dit client-side, c'est-à-dire que les scripts sont exécutés par le
navigateur chez l'internaute (le client). Cela diffère des langages de scripts dits server-side
qui sont exécutés par le serveur Web. C'est le cas des langages comme le PHP.
NB : Cette liste n'est qu'une portion des langages utilisés dans le web
CHAP IV : SYSTEMES
D'INFORMATION
GEOGRAPHIQUE
[2] [6] [14]
4.1 Définition
Les applications SIG sont utilisées en raison de leurs atouts professionnels et leur capacité
à exploiter de nombreuses informations et ressources SIG. Soucieuses de fournir des
informations et des fonctionnalités géo spatiales transversales, la plus part d'organisations
étendent la portée des SIG bureautiques à l'aide de solutions SIG serveur qui fournissent
des contenus et des fonctions via des services Web.
Ainsi, le rôle du SIG est de proposer une représentation plus ou moins réaliste de
l'environnement spatial en se basant sur des primitives géographiques telles que des
points, des arcs, des polygones (vecteurs) ou des maillages (raster). A ces primitives sont
associées des informations qualitatives telles que la nature (route, voie ferrée, forêt, etc.)
ou toute autre information contextuelle.
Bref, l'information géographique peut être définie comme l'ensemble des descriptions d'un
objet et de sa position géographique à la surface de la Terre.
Un SIG doit, quel que soit le domaine d'application, répondre aux 5 questions suivantes:
Ø Où ?
Ø Quoi ?
Ø Comment ?
Ø Quand ?
Ø Et si ?
· Mieux: où se trouvent tous les objets d'un même type et/ou d'autres types ?
Quoi: permet la mise en évidence des objets/phénomènes présents sur un territoire donné.
Comment: met en évidence les relations existant ou non entre les objets et/ou les
phénomènes ?
· comment les objets sont répartis dans l'espace étudié, et quelles sont leurs relations?
C'est relatif à l'analyse spatiale.
Quand:
Et si: Quelles conséquences affecteraient les objets et/ou phénomènes concernés du fait de
leur localisation ?
Nous pouvons classifier les données SIG en deux grandes catégories à savoir les données
géographiques et les données attributaire
Une donnée est dite géographique si on peut la localiser soit directement par ses
coordonnées géographiques ou indirectement par son adresse postale ou par son identifiant
cadastral.
Nous pouvons subdiviser les données géographiques en trois catégories à savoir les
données géométriques, les données graphiques et les métadonnées.
· le point (x, y) : il peut représenter des arbres, des bornes, des collecteurs d'ordures, ...
· la ligne((x1, y1), ..., (xn, yn)) : elle peut représenter une route, de ligne de réseaux de
télécommunication, ....
· le polygone ou surfacique : elle peut matérialiser une entité abstraite comme la surface
d'un pays, d'une forêt, un lac, ...
Ø les métadonnées : Ce sont les informations sur l'origine et le propriétaire d'une donnée
géographique.
Les données raster ont comme élément essentiel le pixel (Picture élément). Les pixels sont
répartis dans un raster de façon régulière en lignes et colonnes comme indique la figue 19
ci-dessous. Les lignes et les surfaces ne peuvent être représentées que par l'enchaînement
de pixel unique. Un objet ne peut donc être représenté que de façon approximative; c'est
ainsi que la taille du pixel-raster (résolution spatiale) conditionne l'exactitude de la
représentation.
251612160
NB: La donnée raster ou maillée donne une information en chaque point du territoire.
Photo aérienne
La photo aérienne peut être scannée, corrigée par des méthodes de photogrammétrie des
déformations d'échelles pour en obtenir une ortho photographie ; elle peut être aussi
numérique c'est-à-dire directement exploitable par un SIG. Dans tous ce cas, la précision
de la photo aérienne dépend de la dimension du plus petit détail visible on parle alors de la
notion de résolution.
Image satellitaire
C'est une image issue des prises de vue des capteurs embarqués dans de satellites
d'observation placés sur orbites de la terre. Lorsque l'image est obtenue par le reflet du
rayonnement solaire dans le domaine du visible par les objets situés au sol, on parle
d'image optique (En référence à la télédétection optique). Il peut s'avérer que l'image est
obtenue par un objet au sol à une onde envoyée par le satellite, on parlera plutôt d'image
radar en référence à la télédétection RADAR.
Un plan scanné est une image issue de la numérisation d'un plan ou carte sur support
papier déjà traité et exploité.
Ø Le modèle topologique
Un des avantages des systèmes d'information géographique est que les relatons entre les
objets peuvent être calculées et donner naissance à des points d'intersection. C'est la
topologie.
La topologie de réseau, décrit la relation entre des ensembles linéaires (polyligne) par
leurs extrémités qui sont les noeuds.
La topologie de voisinage permet à partir des arcs constituant le polygone de connaître les
voisins de chaque surface.
Pour représenter une distance entre deux villes sur une feuille de papier, il faut utiliser un
moyen mathématique qui s'appelle l'échelle.
L'échelle permet de réduire les distances réelles relevées sur le terrain pour les représenter
sur une carte.
Le cartographe adopte pour cela une unité de valeur numérique.Par exemple, si l'échelle
choisie est de 1/25 000, 1 cm sur la carte est égal à 25 000cm (ou 250 m) sur le terrain ;
dans ce cas, pour dessiner une route de 1 km, il faudra dessiner un trait de 4 cm sur la
carte.
L'utilisation des données géographiques et des cartes ne date pas d'hier. Dès les débuts de
la colonie, les explorateurs effectuaient des mesurages sur le territoire pour faire les
subdivisions en seigneuries, gérer les infrastructures portuaires et militaires ou localiser
les routes maritimes et terrestres.
Ø Les cartes topographiques sont utilisées pour représenter des régions terrestres avec
leurs caractéristiques naturelles à savoir les montagnes, les cours d'eau et celles créées par
l'homme, les routes, les villes, ainsi que leurs frontières ;
Ø Les cartes thématiques donnent de l'information sur des thèmes particuliers comme la
carte routière, la carte d'utilisation du sol, la carte géologique, la carte forestière, etc.
Il s'agit d'un ensemble de jeux de données géographiques de différents types stockés dans
un dossier système de fichiers commun, une base de données Microsoft Access ou une
base de données relationnelles multiutilisateurs (comme Oracle, Microsoft SQL Server,
PostgreSQL ou IBM DB2).
Elles vont des petites bases de données mono-utilisateurs aux géodatabases d'entreprise,
de département ou de groupe de travail, plus volumineuses, auxquelles ont accès de
nombreux utilisateurs.
251609088
La géodatabase personnelle
Une géodatabase personnelle utilise le moteur de bases de données Microsoft Jet, et peut
donc être assimilée à une base de données de type Access pour les données attributaires.
Une géodatabase personnelle peut être lue par plusieurs utilisateurs, mais éditée par un
seul d'entre eux. De plus, elle ne supporte pas le versionnement.
Enfin, elle ne permet de gérer que des relations de topologie simples et temporaires.
Tous les produits ESRI (ArcView, ArcEditor, ArcInfo) peuvent la lire et l'éditer sans
extension.
La géodatabase multiutilisateurs
Ce format est destiné à des bases de données lourdes (au-delà de 2 Go), qui doivent être
lues et éditées par de multiples utilisateurs. D'où la gestion du versionnement.
Géodatabases fichier
Elles sont stockées sous forme de dossiers dans un système de fichiers. Aucune limite ne
s'applique à la taille des géodatabases.
Ø Une gamme d'applications et d'outils clients assez souples pour gérer n'importe quelle
tâche ou mission, par exemple, l'accès au SIG via un navigateur, des périphériques
mobiles, des applications de mise à jour, Arc GIS Explorer, des applications bureautiques
SIG et des applications cartographiques grand public fournies par Google et Microsoft.
Ø Intégration à d'autres systèmes de l'entreprise, tels que la gestion des ressources client
ou la gestion globale de l'entreprise à l'aide d'interfaces logicielles et de méthodes
conformes aux normes. Les serveurs SIG permettent de spatialiser une architecture
orientée sur les services (SOA).
Ø Un ensemble commun de services de carte et SIG partagés qui assurent une gestion
cohérente des informations et une vue opérationnelle commune.
Ø Prise en charge des normes d'interopérabilité à la fois dans les domaines SIG (par
exemple, OGC et ISO) et plus largement des technologies de l'information (IT) (par
exemple, W3C).
Ø Logiciel
Ø Matériels
Ø Procédures
Ø Personnel
Ø Réseaux
Ø Cartographie statistique;
Ø Cartographie dynamique
Ø Risques/catastrophes naturels;
Ø Sante;
Ø Télécommunications;
Ø Génie civil;
Ø Gestion côtière;
Ø Océanographie; etc.
4.14.1 Généralités
LeWebmapping désigne, au sens large, tout ce qui relève de la cartographie en ligne sur
Internet. Sous ce terme générique, on englobe différents types d'applications
cartographiques allant du simple visualiseur à l'outil de cartographie thématique, voire au
SIG en ligne. Leur point commun est d'être accessible à travers un simple navigateur
Internet. Le passage au web dynamique permet de dépasser le téléchargement de cartes
statiques et d'accéder à des données géographiques contenues sur un serveur
cartographique (bases de données ou fichiers SIG), voire de superposer des couches
d'information aux données en local. Le webmapping est alors synonyme de cartographie
dynamique, l'utilisateur pouvant interagir avec différentes applications cartographiques via
Internet.
On trouve dans cette rubrique des applications cartographiques concernant des thèmes
aussi variés que l'agriculture, l'eau, l'environnement, les moyens de communication, la
politique... Les outils de cartographie en ligne offrent de plus en plus de possibilités
d'animation et d'interaction pour l'internaute. Les formats sont devenus interopérables, de
sorte que les données peuvent être partagées, échangées, modifiées par différents groupes
ou organisations.
Comme vous pouvez remarquer sur la figure ci-dessous, un serveur SIG possède les
principales fonctions suivantes : le stockage, le traitement et la diffusions des cartes et
informations géographiques via le réseau internet.
Le stockage
Pour bien assurer sa fonction de stockage, le serveur SIG possède deux couches :
· Une couche dédiée aux données supportées par un SGBD géographique à l'instar de
Mysql avec MyGIS, PostGresql avec son extension Post Gis, ou Oracle avec Oracle
spatial etc....
Le traitement
Un SIG web est doté s'un serveur web et d'un serveur de scripts (PHP, JSP, ASP, ...) qui le
rendent capable d'assurer le traitement des requêtes.
SIG, au-delà du stockage des données, c'est-à-dire la possibilité d'effectuer des requêtes à
composante spéciale :
· Assemblage et habillage graphique des couches d'information pour obtenir une carte
La diffusion
Le serveur SIG va donc ajouter aux fonctions habituelles d'un serveur internet des
fonctions supplémentaires en relation avec la gestion et le traitement de données
graphique de référencées.
Le serveur SIG doit être capable de fournir l'information géographique adapte à l'écran de
l'utilisateur.
Le datamining
Pour arriver à exploiter ces quantités importantes de données, le datamining utilise des
méthodes d'apprentissages automatiques.
Ø Client
Ø Serveur cartographique
Ø Serveur de données
Client
Le client est, dans le cadre du Web Mapping, sous la forme d'une application web. C'est
lui qui permet l'interrogation des serveurs cartographiques. Les clients utilisent un certain
nombre d'outils développés à base de différentes bibliothèques (Javascript, Java...), Open
Source ou non, tournés vers la cartographie.
Il existe différents clients qui permettent à l'utilisateur de visualiser des cartes géo-
référencées depuis une page web tels que Google maps, Bing Map, OpenLayers...
Serveur cartographique
· Les serveurs cartographiques libres où le code source est à disposition du grand public,
ce qui permet d'héberger et d'administrer son propre serveur cartographique chez soi
comme GeoServerou MapServer.
· Les serveurs cartographiques semi-libres qui ne permettent que d'être requêtés comme
Google Map Server ou encore Bing Map Server.
Serveur de données
Les serveurs de données utilisés pour faire de la cartographie en ligne ne sont autres que
des Systèmes de Gestion de Base de Données Relationnel et Objet (SGBDRO) améliorés
qui introduisent des extensions de données spatiales expriment toutes les informations
concernant la localisation et la forme de particularités géographiques, ainsi que les
rapports.
4.14.4 Fonctionnalités
Le Webmapping permet l'affichage de cartes sur internet mais pas seulement. Il offre un
large panel de fonctionnalités liées à la cartographie en ligne :
Ø Les cartes peuvent être de différents types, plan ou satellite, en y intégrant plusieurs
vues possibles superposables comme le relief, les routes ou encore les noms de villes. A
ceci s'ajoutent des options réalisables en temps réel sur la carte comme le zoom ou le
déplacement.
Ø Il est possible de placer des marqueurs sur une carte, c'est-à-dire qu'il est possible
d'indiquer un emplacement précis sur une carte, à l'aide de ses coordonnées, comme un
lieu ou un bâtiment.
Ø Il est également possible de calculer et visualiser un itinéraire sur une carte en ligne.
Si ce travailler a été réalisé ce grâce au concours de ces différentes organes que nous
avons pu approcher.
Le réseau routier de la RDC comprend au total 153.209 km de routes répartis comme suit :
· 3.500 ponts de portée de 4 à 750 mètres pour une longueur totale de 68.000 mètres,
Le réseau des routes d'intérêt général se réparti en 3 catégories selon leur importance :
Réseau prioritaire
5.1.1.1 Historique
5.1.1.2 Objectif
Ø Maître d'ouvrage délégué pour les projets d'infrastructures financés par les partenaires
traditionnels ;
Ø Routes ;
Ø Voiries;
Ø Bâtiments Publics ;
Ø Appui Institutionnel;
Ø Administration et Finances.
Ø Passation de Marchés ;
Ø Gestion Financière ;
Ø Audit Interne ;
Niveau Existant
Logiciels ArcGIS
La gamme Microsoft
· Une route a été réhabilitée combien de fois pendant un intervalle des temps.
· Quelles sont les performances des entreprises intervenant dans la construction du réseau
routier congolais ?
5.2.2 Motivation
CHAP VI :CONCEPTION ET
IMPLEMENTATION
[10][18]
Pour notre application de webmapping nous avons utilisé MySQL 5.5.20, le choix
s'explique par les avantages que ce SGBD nous offre. Reconnu comme le meilleur
gestionnaire des données par les ImpactsAwards 2011 de PHP architect, MySQL reste le
SGBD le plus utilisé dans le web.
Ø Améliorer l'accès et la qualité des données : on y retrouve tous les outils destinés à
concevoir un entrepôt de données bien modélisé, performant et contenant des données
fiabilisées.
Le succès des logiciels libres ne s'explique pas par leur prix mais par leur qualité, plus
d'un million de sites Web fonctionne avec Apache Selon une enquête "récente" menée en
2013, le serveur gratuit Apache a dépassé un million de sites administrés, soit 48% des
sites Web devant Microsoft IIS (21,7%) et Netscape Enterprise (9,6%).
Google Maps est un serveur gratuit de cartographie en ligne. Le service a été créé
par Google. Lancé en 2004 aux États-Unis et au Canada et en 2005 en Grande-
Bretagne (sous le nom de Google Local), Google Maps a été lancé jeudi 27 avril 2006,
simultanément en France, Allemagne, Espagne et Italie.
Google Mapsutilise des images satellites et des photographies aériennes de haute altitude
pour une meilleure précision couvrant la totalité de la surface terrestre. Google Maps par
ailleurs propose une API qui permet aux développeurs web par une bibliothèque de
fonctions JavaScript et au format de fichier KML d'intégrer des cartes et de pouvoir créer
des cartes personnalisées pour leurs applications. C'est cette opportunité que nous avons
saisie pour intégrer à notre plateforme la cartographie basée sur Google Maps. La
contrainte c'est que notre plateforme doit être connectée à Internet pour bénéficier de ses
avantages.
6.2 Application dewebmapping
Après des analyses approfondies, nous avons identifié les entités ci-après:
Ø Axe routier
Ø Entreprise
Ø Inspecteur
Ø Route
Ø Paramètre géographique
Ø Province
Les relations trouvent entre les différentes entités sont les suivantes :
Ø Avoir
Ø Localiser
Ø Réhabiliter
Ø Observer
Ø Peut avoir
1,n
251641856
1,n
Province
Idpro
nompro
251616256251631616251621376251622400
Parametregeo
Idpar
Comm_par
Longitude
latitude
251613184
1,n
251649024251619328
Axeroutier
idaxe
Nomaxe
Comm_axe
Taille_axe
Cout
Duree
Date_debut
Date_fin
251614208251635712
Localiser
251628544251636736
Réhabiliter
251629568
1,n
251676672
1,n
251644928
1,1
251642880
1,n
251645952
1,n
251646976
1,1
251643904
1,1
251640832251639808251638784
Peut avoir
251625472251637760251632640251634688251633664251630592
Observer
251627520
Avoir
251626496251623424
Inspecteur
idins
Matricule
Nomobs
Postnom
251617280
Routes
idroute
Nomroute
Comm_route
Type_route
Nbredekm
251615232251624448251620352
Entreprise
identre
Nomentre
Numphone
Adresse
Siteweb
Province
idpro
nompro
251654144251659264251661312
Inspecteur
#idins
Matricule
Nomobs
Postnom
251655168
Routes
#idroute
Nomroute
Comm_route
Type_route
Taille_route
251653120251662336251658240
Entreprise
#identre
Nomentre
Numphone
Adresse
Siteweb
251656192
Parametregeo
Idpar
Comm_par
Longitude
Latitude
#idaxe
251651072251667456251665408
251674624251660288251668480
Axeroutier
idaxe
Nomaxe
Comm_axe
Taille_axe
Coût
Duree
Date_debut
Date_fin
#idroute
#identre
251652096251664384251672576
Observer
idlocalise
#idins
#idaxe
251671552251663360251670528
Localiser
idlocalise
#idpro
#idaxe
251669504251666432251657216251673600
Après s'être loguer, l'administrateur aura une interface d'accueil pour naviguer dans
l'application en vue de mettre à jour les données.
Comme nous pouvons l'apercevoir sur cette interfaceà gauche,nous avons notre menu
principal qui nous permettra de passer d'une interface à une autre. La partie droite
représente notre formulaire qui permettra de saisir les données relatives à l'axe routier.
Interface d'enregistrement de paramètre géographique
Sur cette interface nous aurons la possibilité d'insérer les cordonnées géographique d'une
itinérairedans notre base de données MySQLqui correspondra à un axe qui est en cours de
réhabilitation.
La carte sur la figure suivante représente la vie de Kinshasa, nous pouvons nous
apercevoir des traits rouges qui représentent les itinéraires qui sont en cours de
réhabilitation dans la ville de Kinshasa.
<?php
ClassgoogleConnexion{
try{
return$bkas;
?>
var options = {
center: latlng,
zoom: 20,
mapTypeId: google.maps.MapTypeId.ROADMAP
};
options);
Dans Google Maps les coordonnées sont sous formes de latitude et de longitude. La
librairie Google Maps met àdisposition un constructeur permettant de créer un objet de
classe google.maps.LatLng(lat:number,lng:number) qui prend en paramètre des nombres
représentant, respectivement, la latitude et la longitude.
<?php
include("connexion/connexion.php");
$rep = $conn->Connexion();
/*$rep ;*/
?>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>GeoServer</title>
</head>
<body>
<div id="gauche">
<p></p>
<center>
<table>
<tr>
<td><a href="accueil.php?nav=1"><imgsrc="images/b_home.png" width="16"
height="16" /></a></td>
</tr>
</table>
</center>
<p></p>
<div class="menu">
<table>
<tr>
</tr>
<tr>
</tr>
<tr>
</tr>
<tr>
<tr>
</tr>
<tr>
</tr>
</table>
</div>
</div>
<div id="droit">
<div class="entete">
<table>
<tr>
<td>localhost</td>
</tr>
</table>
</div>
<div class="corpss">
<div class="menuAj">
<table>
<tr>
<td><a href="#"><imgsrc="images/OK.gif" width="20" height="20" /></a></td>
</tr>
</table>
</div>
<fieldset>
<legend>Axe Routier</legend>
<table>
<tr>
<td>Nom route</td><td>
<?php
include("comboR/nomroute.php");
?>
</td>
</tr>
<tr>
<td>Entreprise</td><td>
<?php
include("comboR/entreprise.php");
?>
</td>
</tr>
<tr>
<td>Privince</td><td>
<?php
include("comboR/province.php");
?>
</td>
</tr>
<tr>
<td> Nombre de
ligneParametre geo</td><td><input name="nbrligne" type="text"/></td>
</tr>
<tr>
<td></td><td></td>
</tr>
<tr>
<td></td><td></td>
</tr>
</table>
</fieldset>
<div class="tabl">
</div>
</div>
</div>
</body>
</html>
<?php
Class miseajouraxe{
$bkas->exec('INSERT INTO
axeroutier(idaxe,nomaxe,comm_axe,taille_axe,idroute,identre,date_debut,date_fin,cout,D
uree) VALUES(NULL, \''.$nomaxe.'\', \''.$commtaxe.'\', \''.$taille.'\', \''.$idroute.'\', \''.
$identre.'\', \''.$date_debut.'\', \''.$date_fin.'\', \''.$cout.'\', \''.$duree.'\')');
?>
Les données du réseau routier seront analysables par les utilisateurs suivant cinq
dimensions, il s'agit :
Ø Dimension Route
Ø Dimension Province
Ø Dimension Inspecteur
Ø Dimension Entreprise
Ø Dimension Temps
Selon les problématiques posent nous sommes abouti au choix des mesures suivantes sur
lesquelles seront portés les analyses.
Ø Coût
Ø La taille
Ø La durée
6.3.1.3 Modèle
Dim_Province
Id_DW_province
Id_nat_province
nomprovince
Dim_Inspecteur
Id_DW_Inspecteur
Id_nat_Inspecteur
Nominspecteur
Numphone
Dim_Route
Id_DW_Route
Id_nat_Route
Nomroute
Nomaxeroutier
Comm_route
Comm_axe
Type_route
Entreprise
Id_DW_Entreprise
Id_nat_Entreprise
Nomentreprise
Fait
Id_DW
Id_DW_Province
Id_DW_Temps
Id_DW_Entreprise
Id_DW_Inspecteur
Id_DW_Route
Cout
Duree
Taille
Dim_Temps
Id_DW_temps
Id_nat_temps
Année
Mois
Trimestre
Semestre
Type_route nvarchar(10)
Date_debut smalldatetime
Date_fin_fin smalldatetime
Numphone nvarchar(30)
Date_debut smalldatetime
Date_fin smalldatetime
Date_fin smalldatetime
Date smalldatetime
Année nvarchar(4)
Trimestre nvarchar(4)
Mois nvarchar(12)
Outils utilisé :
Ø Microsoft Office
Procédure
Toutes les dimensions, excepté la dimension temps, sont des dimensions à variation lente.
Les sources de données sont des fichiers Excel que nous avons exportés de notre base de
données MySQL. Nous avons utilisé le processus d'intégration des ETL tel qu'implémenté
dans SQL Server Intégration Services.
Une particularité pour cette dimension, nous l'avons généré automatiquement en fixant
notre plage d'étude entre 2007 et 2013. Car nos données test correspondent à cette plage.
Ø Outils: MySQL, Microsoft Office Excel 2007, SQL Server Integration Services
- Création de la vue de préparation pour extraire les données qui correspondant aux clés
d'entreprise et les mesures.
MySQL
- Nettoyage de données
- Vérification de la cohérence
Excel
La tâche, à ce niveau est facilitée par la base de préparation déjà chargée de données. La
source de donnée est le résultat d'une requête SQL. Ce dernier est alors copié dans la table
des faits après mappage des colonnes.
SELECT DISTINCT
dbo.Dim_Inspecteur.id_DW_inspecteur, dbo.Dim_Route.id_DW_route,
dbo.Dim_Temps.id_DW_temps, dbo.Dim_Province.id_DW_province,
dbo.T_Preparation ON dbo.Dim_Inspecteur.id_nat_inspecteur =
dbo.T_Preparation.id_nat_inspecteurINNER JOIN
dbo.Dim_Province ON dbo.T_Preparation.id_nat_province =
dbo.Dim_Province.id_nat_provinceINNER JOIN
dbo.Dim_entreprise ON dbo.T_Preparation.id_nat_entreprise =
dbo.Dim_entreprise.id_nat_entrepriseINNER JOIN
dbo.Dim_Temps ON dbo.T_Preparation.id_nat_temps =
dbo.Dim_Temps.id_nat_tempsINNER JOIN
Ce script SQL nous a permis de charger la table de fait en faisant le mappage entre les clés
d'entrepôts.
Nous avons procédé à quelques analyses test pour évaluer les performances de notre
système décisionnel, après le déploiement du cube avec Microsoft SQL Server Analysis
Services.
Départ notre tableau de bord, nous pouvons constater qu'au niveau de l'axe Gare Central et
Socimaxdeux entreprises ont eu à intervenir.Nous pouvons alors prendre une décision en
fonction de différentesmesures.
Ø tableau de synthétique
Ce tableau nous représente la synthèse statique de SAFRICAS par rapport à nos trois
mesures.
Ø Histogramme
Sur cette figure nous pouvons constater que la grande partie de l'argent attribue à
SAFRICAS pour les infrastructures routières fut utilisé à KINSHASA.
Tableau 7 Tableau croisé sous Analysis Services pour la présentation des statistiques.
Figure 32 Histogramme de coût par province
CONCLUSION
Le présent travail a fait l'objet de la mise en place d'un data Warehouse et d'une
application de webmapping pour la gestion du réseau routier de la République
Démocratique du Congo.
Si sa mise en oeuvre s'est appuyée sur de bases théoriques développées dans les premier,
deuxième, troisième, quatrième et cinquième chapitres. Le dernier chapitre a été
entièrement consacré à l'implémentation de l'application couplée au Système Décisionnel.
Au cours de la phase théorique, nous avons débuté par les notions fondamentales sur les
bases de données pour ensuite aborder le Système Décisionnel. Au troisième chapitre,
nous avons passé en revue les différents langages de programmation et techniques utilisées
dans le web. Au quatrième chapitre, nous avons abordé les théories sur les Systèmes
d'Information Géographique avec une attention particulière sur le Webmapping. Au
cinquième chapitre nous avons présenté le secteur des infrastructures routières de la RDC
et analyse leur état de la gestion actuelle.
Nous pouvons nous estimer heureux d'être arrivé aux termes de ce travail qui a proposé
une double mise en place, soit:
Ø Une application de webmapping en vue d'informer la population en temps réel sur l'état
des routes aménagées qu'elles soient en cours de (re)construction ou réhabilitation.
Au-delà de tout, nous ne prétendons pas avoir épuisé le sujet. C'est pourquoi nous sommes
ouvert aux critiques ou remarques allant dans le sens d'améliorer notre travail.
BIBLIOGRAPHIE
A. Ouvrages
[2] BARRE Michèle et ROGER Christophe, les bases de données spéciales, IRD
Paris,2005
[3] BERTRANDBourquier, Business intelligence avec SQL Server 2008, Dunod, Paris,
2009
[10] Sébastien FANTINI : Business Intelligence avec SQL Server 2008 R2,ENI Editions
2010
B. Notes de cours
[12] Cyril GRUAU : Conception d'une base de données, note de cours, 2007.
C. Article
[15] Cellule d'infrastructures, les infrastructures routières en RDC, Kinshasa, janvier 2009
D. Mémoire
[16] KASEREKA MUSUMBA : Construction d'un Data Warehouse pour l'aide à la prise
de décision en matière de gestion de l'exploitation industrielle de Bois en République
Démocratique du Congo, Université de Kinshasa 2011-2012.
E. Webographies