Вы находитесь на странице: 1из 7

Suppor tdeCour s

Ingnier ie duDocument(GED)
EcoleDoctor aledelINIPle:Guelma

Planducour s
Chapitr e1Passagedelar chivagedocumentair elintelligencecollective
1.1Lacapitalisationdesconnaissances
1.2Linfor mationetlconomie
1.3LesNouvellesTechnologiesdelInfor mationetdelaCommunication
(NTIC)
Chapitr e2Lamiseenplacedunegestionnumr iquededocuments(GED)
2.1Intr oduction
2.2Mthodedepilotagedunpr ojetdeGED
Pr incipesfondateur s
Analyseparlesusages
Conceptiondunmodulepilote
Analysedeloffr e
Maquette
Bilanetdcision
Chapitr e3LestechniquesdeGED
3.1Acquisitiondudocumentaufor matnumr ique
For matage
Tr aitement
Indexation
Stockage
Recher che
Consultation
Diffusion
Chapitr e4Ledocumentnumr ique:str uctur e,ar chitectur e,scur itet
aspectsjur idiques
4.1Standar dsdedescr iptiondudocument
Nor mesdestr ucturationdesdocuments

Lesstandar dsindustr iels


4.2Ver sundocumentpor table,multimdia,compositeetdistr ibu
4.3Unenouvellear chitectur epour unsystmeDistr ibudInfor mationet
decommunication
4.4Lascur it
4.5Aspectsjur idiquesdudocumentlectr oniques
Chapitr e5LaGEDetlesNTIC
5.1LesNTIC
5.2LeGr oupewar eetlaGED
Chapitr e6 Technologiesavancesetlingnier iedocumentair e
6.1Hyper textesetingnier iedocumentair e
6.2Lagent
6.3Lescluster ssmantiques
6.4Lestechniquesavancesenr echer chedocumentair e
Chapitr e7Les DocumentsPlats
7.1Repr sentationspossibles
o Vecteurbinair e
o Vecteurfr quentiel
o VecteurTFIDF
o Synthsedesr epr sentationsvector ielles
o Repr sentationsquentielle
7.2Lepr tr aitement
o Lasegmentation
o Letr aitementmor phologique
o Letr aitementsyntaxique
o Letr aitementsmantique
7.3Lesproblmatiques
o LaRecher cheDocumentair e(RD)
o LaClassification
o Lecluster ing
Chapitr e8 Lar echer chedinformation
8.1Intr oductionlaRI
Histor iquedelaRI
8.2Indexationdedocuments
8.3 Modlesdebasepour laRI
Modlespr obabilistes
Expansionder equtes
Modlesavancs :modlesdelangue
Cluster ingetclassificationdedocuments

Passagedelar chivagedocumentair elintelligence


collective
1.1Laconnaissancecollective
Passagedelar chivagedocumentairelintelligencecollective
Dans un environnement conomique hautement concurrentiel pour ne pas dire guerrier,
lentreprisequineseproccupepasdestendancesdesonmarch,desnouveauxproduitsetde
sesprincipauxconcurrents,delmergencedenouvellestechnologies,delammorisationde
ses savoirs et de ses savoirfaire, risque vite de subir le mme sort quune poigne de
sauvagesquipsdeflchesetdelancesfaceunhlicoptre
Cest une vidence me direz vousmais tout le problme rside dans notre capacit la
transformer en pratiques et procdures applicables au contexte socioconomique dune
entrepriseetrpartircespratiquestousleschelons.
Quelleconnaissanceprcisedonnequelavantagecomptitifprcis?
Commentsavoircequelonsait,etsurtoutcequelonnesaitpas?
Commentmesurerlavaleurdecequelonsait,etlerisqueencourucausedeceque
lonnesaitpas?
Comment concevoir des organisations qui utilisent effectivement leur patrimoine de
connaissanceetsontcapablesdeleproduirecollectivement,deltendreetdelefaire
vivreenpermanence?
Questionsembrassantes,carilfautreconnatrequedanslentrepriseactuelle,laconnaissance
collective souffre de plusieurs limitations: elle est affecte par les jeux de rles et de
pouvoirs,ellesenlisedanslesroutines,elleestsanscessemenaceparlaperteetparloubli.
Nous pouvons citer le cas dune entreprise grant le domaine routier qui faute dune
mmorisation efficace des plans douvrages et de travaux, se voit oblige, chaque nouvel
ouvrage,dereconduirelafabricationcompltedescartes,depuisleslevstopographiques.
Onpeutciter lexempleduneentreprisedexplorationetproductionptrolirequiparsuite
duneimportanterestructurationdepersonnel aessuyunecatastrophe suruneplateforme,
duelaperteirrversibledeconnaissances(savoirsetsavoirsfaire).
Lorsquuneentreprisesintresse soncapitaldeconnaissance,cestpourseconcentrersur
cedernierentantquepatrimoine.
Dansuntelesprit,la fonctiondocumentation(mmorisation en gnral)devientunecharge
detravailsupplmentaire,administrativeetsansralitconomique.
DeuxpoquesontmarqulhistoiredelaGED :
(Jusquaux environs de 1995), lentreprise tait oblig darchiver et de grer sa
documentation. La solution GED tait trs lourde et trs coteuse. Le march de la
GED tait dcevant et concentr 90% dans les secteurs administrative: banque,
assurance,
(Vers1995etaprs),aumomentdelexpansion desrseaux,dumultimdiaetdela
bureautique laGEDestdevenueconomiqueetstratgique
Cestlmergenceduneentreprise apprenanterecherchantdesgisementsdeproductivit,
desavantagescomptitifs,desfacteursdinnovationetdequalit,traverslamiseenplacede
processusdetravailcollaboratif,decapitalisationetdchangesinformationnels.

Ingnierie documentaire: composante dun systme dinformation et de communication,


intgrantlesderniresavancesdumultimdiaetdestlcommunication.
Lesnouvellestechnologiessontuncomposanttechnologiqueessentieldelacapitalisationde
la connaissance et de lintelligence collective. Loutil ne fait pas le changement mais bien
utilis,ilpeuttreunformidablecatalyseurduchangement.
Aussi, la capitalisation des connaissances se caractrise comme un processus de
transformation des informations, des savoirfaire et des ides acquis dans lexprience, en
rgles de mthodologies gnriques. Le rsultat constitue un gain de productivit pour les
actionsfutures.

1.2Lacapitalisationdesconnaissances
Lacapitalisationdesconnaissancesconsiste identifier,formaliseretconserver lammoire
desactivits lobjectif estderendrecettemmoireaccessible indpendammentdesacteurs
quiloncreetdemanirepertinenteparrapportuncontextedintrtdonn.
Le concept de pertinence voqu est essentiel car il introduit la notion de temps : une
rupturetemporelleconstituesouventunfacteurdepertedeconnaissances.
Parailleurs,lacapitalisationdesconnaissancespasseparunetapedeformalisation,ilfaut
bienvidemmentprendreencomptelefacteur cot.
La question de la capitalisation des connaissances renvoie une srie dinterrogations
relativeslaqualificationdesgrainslmentairesdeconnaissances:
Quellesconnaissancesdoitoncapitaliser?
Comment sassurer que les critres de capitalisation (filtres, choix des documents
rfrentiels, choix des descripteurs,) daujourdhui correspondront aux
proccupationsdedemain ?
Quelleestlademivieduneconnaissance?
Nous pouvons noter que la cration de savoirs et de savoir faire seffectue dans laction et
souventdemanirecollaborative.
Nouspouvonsdistinguer:
Lesfluxentrants:informationacquisedelextrieur,
Lesfluxsortants:informationproduiteparlentrepriseetdiffuselattention deses
clients,pourfaireconnatresessavoirfaire,
Les flux internes, qui concernent les processus de communication lintrieur de
lorganisation.
Ds lors,lentrepriseapprenante nestplusseulementcellequisaitstocker saconnaissance,
mais celle qui se dote de dispositifs permettant aux acteurs dchanger, de partager, de
collaborer,enpermanenceleursreprsentationsetdefabriquer,parlejeudeleursinteractions
unsenscommun.

1.3Linfor mationetlconomie
Uncertainnombredtudesrelativesaupoidsconomiquedelinformationdanslentreprise
ont t publies rcemment ces tudes paraissent minemment discutables dans leur
mthode:
80%desinformationsquicirculentdanslentreprisesontsouslaformededocuments
htrognesetnonstructurs.
Un cadre traite plus de 1500pages par an, avec une croissance annuelle de plus de
10%etconsacreplusde50%desontempslireetcrire.

40%deslancementsdeproduitssontretardsenraisondemanquedinformationou
dedocumentation.
90%delinformationestproduitesansmthodologie.
La rvolution bureautique a certainement contribu une amlioration des changes
informationnelles en obligeant les producteurs dinformations un effort de structuration
(tableurs, SGBD) et ce aubnfice de la comprhension et de lexploitation des documents
produits.
Maiselleacommeeffet secondaireunecroissanceexponentielle,noncontrle,duvolume
des informations publies. Un effet contraire a t escompt : la majorit des organisations
sont dans limpossibilit de lutiliser avec efficacit. Les documentalistes qui avaient peur
dInternetseretrouvedansdespositionsstratgiques.
Lesavoirestreconnucommemoteurdelaproductivitetdelacroissanceconomique.
Aussi, la problmatique de la gestion collaborative des connaissances tant implicitement
contenuedansdesmthodesplusexplicitestellesquelagestiondeprojet,lemanagementdes
processus,

1.4LesNouvellesTechnologiesdelInfor mationetdelaCommunication
(NTIC)
Lespremirestentativesdecapitalisationdocumentairedesannes80avaienttdcevantes.
Trscoteuses,fondssurdessystmesfermsetcompliqus,lesapplicationslectroniques
ddies la gestion documentaire navaient trouv leur place que dans les secteurs des
administrationsoudanslemondebanquefinanceassurance.
AlammepoquelesSIcommenaientmontrerleurslimites:troprigides,tropstructurs,
de dveloppement trop lent, pour satisfaire des systmes de plus en plus volutifs,
complexesetflous.
Enfin, lIA ambitionnant de modliser les connaissances de lexpert, passait par un
embotement de modles qui appauvrissait et dcontextualisait tellement la richesse de son
systmedereprsentation,quelleestrestecantonnelarsolutiondeproblmesrationnels
etreproductibles.
Lesannes9395untournantdansledveloppementtechnologique:
Ledocumentlectroniqueestdevenumultimdia.
Lesnouvellesmmoiresoptiquesetmagntiques,(unCDROMpeutcontenirplusde
200000pagesdetexte.
Lesstandards,protocolesetsystmesdexploitationautorisantleschangesinterplate
forme.
LesIHMsesontsimplifies.
Les technologies informatiques, de tlcommunication et daudivisuel se sont
fusionnes.
Lagnralisationdesrseauxaabolilesdistancesetlesdlais.

Lamiseenplacedunegestionnumr iquede
documents(GED)
2.1Intr oduction
Aujourdhui,laGEDestdevenueunecomposantedessystmesdinformationdesentreprises
dans lesquels elle introduit des fonctions de gestion ou de traitement de documents
vivants,quiviennentseconderlesapplicatifsetlesprogrammesbureautiques.
La mise en place dun systme GED doit tre mene comme un projet, avec une
mthodologieetunmodedepilotageappropris.

2.2Mthodedepilotagedunpr ojetdeGED
QuelestlobjectifdevotreGED?
Estceunobjectifdarchivage,degestiondedocumentrfrentiel?Estceunephotothque,
unegestiondedocumentstechniques?Estceunegestiondedocumentsvivantsetdeflux ?
UnprojetGEDnesersumepasunesimpleacquisitionetinstallationdunoutiloubienle
risquederreuresttrsgrand.
Il est indispensable de faire prcder la mise en place de loutil de GED par une analyse
pralabledefaisabilittechniqueetconomique,quelonpourraitgalementnommer audit
dedfinition .Ellecomprendralespartiessuivantes:

Pr incipesfondateur s
LesprincipesfondateursduprojetdemiseenplaceduneGEDsontnumrscommesuit:

Identificationduprojet
o Quelestlenomduprojet
o Quelleestlaraisondtre?quelleestlaproblmatique,lasource,lesbutset
effetsrecherchs?
o Quisontlescommanditaires,lespartiesprenantes,dequelssoutiensleprojet
vatilbnficier?
o Leprojetsappuietilsurdestudes,constats,
o DansqueldomaineglobalsesitueleprojetdeGED?
ObjetettypologieduprojetGED
Phasageduprojet
Constitutiondugroupeprojet
o Lepilotagestratgique
o Lepilotageoprationnel
o Lepilotagetechnique
Communicationautourduprojet
o Directiongnrale
o Encadrementsuprieur
o Encadrementintermdiaire

Analyseparlesusages
Lanalysedesusagesestexprimepar :
Expressiondesattentes

Analysedelexistant
Dfinitiondescritresdeperformances
Environnementetcontraintes
Budgetetchancier
Rglesdadministration

Conceptiondunmodulepilote

Descriptiondelactivit
Modlisationdesconnaissancesetdesflux
Mtiersdeproductiondocumentaire
Rglesdadministrationetdescurit

Analysedeloffr e
LaGEDbureautiquegrelesdocumentsbureautiquesvivantsdelentreprise,sous
leurformedchangeetdefluxentrelespostesdetravailproducteurs
LaGEDdocumentairegrelesdocumentsderfrencedelentreprise.Lobjectifest
de constituer une mmoire organisationnelle qui perdure audel des acteurs et des
contextes. A cet effet, elle doit constituer un langage dindexation gnralement au
travers dun thsaurus, qui soit la fois suffisamment gnrique pour que la
smantique soit partage par tout le monde, et suffisamment spcifique pour que le
moteurderecherchesoitprcisetpertinent.Leprocessusdindexationdedocuments
esttrslourdpourlecasdeGEDdocumentaire.
LaGEDCOLD(ComputerOutputLaserDisc)regroupelesdocumentsgnrspar
lesordinateurscentrauxoudessystmestransactionnels.
La GED image regroupe toutes les applications de GED de documents numriss.
On peut numriser des documents laide de scanners, importer des fichiers dj
existants
LaGEDmodulaireoucomposantscettecatgorierecouvredesmoduleslogiciels
intgrables des applications au travers doutils de dveloppement comme visual
basic, visual C++. Ils sadressent aux programmeurs et aux socits de services
informatiquesdsirantajouterdesfonctionsdeGEDleurslogiciels.Onytrouvedes
modules de numrisation et de traitement de documents, dextraction dinformation
par OCR reconnaissance otique de caractres ou de marques, dindexation
automatique par lectures de codes barres, dexportation dindex vers des bases de
donnesdegestiondestockagedesimagesnumrises.
Le workflow, sous ce terme sont regroups les outils automatisant la circulation de
documentsoudinformationsselondesprocduresprcises.Leslogicielsdeworkflow
sont souvent associs aux programmes de GED, notamment dans toutes les
applicationsdetraitementdedossierointerviennentplusieurspersonnes.
Louverture de la GED et du workflow sur internet et intranet: La GED et le
workflow ne restent pas lcart des possibilts offertes par les rseaux Internet et
intranet. Certains diteurs de programmes GED ont dores et dj conu des
passerelles entre leurs logiciels et la consultation via ces rseaux. La premire tape
consiste donner lutilisateur la possibilit dinterroger partir dun micro muni
duneconnexioninternet,lesbasesdedonnesouderfrencesdedocumentsoudes
fichiers grs par le programme GED. Les rsultats des recherches est converti au
format HTML etest affich sur le navigateur. Les images elles mmes peuventtre
rcupresetaffiches.

Maquette
Bilanetdcision

Вам также может понравиться