Вы находитесь на странице: 1из 37

Livre blanc

www.afnor.org

ISO 25964-1 - Thsaurus pour la recherche documentaire


Edition Janvier 2013
Sylvie Dalbin, Nathalie Yakovleff, Hlne Zysman. Avec la collaboration de Franois Feyler, Roselyne Bloch, Michle Lnard, Katell Briatte.

DOCUMENT PROTG PAR LE DROIT D'AUTEUR

Livre blanc ISO 25964-1 Thsaurus pour la recherche documentaire Sommaire


Prambule 1 - Enjeux et contexte 2 3

1.1. volution des usages des thsaurus ........................................................................................... 3 1.2. Pourquoi normaliser sur ce domaine ? Pourquoi une nouvelle norme ? ..................................... 3 1.3. Primtre et contexte de la norme ISO 25964 ............................................................................. 4 1.4. Une norme en deux volets ........................................................................................................... 5

2 - Prsentation gnrale de la Partie 1 de la norme ISO 25964

2.1. Termes, dfinitions et symboles ................................................................................................... 6 2.2. Smantique mtier : construire et maintenir un vocabulaire structur ......................................... 7 2.3. Smantique technique : modle de donnes, schma XML et documentation technique .......... 7

3 - Composants d'un thsaurus

3.1.Thsaurus ...................................................................................................................................... 9 3.2. Concepts .................................................................................................................................... 10 3.3. Termes ........................................................................................................................................ 12 3.4. Relations ..................................................................................................................................... 14 3.5. Regroupement de concepts : thmes et facettes ....................................................................... 16 3.6. Multiculturalisme et multilinguisme ............................................................................................. 20

4 - Usages du thsaurus et de ses composants

21

4.1. Prsentation des thsaurus pour consultation ........................................................................... 21 4.2. Intgration des thsaurus des applications ............................................................................. 23 4.3. Formats d'change et protocoles ............................................................................................... 23 4.4. Conception, gestion et maintenance .......................................................................................... 24

5 - Conclusion : Que faire ? Comment faire ? Annexes

25 26

Annexe 1 : Lexique Anglais-Franais du vocabulaire de la norme ................................................... 26 Annexe 2 : Tableau partiel des symboles et sigles............................................................................ 31 Annexe 3 : Modlisation entits-relations quelques repres ......................................................... 32 Annexe 4 : Ressources bibliographiques .......................................................................................... 35 Annexe 5 : Organisation de la production de la norme ISO 25964 ................................................... 36

Prambule
Ce Livre Blanc propose la communaut francophone une prsentation gnrale de la Partie 1 de la norme ISO 25964-1 - Thsaurus pour la recherche d'information parue officiellement, dans sa version anglaise, en aot 2011. La norme ISO 25964-1:2011 La nouvelle norme ISO 25964-1:2011 annule les deux anciennes normes internationales ISO 2786:1986 (thsaurus monolingue) et ISO 5964:1985 (thsaurus multilingue), ainsi que les normes franaises NF Z47-100:1981 (thsaurus monolingue) et NF Z47-101:1990 (thsaurus multilingue). La norme ISO 25964-1:2011 fournit des directives et des recommandations applicables la conception et la gestion des thsaurus monolingues et multilingues ainsi qu' leur mise en forme afin d'optimiser leur exploitation dans des applications et sur les rseaux. Comment lire ce Livre Blanc Ce Livre Blanc expose les grandes lignes et les nouveauts d'un guide mtier de 180 pages. Son objectif est de fournir avant tout une vue synthtique de ce document de norme l'attention de professionnels ayant dj une connaissance des outils d'organisation que sont les thsaurus, taxonomies, classification, vocabulaires contrls en gnral : professionnels de l'informationdocumentation, informaticiens en charge de dispositifs d'accs l'information, architectes de l'information, . Ce nest pas un guide pratique ou mthodologique de cration ou de mise jour de thsaurus. La slection des directives et recommandations de la norme, exposes dans ce Livre Blanc aussi bien que l'organisation et le format de ce document, visent plutt une prise de conscience par les acteurs les plus impliqus dans les systmes documentaires, des enjeux smantiques et techniques actuels et leur fournir des pistes sur les actions mener dans le moyen terme. Motiver la communaut pour porter un projet de traduction en franais de la norme est le deuxime objectif de ce Livre Blanc. Le Livre Blanc de la norme ISO 25964-1 met en exergue les points saillants de la norme et prcise lorsque cela s'avre important pour la communaut francophone, leur caractre obligatoire. Chaque chapitre de ce Livre Blanc fait rfrence des parties prcises de la norme et en expose les pointscls. Les caractristiques plus techniques (appeles dans le Livre Blanc smantique technique) sont exposes dans un sous-chapitre ddi > Modle de donnes ISO 25964-1 .

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

1 - Enjeux et contexte
1.1. volution des usages des thsaurus
Lhistoire des premires normes pour le dveloppement des thsaurus est troitement lie une utilisation humaine de thsaurus sur support papier. Les thsaurus sur support papier ont progressivement cd la place aux thsaurus actuels exploits essentiellement dans des dispositifs informatiques pour l'indexation et la recherche, ou comme ressource terminologique en consultation. labors et maintenus partir de logiciels ou modules spcialiss, les thsaurus sont exploits par dautres logiciels ou applications tels que des moteurs de recherche ou des systmes de gestion de contenu. Conus initialement pour des professionnels forms lindexation et la recherche ou pour des spcialistes ayant une expertise dans le domaine de connaissances couvert, les thsaurus doivent aujourd'hui rpondre de plus en plus aux besoins et pratiques d'utilisateurs non entrans et/ou ayant des connaissances moins affirmes dans le domaine trait. La recherche fdre conduit quant elle manipuler des ressources d'origines et de natures diverses pouvant tre traites selon des protocoles et/ou des vocabulaires diffrents. Plus rcemment, la suite du dveloppement des technologies du Web, les thsaurus sont mis profit dans les systmes terminologiques permettant des machines deffectuer des infrences. Les consquences de ces volutions portent aussi bien sur les caractristiques conceptuelles, terminologiques ou structurelles des thsaurus eux-mmes, sur leur place par rapport d'autres outils smantiques telles que les classifications ou les ontologies, ainsi que sur les modalits de conception et d'intgration dans les systmes documentaires.

1.2. Pourquoi normaliser sur ce domaine ? Pourquoi une nouvelle norme ?


L'application des normes dans diffrents domaines de lactivit humaine comme l'nergie, le transport ou la construction, est considre comme essentielle et jamais remise en question. Mais il semble plus difficile de percevoir lintrt de standardiser un niveau international, des composantes non 1 informatises des systmes d'information ou qui apparaissent comme telles. Pourtant, depuis une quinzaine d'annes se sont dveloppes des pratiques de normalisation dans les activits de management ou sur des aspects mthodologiques des systmes d'information considrs comme des lments-cls de leur performance telles que l'ergonomie ou les dmarches qualit. A ce critre li au primtre mme des normes, s'ajoute la prise en compte d'une situation nouvelle : la propagation du phnomne de numrisation et le dploiement en masse d'informatisation numrique auxquelles nous assistons conduit la multiplication des changes et des flux d'information sur les rseaux et entre les systmes d'information. Ce nouveau contexte rend indispensable le dveloppement de rgles 2 communes sous la forme de normes et de standards adapts la reprsentation, au transfert, l'accs et la rutilisation des connaissances. C'est dans ce contexte que se place cette norme sur les thsaurus.

1 2

Voir Michle Hudon, ISKO 2011 Le terme norme ou norme technique est souvent rserv en particulier en France, une "Spcification technique approuve par un organisme reconnu activit normative pour application rpte ou continue, dont l'observation n'est pas obligatoire" [au sens de la directive 2004/18/CE du Parlement europen et du Conseil (et directive 2004/17/CE). Il se distingue alors du terme standard , dont les spcifications simposent par le march.

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Le thsaurus faisait dj l'objet de documents normatifs depuis les annes 1970 (voir Annexe 4). Mais alors mme que les usages et les technologies voluaient, on ne pouvait que constater l'absence de rigueur dans la maintenance de ces normes, en particulier au niveau international. Initi par la 3 Grande-Bretagne rejointe en 2007 par plusieurs pays au sein du groupe de travail TC46/SC9/WG8 de lISO, ce travail de refonte des normes sur les thsaurus mono- et multilingues devenait indispensable.

La norme ISO 25964:2011 offre la transition ncessaire au monde de la communication numrique de l'information. Tout en restant en harmonie avec les normes et les systmes plus anciens, elle offre un cadre normatif pour faire voluer l'existant et pour dvelopper des outils adapts aux situations actuelles.

1.3. Primtre et contexte de la norme ISO 25964


1. Primtre et contenu de la norme ISO 25964 La norme ISO 25964 s'applique : des vocabulaires composs de termes reprsentant des concepts et/ou des sujets ; des vocabulaires structurs organisant ces ensembles de concepts et de termes entre eux ; des vocabulaires utilisables lors de processus de recherche d'information ; quel que soit le type de ressources dinformation et quel que soit le support utilis (texte, son, image fixe ou anime, objet physique ou multimdia) ; y compris les bases de connaissances et les portails, les bases de donnes bibliographiques, les bases de textes, les collections de muses ou les collections multimdias, et pour retrouver des lments au sein de ces collections. 2. Contexte de production de la nouvelle norme Les fondements de ces vocabulaires (rpertoires de concepts, termes reprsentant les concepts, hirarchie entre concepts,...) et leur dveloppement tels qu'exposs dans les documents normatifs des annes 1980 restent valables. Mais l'utilisation des thsaurus comme outils de reprage et d'accs l'information pour des collections aujourd'hui numriques, la varit de leurs contextes d'application et des contraintes qui en dcoulent, en particulier l'exigence d'interoprabilit entre plusieurs applications en rseau, ainsi que les fonctionnalits requises pour rpondre cette diversit d'applications ont fortement volu, rendant ces documents normatifs difficiles d'exploitation. Ce constat a pouss le groupe ISO en charge des travaux normatifs procder une rvision en profondeur des anciennes normes du domaine, tout en sappuyant sur celles-ci. Ces anciennes normes, matire premire de ce travail international et francophone, sont issues de quatre sources principales : Les normes internationales : ISO 2788:1986 (monolingue) et ISO 5964:1985 (multilingue) ; Les normes franaises NF Z47-100:1981 (monolingue) et NF Z47-101:1990 (multilingue) ; La norme BS 8723 dveloppe plus rcemment entre 2000 et 2007, qui a servi de base au projet de norme dans le processus ISO ; Enfin la norme ANSI/NISO Z39.50:2005. Les travaux initis en 2008 ont t raliss au sein du Groupe de travail ISO WG8 du TC46/SC9, pilot par Stella Dextre Clarke. Le groupe ISO s'est donn un cadre de travail prcis combinant :

LAnnexe 5 fournit des prcisions sur lorganisation des travaux raliss au niveau ISO et limplication du Groupe de travail franais rattach la commission Afnor/GC46/CN357 Modlisation, production et accs aux documents.

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Une grande ouverture sur les usages et les technologies les plus rcentes dont le Web de donnes, d'o un modle de donnes (normatif) associ une documentation technique destination des dveloppeurs (informatif). Une filiation visible avec les normes plus anciennes. Le choix s'est port sur un texte la fois normatif et explicatif ou plus descriptif. Ainsi la norme distingue les rgles qui doivent ( must ), peuvent ( should ) ou pourraient ( could ) tre appliques.

1.4. Une norme en deux volets


La norme ISO 25964 est constitue de deux parties distinctes mais interdpendantes. La Partie 1 - Thsaurus et recherche dinformation offre des directives et recommandations pour le dveloppement et la gestion de vocabulaires structurs utilisables pour la recherche dinformation. Cette partie 1 - qui fait l'objet du prsent Livre Blanc - a t officiellement publie en aot 2011. La Partie 2 - Interoprabilit avec les autres vocabulaires propose des solutions pour lutilisation simultane de plusieurs langages contrls pour accder de trs larges collections de ressources distribues sur de multiples rseaux, rapidement, efficacement, et dans la langue choisie par le chercheur dinformation. Le projet de norme de cette partie 2 devrait tre publie dbut 2013. Le processus de mise jour des normes ISO prvoit une rvision tous les 5 ans.
4

Sur le site de lISO : http://www.iso.org/iso/fr/home/store/catalogue_tc/catalogue_detail.htm?csnumber=53658&commid=48836

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

2 - Prsentation gnrale de la Partie 1 de la norme ISO 25964


La Partie 1 de la norme ISO 25964 publie en aot 2011 est compose de 5 18 chapitres appels Clauses dans le document normatif, 2 annexes informatives contenant des exemples d'extraits de thsaurus ainsi que le schma XML, 6 une bibliographie de 69 rfrences et un index . Ces 18 chapitres peuvent tre scinds en deux grands volets que nous appellerons dans ce Livre Blanc : smantique mtier et smantique technique . La smantique mtier renvoie la construction du thsaurus en tant qu'outil smantique et terminologique d'un systme de recherche d'information : pourquoi (contrler le langage humain pour optimiser la recherche d'information), quoi (choisir et caractriser des concepts, des termes et leurs relations), comment (prsenter et grer ces rseaux smantiques et terminologiques qui composent un thsaurus). La smantique technique renvoie quant elle la modlisation des systmes d'information (modle de donnes et diagramme UML, schma XML et documentation technique). Remarques : Dans dautres secteurs comme la terminologie TC37, ce dcoupage correspond deux sries de normes distinctes, regroupes ici dans un seul document normatif.

2.1. Termes, dfinitions et symboles


ISO 25964-1, Clause 2 Terms and Definitions ; p.1-12 ISO 25964-1, Clause 3 - Symbols, abbreviated terms and other conventions, p.12-15

69 termes utiliss dans la norme sont dfinis et intgrs dans la Clause 2, chapitre traditionnel des normes intitul Termes et Dfinitions . Le lexique bilingue propos en Annexe 1 de ce Livre Blanc reprend l'ensemble de ce vocabulaire propos uniquement en anglais dans la norme. Un important travail a t ralis au niveau national et international pour slectionner les concepts intgrer cette liste, sassurer que leur signification tait bien partage, choisir le ou les termes les reprsentant, et rdiger des dfinitions qui tiennent compte du contenu de la norme et d'un ensemble tendu de pratiques et cultures. Le groupe francophone a travaill sur la traduction franaise des concepts cls - ainsi que sur les exemples de la norme - ds le dbut du projet et tout au long de la rdaction de cette premire partie, ceci en vue de faciliter la production de ce lexique et de diminuer les difficults de traduction ultrieure. Concernant les symboles et abrviations utiliss pour reprsenter des lments descriptifs (i.e. Note explicative = NE), des relations (i.e. Terme spcifique d'instance = TSI) ou certains codes comme les catgories de groupes de concepts, la norme propose un tableau complet des symboles utiles en langue anglaise. Ce tableau est complt pour certains de ces symboles par d'autres versions linguistiques dont le franais (voir Annexe 2). Notons que le groupe ISO en charge de ces travaux n'a pas souhait procder trop de modifications par rapport aux pratiques existantes et a conserv, par
5

Clause : Disposition particulire d'un acte (http://www.cnrtl.fr/definition/clause). Nous conserverons dans ce Livre Blanc la dnomination de Clause pour tous les renvois la norme ISO 25964 ; le terme chapitre sera rserv la structure du Livre Blanc. Complte par des ressources en ligne cette adresse http://www.niso.org/schemas/iso25964/

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

exemple pour les relations entre concepts et termes, les codes dj connus tel que le code TS (Terme spcifique) pour dsigner la relation hirarchique de subordination entre deux concepts (et de fait pour dsigner la relation entre les deux termes les reprsentant).

2.2. Smantique mtier : construire et maintenir un vocabulaire structur


La structure et le contenu de la norme en termes de smantique mtier restent trs proches du contenu des normes ISO 2788:1986 et 5964:1995, et assez proches des normes franaises. Ainsi, aucune modification majeure nest signaler dans les clauses touchant aux concepts reprsents et leurs traitements, aux termes (slection, forme, mthodes de dsambigusation des termes homographes) ou encore la structure relationnelle conceptuelle et terminologique. Par contre, des prcisions et des enrichissements ont t apports, et plusieurs parties nouvelles sont proposes. Le document a galement t enrichi d'exemples. Quant aux nouvelles clauses, celles-ci portent sur : les quivalences conceptuelles dans les thsaurus multilingues (Clause 9), lanalyse par facettes (Clause 11), la prsentation et l'affichage des thsaurus (Clause 12), la gestion des thsaurus (Clause 13) et des recommandations concernant les logiciels pour la gestion des thsaurus (Clause 14).

2.3. Smantique technique : modle de donnes, schma XML et documentation technique


La plus grande nouveaut vient de l'intgration de plusieurs chapitres ou supports techniques en vue de faciliter et stimuler l'utilisation et le dveloppement des applications informatiques et en rseau. Cette matire nouvelle se prsente sous la forme de trois parties spcifiques et d'un certain nombre d'outils techniques destination des concepteurs et dveloppeurs d'applications et de logiciels : Trois nouvelles Clauses (normatives) portant sur l'intgration de thsaurus dans les applications (Clause 16), les formats d'change (Clause 17) et les protocoles (Clause 18) ont t ajoutes. Celles-ci rendent compte de l'importance de la place prise par les thsaurus dans les systmes de recherche d'information. Un modle de donnes (normatif), prsent sous la forme d'un diagramme UML et de tableaux dtaills pour chacune des classes du modle, fait l'objet de la Clause 15. Suivant les rgles des 7 diagrammes de classe UML , le modle de donnes s'exprime travers un ensemble de classes, chacune reprsentant un des composants-cls du thsaurus : Thesaurus, ThesaurusConcept, ThesaurusTerm, ConceptGroup, ThesaurusArray, Note. Chaque classe est enrichie d'attributs et de relations avec d'autres classes. Les lments lis au modle de donnes sont rpartis dans chaque chapitre de ce Livre Blanc dans une section ddie (> Modle de donnes ISO 25964-1). (Pour des repres sur UML, voir lAnnexe 3 de ce Livre Blanc). Un schma XML (informatif) le choix s'est port sur un schma XML plat (plutt qu'un schma XML imbriqu). Le schma peut tre tendu en fonction de l'intrt de la communaut concerne suivant deux axes : lajouts de contraintes d'intgrit rfrentielle dans le cas de l'change d'un thsaurus complet et lajout d'attributs personnaliss pour pouvoir effectuer des changes partiels. La documentation (informatif) du schma au format HTML et un document test sont associs au schma XML. Les outils complmentaires au document normatif sont disponibles sur le site du NISO . Cette documentation caractre technique devrait faciliter le dploiement d'applications conformes aux directives de la norme.
7 8

Diagramme UML. Voir Annexe 3 et http://fr.wikipedia.org/wiki/Diagramme_de_classes Rubrique ISO25964 sur le site du NISO - http://www.niso.org/schemas/iso25964/schema-intro

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

3 - Composants d'un thsaurus


La conception et la construction d'un thsaurus en tant que structure organise de concepts et de termes sont exposes dans huit (8) clauses de la norme ISO 25964-1. Le graphique prsent dans la Figure 1 est un schma trs simplifi du modle de donnes propos 9 dans la norme . Il offre une vision globale des composants principaux d'un thsaurus qui font chacun l'objet d'une section particulire de ce Chapitre 3. Le Thsaurus (Chapitre 3.1.) Les Concepts (Chapitre 3.2.) Les Termes (Chapitre 3.3.) Les Relations entre concepts et entre concepts et termes (Chapitre 3.4.) Les Regroupements de concepts thmatiques ou par facettes (Chapitre 3.5) Nous ajouterons ces composants une section sur les aspects multiculturels et linguistiques prsents dans un thsaurus (Chapitre 3.6) FIGURE 1 Schma simplifi du modle de donnes ISO 25964-1:2011

Lien vers le Schma XML (http://www.niso.org/schemas/iso25964/schema-intro/) et le modle de donnes (http://www.niso.org/schemas/iso25964/Model_2011-06-02.jpg).

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

3.1.Thsaurus
ISO 25964-1, Table 4 Attributes and associations of Thesaurus, p.110

La norme ISO 25964-1 fournit des directives et recommandations pour traiter le thsaurus comme un objet part entire. Le thsaurus dispose ainsi dans la nouvelle norme d'un ensemble dattributs, pour la plupart les lments du format normalis de description du Dublin Core, permettant de le dcrire, de le grer et de le positionner dans un ensemble dautres thsaurus. D'autres lments (non obligatoires) permettent de tracer son volution dans le temps.
Exemple (non prsent dans la norme ISO 25964-1) Titre Thsaurus Sant publique Identifiant URL:http://asp.bdsp.ehesp.fr/Thesaurus/ Contributeur Rseau BDSP Editeur cole des hautes tudes en sant publique (EHESP) Banque de donnes en sant publique (BDSP) Date 2007 Date (cration) 1992 Date (modification) 2007 Version v4 Langue fra Type thsaurus Primtre 614-Sant publique (Dewey) Sujet sant ; politique publique ; systme de soin ; pathologie ; pidmiologie ; Description Thsaurus exploit dans le cadre de la banque de donnes bibliographique BDSP dveloppe par le rseau BDSP (France). La version 2007 comporte 12 825 entres terminologiques organiss en 57 micro-thesaurus. Droits Droit dusage limit une utilisation strictement non commerciale Format pdf, txt, html

> Modle de donnes ISO 25964-1 L'objet Thsaurus est lui-mme considr comme une classe dans le modle de donnes. La classe Thesaurus reprend l'ensemble des 15 attributs du Dublin Core (version 1.1. de 2006) : Identifiant (obligatoire) ; Titre ; Langue (obligatoire) ; Date (permet de grer les mises jour) ; Droits ; Domaine dapplication Cette liste est ouverte la personnalisation : il est tout fait possible dajouter un attribut qui ne soit pas list dans la norme, par exemple une relation vers un autre vocabulaire auquel ce thsaurus serait reli, ou encore la liste des systmes ou bases de ressources dans lesquels ce thsaurus est exploit. La classe Thesaurus est elle-mme associe plusieurs autres classes : la classe Historique des versions ( VersionHistory ), une nouvelle version correspondant un changement dans la structure conceptuelle du thsaurus ; la classe des Concepts du thsaurus ( ThesaurusConcept ) voir 3.2 la classe de Groupes de concepts ( ConceptGroup ) 3.5 1. la classe des Regroupements par facettes ( ThesaurusArray ) voir 3.5.2. Ces trois dernires classes (concepts, groupes de concepts et facettes) sont des parties du Thesaurus (relation isPartOf/contains). Le modle de donnes impose a minima : un identifiant, la/les langues couvertes par le thsaurus, ainsi que des concepts de la classe ThesaurusConcept. Ces lments (identifiant, langue, concepts) correspondent la reprsentation minimale d'un thsaurus.
11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

3.2. Concepts
Une des volutions fondamentales de la norme ISO 25964 porte sur la distinction formalise entre d'une part les concepts et d'autre part les termes les reprsentant. Concepts et termes font l'objet de recommandations cibles dcrites dans des Clauses particulires (Clause 5 Concepts et Clause 6 Terms) et d'un formalisme particulier dans le modle de donnes.

3.2.1. Le thsaurus : une slection de concepts


ISO 25964-1, Clause 5 Concepts - p. 18-21 ISO 25964-1, Table 6 Attributes and associations of ThesaurusConcept, p.112-113 ISO 25964, Table 9 Attributes and associations of Note, p.115

Le thsaurus regroupe une slection de concepts d'un domaine (de spcialit ou d'activits) permettant de formuler les sujets reprsents dans des ressources ou des questions, relevant de ce domaine de spcialit. Les caractristiques principales des concepts reprennent celles nonces dans les versions prcdentes de la norme sur les thsaurus : Les catgories gnrales des concepts prsents dans un thsaurus peuvent tre : des objets et leurs caractristiques physiques, des matriaux, activits et processus, des vnements et faits, des caractristiques (proprits) de personnes, objets, matriaux ou actions, des disciplines ou domaines de spcialit (subject field), des units de mesure, types de personnes et organismes ainsi que des entits individuelles telles que des noms propres (lieux, objets spcifiques, nom de personnes ou d'organismes) ; 10 La note explicative dfinit ou clarifie le primtre smantique du concept tel que dfini dans le vocabulaire contrl. Elle se distingue donc d'une dfinition. D'autres types de note paramtrables sont proposes (dfinition, note ditoriale, ). La norme insiste sur la ncessit de prendre en compte les particularits linguistiques ou culturelles de lenvironnement dutilisation du thsaurus (voir chapitre 3.6). Toutefois, l'organisation conceptuelle du thsaurus prise en charge dans la Partie 1 de la norme ISO 25964-1 repose sur une structure symtrique quelles que soient les langues ou les cultures. Dans le cas o le thsaurus admet des 11 relations non-symtriques entre langues ou cultures, la partie 1 de la norme renvoie la partie 2 pour un traitement par le biais de mthodes d'alignement entre vocabulaires (Clause 10.2.6.). Les concepts au coeur du thsaurus sont relis : d'autres concepts par des relations hirarchiques et associatives, formant ainsi un rseau de concepts (voir chapitre 3.4.) des termes : un seul terme de type prfrentiel et autant de termes non prfrentiels que souhaits (voir chapitre 3.3) ; d'autres concepts par des relations d'une autre nature que les relations hirarchiques ou associatives : les relations thmatiques ou par facettes (voir chapitre 3.5.). > Modle de donnes ISO 25964-1 Le modle de donnes propose une classe spcifique pour reprsenter les concepts, distincte de la
10

Le terme note explicative tait utilis dans la norme ISO 2788 en franais pour ce qui se nommait dans la norme Afnor NF47-100, note d'application (NA). Note explicative (NE) est le terme conserv dans cette norme de 2011. Mais d'autres dsignations sont toutefois possibles : note d'emploi, note d'application. La publication de la partie 2 de la norme est prvue pour fin 2012. Une enqute publique a t lance entre janvier et avril 2012.

11

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

reprsentation du rseau des termes : la classe ThesaurusConcept caractrise par une slection de proprits - identifiant, date de cration et modification, statut (candidat, approuv, ), notation... Les seuls lments imposs par la norme sont : un identifiant unique par concept et au minimum un terme prfrentiel par langue. Ces lments correspondent la reprsentation minimale d'un thsaurus comme rseau de concepts reprsents par des termes (voir Chapitre 3.3. Termes de ce Livre Blanc).

3.2.2. Traitement des concepts complexes


ISO 25964-1, Clause 7 Concepts complexes p.37-44 ISO 25964-1, Clause 8.5. Representation of complex concepts by a combination of terms p.49-50

Un thsaurus peut intgrer des concepts dont le niveau de complexit peut varier. On distingue ainsi les concepts dits simples (par exemple hpital ou logiciel ) des concepts dits complexes dans le sens o ils articulent en leur sein des concepts lmentaires : hpital pour enfants , logiciel de gestion de thsaurus ou biodgradabilit . Une des questions rcurrentes lors de la conception et la maintenance des thsaurus porte sur le degr de prcision ou de gnralit dployer. Par exemple, le thsaurus devra-t-il intgrer tous les types de logiciels sujets des ressources documentaires traites ou ceux faisant l'objet d'une question d'utilisateur, ou bien conserver uniquement les concepts lmentaires logiciel , gestion et thsaurus , ou encore logiciel de gestion et thsaurus - le concept logiciel de gestion de thsaurus tant alors form au moment de l'indexation ou de la recherche par la combinaison des concepts lmentaires. La Clause 7 entirement ddie cette question, introduit la problmatique et fournit des directives et des recommandations pour l'intgration ou le rejet d'un concept complexe, tablies selon certains critres prcis (Clause 7.3.2) ou dans des cas d'utilisation particuliers (Clause 7.3.3. et 7.3.4.). > Modle de donnes ISO 25964-1 Le mcanisme du renvoi d'un concept vers plusieurs autres concepts vise assister un utilisateur posant sa question ou cherchant indexer un concept, ce dernier n'ayant pas t slectionn comme concept du thsaurus. Ce principe de renvoi existait dans les anciennes normes mais n'tait visible que dans les impressions papier des thsaurus utilis alors par les indexeurs, ce mcanisme ntant peu prs jamais implant dans les applications de recherche documentaire. La solution propose dans la nouvelle norme reste dans la continuit des anciennes normes. Elle repose sur la cration dune relation dquivalence combine au niveau des termes (voir chapitre 3.3), et non des concepts. Ainsi logiciel de gestion de thsaurus nest pas un concept du Thsaurus, mais un type particulier de terme : un terme non prfrentiel scind (SplitNonPreferredTerm) reli deux entres du thsaurus par une relation dquivalence particulire appele quivalence compose (CompoundEquivalence).
Exemples - Thesaurus d'thique des sciences de la vie Logiciel de gestion de thsaurus = EM Logiciel de gestion + Thsaurus ou : logiciel de gestion de thsaurus : EM+ Logiciel de gestion, Thsaurus Dans le thsaurus en ligne Ethique des Sciences de la vie
12

12

http://www2.drze.de/BELIT/thesaurus/suchergebnis.html?la=fr&begriff=rein

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

3.3. Termes
ISO 25964-1, Clause 6 Thesaurus terms p.21-37 ISO 25964-1, Clause 8 The equivalence relationship, in a monolingual context, pp.44-50 ISO 25964-1, Table 8 Attributes and associations of ThesaurusTerm, p.114 ISO 25964, Table 9 Attributes and associations of Note, p.115

Les termes comme expressions linguistiques d'une langue, reprsentent les concepts et sont relis ces derniers par une relation approprie. Les directives ou recommandations concernant les termes, leur slection, leur forme ou les mthodes de dsambigusation reprennent celles nonces dans les versions prcdentes de la norme : Un terme peut tre un mot ou un groupe de mots ; Des rgles de dsambigusation (qualificateur pour les homonymes, ajout de notes explicatives,...), ainsi que des rgles pour choisir la forme des termes doivent tre appliques de faon cohrente sur l'ensemble du thsaurus ; Un terme prfrentiel par concept et par langue doit tre slectionn ; Une relation d'quivalence est tablie entre des termes non prfrentiels et un terme prfrentiel. Quelques nouveauts ou prcisions ont t introduites pour tenir compte de la diversit des contextes de dveloppement des thsaurus : Une dfinition ainsi quune note historique gardant la trace des changements peuvent tre attribues un terme, qu'il soit prfrentiel ou non. D'autres types de notes paramtrables (ditoriales, ) sont proposs (Clause 15.2.14) La norme insiste sur la ncessit de prendre en compte les particularits linguistiques ou culturelles, en acceptant par exemple le singulier ou le pluriel, les adjectifs et les verbes, (Clause 6.5). Les noms propres sont accepts et bnficient ainsi des mmes possibilits de mise en relation que tout autre concept. Nanmoins sils sont en grand nombre ou contrls dans leur forme par une liste dautorit externe ou un ensemble de rgles, la norme laisse le choix de les conserver ou de les retirer du thsaurus. Le traitement des concepts complexes est ralis par le biais des termes les dsignant (voir chapitre 2.2.2. Traitement des concepts complexes). > Modle de donnes ISO 25964-1 Le reproche fait traditionnellement aux thsaurus de ne pas tre conceptuels mais terminologiques porte sur l'absence de distinction formelle entre concepts et termes : les concepts n'taient alors manipulables qu' travers le terme prfrentiel. Mais pour faciliter l'interoprabilit entre 13 les thsaurus et prendre en charge les volutions dans le temps, cette distinction concept/terme devient indispensable dans le contexte des systmes de recherche d'information en rseau. Dans le modle de donnes, la nouvelle norme distingue formellement les termes des concepts au moyen d'une classe ddie ThesaurusTerm et de deux relations entre termes et concepts : isPreferredLabel / hasPreferredLabel et isNonPreferredLabel / hasNonPreferredLabel . Les termes du thsaurus sont donc grs au sein d'une classe spcifique ThesaurusTerm , enrichie par un ensemble d'attributs permettant d'assurer la gestion dans le temps du lexique. Parmi ces attributs, la valeur lexicale et l'identifiant du terme sont les seuls qui soient obligatoires, les autres, comme la langue, les dates de cration et modification, la source ou le statut (candidat, approuv,...) sont recommands, mais restent facultatifs.

13

Chaque dispositif peut avoir opt pour des termes prfrentiels diffrents pour un mme concept, par exemple.

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Les termes prfrentiels et non prfrentiels sont relis aux concepts par une relation spcifique isPreferredLabelFor ou isNonPreferredLabelFor . Seule la relation entre un concept et un terme prfrentiel est obligatoire. Les termes prfrentiels et non prfrentiels sont relis entre eux par une relation dquivalence tablie entre les deux sous-classes PreferedTerm et NonPreferedTerms . Les abrviations utilises en franais pour reprsenter ces relations restent identiques : EM (employer) et EP (employ pour) (Clause 3 - Table 2). La nature de la relation entre un terme prfrentiel et un terme non prfrentiel (sigle / dvelopp, nom demprunt / nologisme, synonyme, quasi-synonyme, antonyme, etc.) pourrait tre prcis en utilisant l'attribut role propos par le modle de donne de la norme. Comme dans la recommandation SKOS (voir paragraphe sur SKOS dans le Chapitre 4.3), il est possible d'ajouter un attribut au terme non prfrentiel pour indiquer que celui-ci est cach (hidden), ce qui permet d'intgrer des critures fautives utilises pour la recherche mais non visibles par les utilisateurs. Il est galement possible d'enrichir le thsaurus de diffrents types de notes rattaches aux termes. Elles sont distinctes des notes attaches aux concepts. Trois classes (HistoryNote, Definition, EditorialNote) facultatives sont ainsi associes la classe ThesaurusTerm. Exemples : Extrait du schma XML de la norme ISO 25964-1.

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

3.4. Relations
ISO 25964-1, Clause 10 Relationships between concepts, pp.57-67 ISO 25964-1, Clause 14.3 Relationships between terms and between concepts ISO 25964-1, Table 6 Attributes and associations of ThesaurusConcept, pp.112-113

L'ensemble des types de relations conceptuelles ou terminologiques proposes dans cette norme, existait dans les versions prcdentes des normes : relations d'quivalence entre termes (Clause 8) relations hirarchiques (Clause 10.2) et relations associatives, relations entre concepts (Clause 10.3). La norme franaise Afnor n'tait toutefois pas aussi prcise en ce qui concerne le typage des relations hirarchiques. Les nouveauts de la norme ISO 25964 portent d'une part sur les possibilits de spcifier plus avant les types de relations et d'autre part sur le formalisme impos par le modle de donnes. Les possibilits de spcifier et de formaliser les types de relations permettent de prendre en compte des caractristiques propres certains domaines, activits ou catgories d'utilisateurs. Ainsi : Une relation appartient la discipline / est un objet de la discipline permet de typer plus finement une relation d'association pouvant exister entre Oiseau et Ornithologie ; Une relation hirarchique d'instance entre les noms d'artistes, molcules, produits, et leurs catgories d'appartenance permet de spcifier des relations associatives ou polyhirarchiques ; Une relation d'appartenance une facette origine animale peut tre transforme en une relation hirarchique ou associative d'un type particulier (par exemple origine du produit ),... Ces quelques exemples montrent que la spcialisation ou typage des relations a un impact sur la construction d'un thsaurus et sur les types de relations existants. Il convient donc de prendre du recul et d'tudier l'ensemble des relations formant le rseau conceptuel du thsaurus sur un plan plus global. C'est pourquoi nous faisons ici une prsentation d'ensemble de ce rseau de concepts et des relations qui le structurent, mme si la norme aborde les spcificits de chacune d'entre elles dans une Clause particulire. Nous nous sommes limits dans ce chapitre 4.4. aux relations tablies entre les concepts du thsaurus, et abordons dans un autre chapitre les relations entre ces concepts et leur regroupement soit par domaines (ConceptGroups) soit par facettes (voir chapitre 4.5). Relation hirarchique (Clause 10.2) La relation hirarchique gnrale TG (gnrique) /TS (spcifique), prsente dans la Clause 10.2., 14 peut tre spcifie suivant trois axes : Espce / Genre, Tout / Partie, Instance .
Par exemple : Oiseau TSG Moineau et Moineau TGG Oiseau pour une relation hirarchique gnrique ; Vaisseau sanguin TSP Veine et Veine TGP Vaisseau sanguin pour une relation hirarchique partitive ; Montagne TSI Alpes et Alpes TGI Montagne pour une relation hirarchique dinstance, associe une relation d'quivalence entre Montagne EP Massif montagneux (ou l'inverse suivant les choix des concepteurs du thsaurus)

Comme dans les prcdentes normes, il n'est pas obligatoire de prciser le type de relation, et la mention de la seule relation hirarchique sans plus de prcision est bien sr autorise.
Par exemple : Moineau TG Oiseau et Oiseau TS Moineau .

14

La relation dinstance ne figurait pas dans la norme Afnor 47-100, mais existait dans la norme ISO de 1986 ainsi que dans les normes plus rcentes BS 8723:2008 et ANSI/NISO Z39.19:2005

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Relations avec le concept de tte de la branche hirarchique (TopConcept, Clause 10.2.4.) L'affichage de la relation directe entre un concept et le concept situ en tte de la structure hirarchique dans laquelle il se trouve peut tre trs utile dans le cas de thsaurus fortement hirarchiss ou dans le cas de thsaurus autorisant la polyhirarchie. Dduite gnralement par le systme de gestion du thsaurus, cette possibilit reste toutefois facultative. Cette relation de tte de hirarchie, dont le code est TT, se distingue formellement de la relation d'appartenance d'un concept un groupe de concepts (voir chapitre 3.5.).
Exemples Thsaurus de l'Unesco (p.130 de la norme) Tension mentale TT Comportement (TT concept de tte de hirarchie du concept Tension mentale) 15 Tension mentale CS 4.10 Psychologie (CS - catgorie smantique - appartenance un domaine) GEMET (p.133 de la norme) emploi TT Travail (concept de tte de hirarchie du concept emploi) emploi CS SOCIETE (appartenance un domaine)

Relation polyhirarchique (Clause 10.2.5) La relation polyhirarchique permet de caractriser plus finement un concept et d'en proposer plusieurs cls d'accs en tablissant des relations hirarchiques avec plus d'un concept appartenant des catgories diffrentes.
Exemple : une camra sous-marine est la fois une camra usage spcifique et un matriel de plonge camra sous-marine TG camra usage spcifique camra sous-marine TG matriel de plonge

Relation associative (Clause 10.3) Les relations associatives couvrent, comme dans les normes prcdentes, les relations autres que hirarchiques gnriques/spcifiques entre concepts. Elles forment un rseau smantique complmentaire au rseau hirarchique et enrichissent ainsi les possibilits de navigation entre concepts.
Par exemple Ornithologie TA Oiseau ou encore Poison TA Toxicit .

Diffrents cas de relations associatives comme les relations cause/effet ou opration/agent, sont exposs dans la norme (Clause 10.3.3.). > Modle de donnes ISO 25964-1 Le rseau conceptuel du thsaurus est modlis autour de trois classes cres pour chacun des types de relations entre concepts : HierarchicalRelationship , AssociativeRelationship , Top LevelRelationship . Les classes HierarchicalRelationship et AssociativeRelationship possdent chacune un attribut role qui permet de paramtrer des types de relations particulires. Mais si la norme traite de diffrents cas de relations, aucun vocabulaire autre qu instance et tout-partie pour les relations hirarchiques nest propos pour coder ces types de relations avec l'attribut role .
Exemple Une relation peut tre tablie entre une action (Courtage) et l'agent de cette action (Courtier) agent dnomm souvent par un nom de mtier. Agriculture [TA action-agent ] Agriculteur Courtier [TA action-agent ] Courtage
15

L'tiquette CS n'est pas normalise. C'est la traduction de l'tiquette en anglais : SC semantic category.

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Dans le modle de base, les relations dassociation sont rciproques. Ainsi l'tablissement d'une relation associative entre Oiseau et Ornithologie est symtrique et valable dans les deux sens. Il est recommand de pouvoir contraindre et contrler les applications en charge de la gestion d'un thsaurus comme prcis dans la Clause 14.3 (Relationships between terms and between concepts). Toutefois pour certains types de relation plus spcialise, telle la relation Cause/Effet ou une relation historique , non symtrique, il peut tre ncessaire de modifier cette contrainte en offrant une relation inverse non rciproque. Le modle de donnes de la norme autorise la polyhirarchie, chaque concept pouvant tre reli plusieurs autres concepts par une relation hirarchique, sans restriction.
Exemple Orgue (instrument de musique) TG Instrument vent Orgue (instrument de musique) TG Instrument clavier crne TG os crne TG tte

Ou
crne TGG bones (gnrique gnrique) crne TGP tte (gnrique partitif)

3.5. Regroupement de concepts : thmes et facettes


La structure conceptuelle de base dun thsaurus est constitue par le rseau de concepts cr par les relations hirarchiques et associatives entre concepts. Mais la norme permet galement d'autres types de regroupements de concepts, non obligatoires mais qui enrichissent les accs et la navigation au sein de ce rservoir de concepts. Deux types fonctionnellement distincts de regroupement de concepts sont identifis dans la norme : Des regroupements partir d'une classification - les Groupes de Concepts (voir chapitre 3.5.1). Des regroupements par Facettes (voir chapitre 3.5.2). Les dispositifs sur les Intranets ou l'Internet profitent pleinement de ce type de systme d'organisation des connaissances.

3.5.1. Groupe de concepts regroupements par domaines ou thmatiques


ISO 25964-1, Clause 12.2.5 Classified display, p. 76-78 ISO 25964-1, Clause 15.2.18 Concept groups, p.108 ISO 25964-1, Table 7 Attributes and associations of ConceptGroup, pp.118

Paralllement aux rseaux hirarchiques et associatifs des concepts, les thsaurus autorisent le 16 regroupement des concepts partir d'une structure classificatoire prdfinie . Cette double organisation (conceptuelle et classificatoire) qui fait la spcificit de certains thsaurus, bien que facultative, est de plus en plus frquente dans les dispositifs d'accs l'information sur les rseaux Web ou Intranet. Les bases utilises pour regrouper des concepts sont de nature varie : disciplines, domaines thmatiques ou domaines dactivit mtier... On peut galement citer l'organisation chronologique ou gographique des concepts,.... Ces groupes de concepts sont parfois dnomms catgories

16

Afnor Z47-100, 5.7.1. Regroupement thmatique, p. 14

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

ou catgories de sujets , thmes ou thmatiques , domaines , groupes , microthsaurus ou champs smantiques . Cette structure classificatoire peut elle-mme tre hirarchise sur 2 ou plus rarement 3 niveaux. Chaque groupe de concepts peut possder un nom ou label ( ConceptGroupLabel ) dans une langue donne et une notation. Lappartenance dun concept un regroupement nimplique pas que tous les concepts ayant une relation hirarchique entre eux dans le thsaurus, appartiennent au mme groupe de concepts tel que dfini ici.
Exemples GEMET (p.136 de la norme) Ce thsaurus propose deux systmes distincts de regroupement de concepts : 17 - 42 thmes ; 18 - 32 Groupes ou champs smantiques, regroups en 4 grands domaines auxquels sont rattachs toute la hirarchie de concepts en partant des termes de tte. On trouve par exemple dans le thsaurus Gemet, cette hirarchie de concepts : Agglomration Zone industrielle Zone militaire Agglomration appartient au Thme Btiments . tandis que son terme spcifique zone militaire est sous le Thme aspects militaires . Ils appartiennent tous deux au mme Groupe.

> Modle de donnes ISO 25964-1 La modlisation de ces groupes de concepts repose sur 2 classes, ConceptGroup et ConceptGroupeLabel , relies entre elles. Chaque concept du thsaurus ( ThesaurusConcept ) est ainsi reli par une relation isMemberOfGroup / hasAsMember la classe ConceptGroup . Concernant les classes ConceptGroup et ConceptGroupLabel : La classe ConceptGroupLabel permet de reprsenter chaque groupe de concepts par une valeur lexicale. Les groupes de concepts de la classe ConceptGroup (et les sous-groupes dans le cas d'une classification hirarchique) ont obligatoirement des identifiants. De plus le type de groupe de concepts (Disciplines, Microthsaurus, Thmes, Domaines, ...) peut tre spcifi grce l'attribut conceptGroupType . Ce mode d'organisation classificatoire des concepts reste facultatif. Rappel : La tte de hirarchie du concept (voir chapitre 4.4.3) est formellement distincte du/des groupes de concepts voqus ici.

3.5.2. Regroupement par facettes


ISO 25964-1, Chapitre 11, p. 68-69 ISO 25964-1, Table 5 Attributes and associations of ThesaurusArray, p.111

Une faon diffrente de regrouper des concepts d'un thsaurus repose sur l'analyse par facettes (facet analysis). La notion de facettes est beaucoup plus abstraite et donc moins directement accessible que la notion de thmes ou domaines, mais elle offre des possibilits varies d'organisation et de filtrage dans les systmes de recherche d'information. Lanalyse par facettes aboutit la constitution de groupes de concepts appels concepts frres ou de

17 18

GEMET - Listes thmatiques - http://www.eionet.europa.eu/gemet/index_html?langcode=fr GEMET Groups - http://www.eionet.europa.eu/gemet/groups?langcode=fr

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

mme rang ( sibling concepts) autour d'une facette particulire. Le choix des facettes peut varier en fonction du domaine, mais il est frquent d'utiliser des catgories fondamentales telles que : objets, matriaux, agents, actions, lieux, temps, etc. Plus le thsaurus est spcialis, plus ces facettes seront elles-mmes spcialises. Ainsi de la facette par origine animale dans un thsaurus agricole, ou de la structuration d'une liste de noms de colorant en fonction de leur nature artificielle ou naturelle. Le relais virtuel (node label) est un terme choisi pour dsigner cette facette : acteur , produit , lait par source animale ou lait par type de traitement dans l'exemple suivant. Exemple regroupement par facettes
industries agricoles (acteur) cultivateur-exploitant fermier berger (produit) produit cralier produit laitier beurre crme fromage lait (lait par matire grasse) lait entier lait demi-crm lait crm (lait par source animale) lait de bufflonne lait de vache lait de chvre lait de brebis (lait par type de traitement) lait condens lait vapor lait homognis lait pasteuris lait strilis industries mcaniques (acteur) ingnieur (produit) roue etc

Cette organisation des concepts par facettes est indpendante de leur organisation hirarchique. Il est important de noter la configuration des relations hirarchiques des concepts autour des relais virtuels. Lorsque le relais virtuel reprsente une caractristique de division du concept, tous les termes de cette srie sont alors considrs comme des termes spcifiques du terme suprieur. Ainsi, dans la figure ci-dessus les concepts lait entier , lait de bufflonne et lait strilis sont tous des concepts spcifiques de lait , provenant de diffrents critres de subdivision respectivement matire grasse , origine animale et type de traitement . En revanche, lorsque le relais virtuel introduit une nouvelle facette (acteur, produit, ), les concepts frres ne sont gnralement pas des concepts spcifiques du concept suprieur. Ainsi cultivateur-exploitant (facette acteur) et produits craliers (facette produit) ne sont pas des termes spcifiques d"Industries agricoles". Au sein d'une squence, les concepts du thsaurus peuvent tre ordonnancs suivant l'ordre alphabtique des termes prfrentiels ou bien de faon systmatique.
11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

> Modle de donnes ISO 25964-1 Dans les applications informatiques, l'analyse par facettes peut tre prise en compte de diffrentes manires. Le formalisme adopt dans le modle de donnes de la norme est facultatif et suit principalement les rgles fonctionnelles nonces en 1986 en visant essentiellement une fonction de prsentation (visuelle) d'un thsaurus. Ainsi les relais virtuels ne sont ni des concepts ( ThesaurusConcept ) ni des termes ( ThesaurusTerm ) du thsaurus, et ne sont donc pas en l'tat, exploitables en 19 recherche. Ils ne sont utiles qu' la prsentation du thsaurus, ce qui en limite la porte . L'organisation par facettes est reprsente principalement par : Deux classes spcifiques : ThesaurusArray (srie de concepts) et NodeLabel (valeur lexicale du relais virtuel) ; Une relation isMemberOfArray (concepts membres de la srie) entre la classe ThesaurusConcep et la classe ThesaurusArray . Les facettes peuvent ventuellement tre dcomposes en sous-facettes - grce la relation hasSuperOrdinateArray , jusqu'au niveau de prcision requis. Par exemple une facette Action peut tre subdivise en diffrents types d'action tels que rparation ou dtrioration ; une facette Acteur peut tre subdivise en Acteur par mtier ou Acteur par rle . L'ordonnancement des concepts sous une facette par ordre alphabtique ou de faon systmatique s'appuie sur l'attribut ordered ..

19

Il serait possible d'utiliser l'attribut role et un attribut relais-virtuel pour des concepts particuliers pour formaliser ce type de regroupement de concepts.

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

3.6. Multiculturalisme et multilinguisme


ISO 25964, Clause 9, quivalence entre langues naturelles, p. 50-57

La norme ISO 25964 sur les thsaurus, intgre les caractristiques des thsaurus multilingues considrant ceux-ci comme des thsaurus dont une des caractristiques est de reprsenter des concepts par des termes issus de diffrentes langues naturelles. Le traitement du multilinguisme est abord dans les diffrents chapitres concerns par cette problmatique sous la forme d'ajustements, de prcisions et dexemples s'ajoutant aux recommandations gnrales. Ainsi le choix des relations hirarchiques (Clause 10.2.6) ou associatives (Clause 10.3.4), la prsentation du thsaurus (Clause 12) ou la problmatique de l'quivalence entre diffrentes langues naturelles (Clause 9) permettent dintgrer les particularits des thsaurus multilingues au contenu gnral de la norme sur les thsaurus, au lieu de produire une norme spcifique. Comme dans la norme internationale de 1985 sur les thsaurus multilingues, la question de l'quivalence entre termes de langues naturelles diffrentes reprsentant un mme concept fait l'objet de diverses recommandations. La norme propose quatre degrs dquivalence possibles entre termes de langues naturelles diffrentes.
Exemple quivalence exacte fr: physique / en: physics / es: fsica / de: Physik quivalence quasi-exacte ou proche fr: jeu didactique / en: learning games quivalence partielle ou quivalence gnrique/spcifique fr: scurit / de: Sicherheit / en: safety, security Non quivalence

La deuxime partie de la Clause 9 de la norme propose des solutions aux problmes d'quivalence partielle ou proche : transformer le terme prfrentiel du langage source, modifier le langage source, importer le terme d'une langue source comme terme d'emprunt, crer un terme forg quivalent > Modle de donnes ISO 25964-1 Chaque version linguistique d'un thsaurus multilingue partage le mme rseau conceptuel et la langue devient, dans ce modle de donne, un attribut de la classe ThesaurusTerm . Les langues du thsaurus sont dclares dans la classe Thsaurus . Le degr d'quivalence entre termes dans diffrentes langues naturelles, s'il est expliqu (Clause 9.2.) pour la conception dun thsaurus, n'est toutefois pas modlis dans le modle de donnes. Le nombre de synonymes ou de quasi-synonymes d'un concept varie gnralement d'une langue l'autre, et il n'est pas ncessaire dans un thsaurus multilingue des fins de recherche documentaire, de prsenter les quivalences inter-langues pour des termes non prfrentiels. Cette relation entre termes n'est donc pas prise en charge par la norme ISO 25964-1. Toutefois le modle de donnes, en formalisant les termes au sein d'une classe spcifique (ThesaurusTerm) et en les caractrisant par les attributs Langue (lang) et par la relation isNonPreferredLabelFor permettra l'exploitation de cette association inter-langue entre des termes non prfrentiels.

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

4 - Usages du thsaurus et de ses composants


Nous venons de passer en revue dans le chapitre 3, les composants principaux du thsaurus tels qu'exposs dans la Partie 1 de la norme ISO 25964:2011. Plusieurs clauses de la norme, d'ampleur diffrente, concernent quant elles les usages et services possibles autour des thsaurus. Ces services sont exposs dans ce chapitre 4 du Livre Blanc: La prsentation des thsaurus pour consultation (chapitre 4.1); Les formats et protocole d'changes (chapitre 4.2) ; La mthode de conception et de maintenance des thsaurus (chapitre 4.3) ; Les logiciels de gestion de thsaurus (chapitre 4.4). Il ne s'agit pas dans ces clauses de traiter la question des usages d'un thsaurus pour l'indexation ou recherche, mais d'tudier les aspects techniques et fonctionnels pour prsenter ou porter un thsaurus dans des applications.

4.1. Prsentation des thsaurus pour consultation


ISO 25964, Clause 12, p. 70-88

La norme (Clause 12) ne propose pas de nouveaut en la matire. Diffrentes formes de prsentation, qui se compltent les unes les autres, sont possibles. Des exemples de prsentation de ces diffrents formats sont fournis. Quil soit prsent sur un cran ou sous une forme imprime, le thsaurus peut tre prsent sous les formes suivantes: Prsentation unitaire d'un concept du thsaurus; Liste alphabtique des termes prsents dans le thsaurus ; Classement hirarchique des concepts reprsents dans le thsaurus ; Prsentation systmatique des concepts reprsents dans le thsaurus (domaines ou facettes) ; Table de correspondance pour les thsaurus multilingues. Sans en prciser le contenu, la norme cite deux autres formes de prsentation : Prsentation sous forme de liste alphabtique permute permettant de trouver ou de reprer dans une liste alphabtique les mots inclus dans les termes multi-mots; Prsentation graphique du thsaurus. Prcisons quaucune de ces prsentations nest considre comme tant la meilleure pour toutes les situations : leur pertinence varie en fonction des contextes dapplication. Il est cependant primordial quau moins une des prsentations listes ci-dessus soit mise disposition des utilisateurs en complment de la prsentation alphabtique. Prsentation unitaire dun concept du thsaurus Le concept est reprsent par le terme prfrentiel et son environnement smantique : les termes non prfrentiels et, de manire facultative, les relations qu'il entretient avec d'autres concepts, notes etc. La norme recommande un ordre de prsentation de ces attributs. Liste alphabtique des termes prsents dans le thsaurus Ce type de liste permet aux utilisateurs daccder rapidement l'ensemble des termes, prfrentiels, non prfrentiels et non prfrentiels scinds, depuis le mot utilis par lutilisateur. Cette liste peut galement tre utilise comme un index. Classement hirarchique des concepts reprsents dans un thsaurus
11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Ce classement est bas sur la relation hirarchique TG/TS entre les concepts. Il est recommand dutiliser cette prsentation en complment de la liste alphabtique des termes du thsaurus. Prsentation systmatique des concepts reprsents dans un thsaurus Cette prsentation se concentre sur les relations entre les concepts et leur domaine d'appartenance. Deux choix de prsentation sont possibles : les termes du thsaurus sont ordonns par groupes de concepts (domaines) (voir chapitre 4.5.1) les termes du thsaurus sont classs par facette lintrieur dun domaine (voir chapitre 4.5.2) Il est recommand dutiliser cette prsentation en complment de la liste alphabtique des termes du thsaurus. Dans la pratique, cette approche peut-tre combine avec le classement hirarchique. Liste permute Cette prsentation permet de retrouver facilement un concept partir de l'un des mots qui composent le terme prfrentiel voire non prfrentiel. Prsentation graphique d'un thsaurus Cest la reprsentation visuelle des concepts via leurs termes prfrentiels et de leurs relations. Citons la reprsentation par schma flch trs utilise dans les annes 1970-80. Ce format de prsentation d'un thsaurus peut bnficier aujourd'hui des outils de cartographie.

Cas particuliers
Cas des relations polyhirarchiques Le terme reprsentant un concept apparat ici chacun de ses emplacements dans l'arborescence conceptuelle du thsaurus. Dans le cas des thsaurus imprims, on peut choisir un emplacement principal dans lequel sont logs les termes spcifiques, notes, synonymes etc. Dans le cas d'affichage sur cran, on doit pouvoir voir lensemble des relations quel que soit lemplacement du terme polyhirarchique. Prsentation et affichage des thsaurus multilingues. Toutes les langues doivent tre considres d'une faon gale. On mettra disposition des utilisateurs une liste alphabtique des termes du thsaurus dans chaque langue. Des quivalents interlinguistiques doivent tre disponibles pour les termes prfrentiels de chaque version. La norme apporte des conseils quant aux prsentations unitaires, alphabtiques, systmatiques et hirarchiques du thsaurus dans ce cas de figure. Des recommandations sont faites pour grer les problmatiques techniques ou humaines de codage des caractres : les caractres doivent toujours tre reprsents dans une forme lisible pour les natifs de la langue et l'usage de la norme UCS (Universal Character Set) est fortement recommand. La question des critres de tri fait l'objet de recommandations (Clause 12.4.3). Les systmes de traitement et gestion de vocabulaires doivent tre capables de produire des squences alphabtiques selon les conventions de chacune des langues. A dfaut, la notice explicative de chaque version doit clairement exposer lordre de classement retenu. > Modle de donnes ISO 25964-1 L'exploitation du modle de donnes du thsaurus propos dans la norme ISO 25964-1 permet la production de ces diffrentes modalits de prsentation des thsaurus. L'ajout d'attribut sur les entits (concepts, termes, ) ou sur les relations permet galement de
11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

prendre en compte les besoins et les usages particuliers des utilisateurs finaux ou des gestionnaires.

4.2. Intgration des thsaurus des applications


ISO 25964,-1 Clause 16 - , p. 115-118

Les situations o un thsaurus est exploit au sein d'un systme de recherche ou de gestion d'information se sont diversifies et rendent beaucoup plus frquentes les activits d'change de donnes entre plusieurs systmes. Dans ce contexte, la Clause 16 de la norme prsente : Les caractristiques et fonctions qui permettent dassurer linteroprabilit entre thsaurus travers les systmes et les rseaux, ainsi que l'import/export - partiel ou total - de thsaurus, selon des formats ou des protocoles standards. Les caractristiques et fonctions ncessaires pour exploiter un thsaurus dans une application d'indexation ou de recherche : l'installation du thsaurus dans le systme, la question du codage des caractres, les fonctionnalits de navigation, recherche et slection au sein du thsaurus, de faon autonome ou en conjonction avec un moteur de recherche. Les caractristiques et fonctions requises pour les applications qui utilisent deux thsaurus ou plus seront traites dans la Partie 2 de la norme ISO 25964.

4.3. Formats d'change et protocoles


ISO 25964-1, Clause 17 - p. 118-119 ISO 25964-1, Clause 18 - , p.119-121

Les Clauses 17 et 18 exposent brivement : Les 4 formats d'change les plus courants : SKOS ; MARC21, zThes, et DD 8723-5 (BSI) Des cas d'utilisation de protocoles spcifiques pour l'change de thsaurus, dont SKOS ou ADL Thesaurus protocole, ou des protocoles plus gnraux comme Search Web Services d'OASIS ou SPARQL dans le monde du Web smantique. En raison de changements frquents dans le domaine des technologies de l'information, ces chapitres introduisent la problmatique et ne proposent que les pistes les plus videntes en 2012.

Note concernant SKOS (information non incluse dans la norme)


SKOS (Simple Knowledge Organization System / Systme simple d'organisation des connaissances) cit dans les deux clauses 17 et 18 de la norme ISO, est une famille de langages formels permettant une reprsentation standardise des thsaurus, classifications ou de tout autre type de vocabulaire contrl et structur sur le Web. SKOS est, depuis le 18 aot 2009, une recommandation du W3C. Ce standard du W3C s'est appuy ds le dmarrage du projet sur les normes existantes, en particulier 20 les normes ISO 2788 or BS 8723-2:2005 . Il est ainsi possible d'intgrer un thsaurus un systme d'information reposant sur les technologies du Web, tout en le rendant exploitable par des humains et par une machine. Cette recommandation du W3C ne fournit aucune directive ou recommandation pour la construction et la maintenance dans le temps du thsaurus lui-mme, ni pour les spcifications destines aux outils de gestion des vocabulaires. Pour cela il est recommand de se reporter aux Clauses 5 14 de la norme ISO 25964-1.

20

ISO 2788:1986 - http : //www.iso.org/iso/fr/home/store/catalogue_tc/catalogue_detail.htm?csnumber=7776 BSI:8723-2:2005 : http://shop.bsigroup.com/ProductDetail/?pid=000000000030094114

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Les communauts de la norme ISO 25964 et de la recommandation W3C SKOS proposent un 22 tableau de mise en correspondance entre les lments du modle de donnes de la norme et ceux 23 de SKOS et SKOS XL , une extension de SKOS. Ce tableau de correspondance, disponible sur le 24 site ddi la norme ISO 25964, remplace compter du 12 dcembre 2012 , lancien tableau.

21

4.4. Conception, gestion et maintenance


ISO 25964-1, Clause 13 - Managing thesaurus construction and maintenance, p.88-98 ISO 25964-1, Clause 14 - Guidelines for thesaurus management software , p. 98-103

La norme s'est considrablement toffe sur les aspects lis l'administration et la maintenance du thsaurus : La Clause 13 traite spcifiquement du processus de cration d'un thsaurus. Des recommandations compltent la prsentation de chacune des tapes, et une section est ddie la mise jour et la nature des changements qui peuvent intervenir dans un thsaurus ; La Clause 14 fournit des spcifications fonctionnelles attendues pour un logiciel de gestion d'un thsaurus qui soit capable de grer, importer et exporter les donnes d'un thsaurus telles que prsentes dans la norme. Ces spcifications portent sur les relations entre termes et entre concepts, les notes appliques aux concepts ou aux termes, les codes et les notations, les relais virtuels, le statut des langues, l'import/export de donnes, les fonctions ditoriales, la scurit des donnes et du systme et les outils d'administration.

21 22

Recommandation SKOS, 2009 - http://www.w3.org/2004/02/skos/core# Tableau d'alignement entre ISO 25964 et SKOS (intgr SKOS fin novembre 2012) http://www.niso.org/schemas/iso25964/correspondencesSKOS/ Recommandation SKOS XL, 2009 - http://www.w3.org/2008/05/skos-xl# Annonce officielle sur le site de SKOS le 12 dcembre 2012 - http://www.w3.org/2004/02/skos/.

23 24

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

5 - Conclusion : Que faire ? Comment faire ?


Muni de cette norme, que peut-on faire aujourd'hui ? Trois cas de figure se prsentent aux gestionnaires de vocabulaires et aux concepteurs ou dveloppeurs d'application : On met tout la poubelle Certains prennent ce chemin, avec beaucoup de perte tant sur le plan des comptences, des outils smantiques eux-mmes, des contenus (banques de donnes) que sur le plan humain. On bascule Cette bascule peut tre attaque sous trois angles : Un changement de systme technique conduit se poser la question de l'usage d'un thsaurus, des modalits de sa gestion et diffusion ; La ncessit de diffuser la ressource smantique dans le Web pour tre exploite plus 25 largement ; Le projet de dveloppement d'un systme plus complexe base de rgles (type ontologie de recherche) conduit repositionner le modle thsaurus en tant qu'outil de reprsentation des concepts. La norme se prte tout fait ce type de cas. On se prpare basculer Dans le cas o il est impossible d'envisager aujourd'hui les changements ports par la norme ISO (distinction entre le rseau conceptuel et terminologique, spcialisation de relations, ), le travail de fond sur le thsaurus lui-mme (smantique mtier) peut toutefois tre initi : version linguistique pour se prparer au multilinguisme, travail de fond sur les concepts et les termes, typage de relation en particulier pour les relations dinstance (TSI/TGI) ou dveloppement des quivalences de type synonyme ou sigle/dvelopp, facettes pour prparer des accs mtiers par facettes ou taxonomies sur des portails, tablissement de liens vers d'autres ressources terminologiques pour optimiser des systmes de recherches fdres.... Cette prparation peut s'effectuer soit hors du systme documentaire, soit avec ce dernier si celui-ci offre la possibilit d'ajouter des attributs exploitables dans une phase ultrieure du projet.

25

Citons comme dveloppements raliss en France entrant dans cette cible : - Le thsaurus utilis par pour lensemble des services darchives territoriales en France http://www.archivesdefrance.culture.gouv.fr/gerer/classement/normes-outils/thesaurus/ - Le vocabulaire d'autorit du Sudoc sur le site IdRef - http://www.idref.fr/autorites/autorites.html -

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Annexes
Annexe 1 : Lexique Anglais-Franais du vocabulaire de la norme
La terminologie de la norme ISO 25964-1 (Clause 3 Terms and Definition) est intgre la plateforme ddie de l'ISO (http://www.iso.org/obp/ui/)

Par domaines, puis par ordre alphabtique des termes en franais


Remarque : La traduction en franais et la numrotation associe aux termes en franais proposes ici ne sont pas normalises.

numFR numEN

Terme FR
concept caractristique de division concept de mme rang, concept frre quivalence compose facette

Terme EN
concept characteristic of division sibling concept compound equivalence facet

RESEAU CONCEPTUEL - CONCEPTS ET RELATIONS fr2.06 fr2.04 fr2.07 fr2.11 fr2.13 fr2.26 fr2.34 fr2.35 fr2.36 fr2.37 fr2.38 fr2.43 fr2.44 2.11 2.04 2.52 2.08 2.20 2.50 2.02 2.18 2.23 2.41 2.59 2.34 2.42

note explicative, note d'emploi, note scope note d'application relation associative relation d'quivalence relation hirarchique relation paradigmatique, relation priori relation syntagmatique, relation posteriori structure monohirarchique structure polyhirarchique associative relationship equivalence relationship hierarchical relationship a paradigmatic relationship, a priori relationship a syntagmatic relationship, a posteriori relationship monohierarchical structure polyhierarchical structure

REPRESENTATION DE CONCEPTS : RESEAU DE TERMES fr2.15 fr2.18 fr2.25 fr2.31 fr2.33 fr2.41 2.24 2.22 2.40 2.47 2.38 2.01 homographe/ie indicateur de facettes notation, code ou numro classification, indice ou cote classement quasi-synonyme, synonyme proche tiquette de nud, relais virtuel srie (liste, regroupement) homograph facet indicator de notation, class code, class number, de classmark quasi-synonym, near-synonym node label array

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

fr2.45 fr2.46 fr2.47 fr2.48 fr2.49 fr2.51 fr2.53 fr2.54 fr2.55 fr2.56 fr2.57 fr2.58 fr2.59 fr2.60

2.58 2.61 2.48 2.09 2.30 2.53 2.16 2.63 2.07 2.03 2.36 2.39 2.45 2.37

synonyme terme terme associ terme compos terme d'emprunt terme de mme rang, terme frre terme de recherche, terme rejet terme de tte (de hirarchie) terme forg terme gnrique terme multi-mots

synonym term related term compound term loan term sibling term entry term - lead-in term top term coined term broader term multi-word term

terme non-prfrentiel, non-descripteur non-preferred term, non-descriptor terme prfrentiel, descripteur terme spcifique preferred term, descriptor narrower term

SYSTEMES D'ORGANISATION DE CONCEPTS fr2.39 fr2.40 fr2.61 fr2.62 fr2.63 fr2.64 2.06 2.57 2.62 2.35 2.12 2.56 schma de classification classification scheme

schma de vedettes matires, langage subject heading scheme, subject de vedettes matires, Liste de vedettes heading language, subject heading list, matires SHL thsaurus thsaurus multilingue vocabulaire contrl vocabulaire structur thesaurus mutilingual thesaurus controlled vocabulary structured vocabulary

ALIGNEMENT (MAPPING) fr2.09 fr2.12 fr2.19 fr2.20 fr2.22 2.17 2.13 2.29 2.60 2.54 correspondance quivalente quivalence interlangue interoprabilit langage cible langage source equivalence mapping cross-language equivalence interoperability target language source language

SYSTEME TECHNIQUE & INFORMATIQUE fr2.02 fr2.03 fr2.14 fr2.16 fr2.21 fr2.24 2.10 2.31 2.19 2.25 2.32 2.14 application informatique balisage format d'change identifiant langage de balisage, de balises modle de donnes computer application markup exchange format identifier markup language data model

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

fr2.30

2.46

protocole

protocol

CONTEXTE GENERAL fr2.01 fr2.05 fr2.08 fr2.10 fr2.17 fr2.23 fr2.27 fr2.28 fr2.29 fr2.32 fr2.42 fr2.50 fr2.52 2.21 2.05 2.64 2.15 2.27 2.33 2.49 2.43 2.44 2.28 2.55 2.26 2.51 analyse par facettes classification contrle du vocabulaire document indexation mtadonne plan, liste (rpertoire du vocabulaire) post-coordination pr-coordination recherche d'information spcificit terme d'indexation (indexat) terme de recherche facet analysis classification, classifying vocabulary control document indexing metadata schedule post-coordinate pre-coordinate information retrieval specificity index term search term

Par domaines, puis par ordre alphabtique des entres en anglais


numFR numEN Terme FR RESEAU CONCEPTUEL - CONCEPTS ET RELATIONS fr2.34 fr2.04 fr2.11 fr2.06 fr2.35 fr2.13 fr2.36 fr2.43 fr2.37 fr2.44 fr2.26 fr2.07 fr2.38 2.02 2.04 2.08 2.11 2.18 2.20 2.23 2.34 2.41 2.42 2.50 2.52 2.59 relation associative caractristique de division quivalence compose concept relation d'quivalence facette relation hirarchique structure monohirarchique relation priori paradigmatique, relation associative relationship characteristic of division compound equivalence concept equivalence relationship facet hierarchical relationship monohierarchical structure a paradigmatic relationship relationship, a priori Terme EN

structure polyhirarchique

polyhierarchical structure

note explicative, note d'emploi, note scope note d'application concept de mme rang, concept frre relation syntagmatique, posteriori relation sibling concept a syntagmatic relationship, a posteriori relationship

REPRESENTATION DE CONCEPTS : RESEAU DE TERMES fr2.41 2.01 srie (liste, regroupement) array

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

fr2.56 fr2.55 fr2.48 fr2.53 fr2.18 fr2.15 fr2.49 fr2.57 fr2.60 fr2.33 fr2.58 fr2.25 fr2.59 fr2.31 fr2.47 fr2.51 fr2.45 fr2.46 fr2.54

2.03 2.07 2.09 2.16 2.22 2.24 2.30 2.36 2.37 2.38 2.39 2.40 2.45 2.47 2.48 2.53 2.58 2.61 2.63

terme gnrique terme forg terme compos terme de recherche, terme rejet indicateur de facettes homographe/ie terme d'emprunt terme multi-mots terme spcifique tiquette de nud, relais-virtuel

broader term coined term compound term entry term - lead-in term facet indicator homograph loan term multi-word term narrower term node label

terme non-prfrentiel, non-descripteur non-preferred term, non-descriptor notation, code ou numro classification, indice ou cote classement terme prfrentiel, descripteur quasi-synonyme, synonyme proche terme associ terme de mme rang, terme frre synonyme terme terme de tte (de hirarchie) de notation, class code, class number, de classmark preferred term, descriptor quasi-synonym, near-synonym related term sibling term synonym term top term

SYSTEMES D'ORGANISATION DE CONCEPTS fr2.39 fr2.63 fr2.62 fr2.64 fr2.40 fr2.61 2.06 2.12 2.35 2.56 2.57 2.62 schma de classification vocabulaire contrl thsaurus multilingue vocabulaire structur classification scheme controlled vocabulary mutilingual thesaurus structured vocabulary

schma de vedettes matires, langage subject heading scheme, subject de vedettes matires, Liste de vedettes heading language, subject heading list, matires SHL thsaurus thesaurus

ALIGNEMENT (MAPPING) fr2.12 fr2.09 fr2.19 fr2.22 fr2.20 2.13 2.17 2.29 2.54 2.60 quivalence interlangue correspondance quivalente interoprabilit langage source langage cible cross-language equivalence equivalence mapping interoperability source language target language

SYSTEME TECHNIQUE & INFORMATIQUE

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

fr2.02 fr2.24 fr2.14 fr2.16 fr2.03 fr2.21 fr2.30

2.10 2.14 2.19 2.25 2.31 2.32 2.46

application informatique modle de donnes format d'change Identifiant Balisage langage de balisage, de balises Protocole

computer application data model exchange format identifier markup markup language protocol

CONTEXTE GENERAL fr2.05 fr2.10 fr2.01 fr2.50 fr2.17 fr2.32 fr2.23 fr2.28 fr2.29 fr2.27 fr2.52 fr2.42 fr2.08 2.05 2.15 2.21 2.26 2.27 2.28 2.33 2.43 2.44 2.49 2.51 2.55 2.64 Classification Document analyse par facettes terme d'indexation (indexat) Indexation recherche d'information Mtadonne post-coordination pr-coordination plan, liste (rpertoire du vocabulaire) terme de recherche Spcificit contrle du vocabulaire classification, classifying document facet analysis index term indexing information retrieval metadata post-coordinate pre-coordinate schedule search term specificity vocabulary control

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Annexe 2 : Tableau partiel des symboles et sigles


Description Symbole Elments descriptifs

Etiguette EN SN

Etiquette FR NE

Signification
Note explicative Une note signale l'usage de note d'application dans la norme Afnor Z47-100) Dfinition Note historique Catgorie smantique ; un code ou une notation, appliqu un groupe de concepts relatif un sujet particulier. Code de concept or notation Employer ; le terme qui suit cette tiquette est le terme prfrentiel devant tre utilis la place du terme prfrentiel qui prcde l'tiquette. Employer pour ou Employ pour : le terme qui suit cette tiquette est un terme non prfrentiel pour lequel doit tre utilis le terme prfrentiel prcdant l'tiquette. Les deux termes prfrentiels ou plus qui suivent cette tiquette doivent tre utiliss ensemble pour reprsenter le concept dsign. Le terme non prfrentiel qui suit (cette tiquette) doit tre reprsent par la combinaison des termes prfrentiels prcdant l'tiquette. Terme de tte : le terme prfrentiel qui suit cette tiquette reprsente le concept le plus haut dans la hirarchie laquelle appartient ce concept prcis. Terme gnrique ; le terme prfrentiel qui suit cette tiquette reprsente un concept ayant un sens plus large/gnrique dans la hirarchie laquelle appartient le concept spcifique. Terme gnrique (gnrique) Terme gnrique (instance) Terme gnrique (partitif) Terme spcifique ; le terme qui suit cette tiquette renvoie un concept ayant une sens plus spcifique. Terme spcifique (gnrique) Terme spcifique (instance) Terme spcifique (partitif) Terme associ ; le terme qui suit cette tiquette est en relation d'association, mais n'est pas un synonyme, quasi-synonyme, terme gnrique ou terme spcifique.

DEF HN
Codes

DEF NH 26

SC CC
Relations

USE

EM

UF

EP

USE...+

EM... +

UF+

EM+
27

TT

<

BT BTG BTI

TG TGG TGI TGP TS TSG TSI TSP TA

< >

BTP NT NTG NTI

>

NTP RT

26

Il est possible de proposer pour la prochaine version de la norme (rvision prvisible partir de 2016) l'usage de CS pour catgorie smantique. Beaucoup de pays ont tendance utiliser les codes en anglais. Il est possible de proposer pour la prochaine version de la norme (rvision 2016) l'usage de TT pour terme de tte (de la hirarchie).

27

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Annexe 3 : Modlisation entits-relations quelques repres


Cette annexe a pour seule ambition d'apporter quelques lments de comprhension pour ce Livre 28 Blanc. Nous renvoyons les lecteurs intresss d'autres sources bibliographiques plus dtailles . Pour reprsenter un thsaurus et sa structure conceptuelle et terminologique, les diteurs de la norme ont choisi le langage UML et en particulier le vocabulaire et formalisme des diagrammes de classes, en raison de son important dploiement dans un grand nombre de pays dans diffrentes rgions du monde. UML est un langage graphique de modlisation des donnes et des traitements. Il propose une reprsentation graphique de ce modle mtier. Outil technique des dveloppeurs, ces diagrammes constituent galement des outils de communication avec l'ensemble des acteurs impliqus dans le dveloppement des systmes, moyennant une formation adapte pour les intervenants n'ayant pas t familiariss avec ce formalisme. Toutefois il existe quelques limites. La norme ISO 25964-1 est ouverte et laisse un grand nombre de possibilits linitiative du concepteur de thsaurus. Le diagramme UML propos dans la norme ne couvre donc pas toutes ces possibilits. Une note de spcifications est ncessaire pour chaque application. De plus, toutes les possibilits offertes dans la norme ne sont pas formalisables avec le langage UML et ne sont donc pas visibles sur le diagramme UML du modle ISO 25964 propos. Cette reprsentation graphique nest donc pas autosuffisante pour spcifier et dvelopper des applications. Les spcifications d'une application doivent donc s'appuyer prcisment sur les besoins, le contenu de la norme et sur les tableaux de prsentation du modle de donnes proposs dans la Clause 15. Vocabulaire UML Seul le diagramme de classe est utilis dans la norme ISO 25964-1. UML s'appuie sur des Classes possdant des attributs qui les caractrisent et des associations entre classes. Classes Dclare des caractristiques communes un ensemble d'objets, cest--dire des attributs reprsentant l'tat des objets Exemple : classe ThesaurusConcept , ThesaurusTerm , ... Association Connexion smantique entre deux classes Exemple : hasTopConcept entre concepts, ou isPreferredLabelFor entre les classes ThesaurusConcept et ThesaurusTerme,... Attributs et proprits Les attributs sont des lments de description des classes ou des associations. Chaque attribut a des proprits, caractristiques particulires qui prcisent l'attribut : obligatoire ou optionnel, rptable ou non, type de donnes. Exemple d'attributs pour la classe ThesaurusConcept : identifiant(identifier), date de cration (created), de modification (modified) ; statut(status) ; notation ( notation ) ; concept de tte ( topConcept ). Exemple de proprit d'un attribut :
28

les identifiants sont de type de donnes string et sont

Consult le 10 juillet 2012 - UML (http://fr.wikipedia.org/wiki/Unified_Modeling_Language) et Diagramme de classes (http://fr.wikipedia.org/wiki/Diagramme_de_classes).

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

uniques.

Comment comprendre le diagramme UML ?

Clause 15, p.103 et 109

a) Caractristiques des attributs Obligatoire ou optionnel, et/ou rptable ou non 0..1 : optionnel et non rptable (zro ou un) 0..* : optionnel et rptable (zro ou plus) 1 : obligatoire, non rptable (un seulement) 1..* : obligatoire et rptable (un et plus) Types donnes string (chane de caractre) ; boolean (true/false) ; date ; language ; class ; association class. Exemples +lexicalValue : String[1] : l'attribut Valeur lexicale ( lexicalvalue ) d'un terme est de type chane de caractres ( string ) ; il existe obligatoirement une valeur et est non rptable (1) +lang:language[0..1] : l'attribut langue ( lang) d'un terme est de type langue (language), c'est-dire que les valeurs sont choisies dans la liste des codes pays ISO 639-1 (p.106 de la norme) ; cet attribut est optionnel (0) ou bien s'il existe, cet attribut n'est pas rptable (1). b) Caractristiques des associations Les associations entre classes sont reprsentes soit par trait simple lorsquelle sont de mme importance, soit par un trait possdant une extrmit un triangle ou un losange vide. Dans ces deux
11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

derniers cas, la smantique de cette association est la suivante : is-a : gnralisation ; est un type de - association entre deux classes dont l'une est gnrale (classe de base ou classe parent) et l'autre spcialise (ou sous-classe) ; cela se traduit par le concept dhritage, l'enfant hritant des attributs du parent formalisme du triangle. Par exemple : les sous-classes customNote , scopeNote , etc hritent des attributs de la classe "Note . has-a : agrgation ; relation partie/tout, d'inclusion - une classe constitue un tout compos de parties. L'agrgation est transitive formalisme du losange vide du ct de lagrgat . Par exemple : +isDefinitionOf[0..*] : l'association est une dfinition de ( isDefinitionOf ) avec le losange vers la classe ThesaurusTerm , indique que la classe Definition fait partie de la classe ThesaurusTerm .

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Annexe 4 : Ressources bibliographiques


O acheter la norme ISO 25964-1:2011, Thesauri and interoperability with other vocabularies. Part 1: Thesauri for information retrieval. Geneva: International Organization for Standards, 2011. Site Afnor
(http://www.boutique.afnor.org/NEL5DetailNormeEnLigne.aspx?CLE_ART=XS120446&nivCtx=NELZNELZ1A10A 101A107&ts=2801922)

Site ISO
(http://www.iso.org/iso/fr/iso_catalogue/catalogue_ics/catalogue_detail_ics.htm?ics1=01&ics2=140&ics3=20&csn umber=53657)

Site pour la documentation technique (NISO) - http://www.niso.org/schemas/iso25964/

Ressources complmentaires ISO 25964 : Vers une nouvelle norme pour l'organisation et l'accs l'information et aux connaissances, Michle Hudon, ISKO-France, 2011 (Rfrence en ligne). Rsum http://conferences.isko-france.asso.fr/fr/abstracts/sa1a.htm. Les actes sont sortis en mai 2012 chez Hermes Publication - http://www.amazon.fr/Lorganisation-connaissances-dynamismetechniques-linformation/dp/2746232278 Thsaurus documentaire, Michle HUDON, Techniques de l'Ingnieur, Thsaurus documentaire, Rfrence H7250, Date de publication : 10 nov. 2012 (http://www.techniques-ingenieur.fr/base-documentaire/technologies-de-l-information-th9/gestion-de-contenus-numeriques42311210/thesaurus-documentaire-h7250/) Les schmas de concepts et le Web smantique : la norme sur les thsaurus ISO 25964 et le Web smantique par Hlne Rabaut (Lexis Nexis) et Hlne Zysman (Smile - Open Source Solutions), Afnor/Bnf, 2011 (Prsentation en ligne) Une nouvelle norme pour le thsaurus : modles et perspectives l're du web smantique, Hlne Rabaut (Lexis Nexis) et Hlne Zysman (Smile - Open Source Solutions), ADBS, 2011 (Prsentation en ligne) The ISO 25964 Data Model for the Structure of an Information Retrieval Thesaurus, Leonard Will, ASIS, 2012 (Texte en ligne). From ISO 2788 to ISO 25964: the evolution of thesaurus standards towards interoperability and data modeling, Stella G. Dextre Clarke et Marcia Lei Zeng, In Information Standards Quarterly, Winter 2012, v.24, no. 1 (Texte pdf en ligne). Guide pratique pour l'laboration d'un thsaurus documentaire, Michle Hudon, avec la collaboration de Danile Dgez et Dominique Mnillet. Montral : Les ditions ASTED (diff. en France : ADBS), 2009. 274 p. ISBN 978-2-923563-17-6.

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Annexe 5 Organisation de la production de la norme ISO 25964


La norme ISO 25964, tout en restant en harmonie avec les normes et les systmes plus anciens, offre un cadre normatif renouvel. Pour conduire ce travail entre lancien et le nouveau , de nombreuses personnes dhorizons diffrents ont t impliques entre 2007 et 2012. Au sein de lISO 17 pays ont particip aux diffrents votes au sein de l'ISO. Le Groupe de travail ddi la ralisation de ces travaux, TC46/SC9/WG8 - Structured 29 vocabularies , pilot par Stella Dextre Clarke (UK), regroupe des experts de diffrents pays : Sylvie Dalbin (France) ; Johan De Smedt (Belgium) ; F. Javier Garca Marco (Spain) ; Michle Hudon (Canada) ; Daniel Kless (Germany) ; Traugott Koch (Germany) ; Richard Light (U.K.) ; Jutta Lindenthal (Germany) ; Marianne Lykke (Denmark) ; Esther Scheven (Germany) ; Douglas Tudhope (U.K.) ; 30 Leonard Will (U.K.) ; Marcia Zeng (U.S.). Au sein de lAfnor Entre 2007 et dcembre 2011, la France avait mis en place au sein de l'Afnor un Groupe de travail ddi (CG46/CN357/GE10) rattach la commission GC46/CN357 Modlisation, production et 31 accs aux documents de lAfnor, commission pilote par Franoise Bourdon de la Bnf. Le Groupe GE10 pour la production de la norme ISO 25964 tait compos de : Dominique Chichereau ; Sylvie Dalbin** ; Alina Deniau; Franois Feyler** ; Thierry Guillotin** ; Michle Lnart; Anne Martel ; Dominique Mnillet ; Mingam Michel ; Hlne Rabault** ; Virginie Triboulin; Bernard Vatant** ; Nathalie Yakovieff**; Hlne Zysman**. ** Participants llaboration de la Partie 2 de la norme ISO 25964 , en cours ddition (2013).
32

29 30 31 32

ISO TC46/SC9 - http://www.nexus.ao/RS/ISO/www.iso.org/iso/iso_technical_committee6fac.html?commid=48836 Project Organization sur le site ddi la norme - http://www.niso.org/schemas/iso25964/ Afnor CG46/CN357 - http://www2.afnor.org/espace_normalisation/structure.aspx?commid=6152 Information and documentation -- Thesauri and interoperability with other vocabularies -- Part 2: Interoperability with other vocabularies - http://www.iso.org/iso/catalogue_detail.htm?csnumber=53658

11 rue Francis de Pressens - 93571 La Plaine Saint-Denis Cedex - Tl. : +33 (0)1 41 62 80 00 - Fax : +33 (0)1 49 17 90 00

www.afnor.org

Вам также может понравиться