Академический Документы
Профессиональный Документы
Культура Документы
Formation continue
Crdit de limage de couverture Tag cloud with wordle.net (Nuages de tags) de Luc Legay http://www.flickr.com/photos/luc/2590452226/
Support de cours des formations internes de la Bibliothque de lEPFL des 28 et 31 mars 2011
[] the solution to the overabundance of information is more information. (p.13) WEINBERGER, David. Everything is miscellaneous : the power of the new digital disorder. New York : Times Books, 2007
Vous avez le droit de rutiliser le contenu de ce document pour autant que cela ne soit pas des fins commerciales et condition que les documents drivs soient galement mis sous licence CC-BY-NC-SA. Dans tous les cas, mon nom doit tre mentionn. Pour de plus amples informations sur la licence, rfrez-vous au lien indiqu dans la mention lgale ci-dessous. Raphal Grolimund
This work is licenced under the Creative Commons Attribution-Non-Commercial-Share Alike 3.0 Unported License. To view a copy of this licence, visit http://creativecommons.org/licenses/by-nc-sa/3.0/deed.fr or send a letter to Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA.
0. Intro
Rcapitulons quelques lments vus dans la 1re partie (Quest-ce que le web 2.0 ?) qui vont nous servir de base pour le cours daujourdhui. 1. Le web 2.0 permet linternaute de passer du rle de simple consommateur celui de producteur ou diffuseur dinformations. En crant un blog, en postant des vidos sur Youtube ou des photos sur Flickr, tout internaute peut partager ses crations ou ses ides sans avoir connatre le HTML ou un langage de programmation. Cette activit nest donc plus rserve aux webmasters. 2. Tous les internautes peuvent aujourdhui dcrire et classer des ressources (ex. Delicious) En plus de crer ou de diffuser du contenu, linternaute peut dcrire ce quil met disposition aussi bien que ce que les autres mettent disposition. Il a donc dsormais le choix entre un moteur de recherche et des sites du type Delicious pour effectuer ses recherches1. 3. Le moyen de description le plus largement rpandu dans les outils 2.0 est le tag. Un tag est un mot qui dcrit une ressource et partir duquel une nouvelle recherche peut tre lance. Cest un mot-cl, une catgorie, une mtadonne. Les tags sont souvent prsents sous forme de nuage. Lintrt dun tel nuage est que les tags les plus employ ressortent tout de suite du lot, car la taille des mots est proportionnelle leur frquence.
Figure 1 : Nuage de tags cr partir d'un travail de diplme (cr sur Wordle.net)
1
Un moteur de recherche indexe le contenu des sites web en se basant sur ce que le webmaster a donn comme information. Delicious permet aux internautes de dcrire ces mmes sites web avec leurs propres mots. Dans le premier cas, la recherche sopre sur les mots-cls choisis par les webmasters, alors que dans le deuxime cas, elle seffectue sur les tags et descriptions des internautes qui ont trouv le site web intressant.
partir de ces lments, nous pouvons nous lancer dans la dcouverte des folksonomies.
Notes personnelles
Notes personnelles
Ces 2 exercices devraient avoir mis en lumire 2 choses. 1. Les folksonomies souffrent dun manque de structure - faut-il choisir le pluriel ou le singulier ? - que faire avec les synonymes ? faut-il tous les mettre ? - comment rendre compte des relations entre les tags ? - dcrirez-vous ces ressources de la mme manire dans 1 an ? 2. Les folksonomies sont la fois un systme de description et un systme de classement - un tag est aussi une catgorie - chaque collection de ressources lie un tag peut tre considre comme un dossier - toute catgorie peut tre la sous-catgorie de nimporte quelle autre catgorie cela il faut ajouter 2 points qui ne dcoulent pas directement de ces exercices. Les folksonomies sont trs faciles mettre en uvre. Aucun apprentissage nest requis puisque chacun fonctionne comme il veut. Lautre force des folksonomies est leur volutivit. Les nouveaux termes peuvent tre adopts trs rapidement. Folksonomie est un mot-valise bas sur folks (qui signifie les gens, Monsieur Tout-le-monde en anglais) et taxonomie. Cette dfinition recoupe bien les observations que nous avons pu faire jusqu maintenant. Reste que la notion de folksonomie recouvre 2 ralits trs diffrentes. Dun ct, il y a des plateformes sur lesquels seul le crateur dune ressource peut la taguer (ex. Youtube) et dautres o tout le monde peut taguer (ex. Delicious, Amazon). Les premires produisent des narrow folksonomies et les secondes des broad folksonomies. Au sens strict, une narrow folksonomy nest pas vraiment une folksonomie, car il lui manque laspect collectif, communautaire. Lautre diffrence majeure rside dans le fait quune broad folksonomy autorise lanalyse de la frquence dun tag sur une ressource. Si on considre que plus un tag est utilis par les internautes pour dcrire une ressource, plus il peut tre considr comme pertinent, on obtient des candidats-descripteurs. Les tags les plus pertinents sont appels des power tags (voir Peters 2009, pour plus de prcisions). Dans une narrow folksonomy, comme il ny a quun indexeur , les tags ne peuvent apparatre quune fois par ressource. Une analyse des tags lchelle de la plateforme reste possible mais noffre pas le mme intrt. 10
11
Sur les pages suivantes, vous trouvez quelques exemples dindexation de livres par la Library of Congress et par les utilisateurs de LibraryThing. Le choix de la Library of Congress est simple : cest un centre de catalogage et dindexation mondialement reconnu. Le choix de LibraryThing est tout aussi simple : la plateforme compte 1.3 millions de membres2, ce qui est suffisant pour ce faire un avis sur les pratiques du grand public en matire dindexation de livres. Le premier exemple a t emprunt une prsentation de Tim Spalding, fondateur de LibraryThing (voir webographie), qui avait une bonne raison de choisir cet exemple
12
Figure 2 : Description de Neuromancer dans l'OPAC de la Library of Congress (consult le 25 mars 2011)
Les connaisseurs savent que Neuromancer est un roman de cyberpunk. Cela napparat pourtant pas dans lOPAC de la Library of Congress. Il ny a dailleurs que 5 entres comptant cyberpunk comme mot-cl 13
Figure 4 : Description de Brigdet Jones's Diary dans l'OPAC de la Library of Congress (consult le 25 mars 2011)
Figure 5 : Description de Bridget Jones's Diary sur LibraryThing (consult le 25 mars 2011)
L, encore le genre chick lit est absent de la description de la Library of Congress, alors que cest lun des tags les plus appliqus ce livre sur LibraryThing. Le terme chick lit est apparu aux Etats-Unis en 1996, alors que le roman dHelen Fielding est paru lanne suivante. Le terme navait pas encore tait popularis au point que les bibliothques lemploient pour dcrire des livres. Sur LibraryThing, par contre, un terme nouveau comme celui-l a rapidement t adopt. 14
Figure 6 : Description de Tintin au Congo dans l'OPAC de la Library of Congress (consult le 25 mars 2011)
Ce cas est un peu diffrent. Le descripteur French wit and humour laisse perplexe (il y a 44 entres pour ce sujet dans le catalogue de la Library of Congress). Le fait quil ne soit pas trs parlant est une chose. Le fait que ce soit le seul descripteur est plus tonnant. Sur LibraryThing, les termes comics, adventure et Africa sortent du lot. Ils nont rien de rvolutionnaire mais sont plus pertinents.
15
4. Conclusion et perspectives
Les OPACs 2.0 offrent la possibilit aux utilisateurs de taguer des notices. Les descriptions des bibliothcaires et celles des utilisateurs sont dj susceptibles de cohabiter. En pratique, autant les internautes taguent beaucoup les ressources du web, autant ils ne le font pas encore beaucoup sur les OPACs. Il faut dire que les OPACs 2.0 ne sont pas encore trs rpandus. Mais le temps o les lecteurs donneront leur avis et dcriront les documents des bibliothques avec leurs propres mots nest peut-tre plus trs loin.
Figure 8 : Les utilisateurs peuvent ajouter des tags dans Swissbib, mais les recherches n'en tiennent pas compte
Du ct des folksonomies, des tudes portent maintenant sur leur gestion et leur optimisation. Cela sappelle le tag gardening. Il sagit dessayer de rcuprer des folksonomies et de les optimiser par des processus automatiques (voir Peters et Weller 2008). Les folksonomies tant aujourdhui trs rpandues, la question de la gestion des tags sur diverses plateformes se posent galement. TagCare, initiative de la Heinrich Heine Universitt de Dsseldorf, propose une gestion centralis de ces tags en provenance de divers sites (actuellement, Delicious, Flickr et Youtube sont pris en charge).
16
Ces initiatives tendent faire entrer les folksonomies dans un moule, les structurer et les hirarchiser. Ce qui nous ramne doucement vers un vocabulaire contrl Comme quoi.
17
5. Bibliographie
Pour chaque document, la langue est indique et le lien permanent vers la notice Swissbib est fourni.
Folksonomies
AHARONY, Noa. Librarians and information scientists in the blogosphere: An exploratory analysis. Library & Information Science Research, sept. 2009, vol. 31, no 3, pp. 174-181. En anglais Disponible lEPFL (ScienceDirect) GUY, Marieke, TONKIN, Emma. Folksonomies. D-Lib Magazine, 2006, vol. 12, no 1. En anglais Accessible en ligne : http://www.dlib.org/dlib/january06/guy/01guy.html, consult le 25 mars 2011 KAKALI, Constantia, PAPATHEODOROU, Christos. Exploitation of folksonomies in subject analysis. Library & Information Science Research, juillet 2010, vol. 32, no 3, pp. 192-202. En anglais Disponible lEPFL (ScienceDirect) LE DEUFF, Olivier. Folksonomies : les usagers indexent le web. Bulletin des Bibliothques de France, 2006, vol. 51, no 4, pp. 66-70. En franais Accessible en ligne http://bbf.enssib.fr/consulter/bbf-2006-04-0066-002, consult le 25 mars 2011 PETERS, Isabella. Folksonomies : indexing and retrieval in Web 2.0. Berlin : De Gruyter, 2009. (Knowledge & information). En anglais Disponible dans NEBIS : http://tinyurl.com/nebis-folks PETERS, Isabella, WELLER, Katrin. Tag Gardening for Folksonomy Enrichment and Maintenance. Webology, sept. 2008, vol. 5, no 3. En anglais Accessible en ligne http://www.webology.ir/2008/v5n3/a58.html, consult le 25 mars 2011
La bibliographie du cours est disponible ici : http://www.zotero.org/groups/epflweb2.0/items, dans le dossier cours 2 folksonomies. Vous pouvez parcourir la bibliographie et vous abonnez au flux RSS pour tre averti des nouveaux ajouts. 18
Si vous avez un compte Zotero, vous pouvez en plus importer les rfrences directement dans votre bibliothque personnelle.
19
6. Webographie
La webographie regroupe majoritairement les ressources utilises pour les exercices. Pour y accder, rendez-vous sur http://www.delicious.com/formation_web2.0/EPFL-folks. Le compte Delicious qui regroupe les ressources sur le web 2.0 est formation_web2.0. Toutes les ressources lies ce cours ont t tiquetes avec le tag EPFL-folks. Il nest pas ncessaire de vous connecter pour les rechercher et les consulter. En vous connectant, vous pouvez ajouter formation_web2.0 dans votre rseau afin de pouvoir en consulter toutes les ressources directement depuis votre compte. Vous pouvez aussi choisir den sauver quelques-unes dans votre compte. Le bouton SAVE qui apparat quand vous survolez un lien vous permet de sauver ce lien dans votre compte.
20