• Aucun résultat trouvé

Quels terrains ?

DANS UN PAYSAGE EN RECOMPOSITION CONSTANTE

1.3 Organiser et structurer les connaissances : différentes approches

Le domaine de l’organisation des connaissances est investi par les bibliothécaires, les docu- mentalistes, les archivistes et autres professionnels de la représentation et du repérage des documents, qui se saisissent de ces problématiques dans le but de construire des systèmes cohé- rents et structurés permettant d’organiser les connaissances afin d’en permettre l’accès (Hudon et Hadi, 2010, 2012). Progressivement, les problématiques relatives à l’organisation des con- naissances ont été étudiées par d’autres approches théoriques et disciplinaires : linguistes, terminologues, informaticiens, ingénieurs, sociologues, etc. Les frontières conceptuelles du domaine se sont ainsi élargies pour appréhender les nouvelles réalités de la gestion, du traite- ment, de la diffusion et de l’accès à l’information transmise, quel que soit le support matériel

des documents23.

19

Cela est peut-être pertinent pour des recherches fréquentes par de nombreuses personnes de choses courantes. Pour des recherches plus ponctuelles (sur une problématique précise et rare, par exemple) sans forcément la masse critique, le nombre de consultations n'est pas forcément un indice. De plus, on consulte parfois un document dont le titre est promet- teur, mais le clic ne prend pas en compte si le document a servi à celui qui a cliqué (parfois il y a des formulaires qui posent la question en fin de page).

20

Il s’agit d’un point de vue européo-centré, Bing aux États-Unis est très utilisé et Baidu en Chine.

21

REX : Retour d’expérience. Cf. Présentation du projet TIREX (en annexe 11) et étude exploratoire CNPE.

22

Evoquer ici les nombreux colloques et congrès sur ces questions, comment ils formulent ces questions et comment ils se positionnent. Sur la demande de la société d’avoir des réponses à ces questions (cf. Congrès SFSIC 2012).

23 « Les principes qui ont servi jusqu’ici d’ancrage à nos activités, le contrôle du vocabulaire, la règle de spécificité, la

caution bibliographique et l’organisation logique du général au spécifique ne suffisent plus pour gérer la complexité grandissante de l’univers du savoir ainsi que la diversification des besoins et des comportements informationnels. Cette réflexion est essentielle à la transformation des modèles et structures existantes conçus par et pour des analystes et usa- gers humains en structures exploitables par des moteurs de recherche. »Appel à communication, diffusé en juin 2011 au Congrès d’ISKO-France.

INTRODUCTION GÉNÉRALE

42

Indexer, catégoriser, classer, classifier, organiser, tagger ou marquer les ressources informa- tionnelles et documentaires, constituent autant d’opérations ayant pour objectif d’organiser l’accès à un fonds documentaire et à des ressources informationnelles. Ils renvoient à différents systèmes d’organisation des connaissances : taxinomies associées aux systèmes de classifica- tion, thésaurus, ontologies formelles ou sémiotiques, folksonomies, etc. Nous utilisons la notion de systèmes d’organisation des connaissances (SOC) à la suite de Hodge (2000) pour regrouper dans une « dénomination unique aussi bien les langages documentaires, les schémas de classification que les langages de représentation des connaissances issus de l’Intelligence Artificielle » (Zacklad, 2011). En suivant ce dernier, peuvent être également considérés comme des SOC les index de moteurs de recherche automatique. Les SOC, en tant qu’outils de classe- ment, de classification, de description, de représentation, constituent autant d’auxiliaires à la recherche. Leur conception et leur utilisation posent en ce sens un ensemble de probléma- tiques24.

La catégorisation et la classification sont des processus qui peuvent être instinctifs ou au con- traire réfléchis et contrôlés. À partir des travaux de Hudon (2009), on définit la classification comme l’opération qui consiste à organiser des entités en classes, de sorte que les entités sem- blables ou parentes sont regroupées et clairement séparées des entités non semblables ou qui leur sont étrangères. La classe est un ensemble d’entités qui présentent une ou plusieurs carac- téristiques communes. Par extension, la classification documentaire est l’opération qui consiste à regrouper en classes les documents semblables ou liés, en les séparant des documents avec lesquels ils n’entretiennent aucun lien ou n’ont aucune caractéristique commune. Plusieurs critères peuvent être utilisés, seuls ou en combinaison, comme base de regroupement : un attri- but physique (forme, dimension, support), un destinataire ou un ensemble de destinataires, une thématique, la valeur accordée au document (document de référence). Lorsque la thématique sert de premier critère pour regrouper les documents, la classification documentaire a pour fonction de :

• représenter le plus clairement et le plus précisément possible la ou les thématiques abordées dans le document ;

• situer cette thématique dans une structure générale d’organisation des connaissances et des savoirs ;

• fournir une ou plusieurs clés d’accès au document et plus précisément à son contenu ;

• servir au rangement des documents imprimés (traditionnellement).

Le plus souvent, la classification est fondée sur la thématique du contenu du document. Plu- sieurs structures classificatoires prennent en compte d’autres critères de regroupement : la perspective adoptée et les objectifs formulés par les auteurs, les destinataires, la valeur attri- buée au contenu, la forme et le support. L’opération de classification implique ainsi en pratique l’identification d’une thématique principale et de thématiques secondaires, l’identification des

24 Cf réflexions de Yann Potin, atelier Atelier “Catalogues, inventaires et bases de données”, 1er mars 2011, Musée du

quai Branly. Voir également notes de la journée d’étude “la catégorie comme accès, la catégorie comme limite”, Serda / Sorbonne, 10 février 2011.

INTRODUCTION GÉNÉRALE 43

classes spécifiques correspondant aux thématiques du document, la localisation des classes choisies dans une structure taxinomique ou un système de classification.

Comme nous l’avons déjà écrit, avec l’expansion du Web, la production et la publication crois- santes de ressources informationnelles dans divers environnements, le rôle et la place de l’utilisateur ont considérablement évolué. Depuis l’avènement du Web dit 2.0, l’individu jusqu’alors considéré comme un utilisateur passif est désormais devenu un acteur à part entière, contribuant et interagissant sur la toile – un des exemples les plus marquants est l’encyclopédie collaborative Wikipédia, devenue une ressource de référence et d’actualités. Devant cette dy- namique de production, de nouvelles approches et de nouveaux outils apparaissent, parmi lesquels les folksonomies et l’indexation collaborative. Ces dernières se présentent comme de nouvelles formes d’auto-organisation, censées traduire l’adaptation des systèmes à la diversité des classements réalisables par les utilisateurs. Ces modèles d’organisation des connaissances se sont surtout diffusés sur les sites de partage et d’échange de contenus tels que Flickr, Deli- cious ou encore Youtube. Les approches qu’ils portent et les techniques sur lesquelles s’appuient ces modèles d’enrichissement collaboratif de contenus intéressent de plus en plus différentes communautés professionnelles et scientifiques et font l’objet de nombreux travaux de recherche comme de développement (web sémantique et web socio-sémantique). Si l’indexation sociale et les folksonomies, qui reposent sur l’idée de construction collective de formes plurielles de classement, présentent ainsi un intérêt indéniable, elles ignorent le principe de structure et les problèmes de synonymie et de polysémie. Plusieurs initiatives ont vu le jour ces dernières années : XHTML, RDF, Linked Open Data, exemple de DBpedia.org.

Documents relatifs