• Aucun résultat trouvé

2 Les langages documentaires

2.1 Rôle des langages documentaires

Après avoir défini et donné les fonctions des langages documentaires, nous allons voir quel est leur rôle pour la recherche et l’indexation, puis leurs différentes typologies.

2.1.1 Définition et fonctions

Il est important de définir ici la notion de « document », au sens documentaire du terme.

Cette notion renvoie, en effet, à l’objet d’étude documentaire au sens large et non pas seulement aux documents textuels. Au sein des musées, cette notion renvoie aux collections muséales et aux ressources utilisées autour de ces collections. Le document peut ainsi être un objet, un ouvrage, une image, du son, etc.

Les langages documentaires permettent justement de faciliter le repérage de ces documents et d’aider à la recherche de l'information en évitant les ambiguïtés et les pièges du langage naturel : la synonymie et la polysémie. Les langages documentaires qui sont des langages artificiels sont des ensembles de termes qui sont liés entre eux par des relations conceptuelles et lexicales et qui permettent de rendre compte des concepts contenus dans le document, mais aussi des instruments d’analyse conçus spécialement pour le traitement de l’information.

L’AFNOR définit ainsi le langage documentaire comme un « procédé conventionnel de représentation des informations d’un document sous une forme condensée et normalisée.

Langage artificiel, constitué de représentations de notions et de relations entre ces notions et destiné, dans un système documentaire, à formaliser les données contenues dans les documents et dans les demandes des utilisateurs ».

L’association des professionnels de l’information et de la documentation en donne également une définition précise11 : « langage contrôlé et normalisé utilisé dans un système documentaire pour l'indexation et la recherche. Un langage documentaire permet de représenter de manière univoque les notions identifiées dans les documents et dans les demandes des utilisateurs, en prescrivant une liste de termes ou d'indices, et leurs règles d'utilisation ».

Les langages documentaires ont donc trois fonctions principales : - normaliser la représentation des sujets des documents ; - permettre à l'utilisateur de "naviguer" entre des sujets voisins ;

- présenter le contenu des documents sélectionnés pour faciliter le choix définitif.

Les langages documentaires résultent d’évolutions de l’organisation des connaissances et de l’accès à l’information : accroissement du volume de l’information, modification des supports d’inscription, nouveaux modes de communication de l’information [6, MENON].

2.1.2 Indexation documentaire

Les langages documentaires, que nous allons décrire plus loin, sont ainsi des outils sémantiques, dont les termes et les règles d’utilisation permettent l’indexation documentaire.

Les concepts sont représentés par des termes12 et donne accès à un document ou à un corpus de documents.

Les principales fonctions de l’indexation documentaire sont :

- d’analyser puis de représenter le contenu d’un document par des concepts représentés par des termes ;

- de repérer et de retrouver l’information contenue dans un document par un terme comme point d’accès au document.

L’indexation est donc la représentation, par les termes d’un langage documentaire, de l’information résultant de l’analyse d’un document afin d’en faciliter la recherche.

L’indexation vise ainsi à représenter le contenu des documents : thèmes, sujets, aspects, etc.

11 Site internet de l’ADBS, Vocabulaire de la doc.

http://www.adbs.fr/langage-documentaire-17593.htm [consulté le 15/12/2013]

12 Concept : représentation mentale abstraite d’un objet, d’une idée conçue par l’esprit. Lié à un domaine de connaissance.

L’indexation peut être :

- manuelle : indexation par l’homme ; - automatique : indexation par la machine ;

- en texte intégral : indexation par la machine, qui contrairement à l’indexeur humain, doit analyser mot à mot pour en extraire le ou les sujets grâce aux liens sémantiques entre les termes ;

- libre : vocabulaire large proche des utilisateurs mais choix des termes sur la base d’un seul document et problèmes de synonymie et de polysémie ;

- contrôlée : utilisation d’un langage documentaire construit sur l’indexation de textes antérieurs et cohérents sur le plan terminologique.

2.1.3 Typologies des langages documentaires

Il existe trois types de famille documentaire : les classifications, les listes d'autorité ou listes de vedettes matières, et les thésaurus [7, SERRES]. Ces langages documentaires sont toujours largement utilisés mais les deux premières restent du domaine des bibliothécaires tandis que la troisième est plutôt réservée aux documentalistes.

Regroupement selon deux critères

Les langages documentaires peuvent être regroupés :

- soit selon la structure du langage et sont répartis entre les langages à structure hiérarchique (classifications et thésaurus) et les langages à structure combinatoire (listes d’autorité ou listes de vedettes matières et thésaurus) ;

- soit selon la coordination des concepts et sont répartis entre les langages pré-coordonnés (classifications et listes d’autorité ou listes de vedettes matières) et les langages post-coordonnés (thésaurus).

La pré-coordination et la post-coordination sont deux principes opposés mais aussi complémentaires dans l’utilisation des langages documentaires. Avec les langages pré-coordonnés, les combinaisons entre les termes d’un langage documentaire s’effectuent au cours de son élaboration ou au cours de l’indexation. Avec les langages post-coordonnés, les combinaisons entre les termes s’effectuent au cours de l’indexation ou au cours de la recherche documentaire.

Distinction selon la démarche d’indexation

Il existe deux démarches d’indexation :

- L’indexation systématique, qui est utilisée avec le langage à structure hiérarchique (classifications). Les concepts sont représentés sous une forme arborescente et chaque notion est située dans une « branche » précise, à un niveau de précision déterminé (construction du langage en classes, en sous-classes, en division, etc). Cette indexation se fait en langage codé (alphabétique, numérique ou alphanumérique).

- L’indexation analytique ou alphabétique, qui est utilisée avec le langage à structure combinatoire (listes d’autorité ou listes de vedettes matières et thésaurus). Les concepts sont juxtaposés, sous forme alphabétique, et les notions sont situées dans des cercles indépendants (ex. : pêche, histoire, Bretagne). Cette indexation s’opère au niveau d’un concept, ou d’une intersection de concepts.

Distinction selon la méthode de recherche

Ces types de langages documentaires induisent différentes méthodes de recherche : - la recherche sur un domaine : classifications ;

- la recherche sur un sujet : listes d’autorité ou listes de vedettes matières et thésaurus.

Tableau récapitulatif

Typologie langages documentaires

Structure du langage Coordination des

concepts Démarche d'indexation Méthode de recherche

Tableau 1 : Tableau récapitulatif des typologies des langages documentaires.

Inconvénients respectifs

Chaque type de langages documentaires peut avoir des inconvénients :

- Les classifications : ce type de langage a le désavantage de disperser les documents et les sujets, selon les disciplines et les points de vue. Mais il est possible de pallier cet inconvénient en le complétant par des index alphabétiques.

- Les listes d’autorité ou listes de vedettes matières et les thésaurus : ces types de langages qui induisent une indexation analytique rassemblent les sujets, mais dispersent les disciplines et les domaines voisins. Cet inconvénient peut être pallié en complétant les listes alphabétiques par des procédés de mise en relation (renvoi, etc).