• Aucun résultat trouvé

Dans un premier temps, il serait intéressant de spécifier la notion d’

« interopérabilité » que beaucoup confondent encore avec compatibilité. Voici comment Patrice Landry53 conçoit ce principe : « On définit l’interopérabilité comme la capacité de plusieurs systèmes à communiquer entre eux sans ambiguïté et à échanger de l’information sans difficulté ». Toutefois, la nuance entre les deux idées est mince : la compatibilité désigne la communication entre deux systèmes A et B tandis que dans le cas de l’interopérabilité, il n’y a pas de restriction du nombre.

2.1. Les technologies du Web sémantique

Comme nous l’avons vu précédemment, l’adaptation des langages documentaires ou ontologies à l’environnement du Web nécessite un panel de dispositifs dont SKOS. Ces dispositifs dépendent eux-aussi de protocoles établis par le W3C pour rendre les liens sémantiques possibles. Cependant, la multiplicité des « langages » qui constituent les fondations du web sémantique tend à complexifier cette infrastructure. Je m’efforcerai donc de proposer une démonstration assez brève des standards du W3C les plus représentatifs en définissant chaque élément séparément :

RDF (Ressources Description Framework) : c’est un modèle de graphes censé représenter les diverses ressources du web et leurs métadonnées de manière à en permettre le traitement automatique. En outre, elle favorise l’interopérabilité en annotant des documents ou applications non structurés sur le Web. Un document modélisé par RDF est composé de trois éléments :

- Le sujet = la ressource à décrire

- Le prédicat = un type de propriété correspondant à cette ressource - L’objet = il représente une autre donnée ou une autre ressource

RDF sert de base à de nombreux langages édifiés par le W3C, tels que RDFS ou OWL pour les ontologies, SKOS pour la représentation des thésaurus, Dublin Core pour le classement bibliographique ou encore FOAF pour la description des personnes (celui-ci est nettement moins connu)

RDFS (Ressources Description Framework Schema) : il complète le langage RDF en précisant les données définies par celui-ci.

53 Patrice Landry, Multilinguisme et langages documentaires : le projet MACS en contexte européen, Documentation et Bibliothèques, avril/juin 2006, p 121

48

OWL (Ontology Web language) : Langage conçu pour représenter et modéliser des ontologies, notamment des thésaurus. Il est basé sur une structure RDF traduite en langage XML. Il est considéré par les spécialistes comme une extension de RDF. Il est décliné en trois variantes : OWL-Lite, la version la plus simple, OWL-DL et OWL-Full.

URIs (Uniform Ressource Identifiers) : Ce sont des composants du web actuel et qui deviennent fondamentaux dans le contexte du Web sémantique. Ils rendent non seulement possible l’identification des ressources sur Internet mais également de créer du lien entre elles.

XML (Extensible Markup language) : Il sert à stocker et à transférer des données structurées en arborescence. C’est un langage de mise en forme, contrairement à l’HTML qui se contente d’ordonnancer les données avec des hyperliens. Les deux langages se juxtaposent et on utilise aujourd’hui l’appellation XHTML.

Le schéma ci-dessous a pour fonction de synthétiser de la manière la plus simple possible la structuration du Web sémantique.

49

URIs

2.2. Le multilinguisme comme facteur d’interopérabilité

L’interopérabilité passe aussi par le multilinguisme. L’accès « universel » à l’information étant l’objectif ultime du web sémantique, l’internaute doit pouvoir, en s’exprimant dans sa langue maternelle, trouver le renseignement qu’il lui faut, fût-il en japonais, russe ou en anglais,. Malheureusement, il faut encore de nos jours recourir à ses propres connaissances linguistiques ou recourir à des dictionnaires pour traduire les documents qui nous intéressent. Les applications Web telles que Google translate peuvent dépanner mais les traductions ne sont pas toujours très pertinentes (quand ce n’est pas à la limite du comique !).

Avant même l’ère d’Internet, des tentatives pour rendre compatibles plusieurs thésaurus de langues variées avaient vu le jour et avaient été couronnées de succès. On

50

peut par exemple citer l’UMLS54 , le ROOT thésaurus ou bien le thésaurus de l’UNESCO, l’integrated Multilingual thésaurus, établis au format de communication MARC. La bibliothèque du congrès a également converti son répertoire de vedettes-matière, les LCSH, au multilinguisme. Le Canada en a fait autant avec le RVM Laval mais seulement en version anglaise et française.

Le développement du Web et la variété de ressources qu’il contient ont impulsé de nouvelles initiatives. En effet, des classifications, telles que Dewey et sa transposition sur Internet, WebDewey, se sont vues insufflées et projetées sur la toile. Plusieurs thésaurus ont été mixés et ont donné lieu à des métathésaurus grâce à un système de traduction manuel ou automatique. TermSciences en est un exemple assez parlant.

Préoccupée par cette problématique du multilinguisme, la CENL55 a mis au point en 1997 le projet MACS, en concertation avec quatre bibliothèques : la BN de Suisse en tant que pilote du projet, la BNF François Mitterrand, la DNB d’Allemagne et la British Library. Le but était de favoriser l’accès aux catalogues de bibliothèques en ligne dans un contexte multilingue. Pour ce faire, elles ont procédé à une mise en concordance des termes dans les langages d’indexation, sans passer par une traduction automatique des vedettes. L’objectif n’était pas de créer un métathésaurus multilingue mais de créer des équivalences entre des

« grappes conceptuelles » d’une langue à l’autre. Les expérimentations du projet MACS ont été validées par la CENL en janvier 2005. Un des inconvénient de MACS est sa mise en pratique sur le Web, des études sur l’infrastructure seraient toujours en cours pour rendre efficient cet outil.

Ainsi, comme nous venons de le voir, les langages documentaires ont un avenir au sein du Web sémantique. Ils constituent une aide à la structuration et modélisation des données. Les professionnels de l’AFNOR ou de l’IFLA les ont d’ailleurs regroupés sous le terme de « référentiels »56. La question de l’interopérabilité ou de l’harmonisation des outils documentaires prend tout son sens dans cette optique de développement de Web sémantique. Cela a également l’avantage de faire collaborer des professionnels qui n’avaient jusqu’ici que peu d’occasions de se rencontrer, de partager des connaissances et de trouver des consensus. En effet, d’aucuns57 reprocheront au Web de déformer, d’ « affaiblir » les langages documentaires. Cependant, n’est-ce pas le prix à payer pour pouvoir les adapter au Net, sans lequel ils seraient sans doute voués à une mort certaine ? Il me paraît légitime de se poser la question. D’autant qu’au XXIème siècle, la flexibilité est de rigueur, on demande de plus en plus aux individus une certaine plasticité cérébrale pour assimiler sans cesse de

54 Unified Medical Language System

55 Conférence des bibliothèques nationales européennes

56 Muriel Amar, Référentiels, données d’autorité, thésaurus, ontologies, taxonomies … pour en savoir plus ! , Documentaliste-Sciences de l’information, 2007, Vol 45, n°3, p 14

57 Bruno Menon, Optimiser l’accès à l’information, une opportunité pour les langages documentaires ?, Journée d’étude ADBS, Documentaliste-Sciences de l’information, 2007/6, Vol 44, p 387

51

nouvelles informations ou concepts, il paraît donc normal que les objets ou les outils subissent eux-aussi cet état de fait pour s’assurer une place dans ce monde virtuel.

Cependant, la mise en place du Web sémantique et de l’interopérabilité rencontre quelques obstacles. Dans un premier temps, on observe qu’il est assez difficile finalement de construire des ontologies58, surtout si l’on considère le fait qu’elles sont elles-mêmes des versions améliorées des thésaurus. Les techniciens veilleront à établir une méthodologie qui prendra en compte le maintien et l’interopérabilité avec d’autres types de ressources du Web. Ensuite, vient la question des métadonnées, le réflexe d’enregistrer des informations décrivant des ressources n’est pas encore acquis et elles doivent respecter un certain formalisme. Les langages qui permettent cette interopérabilité sont également multiples et complexes. Enfin, le Web sémantique est un projet très ambitieux et sa mise en œuvre occasionne des coûts très élevés, que certaines organisations pourront supporter et d’autres pas.

58 Bruno Menon, le web sémantique : de nouveaux enjeux documentaires ?, Journée d’étude ADBS/IUT Paris V , Documentaliste-Sciences de l’information, 2003, vol 40, n°6 p 387

52