• Aucun résultat trouvé

Le web sémantique : une technique pour la documentation

Les bibliothèques numériques : des nouveaux acteurs sur le web

6.1 Valoriser les pratiques documentaires

6.1.1 Le web sémantique : une technique pour la documentation

Nous avons abordé dans le chapitre 2 la notion de médiation documentaire. Nous avons indiqué que cette médiation permet d'établir un lien entre un document et un professionnel de l'information par l’intermédiaire de la technique et du traitement documentaire. Autrement dit, il s'agit de représenter d'une manière intellectuelle le contenu des documents afin de faciliter leur accès. Cela entraîne une médiation des savoirs qui permet de mettre en relation un document et un utilisateur. Dans le contexte des bibliothèques numériques, il s'agit d'une médiation « cachée » dont l'objectif est de mettre en lien un document et un utilisateur par l'intermédiaire des métadonnées. Ces dernières permettent, d'une part, d'identifier et de structurer les données, et d'autre part, d’établir un lien entre l'usager et l'information en facilitant notamment l'accès au contenu numérique.

Nous parlons d'une médiation cachée parce que l'utilisateur ne se rend pas compte du travail exercé derrière l'information pour y accéder, et parce que le professionnel de l'information n'est pas en contact direct avec l'utilisateur pour répondre à ses besoins.

Cette médiation cachée continue d'être présente et même mise en valeur dans le contexte du web sémantique en bibliothèques numériques. Pour Jean-Michel Salaun et le collectif Roger T. Pédauque, c'est un mouvement de redocumentarisation, dans le sens où documentariser signifie traiter un document comme le font traditionnellement les professionnels de l'information [Pédauque, Salaun, 2005, 2006, 2007, 2008]. Ce mouvement implique un retour aux techniques documentaires et aux méthodes de classification et d'indexation exercées par les professionnels de l'information pour structurer l'information [Dalbin et al., 2011] et pour optimiser l'usage du document en permettant un meilleur accès à son contenu et une meilleure mise en contexte [Salaun, 2008].

Dans le tableau 6.1 ci-dessous, nous présentons les techniques de traitement utilisées dans le cadre du web sémantique et dans celui des bibliothèques numériques.

Web sémantique Bibliothèques numériques Techniques

d'identification

Des identifiants uniques (URI) Des identifiants uniques (ISBN,

ISSN, DOI etc.)

Techniques de

description

Indexation structurée en XML (métadonnées)

Catalogage ; Indexation contrôlée (vocabulaire contrôlée, récemment en XML)

Techniques de liaisons Le triplet RDF Des modèles conceptuels (FRBR, FRAD etc.)

Tableau 6.1 – Les techniques de traitement des données utilisées dans le cadre du web sémantique et des bibliothèques numériques

Comme le montre le tableau 6.1, les techniques utilisées pour traiter les documents en bibliothèques numériques et dans le cadre du web sémantique sont très similaires. Dans les deux cas, il s'agit d'identifier les documents et les données pour mieux les repérer. Ensuite, il s'agit de les décrire pour structurer et représenter le contenu des documents par des métadonnées afin de faciliter leur accès. Enfin, il s'agit de relier les données entre elles. Le web sémantique s'appuie sur le triplet RDF pour lier les données, tandis qu'en bibliothèques numériques, les relations entre les données peuvent se faire grâce à des modèles conceptuels comme le FRBR. Ce dernier permet de créer des relations entre les données bibliographiques et les données d'autorités (sujet, auteur).

La différence essentielle réside dans l’élément de base utilisé. Avec le web sémantique, le traitement documentaire se concentre autour de la donnée et non pas autour du document comme c'est le cas en bibliothèques numériques. Autrement dit, il s'agit en bibliothèques numériques d'identifier et de décrire les documents (un livre, un article, etc.), et dans le cadre du web sémantique d'identifier et de décrire les données (le nom d'un auteur, un lieu, etc.). Cela a pour effet de décomposer le document et par conséquent d’accroître ses possibilités de traitement ainsi que son utilisation. Chaque donnée identifiée et décrite peut être facilement liée à d'autres données sur le web, ce qui permet de multiplier les points d'accès à ce document ainsi que son usage.

Dans l'état de l'art, nous avons évoqué la question de l'évolution des métiers de la documentation. Selon Suzanne Briet et Jean Meyriat, la documentation dépend de la technique et du travail intellectuel (Briet, 1951 ; Meyriat, 1981), dans le sens où son développement est étroitement lié aux protocoles et standards utilisés pour identifier, décrire, échanger et faciliter l'accès à l'information. Dans le contexte des bibliothèques numériques, une approche orientée usager du web a permis de développer des formats de description des ressources numériques (Dublin Core, FRBR, MODS etc.) et des protocoles (Z39.50 et OAI-PMH) afin de favoriser les échanges et l’interopérabilité entre les

différents acteurs de l'information (bibliothèques, archives, musées etc.). L'objectif est d'offrir aux usagers un accès facile aux différentes ressources numériques provenant de ces diverses communautés. Cependant, cette approche orientée usager ne prend pas en compte les pratiques des internautes qui cherchent l'information sur le web en utilisant les moteurs de recherche [Bermès et Poupeau, 2012], qui sont considérés comme les points d'entrées pour naviguer sur l'internet [Illien et al, 2013]. Non référencés par les moteurs de recherche, les contenus des bibliothèques numériques restent cachés dans le web invisible [Ibid]. Afin d'améliorer leur visibilité, les bibliothèques numériques peuvent intégrer l'architecture du web. Cela nécessite donc d'adopter les standards du web permettant d'identifier, de décrire et de diffuser les ressources numériques tout en répondant aux besoins des utilisateurs du web.

Dans cet esprit, nous considérons le web sémantique comme une technique offrant aux bibliothèques des standards qui font évoluer leurs services tout en préservant les pratiques professionnelles de type documentaire. Autrement dit, les standards du web sémantique permettent aux bibliothèques numériques de diffuser leurs données sur le web ainsi que d'améliorer leur visibilité [Baker et al, 2011 ; Illien et al, 2013, Bermès et al, 2013]. Les bibliothèques numériques offrent à leur tour des données structurées parfaitement adaptées à un usage au sein du web sémantique.

De cette façon, les bibliothèques numériques peuvent devenir des acteurs importants dans le développement du web sémantique, et ceci en introduisant leur expertise de type documentaire à travers la gestion des métadonnées. Plus précisément, les professionnels de l'information, grâce à leurs expériences de description des contenus et leurs connaissances en termes de besoins d'informations, peuvent envisager de nouvelles fonctionnalités aux outils du web sémantique [Menon, 2003].

Les résultats de la première enquête ont montré que les professionnels de l'information (7 réponses

sur 9)79 considèrent que leur métier est en évolution permanente et que leurs pratiques

documentaires rejoignent les objectifs du web sémantique. De plus, les résultats ont montré que les professionnels de l'information pensent que le web sémantique est important pour le futur des bibliothèques numériques (32 réponses sur 33). Certains enquêtés considèrent que le web sémantique permet aux bibliothèques numériques de se positionner comme des acteurs importants sur le web. Ci-dessous quelques extraits tirés du questionnaire et illustrant ces points de vue :

« Devenir acteur du web sémantique est la voie naturelle pour les bibliothèques, la seule

79 Résultats de la question : Est-ce que l'utilisation du web sémantique a changé vos pratiques documentaires ? (Questionnaire)

en tout cas qui permettrait aux bibliothèques d'exister et de peser dans la société [Q30] » « Le web sémantique permettra aux bibliothèques de sortir de l'univers qui leur est propre et d'être un acteur déterminant du web.[Q03] »

De même, les résultats de la seconde enquête (6 réponses sur 10)80 ont montré que les

professionnels de l'information considèrent que le web sémantique fait partie de l'évolution du métier et qu'en adoptant ses standards, les bibliothèques numériques peuvent devenir des acteurs sur le web. Possédant des collections numériques de valeur et d’intérêt social et culturel, les bibliothèques numériques ont un rôle important à jouer dans la diffusion des savoirs dans la société. Ci-dessous quelques extraits tirés des entretiens et illustrant ces points de vue :

« On a un rôle de devenir acteur du web sémantique, ce n'est pas simplement être présent sur le web et être visible, à mon avis, c'est être acteur du web sémantique et essayer de faire entendre notre voix auprès de ceux qui font l'architecture du web, auprès de W3C. C'est essayer de peser sur les choix stratégiques pour essayer d'améliorer la société, tout simplement, ça fait aussi partie des missions des bibliothèques. Je pense qu' au contraire, si on n'arrive pas à relever ce défi, on risque de devenir des établissements de seconde zone et de moins en moins fréquentés »[E7] « L'enjeu est aussi de passer d'un paradigme où on était centré sur le document à un paradigme où on est centré sur l'information et sur la donnée […] donc l'enjeu est de passer du catalogue centré sur le document au catalogue centré sur l'information»[E10]

Ensuite, les résultats de la deuxième enquête (7 réponses sur 10)81 ont montré que les pratiques

documentaires sont les plus mobilisées dans la mise en place du web sémantique en bibliothèques numériques. Il s'agit des compétences liées au traitement des documents : l’identification, la description et l'indexation. Ci-dessous quelques extraits tirés des entretiens et illustrant ce point de vue :

« Pour moi toute la partie indexation, c'est clairement sur ces compétences là qu'on va apporter, [..] le cœur de notre métier va être même mis en valeur. J'espère que dans le web sémantique, cette partie d’enrichissement, par le biais de l'indexation et de la gestion des référentiels, va être mis en valeur»[E8]

«ce sont des compétences documentaires classiques de type description, indexation, catalogage »[E1]

« C'est un enjeu pour les bibliothèques de proposer des métadonnées de qualité, justement les données des bibliothèques sont des données établies selon un consensus confiant et rationnel. Elles ont été vraiment sélectionnées et validées au niveau de leur qualité, et c'est vraiment là où les bibliothèques ont une carte à jouer, et d'autant plus l’intérêt de rendre visible leur métadonnées, et là on voit l’efficacité du facteur humain face aux algorithmes »[E2]

80 Résultats de la question portant sur les enjeux du web sémantique en bibliothèques numériques (Entretiens) 81 Résultats de la question liée aux pratiques mobilisées pour accompagner la mise en place du web sémantique en

Les bibliothèques numériques doivent évoluer pour répondre aux besoins des usagers du web. Il s'agit d'adopter des techniques permettant aux bibliothèques numériques de réaliser leurs objectifs tout en s'appuyant sur des pratiques professionnelles liées au traitement des documents et à la gestion des métadonnées. Le web sémantique offre le cadre technique permettant aux professionnels de l'information de pratiquer leurs savoirs faire et leurs connaissances dans le traitement des documents dans l'objectif d'améliorer la diffusion des ressources numériques sur le web. A travers leurs collections numériques de grande valeur, les bibliothèques numériques peuvent enrichir le web avec des données structurées, vérifiées et parfois rares. C'est pourquoi, les bibliothèques numériques peuvent devenir des acteurs puissants du web en donnant aux informations qui circulent sur le web davantage de fiabilité et de pertinence.

Nous avons présenté le web sémantique comme une technique pour la documentation qui permet aux bibliothèques d'améliorer la diffusion de leurs contenus sur le web. Mais cette technique a elle-même besoin de modèles conceptuels pour représenter les connaissances. C'est pourquoi dans la section suivante, nous abordons le rôle des langages documentaires dans le web sémantique.