• Aucun résultat trouvé

Le web sémantique et les pratiques des professionnels de l'information

Pourquoi la bibliothèque n'utilise pas le web sémantique ? (19 réponses)

5.3 Présentation et analyse des résultats des entretiens

5.3.5 Le web sémantique et les pratiques des professionnels de l'information

Nous nous intéressons dans cette thèse aux pratiques des professionnels de l'information travaillant en bibliothèques numériques. Plus précisément, nous cherchons à savoir comment les pratiques professionnelles sont influencées par les technologies en général et le web sémantique en particulier. Et réciproquement, nous nous intéressons aux pratiques des professionnels de l'information qui peuvent être mobilisées afin de mieux accompagner la mise en place du web

sémantique.

Une analyse thématique a été faite pour examiner les réponses des enquêtés. Dans un premier temps, nous avons classé les réponses liées à la question de l'influence de la technologie sur les pratiques professionnelles en trois catégories : positive (7 réponses), négative (une réponse) et neutre (2 réponses).

Nous donnons ci-dessous des extraits des réponses positives :

« Si on prend le métier de bibliothécaire sans l'informatique et bibliothécaire avec l’informatique c'est rien à voir. C'est arrivé quand même tôt les premiers langages MARC […] Après il y a eu la logique de réseau avec l'arrivée d'internet [qui a permis] d'échanger des notices bibliographiques. »[E2]

« c'est aspect de traitement de données qui change beaucoup […] finalement le bibliothécaire n'a plus le monopole de ses données, donc il n'est pas forcement amené à produire, mais il est amené à vérifier à croiser les références, il devient plus expert que initiateur […] le bibliothécaire avait un rôle traditionnel, il avait quasiment le monopole institutionnel sur l'accès à l'information, et le fait d'ouvrir l'accès à l'information, oblige les gens vraiment à avoir des réflexions sur ces cadres de production et d'accès à l’information [..] »[E3a]

« elle est importante très importante elle implique qu'on fonctionne différemment […] les bibliothécaires ne se retrouvent plus seuls isolés dans leurs coins. »[E8]

« Pour un service comme le mien c'est essentiel, on est censé suivre l'évolution des formats des langages des logiciels, pour moi c'est central c'est le cœur de mon métier » [E9]

« Je la trouve très positive, c'est-à-dire si je compare 20 ans auparavant, aujourd'hui on a des technologies qui nous permettent d’être un peu à la hauteur de nos ambitions. C'était quand même plus délicat de travailler sur l'échange des données il y a 20 ans, alors qu'internet venait tout juste de naître et qu'on avait des capacités d'échange et de traitement de données très limitées, donc je trouve que c'est très positif »[E10]

« La technologie va avoir une grosse influence sur nos pratiques parce qu'on s'ouvre à l'extérieur […] on va travailler en collaboration avec un autre collègue […]. »[E8] « avant la description était le plus important, aujourd’hui c'est le lien […] on passe moins de temps à décrire, on passe beaucoup de temps à vérifier et à lier un auteur à un livre etc. à s'assurer la fiabilité de ce lien […] aujourd'hui on récupère, on passe de catalogueurs au catalinkeurs »[E6]

Une réponse négative :

«L’omniprésence de Google le moteur de recherche aurait tendance à renvoyer les catalogues dans la préhistoire […] les pratiques documentaires sont balayées par les moteurs de recherche. Là il faut qu'on évolue sinon nos pratiques documentaires seront obsolètes»[E1].

Deux réponses neutres :

« on a grandi avec la technologie, donc elle n'a pas d'influence, ça existait toujours dans nos pratiques » [E3b]

« Je n'ai pas d'opinion, je suis ni pour ni contre »[E5].

Les résultats montrent que les enquêtés trouvent que l'influence de la technologie sur les pratiques professionnelles est plutôt positive. D'une part, elle a aidé les professionnels de l'information à sortir de leur isolement et à communiquer avec l'extérieur, ceci en collaborant et en échangeant les données avec d'autres institutions. D'autre part, étant au cœur du métier, elle est nécessaire pour évoluer les pratiques afin de répondre aux besoins des usagers.

Ensuite, nous avons demandé aux enquêtés quelles sont les pratiques professionnelles à mobiliser pour accompagner la mise en place du web sémantique en bibliothèques numériques.

Les réponses figurent dans le tableau 5.15 ci-dessous :

Les pratiques professionnelles mobilisées pour accompagner la mise en place du web sémantique en bibliothèques numériques

Thème Sous-thème Texte

Compétences documentaires classiques • Indexation • Description • Catalogage • Métadonnées • Normes

« ce sont des compétences documentaires classiques de type description, indexation catalogage »[E1]

« C'est un enjeu pour les bibliothèques de proposer des métadonnées de qualité, justement les données des bibliothèques sont des données établies selon un consensus confiant rationnel, qui ont été vraiment sélectionnées et validées au niveau de leur qualité, et c'est vraiment là où les bibliothèques ont une carte à jouer, et d'autant plus l’intérêt de rendre visibles leur métadonnées, et là on voit l’efficacité du facteur humain face aux algorithmes »[E2] « pour moi c'est toute la partie indexation, c'est clairement sur ces compétences qu'on va apporter […] le cœur de notre métier qui va basculer je dirais, être même mis en valeur, j'espère que dans le web sémantique, c'est toute cette partie enrichissement par le biais de l'indexation de la gestion des référentiels, qui va être mis en valeur »[E8] « le web sémantique n'est pas quelque chose d'automatisable, si on n'a pas d'abord les données qui sont prêtes »[E7]

« ça nous touche, parce que c'est lié à des projets des agents bibliographiques nationaux et de l'évolution des normes » [E9]

« D'abord les compétences de base sur la question du traitement du document, le bagage technique de documentaliste et du bibliothécaire est indispensable […]

donc je dirais ce bagage il ne faut pas le négliger et parfois il faut même en remettre une couche pour mettre à jour les collègues »[E10]

« on a quelque chose qui est fait nul part ailleurs, c'est-à-dire on a l'habitude de cataloguer, on a l'habitude de créer de fichiers d'autorité, on a l'habitude de faire ça à un niveau très poussé surtout en France, et data.bnf a vraiment montré tout ce qui pouvait apporter le travail du bibliothécaire»[E7]

Compétences à

acquérir Ouverture surle web

• Maîtriser les

langages de balisages (Html, Xml)

• RDF

« Si on dit web sémantique on dit web, et ça pour beaucoup de collègues c'est la révolution […] rédiger un article qui va être visible sur le web c'est une autre dimension, et pour l'instant ce n'est pas acquis, ça fait partie de la profession ça s 'apprend, il y en a qui ont été formés, il y en a qui refusent et puis il y en a qui sont entre les deux »[E1] « initiation aux bases des autres langages mobilisés pour le web (html, xml, etc) […] ils offrent un terrain, une couche très souvent utilisée dans le cadre du web sémantique qui me semble important de maîtriser […] il faut comprendre que c'est une manière de structurer l'information aussi »[E10]

« je pense que ce sont des compétences informatiques notamment au niveau RDF pour accompagner vraiment le web sémantique en bibliothèques numériques »[E2]

Compétences

informatiques InformatiqueInformatique

documentaire

« alors là on est dans l'évolution du métier, de l'apprentissage […] donc ce qui est sûr dans l'apprentissage du métier à mon avis, il y a une part d'informatique beaucoup plus conséquente, ça me paraît en fait inévitable […] Je pense qu'un bibliothécaire doit pouvoir avoir la main sur la technologie dans le sens où il doit pouvoir comprendre la technologie et l'infuser c'est-à-dire être à l'origine »[E3a]

« connaissances en informatique documentaire »[E6]

Tableau 5.15 – Analyse thématique des réponses à la question sur les pratiques professionnelles mobilisées pour accompagner la mise en place du web sémantique en bibliothèques numériques

Les résultats montrent que les pratiques documentaires « classiques » viennent en premier pour accompagner la mise en place du web sémantique en bibliothèques numériques. Il s'agit des compétences sur le traitement des documents : l’identification, la description et l'indexation. Ce bagage documentaire pourrait être mis en valeur avec le web sémantique. Ce dernier se base sur des données structurées, or les bibliothèques ont l'habitude de structurer leurs données pour y faciliter l'accès. Cela valide notre hypothèse :

H1

Les professionnels de l'information peuvent jouer un rôle dans la mise en œuvre et l'évolution du web sémantique en introduisant leur expertise documentaire relative à la gestion des métadonnées.

Utilisées toutes seules, les pratiques documentaires ne suffisent pas pour accompagner l'usage du web sémantique en bibliothèques numériques. Il faut acquérir des compétences en informatique, plus précisément, il faut des connaissances de base sur les langages de balisage (Html, XML) et les standards du web sémantique (URI, RDF etc).

Pour comprendre la représentation des données dans le cadre du web sémantique, nous avons demandé aux enquêtés de nous expliquer, d'après leur expérience, comment les liens sont établis entre les données.

Une analyse des réponses figurent dans le tableau 5.16 ci-dessous :

Représentation des données dans le cadre du web sémantique

Thème Sous-thème Texte

Médiation

documentaire Travailintellectuel

• Langages documentaires • Rameau • Formats de production • Formats de diffusion • FRBR • Catalogage • Vocabulaire contrôlée • Organisation des connaissances

« le web sémantique n'arrive pas tout seul, il arrive dans un monde documentaire où on a vu à un moment le FRBR » [E1]

« rien que sur la modélisation, rien que le mapping entre les formats, ça demande un travail intellectuel, on a deux équipes ici qui ont participé à cette modélisation, en fait deux modélisateurs, des gens qui ont fourni le travail intellectuel de modélisation et de mapping dans le rdf » [E3a]

« Rameau est déjà en SKOS, tout Rameau est publié en SKOS, Rameau est un vocabulaire contrôlé et en même temps joue le rôle d'ontologie, il définit des domaines [..] il continue d’être produit en Marc en Intermarc, le format de base de production de Rameau reste l'Intermarc, et à priori il va rester comme ça, et de fait on a pas dans l'idée qu'il faut reproduire nativement du RDF, c'est-à-dire on continuera à produire dans des formats d'autre que RDF, et il y aura toujours ce mapping qui sera fait entre les formats de production et les formats de diffusion, ce qui est sûr c'est que la production et la diffusion d'un point de vue format ça sera toujours distinct en tout cas dans notre politique » [E3a]

«[Établir des liens] est un travail intellectuel, c'est-à-dire que c'est le catalogueur qui va faire le lien avec un auteur, qui va faire le lien avec une vedette rameau etc etc, le lien est fait dans la production, et même de plus en plus on commence à se demander si on ne pourrait pas demander

[aux catalogueurs] de lier carrément à de URLs et non pas lier juste à un mot qui existe dans un référentiel, d'aller chercher l'URL, qui n'est pas forcement évident d'un point de vue de pratique de catalogage […] par ailleurs il faut savoir que nous quand on a commencé à frbriser le catalogue, c'est-à-dire à lier des auteurs à des œuvres ou des œuvres à des éditions, il y avait quand même une tradition de lier les identifiants dans leur production même, c'est-à-dire que dans MARC il y avait une zone [..] il y avait cette possibilité d’insérer des identifiants dans les zones du MARC et de lier les entités en elles » [E3a] « c'est plus une question d'architecture qu'une question de format, on peut très bien faire de linked data avec des données en MARC dans l’écosystème de production interne, parce que depuis 87 les catalogueurs font déjà des liens entre les notices bibliographiques et les notices d'autorités, ce que j'appelle de vintage linked data, les notices ont des identifiants et non pas des URIs, mais des identifiants qui sont bien gérés, derrière il y a des données en MARC, mais on a déjà des entités qui sont liées entre elles, et de ce point de vue là on a déjà une logique de production en entités, [..] c'est un travail de catalogueur, qui est non seulement de la production des données mais l'administration des liens » [E4]

« au niveau métier, il faut un modèle qui peut rester du MARC, c'est ce que les gens ont l'habitude de faire, c'est sur ce format là que s'opère toute la coordination bibliographique, on peut s'appuyer la dessus et faire évoluer, le modèle physique ça peut être une base de données, ça peut être une base de données relationnelle du sql [..] on a plus de 300 personnes qui travaillent dans ce format là et qui le maîtrisent, et plutôt que de le changer d'une manière très destructive, le mieux est de le faire évoluer pour accorder de nouveaux besoins»E4

« on s'est dit qu'avec l'arrivée de la recherche par texte c'est la fin de vocabulaire contrôlé, et même c'est la fin des catalogues [..] alors que pour la simple raison que la recherche par texte ne donne pas d'indice sur la manière dont les connaissances sont organisées et liées entre elles. c'est un enjeu pour les bibliothèques de proposer des métadonnées de qualité » E2

« le web ressuscite les pratiques de la profession , en tout cas la profession telle qu'elle a été pensée au début de l'époque moderne, et à mon avis le RDF est un langage qui sort tout droit de la tradition scientifique de 17eme siècle »E3a

Tableau 5.16 – Analyse thématique des réponses liées à la représentation des données dans le cadre du web sémantique

Les résultats nous ont permis de valider notre hypothèse :

H 2

La représentation des connaissances ne se fait pas seulement en utilisant les langages informatiques et standardisés du web sémantique, il faut une intervention humaine permettant de fournir à ces langages les données et les modèles conceptuels nécessaires pour représenter les connaissances.

D'une part, l'analyse des résultats a montré que la représentation des données dans le cadre du web sémantique nécessite une médiation documentaire. Un travail intellectuel est nécessaire pour créer les liens entre les données, plus précisément, il s'agit du travail exercé par les catalogueurs. Les langages documentaires comme Rameau constituent une base conceptuelle sur laquelle les bibliothèques peuvent s'appuyer pour exposer leur données dans le web sémantique. Cela montre un retour aux langages contrôlés pour décrire et lier les données.

D'autre part, les enquêtés trouvent qu'au lieu de changer les formats utilisés en bibliothèques comme le format Marc, il faut mieux de les faire évoluer pour pouvoir diffuser les données sur le web.