• Aucun résultat trouvé

BIBLIOTHÈQUES NUMÉRIQUES ET HUMANITÉS DIGITALES

N/A
N/A
Protected

Academic year: 2022

Partager "BIBLIOTHÈQUES NUMÉRIQUES ET HUMANITÉS DIGITALES"

Copied!
20
0
0

Texte intégral

(1)

ET HUMANITÉS DIGITALES

La continuité d’une problématique sur l’organisation des connaissances en lettres et sciences humaines

WIDAD MUSTAFA EL HADI

LAURENCE FAVIER

Contexte et finalité

Les humanités digitales se définissent comme « un champ multidisciplinaire important, à l’intersection des technologies digitales et des sciences humaines ». Cette discipline a pour but la création d’applications et de modèles qui ouvrent la voie à de nouveaux champs de recherche, aussi bien dans le domaine des sciences humaines qu’en informatique ainsi que dans toutes les technologies qui leur sont associées.

Les humanités digitales étudient également l’impact de ces techniques sur l’héritage culturel, les institutions mémorielles, les bibliothèques, les archives et la culture digitale » (Warwick et al., 2012). Une autre définition est suggérée par les auteurs du Manifeste pour les humanités digitales. Les

(2)

auteurs mettent en exergue le fait que ce champ de recherche est « une communauté de pratique » née de « différentes communautés thématiquement proches liées par leur intérêt pour les outils, en lien avec divers objets transversaux (codification des ressources textuelles, systèmes d’information géographique, lexicométrie, numérisation des ressources culturelles, scientifiques et techniques, cartographie du web, archives orales, arts numériques, littérature etc.) et qui progressivement convergent pour donner naissance au champ de recherche des Humanités Digitales ».

Dès 1966, une publication aux États-Unis dont le titre était

« Informatique et Humanités » (Computers and the Humanities) annonçait le développement d’un champ de recherche connu aujourd’hui sous le nom d’humanités digitales. Depuis 1978, l’Association pour l’informatique et les humanités1 avait mis en place ce qu’elle nommait « un forum pour la recherche, les échanges techniques et l’exploration » qui alimentait à la fois la transformation des technologies et celle des sciences humaines, telles que nous les connaissons depuis maintenant trente ans : « Depuis un peu plus de trente ans, les développements qu’a connus la technologie ainsi que la compréhension et l’usage qu’en ont les spécialistes de sciences humaines, ont profondément transformé l’un et l’autre domaine ». En tant que principale association professionnelle de spécialistes de sciences humaines, usagers des technologies aux USA, l’ACH a mis en place un forum de recherche, échange et explorations techniques, qui ont alimenté cette transformation »2.

Le concept d’humanités digitales a sa propre histoire qui ne peut être réduite à la simple dimension des développements technologiques actuels.

Ce qui est nouveau, ce n’est pas l’usage qui est fait des technologies de l’information, mais le fait que différentes disciplines telles que les arts et les sciences sociales, se sont réunies autour des humanités digitales. Le champ des humanités digitales inclut « la construction, la gestion et la valorisation de données réunissant du texte, des images de types ou périodes différents et appartenant à des domaines variés ; et ces domaines de recherche revêtent désormais une importance suffisante pour donner naissance à une communauté de pratiques nommée humanités digitales ». Ce qui est nouveau c’est que nous sommes témoins, comme l’indiquait Svensson

1. En anglais : Association for Computers and the Humanities (ACH).

2. http://www.ach.org/history

(3)

(2010), d’une interaction multiniveau très riche avec le « digital » qui résulte partiellement de la force d’entraînement des disciplines et technologies digitales, et des perspectives et approches qu’elles impliquent.

Les spécialistes de sciences humaines étudient différents modes d’implication, modèles institutionnels, technologies et stratégies discursives (ibid).

La définition que donne l’Université d’Oxford au terme « humanités digitales » insiste sur le rôle des technologies de l’information comme point d’ancrage central des méthodologies utilisées par les humanités digitales, pour la création et le traitement des données utilisées par la recherche. Les humanités digitales étaient antérieurement connues sous le nom d’humanités informatiques, ou TIC (technologies de l’information et de la communication) pour les recherches en sciences humaines.

L’utilisation de ces termes montre l’importance croissante des outils et ressources digitales pour les recherches en sciences humaines3. D’une façon ou d’une autre, toutes les disciplines des sciences humaines sont maintenant informatisées : en réalité tous les chercheurs utilisent des ressources digitales diverses et très souvent des ressources digitales spécialisées. Les humanités digitales se projettent au-delà de ce simple usage et font un usage plus systématique des technologies digitales spécialisées.

Mais il ne s’agit néanmoins pas tant d’un domaine de spécialité que d’un domaine de recherche d’intérêt commun plus vaste, ainsi que d’une communauté d’utilisateurs réunissant à la fois les spécialistes académiques de sciences humaines et les spécialistes des technologies.

Le domaine des humanités digitales ne réunit pas seulement les spécialistes de sciences humaines, mais également de nombreux théoriciens et usagers. Il s’agit autant de ceux qui ont fait vivre cette discipline durant les dernières décennies que de ceux qui l’ont intégrée depuis peu : ils sont tous, soit experts d’une discipline en sciences humaines, informaticiens, spécialistes d’information scientifique et technique ou de bibliothèques, et se sont réunis pour constituer les humanités digitales en tant que discipline à part entière, ainsi que pour réfléchir à l’impact de cette discipline sur le champ de recherche et d’études des sciences humaines traditionnelles (Schreibman et al., 2010).

3. Site web du département des sciences humaines de l’Université d’Oxford Humanities ; http://digital.humanities.ox.ac.uk/

(4)

Les projets d’humanités digitales semblent se développer à l’extérieur des bibliothèques numériques car ils sont conçus par et pour les chercheurs seulement. Pourtant les problèmes d’accès aux ressources devraient les lier, en particulier quant au rôle des systèmes d’organisation des connaissances (SOC) pour les sciences humaines. Le terme de système d’organisation des connaissances renvoie à tous les schémas d’organisation de l’information avec une dimension de gestion de la connaissance. Ces systèmes incluent des schémas de classification pour organiser la gestion du matériel à un niveau général (par exemple, les livres sur une étagère), ainsi que les sujets clés qui permettent un accès thématique plus précis, et les champs d’autorité qui contrôlent les variantes d’une information clé (comme les noms de lieux géographiques et les noms propres). Ils incluent également des schémas moins traditionnels, tels que les réseaux sémantiques et les ontologies. C’est parce qu’ils organisent l’information que les systèmes d’organisation des connaissances, sont le cœur même de toute bibliothèque, musée ou service d’archives (Hodge, 2000).

1. Les bibliothèques numériques, un bref résumé de leurs missions Les bibliothèques numériques sont l’extension numérique des bibliothèques traditionnelles et offrent de nombreuses possibilités nouvelles. Comme n’importe quelle bibliothèque, les bibliothèques numériques se doivent d’offrir un haut niveau de sélection des ressources correspondant à des critères pertinents pour leur mission et d’être en mesure de proposer des services facilitant l’usage de ces ressources par leur communauté cible. Borgman définit la bibliothèque numérique comme

« un ensemble de ressources électroniques et possibilités techniques associées permettant la création, la recherche et l’usage d’informations. De ce point de vue, elle constitue une extension et un déploiement des systèmes de stockage et de recherche d’information, qui permettent la manipulation de données numériques sur n’importe quel support et se déploient dans les réseaux distribués » (Borgman, 2000).

Alors que les termes « bibliothèque virtuelle » et « bibliothèque numérique » sont couramment utilisés de façon interchangeable, il ne s’agit en fait pas de la même chose. Une bibliothèque numérique réunit une collection d’information multimédia en réseau la plupart du temps utilisée en un seul lieu (UNESCO, Europeana, entre autres), alors qu’une

(5)

bibliothèque virtuelle réunit un ensemble de liens vers diverses ressources disponibles sur internet, comme des documents, des logiciels ou des bases de données. Les liens dans une bibliothèque virtuelle sont généralement proposés aux utilisateurs de façon transparente et à travers une interface unique (Kawatra, 2000)4.

Le protocole de recherche d’information et la norme internationale ISO 23950, connue sous la référence Z39.50. – qui a précédé le réseau internet et a essentiellement été utilisée par les bibliothèques – est à la base des efforts réalisés par les premières bibliothèques numériques pour parvenir à l’interopérabilité des contenus numériques distribués.

L’utilisation de cette norme permet de rechercher en temps réel des contenus stockés sur différents systèmes d’information. « Les organisations peuvent paramétrer leurs ressources en ligne (catalogues, bases de données, index) en tant que cibles Z39.50. En d’autres termes, les services de recherche d’information Z39.50 collectent les données disponibles dans les bibliothèques numériques », (Calhoun, 2014, 68). La norme Z39.50 a été utilisée à l’initiative de certaines des premières bibliothèques numériques.

Elle a démontré sa pertinence pour la recherche d’information croisée et les recherches fédérées ayant un intérêt pour les bibliothèques numériques, car elle permet l’interrogation simultanée de catalogues multiples, la consultation de résumés et de bases de données d’indexation, et de toutes sortes de ressources présentant un intérêt pour les bibliothèques. Son potentiel et sa pertinence pour l’élaboration de systèmes d’information distribuée en Europe a été débattue par de nombreux chercheurs (pour plus d’information cf. Calhoun (ibid)). L’un des exemples les plus célèbres d’utilisation de cette norme est Europeana5 un portail et un protocole de

4. http://vlib.org/Humanities

5. Europeana propose un accès direct à un fonds de plus de 6 millions de documents numériques issus de musées, bibliothèques, et archives de toute l’Europe. Le but était d’atteindre un total de 10 millions de documents et œuvres numérisés en ligne en 2010. Plus de 1 000 organisations culturelles en Europe ont fourni des matériaux à Europeana. L’interface d’Europeana est disponible dans toutes les langues officielles de l’Union européenne. Les objets numériques disponibles à la consultation ne sont pas stockés sur un ordinateur central, mais demeurent dans leurs institutions respectives et sont hébergés sur leur serveur. La sélection du contenu est déterminée par les états de l’Union et leurs institutions culturelles. Seuls les propriétaires de ces matériaux, qu’il s’agisse de bibliothèques

(6)

communication coopérative pour 48 bibliothèques nationales européennes. Europeana ainsi que certaines bibliothèques de recherche ont utilisé la norme Z39.50 de façon particulièrement innovante (ibid).

Les bibliothèques numériques pour les sciences humaines

L’activité que les humanités digitales et les institutions de mémoire telles que les bibliothèques, les archives et les musées ont en commun, consiste en la numérisation de documents historiques et culturels, des images et artefacts dans le but d’améliorer l’accès à ces documents et de favoriser une meilleure compréhension des matériaux en leur possession (Terras, 2012, 47). L’essentiel des ressources est proposé en ligne aux utilisateurs. L’émergence des bibliothèques numériques au début des années 1990 a constitué un tournant et s’est avérée un composant essentiel du mouvement mondial en direction de l’information en réseau (Calhoun, 2014). Les bibliothèques ont été des utilisateurs précoces des systèmes d’information en ligne. Le rêve de la bibliothèque numérique universelle et mondiale, a été partagé par tous et reste encore d’actualité (ibid). Mais alors que la pertinence de cette démarche est justifiée au niveau mondial, il n’en demeure pas moins que ces initiatives ont été financées à un niveau régional et/ou national6. Europeana en est un exemple.

Le rôle indiscutable des bibliothèques à l’ère du numérique est avéré.

Elles intéressent usagers et industries de l’information et offrent des possibilités pour les humanités digitales. Les bibliothèques numériques paraissent ainsi complémentaires des humanités numériques, les unes et les autres étant susceptibles de favoriser le développement de la recherche en sciences humaines. Du point de vue du réseau numérique mondialisé, les bibliothèques numériques, en s’appuyant sur les principes des sciences de l’information et de l’organisation des connaissances, apportent un enrichissement fondé sur leur culture de l’interopérabilité technique et sémantique. Les humanités digitales, quant à elles, peuvent inciter les bibliothèques numériques à adopter des modèles cognitifs plus élaborés pour la construction des corpus destinés à la recherche scientifique. Il

individuelles, de collections audiovisuelles, d’archives ou de musées, décident quels sont les articles à numériser.

6. Voir Calhoun (2014) pour une description complète et détaillée des initiatives nationales.

(7)

existe une tradition scientifique relative aux approches cognitives que les systèmes d’organisation des connaissances ont en commun avec la bibliométrie lorsqu’il s’agit d’approches centrées utilisateur, ainsi que le montre Hjorland (2013) qui considère que les études d’usage et les études cognitives constituent un socle épistémologique fondamental.

2. Les systèmes d’organisation des connaissances

dans les environnements numériques : le cas des humanités digitales Le réseau internet lui-même aussi bien que les référentiels numériques de diverses sortes sont devenus des ressources essentielles dans le domaine de l’éducation, de la recherche et de l’héritage culturel. Cependant la recherche d’information dans les catalogues des bibliothèques numériques demeure peu financée et la localisation des ressources pertinentes devient difficile à mesure que le volume des collections augmente. Jusqu’à ce jour, l’essentiel des efforts réalisés dans les environnements numériques se sont focalisés sur les questions techniques : architecture, normes applicables aux métadonnées, copyright et interopérabilité, qui sont des questions cruciales pour la gestion des fonds numériques. Mais jusqu’à une date encore récente, peu d’efforts ou d’expertise ont été consacrés à des sujets comme l’accès aux contenus par la sémantique, l’interopérabilité sémantique, l’accès à la connaissance et sa facilitation (Slavic, 2011; 2013).

2.1. Systèmes d’organisation des connaissances pour la découverte d’information dans les ressources numériques

Nous constatons aujourd’hui de nombreux changements dans l’organisation des connaissances, le champ des connaissances organisées ne se limitant plus à l’organisation des livres dans une bibliothèque. Pendant longtemps, l’indexation des connaissances s’est limitée à l’application d’un schéma de classification des listes de matières vedettes à des livres imprimés.

Mais de nouveaux documents dont les contenus demandaient également à être organisés sont apparus : des images imprimées, supports magnétiques, supports numériques, information en réseau, etc. (Gnoli, 2011).

Le prérequis à l’utilisation des systèmes d’organisation des connaissances dans un environnement digital est une architecture d’information fondée sur des métadonnées. Les métadonnées descriptives

(8)

(comme l’ensemble des métadonnées du Dublin Core) ont été très largement utilisées pour soutenir l’identification et la découverte de ressources dans les environnements numériques. Mis à part la description formelle de la ressource, les métadonnées descriptives peuvent véhiculer de l’information sur les contenus (sujet du document) et ce sujet peut être exprimé en utilisant un terme présent dans un système d’organisation des connaissances. Cela peut prendre la forme d’une étiquette notionnelle, d’un terme unique ou d’une combinaison de termes. En utilisant ce modèle il est possible de décrire le contexte d’un document textuel, d’une image, d’un document audio ou d’un ensemble de données. Le modèle d’élaboration et de découverte d’information que nous venons de décrire est particulièrement recommandé dans les scenarios suivants7 :

– lorsque les bibliothèques numériques réunissent des ressources hétérogènes (sons, images, ensembles de données, textes) qui ne sont pas nécessairement susceptibles d’être trouvées grâce à des techniques de recherche d’information textuelle ;

– lorsqu’il arrive que des bibliothèques numériques contiennent des ressources qui couvrent un champ complet de connaissances, ce qui rend difficile l’utilisation de méthodes d’indexation verbale à des fins de contextualisation et de description du contenu sémantique. Souvent les mots ne sont pas fiables : ils sont vagues et peuvent revêtir des significations différentes à travers des disciplines différentes. La présence d’une structure de connaissance systématique permet d’expliciter la relation sémantique entre les concepts, et facilite ainsi la navigation dans une collection, ainsi que l’expansion automatique de requêtes. L’absence d’une telle structure empêche l’intégration du contenu sémantique;

– quand les bibliothèques sont connectées entre elles au travers de portails thématiques intégrés. Dans de telles situations, les contenus faisant l’objet de la requête peuvent éventuellement être disponibles en plusieurs langues, figurer dans différents domaines et être indexés par des systèmes d’organisation des connaissances locaux. La plupart des répertoires

7. Voir la conférence Knowescape, La Hague, 23 octobre 2013 : présentation du projet de recherche DIGIKO (Digital Cultures and Universality in Knowledge Organization) proposé avec quatre partenaires : la France en tant que pilote, le Royaume-Uni, les Pays Bas et l’Allemagne, conjointement avec un panel d’experts internationaux.

(9)

numériques de taille importante fusionnent les ressources digitales provenant des domaines de la recherche, des bibliothèques ou encore de l’éducation. On ne peut parvenir à une intégration de l’information et l’alignement de concepts provenant de ces domaines que grâce à la surimposition d’un schéma d’organisation des connaissances8.

Les systèmes d’organisation des connaissances en général, et les classifications universelles qu’ils appliquent en particulier ont été utilisés à des fins d’échange d’information pendant très longtemps et sont devenus de-facto des standards dans le domaine de l’organisation des connaissances et de la découverte d’information :

– ils sont basés sur des consensus éducationnels et scientifiques largement acceptés,

– ce sont des schémas conceptuels et donc indépendants des langues, – ils sont largement utilisés et disponibles dans de nombreuses langues.

2.1.1. Stratégie d’élaboration de ressources et de découverte de connaissance dans les collections hétérogènes

Le domaine de connaissance des sciences humaines est celui de l’interdisciplinarité c’est-à-dire de la diversité mais aussi et surtout de l’interaction entre les disciplines. Étant donné la nécessité d’aborder des concepts à travers des ressources informationnelles hétérogènes (musées, objets, images, sons et textes) il est nécessaire d’adapter à cet usage les systèmes d’organisation des connaissances et leurs modalités d’accès à l’information. C’est la raison pour laquelle les outils et modèles bibliographiques couramment utilisés en organisation et découverte des connaissances, sont utiles pour les sciences humaines, particulièrement en ce qui concerne les outils ayant un lien avec le web sémantique et les technologies sémantiques associées pour la recherche, l’exploitation des données sémantiques stockées dans les systèmes d’organisation des connaissances, ainsi que les champs de métadonnées « sujet » et les champs de métadonnées « ressources » (Broughton et al., 2007 ; Slavic 2011 ; 2013).

Vanda Broughton et Aida Slavic (2007), décrivent les procédures des schémas de classification par facettes, qui sous-tendent la découverte et la création de ressources dans un environnement connecté. Les auteurs

8. DIGIKO project.

(10)

suggèrent qu’il est possible que les systèmes d’organisation des connaissances, et en particulier les systèmes de classification universelle des connaissances soient actuellement sous-exploités dans les environnements numériques et tout particulièrement en sciences humaines. Une application plus large en sciences humaines des systèmes de classification des connaissances serait non seulement susceptible d’améliorer le processus de découverte de connaissances, mais pourrait également contribuer à l’amélioration des outils de recherche et de terminologie pour le transfert de connaissances entre les sciences humaines et d’autres disciplines connexes. Ainsi le projet FATKS9, a abouti à la création d’un vocabulaire contrôlé en sciences humaines basé sur la théorie des facettes et qui est adapté à un environnement connecté.

Le but de ce projet, tel que décrit par les chercheurs est le développement d’une classification susceptible de constituer un outil d’indexation robuste et gratuit, utilisant un processus d’automatisation simple permettant de formuler des requêtes et d’effectuer des recherches dans les différents champs des sciences humaines. Cet outil est capable de proposer un affichage différencié selon la présentation qu’on souhaite faire d’une collection donnée (choix et ordre des facettes, affichage ou masque des annotations, expansion ou réduction de l’étendue des facettes de la même façon que dans les medias numériques). Il adapté à la consultation des collections traditionnelles, numériques ou hybrides (de la même façon que dans les medias numériques). Il peut être sans limite utilisé pour n’importe quel niveau de spécialité, intégrer le vocabulaire de spécialité d’autres systèmes (par exemple les données géographiques), être utilisé pour la création de thesaurus, être interopérable avec les systèmes d’indexation existants déjà utilisés dans les différentes collections (AHDS and Humbul). Il peut être administré au travers d’une architecture portail de type client serveur et proposer des listes d’autorité portables et partageables pouvant servir de fondement à un outil intelligent de classification et catalogage, ou bien de base pour des processus d’automatisation et d’indexation à venir.

9. FATKS (2003-2004) Facet Analytical Theory in Managing Knowledge Structure for Humanities http://www.ucl.ac.uk/fatks/

(11)

La classification par facettes du projet FATKS10 a donné des résultats intéressants. Utilisé pour la découverte et la recherche de connaissances en ligne, ce type de schéma s’impose désormais comme un modèle indiscutable. Richard Smiraglia a récemment pointé le fait que « L’héritage des travaux de Ranganathan, tel qu’il est représenté dans la recherche actuelle par facettes, est maintenant considéré comme une approche dominante en organisation des connaissances pour l’exploration de nouveaux territoires. Les principaux auteurs qui ont cité Ranganathan durant les quarante dernières années ont clairement reconnu l’influence de ses travaux sur les approches utilisées aujourd’hui aussi bien dans le domaine de la classification que du design internet. En effet, la totalité du domaine de l’organisation des connaissances démontre l’influence de la théorie des facettes. (…) Les Prolégomènes ont clairement démontré que le fait d’écarter la confusion produite par les concepts simples dans les structures hiérarchiques, en se centrant au contraire sur l’expression de points de vue combinés, permet de produire une classification des connaissances plus précise. C’est très précisément le bénéfice qu’on peut tirer d’une approche par facettes, et ce qui alimente sa popularité aussi bien à travers les systèmes d’organisation des connaissances que de l’ingénierie d’internet dans le monde d’aujourd’hui » (Smiraglia, 2013, 718).

2.1.2. Création de dépôts numériques et découverte de connaissance dans des collections hétérogènes

Un autre cas de projet d’humanités numériques : les archives audiovisuelles de la recherche (AAR : ESCOM11)

Les enregistrements qui composent ces archives audiovisuelles numériques en sciences humaines contiennent des interviews individuelles avec des chercheurs dans de nombreuses disciplines scientifiques (une interview peut durer de 30 minutes à plusieurs heures…), des conférences,

10. Le modèle utilisé pour ce projet est basé sur un triple système de classification par facettes et analytico synthétique : La Classification Bliss Bibliographic 2, la Classification Décimale Universelle et le Broad System of Ordering. Deux domaines des sciences humaines ont été testés : la religion et les arts.

11. Équipe sémiotique cognitive et nouveaux médias (ESCoM), équipe de recherche de la Fondation Maison des sciences de l’homme, Paris, partenaire du projet DIGIKO. Les archives audiovisuelles de la recherche http://www.archivesaudiovisuelles.fr/fr/.

(12)

des cours, des séminaires de recherche, des ateliers, de petits reportages portant sur la vie quotidienne dans les laboratoires de recherche, des expositions scientifiques, des documentaires, des notes de voyage, des films ethnographiques, etc. Actuellement plus de 5 800 heures de vidéo sont consultables en ligne. Elles couvrent une grande diversité de domaines du savoir en archéologie, en ethnologie et anthropologie, histoire sociale, histoire des cultures, histoire de l’art, Sciences du langage et de la communication, sociologie, sciences économiques, sciences politiques, en philosophie également et plus particulièrement en littérature et études littéraires. Plus de 2 600 chercheurs, étudiants, professionnels issus de 85 pays différents ont déjà contribué à la création de ces archives. Même si la plupart des vidéos sont en français, il en existe aussi en anglais, italien, espagnol, allemand, russe, chinois, etc.

L’équipe ESCoM a créé et adapté différents outils permettant d’accéder à leurs ressources numériques. C’est le cas par exemple, du centre de ressources terminologiques ASA pour les archives audiovisuelles centrées utilisateur. ESCoM a développé un ensemble de ressources termino- logiques (c’est-à-dire métalinguistiques) pour la description/indexation, la publication/republication de corpus audiovisuels. Elles sont composées :

– d’une ontologie centrale destinée à l’analyse, de corpus audiovisuels en sciences humaines,

– d’une ontologie pour la procédure de description des textes audiovisuels,

– d’une bibliothèque de modèles de description communs destinée aux gens souhaitant produire des archives audiovisuelles « standard » ;

– d’un thesaurus commun composé d’une part d’un ensemble de facettes (distances sémantiques, dans le sens de la sémiotique structurelle) et d’autre part, d’un ensemble de valeurs destinées à être interprétées par une ou plusieurs facettes (une facette permet l’interprétation d’un concept du noyau ontologique).

Nous travaillons aujourd’hui au développement expérimental d’une approche par facettes dans ce contexte des AAR ainsi qu’à la définition des fondements théoriques des facettes sémantiques en référence à la sémantique structurelle et à la sémiotique structurelle. L’objectif sera de garantir l’interopérabilité des ressources terminologiques (ontologies, modèles de description et thesaurus) utilisées par le programme

(13)

audiovisuel d’archives de la recherche de FMSH-ESCoM qui utilise un système de classification universelle ; ainsi que le développement d’un pilote expérimental sur la base d’une archive audiovisuelle en ligne thématiquement restreinte. Ce pilote servira à tester l’approche par facettes pour l’indexation et la recherche de vidéos en utilisant les résultats déjà disponibles (Mustafa El Hadi, 2013).

Ces travaux montrent l’intérêt des systèmes d’organisation des connaissances pour favoriser l’accès aux objets culturels et l’interopérabilité entre leurs contenus. Les bibliothèques numériques ont adopté dès le début l’idée d’un système d’organisation des connaissances universel, fondé sur le principe de postulats culturels partagés (partage de notices bibliographiques, catalogues en ligne, etc.) Cette tendance est à la source d’Europeana ainsi que d’autres bibliothèques numériques ou hybrides (Calhoun, 2014). La création de la bibliothèque numérique européenne a permis d’adapter, mais aussi de créer de nouvelles normes européennes. Dans le même temps, les humanités digitales ont créé des corpus spécifiques pour des buts scientifiques particuliers. Ces corpus peuvent ainsi être partagés par un groupe de chercheurs plus étendu ou bien avec le grand public.

3. L’inadéquation des ressources numériques en ligne aux besoins des humanités digitales

3.1. Le cas des fonds numériques en sciences humaines

La littérature consacrée aux infrastructures de réseaux à la disposition de la recherche, insiste sur la nécessité de disposer de données scientifiques durables et partagées. Les différentes disciplines des sciences humaines et sociales ont suivi les traces des sciences et technologies à ce propos. En France par exemple, de récents programmes institutionnels comme le TGE-ADONIS, également appelé TGIR Huma-num12, (pour humanités

12. Le département de recherche Huma-Num fait partie du cadre stratégique scientifique national et européen. Au niveau européen, ESFRI (European Strategy Forum on Research Infrastructures) soutient depuis 2002, l’élaboration d’une infrastructure de recherche européenne dans toutes les disciplines scientifiques. En 2006, l’ESFRI a publié son premier plan d’action, actualisé en 2008, 2010, et en 2012. Dans le domaine des sciences humaines et sociales, 5 projets ont été

(14)

digitales) se sont donné pour but de réussir le « tournant digital » des sciences humaines et sociales. L’offre technologique en ce domaine demeure cependant orientée vers la conservation des données, la mise en place de données interopérables pour la recherche et l’interopérabilité entre les fonds documentaires. Cette interopérabilité, essentiellement d’ordre technologique, tend à affaiblir l’interopérabilité cognitive et sémantique qui sont pourtant des exigences fortes de la recherche scientifique. La diversité des TIC ainsi que celle de leurs conditions d’utilisation appelle l’usage de nouvelles applications souples et interactives, capables de s’adapter à un environnement technique, ainsi qu’à l’utilisateur et à un contexte interactif. Dans ce but il est essentiel de créer des interfaces reconfigurables, capables de s’adapter à un environnement technique ainsi qu’à différents profils d’utilisateurs et à un contexte interactif. Les fondements mêmes de l’organisation des connaissances, les descriptions à valeurs multiples (scientifiques et documentaires) et multidimensionnelles (« profils différents » auteur, lecteur, analyste, expert, etc.), l’agrégation dynamique de contenus hétérogènes (ou de segments de contenus), l’accès multimodal (texte, audio, vidéo, images) permettent de répondre à cet objectif.

Les langages documentaires, analytiques et systématiques utilisés dans les bibliothèques universitaires de recherche (classification décimale Dewey, classification décimale universelle, Bibliothèque du Congrès, classification, Rameau, MotBIS, LCSH, thesaurus de spécialité, etc.) génèrent des métadonnées de qualité. Ces métadonnées d’enrichissement générées grâce au travail des documentalistes et des analystes, font progresser la valorisation au sens documentaire. De plus, les ressources documentaires numériques deviennent accessibles, compréhensibles et disponibles pour un public plus étendu (folksonomies, indexation sociale) au travers d’interfaces adaptées servant des objectifs divers et capables de

financés : Dariah, Clarin, Cessda, ESS, Share. Un ou plusieurs projets issus de l’infrastructure de recherche européenne sont associés avec trois de ces projets TGIR : TGE Adonis : Dariah (Infrastructure de recherche numérique pour les arts et sciences humaines); Corpus-IR : Clarin (Common Language Resources and technology Initiative) ; Progedo : Cessda (Archives en sciences sociales du Conseil de l’Europe - Council of European Social Science Data Archives), ESS (European Social Survey), Share (Survey of Health, Aging and Retirement in Europe). Avec la fusion de TGE Adonis et Corpus-IR, TGIR Huma-Num coordonne la participation française au sein de l’infrastructure Dariah.

(15)

s’adapter à des profils cognitifs et informationnels différents. Néanmoins les interfaces numériques actuelles ne sont pas satisfaisantes.

3.2. Les difficultés d’accès aux fonds et bibliothèques numériques, le cas des fonds documentaires pour les sciences humaines

Ces difficultés ont été rapportées par de nombreux auteurs dans des travaux récents. Andrea Schanrhors (2013), par exemple, dans son article explicite quelques-unes de ces difficultés :

– Manque d’interfaces adaptées : « Avec l’introduction de l’accès public aux catalogues (OPAC13), d’aggrégateurs comme WorldCat et d’Europeana, il est devenu possible de visiter les bibliothèques du monde à partir de votre ordinateur. Bien qu’il s’agisse d’une réalisation exceptionnelle, les catalogues ouverts ne sont toujours pas d’un accès aisé (Borgman, 1996). Fondés sur l’apport des systèmes d’organisation des connaissances, les efforts réalisés par la recherche d’information semblent avoir avant tout pavé le chemin de la recherche d’information de l’utilisateur, l’amenant sans en avoir l’air à effectuer les « bons » clics. Les systèmes d’organisation des connaissances sont maintenant cachés derrière un moteur de recherche à la fois complexe et étonnant, qui agit à travers une interface basée sur une chaîne de mots-clés de recherche, à laquelle l’utilisateur est contraint de se limiter ».

Dans le but d’améliorer l’accès aux ressources numériques, de nombreux auteurs suggèrent l’utilisation d’assistances visuelles à la navigation adaptées. Schanrhors (2013) décrit différentes tentatives couvrant un large spectre de ressources numériques et la façon dont ils ont échoué à satisfaire les exigences exprimées : « (...) malgré le virage visuel annoncé, porté par les tablettes et les smartphones, l’assistance visuelle à la recherche d’information et à la navigation est encore limitée à des outils expérimentaux développés pour des communautés spécifiques. Bien qu’il y en ait beaucoup ainsi que de nombreuses explorations de navigation visuelle qu’il serait judicieux d’examiner systématiquement, il n’en demeure pas moins que l’accès numérique classique à une bibliothèque, un fonds d’archives ou à une collection de musée, n’a guère changé. Un concept émergent est celui des science maps (cartes scientifiques). Ces

13. OPAC : Open Public Access Catalogues

(16)

représentations visuelles à grande échelle, fondées sur des communications savantes (dans les revues scientifiques) sont un exemple intéressant de la façon dont les techniques de visualisation permettent de diffuser les concepts d’un domaine scientifique à un autre (voir également à ce propos le projet KnoweScape14) »

– Manque d’interopérabilité : si nous prenons en compte les différentes couches d’interopérabilité, seule la couche technique est réellement implémentée dans les bibliothèques numériques. Molina (1995), cité par Calhoun 2014 a identifié un continuum d’interopérabilité avec

« l’interopérabilité sémantique profonde » d’un côté, et d’un autre côté une interopérabilité syntaxique au centre et « uniformité superficielle » en bout de chaîne. Des études spécifiques réalisées par Karen Calhoun (2014) ont listé les thèmes et défis clés pour les bibliothèques numériques avec une attention particulière portée à l’interopérabilité. Cette question est essentielle et l’interopérabilité technique a des limites évidentes. Miller (2001) distingue d’autres couches, au-delà des couches classiques (sémantique, syntaxique et interopérabilité technique). Il ajoute l’interopérabilité politique et humaine, qui concerne la décision de rendre les ressources plus largement accessibles et précise quelles en sont les implications pour les organisations : interopérabilité entre les communautés, interopérabilité des lois et règlementations, liée à des questions d’ordre culturel, impliquant des usages, des attentes et des besoins qui diffèrent d’un pays à l’autre. Les couches de traitement ajoutées par Miller sont particulièrement pertinentes pour quiconque a l’intention d’intégrer des données issues de différents lieux géographiques.

– Absence d’une technologie sémantique suffisamment adaptée : durant les dix dernières années, un certain nombre de groupes de travail du W3C dans le domaine du développement du web sémantique ont montré un véritable intérêt pour les systèmes d’organisation des connaissances traditionnellement utilisés dans le domaine bibliographique (thesauri et classifications) et leur capacité à identifier et communiquer le sens. Ceci est particulièrement vrai pour les groupes de développement du W3C travaillant sur le vocabulaire, les standards des ontologies du web, les données qui leur sont liés et – plus récemment cela a aussi été le cas du

14. KNOWeSCAPE, The dynamics of information and knowledge landscapes, http://www.cost.eu/domains_actions/mpns/Actions/TD1210

(17)

groupe d’incubation du W3C – des données liées aux bibliothèques. Les standards des ontologies du web, comme les systèmes simples d’organisation des connaissances, sont mis en place avec l’intention de proposer un modèle commun de données, à des fins de partage et pour relier entre eux les différents systèmes d’organisation des connaissances au travers du web sémantique. Les normes des systèmes simples d’organisation des connaissances sont également conçues pour êtres utilisées comme véhicule pour la publication et le partage des systèmes d’organisation des connaissances qui ne sont pas nativement numériques (ou XML/RDF). Les réalisations scientifiques et technologiques ne sont pas complètement utilisées pour améliorer l’accès à l’information et la découverte d’information dans les bibliothèques numériques et les fonds documentaires15. Il est grand temps de faire un pas en avant dans ce domaine.

4. Initiatives pour l’amélioration de l’accès dans les bibliothèques et les fonds numériques

Nous décrivons ici deux initiatives (une ressource numérique et une bibliothèque numérique) renouvelant l’accès aux ressources numériques pour les sciences humaines. La découverte et l’accès à l’information présente dans les ressources numériques, implique l’utilisation d’interfaces suffisamment adaptées. Deux conceptions différentes sont à la source du design de ces interfaces : une approche collaborative et orientée utilisateur et une approche par facettes. Les deux approches disposent d’une assistance visuelle.

Stories Matter traite de l’histoire orale : http://www.stories- matter.com/. Les auteurs définissent ainsi le système : « Stories Matter16 a pour but de permettre aux partenaires du groupe Histoires de vie pour les Montréalais déplacés par les guerres, les génocides et autres violations des droits humains (projet CURA), d’interagir grâce aux interviews, d’une façon qui met l’interviewé dans une position centrale vis-à-vis des histoires qui sont racontées. De plus, afin de pouvoir interagir avec l’ensemble des sessions,

15. Projet DIGIKO

16. Source: http://storytelling.concordia.ca/storiesmatter/wp-content/uploads/

2010/02/stories-matter-screenshot.jpg

(18)

les utilisateurs ont la possibilité de créer des clips vidéo en fonction de leurs critères personnels, et de créer les listes de lectures personnalisées de clips consacrés à un certain thème. Un outil de recherche d’information adapté permet aux utilisateurs d’accéder aux clips, sessions, interviews et projets en lien avec leurs centres d’intérêt particuliers. À la fin, les utilisateurs peuvent exporter les résultats de leur travail au format PowerPoint ou en HTML pour en faciliter l’usage sous forme de présentation. Les systèmes d’organisation des connaissances, nuages de tags, éléments biographiques se combinent afin de faciliter l’accès aux contenus ».

L’autre exemple est celui de la Bibliothèque numérique mondiale de l’UNESCO. Toujours davantage de plateformes interculturelles proposent en ligne des contenus culturels ou d’apprentissage sans aucune traduction (ressources multilingues), mais qui utilisent une classification par facettes combinée à une assistance visuelle. Tel est le cas de L’UNESCO et de ses 32 institutions partenaires qui ont lancé le 21 avril 2009 la Bibliothèque numérique mondiale, proposant sur le web des matériaux culturels uniques issus de bibliothèques et archives du monde entier. Le site – www.wdl.org – donne accès à des manuscrits, des cartes, des livres rares, des films, des enregistrements sonores, des estampes et photographies diverses. Il permet un accès illimité du grand public à ces matériaux.

5. Conclusion et perspectives

L’utilisation des ressources numériques dans le champ des sciences humaines a connu une évolution plus lente que dans le domaine scientifique (Warwick, 2012) alors qu’on note une augmentation constante et réelle du besoin. Comme l’avait prédit Hocky en 2008 : « Les générations d’étudiants à venir dans le domaine des sciences humaines, seront dépendants d’un vaste éventail de ressources numériques proposées au format numérique » (Hocky et al., 2008, 69) cité par Terras (2012).

L’objectif conjoint des humanités digitales et des bibliothèques numériques est de proposer de nouvelles formes de recherche qu’il était difficile, voire impossible, d’entreprendre auparavant. La fécondation réciproque de leurs réalisations, l’héritage des systèmes d’organisation de connaissance (SOC) lié à l’histoire des bibliothèques ainsi qu’à leur adaptation au numérique, combiné aux méthodes d’assistance visuelle sont

(19)

les voies dont dépendent non pas seulement la performance documentaire mais la production de connaissances nouvelles en sciences humaines.

Bibliographie

Borgman C. (2000). The invisible library: Paradox of the global information infrastructure. Library Trends, vol. 57, n° 4, p.652-675.

Broughton V., Slavic A. (2007). Building a faceted classification for the humanities: principles and procedures. Journal of Documentation, vol. 63, p. 727-754.

Calhoun K. (2014). Exploring Digital Libraries, Foundation, practice, prospects, Facet Publisher, London.

Favier L., Mustafa El Hadi W. (2012). From text to image: the concept of universality in Knowledge Organization systems designed by Paul Otlet and the International Institute of Bibliography. In: Categories, Contexts and Relations in Knowledge Organization. Proceedings of the 12th International ISKO (International Society of Knowledge Organization) Conference, 6-8 August 2012, Mysore, India. Ed. by Ergon Verlag, p. 220-229.

Gnoli C. (2011). Keynote address in ISKO-France Conference, Lille 2011.

Dynamisme et Stabilité dans l’organisation des connaissances. Ed. by W. Mustafa El Hadi. Paris, Hermès, p. 51-66.

Hodge G. M. (2000). “Systems of knowledge organization for digital libraries:

beyond traditional authority files” Digital Library Federation, Council on Library and Information Resources. http://www.clir.org/pubs/reports/

pub91/pub91.pdf

Miller P. (2001). Interoperability : « What is it and why should I want it? ».

Ariadne, 24.

Mustafa El Hadi W. (2013). Faceted classifications as a model for universal classifications. Knowledge Organization from Libraries to the Web, in Journal of Information Management, SRELS (Sarada Ranganathan Endowment for Library Science), Bangalore, vol. 50, n° 6, December 2013, p. 720-734.

Schanrhors A. (2013). Walking through a library remotely, Royal Academy of Arts and science. Site source: http://ehumanities.nl/:http://www.

dans.knaw.nl/en/content/contact/staff-members/andrea- Presentation at European Seminar, Ecole Doctorale, 12th April, 2013, Lille, France.

(20)

Schreibman S., Siemens R., Unsworth J. (2004). Companion to Digital Humanities, (Eds.), Blackwell Companions to Literature and Culture, Blackwell Publishing Professional, Oxford, 132-144.

Slavic A. (2013). Classification in knowledge transfer between languages, domains and collections in humanities: from legacy collections to the Web of linked data, Presentation at European Seminar, Ecole Doctorale, 12th April, 2013, Lille, France, Svensson P. (2010). The Landscape of Digital Humanities.

Digital Humanities, Quarterly, vol. 4 n° 1.

Slavic A. (2011). Classification revisited: a web of knowledge. Innovations in information retrieval: perspectives for theory and practice. Ed. by A. Foster and P. Rafferty P. London, Facet. p. 23-48.

Smiraglia R.P. (2013). Prolegomena to a New Order: A Domain-Analytical Review of the Influence of S.R. Ranganathan on Knowledge Organization.

Knowledge Organization from Libraries to the Web, in Journal of Information Management, SRELS (Sarada Ranganathan Endowment for Library Science), Bangalore, vol. 50, n° 6, December 2013, p. 709-719.

Warwick C., Terras M., Nyhan J. (eds). (2012). Digital Humanities in Practice, Facet Publisher, London.

Références

Documents relatifs

Une réflexion sur les rapprochements de ces deux périodes de transition, de transformation des systèmes documentaires, témoigne de l’articulation importante entre le développement

Les éditeurs de contenus peuvent craindre notamment une dépendance accrue à des acteurs tiers alors qu’ils avaient développé des relations directes avec les bibliothèques

Son intervention sera suivie par la présentation du projet CIRIS (Collection interactive informatisée de sources antiques) par l’équipe d’information scientifique du Centre

[r]

Workshop “Ethiopian Studies and Digital Humanities: tools and projects (Beta maṣāḥəft, Ethiopian Manuscript Archives, EthioMap)”1. 21-24 January 2019 Venue : CNRS – 27 rue

16:00 – 17:30 Mise en pratique : encoder des noms de lieux Comment encoder les noms de lieux dans les sources manuscrites. Annoter des noms de lieux dans des sources

température augmente et donc émet davantage de rayonnement infrarouge. Elle atteint sa température d’équilibre lorsque elle perd autant d’énergie qu’elle en reçoit..

5) L’effet de serre.. Comme la température de la vitre augmente, elle émet plus de rayonnement infrarouge. Dans le cas présent , elle émet autant de rayonnement vers le haut que