• Aucun résultat trouvé

Cadrage historique : des « humanities computing » aux « humanités numériques » 52

UNE RÉVOLUTION NUMÉRIQUE DES SHS

1. Émergence d’un mouvement

1.1. Cadrage historique : des « humanities computing » aux « humanités numériques » 52

mouvement qu’elle recouvre de s’imposer peu à peu comme la figure de proue des réflexions sur les transformations numériques qui affectent la recherche en SHS, si bien qu’il paraît aujourd’hui presque impossible d’évoquer les rapports entre numérique et SHS sans faire référence aux HN. La prolifération des discours qui mobilisent la notion témoigne à elle seule de l’intensité des débats qui animent la communauté scientifique autour des conséquences attendues des technologies numériques sur le développement des SHS.

Malgré ces difficultés, nous souhaitons tenter de décrire et d’analyser, dans une perspective critique, les fondements du projet des HN, en tant qu’ils forment le socle d’un mouvement contestataire cherchant à renouveler tous les aspects constitutifs du champ des SHS par une logique d’équipement numérique globale. Après une étude du processus d’émergence et des voies d’institutionnalisation du mouvement, nous examinerons les grands principes qu’il énonce, ses ambitions et ses prétentions, les attentes qu’il suscite et les imaginaires sur lesquels il repose. Il s’agira, dans le même temps, d’élucider la nature complexe du discours des HN, qui se situe entre épistémologie et politique, et de déceler les conceptions de la recherche en SHS et les conceptions du numérique dont il est porteur.

1. Émergence d’un mouvement

1.1. Cadrage historique : des « humanities computing » aux « humanités numériques »52

Le travail de lemmatisation de l’œuvre de Saint Thomas d’Aquin par le prêtre jésuite et professeur de philosophie Roberto Busa (figure 4) est souvent considéré comme l’événement ayant marqué la naissance d’un champ de recherche, baptisé « humanities computing »53, préfigurant lui-même l’émergence du mouvement des HN. L’Alliance of Digital Humanities Organizations54 le reconnaît ainsi comme « le premier pionnier des humanities computing » et décerne un prix à son nom à des « réalisations exceptionnelles en terme d’application des technologies de l’information et de la communication à la recherche en sciences humaines »55. En 1946, le prêtre italien entreprend une recherche sur le vocabulaire de la présence dans l’ensemble des textes de Saint Thomas d’Aquin et,

52 Ce « cadrage historique » propose une brève généalogie du mouvement des HN, celle-ci s’inspirant des travaux historiographiques menés par certains précurseurs et partisans du mouvement, notamment Susan Hockey (2004), Lou Burnard (2012), Olivier Le Deuff et Frédéric Clavert (2014), Marin Dacos et Pierre Mounier (2014).

53 Expression que l’on pourrait traduire en français par « humanités computationnelles » ou « humanités informatisées ».

54 Association internationale qui chapeaute les différents mouvements nationaux liés au mouvement des « Digital Humanities » : http://adho.org/

pour mener à bien son projet, choisit de recourir à l’informatique naissante. Le projet se concrétise à partir de 1949 lorsque le créateur d’IBM, Thomas J. Watson, accepte de collaborer avec lui. Ils mettent alors au point un programme de concordance automatique fonctionnant avec un système de fiches perforées et commencent ainsi la réalisation de ce qui apparaît comme la première tentative d’élaborer un thésaurus informatisé, et comme la première collaboration historique entre littérature et informatique dans une perspective de recherche scientifique. Cette entreprise colossale connaît des évolutions successives sur plus de 50 ans. Elle prend d’abord la forme d’une série de 56 volumes imprimés, publiés à la fin des années 1970. Puis, l’Index Thomisticus est porté sur CD-ROM de 1989 à 1992, où il bénéficie alors de la technologie hypertexte, avant d’être importé sur le web56 en 2005 et rebaptisé Corpus Thomisticum. Roberto Busa a activement contribué à ce projet tout au long de sa vie.

La technique de concordance informatisée mise au point par Roberto Busa et IBM connaît des applications externes au projet initial et donne ainsi lieu à plusieurs expérimentations dans les années 1960. Il s’agit d’abord de recherches menées dans le cadre d’enquêtes philologiques et lexicologiques dont les premiers expérimentateurs sont : le suédois Alvar Ellegård (Ellegård, 1962), les américains Frederick Mosteller et David L. Wallace (Mosteller, Wallace, 1964), ainsi que Jess Bessinger et Stephen Parrish (Bessinger, Parrish, 1965), et le britannique Roy Wisbey (Wisbey, 1963) qui fonde le Centre for Literary and Linguistic Computing à l’université de Cambridge en 1963. L’une des premières réunions de chercheurs impliqués dans le développement de ces pratiques est organisée par IBM en 1964 à Yorktown Heights aux États-Unis. La conférence donne lieu à la publication d’un texte fondateur, les Literary Data Processing Conference Proceedings, édité par Jess Bessinger et Stephen Parrish en 1965. Il s’agit d’un texte principalement technique et méthodologique où sont abordés divers problèmes inhérents à l’informatisation de la technique de concordance et comprend notamment certaines critiques concernant le phénomène d’altération des données textuelles au moment de leur encodage. Dans la poursuite directe de ces premières manifestation, la création de la revue Computers and the Humanities57, dont le premier numéro paraît en 1966, contribue à la reconnaissance des « humanities computing » en devenant rapidement le principal lieu de diffusion internationale des connaissances du domaine. Il faut toutefois noter que, malgré la notoriété croissante du champ à partir des années 1970, le principe d’un travail en sciences humaines basé sur l’utilisation de l’informatique n’est pas encore admis à l’échelle de la communauté des SHS et apparaît peu légitime à cette époque. Par conséquent, les échanges entre chercheurs participant au développement des « humanities computing » se fait davantage à travers des canaux spécifiques et dans une moindre mesure dans les publications traditionnelles et instituées des SHS.

56 http://www.corpusthomisticum.org/

Figure 4 : Roberto Busa

Les années 1970 sont marquées par la volonté de poser des standards méthodologiques et de définir des procédures techniques propres au domaine de recherche. En mars 1970, une conférence internationale est organisée à l’université de Cambridge qui donne lieu à une publication collective éditée par Roy Wisbey (Wisbey, 1971), posant les bases des protocoles technico-méthodologiques pour les chercheurs en littérature et en linguistique qui souhaitent recourir à des outils informatiques. Cet événement marque le début d’une série de rassemblements biannuels au Royaume-Uni qui couvre toute la décennie : Edinburgh (1972), Cardiff (1974), Oxford (1976), Birmingham (1978) et Cambridge (1980). À la suite du Centre for Literary and Linguistic Computing de Cambridge, l’Association for Literary and Linguistic Computing (ALLC) est fondée au King’s College de Londres en 1973 et produit d’abord un bulletin trimestriel puis, à partir de 1986, une revue intitulée Literary and Linguistic Computing58. En parallèle de ces rassemblements britanniques, en Amérique du Nord se tiennent plusieurs conférences à partir du milieu des années 1970 sous l’appellation International Conference on Computing in the Humanities (ICCH). Bien que ces deux événements se revendiquent du domaine commun des « humanities computing », on perçoit quelques divergences en terme d’objets de recherche. En effet, alors que l’ALLC se focalise sur des applications exclusivement liées à la linguistique, les communications et publications qui émanent de l’ICCH concernent le vaste domaine des sciences humaines, des arts et des lettres, et se consacrent à des thématiques plus variées telles que l’écriture, la musique, les arts plastiques et l’archéologie. Pour accompagner la diversification de ses objets et domaines d’application, l’ICCH donne finalement lieu à la création de l’Association for Computers and the Humanities59 (ACH) en 1978.

58 La revue est toujours éditée par les presses universitaires d’Oxford, sous le titre de Digital Scholarship in the

Humanities : https://academic.oup.com/dsh

Les aspects techniques connaissent aussi des développements et le premier logiciel de concordance d’invention britannique, le COCOA, se diffuse dans la deuxième moitié des années 1970. Toutefois, jugé peu performant, il est remplacé par le logiciel Oxford Concordance Program60 en 1982 qui connaît une diffusion plus importante et devient un outil de référence à l’international. Les « humanities computing » participent également au développement des techniques d’archivage et de conservation des textes, de plus en plus de chercheurs appelant à la création d’archives numériques de textes utilisés comme corpus de recherche commun. À partir de 1972, Theodore Brunner dirige le projet Thesaurus Linguae Graecae à l’Université de Californie, une base de donnée fonctionnant sur l’ordinateur Ibycus de David Packard’s, réunissant les grands textes de la Grèce antique, encore accessible aujourd’hui sous la forme d’un site web61. Un projet similaire est mené pour des textes classiques en latin par le Packard Humanities Institute. Les chercheurs intéressés par le domaine obtiennent de plus en plus de soutiens financiers et des centres de « humanities computing » se multiplient partout dans le monde ainsi que des programmes pédagogiques universitaires dont les contenus se concentrent essentiellement sur les aspects techniques de l’utilisation des applications de concordance.

À la fin des années 1980 l’ordinateur personnel est rapidement adopté par les « humanities computing » et contribue à leur développement. Les chercheurs qui souhaitent recourir à l’ordinateur dans leurs projets sont ainsi moins dépendants des grands centres d’informatique universitaires. Pour poursuivre la consolidation du mouvement et la fédération de la communauté des chercheurs, le besoin d’une solution logicielle standardisée se fait sentir. En 1987, Nancy Ide organise avec le soutien de l’ACH un séminaire au Vassar College pour discuter la possibilité de développer un programme d’encodage textuel qui servirait d’outil de référence pour tout travail de recherche en « humanities computing ». La méthode d’encodage SGML62 (figure 5), qui existe depuis 1986, est choisie pour servir de base au programme. Les participants au séminaire s’accordent sur un ensemble de principes, nommés les « Poughkeepsie Principles »63, qui visent à fournir un format standard et unique pour l’encodage et l’échange de données en sciences humaines. La direction du projet est confiée à un comité composé de représentants de l’ACH, de l’ALLC et de l’Association for Computational Linguistic (ACL). Le groupe parvient à lever plus d’un million de dollars avec des soutiens provenant de toute l’Amérique du Nord et supervise la Text Encoding Initiative64 (TEI) dont l’objectif est de fixer des « directives pour l’encodage et le partage de textes électroniques »65. Le comité est un succès et ses travaux débouchent sur une première version des Text Encoding Initiative

60 Le programme fut initialement développé de 1979 à 1980 par Ian Marriot et Susan Hockey.

61 http://www.tlg.uci.edu/

62 Standard Generalized Markup Language.

63 http://www.tei-c.org/Vault/ED/edp01.htm

64 http://www.tei-c.org/index.xml

Guidelines publiée en mai 1994 en format imprimé et en format électronique. Le texte définit 400 tags d’encodage comme structure permettant le développement de nouveaux domaines applications. Selon Lou Burnard, qui fut l’un des acteurs du projet, « il s’agissait de rendre possible la mutualisation des données en apportant une solution à l’immense variété des manières d’encoder » (Burnard, 2012). En établissant une théorie de référence, le projet TEI représente une étape importante du processus d’institutionnalisation des « humanities computing ». La publication des Guidelines accompagne aussi le développement des projets de bibliothèques numériques qui, jusque là, évoluaient indépendamment du mouvement. Toutefois, malgré ces efforts pour unifier le champ, on constate que certains domaines d’application s’éloignent progressivement des « humanities computing », en particulier les « computational linguistics » qui s’autonomisent de plus en plus et revendiquent leur statut de spécialité distincte, exclusivement centrée sur l’utilisation de l’ordinateur dans le champ de l’étude des langues, avec des conférences et séminaires spécifiques.

Dans la dernière moitié des années 1990, l’introduction dans plusieurs universités anglophones de programmes académiques qui s’inscrivent explicitement dans le projet des « humanities computing » témoigne de la large reconnaissance du domaine au sein de l’enseignement supérieur. Parmi les programmes précurseurs, on peut retenir : le Minor in Applied Computing au King’s College de Londres, le BA in Multimedia de la McMaster University au Canada, le MA in Digital Humanities de l’université de Virginie, le MA in Humanities Computing de l’université d’Alberta et le MPhil in History and Computing à l’université de Glasgow. Aujourd’hui la majorité des grandes universités anglophones proposent des cursus scolaires spécialisés et abritent des centres de recherche ou, a minima, des groupes de réflexions sur les problématiques liées aux HN.

En 2004, le mouvement des « humanities computing » connaît un tournant majeur en changeant de dénomination pour l’expression « digital humanities » à l’occasion de la publication d’un ouvrage collectif, A companion to Digital Humanities, dirigé par John Unsworth, Susan Schreibman et Ray Siemens. Ce texte, qui réunit pas moins de 45 contributeurs, parmi lesquels on trouve des figures historiques du mouvement telles que Roberto Busa, Willard McCarty, Susan Hockey et Nancy Ide, se présente comme un nouveau lieu d’unification, sous une appellation commune, d’un vaste ensemble d’approches et d’applications des ressources informatiques aux objets des principales disciplines littéraires classiques (littérature, stylistique, linguistique, philologie, histoire, archéologie, etc.). Il s’agit de déterminer les limites historiques, théoriques et pratiques d’un champ de recherche et de le faire reconnaître comme une discipline à part entière :

« [...] for the first time, a wide range of theorists and practitioners, those who have been active in the field for decades, and those recently involved, disciplinary experts, computer scientists, and library and information studies specialists, have been brought together to consider digital humanities as a discipline in its own right, as well as to reflect on how it relates to areas of traditional humanities scholarship. »66 (Schreibman, Siemens, Unsworth, 2004)

L’année suivante, la création de l’Alliance of Digital Humanities Organizations67, chargée de regrouper les associations et structures régionales préexistantes, apparaît comme l’événement qui achève la consécration de la dénomination « digital humanities ». On perçoit bien ici l’ambition stratégique des porteurs du mouvement et Aurélien Berra remarque que l’« on doit aussi à une décision marketing le passage de humanities computing à digital humanities » parce que « cette dénomination tactique rajeunissait un champ de recherche et visait à faciliter l’obtention de financements » (Berra, 2012). En 2006 le National Endowment for the Humanities crée une structure de subventions intitulée Digital Humanities Initiative qui popularise le terme, et sera rebaptisée Office of Digital Humanities68 en 2008. On notera également l’importance de la création de la plateforme CenterNet69 en 2007 aux États-Unis qui cherche à structurer un réseau international de centres de « digital humanities ». Cette plateforme dresse aujourd’hui une liste de plus de 300 centres et groupes de recherche qui s’y sont inscrit librement. Elle est rattachée à l’Alliance of Digital Humanities Organizations depuis 2012.

En Amérique du Nord et au Royaume-Uni, l’institutionnalisation des DH comme domaine de recherche à part entière est aujourd’hui bien stabilisée, via des espaces de publication (Digital

66 « […] pour la première fois, un vaste éventail de théoriciens et de praticiens, ceux qui ont été actifs dans le champ depuis des dizaines d’années, et ceux plus récemment investis, des experts disciplinaires, des informaticiens, et des spécialistes de l’information et de la documentation, ont été rassemblés pour considérer les digital humanities comme une discipline de plein droit, ainsi que pour montrer leurs relations avec des domaines traditionnels des sciences humaines. » (Notre traduction).

67 http://adho.org/

68 http://www.neh.gov/divisions/odh

Humanities Quarterly), des formations dédiées dans le supérieur délivrant des diplômes et des titres universitaires, des équipes et des centres de recherche spécialisés, des programmes de financements spécifiques (Office of Digital Humanities). Toutes les conditions institutionnelles constitutives d’un véritable « champ scientifique » (Bourdieu, 1976a) semblent réunies (Kirschenbaum, 2012 ; Welger-Barboza, 2012).

La France se rattache tardivement au mouvement avec le THATCamp70 Paris 2012, dont l’un des principaux débouchés fut la création d’une association francophone des « digital humanities » créée en juin 2014 sous le nom Humanistica71. La Très Grande Infrastructure de Recherche (TGIR) Huma-Num72 est aujourd’hui la principale institution française en HN. Créée en 2013 après la fusion du Très Grand Équipement (TGE) Adonis et de la TGIR Corpus-IR, elle associe le CNRS, l’Université d’Aix-Marseille et le Campus Condorcet. Elle vise à « faciliter le tournant numérique de la recherche en sciences humaines et sociales ». Les deux acteurs majeurs du mouvement en France sont Pierre Mounier et Marin Dacos, cofondateurs du Cléo73 (Centre pour l’édition électronique ouverte), coanimateurs du séminaire « Digital Humanities : les transformations numériques du rapport aux savoirs »74 à l’EHESS et coadministrateurs du blog Blogo-numericus75. À l’origine de nombreuses publications sur le domaine, et en particulier la série de livres numériques intitulée Read/Write Book abondement citée, ils militent activement pour la reconnaissance des HN dans le contexte francophone. Ils sont aussi à l’origine de la plateforme de publication numérique OpenEdition, aujourd’hui supportée par le Cléo.

Depuis peu, on voit l’expression « humanités numériques » déborder du champ proprement scientifique pour circuler dans les sphères médiatiques et politiques. Ainsi, on a vu récemment apparaître le syntagme dans le cadre d’un débat sur la réforme de l’éducation nationale. En octobre 2014 le Conseil National du Numérique a publié un rapport intitulé « Jules Ferry 3.0 »76 où ses membres proposent leurs « recommandations pour bâtir une école créative et juste dans un monde numérique »77 et parmi lesquelles on trouve la création d’un « baccalauréat général humanités numériques ». La proposition a été relayée et débattue dans plusieurs grands médias et François Hollande a suggéré que « l’effort pour les humanités numériques soit non seulement maintenu, mais renforcé dans les années qui viennent » dans son discours d’inauguration des nouveaux locaux pour

70 Thatcamp (The Humanities and Technology Camp) est un réseau international de « non-conférences » annuelles sur le modèle des BarCamps fondé en 2008 au Center for History and New Media de l’université George Mason. Le premier Thatcamp européen s’est tenu à Paris en 2010 à l’initiative du Cléo (Centre pour l'édition électronique ouverte).

71 http://www.humanisti.ca/ 72 http://www.huma-num.fr/ 73 http://cleo.openedition.org/ 74 http://www.ehess.fr/fr/enseignement/enseignements/2011/ue/1094/ 75 http://bn.hypotheses.org/ 76 https://goo.gl/1kMXI4 77 http://www.cnnumerique.fr/education-2/

l’École des Chartes en octobre 2015. La notion est aujourd’hui officiellement reconnue et employée par le ministère de l’enseignement supérieur pour désigner des laboratoires d’excellence ainsi que de nouveaux cursus de formation universitaire78.

1.2. L’imposition d’un « label »

Du point de vue de l’analyse du discours, le syntagme « humanités numériques » paraît épouser tous les traits caractéristiques de la catégorie de la « formule », telle qu’elle a été récemment théorisée dans les travaux d’Alice Krieg-Planque qui propose de la considérer, dans une tentative de définition générale, comme « un ensemble de formulations qui, du fait de leurs emplois à un moment donné et dans un espace public donné, cristallisent des enjeux politique et sociaux que ces expressions contribuent dans le même temps à construire » (Krieg-Planque, 2009 : 7). L’expression nous semble posséder, dans sa forme comme dans ses processus communicationnels de circulation, trois propriétés essentielles du genre discursif de la formule.

« Humanités numériques » constitue d’abord une unité lexicale remarquable par sa stabilité, cette fixité du syntagme étant la première des conditions matérielle d’existence et de diffusion d’une formule. En effet, le caractère réduit, concis, du signifiant est un trait morphologique caractéristique d’une logique formulaire, et cette concision s’accroît à mesure que l’expression se popularise et circule. C’est bien le cas pour l’expression « humanités numériques » que l’on voit de plus en plus apparaître sous la forme de l’acronyme « HN », ou « DH » pour « digital humanities », dans les nombreux textes qui l’invoquent. Alice Krieg-Planque affirme que :

« Ces réductions s’expliquent en partie par une répétition de la séquence dans les usages, suivant la règle établie par André Martinet (1960, p. 194) selon laquelle “lorsque la fréquence d’une unité s’accroît, sa forme tend à se réduire”, par siglaison, par effacement d’une unité lexicale, ou par des troncations qui portent ces noms si délicats d’aphérèse et d’apocope. » (Krieg-Planque, 2009 : 74)

C’est aussi la profusion de formulations alternatives, ou concurrentes, qui participe au phénomène