• Aucun résultat trouvé

L’étude présente a deux objectifs : D’un côté, il est question de s’intéresser aux commentaires en ligne portant sur les livres et leur lecture, aux contextes de publication, notamment sur la plateforme Babelio, à leurs formes, à leur contenu, aux expériences de lecture qui sont partagées à travers eux. De l’autre côté, il est question de mettre en œuvre une méthodologie de méthodes mixtes, autant quantitative que qualitative, de la décrire minutieusement pour permettre la re-productibilité90 des résultats autant que pour servir de documentation d’appli-cation d’une base de données et d’un logiciel de statistique textuelle, Iramuteq, rarement employés pour l’analyse de commentaires de lecture, et enfin pour tester sa pertinence dans l’exploration des commentaires et donc sa capacité à répondre aux questions du pourquoi et du comment de la lecture à l’ère du numérique.

Il n’y a pas de méthode tout faite pour analyser des textes variés : les mé-thodes assistées par ordinateur sont en élaboration continue et l’extension de leur application n’a réellement émergé qu’au cours de la présente étude ; il y a l’obligation de construire ses propres méthodes par tâtonnement, ce qui conduit à une démarche essai-erreur, à partir des sources ; il y a encore peu de recul sur l’adéquation des outils numériques avec des ressources innovantes, telles que les commentaires en ligne.

Ces considérations méthodologiques ont conduit à un biais inattendu mais constructif de la thèse : tester la validité des outils de recherche, avant de s’inté-resser à l’analyse qualitative, source prometteuse de pistes à explorer dans l’avenir. La présence importante des explications de traitement des données avec Ira-muteq dans les troisième et quatrième parties de cette thèse s’explique à la fois par son utilisation innovante pour explorer les critiques littéraires et par un manque de documentation accessible. Il s’agit de démontrer les potentialités et les limites de cette méthodologie, sa mise en place chronophage, mais aussi sa faisabilité pour les chercheurs et chercheuses en études littéraires sans connaissances préalables des méthodes assistées par ordinateur, notamment de la statistique textuelle ou du langage de requête SQL pour interroger une base de données MySQL.

La première partie (p. 40) sert de positionnement critique et méthodolo-gique face à un état de l’art sélectif, autant sur le plan des théories de la lecture et du lecteur, que des approches pluridisciplinaires (les études littéraires, les sciences de l’information et de la communication, les études sociologiques) des pratiques de lecture et des échanges littéraires en ligne.

La deuxième partie (p. 140) pose le point de départ avec une brève pré-sentation des ouvrages de fiction sur lesquels ont été collectées les critiques, des échanges littéraires en ligne, leurs principaux aspects, ainsi que trois notions

im-90. Voir Christof Schöch et al., « Replication and Computational Literary Studies », Digital Humanities Conference 2020 (DH2020) (Ottawa), 20-25 juil. 2020.

portantes pour les comprendre – la production du contenu, l’identité en ligne et la sociabilité littéraire – et la description de Babelio, la plateforme d’une com-munauté de lecteurs et lectrices en ligne, dont sont issus les commentaires de l’échantillon d’étude. Cette deuxième partie donne déjà lieu à une analyse géné-rale des échanges littéraires en ligne et s’interroge sur l’existence d’une Nouvelle République des Lettres, dont la communauté de Babelio pourrait être représen-tative, avant que la troisième et la quatrième partie soient plus particulièrement consacrées à la méthodologie et ses résultats pour explorer les critiques sur Babe-lio.

La troisième partie (p. 230) documente minutieusement la mise en œuvre technique et méthodologique pour l’analyse des critiques collectées sur Babelio, afin d’assurer la transparence et la traçabilité de la démarche scientifique. D’abord, il est question de la collecte et du traitement de l’échantillon des « critiques » dans une base de données MySQL construite dans ce but et de la nature des données. Ensuite, on s’intéresse à la préparation de l’échantillon des critiques pour le text mining et l’utilisation du logiciel de text mining, Iramuteq. Enfin, on présentera les étapes de production d’une liste de termes annotés, regroupant des termes évoquant des expériences de lecture que l’on a retracées dans les commentaires. Dans une logique de science ouverte, le jeu de données – l’échantillon original et l’échantillon traité, le dictionnaire d’indexation nécessaire pour Iramuteq, ainsi que la liste de termes annotés – est disponible sur Zenodo91.

La quatrième partie (p. 302) concerne l’exploitation et l’interprétation des données de l’échantillon et de la liste de termes annotés. Des approches différentes sont entreprises : Premièrement, une analyse statistique des métadonnées accom-pagnant les textes de critiques pour observer la répartition temporelle de leur publication, leur longueur, la notation en étoiles qui les accompagne, le nombre de commentaires et d’appréciations qu’elles ont reçus et qui témoignent de l’in-teraction entre les membres de la plateforme Babelio.

Deuxièmement, une approche est faite par le contenu des critiques en choi-sissant quelques notions, telles que les mentions du style et de la traduction, les références intertextuelles, les références aux médias de lecture, aux lieux de découverte ou de provenance des ouvrages commentés, etc.

Troisièmement, une analyse des critiques via Iramuteq tire profit de trois formes d’analyse proposées par Iramuteq (la liste des formes actives, le nuage de mots et la classification hiérarchique descendante) pour explorer le contenu des critiques, ainsi que pour tester la validité de ces analyses dans cette explo-ration générale, mais aussi la possibilité de détecter les énoncés contenant des expériences de lecture.

91. Cora Krömer, « Expériences de lecture - Babelio (Version 1.0.0) [Data set] », dans :

Quatrièmement, une analyse explore la liste de termes annotés qui évoquent un élément d’une expérience de lecture – le sujet lecteur, les prémisses, les médias de lecture, la session de lecture, les contenus, la réception. Il s’agit surtout d’une exploration et d’une description de ce que l’on peut trouver dans les critiques de l’échantillon avec les méthodes employées pour proposer des pistes à explorer, plutôt que d’une analyse qualitative et herméneutique approfondie pour toutes les notions.

Les Annexes (p. 508) contiennent quelques critiques littéraires et de com-mentaires y répondant – quand leur intégralité et leur pouvoir explicatif se jus-tifient dans le corps de la thèse –, quelques explications et résultats d’analyses de la classification hiérarchique descendante générée par Iramuteq – pour éviter trop de technicité –, ainsi que les listes de termes annotés classifiées par no-tions. Ces annexes sont destinées à illustrer et appuyer les analyses présentées dans la quatrième partie. Par contre, l’ensemble de l’échantillon de critiques et des sous-échantillons d’analyse est disponible sur Zenodo. En outre, les annexes contiennent des résumés substantiels en allemand et en anglais pour répondre aux exigences de la thèse en cotutelle.

L’ensemble des analyses permet de témoigner de l’enjeu de la construction d’une approche de méthodes mixtes – combinant des approches quantitatives et qualitatives – et d’une approche pluridisciplinaire – tirant profit de constatations d’études en histoire du livre, en études littéraires, en sociologie, en sciences de l’information et de la communication – pour extraire et décrire des expériences de lecture et les contextes de leur partage. Ainsi, cette étude à caractère exploratoire et descriptif tente-t-elle de présenter un instantané d’un phénomène en évolution permanente, à savoir une des pratiques de lecture contemporaine sur le modèle de la lecture de livres de fiction imprimés dont l’expérience est partagée dans une communauté de lecteurs et lectrices en ligne.

sélectif et positionnement