• Aucun résultat trouvé

Un grand écart méthodologique : les Humanités numériques à la rencontre de la littérature et de la Géomatique de la littérature et de la Géomatique

Concrètement, la rencontre interdisciplinaire de la littérature et de la géographie se fera selon deux pôles méthodologiques dans cette thèse : premièrement par le passage de concepts d’un domaine à l’autre, et, deuxièmement, par l’utilisation d’outils spécifiques à la géographie pour étudier la spatialité construite littérairement, et plus précisément par l’utilisation des outils de modélisation géomatique. La géomatique est, selon la définition techniciste de l’ENSG80, « un ensemble de technologies permettant de modéliser, de représenter et d’analyser le territoire pour en faire des représentations virtuelles : géolocalisation, imagerie spatiale, bases de données, systèmes d’information et SIG (Système d’information géographique), systèmes décisionnels, technologies du Web… ». Dans un sens plus large, la géomatique est la contraction des termes « géographie » et « informatique » et désigne « l’ensemble des utilisations techniques de l’informatique en géographie », c’est-à-dire l’ensemble des outils, mais aussi des méthodes et des travaux théoriques réflexifs, qui impliquent l’usage de l’informatique (Analyse spatiale, démarche de simulation, statistiques, etc.). Elle est intimement liée aux logiciels appelés Systèmes d’Information Géographiques (SIG) et à tout ce qui concerne l’information géographique. Le domaine de la géomatique englobe les différentes étapes intervenant dans la gestion de données géographiques : la collecte, le traitement, l’analyse et la représentation81. La géomatique est donc sans doute la branche la plus quantitative et technique de la géographie.

80 L’Ecole Normal des Sciences Géographique (ENSG), est l’école d’ingénieurs rattachée à l’Institut national de l’information géographique et forestière (IGN) qui forme des géomaticiens.

81 Pour une définition plus précise, voir le site de l’ENSG (notamment pour sa dimension professionnelle) : http://www.ensg.eu/Geomatique, consulté le 23 mai 2016 ; l’article « Géomatique » dans Le Dictionnaire de la géographie et de l’espace des sociétés, de Lévy et Lussault, op. cit., p. 402-403 (notamment pour les réflexions que l’essor de la géomatique entraine en géographie en général) ; L’ouvrage de Erwann Minville et Sid-Ahmed Souiah, L’analyse statistique et spatiale. Statistiques, cartographie, télédétection, SIG, Paris, Editions du temps, coll. « Outils et méthodes en géographie », 2003, et notamment le Chapitre 7 : « Les Systèmes d’Information géographique (SIG) » p. 189-243 (pour une approche plus technique des SIG).

La modélisation quant à elle n’est pas spécifique à la géographie, elle transcende les disciplines et se retrouve comme outil classique de la physique, de la biologie, de l’économie, de l’informatique, de la géographie, etc. « Dans le langage courant […] le modèle désigne aussi bien un objet sur lequel il convient de conformer son comportement, qu’un abrégé de toutes ses qualités. Le modèle est donc tout à la fois moule, gabarit, prescription, résumé et réduction82. » Qu’il précède l’objet ou le phénomène (dans le sens de « moule », « prescription ») ou qu’il soit élaboré à partir d’eux (dans le sens de « résumé », « réduction », ou de « synthèse »), le modèle est toujours un repère généralisant et simplifié auquel l’objet particulier est comparé. Heuristiquement, et notamment en géographie, le modèle est utilisé comme « une représentation simplifiée d’une réalité, qui donne du sens à cette réalité et permet donc de la comprendre83 », en ce sens c’est à la fois « un aboutissement dans la construction de la connaissance », en tant que synthèse heuristique tendant vers une généralisation84, et en même temps un système qu’il est possible d’explorer, d’éprouver, d’expérimenter et toujours d’améliorer (simulation, prospective à partir de modèle de la réalité, démarche exploratoire, construction rétroactive du modèle)85. Ce mouvement d’aller –retour permanent entre le phénomène ou l’objet étudié et le modèle qui doit le circonscrire révèle le degré de complexité que le processus de modélisation peut atteindre86. En tant que formalisation synthétique de l’information, la modélisation est inhérente à la géomatique.

Nous voulons relever le défi de la rencontre entre littérature et géographie à travers ce qu’elles ont de plus extrêmes : un matériau poétique que l’on peut qualifier dans une certaine mesure d’hermétique, en tout cas de complexe (l’œuvre de Kateb Yacine), et une approche scientifique que l’on peut qualifier de quantitativiste (la modélisation géomatique). Nous voulons faire l’expérience d’aller peut-être trop loin dans la confrontation de deux domaines, de deux méthodes, de deux natures de l’information, afin d’éprouver véritablement les limites de la rencontre interdisciplinaire, son intérêt et les gains heuristiques qu’elle permet. Cela étant dit, la justification de

82 GANASCIA, Jean-Gabriel, Le Petit Trésor. Dictionnaire de l’informatique et des sciences de l’information, Paris, Flammarion, 1998, p. 182.

83 CHAMUSSY Henry, article « Modèle », Hypergéo [En Ligne], dernière mise à jour en 2014, consulté le 24 mai 2016. URL : http://www.hypergeo.eu/spip.php?article9

84 « Un modèle est un aboutissement (provisoire, bien sûr) dans la construction de la connaissance. Les faits du monde sensible peuvent bien être enregistrés, les fondements des assertions être axiomatisés, tant que la connaissance ne sera pas représentée par un modèle qui portera, voire matérialisera, l’idée que le chercheur se fait de l’objet qu’il étudie, cette connaissance restera incomplète, et boiteuse. », Ibid.

85 Selon Jean-Philippe Bouchaud, physicien, la modélisation consiste, « à partir d’observation, [à] essayer de trouver un formalisme mathématique, qui est à la fois plausible et cohérent avec les données. Ensuite à partir de ce formalisme mathématique on prédit autre chose qu’on n’a pas vu dans les données et c’est ce qui souvent valide la modélisation » (« La science telle qu’elle se fait (3/4) : La modélisation à l’épreuve de la pratique », Les nouveaux Chemins de la connaissance, France Culture, Adèle Van Reeth, le 11/11/2015, à 10h). Cette définition, focalisée sur l’application de la modélisation en physique, est en fait applicable à tous les domaines. Elle formule bien l’aller-retour et la double fonction synthétique (à la fin de l’observation) et hypothétique (relativement au début de l’expérimentation) qui fondent la puissance heuristique de la modélisation Cette définition physique ajoute de la rigueur mathématique et matérielle au « modèle théorique », qui est définit comme un « schéma théorique, non matérialisé en général, qui n’est pas censé reproduire fidèlement un phénomène, mais au contraire le simplifie, pour pouvoir l’analyser, l’expliquer (partiellement ou non) et en prédire (dans certaines marges) la répétition. Le modèle est un simple instrument d’intelligibilité sans prétention ontologique », SINACEUR, Hourya, article « Modèle », dans LECOURT, Dominique (dir.), Le dictionnaire d’histoire et philosophie des sciences, Paris, Presses Universitaires de France, 1999, p. 649-651, p. 649. Cette deuxième définition est intéressante pour la fonctionnalité, l’utilité et le souci d’efficacité qu’elle introduit dans la notion de modèle.

86 A cet égard nous pouvons citer Roger Brunet, premier représentant de la modélisation en géographie, qui lui-même cite la définition d’Alain Rey : « Alain Rey définit le modèle comme “système représentant les structures essentielles d’une réalité” ; remarquons qu’ici l’on est fort éloigné de l’idée de simplification, mais non de l’idée d’essence, ce qui est autrement exigeant. », BRUNET, Roger, « Des modèles en géographie ? Sens d’une recherche », Bulletin de la société géographique de Liège, n°39, 2000-2, p. 21-30, p. 22.

cette démarche n’est pas l’amour du risque et de l’extrême. Nous avons déjà commencé à la justifier en ce qui concerne la cartographie, le développement de la thèse continuera cette justification et explorera ses potentialités. Notre démarche s’intègre à part entière dans un domaine en pleine ébullition technique, méthodologique et conceptuelle, avec lequel elle partage bien des interrogations : les Humanités numériques, qui englobent toutes les rencontres des « humanités » (sciences humaines et sociales) et de l’informatique (comme outil ou thématique de recherche). Les Humanités numériques posent les questions de la formalisation numérique et quantitative, de la généralisation, de la reproductibilité, de l’exhaustivité et de l’approche systématique, dans des domaines et à propos d’objets apparemment étrangers à ces approches : la littérature, la musicologie, l’histoire de l’art en général, dont la critique classique privilégie plutôt l’approche singulière. Les Humanités numériques sont souvent associées au traitement des big data, dont une connaissance globale est impossible à acquérir à « l’œil nu », sans le recours aux outils de synthèse que sont les statistiques, les algorithmes informatiques ou les visualisations graphiques87.

Un certain extrémisme interdisciplinaire marque souvent les initiatives très expérimentales des Humanités numériques. C’est parfois ce qui leur est reproché ; c’est exactement ce qui nous intéresse : entre une tradition technique parfois trop pleine de positivisme et une tradition disciplinaire parfois trop pleine de relativisme et de subjectivisme le dialogue il possible ? Une posture de recherche équilibrée et efficiente est-elle réalisable dans ces conditions ? N’est-ce pas dénaturer l’information issue d’un texte littéraire que de la confronter à des systèmes informatiques strictement systématiques et de la modéliser à travers des modèles forcément simplificateurs88 ? Comment peut-on aborder le texte littéraire de manière catégorielle, sélective, systématique et exhaustive – prérogatives à la fois de l’informatique, de la modélisation et de la cartographie89 ? Est-il seulement possible de parler d’« informations » concernant un texte littéraire ? Et d’un autre côté, pensons aux gains heuristiques qu’une vision synthétique et globale d’une œuvre littéraire complexe pourrait entraîner… Autant de questions que nous allons explorer, en pratique et par l’expérimentation, dans cette thèse. Autant de questions qui ne trouveront peut-être pas de réponses figées, reproductibles et absolument généralisables dans tous les cas90, mais qui seront approfondies et dont les limites seront posées et assumées. Cette thèse entend

87 On peut citer dans ce domaine la Distant reading que propose Franco Moretti pour appréhender les grands mouvements de l’histoire littéraire. L’approche de Franco Moretti – l’un des grands noms des humanités numériques littéraires et de la cartographie littéraire – consiste à adopter une vision distanciée et synthétique pour traiter un très grand nombre d’ouvrages et de données (de publication, de réception, etc.), grâce aux outils synthétiques des statistiques et de la graphique (il met les informations en « cartes », en « graphes » et en « arbres »), afin d’en extraire les logiques macrostructurelles de l’histoire littéraire. Voir MORETTI, Franco, Atlas du roman européen 1800-1900, Paris, Editions du Seuil, « La Couleur des idées », 2000 ; et MORETTI, Franco, Graphes, cartes et arbres. Modèles abstraits pour une autre histoire de la littérature, op. cit. À ce propos, nous pouvons également citer l’article GANASCIA, Gabriel, « Les Big Data dans les Humanités numériques », Des chiffres et des lettres, Revue Critique, n°819-820, août-septembre 2015, qui résume les enjeux actuels des big data (notamment en termes de quantité de données) dans les Humanités et les apports nécessaires du numérique dans ce domaine.

88 « Modéliser c’est donc trouver les expressions mathématiques, les équations qui simulent, c’est-à-dire représentent schématiquement et analogiquement un processus physique, biologique, psychologique, économique, social… Un grand nombre d’observation peuvent être synthétisées par un nombre relativement petit de paramètres : un modèle est forcément réducteur. » (SINACEUR, Hourya, « modèle », art. cit., p. 651).

89 Marc Brosseau formule l’apparente incompatibilité entre la littérature et la cartographie ainsi : « Seulement il faut se méfier de l’excès de mise en ordre, voire de mise en boîte. Il ne faut pas confondre la carte avec le territoire. Comment ces lieux et leurs liens sont-ils écrits, décrits, générés, inventés, déformés ou reproduits ? C’est aussi une question de géographe. », BROSSEAU, Marc, Des romans-géographes, Paris, L’Harmattan, Coll. « Géographie et Cultures », 1996, p. 11.

répondre au danger réducteur de la géomatique et de la cartographie (catégorisation, sélection, monosémie, univocité, uniformisation) par une tentative de modélisation de la complexité du système spatial littéraire du Cycle de Nedjma à travers la conception d’une base de données relationnelle. Celle-ci est conçue sur le modèle des bases de données géographiques91 et référence non seulement les lieux géographiques référentiels présents dans le Cycle, mais aussi les extraits de textes eux-mêmes et tous les éléments narratifs participant à la manière dont les lieux sont « écrits, décrits, générés, inventés, déformés ou reproduits92 ». Ainsi seront mis en relation dans une même base de données les éléments littéraires participant à la construction de l’espace géographique katébien et ceux participant à la construction de l’espace littéraire (parfois communs). Bien que les deux espaces ne puissent se déployer concrètement dans le même système de coordonnées – n’étant pas de même nature –, l’ambition est de visualiser les relations entre eux, automatiquement, de manière répétée et infiniment réactualisable, selon autant de combinaisons de modalités que nécessaire. Ces relations se cristallisent très notablement et seront donc recherchées aux endroits de répétitions, mises en échos, dérivations (textuelles ou thématiques) des éléments littéraires référencés dans la base de données : lieux, temps, personnages, tonalité, focalisation, épisodes, thèmes, citations, etc.

Nous pouvons déjà présenter succinctement certains choix de méthodes qui constituent des premières pistes de réponse aux questions soulevées et précisent à la fois nos objectifs et notre objet. S’agissant premièrement de construire une connaissance sur l’espace chez Kateb Yacine et non une connaissance générale sur l’espace référentiel, l’emprise de la base de données sera très petite : nous ne nous intéressons qu’au Cycle de Nedjma et ne référençons dans la base de données que (mais exhaustivement) les fragments composant le roman Nedjma. L’objectif de cette étude étant de cartographier l’espace du récit, il est important de se placer aux différentes échelles du texte où celui-ci se construit et s’exprime effectivement. Nous adopterons donc une approche multiscalaire, qui va de la très grande échelle du mot à la plus petite échelle de l’ouvrage93. Pour ce faire, et en raison du format de cette étude, notre expérience numérique ne portera que sur les quelque 250 pages du roman de Nedjma. Comparée à la méthode du Distant reading de Franco Moretti par exemple, qui s’intéresse à un

l’observation particulière. Mais cette capacité de généralisation d’un modèle et donc la reproductibilité de celui-ci ne vont pas de soi dans les en sciences humaines et sociales. Face aux situations particulières qu’elles observent, les sciences humaines et sociales ont tendance à vouloir faire rentrer le maximum de variables dans le modèle et se trouvent face à difficulté à limiter le nombre de paramètres à prendre en compte. Cela favorise le risque de surspécifier le modèle et de le rendre incapable de s’adapter à d’autres données, de le rendre non reproductible. Voir à ce propos BRESSOUX, Pascal, Modélisation statistique appliquée aux sciences sociales, Bruxelles, De Boeck, 2008, p. 20.

91 Les bases de données géographiques relationnelles sont des bases de données qui mettent en relation des objets géographiques (possédant des coordonnées géographiques projetables dans un système de coordonnées), référencés dans différentes tables. La gestion de ces bases de données se fait par des logiciels appelés Systèmes de Gestion de Bases de Données Géographiques (SGBDG), par exemple PostGIS, qui est le plugin géographique du SGBD PostgreSQL (Pour plus d’informations voir http://www.postgis.fr/wiki, consulté le 23 mai 2016). Ces SGDBG permettent de réaliser des requêtes sur les données contenues dans la base de données, notamment sur critères de topologie spatiale, et peuvent être mis en relation avec un SIG (QuantumGIS, ArcGIS) afin de visualiser les données.

92 BROSSEAU, Marc, Des romans-géographes, op. cit., p. 11.

93 Nous utilisons le terme « échelle » dans le sens que lui donne la cartographie, selon cette définition : « L’échelle est le rapport entre une dimension dans la réalité et sa transcription sur carte. Il s’exprime comme une fraction. … Comme toute fraction, une échelle est d’autant plus petite que son dénominateur est grand. Les planisphères sont à très petite échelle … » (BRUNET, Roger, FERRAS, Robert, THERY, Hervé (dir.), Les Mots de la géographie, op. cit.). Une « grande échelle » traduit un faible rapport de réduction, donc la représentation sur un plan d’un petit espace (une ville, une région), alors qu’une « petite échelle » traduit un rapport élevé de réduction, donc la représentation sur un plan d’un espace plus vaste (le monde dans le cas du planisphère par exemple).

très grand nombre d’ouvrages, la nôtre s’applique à une échelle très locale. Bien que les ouvrages composant le Cycle de Nedjma possèdent des différences, notamment géographiques et narratives, elles marchent ensemble. C’est pour cette raison que nous ne pourrons comprendre la spatialité katébienne sans les prendre tous en compte (la deuxième partie de cette thèse sera consacrée à l’étude « classique » de la spatialité dans tout le Cycle). Mais c’est également pour cette raison que nous pourrons, dans un deuxième temps, nous focaliser sur un opus en particulier – Nedjma – afin d’y appliquer, comme à un échantillon, une méthode qui aura vocation ensuite à s’appliquer à tout le Cycle. Nous choisissons de nous focaliser sur Nedjma parce que ce roman est considéré – à raison – comme le laboratoire de l’expérimentation littéraire, et particulièrement narrative, de Kateb Yacine, là où ont germé la fragmentation, la multifocalisation, les thèmes, le schéma diégétique, la cyclicité narrative, etc., qui s’approfondiront et s’affirmeront ensuite dans Le Cercle des représailles et Le Polygone étoilé94. Les conclusions qui pourront être tirées de cette étude concernent donc directement Nedjma, mais elles peuvent être, la plupart du temps, généralisées au Cycle de Nedjma, voire, pour certaines d’entre elles, à un certain type plus général de narrations – les narrations dites « postcoloniales » ou « postmodernes », caractérisées par la fragmentation et la revisitation critique des normes narratives.

L’outil de la base de données relationnelle a été choisi pour sa relative malléabilité et pour les possibilités d’adaptation à l’objet étudié qu’il offre. Néanmoins, cette technique informatique impose des contraintes (de langage, de structure, de savoir-faire). L’enjeu sera de minimiser les biais technologiques en adaptant l’instrument géomatique – dans la mesure du possible – à l’objet littéraire et à sa spatialité. Il sera donc nécessaire de le construire à la lumière d’une exploration préalable – que l’on pourrait dire plus « classique » – du texte. Dans ce sens, il est très important d’adopter une méthode d’exploration de données dynamique et rétroactive qui permette d’adapter sans arrêt la méthode et l’outil en train de se construire à l’objet et à son observation – terrain empirique de l’étude (comme le montre la Figure 1).

Figure 1: méthode rétroactive de l’analyse de données et de construction de modèles95

94 Le Polygone étoilé est composé à partir des chutes de Nedjma, que l’éditeur avait coupées en 1956.

95 Figure que nous commenterons plus en détail dans la première partie de la thèse, quand nous rentrerons dans les détails de la définition de la modélisation.

La rétroactivité de la méthode entend remplir l’une des « exigences » de la modélisation formulées par Roger Brunet :

La modélisation prend des hypothèses, qui sont fonction de la nature et de la situation même de l’objet géographique étudié. Elle les associe et les pousse à leur limite ; elle construit, déconstruit et reconstruit ; elle passe par une série d’itérations entre déduction et induction. Ses premiers dessins, si dessins il y a, sont du domaine de l’abstrait ; peu à peu, ils se rapprochent de la complexité du réel, qui n’est jamais simplifié. Ils traquent peu à peu les résidus, au sens des écarts. La seule décision stratégique est de choisir le moment où arrêter le processus, qui laisse dans l’ombre ce qui dès lors est considéré comme accessoire, mais c’est une question commune à toute activité intellectuelle.96.

En résumé, les enjeux de cette thèse peuvent simplement se formuler ainsi : pourquoi et comment modéliser l’espace complexe construit dans une œuvre littéraire ?

0.5. Le texte est l’espace : quels rapports de la littérature au monde pour quels