• Aucun résultat trouvé

Proust, Kolb, Kolb-Proust : emboîtement d’écritures autour de l’écriture

N/A
N/A
Protected

Academic year: 2022

Partager "Proust, Kolb, Kolb-Proust : emboîtement d’écritures autour de l’écriture"

Copied!
20
0
0

Texte intégral

(1)

d’écritures autour de l’écriture

Caroline Szylowicz

University of Illinois at Urbana-Champaign Library 1408 West Gregory Drive

Urbana, IL 61801 Etats-Unis szylowic@uiuc.edu

RÉSUMÉ. La bibliothèque de l’Université d’Illinois développe depuis 1994 un outil hypertexte qui rassemble des sources secondaires sur la vie littéraire, artistique et mondaine en France pour la période 1870-1925, à partir des 40 000 fiches de recherche constituées par le professeur Kolb pour son édition de la correspondance de Marcel Proust. L’insertion de métadonnées, de liens hypertextes et de nouvelles informations nécessaires à la constitution de cette base apporte un niveau supplémentaire à cet édifice déjà formé par la superposition des écrits de Proust et de Kolb.

ABSTRACT. Since 1994, the University of Illinois Library has been developing a hypertext tool which offers secondary sources on literary, artistic and social life in France, spanning the years 1870-1925. This tool is based on 40,000 notecards created by Philip Kolb for his edition of Marcel Proust’s correspondence. The insertion of metadata, hyperlinks and new information necessary for the construction of this database also create an additional level to a structure composed of Proust’s and Kolb’s successive writings.

MOTS-CLÉS : Marcel Proust, culture française, écriture hypertextuelle, métadonnées.

KEYWORDS: Marcel Proust, french culture, hypertext writing, metadata.

(2)

1. Introduction

Le centre de recherche Kolb-Proust de la bibliothèque de l’Université d’Illinois procède depuis 1994 à la constitution d’une base de connaissances sur la vie intellectuelle, mondaine, culturelle et artistique en France pour la période 1870- 1925, sous forme d’un outil hypertexte1. Le centre, établi en 1993, est basé dans le cabinet de travail du professeur Philip Kolb (1907-1992), un chercheur américain qui a établi l’édition de la correspondance générale de Marcel Proust (1871-1922).

La base trouve son point de départ dans un vaste système de fichiers élaboré par Kolb pour gérer les masses d’informations nécessaires à l’édition critique des lettres de Proust.

Ce projet se distingue des nombreuses ressources littéraires qui se sont développées avec les hypermedias depuis plusieurs années. A la différence d’autres projets2 dont l’objectif est de transférer sur de nouveaux supports des textes et des documents déjà existants tels que des œuvres complètes et leur appareil critique, des manuscrits ou des correspondances d’auteurs, ou encore des documents historiques, le projet Kolb-Proust consiste en un travail de réécriture et d’amplification des sources et des notes de recherche personnelles d’un chercheur, elles-mêmes centrées autour de la correspondance d’un auteur, structure qu’on peut comparer à des matriochkas, ces poupées russes en bois de taille croissante qui s’emboîtent les unes dans les autres3. Chaque nouveau niveau d’écriture vient se superposer au précédent, en cercles concentriques, tout en gardant un rapport direct aux niveaux antérieurs.

2. Les différentes couches d’écriture

On peut distinguer trois, voire quatre couches successives d’écriture qui s’accumulent de façon quasiment ininterrompue depuis maintenant plus d’un siècle.

La correspondance de Marcel Proust représente la première, ou les deux premières couches d’écriture, si l’on considère comme une couche distincte la citation littéraire dont Proust émaille ses lettres tout au long de sa vie. La couche suivante est constituée par les travaux de Philip Kolb, qui enveloppent et éclairent la correspondance et dépassent par leur ampleur le statut de simple appareil critique, mais qui ne trouvent véritablement leur cohérence qu’en relation avec les lettres dont elles découlent. Les diverses opérations suscitées par la transformation de ce

1. http://www.library.uiuc.edu/kolbp/homeF.htm

2. Voir par exemple les sites du centre Flaubert de l’université de Rouen (http://www.univ- rouen.fr/flaubert), le projet HyperNietzsche de l’ITEM (D’Iorio, 2000, [DIO 00]), Gallica à la Bibliothèque nationale de France (http://gallica.bnf.fr), ou les travaux d’E. Vanhoutte sur les correspondances d’auteurs et compositeurs flamands des XIXe et XXe siècles (Vanhoutte 1999, [VAN 99]) et ceux d’O. Eide sur la correspondance d’Ibsen (Eide 2001, [EID 01]).

3. Cette image m’a été suggérée par le professeur Leleu-Merviel au congrès H2PTM’01.

(3)

matériau critique en un nouveau document primaire apportent la dernière couche (en date !), par la numérisation, le reformatage des contenus et l’élargissement du sujet visé.

2.1. Ecriture de Marcel Proust

Le nombre des lettres de Proust publiées à ce jour s’élève environ à 5 500, si l’on compte l’édition générale, quelques recueils séparés comme la correspondance avec Gaston Gallimard ou les lettres à Lucien Daudet, et des publications récentes en revues. Se référant aux diverses mentions de lettres écrites mais jamais retrouvées, conservées dans des collections privées ou tout simplement jamais expédiées ou détruites, Philip Kolb situait le nombre total de lettres écrites par Proust aux alentours de 20 000. De nouvelles lettres apparaissent régulièrement dans les catalogues de ventes aux enchères et de marchands d’autographes et viennent petit à petit combler les vides de ce grand puzzle.

La correspondance de Proust a largement été utilisée comme source de renseignements sur l’élaboration de l’œuvre proustienne et la vie de son auteur par les critiques littéraires et les généticiens mais elle a été encore peu étudiée pour elle- même, en tant que corpus à part entière. Cela tient sans doute en partie au fait que l’édition générale de Kolb n’a été achevée que relativement récemment (le vingt et unième volume est paru fin 1993). Si la fonction première de la correspondance de Proust est de servir de lien entre le monde extérieur et son auteur, certains critiques voient en elle d’autres rôles, parmi eux celui de « cordon sanitaire » pour tenir le monde extérieur à distance et préserver sa solitude, ou de terrain d’essai pour l’élaboration du style de A la recherche du temps perdu [ROB 96]. Ce corpus est composé de très nombreux éléments autonomes, qui au contraire des chapitres d’un livre, ne s’enchaînent pas selon un ordre préétabli par son auteur, mais s’accumulent tout au long de sa vie.

On peut aussi distinguer dans ce corpus deux niveaux d’écritures, le premier composé des lettres, le second sous la forme de nombreuses citations littéraires serties dans le texte de ces missives. Proust en fait un usage très fréquent, dans sa correspondance encore plus que dans ses œuvres. Le fichier des citations littéraires constitué par Kolb sur la base des 5 000 lettres éditées contient environ 1 100 fiches, qui correspondent chacune à une citation différente, plus une liste d’une cinquantaine de citations pas encore identifiées. C’est d’autant plus considérable que certaines citations se retrouvent dans plusieurs lettres. Les auteurs représentés vont des classiques grecs et latins aux auteurs traditionnels, à ses contemporains. Un projet lancé en 1998 par l’équipe Proust de l’Institut des textes et manuscrits modernes (ITEM) du CNRS4 cherche à retracer les lectures de Proust, à reconstituer en quelque sorte sa bibliothèque, grâce à un relevé systématique de toutes les

4. ITEM/équipe Proust : http://www.item.ens.fr/equiprojet/EQPaccueil.htm.

(4)

notations de lecture présentes dans la correspondance, dont les citations littéraires.

Une étude préliminaire du relevé jusqu’à l’année 1904 montre que la citation littéraire joue des rôles différents suivant les lettres : simple citation pour illustrer ou commenter, pastiche, déformation et morcellement des textes cités pour en adapter le sens à ses besoins et s’en approprier les termes, procédé qui devient un travail de réécriture de la part de l’écrivain, « il s’agit bien pour Proust de chercher, avec les mots des autres, à composer sa propre voix » [LAM 99].

2.2. Ecriture de Philip Kolb

Philip Kolb a consacré toute sa carrière à l’édition de la correspondance de Marcel Proust, depuis son doctorat entamé en 1935 jusqu’à son décès. Après sa thèse, qui propose des principes généraux d’édition et une redatation systématique des lettres de Proust déjà publiées à l’époque [KOL 49], Philip Kolb entreprend une édition générale organisée de façon chronologique, en accord avec la nièce de l’écrivain. Défi de taille, quand on sait que l’écrivain ne datait que très rarement ses lettres.

Très tôt, Kolb élabore un système de fichiers croisés pour enregistrer et classer la masse des informations dont il se sert pour la datation et l’annotation de la correspondance. Ces informations proviennent des lettres elles-mêmes, d’échanges avec des contemporains de Proust, ou résultent de recherches incessantes, véritables travaux de détective privé, dans les journaux et revues de l’époque, les biographies et mémoires de contemporains, les annuaires mondains et professionnels, les encyclopédies, les répertoires accumulés au fil des années dans le cabinet de travail alloué par la bibliothèque universitaire. Chaque bribe, nom de personne, titre, lieu, date, événement, est reporté manuellement sur une fiche bristol de 3 x 5 pouces (7 x 12,5 cm), immédiatement classée dans l’un des fichiers suivants :

– fichier bio-bibliographique des personnes réelles ou imaginaires citées dans la correspondance (11 300 fiches) ;

– fichier biographique complémentaire de personnes n’apparaissant pas dans la correspondance : homonymes ou parents de personnes citées, personnalités dont Kolb pensait qu’elles pourraient apparaître dans des lettres restant à découvrir (4 800 fiches) ;

– chronologie des petits et grands événements qui jalonnent la vie de Proust et fournissent une trame de référence pour la datation des lettres (9 500 fiches) ;

– fichier d’identification des lettres, qui permettait à Kolb de classer et reclasser les lettres au fur et à mesure de ses découvertes (6 900 fiches) ;

– fichier toponymique de la correspondance (2 100 fiches) ;

– bibliographie de tous les écrits publiés par Proust et de tous les écrits à son sujet jusqu’à sa mort en 1922 (1 380 fiches) ;

– index des périodiques de l’époque (400 fiches) ;

(5)

– fichier des citations littéraires trouvées dans la correspondance, dans la/les version(s) de Proust et dans leur version originale (1 100 fiches).

Certaines de ces fiches, comme les notices bibliographiques ou la majeure partie des fiches chronologiques, ont été rédigées en une seule fois. D’autres, notamment les fiches de citations, les fiches topographiques ou biographiques, représentent l’accumulation de données au fil des ans5. Ensemble, elles résument, sous forme de symboles, d’abréviations et de notes elliptiques, les connaissances mises au jour par Philip Kolb.

Ces fiches sont par nature des documents inachevés parce qu’elles sont essentiellement des listes de renseignements divers glanés au cours de nombreuses années de travail. Au contraire de la structure des fichiers, très bien définie, la structure interne de chaque fiche est beaucoup plus floue. Mis à part un en-tête qui permet de retrouver et de reclasser la fiche, les informations sont reportées dans l’ordre de leur découverte, parfois classées par catégories, mais le critère principal est souvent l’espace blanc restant sur la fiche. Les fichiers représentent un ensemble documentaire de structure très fragmentaire où l’on n’accède pas de façon linéaire, suivant un plan préétabli, mais où chaque fiche est un point d’entrée potentiel, suivant les besoins de l’utilisateur.

Après le décès de Philip Kolb, on recense dans son cabinet transformé en véritable laboratoire proustien plus de 40 000 de ces fiches, ainsi que 2 000 volumes et microfilms, et 400 dossiers dans lesquels il conservait, triées par correspondant, les reproductions et les transcriptions des lettres et une multitude de documents tels qu’extraits d’actes de naissance ou de décès, notes de lecture, extraits de périodiques, etc. L’ensemble documente la vie et l’œuvre de Marcel Proust dans ses moindres détails, présente un panorama de la vie intellectuelle, artistique, et mondaine de l’époque et fixe les progrès des recherches de Kolb, dont l’état le plus abouti est fixé dans les parties liminaires et les notes de la correspondance éditée [PRO 70].

2.3. Ecriture de l’équipe Kolb-Proust

Conscients de la valeur documentaire de ce fonds, les héritières de Philip Kolb, la bibliothèque et le département de français de l’université décident d’en mettre le contenu à la disposition du public. Les ouvrages qui appartenaient à Philip Kolb et ceux extraits des magasins généraux constituent désormais une collection à part entière au sein de la bibliothèque.

Les fichiers, trop fragiles pour être communiqués en l’état, sont en cours de numérisation. A ce premier projet viendront se greffer d’autres corpus comme le texte intégral de la correspondance éditée par Kolb, qui est au cœur de cette

5. Voir figures 1 à 3.

(6)

entreprise, les images numérisées des lettres originales, dont la bibliothèque possède une importante collection, ou d’autres matériaux comme des correspondances entre des tiers, des documents visuels ou sonores, etc.

La mise en ligne des matériaux de recherche de Philip Kolb fait basculer la fonction de ces documents. Ils passent ainsi d’un statut de note de recherche ou d’aide-mémoire rédigé par et pour un seul individu à celui de notice documentaire à l’usage d’un public varié composé de chercheurs et d’étudiants, pas forcément spécialistes de Proust, d’amateurs plus ou moins éclairés, de journalistes, d’auteurs de jeux télévisés, etc.

Cette nouvelle fonction amène des modifications dans la structure et le contenu des documents, comme une structuration plus homogène des données dans chaque fichier, le développement des notes de Kolb en langage clair pour plus de lisibilité, l’ajout de métadonnées qui multiplie les possibilités de consultation ou la mise à jour régulière du contenu des fiches au fur et à mesure de la découverte de nouvelles informations pour préserver l’utilité de ces données et élargir le point de vue au-delà de Proust.

3. Processus d’écriture du document Kolb-Proust 3.1. Choix informatiques

Plutôt que de s’embarquer dans la construction d’une base de données qui s’annonçait très complexe, les informaticiens de la bibliothèque ont recommandé en 1994 l’emploi du métalangage SGML (Standard Generalized Mark-up Language) et de la DTD TEI (Text Encoding Initiative6) qui possèdent tous les éléments nécessaires pour une représentation détaillée des données.

SGML est un langage libre de droit et multiplate-forme, ce qui facilite les transferts d’un logiciel à l’autre au fur et à mesure des progrès techniques, détail non négligeable pour un projet de longue haleine.

Jusqu’à présent, l’exploitation des fichiers SGML s’est faite grâce au logiciel Livelink de la société Opentext. La bibliothèque universitaire ayant récemment abandonné ce logiciel pour l’exploitation de ses autres produits documentaires numériques au profit d’outils XML, une transition similaire est prévue pour le centre Proust dans un futur proche.

6. Guidelines for Electronic Text Encoding and Interchange. Edited by C. M. Sperberg- McQueen and Lou Burnard. Chicago, Oxford : Text Encoding Initiative, 1994.

(7)

3.2. Balisage structurel

Le langage SGML requiert une analyse distincte de la forme et du contenu des documents auxquels il s’applique. Les fiches de Kolb ne correspondant pas à l’un des types de documents prévus par la DTD TEI, il a fallu créer une structure type pour chaque fichier. Le résultat est une série de formulaires vierges dans les catégories desquels sont triées les données de chaque fiche.

Trois fichiers ont été sélectionnés pour la première phase de numérisation : – la bibliographie des écrits de et sur Proust, entièrement disponible en ligne ; – la chronologie, en cours d’achèvement, disponible en ligne jusqu’à l’année 1913 (à l’automne 2001) ;

– le fichier bio-bibliographique, en cours de traitement.

La bibliographie a servi de banc d’essai pour l’établissement du processus de numérisation en raison de sa faible taille et de la simplicité de sa structure ; les deux derniers fichiers ont été choisis pour leur importance pour la recherche proustienne et parce que la quantité et la complexité des informations à traiter demandent un investissement considérable en temps et en main d’œuvre.

Un échantillonnage a permis de repérer les différents types de données présents dans chacun de ces fichiers. Les deux premiers fichiers sont constitués d’un nombre limité d’éléments clairement structurés :

– Bibliographie : - Date

- Citation bibliographique détaillée - Extraits/commentaires de Kolb

Figure 1. Exemple de fiche bibliographique

(8)

– Chronologie : - Date

- Evénement(s)

- Source(s)/citation(s) bibliographiques(s)

Figure 2. Exemple de fiche chronologique

Le fichier biographique est plus complexe. Mis à part l’en-tête de la fiche qui contient le nom et les dates de naissance et de décès, le contenu est très varié et sa disposition dépend entièrement de l’ordre dans lequel les informations ont été obtenues et de l’espace vierge disponible sur la fiche, puisque Kolb faisait tenir sur une seule fiche la totalité de ses renseignements concernant une personne, quelle qu’en soit la quantité :

– Biographie :

- Nom/dates de naissance et de décès

- Sans ordre apparent : éducation, carrière, décorations, œuvres, portraits, adresses, faits marquants ou se rapportant à Marcel Proust, citations chez Proust et autres auteurs, existence de correspondance avec Proust, etc.

(9)

Figure 3. Exemple de fiche biographique

A partir de cet échantillonnage, des formulaires ont été construits à l’aide de l’éditeur SGML Author/Editor (sociétés Softquad puis Interleaf) pour fixer la structure élémentaire des documents numériques et faciliter la saisie des données.

Figure 4. Formulaire de saisie pour le fichier bibliographique

(10)

Figure 5. Formulaire de saisie pour le fichier chronologique

La préparation du document électronique s’effectue en plusieurs étapes. La saisie consiste à déchiffrer l’écriture manuscrite de Philip Kolb et à classer les différents éléments à l’aide d’un des formulaires prédéfinis.

Une fois ce premier tri établi, un gros travail éditorial est nécessaire pour rendre le contenu des fiches intelligible : il faut développer les nombreux symboles et abréviations, rendre à chaque citation la source qui lui correspond, éliminer les doublons, remplacer les références bibliographiques d’anciens volumes de lettres de Proust par la référence équivalente dans l’édition générale de Kolb, devenue la référence dans le domaine (celle-ci fournit pour chaque lettre la liste des publications précédentes : il n’y a donc pas de perte d’information).

Il est souvent nécessaire de retourner aux documents d’origine pour confirmer le rapport entre une note et une source, ou pour étoffer une citation obscure parce que Kolb n’en a extrait que trois ou quatre mots en guise d’aide-mémoire.

Le texte ainsi établi est pris en charge par une personne différente pour la suite des opérations, ce qui permet une relecture par des yeux « non avertis », plus susceptibles de repérer les coquilles et les passages confus.

(11)

Figure 6. Formulaire de saisie pour le fichier biographique

(12)

Figure 7. Texte de la figure 1 après saisie dans le formulaire chronologique

3.3. Balisage du contenu

Des éléments du contenu déterminés à l’avance sont codés de façon systématique avec différentes balises et attributs SGML, qui permettent de valoriser certains aspects du fichier qui étaient pratiquement inaccessibles dans sa version papier et qui multiplient les critères de recherche proposés aux utilisateurs.

Ce procédé a d’abord été testé sur le fichier bibliographique, mais il est aujourd’hui mis en œuvre à plus grande échelle dans le fichier chronologique, en cours d’édition. Il sera ensuite adapté au fichier biographique, actuellement en cours de saisie, puis aux fichiers restants. Dans la chronologie, les éléments suivants font l’objet d’un codage particulier : dates, titres, personnes, renvois et/ou corrélats.

(13)

3.3.1. Dates

La date d’en-tête reçoit la balise <DATE> </DATE>.

Chaque date est composée en théorie d’un jour, d’un mois et d’une année. Ces trois éléments sont convertis en une valeur numérique de modèle « AAAAMMJJ » qui est utilisée comme attribut pour permettre des recherches ultérieures sur des dates ou des périodes.

Ex. : « 1871 10 juillet » devient « <DATE VALUE="18710710">1871 10 juillet</DATE> »

Le fichier chronologique recèle toutefois un nombre important de fiches aux dates incomplètes ou imprécises qui illustrent la complexité et le caractère d’inachèvement quasi permanent du travail de datation entrepris par Philip Kolb. La difficulté de dater une lettre ou un événement de façon précise à laquelle Kolb se heurtait à longueur de temps se retrouve dans la difficulté d’attribuer une valeur numérique détaillée à une date qui n’est souvent qu’une date butoir. Des conventions ont été adoptées pour représenter les différents cas de figure recensés au cours d’un échantillonnage et assurer que toutes les dates, qu’elles soient complètes ou non, précises ou non, soient prises en compte au cours de requêtes chronologiques à l’aide du moteur de recherche.

3.3.1.1. Dates incomplètes

Lorsque le jour et/ou le mois manquent, ils sont remplacés par le jour et/ou le mois « 00 ». Cette substitution permet au moteur de recherche de prendre en compte la totalité des fiches dans les recherches chronologiques.

Ex. : « 1912 » devient « 19120000 » ; « 1901 mai » devient « 19010500 » Pour trouver toutes les fiches datées du mois de mai 1901, un utilisateur demandera à voir toutes les fiches comprises entre 1901 mai 00 et 1901 mai 31 (« 19010500-19010531 »). Il en va de même lorsque l’année est le seul élément chronologique disponible : 1912 devient « 19120000 ». Une requête pour toutes les fiches de l’année 1912 couvrira les dates 1912 00 00 à 1912 12 31 (« 19120000- 19121231 »).

3.3.1.2. Dates imprécises

Il n’est malheureusement pas encore possible de traduire toutes les hésitations et les nuances du langage naturel en valeurs numériques. Lorsqu’une date complète est nuancée par une expression telle que « vers », « peu avant », « quelques jours après », la date est codée comme une date normale.

Ex. : « 1896 vers le 12 mars » devient « 18960312 »

Lorsqu’une date imprécise est limitée au début, à la fin, à la première ou la deuxième quinzaine d’un mois, la valeur numérique est ramenée à un jour précis.

(14)

Ex. : « 1907 2ème quinzaine de juin » devient « 19070615 » (« 1ère quinzaine » serait noté « 19070601 »)

« 1904 début août » devient « 19040801 » (« fin août » serait noté

« 19040831 »)

De même, lorsqu’une date ne contient qu’une année et une mention telle que

« début », « fin », « premiers » ou « derniers mois », la valeur numérique est ramenée à janvier ou décembre, sans jour précis.

Les indications de saison ne sont pas prises en compte, après de longs débats qu’il ne convient pas de reprendre ici. Les dates concernées sont traitées comme des dates incomplètes qui ne contiendraient que l’année.

Les dates multiples sont décomposées et codées date par date.

Ex. : « 1897 1er mai - 1897 15 juin » devient « 18970501-18970615 » 3.3.2. Titres

Les titres reçoivent la balise <TITLE> </TITLE>.

Les œuvres littéraires, musicales ou artistiques citées dans le corps de la fiche reçoivent un code de deux lettres associé à l’attribut « TYPE », qui précise leur genre.

Les catégories suivantes ont été retenues : arts graphiques (ag), danse (ds), essai (es), musique (mu), opéra (op), poésie (po), récit (re), sculpture (sc), spectacle (sp), théâtre (th). Ce travail d’indexation nécessite l’identification d’une grande partie des œuvres citées à l’aide de divers ouvrages de référence, mais il ouvre de nouvelles possibilités dans l’utilisation du fichier chronologique.

Ex. : « <TITLE TYPE="th">La Folle Enchère</TITLE>, comédie en 3 actes de Lucien Besnard »

« [...] <TITLE TYPE="ds">l’Après-midi d’un faune</TITLE> où Nijinsky dansait avec un génie qui rejoignait celui de Debussy ! »

3.3.3. Personnes/personnages

Toutes les personnes, réelles ou fictives, reçoivent la balise <NAME>

</NAME> et un code alphanumérique unique, généralement composé des six premières lettres du nom de famille et d’un ou plusieurs chiffres, associé à l’attribut

« KEY ».

Ex. : <NAME KEY="proust1">Marcel Proust</NAME>

<NAME KEY="proust2">Jeanne Weil, Mme Adrien Proust</NAME> (mère de M. Proust)

(15)

Ce balisage permet d’identifier une personne, quelle que soit la forme prise par son nom dans les fiches. Le module de recherche associé à cette balise est particulièrement utile pour lancer des requêtes7 sur des auteurs qui utilisent des pseudonymes, comme Marcel Proust, qui écrivait sous les noms de plume

« Horatio », « Laurence », « Dominique », « Marc Eodonte » (coquille malencontreuse pour « Marcel Dante »), ou pour suivre au cours des années des femmes dont le nom changeait au gré des mariages, comme Jeanne Hugo, pour n’en citer qu’une, qui devint successivement Mme Léon Daudet, Mme Jean Charcot, et Mme Michel Nègreponte. De la même façon, une fois leur identité établie,

« l’auteur de Cyrano de Bergerac », un Président de la République en exercice ou la mère de la mariée reçoivent la balise et l’attribut qui leur reviennent.

L’attribution d’un code unique à chaque personne identifiée a nécessité la mise en place d’une base de données afin d’éviter qu’un même code soit attribué à deux personnes différentes ou qu’une même personne reçoive deux codes différents, et pour permettre à plusieurs encodeurs de travailler simultanément.

La base consistait au départ en une simple liste d’autorités de noms et de codes.

Très vite, il est devenu nécessaire d’ajouter des informations supplémentaires pour distinguer les homonymes, particulièrement fréquents à cause de la présence de nombreux titres de noblesse. Au nom complet (incluant les surnoms et les pseudonymes) viennent s’ajouter, chaque fois que c’est possible, les années de naissance et de décès, de mariage(s) et de divorce(s) pour les femmes, la profession, le lien de parenté avec d’autres personnes recensées, la date de changement de titre de noblesse, ou si rien de tout ceci n’est connu, au moins l’année et les circonstances dans lesquelles la personne est citée : compte rendu mondain, témoin à un mariage ou un duel, etc. Parfois l’incertitude demeure : Mme Trousseau aperçue en 1894 à Trouville est-elle la même personne que Mme Trousseau rendant visite à Mme Aubernon en 1897 ? Dans de tels cas, deux identifications distinctes sont maintenues par prudence.

Les titres de noblesse requièrent un gros travail de prosopographie : le titre de duc de Noailles est-il porté par la même personne en 1896 et en 1909, ou bien a-t-on affaire au père et à son fils ? Quelques chiffres : du début du fichier à l’année 1913, soit environ 6 800 fiches, on recense dans la chronologie plus de 6 400 personnes différentes. Des vérifications minutieuses s’imposent pour éviter les erreurs d’identification. Pour faciliter les requêtes, les informations associées à chaque personne sont accessibles au public dans le module « recherche de personne » du moteur de recherche.

7. http://www.library.uiuc.edu/kolbp/npubF.htm

(16)

3.4. Renvois et/ou corrélats

Chaque fiche bristol est traitée comme un document séparé, même si les fiches numérisées sont regroupées par série de trente ou quarante dans des fichiers SGML pour faciliter les manipulations informatiques. Chaque fiche, représentée par l’élément structurel <DIV0>, reçoit un numéro d’identification attribué automatiquement grâce à un petit programme PERL. Au cours du balisage, les fiches qui traitent d’un même sujet ou qui contiennent des renvois et des corrélats sont connectées par des liens hypertextes insérés manuellement avec la balise

<XREF> </XREF>.

Au fur et à mesure que l’édition du fichier chronologique progresse, des liens transversaux se tissent à l’intérieur du fichier pour mettre en valeur des sous- ensembles chronologiques ou thématiques.

Ex. : <DIV0 ID="c67970" TYPE="card">1913 fin mars - 1913 début avril Emmanuel Bibesco invite Proust à une promenade en automobile à Champlâtreux et dans la vallée de Chevreuse, en compagnie de la comtesse Thérèse Murat

à Emmanuel Bibesco, Cor XII, p. 118, n. 49 [Fin mars ou début avril 1913]

Cf. peu après le 27 mars 1913 [<XREF>c67980</XREF>]

Cf. vers le début d’avril 1913 [<XREF>c67990</XREF>] </DIV0>

Le balisage structurel des fiches est assez simple car il n’utilise qu’un petit nombre d’éléments qui sont organisés à l’avance en formulaires dans lesquels les données sont ensuite classées.

En revanche, le balisage du contenu est une tâche très minutieuse, impossible à automatiser. Si le codage des dates va relativement vite, une fois les conventions établies, l’identification des genres d’œuvres et surtout des personnes est sans conteste l’étape qui demande le plus de temps et de familiarité avec le sujet traité et les sources disponibles pour la période. C’est aussi celle qui accroît le plus la valeur du fichier chronologique et qui en étend l’utilité au-delà du seul domaine proustien.

Le balisage des personnes citées décrit plus haut a donné lieu à la création

« fortuite » d’un nouvel ensemble de données biographiques à partir d’un corpus existant. Ce fichier d’autorités qui, pour l’instant, constitue essentiellement l’index onomastique de la chronologie, englobera ultérieurement le fichier biographique de Philip Kolb, puisque les mêmes identifiants seront réutilisés pour son balisage.

Nouvellement créé par l’extraction de ressources déjà présentes mais inaccessibles dans la version papier, il servira d’index biographique général pour toute la base de connaissances au fur et à mesure que celle-ci se développera. Un utilisateur pourra alors naviguer entre les différents documents pertinents pour sa recherche à partir d’une notice centrale.

(17)

<DIV0 ID="c36650" TYPE="card"><HEAD><DATE

VALUE="19040809">1904 9 ao&ucirc;t</DATE> au <DATE VALUE="19040814">14 ao&ucirc;t (mardi soir au dimanche soir)</DATE></HEAD><DIV1 TYPE="subdiv"><P>D&eacute;part le mardi 9 de Paris (*1); Itin&eacute;raire : <NAME KEY="proust1">Proust</NAME> &agrave; bord le Yacht H&eacute;l&egrave;ne; mont&eacute; &agrave; bord au Havre, on est parti chercher <NAME KEY="billy2">Mme de Billy</NAME> &agrave; Ouistreham, et de l&agrave;, apr&egrave;s un arr&ecirc;t &agrave; Cherbourg et (?)

&agrave; Guernesey, arriv&eacute;e &agrave; Saint-Malo (*2); ancr&eacute; deux jours en rade de Dinard (*3) - 5 jours en tout (*4); rentre le 15 ao&ucirc;t (*3);

arriv&eacute;e &agrave; Paris lundi matin &agrave; 7 h.

(*5).</P><LISTBIBL><BIBL>*(1) &Agrave; <NAME

KEY="nordli1">Marie Nordlinger</NAME>, Cor IV, p. 204, n. 110, dimanche soir [7 ao&ucirc;t

1904]</BIBL><BIBL>*(2) <AUTHOR><NAME KEY="billy1">Robert de Billy</NAME></AUTHOR>, <TITLE LEVEL="M">Lettres et Conversations</TITLE>, 1930, p. 143</BIBL><BIBL>Cf.

&agrave; <NAME KEY="billy2">Mme Robert de Billy</NAME>, Cor IV, p. 219, n. 121 [mercredi 17 ao&ucirc;t

1904]</BIBL><BIBL>*(3) &Agrave; <NAME KEY="yeatma2">Mme L&eacute;on Yeatman</NAME>, Cor IV, p. 264, n. 141 [septembre 1904]</BIBL><BIBL>*(4) &Agrave; <NAME

KEY="straus1">Mme Straus,</NAME> Cor V, p. 88, n. 42 [22 ou 23 mars 1905]</BIBL><BIBL>*(5) &Agrave; <NAME

KEY="proust2">Mme Proust</NAME>, Cor IV, p. 216, n. 119, lundi soir [15 ao&ucirc;t

1904]</BIBL></LISTBIBL></DIV1><DIV1

TYPE="subdiv"><P>Proust : "Je suis revenu par hasard

&agrave; Paris la veille du jour ou il [l’article] a paru." [<BIBL><TITLE LEVEL="A">La mort des

cath&eacute;drales</TITLE>, <TITLE LEVEL="J">Figaro</TITLE>, 16 ao&ucirc;t

1904</BIBL>.]</P><LISTBIBL><BIBL>&Agrave; <NAME

KEY="lauris1">Georges de Lauris</NAME>, Cor IV, p. 260, n. 139 [septembre 1904]</BIBL></LISTBIBL></DIV1></DIV0>

Figure 8. Texte de la figure 1 après balisage et conversion en SGML

(18)

4. Edition dynamique du document Kolb-Proust 4.1. Mise à jour et extension des fichiers

Afin de conserver toute leur valeur aux fichiers de Philip Kolb, qui représentent l’état de ses connaissances au moment de son décès, il est nécessaire d’effectuer une mise à jour constante des notices en incorporant des données nouvelles au fur et à mesure de la numérisation des fiches ou de la publication de nouveaux travaux. Cela revient à maintenir les principes de recherche et de classement établis par Kolb, même si les supports et l’environnement de travail ont complètement changé. En plus du balisage décrit précédemment, les encodeurs ont la possibilité d’introduire des annotations signées pour approfondir certains éléments, fournir des informations supplémentaires ou rectifier des faits inexacts.

Le travail d’identification des personnes nécessité par le balisage du contenu des fiches et décrit plus haut fournit déjà l’occasion de mettre au jour des informations que Kolb n’avait pas recherchées ou pas trouvées. Un effort est fait pour retrouver le nom complet et les dates de naissance, de décès, et de mariage dans des répertoires biographiques généraux imprimés ou en ligne, des biographies, des avis mondains ou des rubriques nécrologiques de journaux, et enfin, en dernier recours, auprès des bureaux d’état civil, quand un lieu et une date approximative sont déjà connus. Les résultats sont ajoutés à la base de données des noms ainsi que sur des fiches annexes dans le fichier biographique, en prévision de sa numérisation prochaine.

Il est également prévu que les notices d’autorité qui n’auront pas trouvé leur équivalent dans le fichier biographique, une fois celui-ci édité, seront étoffées. Ce travail aura pour effet de contrebalancer le point de vue majoritairement proustien qui existe pour l’instant dans les fichiers. En effet, Kolb par économie de temps et d’espace, omettait des informations importantes pour la connaissance générale de la période, mais superflues pour la tâche déjà considérable qu’il s’était fixée.

Aujourd’hui, la technologie employée permet de restituer ces omissions tout en conservant la séparation entre le travail de Philip Kolb et les additions plus récentes.

Le support informatique de cet outil hypertexte en pleine croissance réduit considérablement le délai nécessaire à la diffusion de nouveaux savoirs. Des liens peuvent être insérés pour diriger l’utilisateur vers d’autres ressources, internes ou externes, sur le même sujet ou des sujets apparentés. Les utilisateurs ont aussi la possibilité de participer à l’élaboration de cet outil qui leur est destiné en signalant des publications, des manifestations, ou en proposant des nouvelles données, des commentaires et des interprétations variées, qui peuvent être incorporés en regard des notices concernées. Ce procédé n’est pas sans risque et demande un travail de vérification soigné. Néanmoins, ce nouveau mode d’édition dynamique est particulièrement intéressant pour des projets futurs envisagés par le centre Kolb- Proust.

(19)

4.2. Addition de nouveaux corpus, collaboration à d’autres projets

Si la première phase de numérisation se distingue quelque peu d’autres projets littéraires, la seconde bénéficiera sans aucun doute de leur expérience et des principes qui ne manqueront pas de s’en dégager. Il s’agit en effet de la numérisation du texte intégral de la correspondance de Marcel Proust8. Philip Kolb en a publié les vingt et un volumes de 1970 à 1993 [PRO 70]. Durant ces deux décennies, la découverte de nouvelles lettres et de nouvelles données l’ont amené à corriger les volumes déjà parus, à redater des lettres et à publier des lettres d’années antérieures en appendice des nouveaux volumes. Aujourd’hui, nombre de proustiens réclament une édition révisée et refondue pour intégrer ces nombreuses corrections et additions, mais il est peu probable que l’éditeur accepte de s’engager à nouveau dans un projet de cette envergure. Par contre, on peut parfaitement envisager une édition électronique qui, à partir du texte imprimé, incorporerait les lettres parues depuis 1993, toutes les modifications indiquées par Philip Kolb ainsi que celles suggérées par d’autres chercheurs. On peut imaginer qu’en cas de désaccord sur une date ou sur l’interprétation d’une allusion, la version électronique présenterait le texte disputé et les commentaires contradictoires, comme une glose moderne. Une telle édition aurait l’avantage d’être mise régulièrement à jour, offrirait des possibilités de manipulation des textes qui n’existent pas dans les éditions imprimées et serait présentée au sein d’une large collection où l’utilisateur trouverait à la fois son document primaire et les sources nécessaires à sa recherche.

Par d’autres aspects, ce projet remet également en question la notion d’une édition dite définitive et la notion de pérennité de l’héritage écrit, sujets débattus depuis maintenant plusieurs années par diverses professions comme les chercheurs, les auteurs et les professionnels de l’information.

5. Conclusion

Philip Kolb s’était donné pour mission de restituer aussi exactement que possible le portrait de Proust tel que celui-ci apparaît à travers ses lettres. Le centre Kolb-Proust poursuit aujourd’hui cette mission et l’étend au travail de Philip Kolb, en restituant aussi exactement que possible le contenu des notes du chercheur.

L’entreprise de préservation de ces deux écritures tente d’intégrer en un même ensemble documents primaires et appareil critique, avec la situation curieuse que la correspondance de Proust était pour Kolb le matériau primaire, tandis que les notes de Kolb deviennent le matériau primaire pour l’équipe Kolb-Proust, au même titre que la correspondance de Proust. Chaque couche d’écriture possède une fonction particulière : la correspondance de Marcel Proust est un outil de communication entre un homme et son environnement ; les travaux d’érudition de Philip Kolb

8. Des négociations sont en cours avec l’éditeur Plon pour fixer les conditions de numérisation et de diffusion.

(20)

permettent de reconstituer cette correspondance, de la replacer avec son auteur dans son contexte historique, littéraire et social et de la rendre compréhensible du public ; le travail de l’équipe Kolb-Proust enfin reprend les matériaux accumulés par Kolb dans les coulisses de son édition et les fait également passer du domaine privé au domaine public grâce à toutes les transformations décrites plus haut, et ce faisant, passe d’une écriture individuelle à une écriture collective effectuée par les différents acteurs du centre, sa bibliothécaire, ses assistants de recherche aussi bien que les utilisateurs du site qui contribuent volontiers en mettant à disposition ceux de leurs résultats qui peuvent présenter un intérêt pour le développement de la base de connaissances.

Cette entreprise fonctionne comme une série de poupées russes où chaque poupée peut s’ouvrir pour laisser apparaître une poupée de dimension inférieure, jusqu’à la plus petite, qui garde malgré tout son apparence de poupée. Dans le cas du projet Kolb-Proust, le plus petit élément serait la lettre de Proust, ou si l’on veut distinguer entre l’écriture de Proust et les emprunts, la citation littéraire sertie dans le texte de la lettre. Elle fonctionne également comme une mosaïque au motif concentrique dans laquelle chaque cercle est composé par la juxtaposition de multiples petits éléments autonomes : une lettre au sein de la correspondance, un renseignement sur une fiche, ou une fiche dans l’ensemble documentaire. Le motif peut être amplifié par l’ajout d’éléments supplémentaires autour du dernier cercle, mais chaque élément ne prend sa signification complète que par sa position dans le motif général.

6. Bibliographie

[DIO 00] D’IORIO P., HyperNietzsche. Modèle d’un hypertexte savant sur Internet pour la recherche en sciences humaines, Presses Universitaires de France, 2000.

[EID 01] EIDE O., « Putting the Dialog Back Together : Re-creating Structure in letter publishing », ACH/ALLC conference, New York City, 13-17 juin 2001.

[GID 02] GIDDING J., « HyperProust : The Recherche as Hypertext », Proust in Perspective : Visions and Revisions, The University of Illinois Press, Urbana, [à paraître en 2002].

[KOL 49] KOLB P., La correspondance de Marcel Proust : Chronologie et commentaire critique, The University of Illinois Press, Urbana, 1949.

[LAM 99] LAMBILLIOTTE J., « La Bibliothèque de Marcel Proust. De la lecture à l’écriture », Bulletin d’informations proustiennes n° 30, p. 81-89, 1999.

[PRO 70] PROUST M., Correspondance. Texte établi, présenté et annoté par Philip Kolb, [21 volumes], Plon, Paris, 1970-1993.

[ROB 96] ROBITAILLE M., « Etudes sur la correspondance de Marcel Proust : une synthèse », Bulletin Marcel Proust n° 46, p. 109-126, 1996.

[VAN 99] VANHOUTTE E., « Ruling the screen : compromising decisions and decisive compromises », Digital Resources for the Humanities Conference, London, 14 septembre 1999.

Références

Documents relatifs

Cette édition numérique a été réalisée à partir d’un support physique parfois ancien conservé au sein des collections de la Bibliothèque nationale de France, notamment au titre

Je sens que si je veux atteindre mon objectif situé entre 46 et 48 heures et surtout éviter de passer une troisième nuit dehors, il me faut « faire du jus ».Pour la première fois

6 § 3, dont le texte est le suivant: «En territoire occupé, l'application de la pré- sente Convention cessera un an après la fin générale des opérations militaires

Refuser ainsi l’intériorité, c’est ce qu’exprime la formule spinoziste « homo cogitat » : au commencement, il y a de la pensée, qui plus tient, une pensée qui se tient dans

Lecteur très insuisant de Schelling je vais présupposer pour ce qui suit le livre de Gérard Bensussan Les Âges du monde de Schelling. Une traduction de l’absolu. Je voudrais

Clinical metagenomics, relying on next-generation sequencing (NGS) is an emerging approach that allows pathogen identification in challenging situations, as evidenced by a

Et l’atelier d’Elstir m’apparut comme le laboratoire d’une sorte de nouvelle création du monde, où, du chaos que sont toutes choses que nous voyons, il avait tiré, en

Forum for Inter-American Research, 2016, Negotiating Nature: Imaginaries, Interventions and Resistance, 9 (2), pp.55-71.. Etienne Sauthier fiar Vol. En décembre 1919, le nom