• Aucun résultat trouvé

J DE LA CHAPELLE ET J G CAMPISTRON

Dans le document Qui a écrit Aétius, Juba et Tachmas ? (Page 89-94)

CLASSIFICATIONS HIERARCHIQUES

III. J DE LA CHAPELLE ET J G CAMPISTRON

Les œuvres présentées sous le nom de J. de La Chapelle et de J.-G. Campistron sont ajoutées aux précédentes. Quels sont les résultats attendus ?

Les résultats attendus…

L’automate doit classer 40 pièces dont il ignore les titres et les auteurs. Mais le chercheur, lui, les connaît et s’attend à ce que l’automate retrouve cinq groupes puisque ces œuvres ont été présentées par cinq "auteurs" différents et que l’histoire littéraire lui affirme qu’il s’agit bien de cinq écrivains différents.

En effet, la première partie a démontré que l’écrivain est le principal facteur discriminant et l’on vient de voir que la classification hiérarchique ascendante discrimine correctement ces écrivains. Dès lors, s’il existe cinq écrivains, comme l’affirme l’histoire littéraire, l’automate doit parvenir à cinq groupes différents, comme il en a reconnu trois précédemment.

89

De plus, les deux groupes constitués par les œuvres de J. de La Chapelle et de J.-G. Campistron devraient logiquement rejoindre les autres à un seuil plus élevé que celui des pièces des deux frères Corneille qui donnent une sorte d’étalon de la proximité maximale.

Enfin, le décalage temporel doit encore élever ce seuil. En effet, contrairement à J. Racine et aux frères Corneille qui sont contemporains, il existe ici un écart temporel qui peut aller jusqu’au quart de siècle et qui doit augmenter les distances entre les deux nouveaux et les trois "anciens" (la troisième partie revient sur cette dimension temporelle).

- L’hétérogénéité du corpus augmentant, cela devrait se manifester par une élévation des niveaux ultimes d’agrégation (notamment le dernier situé pour l’instant légèrement au-dessus de 0,26).

Toutes ces attentes se révèlent bien éloignées de la réalité. … loin de la réalité

Les résultats obtenus sont exactement à l’opposé de ces attentes et soulignent l’étrangeté de la situation (tableau 6). Au lieu des cinq groupes attendus, l’automate n’en a constitué que trois et le stade d’agrégation ultime se situe au même niveau que précédemment (légèrement au-dessus de 0,26).

A gauche, les deux groupes des frères Corneille ne changent pas. A droite, le groupe des œuvres présentées par J. Racine est bouleversé.

90

Tableau 6. Dendrogramme de la classification hiérarchique ascendante sur le corpus des pièces présentées par J. Racine, P. et T. Corneille, J. de La Chapelle et J.-G. Campistron (méthode de la moyenne).

Le noyau des œuvres présentées sous le nom de Campistron (y compris les quatre actes d’Aétius) est amalgamé avec Mithridate et Iphigénie (les deux pièces les plus centrales de J. Racine) et avec Téléphonte (de J. La Chapelle) dont les deux autres pièces (Zaïde, Cléopâtre) sont rattachées à cet ensemble en même temps que… Tachmas et Phèdre ! Puis viennent Andromaque, Bazajet, Britannicus, Bérénice et enfin Juba. En quelque sorte, ce groupe ressemble à un sandwich : une couche de Campistron, une couche de Racine, une couche de La Chapelle, une couche de Racine et un nappage de Campistron ! Sauf Juba, toutes se rejoignent à un niveau inférieur à celui des deux frères Corneille, alors que le contraire était attendu.

J. Racine, J. de La Chapelle et J.-G. Campistron ne sont pas frères, n’ont pas eu les mêmes professeurs, n’ont pas épousé des sœurs ni vécu sous le même toit ni fait bourse commune toute leur vie… Il ne reste qu’une explication : un seul écrivain pour les œuvres regroupées dans la partie droite du tableau, dont la création s’étale sur près d’un quart de siècle et qui ont été

91

présentées sous trois noms différents mais sont pourtant plus proches entre elles que ne le sont les œuvres contemporaines des deux frères Corneille.

Conclusions du chapitre.

La classification donne une représentation fidèle des principaux groupes - existant dans un corpus et de leurs proximités relatives – grâce aux propriétés de la distance intertextuelle. En revanche, les autres métriques - qui n’ont pas les propriétés des distances euclidiennes - engendrent des distorsions d’autant plus grandes que l’on s’élève dans les agrégations successives. Ces défauts sont facilement détectables : au bas du graphique, les groupes semblent compressés et plus on s’élève, plus ils sont exagérément étirés.

Ces calculs n'ont de signification que si les textes ont été dépouillés en suivant la même norme afin de ne pas interpréter les fluctuations dans les graphies d’un même mot comme des différences réelles. Ces fluctuations peuvent entraîner des différences quantitativement significatives mais sans contenu lexical...

Concernant la classification, la méthode employée produit parfois des "effets de chaîne" qui se manifestent par un graphique en forme "d’escalier". Certaines proximités entre textes ne sont alors pas discernables, car les sommets qui les relient sont effacés par des agrégations effectuées à un niveau inférieur. Nous avons déjà donné l’exemple d’Othon correctement classée dans les œuvres de P. Corneille mais dont la position au sein de celle-ci est mal représentée.

Pour le corpus Racine-La Chapelle-Campistron, cela est notamment le cas de Tachmas et surtout de Juba. Tachmas est "marié" avec Zaïde dont il est séparé par une distance de 0.219 alors que ses plus proches voisins sont Aétius (0.206), Alcibiade (0.218) et Tiridate ex-aequo avec Zaïde (0.219). Mais ces trois-là sont groupés avec des textes un peu plus proches d’eux (Andronic, Phocion, Adrien, Pompéia…), de telle sorte que Tachmas semble décalé par rapport à ses voisins les plus proches, ce qui serait une interprétation erronée. Pour Juba, c’est encore pire puisqu’il n’est inclus dans le groupe de droite du tableau qu’à l’ultime étape à une distance proche de 0.25, ce qui efface totalement sa parenté avec Arminius (distance : 0.218), Alcibiade (0.228), Aétius (0.231), etc. L’effet de chaîne aboutit à exagérer son décalage par rapport aux autres pièces du groupe Racine- La Chapelle-Campistron.

L'arbre ne doit donc pas être utilisé aveuglément. L'appartenance de chacun des textes à un groupe est solide. En cela, la classification hiérarchique ascendante est un excellent auxiliaire pour une attribution d’auteur – sous réserve que les distances sur lesquelles elle travaille soient des distances euclidiennes et non de simples mesures de dissimilarité. En revanche, pour le détail, il

92

n'est pas mauvais de se reporter aux tableaux de distances surtout lorsque certains textes sont représentés comme décalés par rapport aux autres ou lorsqu’une partie du graphe a une structure en escalier.

Ceci conduit à envisager, en complément de cette première étape, des procédures qui restituent ces informations effacées ou déformées par la classification hiérarchique. Elles permettront aussi de répondre à une question : quelle confiance accorder à ces classifications ?

93

CHAPITRE VI.

Dans le document Qui a écrit Aétius, Juba et Tachmas ? (Page 89-94)