• Aucun résultat trouvé

et représentation des genres discursifs

I. 3.4 – Répartition des occurrences

Le corpus compte dans sa totalité 6 096 881 mots, répartis sur 10 romans (1 746 006 mots), 5 recueils de correspondances (989 556 mots), 101 pièces de théâtre (1 678 193 mots), 15 recueils de poésie (247 122 mots), 13 textes d’idées (1 140 277 mots) et 26 oraisons (295 727 mots). Nous avons analysé ce faisant la production litté- raire de 31 auteurs différents, en tâchant d’avoir un nombre de mots plus ou moins équivalents selon les genres discursifs : cela explique que nous avons notamment mul- tiplié le nombre de pièces de théâtre étudiées, leur amplitude textuelle étant générale- ment plus faible que les textes appartenant aux autres genres discursifs. En revanche, nous n’avons pu faire de même pour la poésie ou l’éloquence compte tenu et de leur ampleur textuelle, et de leur représentativité dans les bases de données : les sous- corpus les composant sont par conséquent d’une taille moindre. Nous avons analysé dans notre corpus principal 926 occurrences, dont 629 occurrences de LEQUEL à une

fonction directe, sujet ou objet, et 297 occurrences de LEQUEL à une fonction préposi-

tionnelle41. L'intégralité de ces occurrences, réparties selon les fonctions, les auteurs et

les œuvres, est donnée dans le deuxième volume de ce travail. Les textes d’où sont issues les occurrences sont donnés quant à eux dans la bibliographie ; ils proviennent pour la plupart des bases de données Frantext et Gallica. La numérisation des textes a permis de faire des recherches automatiques des formes, et les données ont par la suite été extraites et analysées manuellement.

41 Nous pourrons désigner dans la suite de cette étude les

LEQUEL sujets et objets directs sous le terme de « LEQUEL aux fonctions directes », et les autres occurrences sous le terme de « LEQUEL préposi-

Voici les résultats que nous avons obtenus concernant les occurrences de LEQUEL

aux fonctions directes (sujet et objet), puisque les fonctions prépositionnelles, comme nous le disions, ont été sélectionnées aléatoirement à raison de dix occurrences (si pos- sible) par texte analysé. Nous présentons les occurrences :

– Selon les auteurs (Figure 2). Le premier chiffre donne le nombre d’occurrences relevées, le second le pourcentage que ce nombre représente à l’aune de l’ensemble du corpus, à la décimale près.

Figure 2 – Répartition des occurrences selon les auteurs (fonctions directes, période classique)

– Selon les genres discursifs. Nous présentons le nombre d’occurrences par genre (Figure 3a), et le pourcentage qu’elles représentent vis-à-vis du nombre to- tal de mots de chacun (Figure 4).

Figure 3a – Répartition des occurrences selon les genres discursifs (fonctions directes, période classique)

Figure 4 – Pourcentage des occurrences par genre discursif selon le nombre de mots (fonctions directes, période classique)42

42

Compte tenu de l’absence d’occurrences dans la poésie, nous ne l’avons pas incluse dans ce gra- phique.

– Selon la date du texte d’où est issue l’occurrence (Figure 5a). Pour ce dernier paramètre, nous avons choisi de regrouper les occurrences par périodes de 20 ans (1580 – 1600, 1601 – 1620, 1621 – 1640, 1641 – 1660, 1661 – 1680, 1681 – 1700, 1701 – 1720).

Figure 5a – Répartition chronologique des occurrences (fonctions directes, période classique)

Nous désirons faire quelques remarques concernant ces résultats numériques. Tout d’abord, pour ce qui est de la répartition chronologique des occurrences : la figure 5a traduit une forme de régression et illustre la difficulté à relever des occurrences à la fin de notre période d’étude, comme cela avait été prédit empiriquement. Nous pouvons comparer cette courbe avec les calculs de spécificités43 obtenus à partir du corpus

PRESTO pour LEQUEL relatif, par l’intermédiaire du logiciel d’étude de corpus TXM44,

spécificités calculées par décennie et pour la recherche du lemme LEQUEL dans la caté-

gorie « pronom relatif » (Figure 5b).

43 « La commande Spécificités calcule une statistique indiquant si les occurrences d'un mot ou d'une

requête CQL quelconque paraissent en surnombre (ou en sous-effectif) dans chaque partie d'une par- tition, ou dans un sous-corpus donné (par rapport à son corpus parent). » Source : <http://txm.sourceforge.net/doc/manual/manual36.xhtml#toc141> (consulté le 6 février 2017).

Figure 5b – Spécificités par décennie de LEQUEL pronom relatif dans le corpus PRESTO (1580-1720)

Le calcul de spécificités permet d’évaluer, dans un corpus donné, la probabilité de rencontrer une forme particulière. Nous avons ici partititionné le corpus PRESTO en quinze décennies et nous avons demandé au logiciel d’évaluer la probabilité de rencon- trer le pronom relatif LEQUEL dans les textes. L’espace entre les deux lignes noires, de

part et d’autre du niveau « 0 », indique un emploi attendu vis-à-vis d’une distribution théorique du lemme prenant en compte l’intégralité du corpus ; les barres avançant dans le positif et le négatif révèlent un emploi sur-représenté, ou sous-représenté vis-à- vis de ces estimations. Le score de spécificités, indiqué en ordonné, compare ce faisant des ordres de grandeur plutôt que des probabilités : par exemple, le score de spécificité obtenu pour la décennie 1580 – 1589 est de 25. Cela signifie que LEQUEL pronom rela-

tif a 25 fois plus de chances d’apparaître dans cette portion du corpus au regard des projections d’emploi à l’aune de l’ensemble des occurrences du corpus PRESTO. En revanche, le score de spécificité est de -15 pour la décennie 1640 – 1649, ce qui signi- fie un emploi probable quinze fois inférieur au modèle de distribution théorique du lemme dans le corpus.

Nous voyons que ces scores de spécificités confirment également les attentes empi- riques, et montrent que l’emploi de LEQUEL devient marginal dès les années 1630,

même si cela n’est pas avec régularité. Nous notons aussi que la période 1610 ‒ 1629 témoigne d’un emploi plus fréquent du pronom-déterminant au regard des autres dé- cennies de la période d’étude, élément que nous retrouvons avec notre propre corpus

(Figure 5a). Dans notre corpus, ce sont notamment les textes de César Oudin (1614), de Nicolas Bénard (1621) et de Pierre de Bérulle (1623) qui expliquent nos relevés ; dans le cadre du corpus PRESTO, il est également sur ces périodes des textes d’idées (notamment de Saint-François de Sales ou du Père Mersenne) qui peuvent expliquer ces tendances. Si la coïncidence est intéressante, il nous faudrait cependant mener une étude de plus grande ampleur pour déterminer s’il y a, dans le premier tiers du

XVIIe siècle, une augmentation d’emploi de LEQUEL relatif ou si ces résultats sont dus

aux biais induits par les textes sélectionnés dans les corpus.

Deuxièmement et en lien avec cette remarque, nous remarquons que certains au- teurs, tels Montaigne, Bérulle, Bénard, Oudin et Vaugelas, emploient fréquemment le pronom-déterminant aux fonctions directes (Figure 2). De même, certains genres dis- cursifs semblent plus propices à son emploi que d’autres (Figures 3a et 4). Comme Alexandre Lorian l’avait observé (1973:232), l’emploi de LEQUEL dépend en partie du

style des auteurs, et du genre discursif dans lequel ils composent. Tout ce que nous pouvons alors dire à la suite de cette exploration quantitative du corpus, c’est que le pronom-déterminant relatif LEQUEL, du moins aux fonctions directes, a plus de chance

d’être employé au cours de la première moitié du XVIIe siècle, dans les textes d’idées ou les romans ; mais il s’agit là davantage de tendances que de résultats à proprement parler.

Certaines oppositions illustrent la difficulté d’établir des prédictions statistiques : – La traduction de Don Quichotte effectuée par César Oudin (1614) présente un nombre très important de LEQUEL aux fonctions directes tandis que L’Astrée

(1610 et 1612) n’en présente qu’un nombre fort limité, du moins dans ses deux premiers livres. Cependant, le premier texte parodie les romans médiévaux alors que le second correspond davantage aux goûts du temps.

– La traduction de Vaugelas de La Vie d’Alexandre, composée vers la moitié du

XVIIe siècle, a une haute fréquence d’emploi du pronom-déterminant alors que Tristan l’Hermite, dans Le Page disgracié (1643), ne l’emploie que rarement. Vaugelas s’appuie néanmoins sur un texte latin qui a influencé son écriture, ce qui n’est pas le cas de Tristan l’Hermite.

– Bérulle, Pascal et Bossuet traitent tous trois du divin et de ses qualités, et bien que le style de Bérulle soit, compte tenu de la date de rédaction de son texte

(1623) conforme aux attentes, Bossuet fait un emploi assez important du pronom- déterminant vis-à-vis de Pascal, alors qu’il compose ses textes après ce dernier. Partant, et bien que la diminution de l’emploi relatif de LEQUEL sujet et objet direct

soit observable dans les corpus, elle ne doit pas obscurcir une analyse de détail. Les tendances que nous avons relevées sont certes conformes aux observations empiriques et aux commentaires des grammairiens et des chercheurs, mais il nous intéresse aussi d’étudier les écarts que nous venons d’évoquer et de les expliquer dans notre étude. En ce sens, nous ne retiendrons que deux phénomènes précis : d’une part la décroissance lisible des Figure 5a et 5b qui traduit la difficulté à trouver des occurrences lorsque nous approchons du XVIIIe siècle ; d’autre part la répartition des occurrences par auteur (Figure 2) et par genre (Figures 3a et 4), que nous exploiterons par la suite du point de vue stylistique.