• Aucun résultat trouvé

Le mot comme unité de prédictibilité

1.3 Vers une perspective abstractive

1.3.1 Le mot comme unité de prédictibilité

Pour les noms du latin, la tradition considère que le nominatif et le génitif fournissent conjointement assez d’information pour sélectionner le reste du paradigme. Dans le tableau1.2, cette paire de cases suffit à distinguer la plupart des autres cases : seules les formes qui se déclinent comme  prennent/-a/au nominatif singulier et/-ae/au génitif singulier, seules celles qui se déclinent comme  prennent/-us/au nominatif singulier et/-i/au génitif singulier. Mais ces seules deux cases ne suffisent pas à distinguer les paradigmes types de  et , qui se distinguent uniquement par le génitif pluriel, ou ceux de  et , qui se distinguent par l’accusatif singulier, et les nominatif, vocatif et accusatif pluriels (ainsi que par leur genre, puisque la déclinaison de  est propre aux noms neutres).

Stump et Finkel (2013) se sont appuyés sur la notion de système de parties principales pour développer une typologie des systèmes flexionnels. Ils utilisent un outillage informatisé afin de mesurer précisément les variables typologiques étudiées. Tandis que les grammaires tradi- tionnelles et pédagogiques avancent l’existence d’un unique ensemble de parties principales permettant de prédire l’ensemble des autres cases du paradigme pour l’ensemble des lexèmes, ils s’intéressent à toutes les formes que peut prendre un tel ensemble. Le Principal Part Analy- zer est un programme qu’ils ont développé et qui permet de calculer les propriétés des systèmes de parties principales. Si on lui soumet le paradigme d’affixes du tableau1.2, celui-ci propose en sortie les quatre ensembles de parties principales possibles suivants17:

1. {nom.sg, acc.sg, gen.pl } 2. {nom.sg, nom.pl, gen.pl } 3. {voc.sg, acc.sg, gen.pl } 4. {voc.sg, nom.pl, gen.pl }

17. Stump et Finkel (2013) étudient les implications entre cases de paradigme à travers les relations entre règles d’exponence, et non entre mots formes. Leurs analyses ne sont pas constructives, et s’apparentent à des analyses abstractives sans toutefois s’intéresser directement aux formes de surface. Elles constituent un compromis entre approches fondées sur le mot et approches fondées sur l’exponence.

1.3. Vers une perspective abstractive 53

Comme nous l’avons vu, Carstairs-McCarthy a conclu de l’observation du système nominal du latin qu’une analyse qui conserve les voyelles thématiques dans les affixes respecte mieux le NBP. Or le NBP, comme le PEP, est une contrainte sur l’indépendance des cases de paradigmes. Ces principes imposent une prédictibilité des réalisations entre elles : si une réalisation est diagnostique d’une classe, elle suffit à prédire l’ensemble des autres réalisations des lexèmes de cette classe. Il n’est pas surprenant que la segmentation qui attribue le plus de matériel aux affixes mène à une meilleure prédictibilité au sein du paradigme : l’ajout d’information ne peut en effet qu’améliorer cette prédictibilité. Nous pourrions donc employer le même moyen pour justifier une analyse qui prend en compte les radicaux au même titre que les affixes : un mot entier est nécessairement un prédicteur de classe égal ou meilleur qu’un affixe. C’est pour cette raison que Blevins (2004, p. 42) écrit : « les généralisation sur les exposants affixaux dérivent des patrons d’interdépendance qui impliquent les mots entiers18». Blevins (2016) montre que

les segmentations en affixes et radicaux opacifient artificiellement les paradigmes, et que la pratique d’utiliser des étiquettes de classes constitue un palliatif à ce problème.

Il apparaît donc que le mot constitue une unité plus utile que l’affixe – ou tout autre forme d’exposant – pour l’étude de la complexité, et donc de la prédictibilité des paradigmes, dans les systèmes flexionnels (Robins1959). Blevins (2004) remarque justement que dans une pers- pective M  P, il n’est pas besoin d’un principe d’économie pour expliquer la dépendance entre cases du paradigme. Celle-ci est au contraire un des fondements théoriques de l’approche : ce type d’analyse n’est possible que parce qu’il existe des dépendances fortes entre cases de paradigme. Par ailleurs, une analyse Mot et Paradigme a l’avantage de ne pas né- cessiter de référence explicite à une segmentation particulière des formes en affixes, qui comme nous l’avons vu ne va pas de soi.

L’exemple du burmeso illustre de manière spectaculaire le contraste entre approches construc- tives et approches abstractives. Le tableau1.5présente deux classes flexionnelles des verbes du burmeso telles qu’elles sont décrites par Corbett (2009), sous la forme d’exposants affixaux. D’un point de vue constructif, ce système flexionnel semble extrêmement complexe : chaque

18. [En anglais dans le texte] « generalizations over affixal exponents are derivative of patterns of interdependence

Classe 1 Classe 2     I j- s- b- t- II g- s- n- t- III g- j- n- b- IV j- j- b- b- V j- g- b- n- VI g- g- n- n-

T 1.5 – Classes flexionnelles verbales du burmeso (Corbett2009, d’après Donohue 2001).

classe constitue un système d’affixes entièrement indépendant. Ces moyens concurrents pour exprimer les mêmes valeurs semblent, dans la perspective constructive, excédentaires, et se traduiraient par une grammaire « double ». Pourtant, dans une perspective abstractive, cette complexité disparaît. En effet, il est toujours trivial dans ce système de savoir à quelle classe ap- partient un mot, et de prédire l’ensemble de ses autres formes. N’importe quelle case constitue une partie principale parfaite.

Afin de rendre compte de ce contraste, Ackerman et Malouf (2013) distinguent la    d’un système, ou E, qui concerne le nombre de distinctions faites par un système, et la taille de l’inventaire de moyens servant à les marquer ; et la   , ou I définie comme la difficulté que pose le système pour les locuteurs. En raison de la distribution zipfienne des mots formes en corpus, les locuteurs sont exposés à certaines formes, mais jamais au paradigme entier d’un lexème. En conséquence, ils doivent faire des inférences afin de produire les formes auxquelles ils n’ont pas été exposés. Ackerman et Malouf (2013) nomment ce problème le P C F P (PCFP). Ils mesurent la complexité intégrative comme la difficulté moyenne que pose le PCFP au sein d’un système flexionnel.

Tandis que les systèmes flexionnels varient beaucoup en E-complexité, Ackerman et Ma- louf (2013) observent que ce n’est guère le cas en termes d’I-complexité, qui est uniformément

1.3. Vers une perspective abstractive 55

basse dans les systèmes qu’ils mesurent. Puisque celle-ci reflète une organisation en patrons implicatifs des paradigmes, ils concluent que « les approches grammaticales qui considèrent les mots, les paradigmes et les constructions clausales comme des unités primaires de l’analyse semblent bien fondées19».