• Aucun résultat trouvé

3.4 Implications n-aires

3.4.1 Motivations

Dans cette section, nous motivons la pertinence, pour les locuteurs, de résoudre le PCFP en se fondant sur plus d’une case de paradigme connue. Dans le corpus FrWaC, nous avons observé qu’au fil du corpus les paradigmes se remplissent lentement, sans jamais atteindre saturation. Nous en avons conclu que les locuteurs sont continuellement amenés à produire des formes qu’ils n’ont pas encore rencontrées. Nous souhaitons à présent savoir combien de formes d’un même lexème les locuteurs disposent pour faire une telle prédiction.

3.4. Implications n-aires 163

La figure3.16montre la proportion de lexèmes trouvés pour au moins k formes en fonction de la taille du corpus. Le nombre de lexèmes pour lesquels on trouve au moins deux formes atteint une valeur maximale supérieure à 90% dès 100 millions d’occurences, puis demeure constante. % de le xèmes d ans le l e xiq ue

taille du corpus (en milliards de tokens)

F 3.16 – Proportion des lexèmes attestés dans au moins k formes en fonction de la taille du corpus dans FrWaC, pour diverses valeurs de k.

Cette observation indique que les locuteurs sont massivement exposés à plusieurs formes de la plupart des lexèmes : leur expérience linguistique leur donne les moyens de fonder des inférences sur au moins deux formes d’un même lexème. La même observation tient pour un nombre de formes plus élevées. Cependant, plus on augmente le nombre de formes, plus la croissance et la valeur maximale de la courbe baissent.

Le fait que les locuteurs aient accès à plusieurs formes de lexèmes dont ils ne connaissent pas le paradigme entier ne prouve pas l’utilité de cette information. Il se pourrait que la connais- sance d’une seconde forme de lexème n’améliore pas la prédictibilité. Afin d’illustrer la façon dont cette information peut contribuer à une meilleure prédiction, nous nous appuyons sur un petit sous paradigme du français présenté dans le tableau3.9. Ces données illustrent les alternances principales entre l’infinitif, le présent de l’indicatif et le participe passé des verbes

français.

Classe Taille Exemple  .3 .3 .

(i) 4108  ‘deliver’ /livʁe/ /livʁ/ /livʁ/ /livʁe/ (ii) 210  ‘link’ /ʁəlje/ /ʁəli/ /ʁəli/ /ʁəlje/ (iii) 22  ‘rake’ /ʁatise/ /ʁatis/ /ʁatis/ /ʁatise/ (iv) 327  ‘build’ /batiʁ/ /bati/ /batis/ /bati/

(v) 37  ‘hold’ /təniʁ/ /tjɛ̃/ /tjɛn/ /təny/

(vi) 8  ‘open’ /uvʁiʁ/ /uvʁ/ /uvʁ/ /uvɛʁ/

(vii) 1  ‘die’ /muʁiʁ/ /mœʁ/ /mœʁ/ /mɔʁ/

T 3.9 – Sous-paradigmes exemplaires de verbes français.

Comme illustré dans ce tableau, le participe passé peut être prédit catégoriquement à partir de l’infinitif pour les verbes dont l’infinitif se termine en/-e/. Cependant, pour les verbes dont l’infinitif est en/-iʁ/, la prédiction est plus difficile. Il existe un patron majoritaire correspon- dant à la classe (iv), c’est à dire la seconde conjugaison dans la description traditionnelle, mais également une minorité de patrons suivant (v), (vi) et (vii). L’implication en (45) n’est exacte que dans 90% des cas :

(45) Si l’infinitif d’un verbe est/Xiʁ/, alors son participe passé est/Xi/.

Aucune case de paradigme seule ne suffit à fournir une prédiction parfaite du participe passé de ces verbes. Au présent troisième personne, la principale difficulté provient des formes qui se terminent en /-i/et pourraient appartenir soit à la classe (ii), avec un participe passé en/-je/, soit à la classe (iv), avec un participe passé en/-i/. Au présent troisième personne du pluriel, les formes qui se terminent en/-is/alternent soit avec une forme de participe passé en /-ise/(iii), soit en/-i/(iv). Aucune des autres cases de paradigme présentées dans cette table n’est un prédicteur catégorique du participe passé.

La situation est différente si l’on considère des combinaisons de cases. Supposons qu’un locuteur ait une connaissance jointe de l’infinitif et d’une forme de présent singulier d’un verbe.

3.4. Implications n-aires 165

Si l’infinitif se termine en/-e/, le participe passé est identique. Sinon, le présent désambiguïse entre les classes (iv), (v), (vi) et (vii). Spécifiquement, l’implication en (46) qui identifie les verbes de la classe (iv) est catégorique.

(46) Si l’infinitif d’un verbe est/Xiʁ/et son présent 3 est/Xi/, alors son participe passé est/Xi/.

Cet exemple montre qu’il existe parfois des prédictions n-aires utiles dans les systèmes flexionnels. Le besoin de telles prédictions peut même être systématique, comme le montrent Bonami et Luı́s (2014) et Bonami et Beniamine (2016) pour le portugais européen.

Nous ne connaissons pas d’étude psycholinguistique discutant de l’usage d’implications binaires par les locuteurs. En l’absence d’études expérimentales, Bonami et Beniamine (2016) s’appuient sur l’observation des erreurs de conjugaison des locuteurs afin d’appuyer l’existence de prédiction n-aires dans le comportement des locuteurs. Les erreurs de régularisation sont fréquentes lors de l’acquisition d’une langue native, d’une langue seconde, et elles sont pré- sentes dans une moindre mesure dans la parole des locuteurs natifs adultes. Elles fournissent des indices de l’application de patrons productifs par les locuteurs (par opposition à une mémo- risation des formes). Le tableau3.10fournit quelques exemples de régularisations fréquentes dans la conjugaison du français, choisis dans la liste établie par Kilani-Schoch et Dressler (2005).

Lexème Case de paradigme Forme correcte Régularisation

(i)  .2 /dit/ /dize/

(ii)  .2 /fɛt/ /fəze/

(iii)  . /pʁevy/ /pʁevwaje/

(iv)  . /uvɛʁ/ /uvʁi/

(v)  . /pʁi/ /pʁɑ̃dy/

(vi)  . /pɛ̃/ /pɛ̃dy/

(vii)  . /mɔʁ/ /muʁy/

T 3.10 – Erreurs de régularisations fréquentes dans la conjugaison du français.

Ces verbes sont les 3e et 4e plus fréquents d’après Lexique (New, Brysbaert et al.2007), et les seuls verbes à l’exception du verbe être à avoir un .2 en/-t/plutôt que/-e/. Il n’existe pas de cas documenté de généralisation erronée du/-t/final aux formes en/-e/. En conséquence, c’est la fréquence de type, et non la fréquence de token, qui détermine les erreurs de régularisation. Les locuteurs régularisent les patrons utilisés par de nombreux lexèmes, non les patrons utilisés par les lexèmes fréquents.

Observons à présent les erreurs de régularisation qui concernent le participe passé. La plu- part d’entre elles peuvent être attribuées à des patrons unaires. L’exemple (iii) aligne  avec les verbes de la première conjugaison qui présentent une alternance-wa⇌-waje entre présent et participe passé, plutôt que le véritable patron -wa⇌-y, instancié par très peu de verbes. L’exemple (iv) aligne  avec les verbes de la seconde conjugaison qui présentent une alternance-iʁ⇌-ientre infinitif et participe passé, plutôt qu’avec la petite classe de verbes qui suivent un patron-iʁ⇌-ɛʁ. Les exemples (v) et (vi) alignent  et  sur le patron fréquent-Cʁ⇌-Cyentre infinitif et participe (voir tableau3.9).

Dans l’exemple (vii),  présente un très rare participe passé en/-ɔʁ/, en faisant un très bon candidat à la régularisation. Mais la régularisation attendue de cette forme serait/muʁi/11, /muʁe/ou/mœʁe/, selon la case employée pour fonder l’analogie. Les seules cases pouvant don- ner lieu à une forme/muʁy/sont le passé simple et le subjonctif passé, mais celles-ci sont trop peu fréquentes pour que cette hypothèse soit défendable. Cependant, il existe une implication binaire très fiable dans le reste du paradigme : la très vaste majorité de verbes dont l’infinitif est en/-iʁ/et qui ont un présent sans/-i/final ont un participe passé en/-y/, comme pour , .1/kuʁ/, ./kuʁy/.

3.4.2 Extension de l'entropie implicative au cas à prédicteurs multiples