• Aucun résultat trouvé

Chapitre 1. Modèles de variation et de cohésion dialectale

1.2. Approches en Théorie de l’Optimalité

1.2.2. La variation en OT

On constate, dans l’exemple précédent, qu’il suffit de modifier l’ordonnancement des contraintes pour que le module EVAL sélectionne l’autre candidat : le candidat le plus harmonique selon l’ordonnancement IDENT-IO(VOIX) >> *CODA-VOIS est le candidat fidèle vis-à-vis du voisement, autrement dit [menaʒ]. Or, ce candidat constitue effectivement l’output (la forme de surface) dans certaines variétés du picard : le voisement des obstruantes en coda constitue une variable dialectale, [menaʒ] et [menaʃ] sont placés sur un axe de variation dialectale. Cet exemple suggère fortement que la variation peut être analysée en termes d’ordonnancement des contraintes.

Le modèle standard de l’OT impose un ordonnancement complet des contraintes15 : étant donné une grammaire possédant les contraintes A, B, C, il faut obligatoirement que A >> B >> C, ou A >> C >> B, ou B >> A >> C, etc. (six grammaires possibles). Dans certains cas, l’analyse ne permet pas de déterminer un ordonnancement total (plusieurs ordonnancements rendent compte des données observées), mais il s’agit dans ce cas d’un non-ordonnancement non-crucial (Prince & Smolensky, 1993:51) ayant éventuellement vocation à être précisé par l’intégration de

14 L’analyse proposée est volontairement simplifiée et n’est donnée ici qu’à titre d’illustration ; elle reprend celle de Kager (1999:14-18) pour le néerlandais. Cette analyse pèche probablement par le caractère ad hoc de la contrainte *CODA-VOIS, qui ne constitue guère plus qu’une constatation empirique et introduit une certaine circularité dans la démonstration. Une analyse alternative et plus satisfaisante ferait intervenir trois contraintes : une contrainte *VOIX prohibant de façon générale le voisement (en toutes positions), la contrainte IDENT-IO(VOIX), et une contrainte de fidélité positionnelle (positional faithfulness) qu’on pourrait noter IDENT-ATT(VOIX), identique à la précédente mais dont la portée est limitée à l’attaque. L’ordonnancement IDENT-ATT(VOIX) >> *VOIX >> IDENT-IO(VOIX) rend compte des données observées. Sur l’approche par contraintes de fidélité positionnelle, voir par exemple Lombardi (1999, 2001) et Kager (1999:407-412) 15 Rappelons que l’ordonnancement des contraintes est ce qui définit en propre la

grammaire d’une langue, puisque les contraintes elles-mêmes sont universelles, et que les inputs (ainsi que nous le verrons plus loin) sont libres.

données plus fines dans l’analyse. Étant donné, donc, un certain ordonnancement, l’OT pose qu’un candidat et un seul est retenu par le module EVAL. L’hypothèse que plusieurs candidats soient retenus et émergent simultanément en surface n’est pas formellement interdite par la théorie, mais, sur un grand nombre de contraintes, sa probabilité est extrêmement faible16 : on ne saurait rendre compte de cette manière des faits de variation qui sont, au contraire, un cas de figure normal et fréquent dans le langage (cf. 1.1.3).

Plusieurs modèles ont donc été proposés, qui tentent de rendre compte de la variation en assouplissant la règle d’un ordonnancement strict. Lee (2001) examine l’hypothèse de contraintes liées : il s’agit de deux contraintes crucialement non ordonnées, qui se comportent comme s’il s’agissait d’une seule contrainte, et sont évaluées dans un tableau unique. Soit par exemple une grammaire à quatre contraintes A, B, C, D, telles que A >> B = C >> D (B et C sont liées). L’évaluation fait appel à un tableau tel que :

A B = C D

 candidat 1 * *

 candidat 2 * *

candidat 3 *! *

Les candidats 1 et 2 sont sélectionnés tous les deux grâce à la liaison des contraintes B et C. Néanmoins, Lee remarque qu’une différence d’évaluation sur n’importe quelle contrainte ordonnée plus bas que B = C (par exemple D) suffit à rompre l’effet de la liaison. En fait, ce modèle est strictement équivalent à celui qui laisserait émerger plusieurs candidats gagnants d’un ordonnancement strict, dont on vient de voir qu’il avait une probabilité quasi nulle.

Anttila (1997a, 1997b, 2001) propose également un modèle de variation basé sur des contraintes crucialement non-ordonnées. Néanmoins, le modèle d’Anttila ne s’appuie pas sur une évaluation simultanée.

Selon cette vue, les trois contraintes A, B, C peuvent faire l’objet, par

16 Voir les considérations statistiques de Asudeh (2000), note 10. La probabilité que deux candidats soient évalués à égalité par une grammaire de n contraintes est égale à 1 / 2n

exemple, de l’ordonnancement partiel suivant : A >> B, A >> C. Cet ordonnancement partiel ne permet pas de déterminer le positionnement respectif de B et C : la grammaire autorise aussi bien B >> C que C >> B. Cette grammaire s'accommode localement de deux tableaux :

A B C candidat 1 * *!  candidat 2 * * A C B  candidat 1 * * candidat 2 * *!

Cette grammaire (unique) permet donc la sélection de deux candidats en output (via deux tableaux distincts), ce qui correspond à la variation observée. Le modèle d’Anttila fait en outre des prévisions sur la probabilité d’occurrence des variantes en concurrence. Si la grammaire, par le jeu des contraintes non-ordonnées, se traduit par t tableaux, et qu’un candidat donné est le gagnant dans n tableaux, alors la probabilité d'occurrence du candidat est n/t.

La grammaire réelle utilisée par Anttila s’écarte légèrement de ce schéma théorique, car elle est stratifiée : les contraintes sont réparties en plusieurs strates, et l’ordonnancement partiel ne vaut qu’au sein d’une strate déterminée. Cette précision vise à pallier un inconvénient du modèle initial. Si l’on considère une grammaire telle que A >> B, C >> D >> ... >> Z, la contrainte B peut se positionner n’importe où dans la hiérarchie, entre A (A >> B >> C >> D >> .. >> Z) et la dernière position (A >> C >> D >> .. >> Z >> B).

On peut également mentionner le raffinement apporté par Boersma (1998, chapitre 15) dans une version stochastique de l’OT. L’ordonnancement fixe de l’OT standard est ici remplacé par l’attribution d’une valeur d’ordre à chaque contrainte. La valeur réelle d’une contrainte peut varier autour d’une moyenne, et se trouve fixée de façon aléatoire lors de chaque évaluation, dans la limite d’une certaine marge de variation. Si deux contraintes C1 et C2 ont des valeurs d’ordre égales ou voisines, compte tenu de leurs marges de variation propres, elles peuvent se trouver, au moment d’une évaluation, dans une position respective telle

que C1 >> C2 ou C2 >> C1, selon une répartition probabiliste. Si cette conception permet une définition plus rigoureuse du réordonnancement des contraintes, et s’accompagne d’une théorie de l’acquisition, son application concrète à la description d’une grammaire nous paraît équivalente à l’ordonnancement partiel de Anttila.

Lee (2001) propose de distinguer, à côté du réordonnancement des contraintes, le cas des ordonnancements réversibles. Ils concernent par définition deux contraintes contiguës17 et interviennent dans les cas d’optionalité (ou variation libre), tandis que le réordonnancement concerne la variation inter-individuelle (au rang desquels se trouve la variation dialectale). Selon Lee, le réordonnancement fait appel à des évaluations multiples mettant en jeu un même input, alors que l’ordonnancement réversible autorise une évaluation unique.

Cette distinction entre variation et optionalité figure chez d’autres auteurs. Boersma (2001) énumère « la variation entre formes lexicales, la

variation liée à des facteurs régionaux, stylistiques, pragmatiques, au registre, à des différences aléatoires entre locuteurs, ou à une variation aléatoire intra-locuteur ». Selon lui, seul ce dernier type de variation peut

être décrit par une grammaire unique du type de celle que propose Anttila. Rapportée aux réflexion de Berrendonner, Le Guern et Puech (voir 1.1.3), cette distinction nous semble relever de l’ « approche corrélationniste » que nous avons déjà critiquée. Lorsque l’on tente d’unifier le traitement des différents types de variation (ou plutôt : si l’on considère que la variation est un phénomène général, inhérent au fonctionnement du langage, et parfois investi par les locuteurs de corrélats sociaux, géographiques, etc.), les mécanismes à l’œuvre sont nécessairement les mêmes.

Lyche, Laks et Durand (2003) s’interrogent, à propos de l’étude de van Oostendorp (1997), sur le nombre de grammaires différentes que peut

17 La notion de « contraintes contiguës » nous paraît difficile à manier. Une grammaire, en l’état actuel de la recherche, est toujours une construction provisoire, destinée à rendre compte d’un ensemble de données (ensemble parfois étendu, mais jamais exhaustif, selon la définition même de la grammaire comme dispositif d’engendrement). Rien ne garantit donc que deux contraintes définies comme contiguës à une étape donnée de la recherche ne seront pas séparées par une troisième contrainte intervenant lors de la prise en compte de données complémentaires.

posséder le locuteur – grammaires dont l’alternance engendre une variation entre les styles. Mais ce que Van Oostendorp considère comme des grammaires est peut-être assimilable, en définitive, à ce que Anttila considère simplement comme des tableaux, lorsqu’il propose qu’une grammaire donnée puisse être traduite par plusieurs tableaux en alternance. À cet égard, la distinction de Lee entre évaluation multiple (variation) et évaluation simultanée (optionalité) se trouve fragilisée. À l’occasion d’un énoncé particulier, le locuteur utilise une configuration unique des contraintes, fixée de façon aléatoire, au moment de sa production, soit en choisissant un ordonnancement parmi plusieurs possibles (Anttila), soit en déterminant une valeur d’ordre particulière pour chaque contrainte (Boersma). Autrement dit, dans un contexte de variation, chaque énoncé est décrit par un tableau particulier, sans qu’il soit utile de recourir à des grammaires différentes (car, si chaque énoncé a sa propre grammaire, la notion même de « grammaire » s’évapore). Il faut envisager un tableau à plusieurs outputs comme un raccourci pratique : il synthétise plusieurs tableaux, chacun avec un ordonnancement différent, et donc avec un output différent. Selon l’approche non corrélationniste que nous adoptons ici, peu importe que ces différents tableaux (ou ordonnancements) correspondent à des sociolectes, des topolectes, ou autres X-lectes, ou qu’ils alternent de façon aléatoire (« optionalité »).

Quelles que soient les nuances entre les auteurs, le recours à l’ordonnancement des contraintes pour rendre compte de la variation est à peu près unanimement accepté en OT. Or, il faut remarquer que cette théorie fragilise l’un des postulats fondamentaux de l’OT, qui fait de l’ordonnancement des contraintes le seul lieu où se distinguent les langues entre elles. Si l’ordre des contraintes est universellement variable, comment trouver un ordre qui caractérise en propre le français, un autre qui caractérise le picard, et d’autres encore pour l’anglais, le russe ou le mandarin ?

Il est étonnant, en revanche, que le traitement de la variation par l’OT ne tienne pas compte de cet autre pilier de la théorie qu’est l’infinité potentielle des candidats engendrés par le module GEN de la grammaire. Pour le dialectologue habitué à voir une quasi-infinité de formes différentes réparties sur le territoire en réponse à chaque item de son questionnaire

(autrement dit, en termes OT, pour un « input » donné), il est tentant d’assimiler les candidats de l’OT, dont le statut est purement théorique et virtuel, avec ces objets réels que sont les réponses des témoins reportées sur les carnets du dialectologue ou sur une carte d’atlas linguistique. Nous suggérons là un statut nouveau pour les « candidats », certes différent de ce que prévoit la théorie initiale, mais qui peut rencontrer un objet connu de longue date par les dialectologues : la collection des variantes dialectales.