• Aucun résultat trouvé

Chapitre 6 : La préfixation

6.2 Les règles de construction des lexèmes

Toutes les approches qui accordent à la morphologie un statut indépendant de la grammaire utilisent le concept de règles pour exprimer le processus de formation des lexèmes (p. ex. Aronoff, Corbin, etc.). Ces règles permettent de formaliser le rapport sémantico-formel entre les lexèmes, généralement entre un lexème construit et un lexème de base. C’est là l’une des premières caractéristiques des Règles de construction des lexèmes (RCL). Elles s’appliquent à des lexèmes pour donner des lexèmes44.

L’action d’une règle sur un lexème porte en fait soit sur une seule rubrique, soit sur plusieurs rubriques à la fois. Prenons l’exemple de l’application de la RCL de dérivation en age (exemple tiré de (Fradin 2003b))45 :

INPUT OUTPUT

(G) X# G Xage#

(F) /X/ F /X/⊕/aȢ/

(SX) cat :v <SN, SN> SX cat :n, genre = masc,

<SP[de]>

(S) X’ S ACTION X’

Figure 16 : RCL de suffixation en age

La RCL est divisée en deux parties, une entrée (input) et une sortie (output), qui sont reliées par une relation orientée (). La RCL s’applique à la rubrique phonologique (F) - ce qui a pour conséquence de modifier la rubrique graphique(G) - à la rubrique syntaxique (SX), en indiquant le changement de catégorie (VN) et la place des arguments du verbe après la nominalisation de celui-ci, et à la rubrique sémantique du lexème (S). Il y a donc une action simultanée sur les rubriques. Autrement dit, la fonction sémantique ACTION’ s’applique à la représentation sémantique du lexème d’input. Soulignons à nouveau que le suffixe /aʒ/ n’est que l’exposant de cette fonction sémantique.

Dans la suite, nous soulevons trois types de questions liées à la notion de règles : la question des exposants multiples (section 6.3.1), celle de l’ordre d’application des marques (section 6.3.2), puis nous passons en revue les différentes restrictions qui peuvent s’appliquer à une règle (6.3.3).

6.2.1 Des règles à exposants multiples

Bernard Fradin, dans son approche, affirme la primauté de l’aspect sémantique des règles de construction des lexèmes. Ainsi, il existe une seule règle de dérivation pour chaque type de formation sémantique. Ceci est avant tout vrai pour les règles flexionnelles, mais pourrait être adopté pour les règles constructionnelles. Une règle peut alors disposer de plusieurs « moyens morphologiques » pour former un sens nouveau. Les affixes ne sont donc pas considérés de manière spécifique, ils sont de simples exposants d’une règle (comme le suffixe /aʒ/ dans la règle ci-dessus, qui n'est que l'exposant de la fonction sémantique

44 En dérivation, un lexème sert de base à la construction d’un autre lexème (Lxm1 Lxm2), alors qu’en composition, ce sont deux lexèmes qui permettent d'en construire un nouveau (Lxm1-Lxm2 Lxm3).

45 Pour la formalisation sémantique, Fradin utilise un formalisme complexe basé sur le lambda-calcul. Dans le présent travail, nous simplifions les choses en exprimant le sens construit comme l’application d’une fonction (ici ACTION) sur la sémantique de la base.

ACTION'). Ces exposants peuvent d’ailleurs prendre de nombreuses formes, qui ne sont pas forcément de type affixal. Ils peuvent être segmentaux (les affixes) ou non segmentaux (la conversion, la reduplication, l’accourcissement, …). Par exemple, la RCL qui produit des verbes de changement d’état recourt à trois moyens morphologiques (en français) : la conversion (pâle/pâlir), la préfixation (pauvre/appauvrir) et la suffixation (pur/purifier).

Devant autant d’exposants, les différentes rubriques (en particulier Sx, mais également F, ou G) doivent alors disposer d’un mécanisme de restriction permettant de définir l’application de tel ou tel exposant.

Mais il est également possible d’envisager l’option théorique inverse qui consiste à définir une RCL par son « moyen morphologique ». (Fradin 2003 p. 113) pose d’ailleurs en ces termes la question :

« La question est de savoir si la règle morphologique doit être définie sur une base sémantique (e.g. N-ACTION) ou bien substratale (e.g. age, ment) ».

C’est d’ailleurs vers l’option « 1 affixe=1 règle » que semble se diriger B. Fradin, en tout cas pour la dérivation. Cependant, nous pensons que, dans certains cas, ces règles à exposants multiples peuvent être très utiles. Par exemple, en italien, les préfixes multi, pluri et poli apportent tous la même notion de pluralité indéterminée, même s’il est admis que poli a un nette préférence à la formation de lexèmes construits savants (Iacobini 2004). Nous pouvons ainsi proposer la RCLPLURAL_INDET (RCL de pluralité indéterminée) suivante :

INPUT OUTPUT

(G) X G multi|pluri|poliX

(F) /X/ F multi|pluri|poli⊕/X/

(SX) cat :adj SX cat :adj

(M) M poli : res(X) : sav

(S) X’ S PLURAL_INDET X’

Figure 17 : RCL à exposants multiples de pluralité indéterminée

La règle ci-dessus permet de décrire dans le même temps les trois exposants possibles, qui sont souvent permutables (multicellulare, pluricellulare). La seule restriction est placée sur la base de poli qui doit être savante (poli : res(X) : sav). Les tenants de l’autre option décriraient pour ces trois affixes trois règles distinctes, dont deux seraient rigoureusement identiques (multi et pluri).

Notre propos n’est pas ici de trancher entre les deux perspectives. Cependant, nous montrerons que d’un point de vue bilingue, il est particulièrement intéressant de disposer de la possibilité d’avoir, pour la même règle, plusieurs exposants. De plus, d’un point de vue théorique, les règles à exposants multiples sont pratiques pour décrire des procédés apparemment « synonymes », tant que n’ont pas encore été découvertes les restrictions adéquates.

6.2.2 Ordre fonctionnel des marques.

Normalement, l’ordre des exposants (des affixes) dans les lexèmes construits reflètent l’ordre dans lequel les fonctions morphologiques ont été appliquées. Par exemple (Fradin 2003b), le verbe dépersonnaliser, s’analyse comme :

[dé [ [ [ personneN ] alA ] isV ] V ]

ou, pour l’exprimer de manière différente dans l’ordre de formation : personne personnel personnaliser dépersonnaliser

Mais dans certains cas, ce « parcours dérivationnel » n’est pas si transparent. Prenons l’exemple des règles de préfixation négative en in et de suffixation nominale en ité . Les règles de préfixation en in permettent de nier la propriété de la base. Ces règles sélectionnent soit des adjectifs (pur/impur), soit des noms (confort/inconfort). Les règles de suffixation en ité sont employées pour désigner la propriété « objective » de la base adjectivale (utile utilité). Or, dans certains lexèmes construits, il est difficile de décider quelle opération a eu lieu en premier. Ainsi faut-il considérer le lexème inutilité comme le résultat d’une suite d’opérations A inA inAité ou A Aité inAité), comme le résume la figure 18 ci-dessous :

Figure 18 : Différents chemins de formation possibles

Du point de vue de l’analyse d’un lexème construit, il est parfois difficile de définir quel chemin a été pris (le 1 ou le 2). Si parfois, la date d’apparition du lexème construit peut donner une idée de l’ordre de la dérivation, dans bien des cas cette information n’est d’aucune utilité. Il faut alors envisager les deux possibilités, sans choisir l’une ou l’autre, le résultat sémantique étant le même.

Dans les exemples que nous venons de voir, l’entrée et la sortie sont clairement identifiées. Mais il existe d’autres cas où il est encore plus difficile de savoir quel lexème a été formé avant l’autre. C’est le cas par exemple des suites ci-dessous (tiré de (Namer 2006)) :

persuader/auto-persuader/persuasion/auto-persuasion Ségolène/ségoléniser/ségolénisation

ou en anglais, des suites du type (tiré de (Haspelmath 2002) : attract/attraction/attractive

describe/description/descriptive

Pour traiter ces suites dans une approche lexématique, il faut alors envisager non seulement une relation non orientée (désignée par (Plag 2003) sous le terme de cross-formation, qui permet d’expliciter la relation entre deux lexèmes comme communiste et communisme), mais également la possibilité d’une relation ternaire entre les trois éléments, sans devoir spécifier le sens de construction :

in-

in- -ité

2 1 Adj

Adj + itéNOM

in + AdjADJ

in+Adj+itéNOM

-ité

Figure 19 : Relation ternaire

Cette optique permet de désigner le lien non orienté entre ségoléniser et ségolénisation et également le lien de ces deux lexèmes avec la base Ségolène. Il existe sans doute un « ordre préférentiel », mais le principe de ce genre de relation est d’exprimer l’obtention possible des deux lexèmes, sans pour autant spécifier un input et un output.

Dans le traitement automatique, cette particularité est évidemment à prendre en compte pour pouvoir analyser le lexème inconnu construit, surtout que notre approche repose sur la présence de la base dans le lexique de référence. Si cette base n’est pas réalisée, le lexème inconnu construit ne pourra pas être analysé. Idéalement, il faudrait formaliser des règles pour toutes les formalisations (les chemins 1 et 2 dans le premier exemple, ou les formations en iser et en isation dans le second).

Dans le présent travail, nous l’avons dit, nous nous limitons à la préfixation, ce qui implique que le programme ne pourra pas prendre en compte certaines formations plus complexes. Par exemple, le lexème inconnu auto-ségolénisation ne pourra pas être analysé si ségolénisation n’est pas présent dans le lexique. Une implémentation plus large de notre analyseur, appliqué à la préfixation et la suffixation, permettrait d'envisager les différents chemins à l'image de ceux présentés dans la figure 18 ci-dessus.

6.2.3 Les restrictions dans les RCL

Nous avons déjà montré que les RCL s’appliquent de manière simultanée et indépendante sur une ou plusieurs rubriques du lexème. Indépendamment du formalisme retenu, il est communément admis que l’application des règles peut être contrainte. Ces contraintes sont généralement rassemblées sous des étiquettes de restriction, car elles restreignent l’application de RCL. Ces restrictions sont majoritairement présentes dans l’entrée de la règle, c'est-à-dire sur le lexème-base du lexème construit. Mais elles peuvent également porter sur la sortie de la règle, c’est-à-dire le lexème construit lui-même.

6.2.3.1 Les restrictions phonologiques

Les restrictions phonologiques concernent tous les cas où une règle d’affixation ne peut s’appliquer à un lexème-base à cause de ses segments finaux (pour le suffixe) ou initiaux (pour le préfixe). (Haspelmath 2002) note cependant que ces restrictions sont très fréquentes avec les suffixes, beaucoup moins avec les préfixes. Même si dans certains cas, ces restrictions pourraient être qualifiées de morphologiques, c’est avant tout un principe phonologique qui les régit. Par exemple, la suffixation italienne en ità peut s’appliquer à des bases se terminant par ale, ile, ivo, etc. Ces séquences de lettres finales correspondent à des affixes, mais ce n’est pas une condition nécessaire (dans des lexèmes comme passività, rivalità, les bases passivo et rivale se terminent en effet par une séquence typique, mais ne sont pas des lexèmes construits) (Rainer 2004).

/X/NPR

/Xisation/N

/Xiser/V

6.2.3.2 Les restrictions morphologiques

Les restrictions morphologiques au sens strict sont très rares et, comme nous venons de le voir, relèvent davantage de questions phonologiques. (Aronoff 1976) distingue tout de même, pour l’anglais, certaines tendances dans la construction des lexèmes, comme le fait que la règle de suffixation en ity ne s’applique qu’à des lexèmes d’origine latine. Mais de nombreuses restrictions sont davantage liées à des questions de productivité ou de tendance.

Ainsi, Aronoff cite (Marchand 1969) qui indique que le suffixe anglais ity s’applique productivement sur des bases se terminant par ic, al, id, et able. La forme de la base peut donc discriminer l’application de telle ou telle règle. Pour le français, Danielle Corbin a montré que le suffixe nominal en ise privilégiait les bases adjectivales en ard. (vantard vantardise).

En préfixation, l’emploi d’une règle peut être conditionné par le suffixe du lexème-base.

Mais cette assertion relève en fait plus de l’observation de tendances que d’un véritable fait morphologique. En effet, (Aronoff 1976) donne l’exemple pour la langue anglaise, du préfixe négatif un qui s’accole de préférence à des adjectifs déverbaux se terminant par en, ing, able,… .

Pour l’italien, (Iacobini 2004) cite (Scalise 1994) qui observe que les adjectifs déverbaux italiens se terminant par to peuvent être préfixés avec dis ou in, alors que ceux qui se terminent par bile ne peuvent qu’être préfixés par in. En fait, l’explication générale de ces tendances est sans doute de nature sémantique. Les suffixes sont des indices qui peuvent renseigner sur un trait sémantique de la base, trait qui discrimine, ou non, l’emploi de tel ou tel préfixe.

Ces indices sont la conséquence de réalité sémantique, mais également le fruit de constatations plus empiriques. Ils font également écho à une autre constatation faite par (Krott, Schreuder et al. 1999) et plus tard (Namer 2003) qui ont souligné que certaine règles de préfixation sont productives sur des bases qui sont déjà des mots construits. Il est donc envisageable, pour certains préfixes, de contraindre la base sur certaines terminaisons que nous considérons alors comme des « indices de constructivité ». En TALN, ces indices sont particulièrement intéressants, car ils « s’expriment » par des chaînes de caractères et sont donc facilement repérables (cf. chapitre 9).

A noter également que cette présence d’indices dans les mots préfixés est confirmée dans les néologismes extraits manuellement et listés dans (Adamo et Della Valle 2003). En effet, parmi les 13 néologismes en ri sur base nominale, 10 ont une base construite selon un des indices de constructivité mentionnés ci-dessus (comme ribilanciamento, rinazionalizzazione). Cette proportion se retrouve parmi les préfixations nominales en de (10 sur 11, comme demaschilizzazione) et en co (6 sur 8, si l’on ajoute le suffixe agentif tore).

Dans les règles que nous formalisons au chapitre 8, nous mettons en évidence certains indices de constructivité, comme les suffixes de déverbalisation zione, mento, aggio qui sont favorisés comme base pour les préfixations en ri, auto, de, ou les bases en able, particulièrement fréquents dans les préfixations en in.

6.2.3.3 Les restrictions syntaxiques

Ces restrictions recouvrent évidemment toutes les informations que l’on trouve dans la rubrique SX du lexème, c’est-à-dire les informations catégorielles et de rection.

Pour les informations catégorielles, il est vrai que règles de construction sont sensibles à la catégorie de la base, même si cela est davantage exact pour les règles de suffixation que pour celles de préfixation. Dans les premières versions de son approche, D. Corbin parlait du principe d’unicité catégorielle, qu’elle a plus tard remis en cause, notamment pour les

préfixes. En effet, parmi les préfixes de l’italien par exemple, on note qu’un quart des préfixes employés productivement peut s’accoler à des bases appartenant aux trois catégories principales (nom, adjectif, verbe) (Iacobini 2004). Notons également que, dans certains cas, une même forme peut être l’exposant de différentes RCL qui ont chacune une catégorie d’input différent. Ainsi, en italien, certaines règles à valeur de position et celles à valeur d’évaluation peuvent avoir des exposants formels identiques (sopra, extra). Mais ces règles se distinguent par une catégorie d’input différent, la règle de position ne s’appliquant que sur des adjectifs relationnels (extraurbano, sovranazionale) et celle d’évaluation que sur des adjectifs qualificatifs (extrapiatto) (Iacobini 2004).

Concernant la rection, nous pouvons citer un fait très courant dans de nombreuses langues, notamment en anglais où les verbes intransitifs ne peuvent pas être suffixés en –able, (*becomable) (Bauer 2001). Un autre exemple se retrouve dans la langue kiribatese, où le préfixe ka peut former des verbes causatifs sur des bases verbales uniquement intransitives.

Ainsi, le verbe intransitif kiba (aller) peut être dérivé en kakiba (faire aller ) (Haspelmath 2002).

6.2.3.4 Les restrictions sémantiques

Ces restrictions sont beaucoup plus vagues à définir, car la sémantique du lexème-base est soit trop étroitement liée à des aspects syntaxiques (de sous-catégorisations, par exemple), soit elle fait trop largement appel à des notions de type encyclopédique. Il reste cependant certains traits sémantiques précis qui conditionnent l’application de telle ou telle règle de construction. (Rainer 2004) cite par exemple le trait de gradation impossible pour certains adjectifs, bloquant ainsi certaines suffixations (*une révolution industriellissime). Nous pouvons également citer pour l’italien des préfixes qui sélectionnent des bases très « typées sémantiquement », comme meta qui ne s’antépose qu’à des noms abstraits (metadiscorso, metateoria) ou maxi qui préfère les noms concrets non animés (maxistadio).

Toutes les restrictions que nous venons de décrire concernent les lexèmes sur lesquels s'appliquent les RCL (l’INPUT). Mais, comme nous l’avons déjà mentionné, ces restrictions peuvent également s’appliquer à la sortie de la règle. (Rainer 2004) pense que ces restrictions doivent tout de même être prises en compte, mais il les regroupe sous le label pragmatique.

6.2.3.5 Les restrictions pragmatiques

Ces restrictions concernent plutôt l’usage de certaines règles dans un contexte donné.

C’est ainsi que certaines règles ne sont productives que dans des langues de spécialités (comme la restriction que nous avions mise sur les bases savantes pour le préfixe poli dans la RCL de pluralité indéterminée présenté dans la figure 17), ou même, dans des situations encore plus restreintes. Ainsi, (Rainer 2004) cite l’exemple du suffixe diminutif italien ino qui est particulièrement adapté à tout discours ayant trait au monde des enfants. Ces restrictions sont par conséquent étroitement liées à l’usage stylistique de la base ou de l’affixe. Autre exemple, le suffixe itude a pris depuis quelques temps46 une certaine connotation qui peut potentiellement restreindre son emploi dans des formations nouvelles. Ces restrictions rappellent aussi que la morphologie n’explique pas toute la sémantique des lexèmes qu’elle construit. En effet, un certain nombre de propriétés sémantiques du lexème construit sont déterminées contextuellement.

A côté de ces contraintes, nous devons également en mentionner deux autres qui font encore débat chez les morphologues. Premièrement, il existerait, selon certains auteurs, des

46 Ségolène Royal, candidate socialiste à l’élection présidentielle française de 2007, a employé (peut-être volontairement) le lexème bravitude au lieu de bravoure, déclenchant le feu des critiques, et la formation de lexèmes ironiques en –itude.

contraintes esthétiques, qui empêcheraient par exemple la formation de trop longs lexèmes en français (Guilbert 1975). Deuxièmement, il existerait un phénomène de blocage synonymique, selon lequel une règle ne s’applique pas du fait de la préexistence d’un lexème ayant le même sens que le néologisme. L’exemple le plus souvent cité est celui de la dérivation en anglais en er pour former des noms agentifs à partir de verbe ; cette règle ne s’applique pas au verbe to steal (voler *stealer), étant donné que le lexème thief existe déjà pour désigner le même signifié (Haspelmath 2002). Cependant, de nombreux cas montrent la possibilité de co-existence de lexèmes construits synonymes (accuracy/accurateness).

Nous venons de passer en revue les différentes restrictions qui régissent l’application des RCL. Certaines d’entre elles concernent plus directement que d’autres la production des néologismes. Dans la formalisation des RCL bilingues que nous proposerons plus loin, ces restrictions seront bien évidemment implémentées. Nous y reviendrons plus spécifiquement.

Documents relatifs