• Aucun résultat trouvé

Formaliser la flexion avec NooJ

3.1.1. Formalisation de la morphologie flexionnelle

La morphologie inclut la conjugaison des verbes, l’accord en genre et en nombre des noms et des adjectifs, la déclinaison des noms et adjectifs (nominatif, accusatif, datif, locatif, bénéfactif, comparatif, génitif, …), etc. Une morphologie flexionnelle du français écrite avec NooJ peut être décrite par des paradigmes contenus dans un ouvrage de grammaire tel que (Bescherelle 2012).

Pour pouvoir transcrire les paradigmes flexionnels du quechua en formules algébriques ou rationnelles, voyons succinctement quelques formalismes dans NooJ qui nous permettent de générer l’ensemble des formes fléchies à partir d’un élément du lexique. Par exemple, le paradigme S_E qui permet de décrire la flexion d’un grand nombre de noms et d’adjectifs français prenant un « e » au féminin et un « s » au pluriel a la formule suivante:

S_E = <E>/m+s | e/f+s | s/m+p | es/f+p ;

Nous trouvons dans cette expression quatre suffixes, <E>, e, s, es, chacun représentant des propriétés linguistiques. Si nous appliquons cette grammaire à un nom comme lauréat nous aurons :

le premier suffixe <E> (empty) nous fournit le même mot, sans changement, c’est-à-dire lauréat ; ensuite, on associe les marques « m+s » correspondant à masculin et singulier ;

le suffixe « e » permet d’obtenir le mot lauréate ; lequel est associé à « f+s » pour féminin et singulier ;

le suffixe « s » nous donne la forme lauréats associée aux codes « m+p » pour masculin et pluriel ;

le suffixe « es » permet d’obtenir la forme lauréates associée aux codes « f+p » pour féminin et pluriel.

Ainsi, la grammaire S_E nous dit qu’il suffit d’ajouter un suffixe à l’entrée lexicale pour obtenir les formes fléchies.

126 C’est bien « intéressé » et pas « intéressés » (comme dans « Madame, êtes-vous contente »).

127 Voir (Chomsky 1969). Une grammaire contextuelle est une grammaire formelle dans laquelle les substitutions

d'un symbole non terminal peuvent être soumises à la présence d'un contexte gauche et d'un contexte droit. Les grammaires contextuelles (ou « sous-contexte ») ont été définies par le linguiste Noam Chomsky et le mathématicien Marcel-Paul Schützenberger.

Le paradigme S_E peut être réutilisé pour décrire la flexion de milliers d’entrées dans le dictionnaire NOOJ du français : amant,N+FLX=S_E bambin,N+FLX=S_E cogérant,N+FLX=S_E lauréat,N+FLX=S_E mendiant,N+FLX=S_E.

Dans le cas du quechua, nous avons un paradigme semblable pour les noms et adjectifs suivant le modèle :

YUPA = <E>/s | kuna/p ;

Ni « f » ni « m » n’apparaissent, car le genre n’existe pas en quechua. Mais tous les mots ne se fléchissent pas suivant cette règle. Prenons le nom animal. Si nous voulons obtenir la forme fléchie animaux, il faut supprimer le suffixe « l » et ensuite ajouter le suffixe « ux ».

Quand il s’agit de supprimer des lettres, NOOJ utilise le code de contrôle associé à la touche «Effacer» du clavier. Ce code est <B> pour « Backspace ». De même, NOOJ définit un code informatique <S>, associé à la touche « Suppression » qui permet d’effacer le caractère situé après le curseur, etc.

Par exemple, la grammaire M_AL qui permet de mettre au pluriel des noms masculins comme animal, canal, cheval, cardinal, arsenal, etc. est :

M_AL = <E>/m+s | <B>ux/m+p ;

Voici les opérateurs morphologiques contenus dans NooJ et applicables non seulement au français, mais également au quechua. On suppose au départ que le curseur est à la fin de la chaine :

<B> Effacer le caractère avant le curseur <C> Changer la casse du caractère courant <D> Dupliquer le caractère courant

<E> Empty string ou chaîne vide <L> Déplacer le curseur vers la gauche <R> Déplacer le curseur vers la droite <S> Effacer le caractère après le curseur

<N> Déplacer le curseur au début du mot suivant <P> Déplacer le curseur à la fin du mot précédent.

Pour décrire la conjugaison d’un verbe quechua transitif au futur en utilisant ces opérateurs, nous avons la grammaire suivante :

F = <B>(saq/F+s+1 | nki/F+s+2| nqa/F+s+3 | sunchik/F+pin+1 | saqku/F+pex+1 |nkichik/F+p+2 | nqaku/F+p+3);

Ce paradigme nous dit que, prenant comme entrée un verbe à l’infinitif (rimay « parler » par exemple), l’opérateur <B> efface le caractère avant le curseur, produisant le radical verbal

rima-, et qu’ensuite on peut ajouter successivement à ce radical verbal les suffixes saq, nki, nqa, sunchik, saqku, nkichik et nqaku, tout en notant le futur F et la personne, pour fournir en sortie les formes suivantes : rima-saq, rima-nki, rima-sun, rima-sunchik, etc.

NOOJ contient divers outils formels (des grammaires rationnelles aux grammaires hors- contexte), qui nous donnent des possibilités pour décrire un phénomène linguistique donné.

Par exemple, le paradigme S_E qui a été décrit plus haut par une grammaire rationnelle peut être aussi décrit avec la grammaire hors-contexte suivante :

Genre = <E>/m | e/f ; Nombre = <E>/s | s/p ; S_E = :Genre :Nombre ;

Elle montre que, pour le français, le suffixe du nombre est placé après le suffixe du genre, et que chacune des grammaires Genre et Nombre peut être utilisée dans d’autres cas, pour

créer d’autres grammaires, comme :

ARTISTE = (<E>/m |<E>/f) :Nombre ;

La grammaire ARTISTE décrit la flexion de tous les noms et adjectifs qui sont invariables

en genre et qui prennent un « s » au pluriel.

En quechua, cette possibilité de combiner des paradigmes flexionnels élémentaires pour construire des paradigmes plus complets est d’une grande utilité. Par exemple, pour décrire la conjugaison du futur d’un verbe transitif, nous pouvons utiliser les deux grammaires :

F_V = <B>(nki/F+s+2 | nqa/F+s+3 | saqku/F+pex+1 | nqaku/F+p+3); F_C = <B>(saq/F+s+1 | sunchik/F+Pin+1 | nkichik/F+p+2);

La conjugaison du futur sera alors représentée par la grammaire hors-contexte suivante.

F =:F_V | :F_C ;

Les codes de contrôle de NOOJ nous aident à réduire le nombre de paradigmes nécessaires pour décrire la flexion d’une langue. Voici le rôle des autres opérateurs donnés :

L’opérateur <L> (déplacement à gauche) est utilisé pour sauter par-dessus des lettres qui n’interviennent pas dans la flexion.

L’opérateur <C> (changement de casse) est utilisé pour dériver des noms propres. Exemple : France → français.

L’opérateur <D> (duplication) est utilisé pour doubler les lettres, ce qui permet par exemple de décrire la conjugaison du verbe appeler avec la même grammaire que celle du verbe jeter :

jeter, <B2><D>ent → jettent

rappeler, <B2><D>ent → rappellent

 L’opérateur <P> est utilisé pour la flexion des mots composés. Par exemple, pour faire correspondre l’ALU magret de canard a la forme magrets de canard, on peut ajouter le suffixe « P2>s » qui déplace le curseur deux fois à la fin du mot précédent, ensuite il ajoute un « s ».

NooJ donne la possibilité d’ajouter de nouveaux opérateurs spécifiques à chaque langue. Par exemple, pour le quechua, l’opérateur <Q> permet de répéter un mot entier. C’est un opérateur très productif car il permet de construire le superlatif d’un adjectif ou l’abondance d’un nom : on passe de taksa « petit » à taksa taksa « minuscule » ou aqu « sable) à aqu aqu « une sablière ».