• Aucun résultat trouvé

3 Le dictionnaire électronique de l’environnement ALEXIA

3.2 Les articles du dictionnaire

3.2.3 Les autres informations lexicales

Les exemples

Les exemples ont été tirés du corpus et adaptés dans certains cas pour rendre la lecture plus facile. Pour les lexies non représentées dans le corpus, les exemples ont été inventés. Ils sont présentés par phrase entière, une seule phrase étant disponible par lexie. Ils jouent plutôt un rôle illustratif qu’explicatif, même si les exemples peu parlants, comme les exemples trop courts ou possédant un contexte trop pauvre, ont été écartés.

La fréquence

Pour le calcul des fréquences, nous nous sommes servi de la liste de Beaudot (1992), celle- ci étant la plus récente pour le français, bien qu’elle ait été constituée à partir de textes écrits dans les années 60.

L’échelle reprend celle établie dans COBUILD. Elle possède cinq rang de fréquence. Le premier, intitulé « très courant » contient environ 700 vocables (parmi lesquels travail ou

activité), le deuxième, « courant », contient environ 1 200 vocables (boîte, cadre), le troisième, « assez courant », 1 500 vocables (dirigeant, employeur), le quatrième, « relativement peu courant », 3 200 vocables (industrialiser, recrutement, rémunération) et le dernier, « peu courant », contient 8 100 vocables (honoraires, encadrement, allouer). Au-delà, les vocables sont considérés comme rares.

La liste et les résultats en termes de classement doivent cependant être relativisés. D’une part, elle porte sur des textes relativement anciens, qui ne reflètent pas toujours le vocabulaire actuel (par exemple, intérim ou intérimaire sont classés comme « peu courant ». D’autre part, il s’agit de textes généraux, ce qui explique que des vocables comme professionnel (nom), industriel

(nom) ou qualification soient considérés comme « relativement peu courant ». Enfin, les différents registres sont inégalement représentés puisque les vocables familiers (comme boulot

ou job) sont « peu courant » (bosseur, aussi bien nom qu’adjectif, ne fait pas partie de la liste). Cette particularité est due au manque de listes de fréquence récentes sur le français. Les dictionnaires français ne les utilisent pas, contrairement au COBUILD ou au LDOCE, ce dernier faisant même la distinction pour certains vocables entre langue orale et langue écrite.

Nous avions pensé dans un premier temps établir une liste de fréquence des vocables du corpus, mais ce dernier n’étant pas assez important et pas assez significatif, les résultats n’auraient été valables que pour les vocables les plus fréquents.

Signalons enfin, même si elles sont peu nombreuses, que certaines collocations ont leur rang de fréquence. Celui-ci est généralement faible, et de fait peu significatif.

Le genre et le nombre

Ces informations concernent principalement les noms et adjectifs. Il faut tenir compte des noms et adjectifs qui sont uniquement au singulier ou uniquement au pluriel, ou qui n’ont pas de genre, etc. Pour cela, une série de dix codes parcourt toutes les possibilités (voir annexe B). Il est d’usage dans les dictionnaires d’indiquer des modèles de conjugaison des verbes. Cette information n’est pas présente dans ALEXIA car, d’une part, nous n’avons pas l’ensemble de ces modèles, et d’autre part, il n’y a pas d’outil de conjugaison pour pouvoir les

illustrer. Nous n’avons pas accordé la priorité à ce module, car ce n’est pas l’objet de recherche de ce travail. L’implémentation ne poserait pas de problème a priori.

Les registres

Ils sont au nombre de quatre : soutenu, courant, familier et grossier. Ces distinctions sont assez classiques. Il conviendrait d’en rajouter de plus fines, à l’instar par exemple du COBUILD qui propose des registres (ou niveau de langue) tels que littéraire, technique, oral, écrit, injurieux, démodé, etc.

Les informations grammaticales

Elles concernent les verbes et montrent la façon dont ceux-ci sont construits et s’emploient (figure 5.13, en bas à droite). La description est faite de manière explicite en listant les différentes constructions possibles (transitivité, intransitivité, prépositions nécessaires). Il s’agit ici de décrire ces constructions de manière plus formalisée et claire visuellement, tout en évitant des codes grammaticaux dont on sait qu’ils font plaisir aux grammairiens et lexicographes (comme en atteste leur présence importante dans les dictionnaires) sans toutefois être vraiment consultés par les apprenants (Harvey et Yuill, 1997).

Les schémas syntaxiques, réutilisés dans la présentation des actants et dérivés syntaxiques (voir plus bas), en replaçant le verbe en contexte avec les variables qui désignent le sujet et les compléments, complètent la définition de la lexie en montrant certains constituants optionnels du verbe. Par exemple, on peut voir dans la figure 5.13 que la définition de la lexie travailler

sens 2a ne mentionne que l’emploi intransitif du verbe. Pourtant la construction transitive indirecte travailler pour qqn est possible. Le groupe prépositionnel introduit par pour étant optionnel, il est difficile de le mentionner dans la définition sans alourdir celle-ci. La seule solution reste donc de l’illustrer par les schémas syntaxiques.

Les informations grammaticales pourraient aussi concerner d’autres catégories grammaticales comme les noms et les adjectifs. Par exemple, la construction N de N est fréquente, un apprenant du français se demande souvent si tel ou tel adjectif est postposé ou non, il y a des contraintes de gradation sur certains adjectifs, etc. Ces informations n’ont pas été développées dans ALEXIA, mais il est clair qu’elles devraient figurer dans tout dictionnaire d’apprentissage du français.

Les variations lexicales

Elles concernent principalement les expressions semi-figées. Par exemple, mettre au chômage peut se dire mettre à la porte ou mettre dehors ; avoir la tête de l’emploi peut se dire, dans un autre registre,

avoir la gueule de l’emploi. Même s’il s’agit de variantes, les apprenants peuvent parfois les percevoir comme expressions différentes et synonymes. Il convient donc d’en tenir compte dans les relations de synonymie.

Ces variations ont été codées dans la base de données mais elles ne sont pas présentées dans les cartes du dictionnaire. Ce point est aussi à développer.

3.2.4 Les synonymes

Les problèmes auxquels sont confrontés les dictionnaires papier (et leurs équivalents électroniques) concernent tout d’abord l’accès aux synonymes eux-mêmes et ensuite les moyens mis à la disposition de l’apprenant pour saisir les nuances entre les sens exprimés par les différents vocables.

L’accès aux synonymes

Faute de regroupement à un même endroit, les renvois vers les synonymes sont éparpillés dans les articles des dictionnaires papier et il est ainsi plutôt fastidieux de devoir en consulter plusieurs entrées pour discerner tous les différents sens. Il faut alors se tourner vers des dictionnaires spécialisés (Robert des synonymes (Bertaud du Chazaud, 1995), Cambridge Word Routes (McCarthy, 1994), Bénac (1982), Lecointe (1993) ou Macé et Guinard (1990)) ou des thésaurus, qui regroupent les synonymes sous l’entrée centrale au concept et lient les autres vocables vers cet endroit.

Dans ALEXIA, l’ensemble des synonymes est calculé pour chaque vocable en parcourant le réseau (voir ci-dessus) et le système affiche l’ensemble du réseau automatiquement (figure 5.14).

Figure 5.14 : carte de présentation des synonymes d’engager sens 1

Les sens

Bien souvent, toujours à cause du manque de place, le dictionnaire des synonymes papier ne propose pas de définition. Il faut donc se référer à un deuxième dictionnaire. C’est la politique déclarée du Robert qui ne fait que lister les vocables, sans distinction de lexie, en invitant le lecteur à consulter le PR. L’exhaustivité y est certes, mais à quel prix sur le plan de la consultation !

D'un autre côté, on trouve des dictionnaires qui, en regroupant les synonymes, indiquent ce qui les différencie (figure 5.15). Ce sont des informations très utiles qui permettent souvent de déterminer le vocable adéquat.

Figure 5.15 : synonymes de chef dans Lecointe (1993)

Cependant, dans les deux cas, ces dictionnaires s'adressent à des natifs. Ils présupposent que le lecteur connaît déjà les vocables. De ce fait, il nous semble nécessaire, lorsqu'on s'adresse à un apprenant d'une langue étrangère, d'expliquer les vocables en question en donnant une définition, aussi précise que possible (figure 5.14). L'idéal serait d'ajouter explicitement les différences, mais il n'est pas possible de les calculer automatiquement. C'est pourquoi le système affiche uniquement les synonymes et leur définition. Ces dernières, si elles sont suffisamment précises, doivent permettre de comprendre les nuances. Mel'cuk (1995) préconise d'ailleurs de décrire les entrées en confrontant directement l'ensemble des synonymes délimitant le concept pour arriver au maximum de cohérence et de précision.

Signalons enfin dans la figure 5.14, que la synonymie est établie de lexie à lexie. Ainsi, lorsqu'on fait varier la lexie de départ à l'intérieur du même vocable, via le menu en haut à gauche de la fenêtre, le système recalcule les synonymes.

Les différentes synonymies

Un ensemble de boutons radio permettent de faire varier l'affichage en fonction du type de synonymie souhaitée. Ainsi, l'apprenant a la possibilité de lire uniquement les vocables de sens plus étroit, ou bien plus général. Il a néanmoins la possibilité de faire afficher tous les synonymes.