• Aucun résultat trouvé

dant, la difficulté que nous avons rencontrée dans ce projet ne se limite pas à l’acquisition des connaissances d’un domaine précis, l’objectif n’est pas d’informatisé une tâche connue par des experts mais de transformer leurs méthodes en les formant à de nouveaux concepts. Introduire des éléments encore inconnus aux utilisateurs se montre extrêmement délicat, il est important de trouver un juste milieu entre les interactions avec les nouvelles notions et l’ancienne méthodo-logie. Afin de trouver ce juste milieu, il est important d’interagir avec l’utilisateur un maximum par le biais d’entretiens, d’évalutations, etc. Si nous étions amenés à effectuer une tâche iden-tique, notre approche serait différente préférant une démarche moins intrusive dans le domaine et une communication beaucoup plus importante avec les experts.

4.2 Perspectives

4.2.1 Dans la continuité de ce stage

Dans la continuité de ce stage, il est encore nécessaire de soumettre à une évaluation la dernière maquette proposée. Dans le cas où cette évaluation se révèle être un succès, nous pour-rions essayer d’ajouter un peu plus d’éléments permettant d’introduire la notion de sémantique profonde auprès des lexicographes. Pour le moment, ne pouvant intégrer notre outil au logiciel MVS Dicet, nous devons développer les scénarios des utilisateurs autres que le lexicographe (Ingénieur de la connaissance, Administrateur) et concevoir une maquette leur présentant les données. De plus, dans l’objectif de faire de cette interface un véritable outil, nous devons en-core approfondir les informations qu’il est possible d’extraire à partir de cette interface et sous quel format les stocker.

Une autre question que nous n’avons pas abordée lors de ce stage est : quelle représentation utiliser pour l’affichage des informations contenues dans un dictionnaire édité à l’aide desGU? La création de dictionnaire s’effectue pour deux types d’utilisation, l’une est dans un but de traitement automatique, la seconde et probablement la plus évidente vise un public humain. Il est important de se pencher sur cette question, puisqu’une visualisation et exploration adéquate d’un dictionnaire rendraient compte de la force du formalisme des GU et permettraient une acceptation plus facile de la part des lexicographes de ce dernier.

4.2.2 Autres approches

La collecte des informations lexicales est une tâche difficile. En effet, effectuée manuel-lement, elle nécessite des compétences d’experts. Or, comme nous avons pu le voir lors de l’évaluation de notre prototype, les lexicographes ne sont pas encore prêts à manipuler les en-trées d’un dictionnaire au niveau de la RSemP. Dans cette section, nous discuterons de l’idée de nouvelles approches afin d’apporter de la matière et de persuader ces derniers d’atteindre un tel niveau de profondeur dans leur définition.

Chapitre 4 4.2 Perspectives

Une extraction des données du RLF

Une extraction des données entrées dans leRLFaccompagnée d’un traitement automatique permettrait de construire une première base de connaissance conçue selon le formalisme des

GU. Notre idée est de s’appuyer principalement sur le réseau que forme les fonctions lexicales pour en inférer une première base. Cette base serait probablement inconsistante et nécessite-rait une édition manuelle. Évidemment, une telle approche exige encore plusieurs années de recherche puisque la baseRLFn’est pas encore entièrement construite, les fonctions lexicales se montrent complexes et nombreuses et les éléments nécessaires et suffisants assurant la pos-sibilité de raisonner sur lesGUne sont pas encore établis.

Un système collaboratif

Une autre démarche peut être orientée vers système collaboratif ouvert à tous (tel Wikipédia) où ce sont des utilisateurs non experts qui définissent les entrées. Une telle démarche a déjà été effectuées, nous pouvons citer par exemple JeuxDeMots1 (Lafourcade et Joubert, 2008). JeuxDeMots est un projet contributif proposant une application ludique accessible sur le web. Ce sont les joueurs qui vont alimenter la base, en fournissant des associations par le biais de réponses à divers énoncés. Le principal avantage d’une telle approche est le fait qu’elle ne nécessite aucun expert et que sous la condition d’une importante communauté, la base se remplit rapidement. En revanche, assurer la fiabilité et la qualité des informations recueillies risque de se révéler très complexe.

4.2.3 Bases de connaissances en Graphes d’Unités : Applications

Précédemment, nous avons vu d’autres méthodes pouvant être utilisées à moyen terme afin d’obtenir une première base de connaissance. Dans cette section nous présentons quelques ap-plications pouvant être developpées à l’aide d’une telle base.

Dans ce rapport, nous avons présenté uniquement la partie sémantique des GU. Mais ce formalisme permet de représenter tous les niveaux de la langue, c’est pourquoi il est possible de créer un système de traitement automatique de la langue basé uniquement sur ce formalisme.

Le projetRELIEFaxe la majorité de son activité autour de la Langue Française, mais deux autres projets s’appuyant sur la même méthologie et le même logiciel ont été lancés dans le but de créer deux nouvelles ressources lexicales : un Réseau Lexical de l’Espagnol (RLE), un Réseau Lexical du Coréen (RLC). Dans une même perspective multilingue, il serait possible d’établir une correspondance entre les unités sémantiques d’un dictionnaire au format des GU

et de créer une application de traduction automatique s’appuyant sur le sens.

BIBLIOGRAPHIE BIBLIOGRAPHIE

Bibliographie

BARQUE, L., NASR, A. et POLGUÈRE, A. (2010). From the Definitions of the ’Trésor de la Langue Française’ To a Semantic Database of the French Language. In Proceedings of the XIV Euralex International Congress, Fryske Akademy, page 245–252, Leeuwarden (Pays-Bas). Anne Dykstra et Tanneke Schoonheim, dir.

BARQUE, L. et POLGUÈRE, A. (2008). Enrichissement formel des définitions du Trésor de la Langue Française informatisé (TLFi) dans une perspective lexicographique. 22.

KAHANE, S. (2003). The meaning-text theory. Dependency and Valency. An International Handbook on Contemporary Research. Berlin : De Gruyter.

LAFOURCADE, M. et JOUBERT, A. (2008). JeuxDeMots : un prototype ludique pour l’émer-gence de relations entre termes. In JADT’08 : Journées internationales d’Analyse statistiques des Données Textuelles, pages 657–666.

LEFRANÇOIS, M. et GANDON, F. (2013). Rationale, concepts, and current outcome of the unit graphs framework. In Proc. of the 9th International Conference on Recent Advances in Natural Language Processing (RANLP), Hissar, Bulgaria.

LEFRANÇOIS, M., GUGERT, R., GANDON, F. et GIBOIN, A. (2013). Application of the unit graphs framework to lexicographic definitions in the RELIEF project. In Proc. of the 6th International Conference on Meaning-Text Theory (MTT 2013), Prague, Czech Republic. LUX-POGODALLA, V. et POLGUÈRE, A. (2011). Construction of a French Lexical Network :

Methodological Issues. In Proceedings of the International Workshop on Lexical Resources, Ljubljana.

MELCUKˇ , I. (1984–1999). Dictionnaire explicatif et combinatoire du français contemporain. Recherches lexico-sémantiques, volume I–IV. Les Presses de l’Université de Montréal, Mont-réal.

MELCUKˇ , I. A. (1996). Lexical functions : a tool for the description of lexical relations in a lexicon. Lexical functions in lexicography and natural language processing, 31:37–102. MELCUKˇ , I. A. et ARBATCHEWSKY-JUMARIE, N. (1999). Dictionnaire explicatif et

combina-toire du français contemporain : recherches lexico-sémantiques, volume 4. PU Montréal. POLGUÈRE, A. (2011). Classification sémantique des lexies fondée sur le paraphrasage.

Ca-hiers de lexicologie, 98:197–211.

POLGUÈRE, A. (2000). Une base de données lexicales du français et ses applications possibles en didactique. Revue de Linguistique et de Didactique des Langues (LIDIL), 21:75–97.

BIBLIOGRAPHIE BIBLIOGRAPHIE

POLGUÈRE, A. (2009). Lexical systems : graph models of natural language lexicons. Language resources and evaluation, 43(1):41–55.

ROBICHAUD, B. (2011). A graph visualization tool for terminology discovery and assess-ment. In Proceedings of the 5th International Conference on the Meaning Text Theory, page 243–1252, Barcelona, Spain.

ŽOLKOVSKIJ, A. et MELCUKˇ , I. A. (1965). O vozmožnom metode i instrumentax semantiˇces-kogo sinteza. 5:23–28.

Chapitre A Documents de conception

Annexe A

Documents de conception

A.1 Plan et notes de l’entretien avec Alain Polguère - 17/04/2013

L’entretien s’est déroulé de façon informelle. Il a été conduit de manière semi-directive, à questions ouvertes, et permet de décrire la situation actuelle du travail de définition des lexi-cographes et comment ces derniers s’imaginent interagir avec des graphes. Le plan que nous fournissons sert de fil conducteur, certaines questions sont amenées à n’être que partiellement traitées.

Plan

1. Expliquer le but de notre projet et l’idée actuelle de manipulations de graphes. 2. Lui proposer un scénario dans lequel il doit définir une nouvelle entrée.

3. Lui montrer les graphes actuels (graphes hiérarchiques). Quelles pourraient être ses at-tentes ?

4. Qui pourrait être amené à utiliser les définitions sous forme de graphes ? 5. Connaît-il des logiciels de manipulations des graphes ?

6. Pourrait-il nous donner des pointeurs vers un ou deux lexicographes de la Théorie Sens-Texte ?

7. Serait-il possible de le revoir pour d’autres entretiens ? 8. (BONUS) Questions concernant MVS Dicet.

Notes

Le réseau sémantique est très riche, si on l’affiche complétement il se montrera illisible. L’idée de le structurer en sous graphe à l’aide d’un système de boîte pouvant être fermées ou ouverte est émise.

L’édition de définition se déroule en trois étapes :

1. Choix de l’étiquette sémantique dans hiérarchie créée à l’aide de protégé par Alain Pol-guère.

2. Trouver le nombre d’actants, écrire la forme propositionnelle. Alain Polguère a dans l’idée d’implémenter des patrons de formes propositionnelles qui seraient présentés dans une liste ordonnée selon le nombre d’actants.

Documents relatifs