• Aucun résultat trouvé

4. CADRE THÉORIQUE

4.4 Applications de la Sémantique des cadres

4.4.3.3 Framed DiCoEnviro : A framed version of DiCoEnviro

Le DiCoEnviro est une ressource terminologique multilingue (anglais, français et espagnol) de l’environnement. Tout comme le DiCoInfo (voir section 3.1.3), cette ressource est basée sur les principes de la Lexicologie explicative et combinatoire (LEC) de Mel’čuk (Mel’cuk et al. 1995). Dans le DiCoEnviro, les termes sont traités en fonction de leur appartenance au domaine (ce qui couvre plusieurs sous-domaines comme le changement climatique, l’énergie renouvelable et la gestion des matières résiduelles) et leurs propriétés lexico-sémantiques. La description des termes propose une définition de la structure actancielle du terme et ses liens lexicaux. De plus, jusqu’à vingt contextes annotés sont associés au terme montrant comment les actants et les circonstants se combinent avec celui-ci. Considérons la figure 65 pour l’entrée recycler.

Figure 65 : Entrée du verbe recycler dans le DiCoEnviro (DiCoEnviro 2015)

La structure actancielle du verbe est représentée dans le schéma : entreprise [Agent] ~

matières [Patient]. Les liens lexicaux décrivent, entre autres, des relations d’opposition, comme

éliminer, et de voisinage, comme réutiliser. Finalement, les contextes annotés mettent en

évidence les actants et les circonstants, comme dans l’exemple suivant :

On [Agent] est donc habileté à transformer, à RECYCLER et à récupérer, ici [Lieu], toutes sortes de matières plombifères [Patient].

Le DiCoEnviro a fait l’objet d’une modélisation à la FrameNet, concrétisé dans une ressource appelée DiCoEnviro (Framed version) (L’Homme et Robichaud 2014). Dans cette ressource, la terminologie de l’environnement est décrite au moyen des cadres en utilisant comme point de départ des cadres existants dans FrameNet. La ressource propose également des cadres nouveaux. Dans la réalisation de ce travail, un certain nombre d’adaptations ont été faites. Par exemple, dans la version Framed, les noms des rôles sémantiques des actants ont été conservés et les actants (et circonstants) sont définis au niveau des unités lexicales et non pas des cadres (rappelons que les éléments du cadre sont définis au niveau du cadre dans FrameNet). Cela étant dit, les auteurs (L’Homme et al. 2014 : 1365) constatent que leur approche permet de :

1. Unveil frames in specific subject fields based on predicative terms such as verbs and nouns (more specifically, frames in the field of the environment) that share lexico- semantic properties.

2. Define new frames specific to the field of the environment: Although some frames might correspond to frames already defined in FrameNet, it is likely that new frames will be discovered in the data analyzed.

3. Validate the notion of “frame” on data that was not previously encoded for that purpose.

L’identification des cadres dans le DiCoEnviro se base sur une méthodologie comportant les étapes suivantes (L’Homme et Robichaud 2014 : 190) : 1) extraire les données de la ressource terminologique ; et 2) utiliser les cadres de FrameNet comme référence pour identifier les cadres existants que les termes dans DiCoEnviro peuvent évoquer. Pour ce faire, une première étape consiste à comparer les données comprises dans les deux ressources, DiCoEnviro et FrameNet. Une page a été mise en place qui permet de montrer les correspondances entre les UL de DiCoEnviro et les cadres de FrameNet (figure 66).

Figure 66 : Correspondance entre l’UT emit et l’UL emit du cadre Emitting dans FrameNet

Dans le cas du verbe emit, le cadre correspondant est Emitting. D’après cette page de comparaison, les éléments affichés mettent en lumière les composants suivants de chaque ressource : pour le DiCoEnviro, on trouve l’unité terminologique (UT), la structure actancielle, la définition, les équivalents et les liens lexicaux en anglais, français et espagnol; pour FrameNet, on trouve l’UL, le cadre, les FE avec leurs types et les relations. Dans notre exemple, nous pouvons remarquer que l’UT dans DiCoEnviro ne s’accorde pas avec l’UL dans FrameNet en termes de nombre d’actants/core-FE.

Cependant, cette méthodologie doit faire face à un certain nombre de défis, surtout lorsqu’il est question des différences entre les deux ressources en question. Les différences constatées par les auteurs (L’Homme et al. 2014 : 1368-1369 et L’Homme et Robichaud 2014 : 191-192) sont :

1. Dans FrameNet, les FE sont définis au niveau du cadre, alors que dans le DiCoEnviro, les actants sont définis au niveau de l’UT;

2. Le nombre d’actants peut être différent du nombre de core-FE dans un cadre donné;

3. Les noms d’actants sont génériques dans le DiCoEnviro, alors que dans FrameNet les noms des FE sont spécifiques aux cadres;

4. Dans FrameNet, un FE peut avoir différents noms. Dans DiCoEnviro, un actant peut être divisé, par exemple, Cause et Agent.

Pour rendre compte des spécificités de chaque ressource, cinq catégories sont définies pour les correspondances entre les UT et les cadres (L’Homme et Robichaud 2014 : 193) :

1. Entièrement compatible : correspondance parfaite entre les UT et les cadres, en terme de définition et de nombre d’actants/FE;

2. Alternance : cette catégorie rend compte d’une particularité du DiCoEnviro, c’est-à-dire que lorsqu’une UT a deux entrées dans la ressource mais que toutes les deux évoquent le même cadre. Par exemple, emit a deux structures actancielles : emit1 (Source ~ Patient to Destination) et emit2

(Agent or Cause ~ Patient into Destination). L’alternance qui existe dans ce cas est entre Agent (et Cause) et Source;

3. Partiellement compatible : présence d’une différence entre les UT et les cadres, en termes de nombre d’actants/core-FE;

4. Nouveau : lorsqu’il n’existe aucune correspondance entre les données dans les deux ressources, de nouveaux cadres sont créés;

5. En attente : certain UT sont associées d’une manière provisoire à des cadres.

Finalement, une interface web a été mise en ligne pour afficher les données encodées dans le DiCoEnviro (figure 67).

Figure 67 : Affichage du cadre Emitting dans DiCoEnviro framed version (DiCoEnviro Framed Version 2015)

Dans le DiCoEnviro framed version, le cadre est défini en mettant en évidence les actants compris dans celui-ci (Agent ou Source, Patient et Destination). Des exemples sont également donnés comprenant l’UT en question et soulignant les core-FE. À la suite des exemples, une note explicative est ajoutée pour préciser l’origine du cadre. Cette note est conforme aux catégories déjà discutées ci-dessus. Dans le cas de l’exemple dans la figure 67, le cadre est basé sur un cadre existant dans FrameNet, mais le nombre d’actants diffère de celui des core-FE. De plus, il y existe un cas d’alternance (catégorie deux). Une section avec tous les actants et circonstants est ajoutée. On y trouve deux colonnes : Participant (1), qui regroupe les actants ; et Participants (2), qui regroupe les circonstants. Bien entendu, les différents actants et circonstants sont distingués au moyen des couleurs. La dernière section est dédiée aux UT (ou UL) qui appartiennent au cadre. Ici, nous pouvons remarquer que les terminologues du DiCoEnviro ont mis dans cette section les UT des trois langues représentées dans la ressource, à savoir l’anglais, le français et l’espagnol.

Tout comme FrameNet, les relations entre les cadres sont définies dans le DiCoEnviro

framed version. Dans la partie à droite de chaque cadre, les relations sont représentées via des

graphes. Les flèches reliant les cadres précisent la nature des liens entre chacun. Dans la définition des relations entre les cadres, les terminologues de DiCoEnviro se sont basés sur les relations de FrameNet (L’Homme et Robichaud 2014 : 193). Par exemple, dans la figure 67, le cadre Emitting est relié à deux cadres, Reflecting et Soaking_up. Le type des relations reliant ces trois cadres est Precedes.

Finalement, le Framed DiCoEnviro propose des scénarios reliant plusieurs cadres. Par exemple, on y trouve le scénario Cycle_of_existence_scenario (figure 68).

Figure 68 : Cycle_of_existence_scenario dans DiCoEnviro Framed Version (DiCoEnviro Framed Version 2015)

Le cadre Cycle_of_existence_scenario est un cadre général qui a pour but de relier sémantiquement les autres cadres. Ce scénario relie cinq cadres :

Cycle_of_life_and_death, Species_activity, Become_rejuvnated,

Ceasing_to_be et Surviving. Chacun de ces cadres est relié au scénario par une relation. Les cadres Species_activity, Become_rejuvnated, Ceasing_to_be et Surviving sont des sous-cadres (Subframe) du scénario Cycle_of_existence_scenario. Tandis que

Cycle_of_life_and_death entretient une relation d’héritage (Is inherited by) avec le premier.