• Aucun résultat trouvé

synonymes désambiguïsés et gradués en fonction de leur niveau

6.2. Méthodologies d’acquisition des données de ReSyf

6.2.3. Enrichissement des listes de sens-synonymes

Nous nous intéressons ici à enrichir la liste de synonymes, associée à chaque raffinement sémantique du premier niveau d’un terme donné, avec des syno-nymes non désambiguïsés manuellement par les internautes qui jouent à Jeux-DeMots. Afin d’inclure, si possible, les synonymes non désambiguïsés dans les listes de sens-synonymes, nous avons utilisé une méthode de désambiguïsation basée sur les signatures sémantiques de mots et de sens (Billami et al., 2018). Nous avons déjà proposé dans le chapitre 4la méthodologie de création et va-lidation de ces signatures sémantiques. Nous avons fait le choix d’utiliser des signatures à base de la relation Idée associée car il s’agit de la relation contenant le plus grand nombre d’instances puisqu’elle englobe tous les termes faisant pen-ser à une entrée lexicale donnée. Aussi, il s’agit de la relation qui grandit le plus rapidement. Le nombre d’instances de cette relation est de 105 133 268 selon les données de la base lexicale datant deJanvier 2018.

Pour un mot-cible polysémique à traiter, nous avons à disposition un ensemble de raffinements sémantiques du premier niveau qui lui est associé et une liste de synonymes non désambiguïsés manuellement. Nous considérons les

raffine-ments sémantiques comme des sens candidats. Le principe consiste à trouver pour chaque synonyme le raffinement sémantique du mot-cible le plus proche afin qu’ils soient associés.

Nous avons proposé deux algorithmes de désambiguïsation sémantique : 1. Le premier algorithme consiste à comparer directement la signature

mantique de chaque raffinement sémantique candidat à la signature sé-mantique d’un synonyme donné syna(cf. voir l’algorithme4ci-dessous). 2. Le deuxième algorithme utilise l’hypothèse proposée par Budanitsky et

Hirst (2006) : « la similarité entre deux mots est celle de leurs sens les

plus proches» (cf. voir l’algorithme5ci-dessous).

La similarité sémantique que nous utilisons pour comparer deux signatures est une fonction d’activation qui prend en compte l’existence de la relation d’une idée

associéeentre les deux éléments mis en comparaison. Cette fonction consiste à vérifier si l’un des deux éléments à comparer représente une dimension dans la signature sémantique de l’autre. Si c’est vrai, la fonction renvoie une simila-rité parfaite (score de similasimila-rité = 1) sinon la similasimila-rité Cosinus est estimée en utilisant la signature sémantique des deux éléments. Dans les deux chapitres précédents, nous avons fait référence à cette fonction par Act1.

Algorithme 4 : Comparaison de chaque sens du mot-cible avec chaque synonyme

syna

Entrées :

mot − cible : mot à traiter

raf f _sem (mot − cible) : ensemble de sens du premier niveau pour le mot-cible syna: synonyme du mot-cible

ε : seuil de validation d’une similarité

Résultat :

ˆ

Sensmot−cible: sens du mot-cible ayant le meilleur score Données :

Sid´ee_a: ensemble de signatures dont les dimensions sont des idées associées 1 Initialisation :

2 Scoreraf f s_C = ∅ // Score des sens du mot-cible 3 pour chaque sensi ∈ raf f _sem (mot − cible) faire

4 Score =

(

1 si (∗)

Cosinus (Sid´ee_a(sensi), Sid´ee_a(syna)) sinon 5 (∗) : sensi ∈ Sid´ee_a(syna) ∨ syna∈ Sid´ee_a(sensi); 6 si (Score > ε) alors

7 Scoreraf f s_C ← Scoreraf f s_C S

(sensi, Score);

Algorithme 5 : Comparaison de chaque sens du mot-cible avec chaque sens d’un synonyme syna(comparaison directe avec le synonyme s’il n’a pas de raffinements sémantiques)

Entrées :

mot − cible : mot à traiter

raf f _sem (mot − cible) : ensemble de sens du premier niveau pour le mot-cible syna: synonyme du mot-cible

raf f _sem (syna) : ensemble de sens du premier niveau pour le synonyme syna

ε : seuil de validation d’une similarité

Résultat :

ˆ

Sensmot−cible: sens du mot-cible ayant le meilleur score Données :

Sid´ee_a: ensemble de signatures dont les dimensions sont des idées associées 1 Initialisation :

2 Scoreraf f s_C = ∅ // Score des sens du mot-cible 3 si raf f _sem (syna) 6= ∅ alors

4 pour chaque sensi ∈ raf f _sem (mot − cible) faire 5 Score = 0; maxScore = 0 ;

6 pour chaque sensj ∈ raf f _sem (syna) faire 7 Score =

(

1 si (∗)

Cosinus (Sid´ee_a(sensi), Sid´ee_a(sensj)) sinon 8 (∗) : sensi ∈ Sid´ee_a(sensj) ∨ sensj ∈ Sid´ee_a(sensi) 9 si (Score > maxScore) alors

10 maxScore = Score;

11 si (maxScore > ε) alors

12 Scoreraf f s_C ← Scoreraf f s_C S

(sensi, maxScore)

13 sinon

14 pour chaque sensi ∈ raf f _sem (mot − cible) faire 15 Score =

(

1 si (∗)

Cosinus (Sid´ee_a(sensi), Sid´ee_a(syna)) sinon 16 (∗) : sensi ∈ Sid´ee_a(syna) ∨ syna∈ Sid´ee_a(sensi); 17 si (Score > ε) alors

18 Scoreraf f s_C ← Scoreraf f s_C S

(sensi, Score);

19 Sensˆ mot−cible ← Best (Scoreraf f s_C)

L’algorithme 4 permet de désambiguïser un synonyme syna en choisissant le sens le plus proche du mot-cible. Pour chaque paire (syna, sensi), avec i ∈ 1 . . . n(n : nombre de sens candidats du mot-cible), l’algorithme4vérifie d’abord si l’un des éléments de la paire représente une dimension dans la signature

sémantique de l’autre élément. Si c’est vrai, le synonyme est intégré directement dans la liste de synonymes du sensi sinon la similarité Cosinus est estimée. Dans ce dernier cas, les sens les plus proches ayant la meilleure similarité sont sélectionnés. Nous utilisons un seuil ε = 0.01.

L’algorithme 5 permet de désambiguïser un synonyme syna en comparant chaque sens candidat à chaque sens de syna. Si le synonyme synaest polysé-mique et possède des raffinements sémantiques dans JeuxDeMots alors ses sens mis en comparaison sont ses raffinements sémantiques du premier niveau. Dans le cas contraire, si syna est monosémique ou n’a pas de raffinements sé-mantiques dans JeuxDeMots, l’algorithme4est utilisé ici pour le désambiguïser. La validation des algorithmes4et5est décrite dans la section6.4.

Reprenons l’exemple du nom 'phare' (cf. sous-section 6.2.2), si nous appli-quons l’algorithme 4, alors le résultat que nous obtenons est montré dans la figure6.2.

phare

phare (véhicule) phare (maritime) phare (aéronautique) phare (modèle)

code, feu, flambeau, fleuron, lanterne, lumière

balise, fanal, lumière, projecteur, sémaphore gloire, guide, illustration, modèle, visionnaire 1.0 0.51 0.22 0.18

Figure 6.2. – Liste de raffinements sémantiques du nom 'phare' avec des syno-nymes désambiguïsés à partir de JeuxDeMots

L’algorithme permet ici de désambiguïser automatiquement tous les synonymes non désambiguïsés manuellement. Nous rappelons que les noms guide et

mo-dèle sont déjà proposés comme synonymes associés au raffinement séman-tique 'phare (modèle)'. Sur l’ensemble, 13 synonymes sont ajoutés automaséman-tique- automatique-ment. Le nom 'lumière' est ajouté à la fois comme synonyme associé pour le sens 'phare (véhicule)' et 'phare (maritime)'. Il se trouve que dans JeuxDeMots,

lumièreest une idée associée aux deux sens.

La section 6.5 décrit les données quantitatives obtenues par utilisation des sens-synonymes provenant de JeuxDeMots. Les données de la dernière ver-sion de la ressource lexicale ReSyf sont les données obtenues par utilisation des raffinements sémantiques de JeuxDeMots.