• Aucun résultat trouvé

Deux approches pour mesurer la qualité d’une relation

6.3 Le filtrage des objets complémentaires

6.3.1 Les vecteurs sémantiques

6.3.1.3 Deux approches pour mesurer la qualité d’une relation

L’objectif de l’utilisation de vecteurs sémantiques est de mesurer la pertinence de l’as- sociation d’un verbe avec son objet complémentaire afin de classer en termes de plausibilité les relations syntaxiques induites. La finalité est d’obtenir des descripteurs de bonne qual- ité avec notre modèle SelDeF en utilisant les objets complémentaires. Nous présentons ici deux approches permettant de sélectionner ces objets.

L’approche non contextuelle

Une première méthode consiste à mesurer la qualité d’une relation syntaxique induite par rapport à la relation syntaxique dont elle est issue. En d’autres termes, l’objectif est d’évaluer si deux relations syntaxiques, l’une classique, l’autre induite partagent les mêmes concepts. Ainsi, nous allons valider la proximité sémantique entre le verbe et l’objet d’une relation induite avec le verbe et l’objet de la relation originale. Concrètement avec l’exemple de la figure6.2, il s’agit de mesurer la proximité sémantique des relations manger fruit (relation originale) et consommer fruit (relation induite). Nous représentons alors chaque relation syntaxique sans prendre en compte le contexte des phrases d’où elles proviennent34 (c.-à.-d. sans les contextualiser). Ceci permet

de mesurer la proximité sémantique des deux relations. Ainsi, une relation syntaxique est pondérée uniquement avec les concepts du verbe et de l’objet, en tenant compte de la position du gouverneur dans l’arbre morphosyntaxique. Le contexte pris en compte est alors uniquement fondé sur la position hiérarchique des composantes de la relation

34Notons que une relation syntaxique induite ne peut être contextualisée du fait qu’elle ne provient pas

syntaxique. Nous présentons, afin d’illustrer cette approche, la représentation vectorielle de la relation syntaxique “consommer fruit” dans la figure 6.6. Nous calculons dans un premier temps les vecteurs sémantiques du verbe “consommer” puis du nom “fruit”. Nous obtenons finalement le vecteur résultant de la relation syntaxique35. Dans cet exemple, le

Fig. 6.6 – Vecteurs sémantiques respectifs non contextualisés de “consommer”, “fruit”, et “consommer fruit”.

poids du verbe influe sur ses concepts, cela explique les différentes valeurs des composantes. Notons que cette méthode n’est pas très discriminante, car elle ne contextualise pas les relations syntaxiques. En effet, dans cet exemple, la thématique de la nourriture est mise en avant, mais n’est pas répercutée dans le vecteur sémantique de la relation syntaxique résultante. Les concepts “nutrition, fruits, repas et sucrerie” devraient en effet être mis en avant. Cette méthode, qui fut la première implémentée afin d’extraire des descripteurs de qualité à partir de relations induites, montre ses limites dans nos expérimentations qui seront présentées dans le chapitre 7. Nous proposons ci-dessous une approche tenant compte du contexte en employant les vecteurs sémantiques contextualisés globaux.

L’approche contextuelle

L’utilisation de vecteurs sémantiques contextualisés permet une richesse sémantique plus fine. Ainsi, dans cette seconde approche visant à mesurer la qualité des relations induites, nous proposons non plus de mesurer la proximité de relations syntaxiques, l’une induite et l’autre classique, mais de mesurer directement la proximité d’un verbe et de son objet complémentaire. Pour cela, nous utilisons des vecteurs sémantiques globaux contextualisés. Plusieurs représentations globales peuvent alors être employées pour le verbe et l’objet. En d’autres termes, quels peuvent-être les meilleurs descripteurs pour le verbe et l’objet ? Nous avons retenu les représentations suivantes :

– pour le verbe : le verbe “lui même” (le gouverneur du groupe verbal) et le groupe verbal complet

35Nous n’avons pas reporté les noms des concepts dans la figure représentant le vecteur sémantique de

– pour l’objet : le nom (le gouverneur du groupe nominal) et le groupe nominal.

L’utilisation de groupes nominaux et verbaux afin de décrire respectivement un verbe et un objet s’apparente à l’utilisation de syntagmes verbaux ou nominaux. En effet, ne pouvant produire assez de relations syntaxiques en utilisant les syntagmes, nous pouvons ainsi utiliser les ressources sémantiques des contextes générés par les verbes et/ou les objets. Rappelons en effet que nos modèles SelDe et SelDeF dépendent du nombre d’objets communs et distincts de couple de verbes. Nous sommes ainsi contraint d’utiliser comme objets le gouverneur du “groupe objet”. Dans le cas contraire, nous extrairions un nombre trop limité d’objets communs afin d’appliquer nos approches (cf section3.4.2). C’est pourquoi nous proposons avec cette approche fondée sur des vecteurs sémantiques, d’utiliser des représentations plus riches d’un verbe et de son objet. En effet, un groupe nominal est plus porteur de sens qu’un simple nom. De plus, en les contextualisant, les groupes nominaux seront d’autant plus informatifs.

Par exemple, prenons la phrase “J’ai consommé des fruits rouges”. Afin de représenter le vecteur du mot “fruit”, nous prendrions alors, si nous choisissions d’utiliser les groupes nominaux, l’expression “des fruits rouges” afin de décrire “fruit”. Le vecteur résultant donné dans la figure 6.7en sort plus riche avec de nouveaux concepts activés par rapport au terme “fruit” seul. Ces nouveaux concepts ont les numéros 15, 21, 24, 102, 335, 356, 357 et 471 correspondant respectivement à : “identité, ressemblance, uniformité, un, pilosité, brun, et rouge”. Notons que la sélection d’un groupe nominal ou verbal se fait avec l’appui de l’arbre syntaxique généré par l’analyse de Sygfran. Après avoir défini

Fig. 6.7 – Vecteurs sémantiques de “fruit” avec pour descripteur “des fruits rouges”.

nos différentes approches pour représenter les relations syntaxiques induites, nous devons définir une mesure de qualité pour ordonner les vecteurs sémantiques obtenus. Nous présentons dans la section suivante les choix que nous avons effectués dans ce but.

6.3.1.4 Comment mesurer la proximité sémantique des vecteurs séman-