• Aucun résultat trouvé

3.4 Le modèle SELDE

4.1.1 Description du modèle d’expansion

Notre approche vise à enrichir un corpus initial lemmatisé en faisant une expansion des phrases fondée sur la méthode SelDe présentée dans le chapitre3. Une telle approche va permettre de produire un contexte plus riche. Celui-ci est construit en complétant les mots d’un corpus par les descripteurs extraits avec SelDe. Un exemple d’enrichissement est donné ci-dessous :

Soit la phrase : "Vos interlocuteurs seront donc bien inspirés de placer les échanges ...". Nous la transformons tout d’abord en phrase lemmatisée via le système Sygmart : "Votre interlocuteur être donc bien inspiré de placer le échange ...".

Enfin, elle va être enrichie avec nos descripteurs en devenant la phrase (en s’appuyant sur la figure 3.14 du chapitre 3) "Votre ( interlocuteur collaborateur ) être donc bien inspiré de placer le échange ...".

L’expansion d’un corpus s’effectue en différentes étapes résumées dans la figure 4.1.

Fig. 4.1 – Modèle d’expansion de corpus

Sélection des termes à enrichir et des descripteurs

La sélection des descripteurs s’effectue selon le modèle décrit dans le chapitre 3. Ces de- scripteurs vont alors être utilisés afin d’enrichir les termes sélectionnés pour l’enrichisse- ment. Ces termes sont tous les noms du corpus. En effet, tous les noms du corpus peuvent potentiellement être enrichis par cette approche. Les termes à enrichir dépendent directe- ment des descripteurs extraits avec SelDe, qui ne sont autres que les objets communs

des couples de verbes jugés sémantiquement proches. Cette nuance est explicitée dans le paragraphe suivant, traitant de l’enrichissement.

L’enrichissement

L’étape d’enrichissement consiste de manière triviale à enrichir chaque terme candidat à l’expansion par les descripteurs extraits avec SelDe. Rappelons que lors de la sélection de descripteurs avec SelDe, nous mesurons la proximité de verbes en fonction de leurs objets. Ainsi, la mesure d’Asium nous donne un score. Nous fixons alors un seuil, noté SA pour “Seuil d’Asium”, au delà duquel les verbes sont considérés comme proches. Nous cherchons alors à enrichir un terme par d’autres termes qui partagent son contexte (les descripteurs de SelDe formés par les objets des couples de verbes proches). Nous sélectionnons donc les couples dans lesquels le terme à enrichir apparait. Une question se pose néanmoins : de quel couple de verbes sémantiquement proches allons nous sélectionner les objets communs afin d’enrichir notre candidat ? Il se peut en effet que le terme à enrichir apparaisse dans plusieurs couples.

Ainsi, nous proposons deux types de sélections possibles pour le couple de verbes dans lequel le terme apparaît :

– Sélectionner le couple de verbes ayant obtenu le score d’Asium le plus élevé. Cette sélection se distingue du seuil d’Asium SA. Le choix effectué ici est la sélection des objets du couple de verbes ayant obtenu le score d’Asium le plus élevé appartenant à [SA, 1]. Par exemple, soit un seuil SA = 0, 8, un terme à enrichir te, un ensemble de couples de termes Ct dans lesquelles apparaissent te. Si le score d’Asium le plus important obtenu parmi Ct est 0,87, les objets du couple ayant obtenu ce score seront sélectionnés pour l’enrichissement de te. Cependant, si SA valait 0,9, aucun couple ne serait sélectionné pour un enrichissement de te.

– Sélectionner le couple de verbes dans lequel le nombre d’occurrences du terme à enrichir est le plus élevé.

Chaque couple de verbes contient un certain nombre d’objets communs. Ces derniers ont également un nombre d’occurrences propre. Avec cette sélection, nous nous focalisons non plus sur le plus important score obtenu avec Asium. Nous mettons ici en valeur le terme ayant le nombre d’occurrences le plus élevé. Ainsi, pour chaque couple de verbes où le terme à enrichir apparait, nous sélectionnons celui où le terme à enrichir possède un maximum d’occurrences.

Nous noterons ce paramètre de choix du couple de verbes ChVerb dans la suite de ce mémoire, en lui attribuant comme valeur “Asium” (seuil d’Asium maximum) pour la première méthode et “Occurrences” (le nombre maximum d’occurrences) pour la seconde. Nous illustrons ce principe d’enrichissement avec l’exemple ci-dessous.

Exemple d’enrichissement

Soit la phrase “Quelles sont les compétences d’un dirigeant d’entreprise ?”. Afin de simplifier cet exemple, seul le nom “compétence” de notre phrase va être utilisé comme terme candidat à l’expansion. Ainsi, notre objectif est d’enrichir le nom “compétence”. Après avoir extrait les descripteurs en suivant le modèle SelDe, nous disposons d’un certain nombre de couples de verbes dans lesquels le nom “compétence” apparait (nous n’en reporterons que trois) :

couple 1 : “stimuler-mettre”, score d’Asium = 0.67, Objets communs = capacité(5 occurrences), possibilité(2), imagination(2), compétence(12)

couple 2 : “utiliser-disposer”, score d’Asium = 0.85, Objets communs = énergie(5 occurrences), ressource(6), facilité(3), atout(18), compétence(3)

couple 3 : “douter-dépasser”, score d’Asium = 0.79, Objets communs = capacité(6 occurrences), compétence(6)

Alors, avec ChV erb = Asium, nous sélectionnerions le couple 2 (score d’Asium à 0,85) et avec ChV erb = Occurrences, nous sélectionnerions le couple 1 (12 occurrences de “compétence”).

Finalement, la phrase initiale :

– Quelles sont les compétences d’un dirigeant d’entreprise ? devient après lemmatisation :

– Quel être le compétence de un dirigeant de entreprise ?

puis, après enrichissement avec la première méthode de sélection (seuil d’Asium maxi- mum) devient :

– Quel être le (compétence , énergie , ressource , facilité , atout) de un dirigeant de entreprise ?

et finalement enrichie avec la seconde méthode (le nombre maximum d’occurrences), la phrase devient :

– Quel être le (compétence , capacité , possibilité , imagination) de un dirigeant de entreprise ?