• Aucun résultat trouvé

Chapitre 5. Construction automatique de hiérarchies sémantiques à partir du

5.3. Évaluation manuelle des relations hyperonymiques

5.3.2. Analyse des résultats d’évaluation

Figure 5.8. Exemple des hiérarchies sémantiques construites pour le vocable

RAQUETTE

L’évaluation a été effectuée par trois documentalistes de Xilopix qui travaillent sur la

conception manuelle du thésaurus de l’entreprise. Un formulaire a été mis à leur

disposition. Ainsi, les évaluateurs ont pu évaluer la relation d’hyperonymie d’un lexème

et son nœud père à travers deux réponses :

- « Oui » quand le nœud père représente l’hyperonyme du lexème pour un

domaine donné ;

- « Non » quand le nœud père n’est pas l’hyperonyme du lexème.  

5.3.2. Analyse des résultats d’évaluation

L’évaluation a été effectuée sur l’ensemble de 620 relations d’hyperonymie ainsi

déterminées automatiquement. La figure 5.9. présente les résultats obtenus. Ainsi,

82,07 % des relations ont été évaluées comme étant hyperonymiques (ex.

manteau-vêtement, compassion-sentiment, etc.). Toutefois, 17,92 % des relations ont été évaluées

comme non hyperonymiques (ex. batteur-branche, palme-forme, etc.).

  162

Figure 5.9. Résultats de l’évaluation manuelle des relations hyperonymiques

Nous allons maintenant présenter les analyses détaillées de l’évaluation ainsi réalisée.

5.3.2.1. Analyse des résultats positifs de l’évaluation

manuelle

Le tableau 5.1. présente des exemples de relations hyperonymiques évaluées

positivement.

Lexème Hyperonyme Domaine Définition du TLFi

ROSETTE Encre   Technologie   Encre rouge obtenue à partir d’une

essence de bois du Brésil.

CANOË Embarcation Générique Embarcation légère manœuvrée à la

pagaie …

SKI Patin Sports Chacun des deux patins (de bois, de

métal ou de fibre synthétique) longs

POÊLE Appareil   Générique   Appareil de chauffage.

BALLON Pneu Cyclisme Gros pneu de bicyclette.

RAQUETTE Piège Chasse Piège à détente constitué par une

baguette flexible tendue …

AMOUR Attirance Générique Attirance, affective ou physique,

qu’en raison d’une certaine affinité

82,07% 17,92% 0,00% 20,00% 40,00% 60,00% 80,00% 100,00% Oui Non

  163

DOULEUR Souffrance Générique Souffrance plus ou moins vive,

produite par une blessure …

CHÂTEAU Forteresse Histoire Forteresse souvent construite sur

une hauteur et/ou difficilement

accessible …

OBÉLISQUE Monument Générique Monument ou objet ayant la forme

d’un obélisque.  

Tableau 5.1. Exemples de relations identifiées comme hyperonymiques

Ainsi, nous pouvons observer que dans les relations évaluées, l’hyperonyme

déterminé pour un lexème est toujours situé en tête de la définition, même dans les

définitions synonymiques ou dans le cas des définitions qui contiennent des syntagmes

hyperonymiques (ex. appareil de chauffage).

5.3.2.2. Analyse des résultats négatifs de l’évaluation

manuelle

Même si la grande majorité (82,07 %) des relations hyperonymiques déterminées

automatiquement a été évaluée positivement (cf. tableau 5.1.), 17,92 % des relations

d’hyperonymie identifiées ont été évaluées négativement (cf. tableau 5.2.).

Lexème Hyperonyme Domaine Définition du TLFi

CASSEROLE Épreuve Générique Subir une épreuve désagréable.

CHAUFFEUR Feu Générique Celui qui s’occupe du feu d’une forge,

d’un fourneau, du fonctionnement d'une

chaudière.

CITADELLE Force Générique Personne rappelant, par sa force de

résistance.

FORCE Nature Générique Ce qui meut, anime la nature, l’univers.

POUVOIR Fonction Générique Droits d’exercer certaines fonctions et

prérogatives attachées à ces droits.  

SALADIER Salade Générique Personne qui raconte des salades.  

SOUCOUPE

Consomma-tion

Générique Montant d’une consommation dans un

café.  

  164

POMME

Excroissan-ce

Générique Excroissance qui se trouve sur la sauge

passifère et qui est le fruit de la piqûre

d’un insecte.

COCOTTE Familier Générique Appellatif familier adressé à une jument.

AVOCAT Intérêt Générique Personne défendant les intérêts de

quelqu'un ou de quelque chose.

Tableau 5.2.Exemples des relations identifiées comme non hyperonymiques

Nous allons maintenant détailler les différents facteurs qui ont conduit à proposer des

relations hyperonymiques erronées.

1. Structure des définitions du TLFi.

Notre modèle de pondération fonctionne plutôt correctement à partir des définitions

hyperonymiques des vocables nominaux. Toutefois, les définitions de certains lexèmes

ne sont pas toujours hyperonymiques, elles peuvent en effet avoir une autre structure.

C’est par exemple le cas des définitions pour les lexèmes qui désignent un métier

comme CHAUFFEUR, AVOCAT ou qui désignent des choses abstraites comme

FORCE. Les définitions de ces lexèmes commencent toujours par un pronom

démonstratif celui, celle, ce, etc. ou pronom relatif qui indiquent une personne ou une

chose : « Celui qui s’occupe du feu d’une forge » (CHAUFFEUR), « Ce qui meut,

anime la nature, l’univers » (FORCE). Dans ce type de définition, l’hyperonyme du

lexème défini est le pronom démonstratif ou relatif. Dans SEMEME, ces pronoms n’ont

pas été annotés. Ce fait nous ne permet pas de les identifier et de traiter ce type de

structure des définitions.  

2. Syntagmes hyperonymiques.

On relève aussi des définitions qui débutent avec un verbe, par exemple l’une des

définitions des lexèmes du vocable CASSEROLE est « Subir une épreuve

désagréable ». La construction du type Verbe + Nom + Adjectif rencontrée dans la

définition représente un genre prochain de celle-ci complexe, constitué de plusieurs

éléments. La pondération que nous avons proposée ne permet pas de déterminer ce type

de construction complexe. Ainsi, la relation hyperonymique déterminée

automatiquement casserole-épreuve a été évaluée négativement par l’évaluateur.

  165

Toutefois, ce fait est discutable, car cette relation pourrait être bien considérée comme

une relation hyperonymique.

3. Annotation et lemmatisation erronées des définitions du SEMEME.

Lors de l’annotation morphosyntaxique des définitions du TLFi dans le cadre du

projet SEMEME, certains lemmes ont été annotés incorrectement. C’est surtout le cas

des lemmes qui peuvent avoir plusieurs catégories grammaticales (ex. avoir, être,

animal, mammifère, voisin, félin, etc.). Ainsi, certains lemmes des définitions sont

annotés avec d’autres catégories que « nom », ce qui fait qu’ils ne sont pas pris en

compte lors du calcul de poids qui ne traite que les noms. Par exemple, dans la

définition du lexème POUVOIR, le lemme droit est annoté comme adjectif. Ce sont les

mêmes cas pour le lexème SOUCOUPE où le lemme montant est annoté comme verbe

et le lexème COCOTTE où le lemme appellatif est annoté comme adjectif et le lemme

familier comme nom.

4. Des lemmes manquants dans SEMEME.

Nous avons remarqué que dans SEMEME, certains lemmes des définitions

manquent. Par exemple, dans une des définitions des lexèmes du vocable CITADELLE,

le lemme personne manque dans la liste des lemmes de la définition :  

<definition>  

<source> Personne rappelant, par sa force de résistance.</source>

<semes>  

<seme lemme="rappeler" categorie="v"/>

<seme lemme="force" categorie="subst"/>  

<seme lemme="résistance" categorie="subst"/>  

/semes>  

</definition>

De ce fait, notre procédure automatique a déterminé comme hyperonyme du lexème

CITADELLE le nom force et non personne. Le même cas de figure se présente pour les

lexèmes SALADIER et AVOCAT.

5. Les définitions des locutions d’un vocable.

Dans notre recherche, nous utilisons seulement les définitions des lexèmes d’un

vocable donné et non les définitions des locutions. Toutefois, dans SEMEME, certaines

définitions des locutions d’un vocable donné ont été annotées comme étant des

définitions des lexèmes. Ce balisage erroné a contribué à la récupération des définitions

  166

de locutions d’un vocable donné. Par exemple, la définition « Excroissance qui se

trouve sur la sauge passifère et qui est le fruit de la piqûre d’un insecte »de la locution

POMME DE SAUGE a été considérée comme l’une des définitions des lexèmes du

vocable POMME. De ce fait, nous déterminons des hyperonymes qui sont valables

plutôt pour les locutions du vocable et non pour les lexèmes. Ainsi, le nom excroissance

ne peut pas être considéré comme l’hyperonyme du lexème POMME mais uniquement

de la locution POMME DE SAUGE.  

5.4. Comparaison des hiérarchies sémantiques avec le