Chapitre 5. Construction automatique de hiérarchies sémantiques à partir du
5.3. Évaluation manuelle des relations hyperonymiques
5.3.2. Analyse des résultats d’évaluation
Figure 5.8. Exemple des hiérarchies sémantiques construites pour le vocable
RAQUETTE
L’évaluation a été effectuée par trois documentalistes de Xilopix qui travaillent sur la
conception manuelle du thésaurus de l’entreprise. Un formulaire a été mis à leur
disposition. Ainsi, les évaluateurs ont pu évaluer la relation d’hyperonymie d’un lexème
et son nœud père à travers deux réponses :
- « Oui » quand le nœud père représente l’hyperonyme du lexème pour un
domaine donné ;
- « Non » quand le nœud père n’est pas l’hyperonyme du lexème.
5.3.2. Analyse des résultats d’évaluation
L’évaluation a été effectuée sur l’ensemble de 620 relations d’hyperonymie ainsi
déterminées automatiquement. La figure 5.9. présente les résultats obtenus. Ainsi,
82,07 % des relations ont été évaluées comme étant hyperonymiques (ex.
manteau-vêtement, compassion-sentiment, etc.). Toutefois, 17,92 % des relations ont été évaluées
comme non hyperonymiques (ex. batteur-branche, palme-forme, etc.).
162
Figure 5.9. Résultats de l’évaluation manuelle des relations hyperonymiques
Nous allons maintenant présenter les analyses détaillées de l’évaluation ainsi réalisée.
5.3.2.1. Analyse des résultats positifs de l’évaluation
manuelle
Le tableau 5.1. présente des exemples de relations hyperonymiques évaluées
positivement.
Lexème Hyperonyme Domaine Définition du TLFi
ROSETTE Encre Technologie Encre rouge obtenue à partir d’une
essence de bois du Brésil.
CANOË Embarcation Générique Embarcation légère manœuvrée à la
pagaie …
SKI Patin Sports Chacun des deux patins (de bois, de
métal ou de fibre synthétique) longs
…
POÊLE Appareil Générique Appareil de chauffage.
BALLON Pneu Cyclisme Gros pneu de bicyclette.
RAQUETTE Piège Chasse Piège à détente constitué par une
baguette flexible tendue …
AMOUR Attirance Générique Attirance, affective ou physique,
qu’en raison d’une certaine affinité
…
82,07%
17,92%
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
Oui Non
163
DOULEUR Souffrance Générique Souffrance plus ou moins vive,
produite par une blessure …
CHÂTEAU Forteresse Histoire Forteresse souvent construite sur
une hauteur et/ou difficilement
accessible …
OBÉLISQUE Monument Générique Monument ou objet ayant la forme
d’un obélisque.
Tableau 5.1. Exemples de relations identifiées comme hyperonymiques
Ainsi, nous pouvons observer que dans les relations évaluées, l’hyperonyme
déterminé pour un lexème est toujours situé en tête de la définition, même dans les
définitions synonymiques ou dans le cas des définitions qui contiennent des syntagmes
hyperonymiques (ex. appareil de chauffage).
5.3.2.2. Analyse des résultats négatifs de l’évaluation
manuelle
Même si la grande majorité (82,07 %) des relations hyperonymiques déterminées
automatiquement a été évaluée positivement (cf. tableau 5.1.), 17,92 % des relations
d’hyperonymie identifiées ont été évaluées négativement (cf. tableau 5.2.).
Lexème Hyperonyme Domaine Définition du TLFi
CASSEROLE Épreuve Générique Subir une épreuve désagréable.
CHAUFFEUR Feu Générique Celui qui s’occupe du feu d’une forge,
d’un fourneau, du fonctionnement d'une
chaudière.
CITADELLE Force Générique Personne rappelant, par sa force de
résistance.
FORCE Nature Générique Ce qui meut, anime la nature, l’univers.
POUVOIR Fonction Générique Droits d’exercer certaines fonctions et
prérogatives attachées à ces droits.
SALADIER Salade Générique Personne qui raconte des salades.
SOUCOUPE
Consomma-tion
Générique Montant d’une consommation dans un
café.
164
POMME
Excroissan-ce
Générique Excroissance qui se trouve sur la sauge
passifère et qui est le fruit de la piqûre
d’un insecte.
COCOTTE Familier Générique Appellatif familier adressé à une jument.
AVOCAT Intérêt Générique Personne défendant les intérêts de
quelqu'un ou de quelque chose.
Tableau 5.2.Exemples des relations identifiées comme non hyperonymiques
Nous allons maintenant détailler les différents facteurs qui ont conduit à proposer des
relations hyperonymiques erronées.
1. Structure des définitions du TLFi.
Notre modèle de pondération fonctionne plutôt correctement à partir des définitions
hyperonymiques des vocables nominaux. Toutefois, les définitions de certains lexèmes
ne sont pas toujours hyperonymiques, elles peuvent en effet avoir une autre structure.
C’est par exemple le cas des définitions pour les lexèmes qui désignent un métier
comme CHAUFFEUR, AVOCAT ou qui désignent des choses abstraites comme
FORCE. Les définitions de ces lexèmes commencent toujours par un pronom
démonstratif celui, celle, ce, etc. ou pronom relatif qui indiquent une personne ou une
chose : « Celui qui s’occupe du feu d’une forge » (CHAUFFEUR), « Ce qui meut,
anime la nature, l’univers » (FORCE). Dans ce type de définition, l’hyperonyme du
lexème défini est le pronom démonstratif ou relatif. Dans SEMEME, ces pronoms n’ont
pas été annotés. Ce fait nous ne permet pas de les identifier et de traiter ce type de
structure des définitions.
2. Syntagmes hyperonymiques.
On relève aussi des définitions qui débutent avec un verbe, par exemple l’une des
définitions des lexèmes du vocable CASSEROLE est « Subir une épreuve
désagréable ». La construction du type Verbe + Nom + Adjectif rencontrée dans la
définition représente un genre prochain de celle-ci complexe, constitué de plusieurs
éléments. La pondération que nous avons proposée ne permet pas de déterminer ce type
de construction complexe. Ainsi, la relation hyperonymique déterminée
automatiquement casserole-épreuve a été évaluée négativement par l’évaluateur.
165
Toutefois, ce fait est discutable, car cette relation pourrait être bien considérée comme
une relation hyperonymique.
3. Annotation et lemmatisation erronées des définitions du SEMEME.
Lors de l’annotation morphosyntaxique des définitions du TLFi dans le cadre du
projet SEMEME, certains lemmes ont été annotés incorrectement. C’est surtout le cas
des lemmes qui peuvent avoir plusieurs catégories grammaticales (ex. avoir, être,
animal, mammifère, voisin, félin, etc.). Ainsi, certains lemmes des définitions sont
annotés avec d’autres catégories que « nom », ce qui fait qu’ils ne sont pas pris en
compte lors du calcul de poids qui ne traite que les noms. Par exemple, dans la
définition du lexème POUVOIR, le lemme droit est annoté comme adjectif. Ce sont les
mêmes cas pour le lexème SOUCOUPE où le lemme montant est annoté comme verbe
et le lexème COCOTTE où le lemme appellatif est annoté comme adjectif et le lemme
familier comme nom.
4. Des lemmes manquants dans SEMEME.
Nous avons remarqué que dans SEMEME, certains lemmes des définitions
manquent. Par exemple, dans une des définitions des lexèmes du vocable CITADELLE,
le lemme personne manque dans la liste des lemmes de la définition :
<definition>
<source> Personne rappelant, par sa force de résistance.</source>
<semes>
<seme lemme="rappeler" categorie="v"/>
<seme lemme="force" categorie="subst"/>
<seme lemme="résistance" categorie="subst"/>
/semes>
</definition>
De ce fait, notre procédure automatique a déterminé comme hyperonyme du lexème
CITADELLE le nom force et non personne. Le même cas de figure se présente pour les
lexèmes SALADIER et AVOCAT.
5. Les définitions des locutions d’un vocable.
Dans notre recherche, nous utilisons seulement les définitions des lexèmes d’un
vocable donné et non les définitions des locutions. Toutefois, dans SEMEME, certaines
définitions des locutions d’un vocable donné ont été annotées comme étant des
définitions des lexèmes. Ce balisage erroné a contribué à la récupération des définitions
166
de locutions d’un vocable donné. Par exemple, la définition « Excroissance qui se
trouve sur la sauge passifère et qui est le fruit de la piqûre d’un insecte »de la locution
POMME DE SAUGE a été considérée comme l’une des définitions des lexèmes du
vocable POMME. De ce fait, nous déterminons des hyperonymes qui sont valables
plutôt pour les locutions du vocable et non pour les lexèmes. Ainsi, le nom excroissance
ne peut pas être considéré comme l’hyperonyme du lexème POMME mais uniquement
de la locution POMME DE SAUGE.
5.4. Comparaison des hiérarchies sémantiques avec le