• Aucun résultat trouvé

2.5 Bilan sur les sources agricoles

1.1.3 Utilisation de la hiérarchie

Une fois les classes de l’ontologie extraites, les relations hiérarchiques du thésaurus peuvent également être utilisées pour enrichir la transformation. Les relations "narrower" et "broader" témoignent d’une spécialisation ou d’une généralisation thématique et non d’une relation de subsomption entre classes. Cette distinction induit certaines confusions puisque, comme le montre [Soergel et al., 2004], les relations hiérarchiques d’un thésaurus sont parfois utilisées pour représenter des relations de composition (on

Sél. Trait. Types Désambiguïsation Val.

(Wielinga et al., 2001) non Auto. HsCO non non

(Hahn, 2003) oui Auto. HsCO - HC - HF non Auto.

(Van Assem et al., 2004) non Auto. HsCO - HC - HF non non

(Soergel et al., 2004) non Auto. HsCO - HC - HF Patrons de transfor-mations

non

(Hepp et De Bruijn, 2007) non Auto. HsCO non non

(Chrisment et al., 2008) non Auto. HsCO non Man.

(Villazón-Terrazas et al., 2010)

non Auto. HsCO - HC - HF Source externe (non définie)

non

(Li et Li, 2012) non Auto. HsCO - HC - HF non non

(Kless et al., 2012) oui Man. HsCO - HC - HF Man. Man.

(Charlet et al., 2012) oui Man. HsCO - HC - HF Man. Auto.

Table 9 – Utilisation de la hiérarchie

trouve par exemple dans AGROVOC "Cow, narrower, Cow Milk"58). La transformation d’une relation hiérarchique en relation "subClassOf" ne peut donc pas être systématique.

Pour étudier le traitement de ces relations hiérarchiques, nous proposons différents critères. Le résultat de notre analyse est présenté dans le tableau 2. Les critères liés au traitement de la hiérarchie du thésaurus sont :

— Sélection (Sél.) indique si la méthode filtre les branches de la hiérarchie ;

— Traitement (Trai.) précise le niveau d’automatisation du traitement (automatique ou manuel) ;

— Types énumère les types de relations possibles dans l’ontologie (Hiérarchie "sub-ClassOf" -> HsCO, Hiérarchie Compositionnelle -> HC, Hiérarchie Fonctionnelle -> HF) ;

— Désambiguïsation précise si la méthode applique un processus de désambiguïsation pour déterminer la nature de la relation dans l’ontologie et, si oui, quelle technique est utilisée ;

— Validation (Val.) indique si la méthode applique un processus de validation du résultat et, si oui, s’il s’agit d’une validation automatique ou manuelle.

Le filtrage des branches de la hiérarchie peut permettre le traitement spécifique de la hiérarchie du thésaurus suivant une branche spécifique du thésaurus. Un thésaurus pouvant couvrir un domaine large, cette hiérarchie peut donc être utilisée pour représenter différentes relations suivant les branches. La hiérarchie fonctionnelle représente les relations de généralisation et de spécialisation thématiques spécifiques au domaine.

Il apparaît dans le tableau 9que seulement [Charlet et al., 2012][Hahn, 2003] [Kless et al., 2012] effectuent une sélection de la partie du thésaurus à traiter. Cet aspect est particulièrement intéressant puisqu’il permet de ne considérer qu’une sous-partie d’un thésaurus, l’intégralité d’un thésaurus n’étant pas forcément pertinente pour les besoins de la transformation. Les méthodes de traitement de la hiérarchie se décomposent en deux grandes familles :

— celles qui transforment toutes les relations hiérarchiques narrower/broader en un

seul type de relation ontologique ;

— celles qui transforment les relations hiérarchiques en plusieurs types de relations ontologiques.

Dans la première famille, nous trouvons les travaux de [Hepp and De Bruijn, 2007,

Chrisment et al., 2008,Wielinga et al., 2001,Van Assem et al., 2004]. Ils proposent un traitement automatique de la hiérarchie en la transformant directement en hiérarchie de subsomption ("subClassOf"). [Chrisment et al., 2008] précise que les relations nar-rower/broader du thésaurus considéré correspondent particulièrement à des relations "subClassOf". [Van Assem et al., 2004] propose de choisir la transformation de toute la hiérarchie et de déterminer si c’est une hiérarchie de subsomption, de méronymie ("partOf") ou autre (fonctionnelle). Mais toutes les relations de la hiérarchie du

thé-saurus seront traduites de la même façon. Les auteurs ne proposent pas de pouvoir changer de transformation suivant la branche du thésaurus car ils considèrent que la modélisation d’un thésaurus est similaire dans toutes les branches (toutes les relations hiérarchiques d’un thésaurus ont le même sens). Dans la deuxième famille nous trou-vons les travaux de [Soergel et al., 2004,Villazon-Terrazas et al., 2010,Kless et al., 2012,

Li and Li, 2012, Charlet et al., 2012]. Ces travaux proposent un traitement automatique de la hiérarchie tout en prenant en compte les éventuelles ambiguïtés qu’elle peut re-celer. [Soergel et al., 2004] propose une utilisation de règles de désambiguïsation qui permettent la désambiguïsation des relations hiérarchiques du thésaurus, mais aucune autre source n’est utilisée. [Villazon-Terrazas et al., 2010] propose la mise en place de patrons de transformation pour spécifier comment la transformation va être effectuée. Dans certains patrons définis dans [Villazon-Terrazas et al., 2010], il est proposé de désa-mbiguïser les relations hiérarchiques par l’utilisation d’une source externe sans préciser laquelle ni de quelle façon elle est utilisée. Nous pouvons remarquer que les patrons de transformation proposés dans [Villazon-Terrazas et al., 2010] sont une généralisation des règles de désambiguïsation proposées dans [Soergel et al., 2004]. En effet, les règles de désambiguïsation peuvent être incluses dans un patron de transformation. Mais quand les règles de désambiguïsation ne permettent de désambiguïser que des relations, les patrons de transformation permettent la mise en place de tout un processus de transforma-tion. Les travaux les plus récents [Charlet et al., 2012,Kless et al., 2012,Li and Li, 2012] transforment manuellement la hiérarchie des thésaurus. Il est intéressant de noter que [Hahn, 2003, Kless et al., 2012] sont les seuls auteurs qui utilisent des thésaurus dans lesquels sont définis plusieurs types de relations hiérarchiques (de subsomption, de méro-nymie ou autres). Les relations hiérarchiques dans ces thésaurus sont déjà désambiguïsées, ce qui facilite leur transformation. Par rapport à la validation de la hiérarchie de l’ontolo-gie, nous pouvons remarquer que [Charlet et al., 2012] applique toujours une validation par patrons structurels et [Chrisment et al., 2008] une validation manuelle. [Hahn, 2003] utilise un moteur d’inférences pour détecter les incohérences à corriger. Tous les autres auteurs ne mentionnent pas de validation particulière.

Nous pouvons déduire de cette étude que l’utilisation des relations hiérarchiques reste une problématique majeure. En effet, la plupart des travaux utilisent une transformation simple (la hiérarchie transformée directement en "subClassOf"). Les seuls travaux mettant

Util. Trait. Désamb. Val.

(Wielinga et al., 2001) non non non non

(Hahn, 2003) oui Auto. Man. non

(Van Assem et al., 2004) non non non non

(Soergel et al., 2004) oui Auto. Patrons de transfor-mations

non

(Hepp et De Bruijn, 2007) non non non non

(Chrisment et al., 2008) oui Semi-auto.

Corpus Man.

(Villazón-Terrazas et al., 2010) oui Auto. Source externe non

(Li et Li, 2012) oui Man. Man. non

(Kless et al., 2012) oui Man. Man. non

(Charlet et al., 2012) oui Man. Man. Auto.

Table 10 – Utilisation des associations

en place une méthode complexe sont ceux présentés dans [Soergel et al., 2004] qui pro-posent de définir des règles de désambiguïsation ou [Villazon-Terrazas et al., 2010] qui propose une désambiguïsation par l’utilisation de patrons de transformation et encourage l’utilisation d’une source externe. Pour nos travaux, une transformation directe n’est pas envisageable puisque nous souhaitons une représentation correcte du domaine. L’utilisa-tion de patrons de transformaL’utilisa-tion peut permettre de pallier ce problème. Néanmoins, un patron générique pour tout un thésaurus semble complexe à obtenir. De plus, une sous-partie du thésaurus peut être suffisante pour répondre aux besoins de la base de connaissances souhaitée. Il serait alors intéressant de pouvoir filtrer les éléments à trans-former. Cette méthode peut pourtant introduire un certain nombre d’erreurs en raison de l’automatisation du processus. Il faut donc envisager une validation des désambiguïsations effectuées.