• Aucun résultat trouvé

2.5 Bilan sur les sources agricoles

1.1.3 Utilisation de la hiérarchie

Une fois les classes de l’ontologie extraites, les relations hiérarchiques du thésaurus

peuvent également être utilisées pour enrichir la transformation. Les relations "narrower"

et "broader" témoignent d’une spécialisation ou d’une généralisation thématique et

non d’une relation de subsomption entre classes. Cette distinction induit certaines

confusions puisque, comme le montre [Soergel et al., 2004], les relations hiérarchiques

d’un thésaurus sont parfois utilisées pour représenter des relations de composition (on

Sél. Trait. Types Désambiguïsation Val. (Wielinga et al., 2001) non Auto. HsCO non non (Hahn, 2003) oui Auto. HsCO - HC - HF non Auto. (Van Assem et al., 2004) non Auto. HsCO - HC - HF non non (Soergel et al., 2004) non Auto. HsCO - HC - HF Patrons de

transfor-mations

non (Hepp et De Bruijn, 2007) non Auto. HsCO non non (Chrisment et al., 2008) non Auto. HsCO non Man. (Villazón-Terrazas et al.,

2010)

non Auto. HsCO - HC - HF Source externe (non définie)

non (Li et Li, 2012) non Auto. HsCO - HC - HF non non (Kless et al., 2012) oui Man. HsCO - HC - HF Man. Man. (Charlet et al., 2012) oui Man. HsCO - HC - HF Man. Auto.

Table 9 – Utilisation de la hiérarchie

trouve par exemple dans AGROVOC "Cow, narrower, Cow Milk"

58

). La transformation

d’une relation hiérarchique en relation "subClassOf" ne peut donc pas être systématique.

Pour étudier le traitement de ces relations hiérarchiques, nous proposons différents

critères. Le résultat de notre analyse est présenté dans le tableau 2. Les critères liés au

traitement de la hiérarchie du thésaurus sont :

Sélection (Sél.) indique si la méthode filtre les branches de la hiérarchie ;

Traitement (Trai.)précise le niveau d’automatisation du traitement (automatique

ou manuel) ;

Types énumère les types de relations possibles dans l’ontologie (Hiérarchie

"sub-ClassOf" -> HsCO, Hiérarchie Compositionnelle -> HC, Hiérarchie Fonctionnelle

-> HF) ;

Désambiguïsation précise si la méthode applique un processus de désambiguïsation

pour déterminer la nature de la relation dans l’ontologie et, si oui, quelle technique

est utilisée ;

Validation (Val.) indique si la méthode applique un processus de validation du

résultat et, si oui, s’il s’agit d’une validation automatique ou manuelle.

Le filtrage des branches de la hiérarchie peut permettre le traitement spécifique de

la hiérarchie du thésaurus suivant une branche spécifique du thésaurus. Un thésaurus

pouvant couvrir un domaine large, cette hiérarchie peut donc être utilisée pour représenter

différentes relations suivant les branches. La hiérarchie fonctionnelle représente les relations

de généralisation et de spécialisation thématiques spécifiques au domaine.

Il apparaît dans le tableau 9que seulement [Charlet et al., 2012][Hahn, 2003]

[Kless et al., 2012] effectuent une sélection de la partie du thésaurus à traiter. Cet aspect

est particulièrement intéressant puisqu’il permet de ne considérer qu’une sous-partie d’un

thésaurus, l’intégralité d’un thésaurus n’étant pas forcément pertinente pour les besoins

de la transformation. Les méthodes de traitement de la hiérarchie se décomposent en

deux grandes familles :

— celles qui transforment toutes les relations hiérarchiques narrower/broader en un

seul type de relation ontologique ;

— celles qui transforment les relations hiérarchiques en plusieurs types de relations

ontologiques.

Dans la première famille, nous trouvons les travaux de [Hepp and De Bruijn, 2007,

Chrisment et al., 2008,Wielinga et al., 2001,Van Assem et al., 2004]. Ils proposent un

traitement automatique de la hiérarchie en la transformant directement en hiérarchie

de subsomption ("subClassOf"). [Chrisment et al., 2008] précise que les relations

nar-rower/broader du thésaurus considéré correspondent particulièrement à des relations

"subClassOf". [Van Assem et al., 2004] propose de choisir la transformation de toute

la hiérarchie et de déterminer si c’est une hiérarchie de subsomption, de méronymie

("partOf") ou autre (fonctionnelle). Mais toutes les relations de la hiérarchie du

thé-saurus seront traduites de la même façon. Les auteurs ne proposent pas de pouvoir

changer de transformation suivant la branche du thésaurus car ils considèrent que la

modélisation d’un thésaurus est similaire dans toutes les branches (toutes les relations

hiérarchiques d’un thésaurus ont le même sens). Dans la deuxième famille nous

trou-vons les travaux de [Soergel et al., 2004,Villazon-Terrazas et al., 2010,Kless et al., 2012,

Li and Li, 2012, Charlet et al., 2012]. Ces travaux proposent un traitement automatique

de la hiérarchie tout en prenant en compte les éventuelles ambiguïtés qu’elle peut

re-celer. [Soergel et al., 2004] propose une utilisation de règles de désambiguïsation qui

permettent la désambiguïsation des relations hiérarchiques du thésaurus, mais aucune

autre source n’est utilisée. [Villazon-Terrazas et al., 2010] propose la mise en place de

patrons de transformation pour spécifier comment la transformation va être effectuée.

Dans certains patrons définis dans [Villazon-Terrazas et al., 2010], il est proposé de

désa-mbiguïser les relations hiérarchiques par l’utilisation d’une source externe sans préciser

laquelle ni de quelle façon elle est utilisée. Nous pouvons remarquer que les patrons de

transformation proposés dans [Villazon-Terrazas et al., 2010] sont une généralisation des

règles de désambiguïsation proposées dans [Soergel et al., 2004]. En effet, les règles de

désambiguïsation peuvent être incluses dans un patron de transformation. Mais quand

les règles de désambiguïsation ne permettent de désambiguïser que des relations, les

patrons de transformation permettent la mise en place de tout un processus de

transforma-tion. Les travaux les plus récents [Charlet et al., 2012,Kless et al., 2012,Li and Li, 2012]

transforment manuellement la hiérarchie des thésaurus. Il est intéressant de noter que

[Hahn, 2003, Kless et al., 2012] sont les seuls auteurs qui utilisent des thésaurus dans

lesquels sont définis plusieurs types de relations hiérarchiques (de subsomption, de

méro-nymie ou autres). Les relations hiérarchiques dans ces thésaurus sont déjà désambiguïsées,

ce qui facilite leur transformation. Par rapport à la validation de la hiérarchie de

l’ontolo-gie, nous pouvons remarquer que [Charlet et al., 2012] applique toujours une validation

par patrons structurels et [Chrisment et al., 2008] une validation manuelle. [Hahn, 2003]

utilise un moteur d’inférences pour détecter les incohérences à corriger. Tous les autres

auteurs ne mentionnent pas de validation particulière.

Nous pouvons déduire de cette étude que l’utilisation des relations hiérarchiques reste

une problématique majeure. En effet, la plupart des travaux utilisent une transformation

simple (la hiérarchie transformée directement en "subClassOf"). Les seuls travaux mettant

Util. Trait. Désamb. Val. (Wielinga et al., 2001) non non non non (Hahn, 2003) oui Auto. Man. non (Van Assem et al., 2004) non non non non (Soergel et al., 2004) oui Auto. Patrons de

transfor-mations

non (Hepp et De Bruijn, 2007) non non non non (Chrisment et al., 2008) oui

Semi-auto.

Corpus Man. (Villazón-Terrazas et al., 2010) oui Auto. Source externe non (Li et Li, 2012) oui Man. Man. non (Kless et al., 2012) oui Man. Man. non (Charlet et al., 2012) oui Man. Man. Auto.

Table 10 – Utilisation des associations

en place une méthode complexe sont ceux présentés dans [Soergel et al., 2004] qui

pro-posent de définir des règles de désambiguïsation ou [Villazon-Terrazas et al., 2010] qui

propose une désambiguïsation par l’utilisation de patrons de transformation et encourage

l’utilisation d’une source externe. Pour nos travaux, une transformation directe n’est pas

envisageable puisque nous souhaitons une représentation correcte du domaine.

L’utilisa-tion de patrons de transformaL’utilisa-tion peut permettre de pallier ce problème. Néanmoins,

un patron générique pour tout un thésaurus semble complexe à obtenir. De plus, une

sous-partie du thésaurus peut être suffisante pour répondre aux besoins de la base de

connaissances souhaitée. Il serait alors intéressant de pouvoir filtrer les éléments à

trans-former. Cette méthode peut pourtant introduire un certain nombre d’erreurs en raison de

l’automatisation du processus. Il faut donc envisager une validation des désambiguïsations

effectuées.