Évaluation du score de confiance pour la génération d’une extension

107. http://alignapi.gforge.inria.fr/format.html

Évaluation du score de confiance pour la génération d’une extension

Nous avons présenté dans la section précédente la qualité des candidats générés et

l’impact de la fonction de calcul de la confiance consensuelle sur le filtrage des candidats.

Nous n’avons pas considéré dans ces calculs la génération d’une extension et l’intérêt de

l’utilisation d’une fonction de confiance consensuelle dans un processus de validation des

candidats.

Nous allons présenté ici nos expérimentations concernant la création d’une extension

sur le domaine de la taxonomie des blés. Pour cela nous générons une extension et nous

demandons à un expert de valider chaque candidat sommet contenu dans l’extension. Si

un des candidats sommets de l’extension n’est pas validé par l’expert alors une nouvelle

extension est recherchée en imposant d’inclure tous les candidats déjà validés et en

excluant tous les candidats invalidés. Le processus s’arrête lorsque l’expert a validé tous

les candidats d’une extension. Nous allons montrer qu’un expert a besoin de moins

d’interactions (action de valider ou invalider un candidat) pour trouver l’extension

optimale (extension dont tous les candidats sont validés) lorsque nous prenons en compte

le calcul de confiance des candidats. Cette confiance est utilisée dans la fonction objective

pour trouver une extension mais aussi pour trier les candidats à valider dans une extension.

Ce tri permet de présenter à l’expert en premier les candidats le plus susceptibles d’être

validés. Dans ces expérimentations nous allons considérer uniquement la fonction de

calcultrust

.

La génération d’une extension étant un processus qui prend d’autant plus de temps

qu’il y a d’incompatibilités il ne nous a pas été possible d’effectuer cette évaluation

sur la totalité des candidats sommets générés. Effectivement nous avons générés au

total 212 candidats sommets, avec environ 1500 incompatibilités entre ces candidats. La

génération d’une extension a duré 6h sur une machine standard

et a permis d’obtenir

une extension contenant 17 candidats. Néanmoins ce processus devant être exécuté chaque

fois qu’un candidat n’est pas validé par l’expert, il n’était pas envisageable d’évaluer la

génération d’une extension sur la totalité des candidats sommets générés.

Nous avons fais le choix de ne considérer que les candidats sommets ayant un score

de confiance supérieur à 0.45. De cette manière nous obtenons 100 candidats avec 1150

incompatibilités et une extension est calculée en moins de 3 minutes.

Le tableau 26permet d’observer les résultats obtenus lors de nos expérimentations. La

première ligne considère la génération d’une extension avec comme fonction objective

la maximisation du nombre de candidats. La deuxième ligne présente les résultats en

utilisant la fonction objective maximisant la somme des scores de confiances des candidats

comme présenté dans la section 4.5.4du chapitre III.

Le tableau 26 présente, pour les deux fonctions objectives définies, d’abord le nombre

de candidats dans l’extension maximumext

. Cette extension est la première extension

trouvée par le système, elle représente l’extension qui maximise la fonction objective

sans considération de validation de candidats. En d’autres termes, si nous ne faisions pas

l’étape de validation avec l’expert, c’est cette extension que nous aurions considérée. Ce

Fnct Obj. |ext

| |ext

| Nb interactions

Nb. Cands 10 7 55

Confiance 10 7 25

Table 26 – Résultats des expérimentations sur la recherche d’une extension optimale

tableau présente aussi le nombre de candidats présents dans l’extension optimale ext

.

Cette extension est celle obtenue à la fin du processus de validation avec l’expert. Nous

savons que cette extension contient uniquement des candidats validés par l’expert. Enfin

le tableau présente le nombre d’interactions qui ont été nécessaire à l’expert pour obtenir

l’extension optimale. Nous considérons ici une interaction comme l’action de définir qu’un

candidat est valide ou invalide.

Nous pouvons observer qu’en utilisant les deux fonctions objectives nous obtenons

la même extension maximale, contenant 10 candidats. Nous pouvons remarquer aussi

que l’extension optimale est aussi la même avec 7 candidats. Cette similarité est moins

étonnante puisque ce sont les candidats validés par l’expert. Par contre nous pouvons

voir que l’extension optimale contient 3 candidats de moins que l’extension maximale.

Ceci est due au fait que 3 des candidats de l’extension maximale et tous les candidats

incompatibles à ces candidats n’ont pas été validés par l’expert. Ce qui signifie qu’un

filtre sur le score de confiance et la considération des incompatibilités ne sont pas suffisant

pour garantir des candidats valides. Il est toujours nécessaire de passer par une phase de

validation manuelle par un expert pour s’assurer de la qualité du résultat.

Ce qui nous intéresse particulièrement dans le tableau 26 ce sont les nombres

d’in-teractions qui ont été nécessaire à l’expert pour découvrir l’extension optimale. Nous

considérons ici un ensemble de 100 candidats avant la recherche d’extension. Si nous

avions demandé à un expert de valider ces candidats sans considérer les incompatibilités,

celui-ci aurait eu besoin de 100 interactions pour tous les valider. En considérant les

incompatibilités et une fonction objective maximisant le nombre de candidats dans

l’ex-tension, l’expert n’a eu besoin que de 55 interactions. Ce sont donc 45% des candidats qui

n’ont pas eu besoin d’être validé puisqu’ils sont incompatibles avec les candidats validés.

La phase de validation demandée à l’expert est donc particulièrement simplifiée. Si nous

observons ensuite le nombre d’interactions nécessaire lors d’une utilisation d’une fonction

objective maximisant la somme des scores de confiances, ce nombre d’interactions passe

à 25. En ne validant que 25% des candidats, l’extension optimale a été découverte. Cette

extension étant la même que l’extension obtenue avec une fonction objective maximisant

Table ^{26 – Résultats des expérimentations sur la recherche d’une extension optimale}