• Aucun résultat trouvé

3.4 Evaluation exp´ ´ erimentale

3.4.3 R´ esultats exp´ erimentaux

Les figures 3.5 et 3.6 montrent respectivement le temps d’ex´ecution et le nombre de sous-requˆetes ex´ecut´ees par chaque algorithme pour chaque requˆete du banc d’essai. Ces graphiques sont affich´es en ´echelle algorithmique pour plus de lisibilit´e.

Cette exp´erimentation montre les gains apport´es par notre algorithme αLBA par rapport `a la m´ethode de base DFS. Notre algorithme ex´ecute moins de requˆetes pour trouver les αMFS et les αXSS. Par cons´equent, il pr´esente des temps d’ex´ecutions inf´erieurs, ce qui correspond `a une diminution cons´equente par rapport `a DFS lorsque la taille de la requˆete augmente. Par exemple, DFS a besoin de 4 094 requˆetes pour trouver les αMFS et les αXSS de la requˆete Q6, alors que notre algorithme effectue ce calcul en ex´ecutant 88 requˆetes.

Un algorithme qui ´evalue toutes les sous-requˆetes tel que DFS, peut ˆetre utilis´e pour les requˆetes contenant seulement quelques partons de triplets. Pour des requˆetes plus grandes, le nombre de sous-requˆetes augmente de mani`ere exponentielle et, par cons´equent, les performances de DFS diminuent rapidement et le temps d’ex´ecution devient r´edhibitoire. Dans ce cas, l’ex-ploration intelligente des sous-requˆetes fournie par notre algorithme αLBA est nettement plus efficace. Par exemple le temps d’ex´ecution de DFS pour la requˆete Q7 d´epasse le temps d’ex´ e-cution maximal3, car DFS est amen´e `a ex´ecuter les 32 766 sous-requˆetes de Q7.

Nous remarquons que les temps d’ex´ecution de LBA ne sont pas proportionnels `a la taille des requˆetes, de mˆeme pour DFS. Ceci s’explique par la nature des sous-requˆetes ex´ecut´ees par ces algorithmes. Dans le cas des sous-requˆete en forme de chaˆıne, la suppression de patrons de triplets peut mener `a des produits cart´esiens. En cons´equence, les temps d’ex´ecution sont plus ´

elev´ee que ceux d’une requˆete plus grande mais uniquement bas´ee sur des jointures.

3.5 Conclusion

Dans ce chapitre nous avons pr´esent´e notre premi`ere contribution, `a savoir, l’introduction des αMFS et αXSS. Nous avons d´efini les conditions pour lesquelles l’algorithme LBA de Fokou et al. [FJHB17] peut ˆetre directement adapt´e pour trouver les αMFS et αXSS d’une requˆete

3. not´e TL (time limitation), c’est `a dire que l’algorithme a d´epass´e le temps d’ex´ecution maximal que nous avons fix´e, `a savoir 12 heures.

approche αLBA est meilleure que l’approche de base DFS. Cependant, ceci ne permet pas de savoir ce qui se passerait si l’utilisateur choisissait de diminuer le degr´e de confiance attendu. Aussi, nous ´etudions ensuite la possibilit´e de sugg´erer `a l’utilisateur des requˆetes relax´ees avec des seuils de confiance inf´erieurs au seuil α donn´e.

Ainsi, nous nous int´eressons dans le chapitre suivant au probl`eme de l’identification des

αMFS et αXSS pour un ensemble de seuils α. En plus des causes d’´echec bas´ees sur les patrons de triplets, les retours sur des seuils multiples peuvent permettre `a l’utilisateur de r´e´evaluer le seuil de confiance associ´e `a sa requˆete.

Ce type de relaxation n´ecessite le calcul des αMFS et αXSS pour diff´erents seuils α. Une solution na¨ıve consisterait `a utiliser l’algorithme de calcul des αMFS et αXSS pour chaque seuil

α. Cependant, nous avons identifi´e que les αMFS et αXSS pour un α donn´e peuvent permettre de d´eduire des αMFS et αXSS pour un seuil sup´erieur ou inf´erieur. Ainsi, en fonction de l’ordre dans lequel les valeurs α sont consid´er´ees, trois approches sont propos´ees : ascendante, descendante et hybride.

Chapitre 4

ecouverte de αMFS et αXSS

multi-seuils pour le probl`eme des

r´eponses vides

Sommaire

4.1 Introduction . . . . 73 4.2 Motivation de la probl´ematique . . . . 73 4.3 Approche ascendante . . . . 75 4.3.1 Algorithme . . . . 76 4.3.2 Illustration de l’approche ascendante . . . . 76 4.4 Approche descendante . . . . 79 4.4.1 Algorithme . . . . 79 4.4.2 Illustration de l’approche descendante . . . . 79 4.5 Approche hybride . . . . 80 4.5.1 Algorithme . . . . 80 4.5.2 Illustration de l’approche hybride . . . . 81 4.6 Analyse de la complexit´e des algorithmes propos´es . . . . 82 4.6.1 Approche de base NLBA . . . . 82 4.6.2 Approche ascendante . . . . 82 4.6.3 Approche descendante . . . . 84 4.6.4 Approche hybride . . . . 85 4.7 Evaluation exp´´ erimentale . . . . 85 4.7.1 Comparaison de performance des algorithmes . . . . 87 4.7.2 Passage `a l’´echelle . . . . 88 4.7.3 Evolution du nombre de seuils´ . . . . 89 4.7.4 Performances des algorithmes avec la technique des graphes nomm´es . . 90 4.7.5 Performances des algorithmes avec la la technique de r´eification . . . . . 91 4.8 Conclusion . . . . 93

4.1. INTRODUCTION

4.1 Introduction

Lorsqu’un utilisateur interroge une base de connaissances incertaine, celui-ci s’attend `a ob-tenir des r´esultats de qualit´e, c’est `a dire des r´esultats dont le degr´e de confiance est sup´erieur `

a un seuil donn´e, not´e α. Cependant, la structure et le contenu d’une base de connaissances ne sont que rarement connus au pr´ealable, l’utilisateur peut donc ˆetre confront´e `a un probl`eme de r´eponse vide, o`u aucun r´esultat n’est retourn´e, ou bien seuls des r´esultats avec un degr´e de confiance inf´erieur au seuil α renseign´e. Au lieu de renvoyer uniquement l’ensemble vide de r´esultats, nous avons propos´e l’algorithme αLBA dans le chapitre pr´ec´edent. Le syst`eme peut ainsi aider l’utilisateur `a comprendre les raisons de cet ´echec, en lui fournissant un ensemble de sous-requˆetes minimales causant l’´echec pour un degr´e α (αMFS). En plus des informations bas´ees sur les αMFS, d’autres requˆetes, appel´ees MaXimal Succeeding Subqueries (αXSS), sont sugg´er´ees `a l’utilisateur par le syst`eme. Ce sont les sous-requˆetes qui r´eussissent et qui sont constitu´ees d’un nombre maximal de patrons de triplets par rapport `a la requˆete initiale. L’uti-lisateur peut ex´ecuter ces XSS pour trouver des r´eponses alternatives `a sa requˆete initiale en ´

echec.

Dans l’approche αLBA propos´ee dans le chapitre pr´ec´edent, l’utilisateur doit fournir le pa-ram`etre α. Cependant, comme celui-ci peut ne pas avoir une id´ee pr´ecise du degr´e de confiance des informations pr´esentes dans la BC incertaine cible, nous souhaitons lui sugg´erer des requˆetes assouplies, avec des seuils α inf´erieurs au degr´e initial. Ce type de relaxation n´ecessite le cal-cul de αMFS et de αXSS pour un ensemble de seuils α. Pour optimiser le temps de calcal-cul, certaines propri´et´es entre les αMFS et les αXSS correspondant `a diff´erents seuils sont ´etablies et exploit´ees.