R´ esultats exp´ erimentaux - Evaluation exp´ ´ erimentale

3.4 Evaluation exp´ ´ erimentale

3.4.3 R´ esultats exp´ erimentaux

Les figures 3.5 et 3.6 montrent respectivement le temps d’exécution et le nombre de sous-requêtes exécutées par chaque algorithme pour chaque requête du banc d’essai. Ces graphiques sont affichés en échelle algorithmique pour plus de lisibilité.

Cette expérimentation montre les gains apport´es par notre algorithme αLBA par rapport `a la méthode de base DFS. Notre algorithme exécute moins de requˆetes pour trouver les αMFS et les αXSS. Par cons´equent, il présente des temps d’exécutions inférieurs, ce qui correspond à une diminution conséquente par rapport à DFS lorsque la taille de la requête augmente. Par exemple, DFS a besoin de 4 094 requˆetes pour trouver les αMFS et les αXSS de la requˆete Q6, alors que notre algorithme effectue ce calcul en exécutant 88 requêtes.

Un algorithme qui évalue toutes les sous-requêtes tel que DFS, peut être utilisé pour les requêtes contenant seulement quelques partons de triplets. Pour des requêtes plus grandes, le nombre de sous-requêtes augmente de manière exponentielle et, par conséquent, les performances de DFS diminuent rapidement et le temps d’exécution devient rédhibitoire. Dans ce cas, l’ex-ploration intelligente des sous-requˆetes fournie par notre algorithme αLBA est nettement plus efficace. Par exemple le temps d’exécution de DFS pour la requête Q7 dépasse le temps d’ex´ e-cution maximal³, car DFS est amené à exécuter les 32 766 sous-requêtes de Q7.

Nous remarquons que les temps d’exécution de LBA ne sont pas proportionnels à la taille des requêtes, de même pour DFS. Ceci s’explique par la nature des sous-requêtes exécutées par ces algorithmes. Dans le cas des sous-requête en forme de chaˆıne, la suppression de patrons de triplets peut mener à des produits cartésiens. En conséquence, les temps d’exécution sont plus ´

elevée que ceux d’une requête plus grande mais uniquement basée sur des jointures.

3.5 Conclusion

Dans ce chapitre nous avons présenté notre première contribution, à savoir, l’introduction des αMFS et αXSS. Nous avons d´efini les conditions pour lesquelles l’algorithme LBA de Fokou et al. [FJHB17] peut être directement adapt´e pour trouver les αMFS et αXSS d’une requˆete

3. noté TL (time limitation), c’est à dire que l’algorithme a dépassé le temps d’exécution maximal que nous avons fixé, à savoir 12 heures.

approche αLBA est meilleure que l’approche de base DFS. Cependant, ceci ne permet pas de savoir ce qui se passerait si l’utilisateur choisissait de diminuer le degré de confiance attendu. Aussi, nous étudions ensuite la possibilité de suggérer à l’utilisateur des requêtes relaxées avec des seuils de confiance inf´erieurs au seuil α donn´e.

Ainsi, nous nous int´eressons dans le chapitre suivant au probl`eme de l’identification des

αMFS et αXSS pour un ensemble de seuils α. En plus des causes d’´echec basées sur les patrons de triplets, les retours sur des seuils multiples peuvent permettre à l’utilisateur de réévaluer le seuil de confiance associé à sa requête.

Ce type de relaxation n´ecessite le calcul des αMFS et αXSS pour diff´erents seuils α. Une solution na¨ıve consisterait `a utiliser l’algorithme de calcul des αMFS et αXSS pour chaque seuil

α. Cependant, nous avons identifié que les αMFS et αXSS pour un α donn´e peuvent permettre de d´eduire des αMFS et αXSS pour un seuil sup´erieur ou inférieur. Ainsi, en fonction de l’ordre dans lequel les valeurs α sont consid´erées, trois approches sont proposées : ascendante, descendante et hybride.

Chapitre 4

D´ecouverte de αMFS et αXSS

multi-seuils pour le probl`eme des

r´eponses vides

Sommaire

4.1 Introduction . . . . 73 4.2 Motivation de la problématique . . . . 73 4.3 Approche ascendante . . . . 75 4.3.1 Algorithme . . . . 76 4.3.2 Illustration de l’approche ascendante . . . . 76 4.4 Approche descendante . . . . 79 4.4.1 Algorithme . . . . 79 4.4.2 Illustration de l’approche descendante . . . . 79 4.5 Approche hybride . . . . 80 4.5.1 Algorithme . . . . 80 4.5.2 Illustration de l’approche hybride . . . . 81 4.6 Analyse de la complexité des algorithmes proposés . . . . 82 4.6.1 Approche de base NLBA . . . . 82 4.6.2 Approche ascendante . . . . 82 4.6.3 Approche descendante . . . . 84 4.6.4 Approche hybride . . . . 85 4.7 Evaluation exp´^´ erimentale . . . . 85 4.7.1 Comparaison de performance des algorithmes . . . . 87 4.7.2 Passage à l’échelle . . . . 88 4.7.3 Evolution du nombre de seuils^´ . . . . 89 4.7.4 Performances des algorithmes avec la technique des graphes nommés . . 90 4.7.5 Performances des algorithmes avec la la technique de réification . . . . . 91 4.8 Conclusion . . . . 93

4.1. INTRODUCTION

4.1 Introduction

Lorsqu’un utilisateur interroge une base de connaissances incertaine, celui-ci s’attend à ob-tenir des résultats de qualité, c’est à dire des résultats dont le degré de confiance est supérieur `

a un seuil donné, not´e α. Cependant, la structure et le contenu d’une base de connaissances ne sont que rarement connus au préalable, l’utilisateur peut donc être confronté à un problème de réponse vide, où aucun résultat n’est retourné, ou bien seuls des résultats avec un degré de confiance inf´erieur au seuil α renseign´e. Au lieu de renvoyer uniquement l’ensemble vide de résultats, nous avons propos´e l’algorithme αLBA dans le chapitre pr´ecédent. Le système peut ainsi aider l’utilisateur à comprendre les raisons de cet échec, en lui fournissant un ensemble de sous-requêtes minimales causant l’échec pour un degr´e α (αMFS). En plus des informations bas´ees sur les αMFS, d’autres requˆetes, appel´ees MaXimal Succeeding Subqueries (αXSS), sont suggérées à l’utilisateur par le système. Ce sont les sous-requêtes qui réussissent et qui sont constituées d’un nombre maximal de patrons de triplets par rapport à la requête initiale. L’uti-lisateur peut exécuter ces XSS pour trouver des réponses alternatives à sa requête initiale en ´

echec.

Dans l’approche αLBA propos´ee dans le chapitre précédent, l’utilisateur doit fournir le pa-ram`etre α. Cependant, comme celui-ci peut ne pas avoir une id´ee précise du degré de confiance des informations présentes dans la BC incertaine cible, nous souhaitons lui suggérer des requêtes assouplies, avec des seuils α inf´erieurs au degré initial. Ce type de relaxation nécessite le cal-cul de αMFS et de αXSS pour un ensemble de seuils α. Pour optimiser le temps de calcal-cul, certaines propriét´es entre les αMFS et les αXSS correspondant `a différents seuils sont établies et exploitées.

Dans le document Gestion et exploitation de larges bases de connaissances en présence de données incomplètes et incertaines (Page 70-74)