Conclusion - Plan d'évaluation de PlanetP

5.2 Plan d'évaluation de PlanetP

5.2.3 Conclusion

D'après son diagramme d'évaluation, l'évaluation de PlanetP se décompose en deux étapes indépendantes. D'un coté, on construit une implémentation centralisée classique du modèle des ltres de Bloom. De l'autre, on évalue le mécanisme de gossiping, ce qu'il nous semble raisonnable de faire à l'aide d'un simulateur.

5.2.3.1 Implémentation centralisée du modèle des ltres de Bloom

Nous proposons donc de construire une implémentation centralisée du modèle des ltres de Bloom. Cela donne un dispositif classique d'évaluation d'un modèle RI. Par contre, le modèle évalué est clustérisé, c'est-à-dire que les ressources sont regroupées dans des clusters - assimilables aux pairs. Il va falloir indexer ces clusters, et la recherche se fera en deux étapes : rechercher des clusters puis rechercher des ressources dans ces clusters.

Dans le cas idéal, on dispose de jeux de données complets. Un jeu de données complet dénit des pairs, auxquels sont attachées des ressources documentaires, et on connaît l'évolution de la distribution des ressources sur les pairs dans le temps. On a par exemple une série de photos du contenu des pairs prises à intervalles de temps réguliers. Pour intégrer l'eet du mécanisme de gossiping dans le processus de Recherche d'In- formation, nous devons dégrader articiellement la table des ltres de Bloom des pairs. Cette dégradation doit être exprimée en termes de rappel et précision, pour permettre de faire ensuite le lien avec les résultats d'évaluation du mécanisme de gossiping. Le résultat qu'on obtient, c'est le comportement qu'on peut espérer obtenir sur un pair du réseau P2P.

Soit un couple (rappel, précision). Le rappel donne la proportion des ltres de Bloom connus en moyenne par un pair du réseau. À partir de notre jeu de données, on peut donc générer un ensemble de tables des ltres de Bloom satisfaisant un certain niveau de rappel, en supprimant des entrées de cette table. Nous pensons qu'on peut simplement supprimer des entrées au hasard. Chaque ensemble de suppressions donne un jeu de données, sur lequel on peut lancer un ensemble de requêtes, et mesurer la qualité du résultat obtenu. En générant un grand nombre de jeux de données à un niveau de rappel donné, on gagne en précision, mais on augmente la complexité et donc la durée de l'expérimentation. Un compromis doit donc être choisi par l'expérimentateur.

La précision décrit le niveau de délité du ltre de Bloom au contenu du pair. Les pertes de précision sont dues au délai nécessaire au gossiping pour propager l'information d'une modication d'un ltre de Bloom ; cette modication est due à un changement du contenu du pair. Pour retranscrire ces délais, il faut, pour la distribution des ressources à l'instant t, modier les ltres de Bloom de certains pairs pour les mettre à la valeur qu'ils avaient à l'instant t − x. Il faut que la moyenne des valeurs de x choisies pour

chaque ltre de Bloom soit égale au taux de précision spécié. Il existe donc beaucoup de possibilités pour créer articiellement une dégradation d'un même taux de précision. Il existe aussi des cas où le jeu de données n'est pas complet. Dans ce cas, il va falloir l'enrichir articiellement. Notez que le but de l'évaluation est d'évaluer le composant sur une plage de valeurs pour chaque paramètre du jeu de données ; dans l'objectif de trouver autour de quelles valeurs on obtient les rapports qualité/coût les plus intéressants. Un jeu de données n'est donc pas satisfaisant. On a besoin d'un ensemble de jeux de données permettant d'obtenir plusieurs valeurs pour chacun des paramètres de jeu de données. Premier manque possible, on n'a pas forcément la donnée de l'évolution de la distribution des ressources sur les pairs dans le temps. Dans ce cas, il va falloir générer articiellement des modications du contenu des pairs. Il y a deux types de modications possibles, ajouter ou supprimer une ressource. Cela peut se simuler en :

 enlevant x1 ressources du calcul du ltre de Bloom. Ces x1 ressources ne sont

donc pas prises en compte dans le calcul du ltre de Bloom, ce qui simule des ajouts de ressources non répercutés sur le ltre de Bloom du pair ;

 enlevant x2 ressources du pair, qui seront quand-même prises en compte dans le

calcul du ltre de Bloom. Cela crée x2 possiblilités qu'un défaut de ressource se

produise lorsque le pair est interrogé ; cela simule des suppressions de ressources ; Il faut ensuite choisir des couples (x1, x2)tels que x1+x2 = x. Il nous semble susant de

choisir les ressources aléatoirement, mais les ensembles de x1 ressources et x2ressources

doivent être disjoints.

Il est possible qu'on n'ait pas la donnée de la distribution des ressources sur les pairs. En Recherche d'Information, notamment, nous n'avons pas connaissance d'un jeu de données dans lequel des utilisateurs diérenciés publient des ressources sur le système. Comme nous l'avons déjà évoqué, même dans le cas où on dispose d'un tel jeu de données, il est intéressant de challenger le comportement du système dans d'autres conditions, donc sur d'autres types de distributions des données sur les pairs. Dans ce cas, il faut créer une distribution articielle des ressources sur les pairs.

Un grand nombre de politiques de distribution des ressources sur les pairs ont été proposées dans la littérature, parmi lesquelles on peut citer une distribution en loi de puissance, une distribution en loi de Zipf ou une distribution Small-World.

Pour nir, quelle que soit la façon dont sont générés les jeux de données, l'évaluation du modèle RI de PlanetP doit rendre deux sorties :

les réponses calculées, qui pourront être comparées aux réponses fournies par l'oracle à l'aide d'une courbe précision/rappel ;

un modèle des ltres de Bloom utilisés, donnant leur taille et leur dynamicité - il est possible qu'un ltre de Bloom soit recalculé moins souvent que la ressource correspondante n'est modiée.

5.2.3.2 Un simulateur pour évaluer le mécanisme de gossiping

D'après le diagramme d'évaluation de PlanetP, notre implémentation du mécanisme de gossiping doit prendre en entrée un modèle de réseau physique. Dans la grande majorité des simulateurs dont nous avons eu connaissance, on abstrait la topologie du réseau physique par ses conséquences sur les communications entre les pairs (gigue, pertes de messages...). Par contre, on évalue les performances du système suivant le nombre de pairs dans le système (échelle) et leur dynamicité. On rencontre des modèles de dynamicité des pairs plus ou moins complexes, allant d'une simple probabilité de déconnexion à une loi d'évolution de la connectivité au cours du temps.

L'implémentation du mécanisme de gossiping prend aussi en entrée un modèle des ltres de Bloom tel que donné en sortie du composant précédent : taille et dynamicité (fréquence des mises à jour).

Enn, nous devons calculer en sortie la qualité des tables de routage, dont nous avons discuté à la section précédente.

5.2.3.3 Réutilisation de résultats

Comme nous l'avons déjà évoqué, à la fois le modèle des ltres de Bloom et le mé- canisme de gossiping ont déjà été beaucoup étudiés. La question qui vient naturellement est donc : peut-on réutiliser des résultats précédents ? .

Coté modèle RI, l'originalité ici tient en ce qu'on donne en sortie de l'évaluation du modèle RI un modèle des ltres de Bloom : leur taille et leur dynamicité. Concernant leur taille, généralement celle-ci est plutôt un paramètre (système) de l'évaluation du modèle des ltres de Bloom : on évalue la qualité du modèle en fonction de la taille de ltres utilisée. Il sut donc de transmettre ce paramètre dans les résultats d'évaluation ; cela ne pose a priori pas de diculté. Concernant leur dynamicité, le problème de la fréquence de mise à jour des ltres de Bloom est orthogonal à celui de leur ecacité. Elle n'est donc généralement pas prise en compte dans l'évaluation du modèle. Mais on peut ré-injecter un modèle de dynamicité des ltres de Bloom a posteriori, avant de transmettre le jeu de données au simulateur du mécanisme de gossiping. Coté évaluation du modèle RI, nous pensons donc que réutiliser des résultats sur le modèle des ltres de Bloom ne pose pas de diculté majeure.

Concernant le mécanisme de gossiping, réutiliser des résultats pré-existants nous semble dicile. En eet, à notre connaissance, l'évaluation de ce mécanisme prend rarement en compte la taille des données partagées. Réutiliser une évaluation précédente risque donc de donner des résultats pauvres, parce qu'elle n'évaluera en fait qu'une seule valeur du paramètre taille des ltres de Bloom . On peut cependant réutiliser des résultats existants et les compléter par une nouvelle étude.

Dans le document Contributions à la modélisation, évaluation et conception de systèmes de recherche d'information en pair-à-pair (Page 137-140)