• Aucun résultat trouvé

Concept de solution Nash Individuel Cœur

Manipulations constructive, constructive constructive,

simples destructive destruction du cœur

Condition de Minimales, Fr´equentes Fr´equentes la rationalit´e rares

Complexit´e de d´ecision N P -complet N P -complet12 N P -complet12

Robustesse du syst`eme × ×

Tableau 9.1 – Robustesse aux manipulations des concepts de solution

sur lesquels se fondent les agents manipulateurs. Nombre de strat´egies de d´efense issues de la litt´erature am`enent alors `a affaiblir certaines de ces propri´et´es.

Dans ce manuscrit, nous avons propos´e de renforcer l’un de ces axiomes des syst`emes de r´eputation, stipulant que le processus de d´ecision des agents doit ˆetre guid´e par les r´esultats d’interaction. Cette strat´egie de d´efense consiste `a utiliser les politiques de s´election de bandits manchots en tant que processus de d´ecision (chapitre 7) et de consid´erer la r´eputation d’un agent comme une estimation de la r´ecompense apport´ee lors d’une future interaction avec ce dernier. Nous avons montr´e empiriquement que l’introduction d’un facteur d’exploration adapt´e `

a la fonction de r´eputation permet de renforcer sa robustesse aux manipulations, ´evalu´ee par une r´eduction du regret des agents et une augmentation du coˆut des manipulations.

Nous avons aussi propos´e de renforcer la robustesse des fonctions de r´eputation aux faux t´emoignages. Pour cela, nous avons propos´e une nouvelle mesure de cr´edibilit´e fond´ee sur la divergence de Kullback-Leibler et l’erreur standard de la moyenne (chapitre 8). Cette mesure de cr´edibilit´e nous permet de consid´erer d’un cˆot´e le gain d’information apport´e par un t´emoignage par rapport aux connaissances des agents et, d’un autre cˆot´e, une incertitude sur ces connais-sances. Nous avons ensuite int´egr´e cette notion de cr´edibilit´e dans des fonctions de filtrage qui ´ecartent de mani`ere efficace les t´emoignages non cr´edibles du calcul de la r´eputation.

Le tableau 9.2 positionne nos propositions selon les crit`eres donn´es par [Hoffman et al., 2009] pour cat´egoriser les strat´egies de d´efense dans les syst`emes de r´eputation.

De mani`ere g´en´erique, l’utilisation de ces deux strat´egies nous permet d’am´eliorer la robus-tesse des fonctions de r´eputation issues de la litt´erature en renfor¸cant leurs propri´et´es fonda-mentales identifi´ees par [Resnick et al., 2000]. L’utilisation d’un facteur d’exploration permet de garantir la propri´et´e d’ouverture du syst`eme tout en r´eduisant les mauvaises interactions. L’utilisation d’une fonction de filtrage s’attaque directement `a l’utilisation de faux t´emoignages en ne prenant pas en compte ces derniers lors du calcul des valeurs de r´eputation.

9.2 Perspectives

Notre travail nous am`ene `a nous poser de nouvelles questions auxquelles il serait int´eressant de r´epondre. Le tableau 9.3 pr´esente nos perspectives selon trois axes identiques pour les deux types de syst`eme que nous avons consid´er´es : une g´en´eralisation de nos r´esultats afin d’am´eliorer

Chapitre 9. Conclusion et perspectives

Strat´egies de d´efense

C en tral is atio n S tati st iq u e H eu r is tiq u e Re do n d an ce Al ´eato ire C ry p to g r ap h ie Pr eu v e fo r mel le UCB ε-gloutonne ε-´elitiste KL-filtrage k-fautes k-stochocratie

Tableau 9.2 – Classification des strat´egies de d´efense selon les crit`eres de [Hoffman et al., 2009]

Jeux h´edoniques Syst`emes de r´eputation G´en´eralisation un mod`ele de une m´eta-fonction

des r´esultats connaissances incompl`etes de filtrage Articulation des utiliser des fonctions de r´eputation

mod`eles pour construire les profils de pr´ef´erence

Manipuler poser un dilemme fournir de

les manipulateurs du prisonnier faux t´emoignages honnˆetes Tableau 9.3 – Une vision synth´etique de nos perspectives

9.2.1 G´en´eralisation des r´esultats

Connaissances incompl`etes

Dans notre ´etude des jeux h´edoniques, nous avons fait l’hypoth`ese que les agents malhonnˆetes ont une connaissance compl`ete des pr´ef´erence des autres agents. Cette hypoth`ese forte leur permet de d´ecider s’il est rationnel de mettre en œuvre une manipulation. Qu’en est-il lorsque cette hypoth`ese est remise en cause ?

Pour cela, il serait int´eressant de mod´eliser explicitement les connaissances d’un agent ai par un ensemble de tuples haj, aj ,C1,C2i repr´esentant le fait que l’agent ai sait que C1 j C2. L’introduction de cette repr´esentation partielle des connaissances nous am`ene alors `a red´efinir la notion de rationalit´e d’une manipulation. Une intuition consiste `a consid´erer la rationalit´e des manipulations non plus de mani`ere absolue mais selon une probabilit´e de rationalit´e. Dans ce cas, la robustesse d’un jeu h´edonique reposerait sur une caract´erisation des connaissances minimales n´ecessaires pour qu’un agent malhonnˆete puisse d´ecider de la rationalit´e d’une manipulation avec une certaine probabilit´e. Une telle caract´erisation permettrait d’´etudier de mani`ere plus fine la robustesse des concepts de solution comme par exemple la stabilit´e individuelle que nous avons identifi´ee comme sensible aux manipulations sous l’hypoth`ese de connaissances compl`etes. 162

9.2. Perspectives M´eta-fonction de filtrage

Dans le cadre des syst`emes de r´eputation, nous avons montr´e que l’efficacit´e des fonctions de filtrage n’est pas la mˆeme selon le contexte. Par exemple, le filtrage par k-stochocratie est efficace lors des premiers pas de temps car il permet de compenser le manque d’informations directes. Par contre, apr`es quelques pas de temps, le filtrage par k-fautes permet d’obtenir un meilleur rappel et une meilleure pr´ecision. Il serait alors int´eressant de g´en´eraliser nos fonctions de filtrage en une unique fonction prenant en param`etres un ensemble de t´emoignages, un ensemble d’agents devant juger de la cr´edibilit´e, une mesure de cr´edibilit´e et une r`egle de vote.

Cette m´eta-fonction nous permettrait de capturer les diff´erentes fonctions de filtrage pr´ e-sent´ees dans ce manuscrit comme des instances d’une mˆeme fonction aux param`etres diff´erents. Par exemple, le filtrage par KL-divergence d’un agent ai est la fonction ayant le param´etrage :

– ensemble des t´emoignages : Fi; – ensemble des juges potentiels : {ai} ;

– mesure de cr´edibilit´e : divergence de Kullback-Leibler et erreur standard de la moyenne ; – r`egle de vote : vote majoritaire.

Cette approche permettrait aux agents d’adapter dynamiquement la fonction de filtrage en variant ses param`etres selon le contexte et de consid´erer de nouvelles fonctions de filtrage agr´egeant par exemple du filtrage par k-stochocratie et du filtrage par k-fautes o`u seuls les agents k-cr´edibles peuvent ˆetre s´electionn´es comme juges. De plus, une g´en´eralisation de la fonction de filtrage permettrait une meilleure exploration exp´erimentale de l’espace des fonctions de filtrage et ainsi d´eterminer quels param`etres ont une influence positive et significative sur la robustesse du syst`eme aux manipulations.

9.2.2 Articulation des mod`eles

Dans le contexte des jeux h´edoniques, nous nous sommes limit´e `a un contexte statique qui est le contexte canonique de tels jeux. Il serait alors int´eressant de g´en´eraliser ces r´esultats dans un contexte dynamique de jeux h´edoniques r´ep´et´es. Ceci nous permettrait de faire un lien explicite entre jeux h´edoniques et syst`emes de r´eputation. Nous pourrions consid´erer une succession de jeux h´edoniques o`u les agents mettent `a jour leur profil de pr´ef´erence en fonction du r´esultat des interactions pass´ees entre les membres d’une coalition. L’introduction d’un syst`eme de r´eputation dans ce jeu de coalitions serait alors naturelle. Intuitivement, la r´ep´etition des jeux am`ene une stabilit´e dans les profils de pr´ef´erence de chaque agent. Un changement important dans ces derniers serait alors signe de la mise en œuvre d’une manipulation et pourrait ˆetre rapidement d´etect´e.

L’articulation des jeux h´edoniques et des syst`emes de r´eputation peut ´egalement ˆetre consi-d´er´ee d’un autre point de vue : est-il possible de construire une fonction de r´eputation robuste aux manipulations en utilisant des concepts de solution telle que la stabilit´e au sens de Nash ? Intuitivement, il s’agirait de construire dans le syst`eme d’´echange de service des profils de pr´ e-f´erences en se fondant sur les valeurs de confiance et utiliser comme fonction d’agr´egation un concept de solution plutˆot qu’une fonction de r´eputation. Chaque agent pourrait alors d´ecider avec quel autre agent interagir en fonction de la coalition `a laquelle il appartient. Cependant,

Chapitre 9. Conclusion et perspectives

9.2.3 Manipuler les manipulateurs

Les agents manipulateurs se fondent toujours sur certaines propri´et´es du syst`eme pour construire leurs manipulations. Les agents honnˆetes ne pourraient-ils eux aussi utiliser ces pro-pri´et´es et mettre en œuvre des manipulations honnˆetes afin de perturber les agents manipula-teurs ?

Poser un dilemme du prisonnier

Comme nous avons caract´eris´e les conditions n´ecessaires `a la rationalit´e d’une manipulation, il serait possible de pi´eger un agent manipulateur dans le contexte de jeux h´edoniques r´ep´et´es. Par exemple, un agent honnˆete ou une autorit´e de r´egulation pourrait cr´eer artificiellement un pot de miel, c’est-`a-dire un jeu o`u il serait rationnel de manipuler et de d´etecter ainsi si l’un des participants met en œuvre une manipulation. Sachant cela, un agent manipulateur serait confront´e `a une variante du dilemme du prisonnier : comment d´ecider s’il s’agit effectivement d’un jeu manipulable ou s’il s’agit d’un pot de miel ? La mise en œuvre de cette strat´egie de d´efense pose cependant d’autres questions :

– quel est le coˆut de ce dilemme sur les agents honnˆetes ?

– quelles doivent ˆetre les p´enalit´es `a mettre en œuvre pour que la meilleure strat´egie d’un agent manipulateur lors d’un tel dilemme soit une strat´egie mixte ?

– sans autorit´e de certification, permettre une telle strat´egie ne peut-il pas amener un agent malveillant `a construire lui aussi un pot de miel pour p´enaliser les agents honnˆetes ? Fournir de faux t´emoignages honnˆetes

Certaines manipulations se fondent sur les connaissances des agents manipulateurs pour d´ eci-der quand changer de comportement. Par exemple, un agent manipulateur `a int´erˆet `a se blanchir lorsque sa valeur de r´eputation est trop faible. Il serait alors int´eressant de permettre aux agents honnˆetes de diffuser des faux t´emoignages honnˆetes pour contrecarrer ce type de manipulation. Intuitivement, une diffamation diminue la valeur de r´eputation de sa victime et, s’il s’agit d’un agent manipulateur, cela peut l’inciter `a se blanchir pr´ematur´ement. De mˆeme, il serait pos-sible de pi´eger un agent manipulateur en partageant des informations et en v´erifiant `a l’aide d’un agent Sybil si l’agent soup¸conn´e de malveillance diffuse correctement cette information. Comme pour les jeux de coalitions, quelle serait alors l’influence de ces manipulations honnˆetes sur l’efficacit´e du syst`eme ?

Annexe A

Notations

Dans cette annexes, nous rappelons les notations utilis´ees dans ce manuscrit. L’annexe A.1 pr´esente les notations utilis´ees dans les chapitres 3, 4 et 5. L’annexe A.2 pr´esente les notations utilis´ees dans les chapitres 6, 7 et 8.

A.1 Notations dans les jeux h´edoniques

Notation d’un jeu h´edonique

HG = hN,  ,Pi Un jeu h´edonique ;

N = {a1, . . . an} Ensemble des agents du jeu ; = {1 , . . . n} Ensemble des profils de pr´ef´erence ;

P Protocole de s´election ;

PN Ensemble des structures de coalitions possibles de N ; CaΠi Coalition de l’agent ai dans la structure Π ∈ PN; CN

ai ⊆ 2N Sous-ensemble des coalitions auxquelles l’agent ai appartient.

Concepts de solution

SHG ⊆ PN Structures de coalitions satisfaisant le concept de soluions S ; N SHG ⊆ PN Structures de coalitions stables au sens de Nash ;

ISHG ⊆ PN Structures de coalitions individuellement stables ;

ICSHG⊆ PN Structures de coalitions individuellement contractuellement stables ;

CSHG ⊆ PN Structures de coalitions stables au sens du cœur ; P OHG⊆ PN Structures de coalitions optimales au sens de Pareto.

Annexe A. Notations Manipulations

{am,s1, . . . ,sx} Agent manipulateur et ses x agents Sybil ;

HGM Jeu r´esultant de l’application de la manipulation M sur HG ; M

ai Profil de pr´ef´erence de l’agent ai dans le jeu HGM;

MC,MD,MK Manipulations constructive, destructive et destruction du cœur ; U RHGam ⊆ PN Structures de coalitions dont am est l’unique responsable de la non

stabilit´e ;

f (Π,s,C0) ∈ PN ∪{s} Structure de coalitions construite par l’ajout de l’agent s dans la coalition C0 ∈ Π ∪ {∅} ;

f−10) ∈ PN Structure de coalitions ayant servie `a construire Π0 ∈ PN ∪{s}; cardMC(Π|HG) Nombre de structures de coalitions stables dans le jeu HGMC

construites `a partir de la structure de coalitions Π ∈ PN.