Contre-exemples sur la s´ election des ´ equilibres optimaux dans les

4.3 Robustesse de la dynamique stochastique de meilleure r´ eponse aux processus

0 0.1 1 10 100 1000 100 90 70 80 50 60 40 10 30 20

5

Contre-exemples sur la s´ election des ´ equilibres optimaux dans les

4.3 Robustesse de la dynamique stochastique de meilleure r´ eponse aux processus

4.3.3 Contre-exemples sur la s´ election des ´ equilibres optimaux dans les

a µ. Cela est en particulier v´erifi´e si R

est un ensemble d’´equilibres de Nash stricts.

Corollaire 4.12

Soit un processus de r´evision µ tel que pour tout u ∈ U, µ({u}) >0. Si les sommets

récurrents du graphe de meilleure réponse associé au processus de révision asynchrone

sont des ´equilibres de Nash stricts, alors les ´etats stochastiquement stables de l’algorithme

stochastique de meilleure réponse associé à µsont des équilibres de Nash stricts.

Les hypothèses du corollaire sont vérifiées pour un jeu de potentiel de meilleure réponse

qui n’a que des ´equilibres stricts.

4.3.3 Contre-exemples sur la s´election des ´equilibres optimaux dans

les jeux de potentiel

On sait maintenant que les ´etats stochastiquement stables sont n´ecessairement des

´

etats r´ecurrents du graphe de meilleure r´eponse. Dans le cas des jeux de potentiel, peut-on

affirmer, comme c’est le cas pour le théorème 4.3, que ces états maximisent le potentiel ?

Nous allons montrer par des contre-exemples que cela n’est pas vrai pour les processus

de r´evision ind´ependants

, mˆeme si on a un jeu de potentiel exact (premier exemple). Et

cela n’est pas vrai non plus pour des jeux de potentiel pondérés, même si le processus de

r´evision est asynchrone (deuxi`eme exemple).

Cela montre que l’algorithme stochastique de meilleure r´eponse n’est pas robuste au

processus de révision. Aucune garantie de performance dans les systèmes distribués ne peut

ˆ

etre obtenue d`es lors que l’on ne maˆıtrise pas le processus de r´evision.

Processus de révision général dans les jeux de potentiel : Considérons le potentiel d’un

jeu `a 3 joueurs (le troisi`eme joueur choisissant la matrice) suivant

(extrait de [AFN10]) :

Potentiel Matrice 1

10 6 0

6 0 0

0 0 9

Potentiel Matrice 2

0 0 0

0 1 1

0 1 1

Si l’on considère un processus de révision asynchrone, seul l’état dont le potentiel vaut 10

est stochastiquement stable. Si l’on consid`ere un processus ind´ependant, on peut montrer

que le coût minimal d’un arbre de racine l’état de potentiel 10 est 9 alors que celui de l’état

de potentiel 9 vaut 8. Par conséquent, seul le deuxième état est stochastiquement stable. Le

chemin pour aller de l’état 10 à l’état 9 qui donne le coût de l’arbre égal à 8 est, par exemple,

la premi`ere diagonale de la matrice 1

.

Jeu de potentiel pondéré avec processus de révision asynchrone : Considérons le jeu de

potentiel pondéré à deux joueurs suivant

:

Gains

(2,2) (0,0)

(0,0) (10,1)

Potentiel

2 −6

0 4

Espace d’´etat

(a,a) (a,b)

(b,a) (b,b)

8. C’est-à-dire où chaque joueur choisit de réviser sa stratégie à chaque itération avec une probabilité

indépendante des autres. Il s’agit du processus de révision le plus naturel pour modéliser un système

distribué sans contrôleur centralisé.

9. Un jeu qui poss`ede ce potentiel est, par exemple, le jeu o`u les gains des joueurs sont identiques, et

donn´es par la fonction de potentiel.

10. Sur ce petit exemple, il est facile de trouver pour chaque sommet s, le s-arbre de coˆut minimal.

D`es que la taille du jeu augmente, le nombre d’arbres couvrants explose. On peut alors utiliser le crit`ere

proposé à la proposition 3 de [AFN10]. Intuitivement, ce résultat dit qu’un sommet est asymptotiquement

stable si le coût pour sortir de son bassin d’attraction est plus faible que le coût d’y entrer. Ce critère a

l’avantage d’être local et a donc une complexité inférieure à celui de la recherche exhaustive de tous les

arbres couvrants.

11. On peut v´erifier que ce n’est pas un jeu de potentiel exact car la somme des diff´erences de gain sur

les chemins (b, a)→(b, b) et (b, a)→(a, a)→(a, b)→(b, b) devraient alors ˆetre ´egales.

AUX PROCESSUS DE R´EVISION DES STRAT´EGIES

Ce jeu comporte les deux ´equilibres de Nash (a, a) et (b, b), qui ont pour potentiel

respec-tivement la valeur 2 et 4. Le calcul de la distribution stationnaire en fonction de η pour le

processus de r´evision asynchrone montre que seul l’´equilibre (a, a) est stochastiquement

sta-ble alors qu’il ne maximise pas le potentiel. La distribution est trac´ee `a la figure 4.7. Il est

int´eressant de constater la non monotonie de la probabilit´e de choisir le maximum global du

potentiel.

Distribution stationnaire (en %)

(a,a)

(b,b)