4.3 Robustesse de la dynamique stochastique de meilleure r´ eponse aux processus
5.1.4 Convergence dans les jeux de potentiel
1
0 1
0
y
x
Figure 5.3 – Trajectoires de la dynamique de r´eplication dans le jeu (5.11) sans ´equilibre
de Nash en strat´egie pure : les trajectoires sont des orbites.
5.1.4 Convergence dans les jeux de potentiel
Rappelons que l’extension mixte d’un jeu fini est un jeu de potentiel s’il existe une
fonction F : ×
u∈U
R
nu→R de classeC
1telle que :
∀x∈∆(S),∀u∈ U,∇F
|Hu(x) =∇f
|Hu(x).
Dans ce cas, la dynamique de meilleure r´eponse (5.7) s’exprime en fonction de la fonction
de potentiel par :
Si l’on note G(x) la matrice diagonale par bloc, o`u les blocs sont les matrices Gu(x),
cela se r´e´ecrit de fa¸con compacte :
˙
x=∇
GF
|H(x). (5.12)
Il est imm´ediat de voir que la fonctionGd´efinie de cette mani`ere v´erifie les conditions du
th´eor`eme5.2o`u l’on prendO = ×
u∈U
O
uetH= ×
u∈U
H
u. En particulier, par la proposition5.3,
la fonction de potentiel F est strictement croissante le long des trajectoires, en dehors
des points stationnaires. Comme F est born´ee sur ∆(S), sa valeur converge pour toute
trajectoire de la dynamique de meilleure r´eponse (`a l’image du potentiel dans l’algorithme
de meilleure r´eponse des jeux finis). De plus,F est une fonction de Lyapunov et donc, si un
point appartient `a un ensembleω-limite d’une trajectoire, alors c’est un point stationnaire
(cela n’est pas vrai en g´en´eral, par exemple dans le jeu (5.11) dans lequel chaque point
appartient `a un cycle ω-limite).
Un ensemble E ⊆∆(S) est appel´e un strict maximum local deF si :
– E est connexe,
– tout point de E est un maximum local pour F (pas n´ecessairement strict),
– il existe un voisinageV deE
11tel que F(x)> F(y) pour touty∈ V\E et toutx∈ E.
Il est clair que F est constante sur E, et comme F est continue, E est compact. Ici, la
fonction de potentiel F est multi-affine, ce qui implique que E est une face de ∆(S). En
effet, siF est une fonction de (x
1. . . x
n), et si l’on fixe toutes les variables sauf une, disons
x
1, la fonction x
1∈[0,1]7→F(x
1. . . x
n) est affine. Par cons´equent, elle est maximale soit
pour x
1= 0, soit pour x
1= 1, soit pour tout x
1dans [0,1] ; en r´esum´e elle n’est jamais
maximale uniquement pour une valeur strictement comprise entre 0 et 1. Comme F est
une fonction de Lyapunov sur le voisinage de la face E, on a directement :
Proposition 5.12
Les ensembles asymptotiquement stables de la dynamique de meilleure r´eponse dans
un jeu de potentiel sont ∆(S) et ses faces qui sont des stricts maximums locaux de la
fonction de potentiel.
On retrouve ainsi (mais par des arguments diff´erents) le r´esultat du corollaire 5.11 qui
affirme que les seuls points asymptotiquement stables sont les ´equilibres de Nash stricts.
En effet, d’apr`es la proposition pr´ec´edente, un point est asymptotiquement stable si c’est
une face, donc si c’est une strat´egie pure, et s’il maximise localement, et strictement, le
potentiel. Ce dernier point implique que le point est un ´equilibre de Nash strict.
La fonction de potentiel garantit que tout point d’un ensemble asymptotiquement stable
est un ´equilibre de Nash et qu’un tel ensemble existe. Finalement, si la dynamique de
meilleure r´eponse converge vers un ensemble asymptotiquement stable, alors elle converge
vers un ensemble d’´equilibres de Nash. Ce r´esultat est proche de celui qu’on obtient dans
le cas discret, o`u l’algorithme de meilleure r´eponse converge presque sˆurement vers un
ensemble d’´equilibres de Nash. Cependant, il existe des trajectoires de la dynamique qui
ne convergent pas vers un ensemble asymptotiquement stable.
11. Notons que ce voisinage peut ˆetreElui-mˆeme siE= ∆(S). Ce cas advient si la fonction de potentiel
est constante sur ∆(S), ce qui traduit le fait que les gains du jeu sont constants pour chaque joueur.
FINIS
Exemple : Consid´erons le jeu de potentiel suivant dont les trajectoires pour la dynamique de
r´eplication sont repr´esent´ees `a la figure5.4 :
Gains
(1,1) (2,2)
(1,1) (0,0)
(5.13)
Le profil d’actions correspondant aux gains (2,2) est un ´equilibre de Nash strict et donc
un strict maximum local qui est asymptotiquement stable pour la dynamique de meilleure
r´eponse. La face correspondant `a y = 0 a un potentiel constant et contient un ensemble
d’´equilibres de Nash (x∈[0,0.5]) et des trajectoires convergent vers cet ensemble. Cependant
cet ensemble n’est pas un strict maximum local et n’est donc pas asymptotiquement stable.
1
0 1
0
x
y
Figure 5.4 – Trajectoires de la dynamique de r´eplication dans le jeu de potentiel. Le seul
point asymptotiquement stable est le sommet (1,1).
Par la suite, nous aurons besoin d’une notion d’instabilit´e plus forte que l’instabilit´e
au sens de Lyapunov. En effet, bien que les points `a l’int´erieur du domaine ne soient pas
des attracteurs, il n’existe pas n´ecessairement une direction d’instabilit´e, ou autrement
dit, ils ne sont pas lin´eairement instables. Un point est lin´eairement instable si la matrice
jacobienne de la dynamique en ce point admet une valeur propre de partie r´eelle strictement
positive.
Pour la dynamique de meilleure r´eponse, on voit que, en un ´equilibre de Nash mixte,
∂x˙
u,ajacobienne en ce point est nulle, et donc ´egalement la somme des valeurs propres. Au final,
un ´equilibre de Nash dans l’int´erieur du domaine n’est ´eventuellement pas lin´eairement
instable si toutes les valeurs propres ont une partie r´eelle nulle. Cela arrive si la dynamique
est identiquement nulle, mais dans ce cas, tous les points sont stationnaires. Cela arrive
´
egalement dans le jeu `a 3 joueurs dont la fonction de potentiel est donn´ee par :
Potentiel
1 0
0 1
0 1
1 0
La strat´egie mixte (1/2,1/2,1/2) est un ´equilibre de Nash. En ce point, la matrice
jacobi-enne de la dynamique est nulle.
Dans le document
Auto-optimisation des réseaux sans fil. Une approche par la théorie des jeux
(Page 118-121)