• Aucun résultat trouvé

Convergence dans les jeux de potentiel

4.3 Robustesse de la dynamique stochastique de meilleure r´ eponse aux processus

5.1.4 Convergence dans les jeux de potentiel

1

0 1

0

y

x

Figure 5.3 – Trajectoires de la dynamique de r´eplication dans le jeu (5.11) sans ´equilibre

de Nash en strat´egie pure : les trajectoires sont des orbites.

5.1.4 Convergence dans les jeux de potentiel

Rappelons que l’extension mixte d’un jeu fini est un jeu de potentiel s’il existe une

fonction F : ×

u∈U

R

nu

R de classeC

1

telle que :

∀x∈∆(S),∀u∈ U,∇F

|Hu

(x) =∇f

|Hu

(x).

Dans ce cas, la dynamique de meilleure r´eponse (5.7) s’exprime en fonction de la fonction

de potentiel par :

Si l’on note G(x) la matrice diagonale par bloc, o`u les blocs sont les matrices Gu(x),

cela se r´e´ecrit de fa¸con compacte :

˙

x=∇

G

F

|H

(x). (5.12)

Il est imm´ediat de voir que la fonctionGd´efinie de cette mani`ere v´erifie les conditions du

th´eor`eme5.2o`u l’on prendO = ×

u∈U

O

u

etH= ×

u∈U

H

u

. En particulier, par la proposition5.3,

la fonction de potentiel F est strictement croissante le long des trajectoires, en dehors

des points stationnaires. Comme F est born´ee sur ∆(S), sa valeur converge pour toute

trajectoire de la dynamique de meilleure r´eponse (`a l’image du potentiel dans l’algorithme

de meilleure r´eponse des jeux finis). De plus,F est une fonction de Lyapunov et donc, si un

point appartient `a un ensembleω-limite d’une trajectoire, alors c’est un point stationnaire

(cela n’est pas vrai en g´en´eral, par exemple dans le jeu (5.11) dans lequel chaque point

appartient `a un cycle ω-limite).

Un ensemble E ⊆∆(S) est appel´e un strict maximum local deF si :

– E est connexe,

– tout point de E est un maximum local pour F (pas n´ecessairement strict),

– il existe un voisinageV deE

11

tel que F(x)> F(y) pour touty∈ V\E et toutx∈ E.

Il est clair que F est constante sur E, et comme F est continue, E est compact. Ici, la

fonction de potentiel F est multi-affine, ce qui implique que E est une face de ∆(S). En

effet, siF est une fonction de (x

1

. . . x

n

), et si l’on fixe toutes les variables sauf une, disons

x

1

, la fonction x

1

∈[0,1]7→F(x

1

. . . x

n

) est affine. Par cons´equent, elle est maximale soit

pour x

1

= 0, soit pour x

1

= 1, soit pour tout x

1

dans [0,1] ; en r´esum´e elle n’est jamais

maximale uniquement pour une valeur strictement comprise entre 0 et 1. Comme F est

une fonction de Lyapunov sur le voisinage de la face E, on a directement :

Proposition 5.12

Les ensembles asymptotiquement stables de la dynamique de meilleure r´eponse dans

un jeu de potentiel sont ∆(S) et ses faces qui sont des stricts maximums locaux de la

fonction de potentiel.

On retrouve ainsi (mais par des arguments diff´erents) le r´esultat du corollaire 5.11 qui

affirme que les seuls points asymptotiquement stables sont les ´equilibres de Nash stricts.

En effet, d’apr`es la proposition pr´ec´edente, un point est asymptotiquement stable si c’est

une face, donc si c’est une strat´egie pure, et s’il maximise localement, et strictement, le

potentiel. Ce dernier point implique que le point est un ´equilibre de Nash strict.

La fonction de potentiel garantit que tout point d’un ensemble asymptotiquement stable

est un ´equilibre de Nash et qu’un tel ensemble existe. Finalement, si la dynamique de

meilleure r´eponse converge vers un ensemble asymptotiquement stable, alors elle converge

vers un ensemble d’´equilibres de Nash. Ce r´esultat est proche de celui qu’on obtient dans

le cas discret, o`u l’algorithme de meilleure r´eponse converge presque sˆurement vers un

ensemble d’´equilibres de Nash. Cependant, il existe des trajectoires de la dynamique qui

ne convergent pas vers un ensemble asymptotiquement stable.

11. Notons que ce voisinage peut ˆetreElui-mˆeme siE= ∆(S). Ce cas advient si la fonction de potentiel

est constante sur ∆(S), ce qui traduit le fait que les gains du jeu sont constants pour chaque joueur.

FINIS

Exemple : Consid´erons le jeu de potentiel suivant dont les trajectoires pour la dynamique de

r´eplication sont repr´esent´ees `a la figure5.4 :

Gains

(1,1) (2,2)

(1,1) (0,0)

(5.13)

Le profil d’actions correspondant aux gains (2,2) est un ´equilibre de Nash strict et donc

un strict maximum local qui est asymptotiquement stable pour la dynamique de meilleure

r´eponse. La face correspondant `a y = 0 a un potentiel constant et contient un ensemble

d’´equilibres de Nash (x∈[0,0.5]) et des trajectoires convergent vers cet ensemble. Cependant

cet ensemble n’est pas un strict maximum local et n’est donc pas asymptotiquement stable.

1

0 1

0

x

y

Figure 5.4 – Trajectoires de la dynamique de r´eplication dans le jeu de potentiel. Le seul

point asymptotiquement stable est le sommet (1,1).

Par la suite, nous aurons besoin d’une notion d’instabilit´e plus forte que l’instabilit´e

au sens de Lyapunov. En effet, bien que les points `a l’int´erieur du domaine ne soient pas

des attracteurs, il n’existe pas n´ecessairement une direction d’instabilit´e, ou autrement

dit, ils ne sont pas lin´eairement instables. Un point est lin´eairement instable si la matrice

jacobienne de la dynamique en ce point admet une valeur propre de partie r´eelle strictement

positive.

Pour la dynamique de meilleure r´eponse, on voit que, en un ´equilibre de Nash mixte,

∂x˙

u,a

jacobienne en ce point est nulle, et donc ´egalement la somme des valeurs propres. Au final,

un ´equilibre de Nash dans l’int´erieur du domaine n’est ´eventuellement pas lin´eairement

instable si toutes les valeurs propres ont une partie r´eelle nulle. Cela arrive si la dynamique

est identiquement nulle, mais dans ce cas, tous les points sont stationnaires. Cela arrive

´

egalement dans le jeu `a 3 joueurs dont la fonction de potentiel est donn´ee par :

Potentiel

1 0

0 1

0 1

1 0

La strat´egie mixte (1/2,1/2,1/2) est un ´equilibre de Nash. En ce point, la matrice

jacobi-enne de la dynamique est nulle.