Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

Convergence dans les jeux de potentiel

Dans le document Auto-optimisation des réseaux sans fil. Une approche par la théorie des jeux (Page 118-121)

4.3 Robustesse de la dynamique stochastique de meilleure r´ eponse aux processus

5.1.4 Convergence dans les jeux de potentiel

1

0 1

0

y

x

Figure 5.3 – Trajectoires de la dynamique de r´eplication dans le jeu (5.11) sans ´equilibre

de Nash en strat´egie pure : les trajectoires sont des orbites.

5.1.4 Convergence dans les jeux de potentiel

Rappelons que l’extension mixte d’un jeu fini est un jeu de potentiel s’il existe une

fonction F : ×

u∈U

R

ⁿ^u

→_R de classeC

1

telle que :

∀x∈∆(S),∀u∈ U,∇F

|Hu

(x) =∇f

|Hu

(x).

Dans ce cas, la dynamique de meilleure r´eponse (5.7) s’exprime en fonction de la fonction

de potentiel par :

Si l’on note G(x) la matrice diagonale par bloc, o`u les blocs sont les matrices Gu(x),

cela se r´e´ecrit de fa¸con compacte :

˙

x=∇

_G

F

_|H

(x). (5.12)

Il est immédiat de voir que la fonctionGdéfinie de cette manière vérifie les conditions du

théorème5.2où l’on prendO = ×

u∈U

O

_u

etH= ×

u∈U

H

_u

. En particulier, par la proposition5.3,

la fonction de potentiel F est strictement croissante le long des trajectoires, en dehors

des points stationnaires. Comme F est born´ee sur ∆(S), sa valeur converge pour toute

trajectoire de la dynamique de meilleure r´eponse (`a l’image du potentiel dans l’algorithme

de meilleure r´eponse des jeux finis). De plus,F est une fonction de Lyapunov et donc, si un

point appartient `a un ensembleω-limite d’une trajectoire, alors c’est un point stationnaire

(cela n’est pas vrai en g´en´eral, par exemple dans le jeu (5.11) dans lequel chaque point

appartient `a un cycle ω-limite).

Un ensemble E ⊆∆(S) est appel´e un strict maximum local deF si :

– E est connexe,

– tout point de E est un maximum local pour F (pas n´ecessairement strict),

– il existe un voisinageV deE

11

tel que F(x)> F(y) pour touty∈ V\E et toutx∈ E.

Il est clair que F est constante sur E, et comme F est continue, E est compact. Ici, la

fonction de potentiel F est multi-affine, ce qui implique que E est une face de ∆(S). En

effet, siF est une fonction de (x

₁

. . . x

_n

), et si l’on fixe toutes les variables sauf une, disons

x

₁

, la fonction x

₁

∈[0,1]7→F(x

₁

. . . x

_n

) est affine. Par cons´equent, elle est maximale soit

pour x

₁

= 0, soit pour x

₁

= 1, soit pour tout x

₁

dans [0,1] ; en r´esum´e elle n’est jamais

maximale uniquement pour une valeur strictement comprise entre 0 et 1. Comme F est

une fonction de Lyapunov sur le voisinage de la face E, on a directement :

Proposition 5.12

Les ensembles asymptotiquement stables de la dynamique de meilleure r´eponse dans

un jeu de potentiel sont ∆(S) et ses faces qui sont des stricts maximums locaux de la

fonction de potentiel.

On retrouve ainsi (mais par des arguments diff´erents) le r´esultat du corollaire 5.11 qui

affirme que les seuls points asymptotiquement stables sont les ´equilibres de Nash stricts.

En effet, d’après la proposition précédente, un point est asymptotiquement stable si c’est

une face, donc si c’est une strat´egie pure, et s’il maximise localement, et strictement, le

potentiel. Ce dernier point implique que le point est un ´equilibre de Nash strict.

La fonction de potentiel garantit que tout point d’un ensemble asymptotiquement stable

est un ´equilibre de Nash et qu’un tel ensemble existe. Finalement, si la dynamique de

meilleure r´eponse converge vers un ensemble asymptotiquement stable, alors elle converge

vers un ensemble d’´equilibres de Nash. Ce r´esultat est proche de celui qu’on obtient dans

le cas discret, où l’algorithme de meilleure réponse converge presque sûrement vers un

ensemble d’´equilibres de Nash. Cependant, il existe des trajectoires de la dynamique qui

ne convergent pas vers un ensemble asymptotiquement stable.

11. Notons que ce voisinage peut ˆetreElui-mˆeme siE= ∆(S). Ce cas advient si la fonction de potentiel

est constante sur ∆(S), ce qui traduit le fait que les gains du jeu sont constants pour chaque joueur.

FINIS

Exemple : Consid´erons le jeu de potentiel suivant dont les trajectoires pour la dynamique de

réplication sont représentées à la figure5.4 :

Gains

(1,1) (2,2)

(1,1) (0,0)

(5.13)

Le profil d’actions correspondant aux gains (2,2) est un ´equilibre de Nash strict et donc

un strict maximum local qui est asymptotiquement stable pour la dynamique de meilleure

r´eponse. La face correspondant `a y = 0 a un potentiel constant et contient un ensemble

d’´equilibres de Nash (x∈[0,0.5]) et des trajectoires convergent vers cet ensemble. Cependant

cet ensemble n’est pas un strict maximum local et n’est donc pas asymptotiquement stable.

1

0 1

0

x

y

Figure 5.4 – Trajectoires de la dynamique de r´eplication dans le jeu de potentiel. Le seul

point asymptotiquement stable est le sommet (1,1).

Par la suite, nous aurons besoin d’une notion d’instabilit´e plus forte que l’instabilit´e

au sens de Lyapunov. En effet, bien que les points `a l’int´erieur du domaine ne soient pas

des attracteurs, il n’existe pas n´ecessairement une direction d’instabilit´e, ou autrement

dit, ils ne sont pas lin´eairement instables. Un point est lin´eairement instable si la matrice

jacobienne de la dynamique en ce point admet une valeur propre de partie r´eelle strictement

positive.

Pour la dynamique de meilleure r´eponse, on voit que, en un ´equilibre de Nash mixte,

∂x˙

_u,a

jacobienne en ce point est nulle, et donc ´egalement la somme des valeurs propres. Au final,

un équilibre de Nash dans l’intérieur du domaine n’est éventuellement pas linéairement

instable si toutes les valeurs propres ont une partie r´eelle nulle. Cela arrive si la dynamique

est identiquement nulle, mais dans ce cas, tous les points sont stationnaires. Cela arrive

´

egalement dans le jeu `a 3 joueurs dont la fonction de potentiel est donn´ee par :

Potentiel

1 0

0 1

0 1

1 0

La strat´egie mixte (1/2,1/2,1/2) est un ´equilibre de Nash. En ce point, la matrice

jacobi-enne de la dynamique est nulle.

Dans le document Auto-optimisation des réseaux sans fil. Une approche par la théorie des jeux (Page 118-121)

Télécharger maintenant "Auto-optimisation des ..."

Outline

Documents relatifs