Jeux continus et extension mixte des jeux finis

2.4 Un exemple o` u les deux approches ´ echouent : inciter des joueurs ` a participer

y∈Xu|(y,x−u)∈X

Jeux continus et extension mixte des jeux finis

2.4 Un exemple o` u les deux approches ´ echouent : inciter des joueurs ` a participer

3.1.2 Jeux continus et extension mixte des jeux finis

etant le gain du premier joueur (le joueur qui choisit les lignes par exemple) et la deuxi`eme

´

etant le gain du deuxi`eme joueur. Par exemple, si chaque joueur doit choisir parmi deux

actions, le jeu se pr´esente sous la forme suivante :

Matrice de gains

(a, A) (b, B)

(c, C) (d, D)

Ce jeu n’a pas d’´equilibre de Nash en strat´egies pures si, par exemple,c > a,D > C,b > d,

et A > B. En effet, dans ce cas, aucune strat´egie n’est un point fixe de la correspondance

de meilleure r´eponse.

Comme nous l’avons vu au chapitre pr´ec´edent, les jeux dans lesquels chaque joueur a

une stratégie dominante ont au moins un équilibre de Nash. Néanmoins, déterminer s’il

existe un équilibre de Nash (en stratégies pures) dans un jeu général donné sous sa forme

normale est un probl`eme NP-complet (voir [GGS03]). Par contre, lorsque l’on ´etend le jeu

`

a des strat´egies al´eatoires, ce que nous appelons l’extension mixte du jeu, il existe toujours

un ´equilibre de Nash. On est alors dans le cadre des jeux continus.

3.1.2 Jeux continus et extension mixte des jeux finis

Il existe des situations d’accès à des ressources qui impliquent des prises de décision dans

un ensemble continu d’actions. En informatique, l’exemple typique est le routage comp´etitif

dans les r´eseaux. Chaque joueur doit choisir une ou plusieurs routes afin de transmettre

un flux d’informations d’un point du réseau à un autre point (voir, par exemple, le modèle

dans [ORS93]). En général, plusieurs, voire même un grand nombre de routes joignent ces

deux points. Deux cas de figure apparaissent :

1. les flux sont indivisibles, et doivent transiter sur une route unique. C’est le cas lorsque

les paquets d’information doivent arriver dans le mˆeme ordre que celui dans lequel ils

ont été envoyés, comme par exemple, dans les communications téléphoniques. Dans

cette situation, l’ensemble des d´ecisions est fini, et la situation de comp´etition se

mod´elise par un jeu fini.

2. les flux peuvent être divisés, et chaque portion envoyée sur une route différente. Dans

ce cas, les joueurs choisissent la proportion du flux qu’ils envoient sur chacune des

routes. Cette prise de d´ecision se fait donc dans un ensemble continu.

Nous commen¸cons par décrire le cadre général des jeux à espace de stratégies continu,

et les conditions suffisantes pour qu’il existe un ´equilibre de Nash. Ensuite, nous d´etaillons

une classe particuli`ere de jeux continus utilis´ee dans la suite du chapitre : il s’agit des jeux

obtenus comme extension mixte des jeux finis. L’extension mixte peut ˆetre vue comme

une extension des stratégies déterministes à des stratégies aléatoires. Cela nous

permet-tra ultérieurement de définir des modèles d’apprentissage qui reposent sur des stratégies

al´eatoires, ce qui autorise plus de souplesse et de robustesse (au bruit par exemple) que les

seuls modèles en stratégies déterministes.

Jeux continus

Comme pr´ec´edemment, l’ensemble des joueurs U est fini.

On suppose qu’il existe des entiers (n

)

tels que l’ensemble des actions du joueur u

est compris dans un ensemble convexe et compact deR

not´eX

. Dans le cas du routage,

n

correspond au nombre de routes possibles, etX

est l’ensemble des fa¸cons de partager

un flux sur ces routes :

X

={x∈R

|x≥0 et

X

x

= 1}.

On noteX l’espace global des stratégies. En général, cet espace n’est pas le produit des

espaces de strat´egies de chaque joueur c’est-`a-dire ×

X

. En effet, des contraintes peuvent

interdire certains profils d’actions. Dans le cas du routage de flux de donn´ees, les contraintes

proviennent, par exemple, de la capacité limitée sur les liens ou les nœuds du réseau. De

ce fait, l’ensemble des actions d’un joueur d´epend des actions prises par les autres joueurs.

Finalement, un profil d’actions est un vecteurx= (x

)

∈ X, et ∀u∈ U, x

∈ X

.

Pour chaque joueur, une fonction de gain f

: X → R est donn´ee, et on note f(x) =

(f

(x))

. La fonction f est l’´equivalent de la fonction de gain cdans les jeux discrets.

Le triplet (U,X, f) d´efinit un jeu continu.

La fonction de meilleure réponse d’un joueur par rapport à la stratégie des autres joueurs

est compris dans un ensemble convexe et compact de_R

={x∈_R

: X → _R est donn´ee, et on note f(x) =

quasi-concavit´e des fonctions de gain. On dit qu’une fonction g :X → _Restquasi-concave si ses

sur-niveaux sont convexes, o`u le sur-niveaut ∈_Rest l’ensemble{x∈ X tels que g(x)≥t}.

= {x∈_R

tels que ^X