4.3 Robustesse de la dynamique stochastique de meilleure r´ eponse aux processus
5.1.1 Construction d’une m´ etrique qui garantit l’existence de solutions
Rappelons que la direction de plus grande pente d’une fonction diff´erentiable est relative
`
a un produit scalaire. La donn´ee d’un produit scalaire d´efinit une m´etrique et donc un choix
particulier de direction de plus grande pente. La dynamique qui suit les plus grandes pentes
d´epend donc du produit scalaire.
Dans certains cas, les trajectoires sont contraintes `a rester dans un ensemble compact
donn´e (par exemple l’ensemble des strat´egies mixtes). Toutes les dynamiques qui suivent les
plus grandes pentes ne satisfont pas cette contrainte. Dans cette section, nous donnons des
conditions suffisantes sur les m´etriques qui permettent de garantir l’existence de solutions.
Cette section est assez technique, et principalement inspir´ee de [ABB05]. Elle se place
dans un cadre plus g´en´eral que celui des jeux.
Dynamique d´efinie par les directions de plus grande pente
Soit un domaine X =O ∩ H o`u :
– O est un ouvert convexe et non vide deR
net O est son adh´erence,
– H est un sous-espace affine de R
n. Celui-ci peut s’´ecrire {x∈ R
n|Ax =b}, o`u A est
une matricem×n, avec m ≤n, de rang plein, et b un vecteur de taille m.
Par exemple, l’ensemble des strat´egies mixtes d’un joueur d’un jeu fini peut s’´ecrire de
cette mani`ere, si l’on poseO ={x∈R
n|x >0}, A la matrice 1×n qui vaut 1 partout, et
b= 1.
Soit f : R
n→ R une fonction de classe C
1. La direction de plus grande pente est
donn´ee par le gradient def. Dans le cas du produit scalaire canonique, le gradient est ´egal
au vecteur des d´eriv´ees partielles, ce qui donne un moyen pratique de le calculer.
FINIS
– suit les directions de plus grande pente de f pour une m´etrique donn´ee,
– et tel que les trajectoires sont incluses dansX. Cela est crucial si l’on prendX comme
´etant un espace de probabilit´e : cela n’aurait aucun sens d’avoir, par exemple, des
composantes n´egatives.
Tout d’abord, il est possible que la direction de plus grande pente ne soit pas incluse
dans H
1, et que, par cons´equent, une dynamique qui suit cette direction sorte de H. C’est
le cas si l’on prend, par exemple, O = R
2, H = {(x, y) ∈ R
2|y = 0}, et f(x, y) = y,
alors ∇f(x, y) = (0,1) qui est orthogonal `a H. Pour cette raison, on d´efinit, comme `a la
section 3.2.2, le gradient de la fonctionf restreinte au sous-espace affine H par :
∇f
|H(x) = Proj
H0(∇f(x)), (5.1)
o`u Proj
H0
: R
n→ H
0est la projection orthogonale, pour le produit scalaire courant, sur
l’espace vectoriel H
0 def= Ker(A) ={x|Ax= 0}
2.
On s’int´eresse naturellement au syst`eme dynamique donn´e par l’´equation diff´erentielle :
˙
x(t) =∇f
|H(x(t)),
avec x(0) ∈ X. En raison de la projection sur H
0, les trajectoires restent incluses dans H.
Cependant, rien ne les interdit de sortir de l’ensemble O, et donc deX.
Cela nous am`ene `a consid´erer des produits scalaires qui d´ependent continˆument de x.
Soit G :X →S
n++
une fonction continue, o`u S
n++d´esigne l’ensemble des matrices d´efinies
positives. On d´efinit le produit scalaire h. , .i
Gx
par
3:
∀u, v ∈ R
n,hu, vi
G xdef
= hG(x)u, vi,
o`uh. , .i est le produit scalaire canonique.
Calculons le gradient, que l’on notera ∇
Gf(x), associ´e `a ce produit scalaire particulier.
Par d´efinition du gradient, on a, pour tout u ∈ R
n: h∇f(x), ui = h∇
Gf(x), ui
Gx
. Cela
implique que pour tout u ∈ R
n, h∇f(x), ui = hG(x)∇
Gf(x), ui, et donc que ∇f(x) =
G(x)∇
Gf(x). Comme G(x) est d´efinie positive, c’est une matrice inversible, d’o`u :
∇Gf(x) = G(x)
−1∇f(x).
Finalement, si l’on restreintfau sous-espace affineH, on consid`ere l’´equation diff´erentielle
ordinaire ind´ependante du temps :
(
˙
x=∇
Gf
|H(x),
x(0)∈ X. (5.2)
1. Ou plus pr´ecis´ement dans le plan tangent `aH.
2. On projette en fait sur l’espace tangent `aHqui s’av`ere ˆetreH
0.
3. Les produits scalaires obtenus de cette fa¸con d´efinissent une m´etrique riemannienne sur X. La
g´eom´etrie riemannienne est en dehors du cadre de cette th`ese et des connaissances de l’auteur. Dans
notre cadre tr`es simple, une m´etrique sera un “produit scalaire qui d´epend dex”, ce qui peut toujours
se d´efinir sans avoir recours `a la th´eorie g´en´erale. L’usage de ces m´etriques est d’utilisation courante en
optimisation convexe pour les m´ethodes de points int´erieurs (voir [BGLS97]). Notons ´egalement que la
classique m´ethode de Newton pour l’optimisation peut s’interpr´eter comme une descente de gradient pour
une m´etrique particuli`ere (voir [Iou07]).
Notons que, comme `a l’´equation (5.1), ∇Gf
|H(x) = Proj
H0(∇Gf(x)), o`u la projection est
relative au produit scalaire h. , .i
Gx
.
Nous donnons maintenant des conditions suffisantes sur la fonction G pour que les
trajectoires du syst`eme dynamique (5.2) restent dans X.
Existence des solutions
On dira qu’il existe une solution au syst`eme dynamique s’il existe une trajectoire (x(t))
satisfaisant le syst`eme (5.2) telle que∀t ∈[0,∞), x(t)∈ X.
Le th´eor`eme suivant donne des conditions sur la fonction G:R
n→S
n++
d´efinissant le
produit scalaire, pour que les solutions du syst`eme dynamique existent. Une des conditions
est queGsoit ´egale `a la matrice hessienne∇
2g(x) d’une fonctiongqui est de type Legendre.
D´efinition 5.1 (Fonctions de type Legendre (chapitre 26 dans [Roc97]))
Une fonctiong :O →Rest de type Legendre si elle satisfait les conditions suivantes :
– g est diff´erentiable,
– k∇g(x)k tend vers l’infini quand x tend vers le bord deO,
– g est strictement convexe (si g est de classeC
2, alors ∇
2g(x) est d´efinie positive).
Une fonction qui v´erifie la deuxi`eme condition peut se voir comme une “barri`ere” que
la dynamique ne peut pas franchir. Cela nous permet d’introduire le th´eor`eme fondamental
de cette section :
Th´eor`eme 5.2 (Th´eor`eme 4.1 dans [ABB05])
Supposons que la fonctiong :O →Rest de classeC
2, et de type Legendre. Supposons
´
egalement que l’ensemble X est born´e, donc compact. Alors il existe une solution au
syst`eme dynamique (5.2), o`u le produit scalaireh. , .i
Gx
est donn´e par la fonctionG:X →
S
n++telle queG(x) = ∇
2g(x).
Calculons la d´eriv´ee de f le long d’une trajectoire du syst`eme dynamique (5.2) :
d
dtf(x(t)) =h∇
Gf(x(t)),x˙(t)i
G x=h∇
Gf(x(t)),∇
Gf
|H(x(t))i
G x=h∇
Gf
|H(x(t)),∇
Gf
|H(x(t))i
G x=
k∇
Gf
|H(x(t))k
G x 2,
o`u la troisi`eme ´egalit´e vient du fait que ∇
Gf
|H(x(t)) ∈ H, donc que le produit scalaire
est inchang´e si on projette ∇Gf(x(t)) sur H. On appelle point stationnaires du syst`eme
dynamique (5.2), les points tels que ∇
Gf
|H(x) = 0. Comme cons´equence des calculs
pr´ec´edents, on a :
Proposition 5.3
En dehors des points stationnaires, la fonctionf est strictement croissante le long des
trajectoires du syst`eme dynamique (5.2).
FINIS
En particulier, si l’on suppose que X est compact, alorsf admet une borne sup´erieure,
et sa valeur converge sur toute trajectoire de la dynamique (5.2).
Calcul de l’expression du syst`eme dynamique lorsque le domaine est d´ecrit par des
contraintes explicites
Nous donnons une mani`ere de construire une fonction G qui v´erifie les hypoth`eses du
th´eor`eme fondamental d’existence de solutions dans le cas o`u l’ensemble O est d´efini par
des in´egalit´es.
Supposons que l’ensemble ouvert et convexe O soit d´ecrit par un ensemble de I
cont-raintesO ={x∈R
n|∀i= 1. . . I, c
i(x)>0}, o`u les fonctionsc
i:R
n→Rsont des fonctions
affines. Soit h: (0,∞)→R une fonction qui v´erifie les hypoth`eses suivantes :
Hypoth`ese 5.4
– h est de classe C
2,
– lim
s→0+
h
0(s) =−∞, et
– pour tout s∈(0,∞), h
00(s)>0.
Par exemple, ces hypoth`eses sont satisfaites par les fonctions −log(s), 1
s, slog(s)−s, et
−1
αs
α
pourα ∈(0,1).
La proposition 4.10 dans [ABB05] implique que la fonctiong :O →R d´efinie par :
g(x) =
I
X
i=1
h(c
i(x)), (5.3)
satisfait les hypoth`eses du th´eor`eme 5.2. Par le calcul, on obtient :
∇
2g(x) =
IX
i=1h
00(c
i(x))∇c
i(x)∇c
i(x)
T+h
0(c
i(x))∇
2c
i(x)
. (5.4)
Posons G(x) = ∇
2g(x). Si le sous-espace affine est donn´e par H ={x|Ax = b}, alors,
on a plus explicitement
4:
∇
Gf
|H(x) = G(x)
−1I−A
T(AG(x)
−1A
T)
−1AG(x)
−1∇f(x). (5.5)
Dans le document
Auto-optimisation des réseaux sans fil. Une approche par la théorie des jeux
(Page 103-106)