• Aucun résultat trouvé

Construction d’une m´ etrique qui garantit l’existence de solutions

4.3 Robustesse de la dynamique stochastique de meilleure r´ eponse aux processus

5.1.1 Construction d’une m´ etrique qui garantit l’existence de solutions

Rappelons que la direction de plus grande pente d’une fonction diff´erentiable est relative

`

a un produit scalaire. La donn´ee d’un produit scalaire d´efinit une m´etrique et donc un choix

particulier de direction de plus grande pente. La dynamique qui suit les plus grandes pentes

d´epend donc du produit scalaire.

Dans certains cas, les trajectoires sont contraintes `a rester dans un ensemble compact

donn´e (par exemple l’ensemble des strat´egies mixtes). Toutes les dynamiques qui suivent les

plus grandes pentes ne satisfont pas cette contrainte. Dans cette section, nous donnons des

conditions suffisantes sur les m´etriques qui permettent de garantir l’existence de solutions.

Cette section est assez technique, et principalement inspir´ee de [ABB05]. Elle se place

dans un cadre plus g´en´eral que celui des jeux.

Dynamique d´efinie par les directions de plus grande pente

Soit un domaine X =O ∩ H o`u :

– O est un ouvert convexe et non vide deR

n

et O est son adh´erence,

– H est un sous-espace affine de R

n

. Celui-ci peut s’´ecrire {x∈ R

n

|Ax =b}, o`u A est

une matricem×n, avec m ≤n, de rang plein, et b un vecteur de taille m.

Par exemple, l’ensemble des strat´egies mixtes d’un joueur d’un jeu fini peut s’´ecrire de

cette mani`ere, si l’on poseO ={x∈R

n

|x >0}, A la matrice 1×n qui vaut 1 partout, et

b= 1.

Soit f : R

n

R une fonction de classe C

1

. La direction de plus grande pente est

donn´ee par le gradient def. Dans le cas du produit scalaire canonique, le gradient est ´egal

au vecteur des d´eriv´ees partielles, ce qui donne un moyen pratique de le calculer.

FINIS

– suit les directions de plus grande pente de f pour une m´etrique donn´ee,

– et tel que les trajectoires sont incluses dansX. Cela est crucial si l’on prendX comme

´etant un espace de probabilit´e : cela n’aurait aucun sens d’avoir, par exemple, des

composantes n´egatives.

Tout d’abord, il est possible que la direction de plus grande pente ne soit pas incluse

dans H

1

, et que, par cons´equent, une dynamique qui suit cette direction sorte de H. C’est

le cas si l’on prend, par exemple, O = R

2

, H = {(x, y) ∈ R

2

|y = 0}, et f(x, y) = y,

alors ∇f(x, y) = (0,1) qui est orthogonal `a H. Pour cette raison, on d´efinit, comme `a la

section 3.2.2, le gradient de la fonctionf restreinte au sous-espace affine H par :

∇f

|H

(x) = Proj

H0

(∇f(x)), (5.1)

o`u Proj

H

0

: R

n

→ H

0

est la projection orthogonale, pour le produit scalaire courant, sur

l’espace vectoriel H

0 def

= Ker(A) ={x|Ax= 0}

2

.

On s’int´eresse naturellement au syst`eme dynamique donn´e par l’´equation diff´erentielle :

˙

x(t) =∇f

|H

(x(t)),

avec x(0) ∈ X. En raison de la projection sur H

0

, les trajectoires restent incluses dans H.

Cependant, rien ne les interdit de sortir de l’ensemble O, et donc deX.

Cela nous am`ene `a consid´erer des produits scalaires qui d´ependent continˆument de x.

Soit G :X →S

n

++

une fonction continue, o`u S

n++

d´esigne l’ensemble des matrices d´efinies

positives. On d´efinit le produit scalaire h. , .i

G

x

par

3

:

∀u, v ∈ R

n

,hu, vi

G x

def

= hG(x)u, vi,

o`uh. , .i est le produit scalaire canonique.

Calculons le gradient, que l’on notera ∇

G

f(x), associ´e `a ce produit scalaire particulier.

Par d´efinition du gradient, on a, pour tout u ∈ R

n

: h∇f(x), ui = h∇

G

f(x), ui

G

x

. Cela

implique que pour tout u ∈ R

n

, h∇f(x), ui = hG(x)∇

G

f(x), ui, et donc que ∇f(x) =

G(x)∇

G

f(x). Comme G(x) est d´efinie positive, c’est une matrice inversible, d’o`u :

∇Gf(x) = G(x)

−1

∇f(x).

Finalement, si l’on restreintfau sous-espace affineH, on consid`ere l’´equation diff´erentielle

ordinaire ind´ependante du temps :

(

˙

x=∇

G

f

|H

(x),

x(0)∈ X. (5.2)

1. Ou plus pr´ecis´ement dans le plan tangent `aH.

2. On projette en fait sur l’espace tangent `aHqui s’av`ere ˆetreH

0

.

3. Les produits scalaires obtenus de cette fa¸con d´efinissent une m´etrique riemannienne sur X. La

g´eom´etrie riemannienne est en dehors du cadre de cette th`ese et des connaissances de l’auteur. Dans

notre cadre tr`es simple, une m´etrique sera un “produit scalaire qui d´epend dex”, ce qui peut toujours

se d´efinir sans avoir recours `a la th´eorie g´en´erale. L’usage de ces m´etriques est d’utilisation courante en

optimisation convexe pour les m´ethodes de points int´erieurs (voir [BGLS97]). Notons ´egalement que la

classique m´ethode de Newton pour l’optimisation peut s’interpr´eter comme une descente de gradient pour

une m´etrique particuli`ere (voir [Iou07]).

Notons que, comme `a l’´equation (5.1), ∇Gf

|H

(x) = Proj

H0

(∇Gf(x)), o`u la projection est

relative au produit scalaire h. , .i

G

x

.

Nous donnons maintenant des conditions suffisantes sur la fonction G pour que les

trajectoires du syst`eme dynamique (5.2) restent dans X.

Existence des solutions

On dira qu’il existe une solution au syst`eme dynamique s’il existe une trajectoire (x(t))

satisfaisant le syst`eme (5.2) telle que∀t ∈[0,∞), x(t)∈ X.

Le th´eor`eme suivant donne des conditions sur la fonction G:R

n

S

n

++

d´efinissant le

produit scalaire, pour que les solutions du syst`eme dynamique existent. Une des conditions

est queGsoit ´egale `a la matrice hessienne∇

2

g(x) d’une fonctiongqui est de type Legendre.

D´efinition 5.1 (Fonctions de type Legendre (chapitre 26 dans [Roc97]))

Une fonctiong :O →Rest de type Legendre si elle satisfait les conditions suivantes :

– g est diff´erentiable,

– k∇g(x)k tend vers l’infini quand x tend vers le bord deO,

– g est strictement convexe (si g est de classeC

2

, alors ∇

2

g(x) est d´efinie positive).

Une fonction qui v´erifie la deuxi`eme condition peut se voir comme une “barri`ere” que

la dynamique ne peut pas franchir. Cela nous permet d’introduire le th´eor`eme fondamental

de cette section :

Th´eor`eme 5.2 (Th´eor`eme 4.1 dans [ABB05])

Supposons que la fonctiong :O →Rest de classeC

2

, et de type Legendre. Supposons

´

egalement que l’ensemble X est born´e, donc compact. Alors il existe une solution au

syst`eme dynamique (5.2), o`u le produit scalaireh. , .i

G

x

est donn´e par la fonctionG:X →

S

n++

telle queG(x) = ∇

2

g(x).

Calculons la d´eriv´ee de f le long d’une trajectoire du syst`eme dynamique (5.2) :

d

dtf(x(t)) =h∇

G

f(x(t)),x˙(t)i

G x

=h∇

G

f(x(t)),∇

G

f

|H

(x(t))i

G x

=h∇

G

f

|H

(x(t)),∇

G

f

|H

(x(t))i

G x

=

k∇

G

f

|H

(x(t))k

G x

2

,

o`u la troisi`eme ´egalit´e vient du fait que ∇

G

f

|H

(x(t)) ∈ H, donc que le produit scalaire

est inchang´e si on projette ∇Gf(x(t)) sur H. On appelle point stationnaires du syst`eme

dynamique (5.2), les points tels que ∇

G

f

|H

(x) = 0. Comme cons´equence des calculs

pr´ec´edents, on a :

Proposition 5.3

En dehors des points stationnaires, la fonctionf est strictement croissante le long des

trajectoires du syst`eme dynamique (5.2).

FINIS

En particulier, si l’on suppose que X est compact, alorsf admet une borne sup´erieure,

et sa valeur converge sur toute trajectoire de la dynamique (5.2).

Calcul de l’expression du syst`eme dynamique lorsque le domaine est d´ecrit par des

contraintes explicites

Nous donnons une mani`ere de construire une fonction G qui v´erifie les hypoth`eses du

th´eor`eme fondamental d’existence de solutions dans le cas o`u l’ensemble O est d´efini par

des in´egalit´es.

Supposons que l’ensemble ouvert et convexe O soit d´ecrit par un ensemble de I

cont-raintesO ={x∈R

n

|∀i= 1. . . I, c

i

(x)>0}, o`u les fonctionsc

i

:R

n

Rsont des fonctions

affines. Soit h: (0,∞)→R une fonction qui v´erifie les hypoth`eses suivantes :

Hypoth`ese 5.4

– h est de classe C

2

,

– lim

s→0+

h

0

(s) =−∞, et

– pour tout s∈(0,∞), h

00

(s)>0.

Par exemple, ces hypoth`eses sont satisfaites par les fonctions −log(s), 1

s, slog(s)−s, et

1

αs

α

pourα ∈(0,1).

La proposition 4.10 dans [ABB05] implique que la fonctiong :O →R d´efinie par :

g(x) =

I

X

i=1

h(c

i

(x)), (5.3)

satisfait les hypoth`eses du th´eor`eme 5.2. Par le calcul, on obtient :

2

g(x) =

I

X

i=1

h

00

(c

i

(x))∇c

i

(x)∇c

i

(x)

T

+h

0

(c

i

(x))∇

2

c

i

(x)

. (5.4)

Posons G(x) = ∇

2

g(x). Si le sous-espace affine est donn´e par H ={x|Ax = b}, alors,

on a plus explicitement

4

:

G

f

|H

(x) = G(x)

−1

I−A

T

(AG(x)

−1

A

T

)

−1

AG(x)

−1

∇f(x). (5.5)