• Aucun résultat trouvé

D´efinition, propri´et´es

Dans le document Optimisation et alg` ebre lin´ eaire (Page 28-32)

2.3 Convexit´e et conditions suffisantes

2.3.1 D´efinition, propri´et´es

= ( b

f )

. (2.16)

2.3 Convexit´ e et conditions suffisantes

Une cat´egorie tr`es importante parmi les fonctionnelles est celle des fonctionnelles convexes, pour lesquelles on peut obtenir la caract´erisation des minima. En effet, les conditions n´ecessaires de la premi`ere section deviennent n´ecessaires et suffisantes, lorsque la fonctionnelle est convexe (et diff´erentiable). Qui plus est, le minimum, quia prioripeut-ˆetrelocal, devientglobal.

2.3.1 D´efinition, propri´et´es

D´efinition 2.3.1 SoitJ une fonctionnelle d´efinie sur un sous-ensemble convexe non videK de E, `a valeurs dans R. On dit que J estconvexesi et seulement si

∀u, v∈K, u/=v, ∀θ∈]0,1[ J(θu+ (1−θ)v)≤θJ(u) + (1−θ)J(v).

Dans le cas d’une in´egalit´e stricte, on dit que la fonctionnelle J est strictement convexe.

Enfin, pour ˆetre complet, nous dirons que, s’il existe α >0tel que

∀u, v∈K, u/=v, ∀θ∈]0,1[ J(θu+ (1−θ)v)≤θJ(u) + (1−θ)J(v)−α

2θ(1−θ)'u−v'2, J est α-convexe.

x J(x)

x J(x)

x J(x)

x J(x)

Fig.2.4 – Exemples de fonctions convexes

Remarque 2.3.1 (g´eom´etrique) La convexit´e deJ signifie que le graphe deJ est au-dessous de toutes ses cordes.

Exercice 2.3.1 Montrer que siJ est continue et α-convexe, alors elle est strictement convexe.

Exercice 2.3.2 Montrer que si J est α-convexe et diff´erentiable en un point, alors elle est infinie `a l’infini (NB. On ne fait aucune hypoth`ese de continuit´e sur J.)

Proposition 2.3.1 Soit J une fonctionnelle convexe d´efinie sur un convexe non videK. Si uet v sont deux points de minimum locaux, alorsJ(u) =J(v).

Si de plus J est strictement convexe, alorsu=v.

Preuve :Soient uetvdeux minima.

Comme J est convexe,

J(u+θ(v−u)) =J((1−θ)u+θ v)≤(1−θ)J(u) +θ J(v), ∀θ ∈]0,1[.

Si l’on suppose queJ(v)< J(u), on inf`ere que

J(u+θ(v−u))<(1−θ)J(u) +θ J(u) =J(u), ∀θ ∈]0,1[, ce qui contredit le fait queuest un minimum local (θ proche de 0).

De la mˆeme fa¸con, si l’on suppose queJ(u)< J(v), on en d´eduit cette fois que J(u+θ(v−u))<(1−θ)J(v) +θ J(v) =J(v), ∀θ∈]0,1[, ce qui contredit cette fois le fait quevest un minimum local (θ proche de 1).

On a donc bienJ(u) =J(v).

Supposons queJ est strictement convexe. Siuet vsont deux points de minimum, on a vu que J(u) =J(v). Siuet vsont distincts,

J(u+θ(v−u))<(1−θ)J(u) +θ J(v) =J(u), ∀θ∈]0,1[, ce qui contredit le fait queuest un minimum local.

On a donc bienu=v.

Remarque 2.3.2 Ceci signifie en particulier que

tout point de minimum local d’une fonctionnelle convexe est en fait un point de minimum global. En effet, si on reprend le raisonnement ci-dessus avec u minimum local et v tel queJ(v)< J(u), on trouveJ(u+θ(v−u))< J(u), pour tout θ dans ]0,1[: ceci contredit l’hypoth`ese lorsque θ est proche de 0 !

le point de minimum d’une fonctionnelle strictement convexe, s’il existe, est unique.

Avant de d´emontrer les r´esultats portant sur les conditions suffisantes, lorsque la fonctionnelle est convexe, nous allons commencer par relier cette notion dans E `a celle, plus connue, de la convexit´e dansR. Pour cela, pour tout couple (u, v)∈K×K, nous introduisons la fonction

µu,v : θ-→J((1−θ)u+θv) =J(u+θ(v−u)),de [0,1] dansR (la d´ependance de µu,v par rapport `au etvest sous-entendue dans la suite.)

Th´eor`eme 2.3.1 Soit J d´efinie sur un convexe non vide K. AlorsJ est (strictement) convexe si, et seulement si, µ est (strictement) convexe pour tout couple (u, v) de K×K.

Preuve :Supposons pour commencer queJest strictement convexe. Soientuetvdeux ´el´ements deK,µ la fonction associ´ee, 0≤x < y≤1, etβ∈]0,1[.

µ(β x+ (1−β)y) =J((1−β x−(1−β)y)u+ (β x+ (1−β)y)v)

=J(u+β(−x u+x v) + (1−β)(−y u+y v))

=J((β+ (1−β))u+β(−x u+x v) + (1−β)(−y u+y v))

=J(β((1−x)u+x v) + (1−β)((1−y)u+y v))

< β J((1−x)u+x v) + (1−β)J((1−y)u+y v), soit finalementµ(βx+ (1−β)y)< β µ(x) + (1−β)µ(y).

R´eciproquement, siµ est strictement convexe pour tout couple (u, v), on ´ecrit,θ ∈]0,1[, J(θ u+ (1−θ)v) =µ(1−θ)< θ µ(0) + (1−θ)µ(1) =θ J(u) + (1−θ)J(v).

Bien ´evidemment, on peut reprendre le raisonnement ci-dessus pour la convexit´e simple, en rempla¸cant les in´egalit´es strictes par des in´egalit´es larges.

Rappelons maintenant quelques r´esultats concernant la (stricte) convexit´e des fonctions : Proposition 2.3.2 Soit µ une application de[0,1] dansR.

µ est convexesi et seulement si

∀x0, x1, x2∈[0,1], x0< x1< x2, µ(x1)−µ(x0)

x1−x0 ≤ µ(x2)−µ(x0)

x2−x0 ≤ µ(x2)−µ(x1) x2−x1 . Si de plus µ est d´erivable alors µ est convexe si, et seulement si, µ! est croissante.

Si enfin µ est deux fois d´erivable alors µ est convexe si, et seulement si,µ!! est positive.

µ est strictement convexe si et seulement si

∀x0, x1, x2∈[0,1], x0< x1< x2, µ(x1)−µ(x0) x1−x0

< µ(x2)−µ(x0) x2−x0

< µ(x2)−µ(x1) x2−x1

. Si de plus µ est d´erivable alors µ est strictement convexe si, et seulement si, µ! est strictement croissante.

Preuve :Elle est laiss´ee en exercice...

A partir de ces rappels, nous sommes en mesure d’´enoncer le th´eor`eme principal de caract´erisation des fonctionnelles diff´erentiables convexes.

Th´eor`eme 2.3.2 Soit J une fonctionnelle diff´erentiable sur un sous-ensemble K convexe.

Les assertions suivantes sont ´equivalentes.

(i) J est convexe sur K.

(ii) ∀u, v∈K, u/=v, J(v)≥J(u) + (∇J(u), v−u).

(iii) ∀u, v∈K, u/=v, (∇J(u)− ∇J(v), u−v)≥0.

De mˆeme, les assertions suivantes sont ´equivalentes.

(iv) J est strictement convexe sur K.

(v) ∀u, v∈K, u/=v, J(v)> J(u) + (∇J(u), v−u).

(vi) ∀u, v∈K, u/=v, (∇J(u)− ∇J(v), u−v)>0.

Preuve : Comme pour le th´eor`eme 2.3.1, nous consid´erons uniquement le cas de la stricte convexit´e.

Montrons tout d’abord que (iv) ⇒(v).

Soient doncu etv deux ´el´ements distincts deK, etµ la fonction associ´ee ; d’apr`es le th´eor`eme 2.3.1, µest strictement convexe. D’apr`es la proposition ci-dessus, ceci est ´equivalent au fait que µ! est strictement croissante. Si l’on applique le th´eor`eme de Rolle entre 0 et 1, on trouve

∃c∈]0,1[ tel queµ(1)−µ(0) =µ!(c).

Comme µ! est strictement croissante, ceci implique µ(1)−µ(0)> µ!(0).

Il ne reste plus qu’`a revenir `a la fonctionnelle J. Or, par d´efinition (cf. (2.3)), on a µ!(θ) = (∇J(u+θ(v−u)), v−u).

On en d´eduit finalement que

J(v)−J(u)>(∇J(u), v−u), c’est-`a-dire (v).

Montrons maintenant que (v) ⇒(vi).

Pour cela, il suffit d’appliquer (v) au couple (u, v), puis au couple (v, u), et de faire la somme.

Finalement, il reste `a v´erifier que (vi)⇒(iv).

Soient doncuet vdeux ´el´ements distincts deK, et µ la fonction associ´ee ; nous allons montrer queµ! est strictement croissante. La proposition ci-dessus et le th´eor`eme 2.3.1 permettront alors de conclure. Soient donc 0≤x < y≤1 :

µ!(y)−µ!(x) = (∇J(u+y(v−u))− ∇J(u+x(v−u)), v−u)

= (∇J(u+y(v−u))− ∇J(u+x(v−u)),[u+y(v−u)]−[u+x(v−u)]

y−x )

>0, d’apr`es (vi), puisquey > x.

Remarque 2.3.3 (g´eom´etrique) La convexit´e de J (ii) signifie que le graphe de J est au-dessus du graphe de l’application affine tangente `aJenu, c’est-`a-direv-→J(u)+(∇J(u), v−u), en tout point u de K.

Remarque 2.3.4 En ce qui concerne l’α-convexit´e, on peut prouver les ´equivalences ci-dessous.

Soit J une fonctionnelle diff´erentiable sur un sous-ensemble K.

Les assertions suivantes sont ´equivalentes.

(vii) J est α-convexe sur K.

(viii) ∀u, v∈K, u/=v, J(v)≥J(u) + (∇J(u), v−u) +α

2'u−v'2. (ix) ∀u, v∈K, u/=v, (∇J(u)− ∇J(v), u−v)≥α'u−v'2.

Th´eor`eme 2.3.3 SoitJune fonctionnelle deEde classeC2. AlorsJest convexe si, et seulement si,

∀u, v∈E, (∇2J(u)(v−u), v−u)≥0

Preuve : SiJ est convexe, µ l’est ´egalement pour tout couple (u, v). Par ailleurs, de (2.4), on tire

µ!!(θ) = (∇2J(u+θ(v−u))(v−u), v−u).

Comme µ!! est positive par hypoth`ese, il suffit d’utiliser la formule ci-dessus en θ= 0.

R´eciproquement, supposons que (∇2J(u)(v−u), v−u) ≥ 0, pour tout couple d’´el´ements (u, v) de E×E.

On peut reformuler cette condition en la condition ´equivalente (∇2J(u)h, h) ≥ 0, pour tout couple d’´el´ements (u, h) de E×E, et remplacer pour finiruparu+θ h.

Ceci ´etant not´e, nous appliquons la formule de Taylor-Mac Laurin (cf. th´eor`eme 14.3.3), enuet env.

J(u+h) =J(u) + (∇J(u), h) +1

2(∇2J(u+θ h)h, h), θ∈]0,1[,

≥J(u) + (∇J(u), h).

On choisit h= v−u, pour trouverJ(v)≥ J(u) + (∇J(u), v−u), ce qui correspond bien `a la condition de convexit´e (ii) deJ.

Pour finir, notons que lorsque l’on sait qu’une fonctionnelle est convexe, on peut d´emontrer des r´esultats g´en´eraux concernant sar´egularit´e(nous renvoyons le lecteur `a [10]).

Dans le document Optimisation et alg` ebre lin´ eaire (Page 28-32)