Sous-diff´erentiel et transform´ee de Fenchel

Dans le document Convexité et Optimisation (Page 84-88)

4.8 Diff´erentiabilit´e et sous-diff´erentiabilit´e des fonctions convexes

4.8.3 Sous-diff´erentiabilit´e des fonctions convexes

4.8.3.8 Sous-diff´erentiel et transform´ee de Fenchel

Revenons pour terminer sur la notion de transform´ee de Fenchel introduite au §4.5 pour ´etablir un

lien avec la notion de sous-diff´erentiel. On a vu que par d´efinition de la transform´ee de Fenchel, l’in´egalit´e (4.8) est toujours vraie. Le th´eor`eme qui suit discute de la situation du cas d’´egalit´e.

Th´eor`eme 4.71. Soit f une fonction convexe. L’in´egalit´e (4.8) est une ´egalit´e si et seulement si p

∂ f (x). De plus, si f est s.c.i., alors l’´egalit´e dans (4.8) est aussi ´equivalente au fait que x ∈ ∂ f(p).

D´emonstration. Si l’´egalit´e a lieu dans (4.8) pour un certain x et un certain p, alors on peut retrancher

cette ´egalit´e `a l’in´egalit´e ´ecrite pour un autre y et pour le mˆeme p. Ce que l’on obtient ainsi signifie que

p∈ ∂ f (x). R´eciproquement, si p ∈ ∂ f (x), on a

∀y, p , y − f (y) ≤ p , x − f (x) ,

ce qui montre que c’est x qui r´ealise le sup dans la D´efinition 4.20 de la transform´ee de Fenchel de f au point p. On obtient donc l’´egalit´e dans (4.8).

Pour la seconde partie du th´eor`eme, on observe d’abord que la premi`ere partie qui vient d’ˆetre d´emontr´ee peut aussi s’appliquer au couple de fonctions( f, f) au lieu de ( f, f). Ceci se traduit

notamment, en cas d’´egalit´e pour un couple(p, x) par le fait que x ∈ ∂ f(p). Mais dans le cas o`u f

est s.c.i., elle est ´egale `a son enveloppe convexe s.c.i. qui est ´egale `a f en g´en´eral (Corollaire 4.39).

Donc f= f , ce qui ach`eve la d´emonstration

Introduisons la notion d’inverse ensembliste d’une application, voire mˆeme d’une multi-application A :X → 2Y: c’est la multi-application deY dans 2Xd´efinie par

A−1(y) = {x ∈ X | y ∈ A(x)} .

Autrement dit, y ∈ A(x) est par d´efinition ´equivalent `a x ∈ A−1(y). Alors, du Th´eor`eme 4.71, et pour

une fonction convexe s.c.i. et diff´erentiable, on d´eduit que

et par cons´equent



∂ f−1 = ∂ f . (4.31)

Ceci montre que, consid´er´ee plut ˆot au niveau des sous-diff´erentiels qu’`a celui des fonctions, la trans-form´ee de Fenchel agit comme une inversion !

Exercice 4.72. On a vu `a l’Exercice 4.22 que la transform´ee de Fenchel h d’une inf-convolution h =

fg est la somme des transform´ees de Fenchel fet g. En faisant l’hypoth`ese technique n´ecessaire

`a l’utilisation de la formule (4.24) avec ´egalit´e, et en s’appuyant sur (4.31), montrer que le sous-diff´erentiel de l’inf-convolution est la moyenne harmonique (l’inverse de la somme des inverses) des sous-diff´erentiels des fonctions de d´epart, c’est-`a-dire

∂h =

∂ f−1+∂g−1−1 .

Autrement dit, au niveau des sous-diff´erentiels plut ˆot qu’au niveau des fonctions, l’inf-convolution agit comme la moyenne harmonique. Rapprocher cette formule de (4.30).

4.9 R´esumons nous

Dans ce cours, on a choisi d’aborder l’´etude des fonctions convexes apr`es celle des ensembles convexes. On a vu qu’il est possible de passer de diverses fac¸ons des fonctions aux ensembles (en consid´erant les ´epigraphes ou les ensembles de niveau) et des ensembles aux fonctions (en consid´erant les fonctions indicatrices ou les fonctions support par exemple).

Comme pour les ensembles, la propri´et´e g´eom´etrique de convexit´e des fonctions a des cons´equences topologiques : en dimension infinie, continuit´e s.c.i. dans la topologie faible des fonctions convexes qui sont s.c.i. dans la topologie forte ; en dimension finie, les fonctions convexes ne peuvent pas avoir de “saut vertical fini”, ce qui implique la continuit´e `a l’int´erieur relatif de leur domaine (les discontinuit´es, infinies, se limitent ´eventuellement au bord de ce domaine ; en dimension infinie, il faut supposer que la fonction est born´ee au voisinage d’un point pour conclure `a la continuit´e en ce point).

Le th´eor`eme de s´eparation pour les convexes ferm´es, que nous avons d´eduit au chapitre pr´ec´edent de la notion de projection, avait eu pour cons´equence la “d´efinition externe” des convexes comme intersec-tion des demi-espaces d´elimit´es par leurs hyperplans d’appui. En appliquant ces nointersec-tions aux ´epigraphes de fonctions convexes s.c.i., on d´ebouche sur la notion de sous-gradient et sur le calcul sous-diff´erentiel que l’on a mis en relation avec la notion (plus faible) de d´eriv´ee directionnelle (qui apparaˆıt alors comme la fonction support du sous-diff´erentiel), et celle plus forte de d´eriv´ee de Gˆateaux (correspondant `a l’unicit´e du sous-gradient en tout point). Les approches interne et externe des convexes correspondent, pour l’´epigraphe des fonctions convexes, au fait que le graphe est “sous les cordes” et “au-dessus des tangentes”.

Une autre propri´et´e caract´eristique des fonctions convexes est le fait que le sous-diff´erentiel est un op´erateur monotone, ce qui, dans le cas le plus simple, correspond `a une notion de “co ˆut marginal croissant”.

Une autre fac¸on d’aborder la sous-diff´erentiabilit´e est de s’attaquer au calcul de la fonction support de l’´epigraphe. Ceci conduit `a introduire naturellement la notion de transform´ee de Fenchel et, de fac¸on non surprenante, il existe un lien tr`es fort entre cette transform´ee de Fenchel et le calcul de sous-gradients. On a vu que la transform´ee de Fenchel agit finalement comme une simple inversion lorsque l’on consid`ere son effet sur les sous-diff´erentiels des fonctions transform´ees.

4.10 Corrig´e des exercices

Corrig´e de l’Exercice 4.17 Si la fonction affine suppos´ee minorer f et g est x #→ r , x + b, alors

f(y) ≥ r , y +b et g(x −y) ≥ r , x − y +b dans (4.6), ce qui montre que h(x) ≥ r , x +2b > −∞.

Si(x, ξ) ∈ s(h), donc ξ > infy∈Xf(y)+g(y−x), alors il existe y0tel queξ > f (y0)+g(y0−x), et doncξ peut s’´ecrire η + ζ avec η > f (y0) et ζ > g(x − y0). On a donc exprim´e (x, ξ) comme la

somme de(y0, η ) ∈ s( f ) et (x − y0, ζ ) ∈ s(g). Par cons´equent, s(h) ⊂ s( f ) + s(g).

R´eciproquement, si x = x1+ x2etξ = ξ1+ ξ2avecξ1> f (x1) et ξ2> f (x2), alors ξ > f (x1) + g(x2) > inf

y1+y2=x1+x2 

f(y1) + g(y2)= h(x1+ x2) ,

donc(x1+ x2, ξ1+ ξ2) ∈ s(h) et on a montr´e l’inclusion inverse.

Si f et g sont convexes, leur ´epigraphe strict est convexe et la somme vectorielle pr´eserve la con-vexit´e, donc h est convexe.

Corrig´e de l’Exercice 4.18 Dire que(x, β) ∈ s(g), c’est dire que β > infy f(x, y) ou bien qu’il

existe y tel queβ > f (x, y), ou bien encore qu’il existe y tel que(x, y), β∈ s( f ). Cette derni`ere

affirmation est ´equivalente `a dire que(x, β) appartient `a la projection de s( f ) sur X.

Comme on a vu que la projection d’un convexe est convexe (voir Figure 3.4), ceci montre ques(g)

est convexe, donc g est une fonction convexe.

Corrig´e de l’Exercice 4.60 On ne donne que les d´emonstrations du cas “fortement”. Le cas “stricte-ment” correspond `a une adaptation imm´ediate. On suppose (4.3) que l’on r´e´ecrit

(1 − α)f(y) − f (x)≥ fαx + (1 − α)y− f (x) + bα(1 − α) x − y 2/2

≥ (1 − α) r , x + bα(1 − α) x − y 2/2

pour tout r ∈ ∂ f (x). Il suffit de diviser cette in´egalit´e par α puis de prendre α = 1 pour obtenir (4.20). R´eciproquement, on suit de pr`es le sch´ema de la d´emonstration du Th´eor`eme 4.59, mais en partant de (4.20) au lieu de (4.18), ce qui conduit apr`es calcul `a (4.3).

Corrig´e de l’Exercice 4.69 Supposons la fonction marginale g sous-diff´erentiable en x . Pour tout

r ∈ ∂g(x) et tout x,

g(x) − g(x) ≥ r , x− x .

Si y∈ Y(x), alors, par d´efinition, g(x) = f (x, y) et par ailleurs (condition d’optimalit´e), 0 ∈ ∂y f(x, y).

Moyennant ces observations et celle que pour tout y, f(x, y) ≥ g(x), l’in´egalit´e ci-dessus implique

que :

f(x, y) − f (x, y) ≥ r, x− x+ 0, y− y .

Cette in´egalit´e ´etant vraie pour tout (x, y), elle montre que (r, 0) ∈ ∂ f (x, y) et donc que r ∈ X

∂ f (x, y) = ∂x f(x, y). Cette relation d’appartenance ´etant vraie pour tout y ∈ Y(x),

Optimisation sous contraintes : conditions

d’optimalit´e locales

Dans la premi`ere section de ce chapitre, on traite du probl`eme g´en´eral de la minimisation d’une fonction convexe sur un sous-ensemble “admissible” convexe. L’introduction d’un sous-ensemble admissible est une fac¸on g´eom´etrique ou implicite de formuler des contraintes pesant sur le probl`eme de d´ecision optimale. Nous envisagerons dans les sections suivantes une autre fac¸on plus explicite ou analytique d’introduire des contraintes sous la forme d’´egalit´es ou d’in´egalit´es `a respecter.

5.1 Optimisation sur un ensemble admissible et in´equations

variation-nelles

Les conditions n´ecessaires et suffisantes obtenues ici se pr´esentent sous forme d’in´equations variation-nelles dont on examinera la signification g´eom´etrique. En g´en´eral, les in´equations variationvariation-nelles ne s’interpr`etent pas forc´ement comme les conditions d’optimalit´e d’un probl`eme d’optimisation (sous con-traintes) ; elles peuvent apparaˆıtre dans les probl`emes d’´equilibre (en M´ecanique, dans les r´eseaux de transport. . . ) ou en th´eorie des jeux.

Dans le document Convexité et Optimisation (Page 84-88)