• Aucun résultat trouvé

3.2 Conjuguée de Legendre-Fenchel

N/A
N/A
Protected

Academic year: 2022

Partager "3.2 Conjuguée de Legendre-Fenchel"

Copied!
16
0
0

Texte intégral

(1)

Dualité

3.1 Théorème de Hahn-Banach

3.1.1 Théorème de Hahn-Banach

Le but de cette section est d'énoncer et de démontrer partiellement le théorème de Hahn-Banach.

Théorème 41 (Hahn-Banach). Soit E un espace vectoriel et p : E → R une fonction sous-linéaire (1-homogène et sous-additive). On se donne un sous-espace vectoriel F de E et φ : F → R une forme linéaire dominée par p, c'est-à-dire que φ≤ p|F.

Alors, il existe une extension deφ à E qui reste dominée par p, c'est-à-dire une forme linéaire ψ:E→R telle que

∀x∈F, ψ(x) =φ(x)

∀x∈E, ψ(x)≤p(x).

Remarques 1. L'extension dénie par cet énoncé n'est en général pas unique.

Nous ne démontrerons que le cas où F ⊆ E est de codimension nie. La démonstration du cas général n'est pas constructive et repose sur l'axiome du choix.

Démonstration. Par une simple récurrence, il sut de savoir traiter le cas où F est de codimension 1. Supposons donc queE =F+Ry, où y 6∈F. Par dénition, tout vecteurxde E être décomposé de manière unique comme une sommex=z+ty où z est dansF ett dansR. On dénit

ψ(z+ty) =φ(z) +tλ,

où λ := ψ(y) est à déterminer de sorte à respecter la contrainte ψ ≤ p. Ainsi, on voudrait

∀t∈R, ψ(z+ty) =φ(z) +tλ≤p(z+ty) 27

(2)

Autrement dit, on est ramené à montrer l'existence deλ∈Rtel que

∀t∈R,∀z∈F, tλ≤p(z+ty)−φ(z)

Pour formuler le cast >0, on pose w=z/tpuis on utilise l'homogénéité dep etφ:

∀t >0,∀z∈F, tλ≤p(z+ty)−φ(z)

⇐⇒ ∀t >0,∀w∈F, tλ≤p(tw+ty)−φ(tw)

⇐=∀w∈F, λ≤p(w+y)−φ(w) Pour le cast <0, on poses=−t >0etw0=z/s:

∀t <0,∀z∈F, tλ≤p(z+ty)−φ(z)

⇐⇒ ∀s >0,∀w0∈F,−sλ≤p(sw0−sy)−φ(sw0)

⇐⇒ ∀s >0,∀w0∈F, sλ≥ −p(sw0−sy) +φ(sw0)

⇐=∀w0 ∈F, λ≥φ(w0)−p(w0−y)

Ainsi, pour que l'extension deφsoit majorée parp, il sut queλvérie les inégalités

∀w, w0 ∈F, φ(w0)−p(w0−y)≤λ≤p(w+y)−φ(w), Pour montrer qu'un telλexiste, il sut de démontrer que

wmax0∈Fφ(w0)−p(w0−y)≤min

w∈Fp(w+y)−φ(w)

⇐⇒ ∀(w, w0)∈F, φ(w0)−p(w0−y)≤p(w+y)−φ(w)

Nous utilisons nalement l'hypothèseφ≤ppour démontrer cette dernière inégalité : φ(w) +φ(w0) =φ(w+w0)≤p(w+y−y+w0)≤p(w+y) +p(w0−y) Corollaire 42. Soit E un espace vectoriel normé, soit F un sous-espace et soit φ∈F une forme linéaire continue. Alors, il existe ψ∈E telle kψkE≤ kφkF. Démonstration. On pose M = kφkF. Alors φ(x) ≤ Mkxk pour tout x ∈ F. En appliquant Hahn-Banach avec la fonctionp(x) =Mkxk, qui est1-homogène et sous- additive, on construitψ:E →R vériantψ(x)≤Mkxk, i.e.kψkE =M.

Corollaire 43. Soit E un espace vectoriel normé, il existe φ∈E de norme 1 telle queφ(x) =kxk.

Démonstration. Posons pour φ(tx) = tkxk pour tout t∈ R. Alors φ est une forme linéaire continue sur Rx de norme 1 et vériant φ(x) = kxk. D'après le corollaire précédentφ se prolonge en une forme linéaire continue sur de norme1 surE. Corollaire 44. Soit E un espace vectoriel normé et x 6= y ∈ E. Alors, il existe φ∈E de norme 1 vériantφ(x)6=φ(y).

(3)

3.1.2 Séparation des convexes

Sous sa forme géométrique le théorème de Hahn-Banach arme que deux en- sembles convexes disjoints peuvent être séparés par un hyperplan ane. Comme première étape, on se propose de séparer un convexe ouvert et un point.

Proposition 45. Soit E un espace vectoriel normé, C un ouvert convexe de E et z6∈C. Alors, il existeφ∈E telle que

∀x∈C, φ(x)< φ(z).

Pour montrer cette forme géométrique, nous utiliserons quelques propriétés de la jauge j : E → R d'un convexe C, dénie par j(x) = inf{t > 0 |x ∈ tC}, dont la démonstration est laissée en exercice. On rappellejest1-homogène et sous-additive.

Si de plusC est ouvert et contient l'origine, alors (i) ∃M ≥0, j(z)≤Mkzk;

(ii) C={j <1}.

Preuve de la proposition 45. Quitte à tout translater, suppose que le convexe C contient l'origine. Soit j la jauge de C, qui par le lemme précédent est 1-homogène et sous-additive. Pourt ∈R on pose φ(tz) =t sur l'espace F = Rz. Montrons que φ≤j surF. Comme z6∈C, on a j(z) >1. Par conséquent, φ(tz) =t < tj(z) pour tout t ≥ 0. Pour t < 0 on a bien sûr φ(−tz) < 0 ≤ j(−tz). Ainsi, on peut donc appliquer le théorème de Hahn-Banach et prolonger φ en une forme linéaire ψ sur E vériant l'inégalitéψ ≤j. En particulier, pour x ∈C,ψ(w)≤j(w) <1 =ψ(z). Enn,φest continue car

|φ(x)|= max(φ(x), φ(−x))≤max(j(x), j(−x))≤Mkxk par le lemme précédent.

Théorème 46. Soit E un espace vectoriel normé et soientA, B deux ensembles convexes disjoints.

(i) SiA est ouvert il existe φ∈E telle que

∀x∈A,∀y∈B, φ(x)< φ(y)

(ii) SiA est compact et B fermé, il existe φ∈E et >0 tels que

∀x∈A,∀y∈B, φ(x) + < φ(y)

Remarque 13. L'hypothèse queB est compact est importante pour l'existence d'une séparation stricte. Par exemple les ensembles convexes fermés suivants ne peuvent pas êtres séparés strictement :

A={(x, y)∈R2|x >0, y≥1/x} B ={(x, y)∈R2 |x >0, y≤ −1/x}.

(4)

Démonstration. On commence par (i). Il s'agit de démontrer que

∀x, y∈A×B, φ(x−y)<0⇐⇒ ∀w∈C0, φ(w)<0, (3.1) où C = A ⊕(−B). La somme de Minkowski d'un ensemble avec un ouvert est ouverte. De plus, l'hypothèse queA etB soient disjoint implique queC ne contient pas l'origine. Il sut donc d'appliquer la proposition précédente.

(ii) Soit Aη = A⊕B(0, η). Notons d'abord qu'il existe η > 0 tel que Aη ∩B =∅. Si ça n'était pas le cas il existerait deux suites xn dans A et yn dans B tels que kxn−ynk ≤1/n. Par compacité, on pourrait extraire une sous-suite convergente de xn∈A, dont la limite serait un point de A∩B.

Par construction, l'ensemble convexe ouvert A0 = A⊕int(B(0, η)) est ouvert et n'intersecte pas B. On peut alors appliquer le résultat précédent à A0 et B, et construireφ∈E telle que

∀z∈A0,∀y∈B, φ(z)< φ(y).

i.e.∀x∈A,∀u∈B(0, η/2),∀y∈B, φ(x+u) =φ(x) +φ(u)< φ(y).

Il sut alors de poser ε= supu∈B(0,η)φ(u) =ηkφkE > 0 pour obtenir le résultat.

Corollaire 47. SoitC un convexe fermé d'intérieur non vide et x un point du bord deC. Alors C admet un hyperplan d'appui enx :∃φ∈E\ {0} telle que

∀y∈C, φ(y)≤φ(x)

Démonstration. Il sut d'appliquer le théorème précédent àA = intC etB ={x}.

3.1.3 Enveloppe convexe fermée d'un ensemble

Dénition 14. SoitAune partie fermée d'un espace vectoriel norméE. L'enve- loppe convexe fermée de A, notée convA, est l'intersection de tout les convexes fermés contenant A.

Remarque 14. L'enveloppe convexe fermée deAest égale à l'adhérence de l'enveloppe convexe deA (car l'adhérence deconv(A) est convexe et fermée).

Dénition 15. On appelle demi-espace fermé deE les ensembles de la forme H= {x∈E |φ(x)≤α} oùφ est une forme linéaire continue non nulle etα∈R.

Proposition 48. Soit A⊆E où E est un espace vectoriel normé. L'enveloppe convexe fermée de A coïncide avec l'intersection des demi-espaces fermés conte- nant A.

(5)

Démonstration. On pose C := convA et D l'intersection de tous les demi-espaces fermés contenant A. L'ensemble D est un convexe fermé contenantA, de sorte que C ⊆ D. Pour montrer la réciproque, considérons un point x n'appartenant pas à C. Par la version géométrique du théorème de Hahn-Banach (Théorème 46.(ii)), il existe φ:E →R etε >0 vériant

sup

z∈C

φ(z) +ε≤φ(x).

Ainsi, le demi-espace fermé H ={z∈E |φ(z) ≤φ(x)−ε} contient A et pasx, de sorte queD(qui est contenu dansH) ne contient pas x.

Exemple 8. Soit A ={(x, y) ∈R2 |y ≥1/(1 +x2)}. Alors, convA ={(x, y)∈R2 | y≥0}.

Notation 1. Étant donnée une forme linéaire continueφsur un espace vectoriel normé E etx un point de E, on noterahφ|xi:=φ(x).

Dénition 16. SoitAun sous-ensemble d'un espace vectoriel norméE. On appelle fonction support deA la fonction hA:E →Rdénie par

hA:φ∈E 7→sup

x∈A

hφ|xi (3.2)

Théorème 49. Soit E un espace vectoriel normé.

(i) Si C, D sont deux convexes fermés de E, alors C ⊆ D si et seulement si hC ≤hD.

(ii) En particulier, l'application h:C→hC est injective sur les convexes fermés.

Démonstration. L'implication directe est évidente : siC ⊆D, hC(φ) = sup

x∈C

hφ|xi ≤sup

x∈D

hφ|xi= hD(φ).

Pour démontrer la réciproque, supposons que C6⊆D. Il existe alors un point x∈C qui n'appartient pas à D. Alors, il existe une forme linéaire continue φ séparant strictement le singleton{x}etD, c'est-à-dire que hD(φ) = supy∈Dφ(y) +ε < φ(x).

En particulier, hD(φ)< φ(x)≤hC(φ). Ceci contredit l'inégalité hC ≤hD.

3.1.4 Enveloppe convexe semi-continue inférieure d'une fonction Dénition 17. Une fonctionf :E→Rest semi-continue inférieurement ssi

∀x∈E,∀xn→x,lim inf

n→+∞f(xn)≥f(x) (3.3)

Proposition 50. Soit f :E→R. Les propriétés suivantes sont équivalentes : (i) f est semi-continue inférieurement ;

(ii) ∀α∈R, le sous-niveau{f ≤α} est fermé ;

(6)

(iii) epi(f) est fermé dans R×E;

Remarque 15. Cette caractérisation explique que certains auteurs utilisent le terme fermée à la place de semi-continue inférieurement.

Exemple 9. Soit C un convexe de E. La fonction indicatrice convexe iC de C est semi-continue inférieurement si et seulement siC est fermé.

Démonstration. On ne montre que (iii)=⇒ (i), le reste est laissé en exercice. Soitf une fonction vériant (iii),x∈E et(xn)une suite de points deE qui converge vers x. Il existe alors une sous-suite xnk telle que limk→+∞f(xnk) = lim infn→+∞f(xn). Comme les points (xnk, f(xnk)) sont dans epi(f) et que cet ensemble est fermé, on en déduit que(x,limk→+∞f(xnk))∈epi(f),c'est-à-dire

k→+∞lim f(xnk) = lim inf

n→+∞f(xn)≥f(x).

Proposition 51. Soit E un espace vectoriel normé.

(i) Si f, g:E→R sont sci et s, t≥0, alorssf +tg est sci.

(ii) Le suprémum d'une famille quelconque de fonctions sci est une fonction sci.

Dénition 18. SoitE un espace vectoriel normé etf :E →Rune fonction.

On appelle enveloppe convexe sci def, et on noteconvf le supremum des minorantes convexes et semi-continue inférieurement def :

convf(x) = sup{g(x);g:E→R convexe et sci tqg≤f}

On appelle minorante ane continue de f toute fonction ane continue φ+α, avecφ∈E etα ∈Rtelle f ≥φ+α.

Théorème 52. Toute fonction convexe f :E →Rsemicontinue inférieurement est égale au supremum de ses minorantes anes continues, c'est-à-dire

f(x) = sup{φ(x) +α|φ∈E, α∈R, f ≥φ+α}.

Démonstration. Si domf = ∅, f est constante et égale à +∞ et il n'y a rien à montrer. Supposons doncdomf 6=∅, ou de manière équivalente queC = epi(f) est un convexe fermé non vide deE×R. Posons

g(x) = sup{φ(x) +α|φ∈E, α∈R, ∀y∈E, f(y)≥φ(y) +α}.

Par dénition, g ≤ f, il reste donc à montrer l'inégalité inverse, c'est-à-dire que pour toutx0 dansE et tout t0 < f(x0),g(x0) ≥t0. Si t0 < f(x0), le point (x0, t0) n'appartient pas au convexe fermé C := epi(f). Il existe donc une forme linéaire continue sur E×R séparant strictement C de (x0, t0), c'est-à-dire (φ, v) ∈E ×R etε >0 tel que

∀(x, t)∈epi(f), φ(x) +tv≥φ(x0) +t0v+ε

(7)

En particulier, on a

∀x∈E, vf(x)≥φ(x0−x) +t0v+ε.

En prenant x = x0, on a v(f(x0)−t0) ≥ ε > 0. Comme f(x0) > t0, ceci implique v >0. Ainsi,

∀x∈E, f(x)≥ 1

vφ(x0−x) +t0

La fonction g étant le supremum des minorantes anes continues de f, elle est supérieure au second membre de l'inégalité précédente, c'est-à-dire.

g(x)≥ 1

vφ(x0−x) +t0, En particulier, ceci montre queg(x0)≥t0.

Corollaire 53. L'enveloppe convexe sci d'une fonction f :E → R est donnée par la formule

convf(x) = sup{φ(x) +α;φ∈E, α∈R, ∀y∈E, f ≥φ+α}.

Exemple 10. Une fonctionf est convexe et semi-continue inférieurement si et seule- ment si elle coïncide avec supremum de ses minorantes anes.

Exemple 11. Une fonction sous-linéaire semi-continue inférieurement f :E →Rest égale au supremum de ses minorantes linéaires.

Démonstration de l'exemple. La fonctionfest en particulier convexe et semi-continue inférieurement et elle est donc égale au supremum de ses minorantes anes. Soit φ+α,φ∈E etα∈Rune minorante ane def, i.e.

∀x∈E, φ(x) +α≤h(x).

Alors, par homogénéité,

∀x∈E,∀t >0, tφ(x) +α≤tf(x).

En divisant partet en faisant tendre tvers +∞, ceci montre queφ≤f. 3.1.5 Topologie faible et optimisation

Dénition 19 (Convergence faible). (i) Soit E un espace vectoriel normé. Une suite(xn) converge faiblement vers un point x∈E si et seulement

∀φ∈E, lim

n→∞hφ|xni=hφ|xi.

On écriraxn−→f x sixn converge faiblement versx.

(8)

(ii) Un ensemble C ⊆ E est dit faiblement fermé toute limite faible de points de C est inclue dansC.

(iii) Une fonction f : E → R est faiblement semi-continue inférieurement si et seulement si

∀x∈E, ∀xn−→f x, lim inf

n→∞ f(xn)≥f(x).

Remarque 16. Un ensemble faiblement fermé est fortement fermé, mais la réciproque est fausse en général.

Proposition 54. SoitC un ensemble convexe fermé (fortement) de E. AlorsC est aussi faiblement fermé.

Démonstration. Supposons que xn ∈C −→f x et que x6∈C. Par théorème de Hahn- Banach, on peut séparer le convexe ferméCet du pointxfortement : il existeφ∈E etε >0 tels que

∀z∈C,hφ|zi+ε≤ hφ|xi.

Alors, en particulier,lim suphφ|xni<hφ|xi, ce qui contredit la convergence faible de xn vers x.

Exemple 12 (Lemma de Mazur). Soit E un espace vectoriel normé,(xn) ∈EN une suite convergent faiblement vers un point x ∈ E. Alors, il existe une suite yk ∈ conv({xi|i∈N}) convergeant fortement versx.

Démonstration. Soit A = conv({xi | i∈ N}) et C = ¯A. L'ensemble convexe C est fermé fortement, et donc également fermé faiblement. Comme x est la limite faible des xn, x appartient à C, de sorte qu'il existe une suite yk ∈ A qui converge vers x.

Corollaire 55. Soit f :E →Rune fonction convexe (fortement) semi-continue inférieurement. Alors, f est faiblement semi-continue inférieurement.

Démonstration. Commef est convexe et semi-continue inférieurement, tout ses sous- niveau {f ≤ α} sont convexes et fortement fermés. Par la proposition précédente, les sous-niveaux de f sont aussi faiblement fermés, et f est dons faiblement semi- continue inférieurement.

Exemple 13. En particulier, toute fonction convexe fortement continue (comme la norme de l'espace) est faiblement sci.

Exemple 14. Soit H un espace de Hilbert et f : H → R une fonction convexe fortement semi-continue inférieurement et coercive, c'est-à-dire que

lim

kxk→+∞= +∞.

Alorsf admet un minimiseur global sur H.

(9)

Démonstration. SoitR > R0 := infHf. Soit(xn)∈Hune suite minimisante, c'est-à- dire telle quelimn→∞f(xn) =R0. Quitte à extraire une sous-suite, on peut supposer que (xn) appartient à l'ensemble C :={f ≤R}, qui par coercivité de f est borné.

Dans un espace de Hilbert, toute suite bornée admet une sous-suite convergeant faiblement, et on suppose doncxn −→f x∈E. De plus, comme f est fortement sci et convexe elle est faiblement sci, de sorte que R0 = lim infn→∞f(xn) ≥f(x). Ainsi, la fonction f admet un minimiseur global surE.

Exemple 15. Soit C un convexe fermé d'un espace de Hilbert H, et x ∈ H. La fonction f :y ∈H7→ kx−yk est évidemment coercive, et la fonctionF :y ∈H 7→

kx−yk+iC(x)est donc aussi. La fonctionF est convexe et sci fortement et elle est donc sci faiblement. Par la propriété précédente,F admet un minimiseur global sur H : ceci implique

y∈Hinf F(y) = inf

y∈Ckx−yk= min

y∈Ckx−yk, c'est-à-dire l'existence d'une projection surC.

3.2 Conjuguée de Legendre-Fenchel

3.2.1 Conjuguée de Legendre-Fenchel

Dénition 20. Soit E un espace vectoriel normé et f : E → R une fonction propre (dom(f) 6= ∅). On dénit sa conjuguée de Legendre-Fenchel par f : E →Rpar

f(φ) = sup

x∈E

hφ|xi −f(x).

L'application L:f 7→ f est appelée transformation de Legendre-Fenchel def. On notera parfois Lf pour la conjuguée def.

Remarque 17. Commef est propre, il existe x0 ∈dom(f). Ainsi,

∀φ∈E, f(φ)≥ hφ|x0i −f(x0),

etf est minorée par une fonction ane surE. En particulier, f>−∞. Exemple 16. Commençons par quelques exemples de calculs de conjuguées.

(i) Soit A un ensemble non-vide de E, etiA sa fonction indicatrice (iA= 0 surA et+∞ hors deA). Alors,

∀φ∈E, iA(φ) = sup

x∈E

hφ|xi −iA(x) = sup

x∈A

hφ|xi= hA

On peut donc voir la conjuguée de Legendre-Fenchel comme une généralisation de l'application qui à un convexe associe sa fonction support.

(10)

(ii) Soitf =k.k la norme de l'espaceE. Alors,

∀φ∈E, f(φ) = sup

x∈E

hφ|xi − kxk

Sikφk >1, il existe un pointxdansEtel quehφ|xi − kxk>0. En multipliant xparλ, on voit quef(φ)vaut+∞. Au contraire, sikφk≤1,hφ|xi − kxk ≤0 avec égalité lorsque x = 0. Ainsi, f(φ) = 0. Conclusion : f est la fonction indicatrice convexe de la boule unité pour la norme duale, i.e. f = iB où B ={φ∈E| kφk≤1}.

(iii) Soit f =φ0 une forme linéaire sur E. Alors, f(φ) = sup

x∈E

hφ|xi −φ0(x)

Si deux formes linéaires sont diérentes, alorssupx∈E(φ−φ0)(x) = +∞. Ainsi, f(φ) = +∞si φ6=φ0. Au contraire, f0) = 0. Conclusion, f=i0}. (iv) Soitf(x) = 1p|x|p surR. On identieR avec lui même. Poury≥0, on a

f(y) = sup

x∈R

xy− 1

p|x|p= sup

x≥0

xy−1 pxp

On peut calculer le supremum de la fonction x ∈ R+ 7→ xy − 1pxp, qui est concave, en annulant sa dérivée :

∂x(xy− 1

pxp) =y−xp−1= 0 =⇒x=y1/(p−1)

Ainsi, avecq =p/(p−1), on a (le cas y≤0se traitant de manière analogue)

∀y∈R, f(y) = sup

x∈R

xy− 1 p|x|p

=y1+1/(p−1)−1

pyp/(p−1)= (1−1/p)yp/(p−1)= 1/q|y|q

Proposition 56. La conjuguée de Legendre-Fenchel d'une fonction f :E → R propre vérie :

(i) Inégalité de Fenchel-Young : ∀x∈E,∀φ∈E, f(x) +f(φ)≥ hφ|xi.

(ii) f(0) = sup−f =−inff.

(iii) f est propre si et seulement si f est minorée par une fonction ane continue.

Exemple 17. Inégalité de Hölder : avecf(x) = 1p|x|p pourx∈R, on a : xy≤f(x) +f(y) = 1

p|x|p+1 q |x|q En sommant, on obtient que pourx, y∈Rn, si kxkp =kykq = 1,

hx|yi=

n

X

i=1

xiyi ≤ 1

pkxkp+ 1

qkykq ==kxkpkykq. Par homogénéité, cette inégalité reste vraie pour tout x, y∈Rn.

(11)

Hypothèse Conclusion Remarque f(x)≤g(x) f(φ)≥g(φ)

g(x) =iC(x) g(φ) =hC(φ)

g(x) =kxkE g(φ) =

(0 si kφk≤1 +∞ sinon

g(x) =kxk2H g(φ) =kφk2H H =Hilbert g(x) =φ0(x), φ0 ∈E g(φ) =i0}(φ)

g(x) =f(λx), λ6= 0 g(φ) =f(φ/λ) g(x) =λf(x), λ >0 g(φ) =λf(φ/λ) g(x) =f(x+b), b∈E g(φ) =f(φ)− hφ|bi

h(x) =fg(x) h(φ) =f(φ) +g(φ) cf Prop. 61 Table 3.1 Quelques règles pour calculer la conjuguée de Legendre d'une fonction.

Proposition 57. Soit f : E → R une fonction propre sur un espace vectoriel normé E. Alors, la conjuguée de f est convexe et semi-continue inférieurement sur E pour la topologie induite par la norme duale.

Démonstration. Il sut de remarquer que,x∈E étant xé, l'applicationφ∈E 7→

hφ|xi est linéaire et continue surE. Ainsi,f s'écrit comme un supremum de fonc- tions anes continues surE, et est donc convexe et sci.

Proposition 58. Soit f : E → R convexe, semi-continue inférieurement et propre. Alors, f est convexe, semi-continue inférieurement et propre.

Démonstration. Comme f est convexe semi-continue inférieurement et propre, elle est égale au suprémum de ses minorantes anes continues. En particulier, il existe une forme linéaireφ0 ∈E etα∈Rtelle que f ≥φ0+α. Ainsi,

f0) = sup

x∈E

0|xi −f(x)≤α, etf est donc bien propre.

3.2.2 Bi-conjuguée de Legendre-Fenchel

Dénition 21 (Biconjuguée). SoitE un espace vectoriel normé et g:E→R.

(12)

On notera Lg la conjuguée de Legendre inverse de g, dénie par Lg:E→R

x7→ sup

φ∈E

hx|φi −g(φ).

La bi-conjuguée de Legendre-Fenchel d'une fonction f :E → R est la fonction f∗∗=LLf, qui est donc dénie par

f∗∗(x) = sup

φ∈E

hφ|xi −f(φ).

Lemme 59. Pour toute fonction f :E→R on af∗∗≤f.

Démonstration. Par inégalité de Young, pour tout x∈E etφ∈E on a f(x) +f(φ)≥ hφ|xi.

En appliquant cette inégalité à la dénition def∗∗ on obtient bien f∗∗(x) = sup

φ∈E

hφ|xi −f(φ)≤f(x).

Théorème 60 (Fenchel-Moreau). Soit f :E →R une fonction propre. Alors, f∗∗= convf. En particulier f =f∗∗ si et seulement si f est convexe sci.

Remarque 18. Ce théorème implique en particulier que l'application qui à une fonc- tion convexe propre et sci associe sa conjuguée de Legendre-Fenchel est injective.

Démonstration. On sait déjà que f∗∗ ≤ f et que f∗∗ et sci, on a f∗∗ ≤ conv(f). Pour montrer l'autre inégalité, on utilise le fait que convf est égale au supremum des minorantes anes continues def. l sut donc de montrer quef∗∗est plus grande que toute minorante ane continue def. On suppose donc f ≥φ0+α oùφ0 ∈E etα∈R de sorte que

f0) = sup

x∈E

0|xi −f(x)≤sup

x∈E

0|xi −(φ0(x) +α) =−α.

Ainsi,

∀x∈E, f∗∗(x) = sup

φ∈E

hφ|xi −f(φ)≥ hφ0|xi −f0) =hφ0|xi+α.

3.2.3 Transformée de Legendre-Frenchel et inf-convolution

Dénition 22. Soient f, g : E → R deux fonctions propres dénies sur un espace vectorielE. L'inf-convolée def etgest la fonctionfg:E→R∪ {±∞}

(13)

dénie par

fg(x) = inf

u+v=x u,v∈E

f(u) +g(v) = inf

y∈Ef(y) +g(x−y).

Proposition 61. Soient f, g :E → R deux fonctions admettant une même mino- rante ane. Alors,fg:E→R est convexe, propre et (fg) =f+g

Démonstration. Il sut de choisir une forme linéaireφ∈E, et de calculer : (fg)(φ) = sup

x∈E

hφ|xi − inf

x1+x2=xf(x1) +g(x2)

= sup

x1,x2∈E

hφ|x1+x2i −(f(x1) +g(x2))

= sup

x1∈E

hφ|x1i −f(x1) + sup

x2∈E

hφ|x2i −g(x2)

=f(φ) +g(φ).

Exemple 18. SoitC un convexe fermé d'un espace vectoriel normé E, et dC(x) := inf

y∈Ckx−yk= inf

y∈Ekx−yk+iC(y) = (k.kiC)(x).

Alors,dC =iC+k.k = hC+iB où B ={φ∈E | kφk≤1}.

3.3 Sous-diérentiel

Dénition 23. Soit f : E → R une fonction sur un espace vectoriel normé et soit x0 un point de son domaine. Une forme linéaire φ ∈ E est appelée sous-gradient de f en x0 ∈dom(f)si

∀y∈E, f(y)≥f(x0) +hφ|y−x0i.

L'ensemble des sous-gradients def en x0 est appelé sous-diérentiel de f enx0 et noté ∂f(x0). Pour un point x0 n'appartenant pas au domaine de f, on pose

∂f(x0) :=∅.

Exemple 19. (i) Le sous-diérentiel de f en x0 est toujours un convexe fermé.

(ii) Soitf(x) =|v|= max(x,−x). En identiantR avecR, on a

∂f(x) =





−1 si x <0 1 si x >0 [−1,1] si x = 0 (iii) Soit E un espace vectoriel normé etf(x) =kxk. Alors,

φ∈∂f(0)⇐⇒ ∀x∈E,hφ|xi ≤ kxk ⇐⇒ kφk≤1 Ainsi,∂φ(0)est la boule unité dans l'espace dual.

(14)

(iv) Soit f(x) = −√

x sur [0,+∞[. Alors, ∂f(0) = ∅ bien que 0 appartienne au domaine de f.

Lemme 62. Une fonction f : E → R atteint son minimum global en x0 si et seulement si 0∈∂f(x0).

Démonstration. On raisonne par équivalences : x0 = arg min

x∈Ef(x)⇐⇒ ∀x∈E, f(x0) +h0|x0−xi ≤f(x)

⇐⇒0∈∂f(x0)

Proposition 63. Soit f : E → R une fonction convexe et x0 ∈dom(f). Le sous- diérentiel peut être exprimé en fonction de la dérivée directionnelle :

∂f(x0) ={φ∈E |f+(x0;·)≥φ}. (3.4) Démonstration. Soit A le second membre de l'égalité. Si φ ∈ A, on a pour tout v dansE,

φ(v)≤f+(x0;v) = inf

t>0

f(x0+tv)−f(x0)

t ≤f(x0+v)−f(x0)

Ainsi, en posanty=x0+v, on ahφ|yi ≤f(y)−f(x0)et doncφ∈∂f(x0). Récipro- quement, supposons queφ∈∂f(x0). Alors, pour v∈E,t >0ety=x0+tv,

hφ|y−x0i ≤f(x0+tv)−f(x0), En divisant partet en utilisant y−x0=tv, on a

hφ|vi=φ(v)≤ f(x0+tv)−f(x0) t

ceci étant vrai pour toutt >0, on a bienφ(v)≤f+(x0;v) et donc φ∈A.

Théorème 64. Soitf :E →Rune fonction convexe propre semi-continue inférieu- rement et x0 ∈dom(f). Si f est continue en x0, alors

(i) ∂f(x0) est non vide

(ii) ∂f(x0) est un convexe fermé borné deE.

(iii) La dérivée directionnelle def peut être exprimée en fonction du sous-diérentiel : f+(x0;v) = sup{hφ|vi |φ∈∂f(x0)}.

(iv) La fonctionf est Gâteaux-diérentiable en x0 si et seulement si∂f(x0)est un singleton. Si∂f(x0) ={φ}, alorsf+(x0;·) =φ.

(15)

Démonstration. (i) La fonction g = f+(x0;·) est convexe et continue. Elle admet donc une minorante ane continueφ+α où φ0 ∈E etα∈R. Alors,

∀x∈E, φ0(x) +α≤g(x) en posanty=tx, on a par sous-linéarité deg,

∀y∈E,∀t >0t(φ0(y) +α/t)≤tg(y)

en faisant tendre t vers +∞ on obtient doncg ≥φ0. Par la proposition précédente on en déduit queφ0 appartient au sous-diérentiel ∂f(x0) qui est donc non vide.

(ii) Commef est continue enx0, elle est lipschitzienne au visinage de ce point. Ceci implique facilement que f+(x;v) ≤ Rkvk, de sorte que si φ appartient au sous- diérentiel de ∂f(x0) on a φ(v) ≤ f+(x, v) ≤ Rkvk. Par dénition de la norme duale, on a donckvk≤R.

(iii) Il est facile de voir que pour toutφ∈∂f(x0) on af+(x0;·)≥φ, d'où l'inégalité f+(x0;v)≥g(v) := sup{hφ|vi |φ∈∂f(x0)}.

Soit v un élément de E. On peut dénir une forme linéaire φ sur la droite Rv par φ(v) =tf+(x0;v). Par la version fonctionnelle du théorème de Hahn-Banach,φpeut être étendue en une forme linéaire sur l'espace entier telle queφ≤f+(x0;·), de sorte queφ∈∂f(x0). Ainsi, par dénition de g on af+(x0;v) =hφ|vi ≤g(v).

(iv) Sif est Gâteaux-diérentiable, alorsφ0=f+(x0;·)est linéaire, et la proposition précédente implique que∂f(x0) ={φ0}. Si∂f(x0)est un singleton, alors par le point (iii),f+(x0;·) est linéaire continue, etf est donc Gâteaux-diérentiable enx0. 3.3.1 Sous-diérentiel et transformée de Legendre-Fenchel

Proposition 65. Soitf :E→Rune fonction convexe etx0∈E. Les conditions suivantes sont équivalentes :

(i) φ∈∂f(x);

(ii) f(x0) +f(φ) =hφ|x0i

Démonstration. On commence par remarquer qu'une forme linéaire continue φap- partient à∂f(x0) si et seulement si

∀y∈E, f(y)≥f(x0) +hφ|y−x0i ⇐⇒ ∀y∈E,hφ|yi −f(y)≤ hφ|x0i −f(x0)

⇐⇒f(φ) = sup

y∈Y

hφ|yi −f(y)≤ hφ|x0i −f(x0)

⇐⇒f(φ) +f(x0)≤ hφ|x0i

Avec l'inégalité de Fenchel-Young, on sait que l'inégalitéf(φ) +f(x0)≥ hφ|x0i est toujours vraie. Ceci montre l'équivalence entre (i) et (ii).

(16)

Théorème 66. Soit f :E→R une fonction convexe semi-continue inférieure- ment. Alors, pour tout x∈E et tout φ∈E, on a

φ∈∂f(x)⇐⇒x∈∂f(φ).

Démonstration. Comme f est convexe et semi-continue inférieurement, on sait que f∗∗=f. Ainsi on a

φ∈∂f(x)⇐⇒f(x) +f(φ) =hφ|xi

⇐⇒f∗∗(x) +f(φ) =hφ|xi

⇐⇒φ∈∂f(x),

où l'on a appliqué le critère de la proposition précédente à la fonction f.

Corollaire 67. Soitf :E →Rune fonction convexe propre semi-continue inférieu- rement. Alors, (i) implique (ii) où

(i) f =f∗∗ est strictement convexe sur son domaine ; (ii) pour tout φ∈dom(f), Card(∂f(φ))≤1.

Démonstration. Supposonsf strictement convexe sur son domaine et montrons (ii).

Par l'absurde, supposons qu'il existeφ∈dom(f)etx0 6=x1tels quex0, x1∈∂f(φ).

Alors, par convexité du sous-diérentiel, le segment xt= (1−t)x0+tx1 appartient à∂f(φ), et donc

∀t∈[0,1], f(φ) =hφ|xti −f(xt) =hφ|x0i −f(x0) =hφ|x1i −f(x1) Ainsi,f est linéaire sur le segment, ce qui contredit sa stricte convexité.

Références

Documents relatifs

[r]

le nombre (n+2)/2 reste tout seul ce qui est évidemment suffisant pour montrer que la somme des N+1 puissances k est divisble par

Le premier en prend les deux septièmes, le deuxième prend les deux cinquièmes du reste, le troisième prend les deux tiers du nouveau reste.. Il reste 6 bonbons dans

Dire : - S'exprimer à l'oral lors d'un débat scientifique, d'une présentation Écrire : - S’exprimer à l’écrit pour décrire, expliquer ou argumenter de façon claire

Découvrir du monde GS (numération): associer le nombre à la quantité.. Consigne : Colorie la case qui indique le bon

[r]

[r]

Montrer que f est égale au suprémum de ses minorantes anes continues.. En déduire que f est convexe et