R´egularisation du Lagrangien par rapport λ et cons´equences

7.2 Lagrangien augment´e et r´egularisation duale

7.2.3 R´egularisation du Lagrangien par rapport λ et cons´equences

b(x) = inf y∈X bx − y2/2 + f (y) + IXad(y) = inf y∈Xad bx − y2/2 + f (y).

Ensuite, le Théorème 7.11 s’applique évidemment, ce qui signifie que inf

x∈X ^f

Xad

b (x) = inf

y∈Xad f(y) .

Il est très important de noter que c’est la régularisation qui se fait sur Xâd puis la minimisation de la fonction régularisée sur toutX. On pourra se convaincre sur des exemples que le schéma inverse :

• calcul de la régularisée de f sur tout X, • puis minimisation de cette régularisée sur Xad,

ne fonctionne pas.

7.2.3 R´egularisation du Lagrangien par rapport λ et cons´equences

Revenons `a l’expression (7.3d) de la fonctionζb. Elle montre que la fonctionλ #→ ζb(θ, λ) peut ˆetre

considérée comme la régularisée de la fonctionλ #→ λ , θ, vue comme une fonction concave,3 pour la constante 1/b et sur le sous-ensemble C_{. Une conséquence immédiate de cette observation est que}

le Lagrangien augmenté L_b est aussi la régularisée du Lagrangien ordinaire L par rapport à la variable duale λ pour la constante 1/b et sur le sous-ensemble C_{. Cette remarque va avoir de multiples et}

int´eressantes cons´equences.

Théorème 7.13. Le Lagrangien ordinaire L sur Uâd× C_{et le Lagrangien augmenté L}

b sur U^ad× C∗

ont les mˆemes points selle.

D´emonstration. Consid´erons un point selle u", λ"_{de L sur U}ad× C_:

∀λ ∈ C, L(u^", λ) ≤ L(u^", λ^") , (7.7a) ∀u ∈ Uad, L(u^", λ^") ≤ L(u, λ^") . (7.7b) L’in´egalit´e (7.7a) indique que la fonctionλ #→ L(u", λ) atteint son maximum sur C _{au point}λ"_{. Le}

Théorème 7.11 nous apprend que l’on peut en dire autant pour sa régulariséeλ #→ Lb(u", λ), la

maximi-sation portant maintenant sur toutC∗_{. En particulier, les valeurs maximales L}(u", λ") et Lb(u", λ") sont

égales. Ceci nous fournit donc l’inégalité de gauche du point selle de L_bsur Uâd× C∗_.

Considérons maintenant l’inégalité (7.7b). Le fait queζb(θ, ·) soit la régularisée de · , θ − IC(·)

(cas concave), ou directement la formule (7.3d), montre queζb(θ, λ) ≥ λ , θ − IC(λ) et en particulier

∀u, ζb

#(u), λ"

≥λ", #(u)

puisque I_C(λ") = 0. Il découle de cette inégalité et de (7.7b) l’inégalité de droite pour le point selle

de Lb. Finalement,(u", λ") est un point selle de Lbsur U^ad× C∗_.

R´eciproquement, soit (u", λ") un point selle de Lb sur U^ad × C∗_{. Pour obtenir (7.7a), on utilise}

exactement l’argument symétrique du précédent comme l’autorise le Théorème 7.11 qui fonctionne dans les deux sens. On observe aussi qu’en raison du fait queλ #→ Lb(u", λ) atteint son maximum en λ sur

toutC∗ _{au point}λ" _{et du fait que cette fonction est différentiable en}λ, sa dérivée en λ au point λ" _est

nulle. Alors,

(Lb)_λ(u^", λ^") = (ζb)_λ#(u^"), λ^"= 0 ⇒ (ζb)_θ#(u^"), λ^"= λ^" ,

la dernière implication résultant de la relation (7.5). Cette remarque débouche sur l’autre inégalité du point selle pour L. En effet, admettons pour l’instant (voir Exercice 7.14 ci-après) que l’inégalité de droite du point selle pour Lbsoit équivalente à la condition d’optimalité :

∀u ∈ Uad, J(u) − J(u^") +(ζb)_θ#(u^"), λ^", #(u) − #(u^")≥ 0 .

Si on tient compte dans cette inéquation variationnelle de la remarque précédente, on obtient l’inégalité de droite du point selle pour L et la démonstration est complète.

Exercice 7.14. `A titre de généralisation des conditions d’optimalité du§5.1.4, considèrer le problème

min

u∈Uad

J(u) + GH(u),

o ù Uâd ⊂ U est convexe fermé, J : U → R est une fonction convexe s.c.i. H : U → C est une application à valeurs dansC muni d’un “cône positif” C (convexe fermé), H étant C-convexe et continue,

G :C → R est une fonction convexe, C-non décroissante, continue et différentiable, et montrer qu’une solution optimale u" _{(supposée exister) peut être caractérisée par}

∀u ∈ Uad, J(u) − J(u") +G

H(u"), H (u) − H (u")≥ 0 .

Indication : on commencera par transformer le problème en le problème équivalent (à démontrer !)

min

u∈Uad,c∈C

J(u) + G(c) sous H(u) − c ∈ −C ,

Du fait que Lb(u, ·) est la régularisée de L(u, ·) (plus précisément de L − IC(·)) avec la constante

1/b, et étant donné que, d’après (6.29), la fonction ψ est définie par minimisation en u de L(u, ·)−IC(·),

cela sugg`ere que si l’on d´efinit :

∀λ ∈ C^∗, ψb(λ)def

= inf

u∈Uad Lb(u, λ) , (7.8)

alorsψbdevrait être la régularisée deψ avec la constante 1/b (régularisation sur tout l’espace). C’est ce

que nous montrons maintenant.

Théorème 7.15. La fonctionψbdéfinie par (7.8) est la régularisée concave deψ définie par (6.29) avec

la constante 1/b.

Démonstration. Si on attaque la démonstration directement à partir des définitions de ψ et ψb et de

l’expression (7.3d) qui a permis d’interpréterζb(θ, ·) elle-même comme la régularisation de · , θ, on

doit commuter un inf_u∈Uad et un supµ∈C pour parvenir au r´esultat. La fonction de u, µ en cause (`a

savoir L(u, µ)−λ − µ2/2b avec λ comme param`etre) est bien convexe-concave, s.c.i.-s.c.s. et mˆeme

coercive enµ grâce au terme quadratique. Mais, pour appliquer le Théorème 6.13 d’existence de point

selle qui permettrait cette commutation, il nous manque une hypothèse de coercivité en u que nous n’avons pas faite, préférant simplement postuler l’existence d’une solution u" _{au problème (6.1).}

C’est pourquoi, une autre preuve possible consiste à utiliser plut ôt la formule initiale (7.3c) pourζb. On a donc à calculer ψb(λ) = inf u∈Uad J(u) + ζb#(u), λ = inf u∈Uad inf c∈C

J(u) + λ , #(u) + c + b #(u) + c2/2

= inf

u∈Uadinf

c∈C_µ∈C^sup∗

J(u) + λ , #(u) + c + b #(u) + c2/2 − µ , c

par dualit´e comme dans la d´emonstration du Lemme 7.5, = sup

µ∈C∗ inf

u∈Uadinf

c∈C

J(u) + λ , #(u) + c + b #(u) + c2/2 − µ , c

car la contrainte c∈ C ´etant affine est qualifi´ee, = sup µ∈C∗ inf u∈Uad J(u) + µ , #(u)− λ − µ2/2b

par minimisation explicite en c = sup µ∈C∗ inf u∈Uad L(u, µ) − λ − µ2/2b = sup µ∈C∗ ψ(µ) − λ − µ2/2b,

o ù l’on reconnaˆıt la régularisée deψ sur C∗_.

On énonce maintenant un résultat fondamental qui peut être considéré comme l’aboutissement et le but ultime de toute la démarche du Lagrangien augmenté.

D´emonstration. Il nous faut montrer que si U"× &"_{est l’ensemble des points selle de L}_b_{sur U}ad× C∗_,4

alors, pour toutλ"∈ &"_{et tout}u∈ arg minu∈Uad Lb(u, λ"), u est aussi dans U"_.

Si λ" ∈ &"_{, alors} λ" _{appartient aussi `a arg max}

λ∈C∗ψb(λ). Or cette fonction est diff´erentiable

(comme régularisée de ψ) et puisqu’elle atteint son maximum sur tout C∗ _en λ"_{, alors sa dérivée en}

λ"_{est nulle. Pour tout}u ∈ arg minu∈Uad L_b(u, λ"), on sait que (Lb)

λ(u, λ") constitue un sur-gradient de

ψb au pointλ"_{, compte tenu de la définition (7.8) de}ψb et de l’analogue de (4.26) pour les fonctions concaves. Maisψb étant dérivable, cette expression est en fait la dérivée deψbenλ"_{, et cette dérivée est}

nulle ; donc

(Lb)_λ(u, λ^") = 0 .

Cette ´egalit´e montre que l’applicationλ #→ Lb(u, λ) est aussi maximale en λ"_{, et ceci n’est rien d’autre}

que l’inégalité de gauche du point selle de Lbsur Uâd× C∗_{pour le couple}(u, λ"). L’inégalité de droite

pour le même couple provient tout simplement de la définition même deu. Par conséquent, ce couple est

un point selle de Lbet doncu∈ U"_.

Dans le document Convexité et Optimisation (Page 134-137)