• Aucun résultat trouvé

3 Points-selles et duality gap de la fonction de Lagrange

N/A
N/A
Protected

Academic year: 2022

Partager "3 Points-selles et duality gap de la fonction de Lagrange"

Copied!
35
0
0

Texte intégral

(1)

Dualit´e Lagrangienne

Guillaume Lecu´e1

Le but de cette section est de pr´esenter une approche permettant de donner des informa- tions suppl´ementaires sur les coefficients de Lagrange λ1, . . . , λr, µ1, . . . , µl apparaissant dans le th´eor`eme de KKT grˆace `a des r´esultats de dualit´e.

L’id´ee de l’approche par dualit´e Lagrangienne est de donner une minoration du probl`eme initial minKf (qu’on appellera maintenant probl`eme primal) par un autre probl`eme, en g´en´eral, plus facile `a r´esoudre. Tout l’enjeu en dualit´e Lagrangienne est alors de montrer que cette minoration est exacte sous certaines conditions.

Pour fixer les id´ees, on donne maintenant la minoration du probl`eme primal car elle fait apparaˆıtre la fonction de Lagrange dont l’´etude est au centre de cette section. On consid`ere alors le probl`eme d’optimisation sous contrainte dans sa forme g´en´erale

minx∈Kf(x) (0.1)

o`u f :U →R,U est un ouvert de Rn etK est une contrainte de la forme K=

x∈U : g1(x) =· · ·=gr(x) = 0 h1(x)≤0, . . . , hl(x)≤0

pour g1, . . . , gr :U →R d´efinissant les contraintes d’´egalit´e et h1, . . . , hl :U →R d´efinissant les contraintes d’in´egalit´e. On voit que pour tout x∈K et tout (λ, µ)∈Rr×(R+)l on a

f(x)≥f(x) +

r

X

i=1

λigi(x) +

l

X

j=1

µjhj(x) :=L(x,(λ, µ)).

En particulier, on a (pour tout (λ, µ)∈Rr×(R+)l) minx∈Kf(x)≥min

x∈UL(x,(λ, µ)) :=ψ(λ, µ)

(on minimise bienL(·,(λ, µ)) sur toutU alors que f n’est minimis´ee que sur K – on souhaite en effet retrouver le probl`eme primal `a gauche et un probl`eme non contraint (donc sens´e ˆetre plus facile `a r´esoudre) `a droite). Ce dernier r´esultat ´etant vrai pour tout (λ, µ))∈Rr×(R+)l, on peut prendre le maximum `a droite :

minx∈Kf(x)≥ sup

(λ,µ)∈Rr×(R+)l

ψ(λ, µ). (0.2)

La fonctionLest appel´eefonction de LagrangeouLagrangienassoci´e au probl`eme primal (0.1). La fonction ψ est appel´ee fonction duale et le probl`eme qui cherche `a la maximiser est

1. CREST, ENSAE. Bureau 3029, 5 avenue Henry Le Chatelier. 91 120 Palaiseau. Email : guillaume.lecue@ensae.fr.

(2)

appel´e leprobl`eme duale. L’objectif de cette section est d’identifier des situations o`u le probl`eme dual permet de r´esoudre le probl`eme primal.

L’analyse pr´ec´edente montre que le probl`eme dual peut toujours ˆetre utilis´e pour minorer le probl`eme primal (et ceci sans aucune hypoth`ese) – c’est ce qu’on appellera plus tard, ladualit´e faible. Les situations qui nous int´eressent sont celles pour lesquelles cette minoration est exacte, c’est-`a-dire quand

minx∈Kf(x) = sup

(λ,µ)∈Rr×(R+)l

ψ(λ, µ).

On parlera dans ce cas dedualit´e forte. On voit que cette ´egalit´e est en fait ´equivalente `a avoir minx∈U sup

(λ,µ)∈Rr×(R+)l

L(x,(λ, µ)) = sup

(λ,µ)∈Rr×(R+)l

minx∈UL(x,(λ, µ)).

C’est donc un probl`eme d’interversion de ”min” et de ”sup” de la fonction de Lagrange qu’on va chercher `a r´esoudre. On cherchera donc `a identifier les situations pour lesquelles cette interversion est exacte. On s’int´eresse donc aux propri´et´es de dualit´e forte de L et aux probl`emes de mini- maximisation de L. La section suivante ´etudie ces propri´et´es dans un cadre g´en´erale. On les appliquera par la suite au cas particulier de la fonction de Lagrange pour en d´eduire des liens entre probl`eme primal et probl`eme dual. En particulier, ces liens nous seront utiles `a la fois pour d´eterminer des solutions au probl`eme primal `a l’aide du probl`eme dual mais aussi pour construire des algorithmes et des crit`eres d’arrˆet.

1 Probl` emes de mini-maximisation et points selles

Dans cette section, on donne des r´esultats g´en´eraux sur les probl`emes de mini-maximisation et leurs solutions pour des fonctions L `a deux variables quelconques. On les appliquera par la suite `a la fonction de Lagrange en cas particulier.

D´efinition 1.1 Soient X et Y deux espaces. Soit L: X×Y → R et (x, y) ∈ X×Y. On dit que (x, y) est un point-selle de L sur X×Y quand pour tout (x, y)∈X×Y, on a

L(x, y)≤ L(x, y)≤ L(x, y).

On peut par exemple voir que (0,0) est un point-selle de L : (x, y) → x2−y2+ 2 car pour tout (x, y)∈R×R, on aL(0, y)≤ L(0,0)≤ L(x,0).

D´eterminer les points-selle de la fonction de Lagrange associ´ee `a un probl`eme d’optimisation sous contraintes nous sera utile pour r´esoudre ce probl`eme d’optimisation sous contraintes.

Dans cette section on va s’int´eresser aux probl`emes de minimaximisation de L, c`ad aux pro- bl`emes de la forme

sup

y∈Y

x∈Xinf L(x, y) ou inf

x∈Xsup

y∈Y

L(x, y).

On va identifier des conditions assurant que les deux probl`emes sont en fait identiques.

D´efinition 1.2 Etant donn´´ es X et Y deux espaces et L : X ×Y → R. On appelle fonction primale la fonction ϕ: x ∈ X → supy∈Y L(x, y) (`a valeurs +∞ ´eventuellement). Le probl`eme d’optimisationinfx∈Xϕ(x)est appel´eprobl`eme primal. De mˆeme, lafonction dualeest d´efinie par ψ : y ∈ Y → infx∈XL(x, y) (`a valeurs −∞ ´eventuellement). Le probl`eme d’optimisation supy∈Y ψ(y) est appel´eprobl`eme dual. Dans la fonction, (x, y)∈X×Y → L(x, y), la variable x est appel´eevariable primale et la variabley est appel´ee variable duale.

(3)

Proposition 1.3 (dualit´e faible) Etant donn´´ es X et Y deux espaces et L :X×Y → R. On noteϕ la fonction primale etψ la fonction duale. On a supy∈Y ψ(y)≤infx∈Xϕ(x).

Preuve. On a pour tout x ∈ X et y ∈ Y, L(x, y) ≤ supy∈Y L(x, y) et donc infx∈XL(x, y) ≤ infx∈Xsupy∈Y L(x, y). Ceci ´etant vrai pour tout y, on obtient

sup

y∈Y

x∈Xinf L(x, y)≤ inf

x∈Xsup

y∈Y

L(x, y)

ce qui est, par d´efinition deψ etϕ, ´equivalent `a supy∈Y ψ(y)≤infx∈Xϕ(x).

La Proposition (1.3) dit qu’on a toujours de la dualit´e faible : ψ := sup

y∈Y

x∈Xinf L(x, y)≤ inf

x∈Xsup

y∈Y

L(x, y) =:ϕ (1.1) Autrement ditϕ−ψ ≥0 et la quantit´e ϕ−ψ est appel´eeduality gap. On va identifier des situations o`u l’in´egalit´e inverse a aussi lieu dans (1.1), c`ad quand le duality gap est nul.

D´efinition 1.4 Le duality gap est ϕ −ψ ≥ 0. Quand le duality gap est nul (c`ad quand ϕ), on dit qu’on adualit´e forte.

Les trois propositions qui suivent vont ´etablir des liens entre dualit´e forte, existence de points- selle, solutions du probl`eme primal et solutions du probl`eme dual.

Proposition 1.5 Etant donn´´ es X et Y deux ensembles, L:X×Y →Ret (x, y)∈X×Y. Il y a ´equivalence entre les points suivants :

1) (x, y) est un point-selle de L sur X×Y 2) ϕ(x)≤ψ(y)

3) ϕ(x) =ψ(y)

4) ϕ(x) =ψ(y) =L(x, y)

Preuve. 1)⇒2) Comme (x, y) est un point-selle de L, on a pour tout (x, y) ∈ X ×Y, L(x, y)≤ L(x, y)≤ L(x, y). Ainsi en passant au sup sur y∈Y `a gauche et `a l’inf surx∈X

`

a droite, on obtient

ϕ(x) = sup

y∈Y

L(x, y)≤ L(x, y)≤ inf

x∈XL(x, y) =ψ(y).

2)⇒3) Par d´efinition de ϕ, on a pour tout x ∈ X, ϕ(x) ≥ L(x, y) pour tout y ∈ Y. En particulier, poury, on aϕ(x)≥ L(x, y). Alors en passant `a l’inf surx∈X, on obtient

ϕ(x)≥ inf

x∈Xϕ(x)≥ inf

x∈XL(x, y) =ψ(y).

Ainsi si on suppose que 2) est vraie, on a bien 3).

3)⇒4) Par d´efinition de ϕetψ, on a toujours ϕ(x) = sup

y∈Y

L(x, y)≥ L(x, y)≥ inf

x∈XL(x, y) =ψ(y).

Alors si on suppose queϕ(x) =ψ(y), on en d´eduit bien qu’il n’y a que des ´egalit´es dans la suite d’´egalit´e ci-dessus et doncϕ(x) =L(x, y) =ψ(y).

4)⇒1) Par d´efinition de ϕetψ, on a pour toutx∈X ety∈Y, L(x, y)≤ϕ(x) =L(x, y) =ψ(y)≤ L(x, y).

Donc (x, y) est bien un point selle de Lsur X×Y.

(4)

Proposition 1.6 Etant donn´´ es X et Y deux ensembles, L:X×Y →Ret (x, y)∈X×Y. Il y a ´equivalence entre les points suivants :

1) (x, y) est un point-selle de L sur X×Y

5) x atteint l’infimum de ϕ sur X (c`ad x est solution du probl`eme primal), y atteint le supremum deψsurY (c`adyest solution du probl`eme dual) etϕ(x) =ψ(y) =L(x, y).

Preuve. 1)⇒5) D’apr`es la Proposition 1.5, on sait que 1) implique 4) donc

x∈Xinf ϕ(x)≤ϕ(x) =L(x, y) =ψ(y)≤sup

y∈Y

ψ(y). (1.2)

Par ailleurs, la Proposition 1.3dit qu’on a toujours de la dualit´e faible c`ad sup

y∈Y

ψ(y)≤ inf

x∈Xϕ(x).

Ainsi, la dualit´e faible implique la suite d’´egalit´es suivante dans (1.2)

x∈Xinf ϕ(x) =ϕ(x) =L(x, y) =ψ(y) = sup

y∈Y

ψ(y).

En particulier, infx∈Xϕ(x) est atteint enx, supy∈Y ψ(y) est atteint eny etϕ(x) =L(x, y) = ψ(y). Donc 5) est vrai.

5)⇒1) Comme 5) est plus fort que 4) dans la Proposition 1.5 et que 4) implique 1), on a bien le r´esultat.

Proposition 1.7 Etant donn´´ es X et Y deux espaces, L :X×Y → R et (x, y)∈X×Y. Il y a ´equivalence entre les points suivants :

1) (x, y) est un point-selle de L sur X×Y

6) x atteint l’infimum de ϕ sur X (c`ad x est solution du probl`eme primal), y atteint le supremum deψ sur Y (c`ady est solution du probl`eme dual) et le duality gap est nul.

Preuve. D’apr`es la Proposition 1.3, on a toujours sup

y∈Y

ψ(y)≤ inf

x∈Xϕ(x).

Ainsi, dire que le duality gap est nul est ´equivalent `a dire que

x∈Xinf ϕ(x)≤sup

y∈Y

ψ(y). (1.3)

1)⇒6) D’apr`es la Proposition 1.6, 1) implique 5), il reste donc seulement `a montrer (1.3).

Par ailleurs, d’apr`es 5), infx∈Xϕ(x) est atteint par x et supy∈Y ψ(y) est atteint par y. On a donc

x∈Xinf ϕ(x) =ϕ(x) =ψ(y) = sup

y∈Y

ψ(y).

Donc (1.3) est satisfaite.

6)⇒1) D’apr`es 6), on a

ϕ(x) = inf

x∈Xϕ(x) = sup

y∈Y

ψ(y) =ψ(y).

Donc 3) est vrai et donc d’apr`es la Proposition1.5, 1) est vrai.

La Proposition 1.7permet donc d’assurer la dualit´e forte (c`ad un duality gap nul) quand il y a un point-selle. La r´eciproque est aussi vraie si de plus le probl`eme primal et le probl`eme dual ont une solution. Dans ce dernier cas, le couple form´e par ces solutions est un point-selle.

(5)

2 Fonction de Lagrange

Dans cette section, on introduit une fonction associ´ee `a un probl`eme d’optimisation sous contrainte, c’est la fonction de Lagrange qu’on a d´ej`a vu en d´ebut de chapitre. Il sera int´eressant de d´eterminer les points-selle de cette fonction pour r´esoudre le probl`eme d’optimisation initial.

On consid`ere un probl`eme d’optimisation sous contrainte dans sa forme g´en´erale

minx∈Kf(x) (2.1)

o`u f :U →R,U est un ouvert de Rn etK est une contrainte de la forme K=

x∈U : g1(x) =· · ·=gr(x) = 0 h1(x)≤0, . . . , hl(x)≤0

(2.2) pour g1, . . . , gr :U →R d´efinissant les contraintes d’´egalit´e et h1, . . . , hl :U →R d´efinissant les contraintes d’in´egalit´e.

D´efinition 2.1 La fonction de Lagrange ou Lagrangien associ´e(e) au probl`eme d’optimisa- tion sous contrainte (2.1) o`u K est d´efini dans (2.2) est d´efini(e) par

L:

U×(Rr×(R+)l) → R (x,(λ, µ)) → f(x) +Pr

i=1λigi(x) +Pl

j=1µjhj(x).

Les variables λ∈Rr et µ∈(R+)l sont appel´ees les multiplicateurs de Lagrange.

Dans la suite, on ´etudie les points-selles de L. On montrera, en particulier, les liens entre points-selles de L et les solutions au probl`eme (2.1). On commence par identifier les fonctions primales et duales associ´ees `aL comme d´efinie dans la section pr´ec´edente.

La fonction primale associ´ee `a la fonction de Lagrange est donn´ee pour toutx∈U par ϕ(x) = sup

(λ,µ)∈Rr×(R+)l

L(x,(λ, µ)) =

f(x) ifx∈K +∞ otherwise.

La fonction primaleϕdeLco¨ıncide donc avecf surKet vaut +∞en dehors deK. En particulier, minimiser ϕ sur U est ´equivalent `a minimiser f sur K et donc le probl`eme primal associ´e `a la fonction de Lagrange est exactement le probl`eme (2.1) qu’on souhaite r´esoudre.

Pour la fonction duale associ´ee `aL, on rappelle sa d´efinition : ψ: (λ, µ)∈Rr×(R+)l→ inf

x∈UL(x,(λ, µ)) (2.3)

et le probl`eme dual associ´e est

sup

(λ,µ)∈Rr×(R+)l

ψ(λ, µ). (2.4)

Le probl`eme dual est un probl`eme d’optimisation sous-contrainte mais il a deux avantages : 1) la contrainte n’est faite que delcontraintes d’in´egalit´e qu’on peut ´ecrire de mani`ere abr´eg´ee

par “µ≥0”; c’est une contrainte “facile” car il est facile de projeter dessus (on reviendra sur ce point plus tard lorsqu’on parlera de l’algorithme de Uzawa)

2) la fonction duale est facile `a maximiser car elle est concave.

Le probl`eme duale est un probl`eme d’optimisation convexe car c’est un probl`eme de maximisation d’une fonction concave sur un ensemble convexe (qui est donc ´equivalent `a un probl`eme de minimisation d’une fonction convexe sur un convexe). Ceci est vrai tout le temps, sans aucune hypoth`ese ni sur K ni surf comme on le montre dans le r´esultat ci-dessous.

(6)

Proposition 2.2 La fonction dualeψ d´efinie dans (2.3) est concave.

Preuve. Pour toutx∈U, la fonction (λ, µ)∈Rr×(R+)l → L(x,(λ, µ)) est une fonction affine.

Ainsi,ψ est l’enveloppe inf´erieure d’une famille de fonction affine, elle est donc concave. En effet, pour toutx∈U, (λ0, µ0), (λ1, µ1) et α∈[0,1], on a

L(x, α(λ0, µ0) + (1−α)(λ1, µ1)) =αL(x,(λ0, µ0)) + (1−α)L(x,(λ1, µ1)).

On prend ensuite l’inf en x∈U des deux cˆot´es et comme l’inf d’une somme et plus grand que la somme des infs on conclut.

L’id´ee centrale de la dualit´e Lagrangienne est que le probl`eme dual (2.4) va nous aider `a r´esoudre le probl`eme primal qui est ici exactement le probl`eme d’optimisation (2.1) qu’on souhaite r´esoudre. Le lien entre les solutions du probl`eme dual et les solutions du probl`eme primal se fait grˆace aux points-selles de la fonction de Lagrange quand le duality gap est nul. Identifier les situations o`u le duality gap de la fonction de Lagrange est nul est donc une question centrale en dualit´e Lagrangienne.

3 Points-selles et duality gap de la fonction de Lagrange

Dans cette section, on fait d’abord le lien entre des conditions proches de KKT (points i), ii) et iii) ci-dessous) et l’existence d’un point-selle de la fonction de Lagrange (et donc de la dualit´e forte et de solution primale et duale). Puis, en utilisant le lien entre points-selles de la fonction de Lagrange et solution du probl`eme (2.1) on ´etablit un lien entre solution du probl`eme dual et solution du probl`eme (2.1) sous l’hypoth`ese que le duality gap est nul.

Th´eor`eme 3.1 Soit(x,(λ, µ))∈U×(Rr×(R+)l). Il y a ´equivalence entre :

1) (x,(λ, µ))est un point-selle deL(L´etant la fonction de Lagrange de la D´efinition2.1), 7) (x,(λ, µ)) v´erifie :

i) x minimise x∈U → L(·,(λ, µ)) sur U, ii) x∈K,

iii) µjhj(x) = 0 pour tout j= 1, . . . , l.

Preuve. 1)⇒7) On suppose que (x,(λ, µ)) est un point-selle deLalors pour tout x∈U et (λ, µ)∈Rr×(R+)l, on a

L(x,(λ, µ))

(a)

≤ L(x,(λ, µ))

(b)

≤ L(x,(λ, µ)).

On d´eduit de (b) quex minimisex∈U → L(·,(λ, µ)) surU. On d´eduit de (a) que sup

(λ,µ)∈Rr×(R+)l

L(x,(λ, µ))≤ L(x,(λ, µ))<+∞

et donc x ∈ K, sinon on aurait sup(λ,µ)∈Rr×(R+)lL(x,(λ, µ)) = +∞. Il ne reste plus qu’`a d´emontrer la complementary condition : “µjhj(x) = 0 pour tout j= 1, . . . , l.”

Commex∈K, on peut r´e´ecrire(a) comme : pour tout µ≥0, f(x) +

l

X

j=1

µjhj(x)≤f(x) +

l

X

j=1

µjhj(x).

(7)

Commehj(x)≤0 et µ≥0, on a 0 = sup

µ≥0 l

X

j=1

µjhj(x)≤

l

X

j=1

µjhj(x)≤0 et donc Pl

j=1µjhj(x) = 0, mais comme chaque terme de cette somme est n´egatif (carµj ≥0 et hj(x)≤0 vu quex∈K), chaque terme doit ˆetre nul c`ad µjhj(x) = 0 pour tout j= 1, . . . , l.

7)⇒1) Par hypoth`ese,x minimisex∈U → L(·,(λ, µ)) surU donc pour toutx∈U, L(x,(λ, µ))≤ L(x,(λ, µ)).

Il reste donc `a montrer que pour tout (λ, µ)∈Rr×(R+)l, on a L(x,(λ, µ))≤ L(x,(λ, µ)).

Comme x ∈ K, on a gi(x) = 0 pour tout i = 1, . . . , r et comme µjhj(x) = 0 pour tout j= 1, . . . , l, on a

L(x,(λ, µ)) =f(x) +

r

X

i=1

λigi(x) +

l

X

j=1

µjhj(x) =f(x).

Par ailleurs, si (λ, µ)∈ Rr×(R+)l on a λigi(x) = 0 carx ∈K et µjhj(x) ≤0 car µj ≥0 et hj(x)≤0 donc

L(x,(λ, µ)) =f(x) +

r

X

i=1

λigi(x) +

r

X

j=1

µjhj(x)≤f(x) =L(x,(λ, µ)).

On obtient donc bien que (x,(λ, µ)) est un point-selle de L.

D’apr`es le Th´eor`eme 3.1, il suffit de trouver un point (x,(λ, µ)) satisfaisant i), ii) et iii) pour assurer l’existence d’un point-selle deLet donc la dualit´e forte, une solutionx au probl`eme primal et une solution (λ, µ) au probl`eme dual. Dans le cas de l’OCD, ces trois conditions sont

´

equivalentes aux conditions KKT car dans ce cadre L(·,(λ, µ)) est convexe et donc dire que x est un point critique (comme dans les conditions KKT) est ´equivalent `a dire que c’est un minimum (comme dansi)).

On fait finalement le lien entre solutions du probl`eme dual et solution du probl`eme primal sous l’hypoth`ese que le duality gap de la fonction de Lagrange est nul.

Th´eor`eme 3.2 On suppose que le duality gap de la fonction de Lagrange est nul. Si(λ, µ) est une solution du probl`eme dual (2.4) alors il y a ´equivalence entre :

8) x est solution du probl`eme (2.1) 7) (x,(λ, µ)) v´erifie :

i) x minimise x∈U → L(·,(λ, µ)) sur U, ii) x∈K,

iii) µjhj(x) = 0 pour tout j= 1, . . . , l.

Preuve. D’apr`es le Th´eor`eme 3.1, il y a ´equivalence entre 1) et 7). De plus, d’apr`es la Pro- position 1.7, il y a ´equivalence entre 1) et 6) : “x atteint l’infimum de ϕ sur X, y atteint le supremum de ψ sur Y et le duality gap est nul” qui, appliqu´e au cas particulier de la fonction de Lagrange, s’´enonce sous la forme : “x est solution du probl`eme (2.1), (λ, µ) est solution du probl`eme dual et le duality gap est nul”. Ainsi, si on suppose que (λ, µ) est solution du probl`eme dual et le duality gap est nul, on a bien ´equivalence entre 7) et 8).

(8)

En cons´equence, identifier les situations o`u le duality gap de la fonction de Lagrange est nulle permet de r´esoudre le probl`eme initial d’optimisation `a partir du probl`eme dual. En effet, dans ce cas (c`ad quand le duality gap est nul), on peut d’abord r´esoudre le probl`eme dual (qui a des contraintes “faciles” et une fonction objectif concave `a maximiser) : on obtient une solution (λ, µ). A l’aide de cette solution (λ, µ) (on peut ici prendre n’importe quelle solution au probl`eme duale), on peut identifier toutes les solutions du probl`eme primal (c’est le probl`eme qui nous int´eresse), en r´esolvant le probl`eme d’optimisation sans contrainte :“minimiser x∈U → L(x,(λ, µ)) surU” et en ne gardant que le ou les solution(s) x de ce probl`eme pour laquelle ou lesquelles on ax∈K et µjhj(x) = 0,∀j= 1, . . . , l.

4 Qualification de contrainte et dualit´ e Lagrangienne

Dans la section pr´ec´edente, on a vu que sous hypoth`ese que le duality gap est nul, on peut retrouver toutes les solution du probl`eme primal grˆace au probl`eme dual et en solutionnant un probl`eme d’optimisation sans contrainte. N´eanmoins, v´erifier que le duality gap est nul peut ˆetre difficile (voir cependant les th´eor`emes g´en´eraux `a ce sujet en Section9).

On peut simplifier cette approche en supposant la qualification de la contrainte. On peut en effet faire un lien entre la qualification de contrainte et l’existence d’un point-selle de la fonction de Lagrange (et donc d’un duality gap nul). On peut par exemple, montrer le th´eor`eme suivant grˆace au th´eor`eme de KKT.

Th´eor`eme 4.1 (Th´eor`eme du point-selle) Soit x∈U. On a :

1) S’il existe (λ, µ) ∈Rr×(R+)l tel que (x,(λ, µ)) est un point-selle de L alors x est solution de (2.1).

2) On suppose que U est un ouvert convexe et que les fonctions d´efinissant les contraintes sont telles queg1, . . . , gr sont affines eth1, . . . , hlsont convexes. Six est solution de (2.1) et que K est qualifi´ee en x alors il existe (λ, µ) ∈Rr×(R+)l tel que (x,(λ, µ)) est un point-selle de L.

Preuve. 1)⇒2) On sait d’apr`es la Proposition1.6 que si (x,(λ, µ)) est un point-selle de L alors x est solution du probl`eme primal, donc du probl`emes (2.1) dans le cas de la fonction de Lagrange (et aussi que (λ, µ) est solution du probl`eme dual et le duality gap est nul).

2)⇒1) D’apr`es le Th´eor`eme de KKT, commeK est qualifi´ee enx et quex est solution de (2.1), on sait qu’il existe (λ, µ)∈Rr×(R+)ltel que∇xL(x,(λ, µ)) = 0 etµjhj(x) = 0 pour toutj= 1, . . . , l. Or sous les hypoth`eses que lesgi sont affines et leshj sont convexes la fonction x ∈ U → L(x,(λ, µ) est convexe et diff´erentiable. Alors ses minima sur U sont exactement ses points critiques. Or x est un point critique de cette fonction (par KKT), donc x minimise x ∈ U → L(x,(λ, µ) sur U. Par ailleurs, x ∈ K et, par KKT, on a µjhj(x) = 0 pour tout j = 1, . . . , l donc la propri´et´e 7) du Th´eor`eme 3.1 est satisfaite et donc par le Th´eor`eme 3.1, (x,(λ, µ)) est un point-selle de L.

Le th´eor`eme du point-selle ne s’applique r´eellement bien (c`ad, sous hypoth`ese de qualification, on a une CNS “x est solution de (2.1)” si et seulement si “il existe (λ, µ)∈Rr×(R+)l tel que (x,(λ, µ)) est un point-selle deL”) que pour les probl`emes d’optimisation convexe diff´eren- tiable (OCD) qui sont des probl`emes d’optimisation sous contrainte de la forme minx∈Kf(x) o`u f :U →R,U est unouvert convexe de Rn etK est une contrainte de la forme

K=

x∈U : g1(x) =· · ·=gr(x) = 0 h1(x)≤0, . . . , hl(x)≤0

(9)

o`u les g1, . . . , gr :U → R, d´efinissant les contraintes d’´egalit´e, sont des fonctions affines et les h1, . . . , hl :U →R, d´efinissant les contraintes d’in´egalit´e, sont des fonctionsconvexes diff´erentiables.

Pour les probl`emes d’OCD, la contrainte de qualification la plus utilis´ee est la contrainte de Slater : on dit que K satisfait la condition de Slater quand il existe x0 ∈ K tel que pour tout j = 1, . . . , l, hj(x0) <0. On a vu que cette condition implique que la contrainte K est qualifi´ee (en tout point deK).

Remarque 4.2 On sait, d’apr`es la Proposition 1.3, que si (x,(λ, µ)) est un point-selle de L alors n´ecessairement (λ, µ) est solution du probl`eme dual. On peut alors pr´eciser dans le th´eor`eme du point-selle dans les deux points 1) et 2) que (λ, µ) est une solution du probl`eme dual.

5 Conditions KKT et dualit´ e Lagrangienne

On consid`ere de nouveau le probl`eme d’optimisation diff´erentiable sous contraintes (2.1).

Quand le duality gap est nul, on peut faire le lien entre l’optimalit´e pour les deux probl`emes primal et dual et les conditions KKT. On rappelle ici les conditions KKT.

D´efinition 5.1 Soit f,(gi)i=1,...,r,(hj)j=1,...,l :U 7→Rdes fonctions diff´erentiables sur un ouvert U de Rn. On dit que (x,(λ, µ)) satisfait les conditions KKT quand, pour K =

x ∈ U : gi(x) = 0,∀i= 1, . . . , r, hj(x)≤0,∀j= 1, . . . , l ,

x ∈K et µ≥0 (KKT1)

µjhj(x) = 0,∀j= 1, . . . , l (KKT2)

xL(x,(λ, µ)) = 0 (KKT3)

La condition (KKT2) est appel´ee complementary slackness condition.

La premi`ere condition (KKT1) dit simplement que les ´el´ementsx et (λ, µ) sont dans leur ensemble de contraintes respectifs (pour le primal et le dual). La condition (KKT2) signifie que soithj(x) = 0, c`ad laj-i`eme contrainte du probl`eme primal est satur´ee, soit laj-i´eme contrainte du probl`eme dual est satur´ee, c`adµj = 0. Finalement, la troisi`eme condition (KKT3) signifie que x est un point critique deL(·,(λ, µ)).

Th´eor`eme 5.2 On consid`ere le probl`eme d’optimisation sous contraintes (2.1)o`uf,(gi)ri=1,(hj)lj=1 sont diff´erentiables sur U. On a les r´esultats suivant :

1. si le duality gap de L est nul, six est une solution primale et si(λ, µ) est une solution duale, alors (x,(λ, µ))satisfait les conditions KKT.

2. si on suppose que(gi)ri=1 sont affines et quef et(hj)lj=1 sont convexes alors les conditions KKT sont suffisantes : si (x,(λ, µ)) satisfait KKT alors x est solution du probl`eme primal, (λ, µ) est solution du probl`eme duale et le duality gap est nul.

Preuve. . On montre1.. C’est une cons´equence directe de la Proposition1.7et du Th´eor`eme3.1.

On a ´equivalence entre

6) x minimiseϕsurU (ce qui ´equivaut `a dire quex est solution primale), (λ, µ) maximise ψsurRr×(R+)l(ce qui ´equivaut `a dire que (λ, µ) est solution duale), le duality gap est nul,

(10)

1) (x,(λ, µ)) est un point-selle de L, 7) i) x minimiseL(·,(λ, µ)) sur U

ii) x∈K

iii) µjhj(x) = 0 pour tout j= 1, . . . , l.

Comme1. est une r´e´ecriture de6), on a1.implique7). Dans le cas diff´erentiable,7)implique les conditions KKT vu que si x minimiseL(·,(λ, µ)) sur U alors n´ecessairement x est un point critique deL(·,(λ, µ)) c`ad∇xL(x,(λ, µ)) = 0. Par ailleurs, d’apr`es7),x ∈K,µjhj(x) = 0 pour tout j = 1, . . . , r et par d´efinition de (λ, µ) dans 1., on a µj ≥ 0. Donc (x,(λ, µ)) satisfait KKT.

On d´emontre le deuxi`eme point2.sous l’hypoth`ese suppl´ementaire quefet (hj)j sont convexes et (gi)i sont affines. Soit (x,(λ, µ)) satisfaisant les conditions KKT. On a x et (λ, µ) sont dans les ensembles de contraintes du probl`eme primal et dual respectivement. Par ailleurs, comme µ≥0,L(·, λ, µ) =f(·) +Pr

i=1λigi(·) +Pl

j=1µjhj(·) est convexe et comme∇xL(x, λ, µ) = 0, x est un minimum de L(·, λ, µ) sur U (en optimisation convexe diff´erentiable les points critiques sont les extrema). Ainsi la condition i) de la condition 7) est satisfaite. Par ailleurs, la condition (KKT1) assure que x ∈ K donc ii) est aussi satisfaite. Finalement, la condition (KKT3) implique la condition iii) de la condition 7). Donc 7) est satisfaite et comme elle est

´

equivalente `a 6), on obtient bien le r´esultat.

Dans les deux conclusions suivantes, on combine les r´esultats du Th´eor`eme 4.1 et du Th´eo- r`eme 5.2.

Conclusion 1 : Pour les probl`emes d’optimisation convexe diff´erentiables (OCD) (o`u les contraintes d’´egalit´es (gi)ri=1 sont affines etf,(hj)lj=1 sont convexes et diff´erentiables) les condi- tions KKT sont n´ecessaires et suffisantes : il y a ´equivalence entre

1. le duality gap est nul,x est solution primal et (λ, µ) est solution duale 2. (x,(λ, µ))v´erifie les conditions KKT.

Dans ce cas, pour trouver une solution au probl`eme primale, il suffit de trouver une solution duale (λ, µ) et de trouver un point x tel que(x,(λ, µ))v´erifie les conditions KKT. La r´eciproque n’est vraie que si on sait de plus que le duality gap est nul.

Conclusion 2 : Pour un probl`eme d’optimisation convexe diff´erentiables (OCD) (o`u les contraintes d’´egalit´es (gi)ri=1 sont affines et f,(hj)lj=1 sont convexes et diff´erentiables) ayant une contrainte qualifi´ee (par exemple en v´erifiant la condition de Slater ou pour des contraintes affines), il y a

´equivalence entre

1. x est solution primal et (λ, µ) est solution duale 2. (x,(λ, µ))v´erifie les conditions KKT.

Dans ce cas, pour trouver toutes les solutions au probl`eme primale, il suffit de trouver une solution duale(λ, µ)et de d´eterminer l’ensemble des pointsx tels que(x,(λ, µ))v´erifie les conditions KKT.

On voit que dans la premi`ere conclusion, on n’a pas besoin de qualifier la contrainte : il suffit de trouver une solution (λ, µ) au probl`eme duale et de chercher un x tel que (x,(λ, µ)) v´erifie KKT. Dans ce cas, on sait quex est une solution du probl`eme primal. N´eanmoins, si on veut avoir toutes les solution du probl`eme primal, on a besoin d’une r´eciproque `a cette approche ;

(11)

c’est la deuxi`eme conclusion qui permet de le faire. Mais dans ce cas, on a besoin de l’hypoth`ese de qualification.

On peut tirer d’autres conclusions du Th´eor`eme5.2. Par exemple, du point1.de ce th´eor`eme, on voit que si le duality gap est nul (c’est pas exemple le cas en (OCD) sous l’hypoth`ese queAest de rangr et la condition de Slater est v´erifi´ee – voir Section??) et si (λ, µ) est une solution au probl`eme dual alors toute solution x du probl`eme primal doit aussi satisfaire que (x,(λ, µ)) satisfait les conditions KKT. En particulier, si L(·,(λ, µ)) admet un unique minimum sur U alors soit ce minimum est dans K et µjhj(x) = 0, j = 1, . . . , l et alors le primal admet une unique solution donn´ee par x soit ce minimum n’est pas dans K on ne v´erifie pas µjhj(x) = 0,∀j= 1, . . . , l et dans ce cas, le primal n’a pas de solution.

6 M´ ethodologie et exemple d’application de la dualit´ e Lagran- gienne

Les deux conclusions de la section pr´ec´edente sont propices `a une m´ethodologie d’application de la dualit´e Lagrangienne. Cette m´ethodologie est aussi pr´esent´ee dans le chapitres sur l’OCD car c’est dans ce cadre que la dualit´e Lagrangienne s’applique le mieux (c’est aussi dans ce cadre qu’ont ´et´e ´enonc´ees les deux conclusions pr´ec´edentes). On donne maintenant la m´ethodologie d’application de la deuxi`eme conclusion.

M´ethodologie d’application de la dualit´e Lagrangienne en OCD sous l’hypoth`ese de qualification. Sous hypoth`ese de qualification de la contrainte (par Slater ou contraintes affines par exemple), on peut appliquer la m´ethode suivante pour trouver toutes les solutions d’un probl`eme d’OCD :

0) On v´erifie que les fonctionsf, h1, . . . , hl sont bien convexes et diff´erentiables.

2) On v´erifie que la contrainte est qualifi´ee (Slater ou contraintes affines ou v´erifiant Mangasarian- Fromovitch)

3) On r´esout le probl`eme dual : on trouve une solution (λ, µ) au probl`eme dual

4) on cherche lesx ∈Utel que (x,(λ, µ)) v´erifie KKT (c`ad lesxtels que∇xL(x,(λ, µ)) = 0,x ∈K etµjhj(x) = 0 pour tout j= 1, . . . , l). On note parE2 ⊂K cet ensemble.

5) Par dualit´e Lagrangienne (ici la conclusion 2 de la section pr´ec´edente), l’ensemble des solutions au probl`eme minx∈Kf(x) est donn´e exactement parE2. En effet, sous l’hypoth`ese de qualification, on sait que pour n’importe quelle solution (λ, µ) au probl`eme dual alors (x,(λ, µ)) v´erifie KKT ssi x est solution au probl`eme primal.

On peut aussi ´enoncer une m´ethodologie d’application pour la premi`ere conclusion. Dans ce cas, on n’a pas besoin de v´erifier la qualification mais on doit trouver au moins un point (x,(λ, µ)) v´erifiant KKT. C’est l’existence d’un tel point qui par la Conclusion 1 permet de dire qu’on a dualit´e forte. Une fois qu’on a certifi´e la dualit´e forte (ici par l’existence d’un point v´erifiant KKT), on peut appliquer le th´eor`eme5.2et donc avoir l’´equivalence entre ’xest solution primale et (λ, µ) est solution duale’ et ’(x,(λ, µ)) v´erifiant KKT’. En particulier, il suffit de trouver une solution (λ, µ) au probl`eme duale et de chercher tous les x tel que (x,(λ, µ)) v´erifie KKT pour avoir toutes les solutions au probl`eme. Cependant, si on ne trouve pas de point (x,(λ, µ)) v´erifiant KKT cela ne signifie pas que le probl`eme primal n’a pas de solution car il se peut que la contrainte ne soit pas qualifi´ee en un point x qui serait solution du probl`eme.

C’est cette situation que permet d’´eviter l’hypoth`ese de qualification quand elle est v´erifi´ee.

(12)

M´ethodologie d’application de la dualit´e Lagrangienne en OCD sans qualification.

Sans hypoth`ese de qualification de la contrainte, on peut appliquer la m´ethode suivante pour trouver une ou des solutions d’un probl`eme d’OCD :

0) On v´erifie que les fonctionsf, h1, . . . , hl sont bien convexes et diff´erentiables.

3) On r´esout le probl`eme dual : on trouve une solution (λ, µ) du probl`eme dual

4) on cherche desx ∈U tel que (x,(λ, µ)) v´erifie KKT (c`ad∇xL(x,(λ, µ)) = 0,x∈K etµjhj(x) = 0 pour tout j= 1, . . . , l). On note parE2 ⊂K cet ensemble.

5b) Par dualit´e Lagrangienne (ici la conclusion 1 de la section pr´ec´edente), les points de E2 sont les solutions au probl`eme minx∈Kf(x) (il ne peut pas y en avoir d’autre car l’existence d’un point (x,(λ, µ)) v´erifiant KKT `a permit de certifier la dualit´e forte et donc toute solution primalex est telle que (x,(λ, µ)) v´erifie KKT pour n’importe quelle solution (λ, µ) du duale).

Exemple :On consid`ereM ∈Rn×ntelle queM 0 (c`ad M est sym´etrique d´efinie positive), q∈Rn,A∈Rl×n etb∈Rl. On souhaite trouver les solutions au probl`eme

x∈minRn

1 2

M x, x +

q, x

:Ax+b≤0

(6.1) o`u v≤0 pourv= (vj)lj=1∈Rl quandvj ≤0 pour tout j= 1, . . . , l.

1. Donner la fonction duale de (6.1) et formuler le probl`eme dual (D)

2. Caract´eriser les solutions de (D) par un syst`eme d’in´equations et d’´equations lin´eaires et quadratiques

3. donner une condition suffisante pour que (D) n’admette qu’une seule solution 4. siµ est solution de (D), donner les solutions de (6.1) en fonction deλ. 1.La fonction de Lagrange associ´ee `a (6.1) est

L:

Rn×(R+)l → R (x, µ) → f(x) +

µ, H(x)

= 12

M x, x +

q, x +

µ, Ax+b pourf(x) =

M x, x +

q, x

etH(x) =Ax+best `a valeur vectorielle dansRr. C’est-`a-dire pour toutx∈Rnet µ≥0, on a

L(x, µ) =1 2

M x, x +

q+A>µ, x +

µ, b . La fonction duale est donn´ee par

ψ:

(R+)l → R µ → infx∈Rn

1 2

M x, x +

q+A>µ, x +

µ, b Or pour toutµ≥0,L(·, µ) :x→ 12

M x, x +

q+A>µ, x +

µ, b

est convexe (car sa Hessienne estM 0). DoncxµminimiseL(·, µ) surRnsi et seulement sixµ est un point critique deL(·, µ) c`ad ∇xL(xµ, µ) = 0. Mais comme∇xL(x, µ) =M x+q+A>µ, on a n´ecessairement que

xµ=−M−1(q+A>µ). (6.2)

(13)

On a donc pour toutµ≥0, ψ(µ) =L(xµ, µ) = 1

2

q+A>µ, M−1(q+A>µ)

q+A>µ, M−1(q+A>µ) +

µ, b

= −1 2

q+A>µ, M−1(q+A>µ) +

µ, b

=−1 2

µ, AM−1A>µ +

b−AM−1q, µ

−1 2

q, M−1q .

On retrouve bien le fait que la fonction dualeψest concave (sa Hessienne est−AM−1A0). Le probl`eme dual est

maxµ≥0 ψ(µ). (6.3)

2)Commeψest concave les solutions de (6.3) sont donn´es par la condition d’Euler/P´enao/Kantorovitch en OCD :µ≥0 est solution de (6.3) si et seulement si∇ψ(µ)∈N(

Rl+)) o`uN(

Rl+)) est le cˆone normal `a la contrainte (Rl+) enµ. On a

N(

Rl+)) =

 X

j∈J(µ)

aj(−ej) :a1, . . . , al≥0

(6.4)

o`u (e1, . . . , el) est la base canonique de Rl etJ(µ) ={j∈ {1, . . . , l}:µj = 0}et

∇ψ(µ) =−AM−1A>µ+ (b−AM−1q).

On peut caract´eriser les vecteurs qui appartiennent au cˆone normal (6.4) de la mani`ere sui- vante : il y a ´equivalence entre

a) v∈N(Rl

+)) b) −v∈(Rl+) et

−v, µ

= 0 En effet, siv ∈N(

Rl+)) alors il existea1, . . . , al≥0 tels quev=P

j∈J(µ)aj(−ej). En particu- lier, −v=P

j∈J(µ)ajej ∈(Rl+) et

−v, µ

= X

j∈J)

ajµj = 0

car µj = 0 pour tout j ∈ J(µ). R´eciproquement, on prends v ∈ Rl tel que −v ∈ (Rl+) et −v, µ

= 0. On ´ecrit v = Pl

j=1vjej o`u vj ≤ 0 car −v ∈ (Rl+). Par ailleurs, 0 = v, µ

= P

j /∈J(µ)vjµj et comme les termes de cette somme sont tous n´egatifs car vj ≤0 etµj <0, on a donc forc´ement vjµj = 0 pour tout j /∈J(µ) et comme µj <0, on a vj = 0 pour tout µj <0.

On a donc bienv∈N(

Rl+)).

En utilisant la caract´erisation pr´ec´edente des ´el´ements deN(Rl

+)), on obtient que∇ψ(µ)∈ N(

Rl+)) si et seulement si

AM−1A>µ−(b−AM−1q)≥0 et

AM−1A>µ−(b−AM−1q), µ

= 0. (6.5) Les solution du probl`eme dual (6.3) sont les solutions du syst`eme d’in´equations et d’´equations quadratiques et lin´eaires donn´e en (6.5).

3. Pour qu’une fonction concave admette un unique maximum il suffit que sa Hessienne soit strictement n´egative c`ad ici que AM−1A> 0. Dans ce cas, le syst`eme (6.5) admet une unique solution.

(14)

4.La fonction objectivef est convexe et diff´erentiable car c’est un polynˆome et sa Hessienne est M 0. La contrainte est faite uniquement de l contraintes d’in´egalit´es affines, elle est donc qualifi´ee. Ainsi, par dualit´e Lagrangienne, si µ ≥0 est une solution du probl`eme dual (6.3), on a ´equivalence entre :

1) x est solution du probl`eme (6.1)

2) x minimiseL(·, µ) sur Rn etµj(Ax+b)j = 0 pour toutj= 1, . . . , l.

On a d´ej`a vu en (6.2) que l’unique solution au probl`eme de minimisation de L(·, µ) sur Rn est donn´ee par xµ=−M−1(q+A>µ). De plus, on a pour toutj= 1, . . . , l,

µj(Axµ+b)j =−µj(AM−1A>µ−(b−AM−1q))j

qui est bien nul d’apr`es (6.5) vu que (AM−1A>µ−(b−AM−1q))j ≥0,µj ≥0 etP

jµj(AM−1A>µ− (b−AM−1q))j = 0. Donc pour toute solutionµ au probl`eme dual (c`ad v´erifiant (6.5)), xµ est solution du probl`eme (6.3) et toute solution de ce probl`eme s’´ecrit sous la forme xµ o`u µ est solution au probl`eme dual.

7 Interpr´ etation g´ eom´ etrique des dualit´ es faible et forte et Th´ eo- r` eme de Slater.

On consid`ere l’ensemble

G ={(g1(x),· · ·, gr(x), h1(x),· · · , hl(x), f(x)) :x∈U} ⊂Rr×Rl×R.

La valeur optimale atteinte par le probl`eme primal, not´ee ϕ = min(f(x) : x ∈ K), peut se retrouver `a l’aide deG car

ϕ = min (t: (u, v, t)∈ G, u= 0, v≤0).

On peut aussi retrouver la fonction duale `a partir de G car pour tout (λ, µ)∈Rr×(R+)l, on a ψ(λ, µ) = inf

(λ, µ,1)>(u, v, t) : (u, v, t)∈ G . En particulier, pour tout (u, v, t)∈ G, on a

(λ, µ,1)>(u, v, t)−ψ(λ, µ)≥0. (7.1) Ainsi, pour tout (λ, µ) ∈ Rr×(R+)l tel que ψ(λ, µ) est fini, la ligne de niveau 0 de la fonction affine

(u, v, t)∈Rr×Rl×R→(λ, µ,1)>(u, v, t)−ψ(λ, µ) est un hyperplan supportant G (voir Figure1).

(15)

G={(h1(x), f(x)) :x∈U}

v t

b

µv+t=b

µv+t=ψ(µ) ψ(µ)

Figure 1 – ´Etant donn´e un µ ≥ 0 et b ∈ R, la droite {(v, t) : µv +t = b} a une pente n´egative donn´ee par −µet un intercepte ´egal `a b. Pour retrouver la fonction dualeψ :µ≥0→ infx∈U(f(x) +µh1(x)), on fait diminuer b (et donc la droite {(v, t) : µv+t = b} est abaiss´ee parall`element `a celle d’origine) jusqu’au point dernier point de contact avec G. On peut ensuite voir la valeur deψ(µ) comme ´etant l’intercept de cette derni`ere droite tangente `a G et de pente

−µ.

On rappelle la d´efinition d’un hyperplan supportant un ensemble.

D´efinition 7.1 Soit G un ensemble d’un espace de HilbertH. Pour w∈H etb∈R, on dit que {x∈H:

w, x

=b} est un hyperplan supportant G quand pour tout x∈ G, on a w, x

≥b.

Selon la D´efinition7.1,{(u, v, t) : (λ, µ,1)>(u, v, t)−ψ(λ, µ) = 0}est un hyperplan supportant G. Par ailleurs, comme le vecteur normal (λ, µ,1) de cet hyperplan a un coefficient ´egal `a 1 en derni`ere coordonn´ee, on dit que c’est un hyperplan supportantGnon-vertical. R´eciproquement, si {(u, v, t) : (λ, µ,1)>(u, v, t) =b}est un hyperplan supportantG non-vertical alors n´ecessairement b≤ψ(λ, µ) ´etant donn´e la d´efinition deψ(λ, µ). Ainsi,{(u, v, t) : (λ, µ,1)>(u, v, t)−ψ(λ, µ) = 0}

pour (λ, µ) ∈ Rr×(R+)l sont tous les hyperplans supportant G ’tangent’ `a G en dessous de G avec µ≥0 (c`ad avec des coefficients positifs sur les coordonn´ees dev).

Par ailleurs, l’hyperplan d’´equation (λ, µ,1)>(u, v, t)−ψ(λ, µ) = 0 coupe le dernier axe des coordonn´ees ent=ψ(λ, µ). On peut donc retrouverψ(λ, µ) `a partir cet hyperplan supportantG qui lui est aussi tangent.

(16)

G={(h1(x), f(x)) :x∈U}

v t

ϕ ψ

µv+t=ψ

Figure 2 – Interpr´etation g´eom´etrique de la dualit´e faible pour le probl`eme minx∈U(f(x) : h1(x) ≤ 0). La fonction duale ψ : µ ≥ 0 → infx∈U(f(x) +µh1(x)) se retrouve comme ψ(µ) = inf(µv+t: (v, t)∈ G) et peut se lire sur l’axe des ’t’ carµ≥0 c`ad pourv = 0 dans l’hyperplan µv+t= ψ(µ). On retrouve la valeur optimale du probl`eme primal ϕ = min(f(x) : h1(x) ≤0) commeϕ= min(t: (t, v)∈ G, v≤0) et la valeur optimale du probl`eme dual parψ = max(ψ(µ) : µ≥0). On peut ainsi visualiser la dualit´e faible sur cette figure : ψ ≤ϕ (et ici un duality gap ϕ−ψ >0).

Application au Th´eor`eme de Slater. On consid`ere un probl`eme de type (OCD) o`u on rappelle que la contrainte est de la forme

K ={x∈U :Ax=beth1(x)≤0,· · · , hl(x)≤0} (7.2) o`u A ∈ Rr×n et b ∈Rr. On rappelle que la contrainte K v´erifie la condition de Slater quand il existe x0 ∈K tel que pour toutj= 1, . . . , l, on a hj(x0)<0.

Th´eor`eme 7.2 (Th´eor`eme de Slater) Soit K un contrainte en (OCD) de la forme (7.2) o`u Aest de rang r. On suppose queK v´erifie la condition de Slater alors il y a dualit´e forte. De plus si inf(f(x) :x∈K) est fini alors le probl`eme dual admet une solution.

Preuve. La preuve du Th´eor`eme de Slater que nous donnons maintenant est bas´ee sur un argument g´eom´etrique de s´eparation de deux ensembles convexes disjoints dans l’espaceRr×Rl×R o`u vit l’ensembleGqui a ´et´e introduit ci-dessus. Cet argument est similaire `a celui que nous avons d´emontr´e concernant la s´eparation stricte entre un convexe ferm´e non vide et un point qui lui est ext´erieur. Ici on utilise le r´esultat suivant : siAetB sont deux ensembles convexes disjoints d’un espace de Hilbert H de dimension finie alors il existe w∈H\{0} et b∈Rtels que a) pour tout x∈ A,

w, x

+b≤0 et b) pour toutx∈ B, w, x

+b≥0. Ce r´esultat est aussi appel´e Th´eor`eme de Hahn-Banach g´eom´etrique.

On remarque que pour ϕ = minx∈Kf(x) on a soit ϕ = −∞ ou ϕ est fini. Si ϕ = −∞

alors par dualit´e faible ψ = max(ψ(λ, µ) : µ≥0) vaut aussi −∞ et donc ψ = ϕ, c`ad pas de duality gap. On peut maintenant supposer queϕ est fini.

Références

Documents relatifs

Pour le système Soleil-Jupiter il y a des astéroides aux points stables L 4 et L 5 appelés troyens (Achille et Hector furent respectivement les premiers à être découverts en 1906

Quels sont les (éventuels) extrema de f?. (On en calculera une valeur approchée au

Theorem 4.1 If u is a local minimum of J over K, if the constraints are regular at u, and if J is differentiable at u, then there exist λ 1 ,... Remind that if J is infinite

Les formules compliquées qu'entraîne cette géométrie, sont très-souvent singulièrement abrégées, à l'aide de certaines relations analytiques existant entre les

[13], and further developed in Lemar´ echal and Oustry [9], leads to simple alternative derivations of well-known, important relaxations to two well-known problems of

L’idée est de montrer que, étant donnés deux nombres différents, leurs images sont identiques et donc que la fonction est constante. f satisfait les conditions du théorème

2 – Dans le référentiel ℜ en rotation autour du centre de masse du système Soleil-Terre à la vitesse angulaire ω, référentiel dans lequel le Soleil et le

b – WMAP, observant des rayonnements faibles par rapport à ceux émis par le Soleil, doit être dans l’ombre de la Terre, donc en L 2.. Notez que L 2 est encore partiellement