CORRECTION DU TD 3 : ANALYSE CONVEXE
COURS D’APPRENTISSAGE, ECOLE NORMALE SUP ´ERIEURE, OCTOBRE 2017
Aude Genevay aude.genevay@ens.fr
1. Exercice 1 : S´eparation des convexes compacts
Par compacit´e du produit C×D, il existe deux pointsx ∈C et y∈ D tels quekx−yk2 soit minimale. CommeC∩D=∅, on a A= y+x2 qui est un point n’appartenant ni `a C ni `a D. Un dessin convainc assez rapidement que l’hyperplan orthogonal `a la direction vectorielle (y−x) et passant par Aest un hyperplan s´eparateur. Montrons le.
On consid`ere l’hyperplan affine HA = A+H. Cet hyperplan v´erifie l’´equation u ∈ HA ⇔ (y−x)T(u− y+x2 ) = 0.
On doit ensuite v´erifier que,∀u∈C,(y−x)T(u−y+x2 )<0 et∀u∈D,(y−x)T(u−y+x2 )>0.
Faisons le pourD, sur C le raisonnement sera analogue.
Il suffit juste de v´erifier une propri´et´e du minimiseur y de la distance avec C qui est que tout autre point de l’ensembleDfera un angle obtu avec x−y.
Consid´erons l’ensembleDet montrons que pour tout pointu∈D, on a (u−x+y2 )T(y−x)>
0. Supposons, par l’absurde qu’il y ait un pointu∗tel que (u∗−x+y2 )T(y−x)≤0. Consid´erons la fonction univari´ee f(t) = kx −y−t(u−y)k22. On a f0(0) = −2(x −y)T(u∗ −y). Or (x−y)T(u∗−y) = (x−y)T(u∗−x+y2 ) + (x−y)T(x+y2 −y). On a donc que (x−y)T(u∗−y)>0, et par suitef0(0) <−2. La fonction est localement d´ecroissante donc il existe un 1≥t > 0 tel que kx−y−t(u−y)k soit plus petit que f(0) = kx−yk22. Mais y+t(u−y) ∈ C par convexit´e ce qui est contradictoire avec la d´efinition de xety comme minimisant la distance de C `aD. Donc ∀u∈D,(u−x+y2 )T(y−x)>0.
Ainsi l’hyperplan s´epare bien les deux ensembles convexes. La s´eparation est de plus stricte car, par un raisonnement analogue au pr´ec´edent, on trouve queyetxminimisent les distances respectives `a DetC respectivement.
Il existe une vaste litt´erature concernant la s´eparation des ensembles convexes, cf chapitre 11 de[?]. Au del`a des espaces de dimensions finis, la notion de s´eparation des convexes est une notion tr`es importante qui, permet de fonder correctement l’analyse fonctionnelle (th´eor`emes de Hahn Banach).
2. Exercice 2 : Convexit´e des fonctions usuelles
1) On consid`ere cette fonction sur deux ensembles convexes distincts, les ensembles A+ = {(x, y)∈R2, y >0} etA− ={(x, y)∈R2, y <0}.
La convexit´e se v´erifie en calculant la matrice Hessienne de cette fonction.
H= 2 y3
y2 −xy
−xy x2
.
2 COURS D’APPRENTISSAGE, ECOLE NORMALE SUP ´ERIEURE, OCTOBRE 2017
On remarque ainsi que cette Hessienne est d´efinie positive poury >0 et n´egative sinon.
2) Il suffit de remarquer que l’indicatrice v´erifie la d´efinition d’une fonction convexe, `a savoir que∀x, y∈Rn, λ∈[0,1], IC(λx+ (1−λ)y).
3) SoitQ∈Rn. La forme quadratiquef peut s’´ecrire 12xT(Q+QT)x. La fonctionf est donc convexe si et seulement si sa partie sym´etrique Q+Q2 T est semi d´efinie positive.
4) SoitI une famille de fonctions convexes. Elle v´erifie :
∀i∈I,∀λ∈[0,1],∀x, y∈Rn, fi(λx+ (1−λ)y)≤λfi(x) + (1−λ)fi(y) donc sup
i∈I
fi(λx+ (1−λ)y)≤sup
i∈I
λfi(x) + (1−λ)fi(y) d’o`u, sup
i∈I
fi(λx+ (1−λ)y)
≤λsup
i∈I
fi(x) + (1−λ) sup
j∈I
fi(y)
L’infimum de deux fonctions convexes n’est clairement pas convexe. Prenons par exemple le sup des fonctions d´efinies pour tout x dans R par f1(x) =x et f2(x) = −x. L’inf de ces deux fonctions lin´eaires estf(x) =−|x|qui n’est pas convexe.
5) On remarque que, ∀S ∈ Sn, λmax(S) = maxu∈Rn uTSu
uTu . Par la question pr´ec´edente cette fonction est donc bien convexe car la fonctiong(x, S) = uuTTSuu est lin´eaire enS. On peut aussi d´eduire de cela que la valeur propre minimale est une fonction concave.
3. Exercice 3 : Dualit´e Lagrangienne
6) On commence par introduire les variables de Lagrangeλ∈Rn+etν∈Rm. On ´ecrit ensuite la fonction associ´ee :
L(x, λ, ν) =cTx−λTx+νT(Ax−b).
(1)
La minimisation en la variable primale x conduit `a la fonction duale suivante :
g(λ, ν) =
(−bTν si −ATν+λ−c= 0
−∞ sinon .
Le probl`eme dual avec contraintes explicites devient donc :
ν∈maxRn
−bTν tel queATν+c≥0
7)Comme sugg´er´e dans l’´enonc´e introduisons une variables auxiliaire (souvent appel´ees dans la litt´erature anglophone des “slack variables”)t= maxiaTi x+bi. On obtient alors le probl`eme
CORRECTION DU TD 3 : ANALYSE CONVEXE 3
primal suivant :
x∈minRn,t∈R
t tel quet= max
i aTi x+bi.
Ce probl`eme est ´egalement ´equivalent au probl`eme suivant (on peut s’en convaincre par un dessin) :
x∈minRn,t∈R
t
tel que∀i, t≥aTi x+bi. C’est un programme lin´eaire sous forme canonique.
8) En passant `a la variabley, le probl`eme devient ´equivalent `a miny∈{−1,1}nyTW y. Ou encore de mani`ere ´equivalente :
y∈minRn
yTW y t.q, ∀i,yi2 = 1.
Si diag() repr´esente l’op´erateur cr´eant une matrice diagonale `a partir d’un vecteur, on ´ecrit mˆeme :
y∈minRn
yTW y t.q, ∀i,diag(y)y=1.
Le Lagrangien est ainsi : L(y, λ) =yTW y+λT(diag(y)y−1).Le dual devient donc : g(λ) =
(−1Tλ, siW + diag(λ)0
−∞, sinon. .
On alors le probl`eme dual suivant (avec contraintes explicites) :
λ∈maxRn
−1Tλ
tel queW + diag(λ)0.
Remarque: on peut poserλ=−λmin(W)1. Ce point est faisable (carW−diag(λmin(W)1) 0) et il nous permet d’obtenir une borne inf´erieure `a la valeur optimale du probl`eme primal :
p?≥nλmin(W).
9) Notons tout d’abord que nous avons :xTAx= 12(A+AT). De ce fait nous supposons dans la suite que A est sym´etrique. Notons aussi que ce probl`eme n’est pas convexe (contrainte d’´egalit´es non affines). Cependant la solution de ce probl`eme est connue, la valeur optimale est la valeur propre minimale de A, atteinte pour x ´etant le vecteur propre de norme 1 cor- respondant. Regardons maintenant si nous avons dualit´e forte au sens de Lagrange. Ecrivons maintenant le lagrangien du probl`eme :
4 COURS D’APPRENTISSAGE, ECOLE NORMALE SUP ´ERIEURE, OCTOBRE 2017
L(x, λ) =xTAx+λ(xTx1) =xT(A+λIn)x−λ,
o`uInest la matrice identit´e de taillen. En minimisant par rapport `a la variablexon obtient :
g(λ) =
(λmin siA+λIn0
−∞ sinon ,
o`uλmin est la valeur propre minimale de A. On en d´eduit que le probl`eme dual a pour valeur optimale λmin. Nous avons donc bien dualit´e forte.