Correction du TD5.
MNO, L3, Dauphine, 2020-2021 D. Gontier, gontier@ceremade.dauphine.fr
Échauffement
Exercice 1.
Soit F : R d → R une fonction de classe C 2 . a/ Montrer que
F (x + h) = F(x) + h∇F (x), hi + hh, Z 1
0
(1 − t)H F (x + th)dt
hi.
b/ Montrer que
∇F (x + h) = ∇F(x) + Z 1
0
H F (x + th)dt
h.
a/ C’est le développement de Taylor classique.
b/ On peut par exemple faire un développement limité de ∂ x
iF à l’ordre 1. On a
∂ x
iF (x + h) = ∂ x
iF(x) + Z 1
0
h∇ (∂ x
iF(x + th)) , hidt
Or
h∇ (∂ x
iF(x + th)) , hi =
n
X
j=1
∂ x
j∂ x
iF (x + th)h j =
n
X
j=1
[H F (x + th)] ij h j
On reconnaît la i-ème ligne de la multiplication H F h. En regroupant les lignes dans un vecteur, on obtient le résultat.
Exercice 2.
Soit F : R d → R une fonction de classe C 1 .
a/ (Cours) Montrer que h est une direction de descente en x si et seulement si h∇F(x), hi < 0.
b/ Montrer que pour tout A ∈ S d ++ ( R ), le vecteur h A := −A(∇F (x)) est une direction de descente en x.
a/ Voir cours.
b/ Si λ 1 > 0 est la première valeur propre de A, on a
h∇F(x), h A i = −h∇F, A∇F i ≤ −λ 1 k∇F k 2 < 0,
donc A∇F (x) est une direction de descente.
Problèmes d’optimisation
Exercice 3. Pseudo-inverse, Examen 2019
Soit m, n ∈ N , et soit A ∈ M m,n ( R ). On dit que A est injective si Ker A = {0}.
a/ Montrer que A est injective si et seulement si les colonnes de A sont indépendantes.
b/ Montrer que si A est injective, alors rg A = n, et m ≥ n.
c/ Montrer que A est injective si et seulement si A T A ∈ S n ++ .
On suppose dans la suite que A est injective, et on note A † := (A T A) −1 A T (pseudo inverse).
d/ Exemple : Calculer B † , où
B :=
0 0 0 1 1 1
.
e/ Montrer que A † A = I n . Montrer que AA † = I m si et seulement si m = n.
Soit b ∈ R m . On s’intéresse au problème de minimisation suivant
x ∗ = argmin {kAx − bk R
m, x ∈ R n } (P).
f/ Montrer qu’il existe S ∈ S n ++ et c ∈ R n qu’on explicitera tel que x ∗ = argmin
1
2 x T Sx − c T x, x ∈ R n
.
g/ En déduire que x ∗ = A † b.
h/ Montrer que si A n’est pas injective, alors le problème (P ) admet plusieurs minimiseurs.
a/ Soit a 1 , a 2 , . . . , a n ∈ R m les colonnes de A. On raisonne par contradiction. Si A n’est pas injective, alors il existe u 6= 0 tel que Au = 0. Alors
0 = Au = u 1 a 1 + u 2 a 2 + · · · + u n a n , (1) et la famille (a k ) n’est pas libre. Réciproquement, si la famille n’est pas libre, il existe une combinaison linéaire u 1 a 1 + u 2 a 2 + · · · + u n a n = 0, avec u := (u 1 , · · · u n ) T 6= 0. Alors Au = 0, et A n’est pas injective.
b/ La famille (a 1 , . . . , a n ) est une famille de n vecteurs dans R m . Si m < n, cette famille est forcément liée. Si A est injective, la famille est libre, et m ≥ n. Dans ce cas, par définition du rang (dimension de l’espace d’arrivée
= dimension de l’espace engendrée par les colonnes), rgA = n.
c/ Pour toute matrice A ∈ M m,n ( R ) (pas forcément injective), la matrice A T A est symétrique, car (A T A) T = A T A, et
∀u ∈ R n , hu, A T Aui = hAu, Aui = kAuk 2 ≥ 0,
donc A T A ∈ S n + . Montrons que cette matrice est inversible ssi A est injective. Si A est injective, on a, d’après la ligne précédente,
∀u ∈ R n , hu, A T Aui = 0 = ⇒ kAuk 2 = 0 = ⇒ Au = 0 = ⇒ u = 0,
donc A T A ∈ S n ++ ( R ). Réciproquement, si A T A ∈ S n ++ ( R ), alors
Au = 0 = ⇒ kAuk 2 = 0 = ⇒ hu, A T Aui = 0 = ⇒ u = 0,
et A est injective. On a bien montré que A est injective ssi A T A ∈ S n ++ . d/ On trouve
B † =
0 0 1 0 1 1
0 0 0 1 1 1
−1
0 0 1 0 1 1
= 1 1
1 2 −1
0 0 1 0 1 1
=
2 −1
−1 1
0 0 1 0 1 1
=
0 −1 1
0 1 0
.
e/ On a A † A = (A T A) −1 A T A = I n . Par ailleurs, si m > n, alors A est de rang au plus n, et donc AA † est une matrice de taille m × m, qui est aussi de rang au plus n. En particulier, elle ne peut pas être inversible.
f/ Le minimiseur de kAx − bk est aussi le minimiseur de 1
2 kAx − bk 2 = 1
2 x T A T Ax − b T Ax + 1 2 b T b.
En posant S = A T A et c = A T b, et en remarquant que le terme 1 2 b T b ne dépend pas de x, c’est aussi le minimiseur de
1
2 x T Sx − c T x.
f/ Comme A est injective, S = A T A est dans S n ++ . On cherche à optimiser une fonctionnelle quadratique strictement coercive sur tout l’espace. D’après le cours, le minimum est
x ∗ = S −1 c ou encore x ∗ = (A T A) −1 A T b = A † b.
g/ Si A n’est pas injective, alors KerA 6= 0. Si x ∗ est un minimiseur de (P), alors tous les éléments de x ∗ + KerA sont des minimiseurs : il y a une infinité de minimiseurs.
Exercice 4. Régularisation de Tichonov
Soit A ∈ S d ++ ( R ) et b ∈ R d . Pour α ≥ 0, on s’intéresse au problème de minimisation de Q α sur R d , où Q α (x) := kAx − bk 2 + αkxk 2 .
2
a/ Dans le cas α = 0, quel est le minimiseur de Q α=0 ?
b/ Dans ce cas, que se passe-t-il si b est bruité (b = b 0 + w avec w ∈ R d un bruit aléatoire), et si A a des petites valeurs propres ?
c/ On suppose maintenant α > 0. Montrer que, pour tout x, y ∈ R d avec x 6= y,
∀0 < t < 1, Q α (tx + (1 − t)y) < tQ α (x) + (1 − t)Q α (y) (Q α est strictement convexe).
d/ Montrer que Q α est coercive (Q α (x) → ∞ si kxk → ∞). En déduire que Q α a un unique minimiseur x ∗ ∈ R d . e/ Montrer que x ∗ vérifie (A 2 + α)x ∗ = Ab.
f/ Reprendre la question b/ (on pourra regarder ce qui se passe dans une base de diagonalisation de A).
a/ Si α = 0, on a ∇Q 0 (x) = 2A[(Ax) − b], qui s’annule uniquement pour x ∗ = A −1 b.
b/ Si A a des petites valeurs propres, alors A −1 a des grandes valeurs propres. Celles-ci peuvent amplifier un bruit initial.
c/ La fonction x 7→ kxk 2 est strictement convexe, et on a
kt(Ax − b) + (1 − t)(Ay − b)k 2 − tkAx − bk 2 − (1 − t)kAy − bk =
= t(t − 1)kAx − bk 2 + t(t − 1)kAy − bk 2 + 2t(1 − t)hAx − b, Ay − bi
= t(t − 1)k(Ax − b) − (Ay − b)k 2 ≤ 0.
d/ On a Q α (x) ≥ αkxk 2 , qui tend vers +∞ lorsque x tend vers +∞. Donc Q α est coercive. De plus Q α est continue, donc atteint son minimum.
Rappel de la preuve En effet, on a Q α (0) = kbk 2 , et il existe A > 0 tel que pour tout kxk > A, on a Q α (x) > kbk 2 = Q α (0). En particulier, on a inf{Q α (x), x ∈ R d } = inf{Q α (x), x ∈ B(0, A)}. Le dernier pro- blème est le minimum d’une fonction continue sur un compact.
e/ Le gradient de Q α est ∇ x Q α (x) = A(Ax − b) + αx. Le minimum x ∗ vérifie donc (A 2 + α)x ∗ = Ab.
f/ Si A est diagonal, on a x i = λ
2λ
ii
+α b i . Si λ → 0 (petite valeur propre), alors λ
2λ
ii