Syst` emes ind´ etermin´ es - M´ ethodes directes pour la r´ esolution des syst` emes lin´ eair

M´ ethodes directes pour la r´ esolution des syst` emes lin´ eaires

3.12 Syst` emes ind´ etermin´ es

etapeide l’algorithme, l’erreur relative x−x⁽ⁱ⁾ _∞/ x _∞est diminu´ee d’un facteur ρdonn´e par

ρ2 ncond(A,x)u (RPF),

ou ρu (RPM).

Remarquer queρest ind´ependant du conditionnement de A dans le cas RPM.

Une convergence lente de RPF est une indication claire du grand conditionne-ment de la matrice : sipest le nombre d’itérations nécessaires à la convergence de la méthode, on peut montrer queK_∞(A)β^t⁽¹⁻¹^/p⁾.

Même quand il est effectué en précision fixe, le raffinement itératif est utile dans la mesure où il améliore la stabilité globale des méthodes directes pour la résolution d’un système. Nous renvoyons le lecteur à [Ric81], [Ske80], [JW77]

[Ste73], [Wil63] et [CMSW79] pour davantage de renseignements sur ce sujet.

3.12 Syst` emes ind´ etermin´ es

Nous avons vu que sin=met si A est inversible alors la solution du syst`eme lin´eaire Ax=bexiste et est unique. Dans cette section, nous donnons un sens

a la solution d’un systèmesurdéterminé,i.e.quandm > n, etsousdéterminé, i.e. quand m < n. Notons qu’un système indéterminé n’a généralement pas de solution à moins que le second membrebn’appartienne à Im(A).

Nous renvoyons à [LH74], [GL89] et [Bjö88] pour une présentation plus d´ e-taillée.

Etant donné A∈ R^m^×ⁿ avec m ≥n, et b∈ R^m, on dit que x^∗ ∈ Rⁿ est une solution du système linéaire Ax=bau sens des moindres carréssi

Φ(x^∗)≤ min

x∈RⁿΦ(x), o`u Φ(x) = Ax−b ²₂. (3.62)

Le problème consiste donc à minimiser la norme euclidienne du résidu. La solution de (3.62) peut être déterminée en imposant au gradient de la fonction Φ de s’annuler enx^∗. Puisque

Φ(x) = (Ax−b)^T(Ax−b) =x^TA^TAx−2x^TA^Tb+b^Tb, on a

∇Φ(x^∗) = 2A^TAx^∗−2A^Tb= 0.

Il en découle quex^∗ doit être solution du système carré

A^TAx^∗ = A^Tb, (3.63)

appelé système deséquations normales. Le système est non singulier si A est de rang maximum. Dans ce cas, la solution au sens des moindres carrés existe et est unique.

Remarquons que B = A^TA est une matrice symétrique définie positive.

Ainsi, pour résoudre les équations normales, on pourrait d’abord effectuer la factorisation de Cholesky B = H^TH, puis résoudre les deux systèmes H^Ty = A^Tbet Hx^∗ =y. Cependant, cette méthode présentent deux incon-vénients majeur. D’une part le système (3.63) est mal conditionné. D’autre part, les erreurs d’arrondi peuvent entraˆıner une perte du nombre de chiffres significatifs lors du calcul de A^TA, ce qui peut altérer les propriétés d’inversi-bilité et/ou de positivité de cette matrice. Ainsi, dans l’exemple suivant (où les calculs sont effectués dans MATLAB), A est de rang maximal et la matrice fl(A^TA) est singulière

A =

⎡

⎣ 1 1 2⁻²⁷ 0

0 2⁻²⁷

⎤

⎦, fl(A^TA) = 1 1

1 1

Il est en général plus efficace d’utiliser la factorisation QR introduite à la Section 3.4.3. On a alors le résultat suivant :

Th´eor`eme 3.7 Soit A∈R^m^×ⁿ, avecm≥n, une matrice de rang maximal.

Alors, l’unique solution de(3.62)est donn´ee par

x^∗ = ˜R⁻¹Q˜^Tb, (3.64)

où R˜ ∈Rⁿ^×ⁿ et Q˜ ∈R^m^×ⁿ sont les matrices définies dans (3.45)à partir de la factorisation QR de A. De plus, le minimum deΦest donné par

Φ(x^∗) = m i=n+1

[(Q^Tb)i]².

Démonstration.La factorisation QR de A existe et est unique puisque A est de rang maximal. Ainsi, il existe deux matrices, Q∈R^m×m et R∈R^m×n telles que A=QR, où Q est orthogonale. Le fait que les matrices orthogonales préservent le produit scalaire euclidien entraˆıne

Ax−b²2 =Rx−Q^Tb²2. En rappelant que R est trap´ezo¨ıdale, on a

Rx−Q^Tb²2=Rx˜ −Q˜^Tb²2+ m i=n+1

[(Q^Tb)_i]².

Le minimum est donc atteint enx=x^∗. 3

Pour plus de précisions sur l’analyse du coût de cet algorithme (qui dépend de l’implémentation de la factorisation QR), ainsi que pour des résultats sur sa stabilité, nous renvoyons le lecteur aux ouvrages cités au début de la section.

Si A n’est pas de rang maximal, les techniques de résolution ci-dessus ne s’appliquent plus. Dans ce cas en effet, six^∗ est solution de (3.62), le vecteur x^∗ +z, avec z ∈ Ker(A), est également solution. On doit par conséquent imposer une contrainte supplémentaire pour forcer l’unicité de la solution.

Typiquement, on peut chercher à minimiser la norme euclidienne dex^∗. Le problème des moindres carrés peut alors être formulé ainsi :

trouverx^∗∈Rⁿ de norme euclidienne minimale tel que Ax^∗−b ²₂≤ min

x∈Rⁿ Ax−b ²₂. (3.65)

Ce probl`eme est consistant avec (3.62) si A est de rang maximal puisque dans ce cas (3.62) a une unique solution (qui est donc n´ecessairement de norme minimale).

L’outil pour résoudre (3.65) est la décomposition en valeurs singulières (ou DVS, voir Section 1.9). On a en effet le théorème suivant :

Théorème 3.8 Soit A∈R^m^×ⁿ dont la décomposition en valeurs singulières est donnée par A = UΣV^T. Alors, l’unique solution de(3.65)est

x^∗= A^†b, (3.66)

où A^† est la pseudo-inverse deA introduite dans la Définition 1.16.

Démonstration.En utilisant la DVS de A, le problème (3.65) est équivalent à trouverw= V^Txtel quewait une norme euclidienne minimale et

Σw−U^Tb²2≤ Σy−U^Tb²2, ∀y∈Rⁿ. Sir est le nombre de valeurs singuli`eresσinon nulles de A, alors

Σw−U^Tb²2= r i=1

σiwi−(U^Tb)i

+ m i=r+1

# (U^Tb)i

qui est minimal siw_i= (U^Tb)_i/σ_i pouri= 1, . . . , r. De plus, il est clair que parmi les vecteursw deRⁿdont lesr premières composantes sont fixées, celui de norme euclidienne minimale est celui dont les n−r composantes restantes sont nulles.

Ainsi, la solution estw^∗= Σ^†U^Tb, c’est-`a-dire,x^∗= VΣ^†U^Tb= A^†b, o`u Σ^†est la

matrice diagonale d´eﬁnie en (1.12). 3

En ce qui concerne la stabilité du problème (3.65), précisons que si la matrice A n’est pas de rang maximal, la solutionx^∗ n’est pas nécessairement une fonction continue des données, de sorte qu’une petite modification de ces dernières peut induire de grandes variations dansx^∗. En voici un exemple :

Exemple 3.9 Consid´erons le syst`eme Ax=bavec

A =

⎡

⎣ 1 0 0 0 0 0

⎤

⎦, b=

⎡

⎣ 1 2 3

⎤

⎦, rg(A) = 1.

La fonctionsvdde MATLAB permet de calculer la décomposition en valeurs singu-lières de A. En calculant la pseudo-inverse, on trouve alors la solutionx^∗= [1, 0]^T. Si on modifie de 10⁻¹² l’élément nul a₂₂, la matrice perturbée est de rang 2 (i.e.

de rang maximal) et la solution (unique au sens de (3.62)) est alors donn´ee par

x^∗= [1, 2·10¹²]^T. •

Dans le cas des systèmes sousdéterminés,i.e.pour lesquelsm < n, si A est de rang maximal, la factorisation QR peut encore être utilisée. En particulier, quand on l’applique à la matrice transposée A^T, la méthode conduit à la solution de norme euclidienne minimale. Si, au contraire, la matrice n’est pas de rang maximal, on doit effectuer une décomposition en valeurs singulières.

Remarque 3.7 Si m = n (système carré), la DVS et la factorisation QR peuvent être utilisées comme alternative à la méthode de Gauss pour résoudre le système linéaire Ax=b. Même si ces algorithmes sont plus coûteux que la méthode de Gauss (la DVS, par exemple, nécessite 12n³flops), ils se révèlent plus précis quand le système est mal conditionné et presque singulier.

Exemple 3.10 Calculons la solution du système linéaire H₁₅x=b, où H₁₅ est la matrice de Hilbert d’ordre 15 (voir (3.29)) et où le second membre est choisi de fa¸con à ce que la solution exacte soit le vecteur unitéx=1. La méthode de Gauss avec changement de pivot partiel donne une solution dont l’erreur relative dépasse 100%. Une meilleure solution est obtenue en effectuant le calcul de la matrice pseudo-inverse, dans lequel les éléments de Σ inférieurs à 10⁻¹³ ont été remplacés par 0.

•

3.13 Exercices

1. Pour une matrice carr´ee quelconque A∈R^n×n, montrer les relations suivantes : 1

nK₂(A)≤K₁(A)≤nK₂(A), 1

nK_∞(A)≤K₂(A)≤nK_∞(A), 1

n²K₁(A)≤K_∞(A)≤n²K₁(A).

Ceci permet de conclure qu’un système mal conditionné dans une certaine norme demeure mal conditionné dans une autre norme, à un facteur multiplicatif près dépendant den.

2. Vérifier que la matrice B∈R^n×n :b_ii = 1,b_ij=−1 sii < j,b_ij = 0 sii > j, est telle que dét(B) = 1 etK_∞(B) =n2ⁿ⁻¹.

3. Montrer queK(AB)≤K(A)K(B), pour toutes matrices A et B∈R^n×n inver-sibles.

6. Soit A la matrice de l’Exemple 3.5. Prouver que les éléments des matrices L et U sont tr` es grands en module. Vérifier qu’on obtient la solution exacte en utilisant la méthode de Gauss avec changement de pivot total.

7. Construire une variante de la m´ethode de Gauss qui transforme une matrice inversible A∈R^n×ndirectement en une matrice diagonale D. Cet algorithme est connu sous le nom de m´ethode de Gauss-Jordan. Trouver les matrices de transformation de Gauss-Jordan G_i,i= 1, . . . , n, telles que G_n. . .G₁A = D.

8. Etudier l’existence et l’unicit´e de la factorisation LU des matrices suivantes B =

[Solution: d’après la Propriété 3.4, la matrice singulière B, dont la sous-matrice principale B₁= 1 est inversible, admet une unique factorisation LU. La matrice inversible C dont la sous-matrice C₁est singulière n’admet pas de factorisation, tandis que la matrice (singulière) D, dont la sous-matrice D₁ est singulière, admet une infinité de factorisations de la forme D = L_βU_β, avec l₁₁^β = 1,

(1) Est-il possible d’utiliser la méthode de Gauss sans pivot ? (2) Trouver une permutation de A, sous la forme PAQ, pour laquelle on peut appliquer la m´ e-thode de Gauss. Comment transforme-t-elle le système linéaire ?

[Solution: la Propriété 3.4 n’est pas satisfaite car dét(A₂₂) = 0. La matrice de permutation est celle qui échange d’une part la première et la seconde lignes, d’autre part la seconde et la troisième colonnes.]

10. Montrer que, si A est une matrice symétrique définie positive, résoudre le sys-tème linéaire Ax =brevient à calculer x=_n

i=1(c_i/λ_i)v_i, o`u lesλ_i sont les valeurs propres de A et o`u lesv_isont les vecteurs propres correspondants.

11. (D’après [JM92]). On se donne le système linéaire suivant 1001 1000

1000 1001 x₁ x₂

= b₁

b₂

En utilisant l’Exercice 10, expliquer pourquoi, quand b = [2001, 2001]^T, un petite perturbationδb= [1,0]^T produit de grandes variations dans la solution, et r´eciproquement quand b= [1, −1]^T, une petite variationδx = [0.001,0]^T dans la solution induit de grandes variations dans b.

[Indication : d´ecomposer le second membre sur la base des vecteurs propres de la matrice.]

12. Déterminer le remplissage pour une matrice A∈R^n×nn’ayant des termes non nuls que sur la diagonale principale, sur la première colonne et sur la dernière ligne. Proposer une permutation qui minimise le remplissage.

[Indication : il suffit d’échanger la première ligne et la première colonne avec la dernière ligne et la dernière colonne respectivement.]

13. Soit H_nx=bun système linéaire où H_n est la matrice de Hilbert d’ordren.

Estimer, en fonction de n, le nombre maximum de chiffres significatifs qu’on peut attendre en résolvant ce système avec la méthode de Gauss.

14. Montrer que si A=QR alors 1

nK₁(A)≤K₁(R)≤nK₁(A), et K₂(A) =K₂(R).

4 M´ ethodes it´ eratives pour la r´ esolution

Dans le document Méthodes Numériques (Page 120-126)