M´ ethode d’´ elimination de Gauss et factorisation LU

M´ ethodes directes pour la r´ esolution des syst` emes lin´ eaires

3.3 M´ ethode d’´ elimination de Gauss et factorisation LU

La méthode d’élimination de Gauss a pour but de transformer le système Ax=b en un système équivalent (c’est-à-dire ayant la même solution) de la forme Ux=b,où U est une matrice triangulaire supérieure etbest un second membre convenablement modifié. Ce dernier système peut être alors résolu par une méthode de substitution rétrograde.

Au cours de la transformation, on utilise essentiellement la propriété se-lon laquelle on ne change pas la solution du système quand on ajoute à une

equation donnée une combinaison linéaire des autres équations.

Considérons une matrice inversible A∈Rⁿ^×ⁿ dont le terme diagonala₁₁ est supposé non nul. On pose A⁽¹⁾= A etb⁽¹⁾=b. On introduit les de même pour le membre de droite. On définit alors

a⁽²⁾_ij =a⁽¹⁾_ij −m_i₁a⁽¹⁾₁_j, i, j= 2, . . . , n,

On peut à nouveau transformer ce système de fa¸con à éliminer l’inconnuex₂ des lignes 3, . . . , n. En poursuivant ainsi, on obtient une suite finie de systèmes A⁽^k⁾x=b⁽^k⁾, 1≤k≤n, (3.26) où, pourk≥2, la matrice A⁽^k⁾est de la forme suivante

A⁽^k⁾=

Pour être consistant avec les notations introduites précédemment, on note U la matrice triangulaire supérieure A⁽ⁿ⁾. Les termesa⁽_kk^k⁾sont appeléspivotset doivent être évidemment non nuls pourk= 1, . . . , n−1.

Afin d’expliciter les formules permettant de passer duk-ième système au k+ 1-ième, pourk = 1, . . . , n−1, on suppose que a⁽_kk^k⁾ = 0 et on définit les

Exemple 3.1 Utilisons la méthode de Gauss pour résoudre le système suivant

(A⁽¹⁾x=b⁽¹⁾)

qui admet la solution x=(1, 1, 1)^T. A la première étape, on calcule les multipli-cateurs m₂₁ = 1/2 etm₃₁ = 1/3, et on soustrait de la deuxième (resp. troisième)

equation la première ligne multipliée par m₂₁ (resp. m₃₁). On obtient le système

Si on soustrait à présent de la troisième ligne la seconde multipliée parm₃₂= 1, on obtient le système triangulaire supérieur

(A⁽³⁾x=b⁽³⁾)

a partir duquel on calcule imm´ediatementx₃= 1 et, par substitution r´etrograde, les

autres inconnuesx₁=x₂= 1. •

Remarque 3.2 La matrice de l’Exemple 3.1 est appelée matrice de Hilbert d’ordre 3. Dans le cas général n×n, ses éléments sont

h_ij= 1/(i+j−1), i, j= 1, . . . , n. (3.29) Comme nous le verrons plus tard, cette matrice est un exemple type de matrice

ayant un grand conditionnement.

Pour effectuer l’élimination de Gauss, 2(n−1)n(n+ 1)3 +n(n−1)flops sont nécessaires, auxquels il faut ajouter n² flops pour la résolution par “re-montée” du système triangulaire Ux=b⁽ⁿ⁾. Ainsi, environ (2n³/3+2n²)flops sont nécessaires pour résoudre le système linéaire en utilisant la méthode de Gauss. En ne conservant que le terme dominant, on peut dire que le procédé d’élimination de Gauss a un coût de 2n³/3flops.

Comme indiqué précédemment, la méthode de Gauss n’est correctement d´ e-finie que si les pivots a⁽_kk^k⁾ sont différents de zéro pourk= 1, . . . , n−1. Mal-heureusement, le fait que les termes diagonaux de A soient non nuls ne suffit pas à empêcher l’apparition de pivots nuls durant la phase d’élimination. Par exemple, la matrice A dans (3.30) est inversible et ses termes diagonaux sont non nuls

Pourtant, on doit interrompre la méthode de Gauss à la seconde étape car a⁽²⁾₂₂ = 0.

Des conditions plus restrictives sur A sont donc nécessaires pour assurer que la méthode s’applique bien. Nous verrons à la Section 3.3.1 que si les mineurs principauxd_i de A sont non nuls pouri= 1, . . . , n−1 alors les pivots correspondantsa⁽_iiⁱ⁾sont également non nuls (rappelons qued_iest le d´ etermi-nant de la i-ième sous-matrice principale A_i, i.e.la sous-matrice constituée des i premières lignes et colonnes de A). La matrice de l’exemple précédent ne satisfait pas cette condition puisqued₁= 1 et d₂= 0.

Il existe des cat´egories de matrices pour lesquelles la m´ethode de Gauss peut ˆ

etre utilis´ee sans risque dans sa forme de base (3.28). Parmi ces matrices, citons les suivantes :

1. les matrices`a diagonale dominante par ligne;

2. les matrices à diagonale dominante par colonne. Dans ce cas, on peut même montrer que les multiplicateurs ont un module inférieur ou égal à 1 (voir Propriété 3.2) ;

3. les matricessymétriques définies positives(voir Théorème 3.6).

Ces r´esultats seront ´etablis rigoureusement dans les prochaines sections.

3.3.1 La méthode de Gauss comme méthode de factorisation Dans cette section, nous montrons que la méthode de Gauss est équivalente à la factorisation de la matrice A sous la forme d’un produit de deux matrices, A=LU, avec U=A⁽ⁿ⁾. Les matrices L et U ne dépendant que de A (et non du second membre), la même factorisation peut être réutilisée quand on r´ e-sout plusieurs systèmes linéaires ayant la même matrice A mais des seconds membresbdifférents. Le nombre d’opérations est alors considérablement r´ e-duit, puisque l’effort de calcul le plus important, environ 2n³/3flops, est dédié

a la proc´edure d’´elimination.

Revenons à l’Exemple 3.1 concernant la matrice de Hilbert H₃. En pra-tique, pour passer de A⁽¹⁾=H₃ à A⁽²⁾, on a multiplié à la première étape le

De même, pour effectuer la seconde (et dernière) étape de la méthode de Gauss, on doit multiplier A⁽²⁾ par la matrice

M₂=

D’autre part, les matrices M₁et M₂étant triangulaires inférieures, leur produit est encore triangulaire inférieur ainsi que leur inverse ; on déduit donc de (3.31)

A = (M₂M₁)⁻¹U = LU.

C’est la factorisation de A que l’on souhaitait établir. Cette identité peut être généralisée comme suit. En posant

mk= [0, . . . ,0, m_k₊₁_,k, . . . , m_n,k]^T ∈Rⁿ,

comme lak-i`emematrice de transformation de Gauss, on a (M_k)_ip=δ_ip−(m_ke^T_k)_ip=δ_ip−m_ikδ_kp, i, p= 1, . . . , n.

D’autre part, on a d’apr`es (3.28) a⁽_ij^k⁺¹⁾=a⁽_ij^k⁾−m_ikδ_kka⁽_kj^k⁾=

n p=1

(δ_ip−m_ikδ_kp)a⁽_pj^k⁾, i, j=k+ 1, . . . , n, ou, de mani`ere ´equivalente,

A⁽^k⁺¹⁾= MkA⁽^k⁾. (3.32) Par conséquent, à la fin du procédé d’élimination, on a construit les matrices M_k,k= 1, . . . , n−1, et la matrice U telles que

M_n₋₁M_n₋₂. . .M₁A = U.

Les matrices M_ksont des matrices triangulaires inférieures dont les coefficients diagonaux valent 1 et dont l’inverse est donné par

M⁻¹_k = 2In−Mk= In+mke^T_k. (3.33)

Remarquons que, d’après (3.34), les éléments sous-diagonaux de L sont les multiplicateurs mik générés par la méthode de Gauss, tandis que les termes diagonaux sont égaux à 1.

Une fois calculées les matrices L et U, résoudre le système linéaire consiste simplement à résoudre successivement les deux systèmes triangulaires

Ly=b, Ux=y.

Le coût de la factorisation est évidemment le même que celui de la méthode de Gauss.

Le résultat suivant établit un lien entre les mineurs principaux d’une ma-trice et sa factorisation LU induite par la méthode de Gauss.

Th´eor`eme 3.4 Soit A∈Rⁿ^×ⁿ. La factorisation LU deA avec l_ii = 1 pour i= 1, . . . , nexiste et est unique si et seulement si les sous-matrices principales A_i de Ad’ordrei= 1, . . . , n−1 sont inversibles.

Démonstration.Nous pourrions montrer l’existence de la factorisation LU en suivant les étapes de la méthode de Gauss. Nous préférons adopter ici une autre approche que nous réutiliserons dans les prochaines sections et qui nous permet de prouver en même temps l’existence et l’unicité.

Supposons les sous-matrices principales A_ide A inversibles pouri= 1, . . . , n−1 et montrons par r´ecurrence sur il’existence et l’unicit´e de la factorisation LU de A(= A_n) avecl_ii= 1 pouri= 1, . . . , n.

La propriété est évidemment vraie sii= 1. Montrons que s’il existe une unique factorisation LU de A_i−1 de la forme A_i−1= L⁽ⁱ⁻¹⁾U⁽ⁱ⁻¹⁾avecl_kk⁽ⁱ⁻¹⁾= 1 pourk= et cherchons une factorisation de A_ide la forme

⎡ produit de ces deux matrices et en identifiant par blocs les éléments de A_i, on en déduit que les vecteursletusont les solutions des systèmes linéaires L⁽ⁱ⁻¹⁾u=c, l^TU⁽ⁱ⁻¹⁾=d^T.

Or, 0= dét(A_i−1) = dét(L⁽ⁱ⁻¹⁾)dét(U⁽ⁱ⁻¹⁾), les matrices L⁽ⁱ⁻¹⁾ et U⁽ⁱ⁻¹⁾ sont donc inversibles. Par conséquent, uetlexistent et sont uniques.

Ainsi, il existe une unique factorisation de A_i, et u_ii est l’unique solution de l’équation u_ii= a_ii−l^Tu. Ce qui achève la preuve par récurrence.

Il reste maintenant à prouver que si la factorisation existe et est unique alors les n−1 premières sous-matrices principales de A sont inversibles. Nous distinguerons les cas où A est singulière et où A est inversible.

Commen¸cons par le second cas, et supposons l’existence et l’unicit´e de la fac-torisation LU de A avec l_ii = 1 pour i = 1, . . . , n. Alors, d’apr`es (3.35), on a Ai= L⁽ⁱ⁾U⁽ⁱ⁾pouri= 1, . . . , n, et donc

dét(A_i) = dét(L⁽ⁱ⁾)dét(U⁽ⁱ⁾) = dét(U⁽ⁱ⁾) =u₁₁u₂₂. . . u_ii. (3.36) En prenant i = n et en utilisant le fait que A est inversible, on en déduit que u₁₁u₂₂. . . u_nn= 0, et donc dét(A_i) =u₁₁u₂₂. . . u_ii= 0 pouri= 1, . . . , n−1.

Considérons maintenant le cas où A est une matrice singulière et supposons qu’au moins un terme diagonal de U soit égal à zéro. Notonsu_kk le terme nul de U dont l’indicek est le plus petit. D’après (3.35), la factorisation peut être effectuée sans problème jusqu’à lak+ 1-ième étape. A partir de cette étape, la matrice U^(k)

etant singulière, on perd l’existence et l’unicité du vecteurl^T. On perd donc aussi l’unicité de la factorisation. Afin que ceci ne se produise pas avant la factorisation complète de la matrice A, les termesu_kkdoivent être tous non nuls jusqu’à l’indice k = n−1 inclus, et donc, d’après (3.36), toutes les sous-matrices principales A_k doivent être inversibles pourk= 1, . . . , n−1. 3

D’après le théorème précédent, si une sous-matrice A_i,i = 1, . . . , n−1, est singulière, alors la factorisation peut ne pas exister ou ne pas être unique (voir Exercice 8).

Dans le cas où la factorisation LU est unique, notons que, puisque dét(A) = dét(LU) = dét(L)dét(U) = dét(U), le déterminant de A est donné par

d´et(A) =u₁₁· · ·u_nn.

Indiquons la propri´et´e suivante (dont la preuve se trouve par exemple dans [GL89] ou [Hig96]) :

Propriété 3.2 SiAest une matrice à diagonale dominante par ligne ou par colonne, alors la factorisation LU deAexiste et est unique. En particulier, si A est à diagonale dominante par colonne alors|l_ij| ≤1 ∀i, j.

Dans la preuve du Théorème 3.4, nous avons exploité le fait que les termes diagonaux de L étaient égaux à 1. Nous aurions pu, de manière analogue, fixer

a 1 les termes diagonaux de la matrice triangulaire supérieure U, obtenant alors une variante de la méthode de Gauss. Nous considérerons cette variante

a la Section 3.3.4.

La liberté d’imposer les valeurs des termes diagonaux de L ou de U im-plique que plusieurs factorisations LU existent, chacune pouvant être déduite de l’autre par multiplication par une matrice diagonale convenable (voir Sec-tion 3.4.1).

3.3.2 Eﬀets des erreurs d’arrondi

Si les erreurs d’arrondi sont prises en compte, la factorisation induite par la méthode de Gauss conduit à deux matrices, L etU, telles que LU = A + δA, oùδA est une matrice de perturbation. Une estimation de cette perturbation est donnée par

|δA| ≤ nu

1−nu|L| |U|, (3.37) où u est l’unité d’arrondi (voir [Hig89] pour la preuve de ce résultat). On voit que la présence de petits pivots peut rendre très grand le second membre de l’inégalité (3.37), conduisant alors à un mauvais contrôle de la matrice de perturbationδA. Il serait donc intéressant de trouver des estimations du type

|δA| ≤g(u)|A|,

oùg(u) est une fonction deuà déterminer. Par exemple, supposons queL et U aient des termes positifs. On obtient alors, puisque |L| |U|=|LU|,

|L| |U|=|LU|=|A +δA| ≤ |A|+|δA| ≤ |A|+ nu

1−nu|L| |U|, (3.38)

d’o`u on d´eduit l’estimation voulue avecg(u) =nu/(1−2nu).

La stratégie du pivot, examinée à la Section 3.5, permet de maˆıtriser la taille des pivots et rend possible l’obtention d’estimations du type (3.38) pour toute matrice.

3.3.3 Impl´ementation de la factorisation LU

La matrice L étant triangulaire inférieure avec des 1 sur la diagonale et U étant triangulaire supérieure, il est possible (et commode) de stocker directement la factorisation LU dans l’emplacement mémoire occupé par la matrice A.

Plus précisément, U est stockée dans la partie triangulaire supérieure de A (y compris la diagonale), et L occupe la partie triangulaire inférieure stricte (il est inutile de stocker les éléments diagonaux de L puisqu’on saita priori qu’ils valent 1).

Le code MATLAB de l’algorithme est proposé dans le Programme 4. La factorisation LU est stockée directement à la place de la matrice A.

Programme 4 - lukji: Factorisation LU de la matrice A, versionkji function [A]=lukji(A)

% LUKJI Factorisation LU de la matrice A dans la version kji

% Y=LUKJI(A): U est stock´e dans la partie triangulaire sup´erieure

% de Y et L est stock´e dans la partie triangulaire inf´erieure

% stricte de Y.

[n,m]=size(A);

if n ˜= m, error(’Seulement les syst`emes carr´es’); end for k=1:n-1

if A(k,k)==0; error(’Pivot nul’); end A(k+1:n,k)=A(k+1:n,k)/A(k,k);

for j=k+1:n

i=[k+1:n]; A(i,j)=A(i,j)-A(i,k)*A(k,j);

end end return

On appelle cette implémentation de l’algorithme de factorisationversion kji, à cause de l’ordre dans lequel les boucles sont exécutées. On l’appelle

egalement SAXP Y −kji car l’opération de base de l’algorithme consiste à effectuer le produit d’un scalaire par un vecteur puis une addition avec un autre vecteur (SAXP Y est une formule consacrée par l’usage ; elle provient de “ScalaireAmultiplié par vecteur X PlusY”).

La factorisation peut naturellement être effectuée dans un ordre différent.

Quand la boucle sur l’indiceiprécède celle surj, l’algorithme est ditorienté ligne. Dans le cas contraire, on dit qu’il est orienté colonne. Comme d’habi-tude, cette terminologie provient du fait que la matrice est lue par lignes ou par colonnes.

Un exemple de factorisation LU enversionjkiet orienté colonne est donné dans le Programme 5. Cette version est appeléeGAXP Y−jki, car l’opération de base de cette implémentation est le produit matrice-vecteur (GAXP Y provenant de “sAXP Y Généralisé”, ce qu’il faut interpréter comme “SAXP Y dans lequel le produit par un scalaire est remplacé par le produit par une matrice”; pour plus de précisions voir [DGK84]).

Programme 5 - lujki: Factorisation LU de la matrice A, versionjki function [A]=lujki(A)

% LUJKI Factorisation LU de la matrice A dans la version jki

% Y=LUJKI(A): U est stock´e dans la partie triangulaire sup´erieure

% de Y et L est stock´e dans la partie triangulaire inf´erieure

% stricte de Y.

[n,m]=size(A);

if n ˜= m, error(’Seulement les syst`emes carr´es’); end for j=1:n

if A(j,j)==0; error(’Pivot nul’); end for k=1:j-1

i=[k+1:n]; A(i,j)=A(i,j)-A(i,k)*A(k,j);

end

i=[j+1:n]; A(i,j)=A(i,j)/A(j,j);

end return

3.3.4 Formes compactes de factorisation

La factorisation dite de Crout et celle dite de Doolittle constituent des va-riantes de la factorisation LU. On les appelle aussi formes compactes de la méthode d’élimination de Gauss car elles nécessitent moins de résultats inter-médiaires que la méthode de Gauss classique pour produire une factorisation de A.

Calculer la factorisation de A est formellement équivalent à résoudre le système linéaire suivant den²équations

a_ij =

min(i,j) r=1

l_iru_rj, (3.39)

les inconnues étant lesn²+ncoefficients des matrices triangulaires L et U. Si on donne arbitrairement la valeur 1 àncoefficients, par exemple les éléments diagonaux de L ou de U, on aboutit respectivement aux méthodes de Doolittle et de Crout, qui constituent une manière efficace de résoudre le système (3.39).

Supposons que lesk−1 premières colonnes de L et U soient disponibles et fixonsl_kk= 1 (méthode de Doolittle). La relation (3.39) donne alors

a_kj=

Remarquer que ces équations peuvent être résolues de manière séquentielle par rapport aux inconnues (encadrées) ukj etlik.

La méthode compacte de Doolittle fournit d’abord lak-ième ligne de U, puis la k-ième colonne de L, selon les formules : pourk= 1, . . . , n

La factorisation de Crout s’obtient de fa¸con similaire, en calculant d’abord la k-i`eme colonne de L, puis lak-i`eme ligne de U : pourk= 1, . . . , n

où on a poséu_kk= 1. Selon les notations introduites précédemment, la facto-risation de Doolittle n’est autre que la version ijkde la méthode de Gauss.

Nous proposons dans le Programme 6 une implémentation du schéma de Doolittle. Remarquer que l’opération principale est à présent un produit sca-laire, le schéma est donc aussi connu sous le nom de versionDOT −ijkde la méthode de Gauss (dot désignant en anglais lepoint du produit scalaire).

Programme 6 - luijk: Factorisation LU de la matrice A, versionijk function [A]=luijk(A)

% LUIJK Factorisation LU de la matrice A dans la version ijk

% Y=LUIJK(A): U est stock´e dans la partie triangulaire sup´erieure

% de Y et L est stock´e dans la partie triangulaire inf´erieure

% stricte de Y.

[n,m]=size(A);

if n ˜= m, error(’Seulement les syst`emes carr´es’); end for i=1:n

for j=2:i

if A(j,j)==0; error(’Pivot nul’); end A(i,j-1)=A(i,j-1)/A(j-1,j-1);

k=[1:j-1]; A(i,j)=A(i,j)-A(i,k)*A(k,j);

end k=[1:i-1];

for j=i+1:n

A(i,j)=A(i,j)-A(i,k)*A(k,j);

end end return

Dans le document Méthodes Numériques (Page 84-95)