R´ esolution d’un syst` eme triangulaire - M´ ethodes directes pour la r´ esolution des syst` e

M´ ethodes directes pour la r´ esolution des syst` emes lin´ eaires

3.2 R´ esolution d’un syst` eme triangulaire

x= Cbde l’analysea priorirétrograde. On pourrait donc songer à calculer C dans le seul but d’utiliser l’estimation (3.16) (par exemple, dans le cas où (3.2) est résolu par la méthode d’élimination de Gauss, on peut calculer C a posteriorien utilisant la factorisation LU de A, voir les Sections 3.3 et 3.3.1).

Concluons en remarquant que si δb est interprété dans (3.11) comme le résidu de la solution calculéey=x+δx, on a également

x ≤K(A) r

b . (3.17)

L’estimation (3.17) n’est pas utilisée en pratique car le résidu calculé est en-taché d’erreur d’arrondi. En posant r = fl(b−Ay) et en supposant que notation sera désignée dans la suitenotation valeur absolue. Nous utiliserons aussi la notation suivante

C≤D, o`u C, D∈R^m^×ⁿ pour indiquer que

c_ij≤d_ij pour i= 1, . . . , m, j= 1, . . . , n.

Des formules du type de (3.18) sont implémentées dans la bibliothèque d’al-gèbre linéaire LAPACK (voir [ABB⁺92]).

3.2 R´ esolution d’un syst` eme triangulaire

Considérons un système inversible 3×3 triangulaire inférieur :

⎡

La matrice ´etant inversible, ses termes diagonaux l_ii, i = 1,2,3 sont non nuls. On peut donc d´eterminer successivement les valeurs inconnues x_i pour i= 1,2,3 :

x₁=b₁/l₁₁,

x₂= (b₂−l₂₁x₁)/l₂₂, x₃= (b₃−l₃₁x₁−l₃₂x₂)/l₃₃.

Cet algorithme peut être étendu aux systèmes n×n. On l’appelle substitu-tion directe. Dans le cas d’un système Lx=b, où L est une matrice inversible triangulaire inférieure d’ordren(n≥2), la méthode s’écrit

x₁= b₁ l₁₁, x_i= 1

l_ii

⎛

⎝b_i−

i−1

j=1

l_ijx_j

⎞

⎠, i= 2, . . . , n.

(3.19)

On appelle ces relations formules de “descente”. L’algorithme effectue n(n+ 1)/2 multiplications et divisions et n(n−1)/2 additions et soustractions. Le nombre global d’opérations pour (3.19) est doncn²flops.

On traite de manière analogue un système linéaire Ux=b, où U est une matrice inversible triangulaire supérieure d’ordren(n≥2). Dans ce cas l’al-gorithme s’appellesubstitution rétrogradeet s’écrit dans le cas général

x_n= b_n u_nn, xi= 1

uii

⎛

⎝b_i− n j=i+1

uijxj

⎞

⎠, i=n−1, . . . ,1

(3.20)

(formules de “remontée”). Son coût est encore den²flops.

3.2.1 Impl´ementation des m´ethodes de substitution

A l’étape i de l’algorithme (3.19), on effectue un produit scalaire entre le vecteur ligne L(i,1 : i−1) (cette notation désignant le vecteur obtenu en extrayant de la matrice L les éléments de la i-ième ligne depuis la première jusqu’à la (i-1)-ième colonne) et le vecteur colonne x(1 :i−1). L’accès aux

eléments de la matrice L se fait donc par ligne ; pour cette raison, on dit que l’algorithme de substitution directe implémenté comme ci-dessus est orienté ligne.

Son impl´ementation est propos´ee dans le Programme 1.

Programme 1 - forwardrow: Substitution directe : version orient´ee ligne function [x]=forwardrow(L,b)

% FORWARDROW substitution directe: version orient´ee ligne.

% X=FORWARDROW(L,B) résout le système triangulaire inférieur L*X=B

% avec la m´ethode de substitution directe dans sa version

% orient´ee ligne [n,m]=size(L);

if n ˜= m, error(’Seulement des syst`emes carr´es’); end

if min(abs(diag(L))) == 0, error(’Le syst`eme est singulier’); end x(1,1) = b(1)/L(1,1);

for i = 2:n

x (i,1) = (b(i)-L(i,1:i-1)*x(1:i-1,1))/L(i,i);

end return

Pour obtenir une version orientée colonne du même algorithme, on tire avantage du fait que la i-ième composante du vecteur x, une fois calculée, peut être aisément éliminée du système.

Une implémentation de cette procédure, dans laquelle la solution x est stockée à la place du membre de droiteb, est proposée dans le Programme 2.

Programme 2 - forwardcol: Substitution directe : version orient´ee colonne function [b]=forwardcol(L,b)

% FORWARDCOL substitution directe: version orient´ee colonne.

% X=FORWARDCOL(L,B) résout le système triangulaire inférieur L*X=B

% avec la m´ethode de substitution directe dans sa version

% orient´ee colonne [n,m]=size(L);

if n ˜= m, error(’Seulement des syst`emes carr´es’); end

if min(abs(diag(L))) == 0, error(’Le syst`eme est singulier’); end for j=1:n-1

b(j)= b(j)/L(j,j); b(j+1:n)=b(j+1:n)-b(j)*L(j+1:n,j);

end

b(n) = b(n)/L(n,n);

return

Implémenter le même algorithme par une approche orientée ligne plutôt que colonne peut modifier considérablement ses performances (mais bien sûr pas la solution). Le choix de l’implémentation doit donc être subordonné à l’ar-chitecture spécifique du calculateur utilisé.

Des considérations analogues sont valables pour la méthode de substitution rétrograde présentée en (3.20) dans sa version orientée ligne.

On a implémenté la version orientée colonne dans le Programme 3. Comme précédemment, le vecteur xest stocké dansb.

Programme 3 - backwardcol: Substitution r´etrograde : version orient´ee colonne

function [b]=backwardcol(U,b)

% BACKWARDCOL substitution r´etrograde: version orient´ee colonne.

% X=BACKWARDCOL(U,B) résout le système triangulaire supérieur

% U*X=B avec la m´ethode de substitution r´etrograde dans sa

% version orient´ee colonne.

[n,m]=size(U);

if n ˜= m, error(’Seulement des syst`emes carr´es’); end

if min(abs(diag(U))) == 0, error(’Le syst`eme est singulier’); end for j = n:-1:2,

b(j)=b(j)/U(j,j); b(1:j-1)=b(1:j-1)-b(j)*U(1:j-1,j);

end

b(1) = b(1)/U(1,1);

return

Quand on résout de grands systèmes triangulaires, seule la partie triangu-laire de la matrice doit être stockée, ce qui permet une économie de mémoire considérable.

3.2.2 Analyse des erreurs d’arrondi

Dans l’analyse effectuée jusqu’à présent, nous n’avons pas considéré la pr´ e-sence des erreurs d’arrondi. Quand on prend celles-ci en compte, les algo-rithmes de substitution directe et rétrograde ne conduisent plus aux solutions exactes des systèmes Lx=bet Uy=b, mais fournissent des solutions appro-chéesxqu’on peut voir comme des solutionsexactesdes systèmes perturbés

(L +δL)x=b, (U +δU)x=b,

où δL = (δl_ij) et δU = (δu_ij) sont des matrices de perturbation. En vue d’appliquer l’estimation (3.9) établie à la Section 3.1.2, on doit estimer les matrices de perturbationδL etδU en fonction des coefficients des matrices L et U, de leur taille, et des caractéristiques de l’arithmétique à virgule flottante.

On peut montrer que

|δT| ≤ nu

1−nu|T|, (3.21)

où T est égal à L ou U et oùuest l’unité d’arrondi définie en (2.34). Clairement, si nu<1, en utilisant un développement de Taylor, il découle de (3.21) que

|δT| ≤nu|T|+O(u²). De plus, d’apr`es (3.21) et (3.9), si nuK(T)<1 alors x−x

x ≤ nuK(T)

1−nuK(T) =nuK(T) +O(u²), (3.22)

pour les normes · 1, · ∞ et la norme de Frobenius. Si la valeur deuest assez petite (comme c’est typiquement le cas), les perturbations introduites

par les erreurs d’arrondi dans la résolution d’un système triangulaire peuvent donc être négligées. Par conséquent, la précision des solutions calculées par les algorithmes de substitution directe et rétrograde est généralement très élevée.

Ces résultats peuvent être encore améliorés en faisant des hypothèses sup-plémentaires sur les coefficients de L ou U. En particulier, si les coefficients de U sont tels que|u_ii| ≥ |u_ij|pour toutj > i, alors

|xi−xi| ≤2ⁿ⁻ⁱ⁺¹ nu 1−nu max

j≥i|xj|, 1≤i≤n.

On a le même résultat si T=L quand |lii| ≥ |lij|pour toutj < i, ou si L et U sont à diagonale dominante. Les estimations précédentes seront utilisées dans les Sections 3.3.1 et 3.4.2.

Pour les démonstrations des résultats que nous venons d’énoncer, voir [FM67], [Hig89] et [Hig88].

3.2.3 Inverse d’une matrice triangulaire

On peut employer l’algorithme (3.20) (resp. (3.19)) pour calculer explicitement l’inverse d’une matrice triangulaire supérieure (resp. inférieure). En effet, étant donné une matrice triangulaire supérieure inversible U, les vecteurs colonnes vi de l’inverse V=(v₁, . . . ,vn) de U satisfont les systèmes linéaires suivants

Uv_i =ei, i= 1, . . . , n, (3.23) où {ei} est la base canonique deRⁿ (définie dans l’Exemple 1.2). Le calcul desvi nécessite donc d’appliquernfois l’algorithme (3.20) à (3.23).

Cette procédure est assez inefficace puisqu’au moins la moitié des éléments de l’inverse de U sont nuls. Nous allons tirer avantage de ceci. Notons v_k = (v₁_k, . . . , v_kk)^T le vecteur de taillektel que

U⁽^k⁾v_k=lk k= 1, . . . , n, (3.24) où les U⁽^k⁾sont les sous-matrices principales de U d’ordreketl_kest le vecteur deR^kdont le premier élément vaut 1 et les autres 0. Les systèmes (3.24) sont triangulaires supérieurs d’ordre k et ils peuvent être à nouveau résolus en utilisant la méthode (3.20). L’algorithme d’inversion des matrices triangulaires supérieures s’écrit : pourk=n, n−1, . . . ,1, calculer

v_kk=u⁻¹_kk, v_ik=−u⁻¹_ii

k j=i+1

u_ijv_jk, pour i=k−1, k−2, . . . ,1. (3.25) A la fin de cette procédure, les vecteurs v_k fournissent les termes non nuls des colonnes de U⁻¹. L’algorithme nécessite environn³/3 + (3/4)n² flops. A nouveau à cause des erreurs d’arrondi, l’algorithme (3.25) ne donne pas la solution exacte, mais une approximation de celle-ci. On peut évaluer l’erreur introduite en utilisant l’analysea priorirétrograde effectuée à la Section 3.1.3.

Dans le document Méthodes Numériques (Page 79-84)