Systèmes d’équations linéaire ; opérations élémentaires, aspects algorithmiques, conséquences théoriques

(1)

Systèmes d’équations linéaire ; opérations

élémentaires, aspects algorithmiques, conséquences théoriques

Gabriel L

EPETIT

Mémoire de master 2 MEEF dirigé par GuyCASALEsur une leçon présentée en collaboration avec AntoineD^IEZ.

Table des matières

1 Théorie générale des systèmes linéaires 2

1.1 Systèmes de Cramer . . . 2

1.2 Cas général : le théorème de Rouché-Fontené . . . 3

1.3 Le cas des systèmes homogènes . . . 4

2 Sur les opérations élémentaires 7 2.1 Définitions . . . 7

2.2 L’algorithme du pivot de Gauss . . . 8

2.3 Interprétation en termes d’actions de groupes . . . 9

2.4 Sur un anneau euclidien : l’algorithme des facteurs invariants . . . 12

3 Résolution effective des systèmes linéaires 14 3.1 Méthodes directes . . . 14

3.2 Méthodes itératives de résolution d’un système linéaire . . . 15

3.3 Méthodes de gradient . . . 17

3.3.1 Méthode de gradient conjugué . . . 18

3.3.2 Méthode de gradient à pas optimal . . . 19

***

La résolution de systèmes linéaires sur un corps est un problème de base, aussi bien en algèbre qu’en analyse. En effet, la résolution numérique d’un problème d’équations aux dé- rivées partielles passe souvent par une discrétisation nécessitant la résolution d’un système linéaire. En outre, le calcul de la transformée de Fourier rapide, central en traitement numé- rique du signal, fait appel à cette notion. L’étude de systèmes linéaires sur un anneau dans le cadre de la théorie des modules donne lieu à de riches développements en arithmétique.

La recherche de méthodes efficaces pour résoudre ce genre de systèmes est cruciale car les systèmes apparaissant dans la pratique sont souvent de très grande taille.

Dans ce mémoire, on présentera tout d’abord une théorie générale des systèmes linéaires, notamment le théorème de Rouché-Fontené qui donne des conditions d’existence des solutions, puis on développera une méthode algorithmique de résolution par opérations élémen- taires, le pivot de Gauss, qu’on interprétera en termes d’actions de groupe sur l’espace des matrices. Enfin, la troisième partie sera l’occasion de s’intéresser à des méthodes directes ou itératives efficaces de résolution.

(2)

1 Théorie générale des systèmes linéaires

On se donne un corpsK etA∈ Mm,n(K),b∈ Mm,1(K). On cherche à étudier le système linéaire Ax =b. On se demande d’abord s’il admet des solutions, quelle est la structure de l’espace des solutions, s’il est possible de calculer ces solutions explicitement. La recherche de l’efficacité dans cette démarche fera l’objet des parties suivantes.

Définition 1.1

Le systèmeAx = best ditcompatibles’il admet au moins une solution x ∈ Mm,1(K). Le rangdu système est le rang deA.

1.1 Systèmes de Cramer

Définition 1.2

On parle desystème de CramerquandAest dansGL_n(K).

Un système de Cramer admet donc une unique solution x =A⁻¹b.

Théorème 1.3 (Formules de Cramer)

Si A = (a_{i j})1¶i,j¶n, l’unique solution du système de Cramer Ax = b est donnée par x =



 x₁

... x_n



où

∀i∈J1,nK,x_i =

a₁₁ . . . a_1,i−₁ b₁ a_1,i+₁ . . . a_1,n ... ... ... ... ... a_n,1 a_n,i−₁ b_n a_n,i+₁ . . . a_n,n

detA

Démonstration.En notantC₁, . . . ,C_n les colonnes deA, on a b=Pⁿ

i=1

x_iC_i.

On noteA_k la matrice obtenue en remplaçant lak-ème colonne par b, etB_i,k la matrice obtenue en remplaçant lak-ème colonne parC_i. Par linéarité du déterminant par rapport à lak-ème colonne et en utilisant son caractère alterné, on a :

det(A_k) = Xn

i=1

x_idet(B_i,k) = x_kdetB_k,k=x_kdetA

Le calcul de la solution demande de l’ordre de(n+1)! opérations. En effet, il faut calculer n+1 déterminants, chacun se calculant en n! opérations.

Exemple 1.4.ConsidéronsA=





2 −5 2

1 2 −4

3 −4 −6



etb=



 7 3 5



. Alors on ax₁=−1 46

7 −5 2

3 2 −4

5 −4 −6

=

5, x₂=−1 46

2 7 2

1 3 −4 3 5 −6

=1, x₃ =−1 46

2 −5 7

1 2 3

3 −4 5

=1.

(3)

1.2 Cas général : le théorème de Rouché-Fontené

Soit A ∈ Mm,n(K), on note r ¶ min(n,m) le rang du système. Quitte à permuter et renuméroter les équations, on peut supposer que δ=

a₁₁ . . . a_1,r ... ... a_r,1 . . . a_r,r

6=0 Définition 1.5

On appelledéterminants caractéristiquesdu systèmeAx =bles déterminants

∆s =

a₁₁ . . . a_1,r b₁ ... ... ... a_r_,1 . . . a_r,r b_r a_s,1 . . . a_s,r b_s

pours∈Jr+1,nK

Théorème 1.6 (Rouché-Fontené)

Le systèmeAx = b est compatible si et seulement si ∆s =0 pour touts ∈Jr+1,nK. Dans ce cas, les solutions forment un espace affine de dimension n−r. Une solution x est obtenue en donnant à x_r₊₁, . . . ,x_n des valeurs arbitraires puis en calculant l’unique solution du système







a₁₁x₁+· · ·+a_1,rx_r = b₁−a_1,r₊₁x_r₊₁− · · · −a_1,nx_n

... ... ...

a_r,1x₁+· · ·+a_r,rx_r = b_r−a_r,r₊₁x_r₊₁− · · · −a_r,nx_n La preuve présentée est issue de[5], p. 144.

Démonstration.Notons C₁, . . . ,C_n les colonnes de A. Comme δ est un mineur non nul de taille rde(C₁. . .C_r), lesrpremières colonnes deAforment une famille libre, donc une base de ImA. Ainsi, le systèmeAx =best compatible si et seulement si(C₁, . . .C_r,b)est liée, c’est à dire de rangr, ce qui équivaut à la nullité de tous les mineurs de tailler+1 de(C₁. . .C_rb), qui ne sont autre que les déterminants caractéristiques∆s, pours∈Jr+1,nK.

Sous ces conditions,B= (C₁. . .C_nb)est de rangrdonc ses lignes constituent une famille

de rang r. MaisB =







a₁₁ . . . a_1r . . . a_1n b₁ ... ... ... ... a_r1 . . . a_{r r} . . . a_{r n} b_r

... ... ...

a_p1 . . . a_pr . . . a_pn b_p







donc puisqueδ6=0, lesr premières

lignes sont indépendantes. Les p−r dernières lignes sont donc combinaisons linéaires des r premières, ce qui permet leur élimination du système d’équations linéaires, qui devient équivalent au système d’équations principalessuivant :







a₁₁x₁+· · ·+a_1rx_r+a_1,r₊₁x_r₊₁+· · ·+a_1,nx_n = b₁

... ...

a_r,1x₁+· · ·+a_r,rx_r+a_r_,r₊₁x_r₊₁+· · ·+a_r,nx_n. . . = b_r

A nouveau, le fait que δ 6= 0 garantit qu’une fois x_r+1, . . . ,x_n arbitrairement choisis, il existe un unique (x₁, . . . ,x_r)tel que (x₁, . . . ,x_n) soit solution deAx = b. En particulier, l’espace des solutions est un espace affine de dimensionn−r.

(4)

Exemple 1.7.Soit la matrice réelle de rang 2A =





1 2 −1 1

1 0 −1 −1

−1 1 1 2



 et b =



 1 1 m



,m ∈

R. Le seul déterminant caractéristique est ∆ =

1 2 1

1 0 1

−1 1 m

= −2(m+1). Le système admet donc des solutions si et seulement si m = −1 et dans ce cas, il est équivalent à

§ x₁ = 1+x₃+x₄ x₂ = −x₄ .

1.3 Le cas des systèmes homogènes

Proposition 1.8

SoitA∈ Mm,n(K). SiAest de rangr, alors les solutions deAx=0constituent un espace vectoriel de dimensionn−r.

Ce résultat de base peut être appliqué par exemple pour prouver le théorème d’Artin, résultat de théorie de Galois. On s’appuie sur la démonstration de[6].

Lemme 1.9 (Dedekind)

SoientK, Ldeux corps et(ϕ1, . . . ,ϕn)une famille de morphismes de corps distincts de K dans L. Alors elle est linéairement indépendante sur L: si∀x ∈K,

n

P

i=1αiϕi(x) =0, on aα1 =· · ·=αn=0.

Démonstration.Supposons qu’il existeα1, . . . ,αnnon tous nuls tels que∀x ∈K,

n

P

i=1

αiϕi(x) = 0. Quitte à réordonner les termes de la somme, on peut trouver r ∈N^∗ tels queα1, . . . ,αr

sont non nuls etα_r+1=· · ·=αn=0, et on peut choisir(αi)i de sorte que ce r soit minimal.

Soity ∈Ktel queϕ1(y)6=ϕr(y). On a pour toutx ∈K,0=P^r

i=1

αiϕi(y x) = P^r

i=1

αiϕi(y)ϕi(x). De plus,ϕ1(y)P^r

i=1

αiϕi(x) =0 donc en soustrayant ces deux équations,

∀x ∈K,

r

X

i=2

αi(ϕi(y)−ϕ1(x))ϕi(x) =0

Comme par hypothèseαr(ϕr(y)−ϕ1(y))6=0, on a une combinaison linéaire à coefficients non tous nuls de r−1 termes de(ϕi)i ce qui contredit la minimalité der.

Théorème 1.10

Si L est un corps et H est un groupe fini du groupe des automorphismes de L, alors si L^H ={x ∈L:∀σ∈H,σ(x) = x}, L/L^H est une extension finie,|H|= [L: L^H]et H est le groupe desL^H-automorphismes de L.

Démonstration.On notem= [L: L^H](éventuellement égal à∞) etn=|H|. On va vérifier dans un premier temps que m=n.

1 Supposons que m<n<+∞. Fixons x₁, . . . ,x_m une base de L sur L^H et notonsH = {σ1, . . . ,σn}. Considérons le système deméquations àninconnues dans L,Y₁, . . . ,Y_n défini par :

∀j∈J1,mK,σ1(x_j)Y₁+. . .σn(x_j)Y_n=0

(5)

C’est un système surdéterminé donc il admet une solution non nulle(y₁, . . . ,y_n). Par suite, pour tout x =P^m

j=1

αjx_j ∈L, oùαj ∈L^H, on a

n

X

i=1

σi(x)y_i=

n

X

i=1 m

X

j=1

αjσi(x_j)y_i =

m

X

j=1

αj

_m X

i=1

σi(x_j)y_i

=0 On a donc Pn

i=1 y_iσi =0 avec les y_i non tous nuls ce qui contredit le lemme d’indé- pendance de Dedekind ci-dessous. Doncm¾n.

2 Supposons que m>n. Il existe donc une famille (x₁, . . . ,x_n+₁)d’éléments de L libre sur L^H. Selon le même argument que pour le premier point, on peut trouver une famille non nulle(y₁, . . . ,y_n+1)∈Lⁿ⁺¹)vérifiant (S):

∀i∈J1,nK,σi(x₁)y₁+· · ·+σi(x_n+₁)y_n+₁=0

Sans perte de généralité, on peut supposer que parmi toutes les solutions non nulles, (y₁, . . . ,y_n+₁)a un nombre minimalr de termes non nuls. Alors quitte à renuméroter, on peut supposer que∀i¶r,y_i 6=0 et∀i>r,y_i=0. Ainsi,(S)se réécrit :

∀i∈J1,nK,σi(x₁)y₁+· · ·+σi(x_r)y_r=0

Soit σ∈H, appliquonsσ au système(S): ∀i∈J1,nK,(σ◦σi)(x₁)σ(y₁) +· · ·+ (σ◦ σi)σ(y_r) =0. Commeτ7→σ◦τest une permutation de l’ensemble finiH, on a donc (∆):

∀i∈J1,nK,σi(x₁)y₁+· · ·+σi(x_r)y_r=0

En multipliant (S) par σ(y₁), (∆) par y₁ et en additionnant les deux systèmes, on obtient

∀i∈J1,nK,σi(x₂)(σ(y₁)y₂−σ(y₂)y₁) +· · ·+σi(x_r)(σ(y₁)y_r−σ(y_r)y₁) =0 L’entier r étant le nombre minimal de termes non nuls d’une solution non triviale de (S), on a ∀j ∈ J2,rK,σ(y₁)y_j −y₁σ(y_j) = 0, soit σ(y₁y⁻_j ¹) = y₁y⁻_j¹ donc ∀j ∈ J2,rK,y₁y⁻¹_j ∈L^H. Ainsi pour tout 2¶ j¶r, il existez_j∈(L^H)^∗ tel que y_j=z_jy₁. La ligne de(S)correspondant àσi=id_Ldevient alors :x₁y₁+x₂z₂y₁+· · ·+x_rz_ry₁=0 donc comme y₁ 6=0, on a x₁+x₂z₂+· · ·+x_rz_r=0, de sorte que(x₁, . . . ,x_r)est une famille liée, ce qui contredit l’hypothèse initiale. Donc m ¶ n< +∞ et finalement m=n.

3 Notons G le groupe des L^H-automorphismes de L. Il contientH de manière évidente.

Montrons que G est fini. Soit (a₁, . . . ,a_n) une base de L sur L^H, Π1, . . . ,Πr les poly- nômes minimaux respectifs des a_i sur L^H et f =Π1. . .Πr ∈L^H[X]. SoitR l’ensemble (fini) des racines de f dans L. CommeΠj(a_j) =0 pour tout j,R contient{a₁, . . .a_n}. De plus, si x = Pⁿ

i=1

αia_i ∈ L, où αi ∈ L^H, alors, pour tout élément σ de G, on a σ(x) = Pⁿ

i=1

αiσ(a_i). Cela nous assure que ψ: G −→ S(R) σ 7−→ σ_|R

est injective et donc que G est fini.

On a L^H ⊂L^G⊂Lpar définition deG, et L^G⊂L^H⊂LcarH ⊂Gdonc L^H =L^G. Selon la conclusion du deuxième point, on a|G|= [L: L^H] = [L:L^G] =|H|donc G=H.

(6)

Donnons quelques précisions supplémentaires sur la théorie de Galois. Étant donné une extension de corpsL/K, on s’intéresse à songroupe de GaloisGal(L/K)qui est le groupe des K-automorphismes de corps de L. Le résultat majeur de cette théorie est la correspondance de Galois entre les corps intermédiaires K⊂M ⊂L et les sous-groupesH de Gal(L/K): Théorème 1.11

Si L/K est une extension galoisienne, les applications Fix : H 7→ L^H et Gal : M 7→

Gal(L/M)sont réciproques l’une de l’autre, oùL^H, comme défini dans l’énoncé du théo- rème d’Artin est appelésous-corps fixede Lassocié àH

Il est remarquable qu’en vertu du théorème d’Artin, toute extension finie vérifie Gal◦ Fix=id.

Définition 1.12

SoitL/Kune extension algébrique. On dit que c’est une extensiongaloisiennesiL^Gal⁽^L^/^K⁾= K.

On suppose à présent queKest un corps parfait, c’est-à-dire que siL/Kest une extension algébrique, alors tout polynôme de L[X]n’admet que des racines simples dans son corps de décomposition – L est ditséparable. La plupart des corps usuels sont parfaits :Q,R,C, les corps finis. En revanche pour ppremier,Fp(T)n’est pas parfait.

Définition 1.13

L’extension algébrique L/K est dite normale si tout polynôme irréductible f ∈ K[X] admettant une racine dansL se décompose en produit de facteurs de degré 1 dansL.

Par exempleC/Rest une extension normale.

Proposition 1.14

Soit L/K une extension finie, alors on a l’équivalence entre : 1 L/K est galoisienne ;

2 L/K est normale ;

3 Lest le corps de décomposition d’un polynôme f ∈K[X]; 4 Gal(L/K)est d’ordre[L:K];

Démonstration.Montrons la première implication. Comme l’extension L/K est finie, son groupe de Galois G est fini (vu dans le troisième point de la démonstration du théorème d’Artin). Soit f ∈K[X] irréductible admettant une racine a dans L. Introduisons P(X) =

Q

σ∈G(X−σ(a)). Siτ∈G, en notant encoreτson prolongement naturel à L[X], on aτ(P) = Q

σ∈G(X −(τ◦σ)(a)) =P carσ7→τ◦σest une permutation deG. Donc P ∈L^G[X] =K[X] carL/Kest galoisienne ; et de plusP(a) =0. Mais f étant irréductible, c’est à constante près le polynôme minimal de a sur K donc f divise P dans K[X]. Ainsi, f est scindé à racines simples sur L.

En particulier si L/K est galoisienne finie etK⊂M ⊂Lest un corps intermédiaire, alors L/M est galoisienne puisque L est le corps de décomposition de f ∈K[X]⊂M[X], ce qui

(7)

prouve la correspondance de Galois.

Voir également[11]pour un point de vue concis sur la théorie de Galois.

2 Sur les opérations élémentaires

2.1 Définitions

Unematrice de dilatationest une matrice de la forme D_i(α) =Diag(1, . . . , 1,α, 1, . . . , 1) oùα6=0 est en i-ème position dans la diagonale. Son inverse estD_i(α⁻¹).

Unematrice de transvectionest une matrice de SL_n(K)de la formeT_{i j}(λ) =





 1

1 λ

...

1





 oùλest en position(i,j)et i6=j. L’inverse de T_{i j}(λ)estT_{i j}(−λ).

Une matrice de permutation est une matrice P_{i j} de la forme





I_i−1 0

U

0 I_n₋₁₋_i₋_j



 avec

U =







0 1

1 ...

1 0







bloc carré de taillei+j+1. La matrice P_{i j} est inversible d’inverseP_ji.

Proposition 2.1

SoitA∈ Mm,n(K). On note L_i lai-ème ligne deA.

• CalculerD_i(α)A, c’est faire l’opération élémentaire L_i ←αL_i.

• CalculerT_i,_j(λ)A, c’est faire l’opération élémentaire L_i← L_i+λL_j.

• CalculerP_{i j}A, c’est faire l’opération d’échange L_i ↔L_j.

Remarque.Par multiplication à droite par ces matrices, on obtient les opérations élémen- taires analogues sur les colonnes.

Le théorème suivant peut être prouvé de plusieurs manières. C’est soit une conséquence de la terminaison de l’algorithme du pivot de Gauss qu’on verra dans la section suivante, soit un résultat théorique comme montré dans[8], chapitre IV.

Théorème 2.2

• Les matrices de transvection de taillenengendrentSL_n(K).

• Les matrices de transvection et de dilatation de taillenengendrentGL_n(K).

Corollaire 2.3

SiK est de caractéristique différente de 2 ou 3,SL_n(K))est son propre groupe dérivé.

Exemple 2.4.Une application de ce résultat est le théorème de Frobenius-Zolotarev : sipest un nombre premier supérieur à 5, etu∈GL_n(Fp)alors la signature deuest"(u) =detu

p

.

(8)

2.2 L’algorithme du pivot de Gauss

Ce lemme donne l’idée de base de l’algorithme, qui est utilisé au moins depuis le I^ersiècle en Chine, mais a été formalisé par Gauss en 1810.

Lemme 2.5

Toute matrice A ∈ Mm,n(K) à première colonne non nulle peut être transformée par multiplication à gauche par des transvections en une matrice de la forme

β ? 0 A˜

où A˜∈ Mm−1,n−1(K).

Démonstration.En effet, il suffit d’effectuer pour i¾2, l’opération élémentaire L_i ← L_i− a_i,1

a₁₁L₁, ce qui revient à multiplier par la matrice de transvection T_i,1

−a_i,1 a₁₁

.

Corollaire 2.6

Soit A ∈ Mm,n(K). Il existe M ∈ GL_n(K) produit de matrices de transvections triangulaires supérieures et de matrices de permutation telle que T = M Aest triangulaire supérieure.

Remarque.Ainsi,AX =best équivalent àT X =M b.

L’algorithme du pivot de Gauss détermine si un système du typeAX =B,A∈ Mm,n(K),B∈ Mm,1(K)est compatible, et s’il l’est le réduit à un système d’équations du type





a₁₁ ?

0 ... T

0 0 a_r,r







 x₁

... x_r



=B⁰

où r¶inf(m,n)est le rang deA, lesa_i,i sont tous non nuls etT ∈ M_r,n−r(K),B⁰∈ Mr,1(K). En vertu du théorème de Rouché-Fontené, l’espace des solutions deAX =Best de dimension n−ret une solutionx = (x₁, . . . ,x_n)s’obtient en donnant une valeur arbitraire àx_r₊₁, . . . ,x_n et en résolvant par remontée le système triangulaire supérieur







a₁₁x₁+· · ·+a_1,rx_r = b₁⁰ −a_1,r₊₁x_r₊₁− · · · −a_1,nx_n

... ...

a_r,rx_r = b⁰_r−a_r,r₊₁x_r₊₁− · · · −a_r,nx_n Description de l’algorithme

Entrées: une matriceA= (a_i,j)i,j de taille m×n, un vecteur colonne B de taille m. On note L₁, . . . ,L_m les lignes de la matrice A B

. Pour1¶k¶n−1 :

Siil existe r¾ktel quea_r,k6=0 : Trouver r¾ktel que|a_r,k|=max

k¶i¶n|a_i,k|. Échanger L_k et L_r

Pouri¾k+1 :

Effectuer L_i ← L_i− a_i,k a_k,kL_k. Si L_i est de la forme(0 . . . 0,b⁰_i):

Si b⁰_i6=0 : terminer et renvoyer ("non compatible",A,B).

Sinon, supprimer L_i de la matrice.

(9)

Renvoyer ("compatible",A⁰,B⁰), oùB⁰est la dernière colonne deAetA⁰la matrice consti- tuée des npremières colonnes deA.

Remarque. • Cet algorithme nécessiteO(n³)opérations.

• Sa bonne terminaison est assurée par le lemme.

• On choisit le pivot de module maximal pour des raisons de stabilité numérique : un exemple spectaculaire est donné dans[3], p. 78.

Le résultat suivant est une application de la méthode du pivot : Théorème 2.7 (décomposition de Bruhat)

Si Ts est le groupe des matrices triangulaires supérieures inversibles de Mn(K), on a GL_n(K) = `

σ∈S_n

TsP_σTs où P_σ= (δ_i,σ(j))i,j est la matrice de permutation associée àσ. En utilisant le pivot de Gauss sur une matrice rationnelle, on peut obtenir des résultats sur les systèmes diophantiens, comme par exemple cette proposition :

Proposition 2.8

SoitA∈ Mn(Z). Le système diophantienAx =0admet une solution non nulle dansNⁿ si et seulement0_Rn est dans l’enveloppe convexe des colonnes deA.

Démonstration.On note A_i lai-ème colonne deA.

⇐ : soit x solution non nulle dans Nⁿ, alors 0 = (A₁. . .A_n)



 x₁

... x_n



 = Pⁿ

i=1

x_iA_i donc en divisant parn, on obtient le résultat.

⇒: soitlminimal tel que 0 s’écrive comme combinaison convexe altermes Pl j=1

x_jA_i_j des colonnes deA. Selon le théorème de Carathéodory, en notant r le rang surQde la matrice (A_i

1, . . . ,A_i

l), on a l ¶ r+1. Mais puisqu’on a exhibé une relation de dépendance linéaire entre ces colonnes, r <l. Ainsi r =l−1 et par l’algorithme du pivot de Gauss sur Q, on peut trouver P ∈ GL_m(Q) tel que P(A_i

1. . .A_i

r) =

M 0

où M ∈ M_r,r+1(Z) est de rang r.

Donc ker_QM est de dimension 1 surQet de plus M



 x₁

... x_r



=0 donc x⁰= (x₁, . . . ,x_r)est un vecteur directeur à coefficients positifs de ker_QM.

Or ker_QM ⊂ker_RM donc x⁰est également un vecteur directeur de ker_RM, de sorte que tous ses éléments ont leurs coefficients tous positifs ou tous négatifs. En multipliant x⁰ par un coefficient bien choisi, on peut donc trouver y⁰∈N^r tel que(A_i

1. . .A_i

r)y⁰=0. On obtient y ∈Nⁿtel que Ay=0 en complétant y⁰ avec des 0.

2.3 Interprétation en termes d’actions de groupes

Dans cette sous-section, on cherche à étudier les orbites de l’action de GL_m(K)surMm,n(K) par multiplication à gauche, ce qui correspond à des opérations sur les lignes. Dans le contexte de la résolution de systèmes linéaires, cela est plus naturel que la multiplication à droite, qui correspond à un changement de variable affine des inconnues.

(10)

Des précisions supplémentaires ainsi qu’une application à l’étude des grassmanniennes peuvent être trouvés dans[2], chapitre IV.

Définition 2.9

On appelle pivotd’une ligne le coefficient non nul (s’il existe) situé dans la colonne la plus à gauche. Une matrice est dite échelonnée réduite lorsqu’elle vérifie les conditions suivantes :

• Si une ligne est nulle, toutes les lignes suivantes sont nulles ;

• Le pivot d’une ligne est strictement plus à droite que ceux des lignes précédents ;

• Tous les pivots sont égaux à 1 et sont les seuls coefficients non nuls de leur colonne.

Une matrice échelonné réduite est déterminée par la liste (j₁, . . . ,j_r) des colonnes des pivots, qu’on appelle sontype.

Exemple 2.10.La matrice







0 1 0 ? 0 ? ?

0 0 1 ? 0 ? ?

0 0 0 0 1 ? ?

0 0 0 0 0 0 0





est échelonnée réduite.

On note Em,n l’ensemble des matrices échelonnées réduites de Mm,n(K). Le théorème suivant montre qu’elles constituent une classe de représentations pour l’action considérée.

Théorème 2.11

SoientA,A⁰ ∈ Mm,n(K). Alors AetA⁰ sont dans la même orbite pour l’action par multiplication à gauche si et seulement sikerA=kerA⁰. On aMm,n(K) = `

E∈Em,n

Orb(E). Démonstration. • Supposons kerA = kerA⁰ = F ⊂ K^m. Soit une base (e₁, . . . ,e_p) de

F, qu’on complète en une base (e₁, . . . ,e_p,f_p₊₁, . . . ,f_m) de K^m. Alors (v_p₊₁, . . . ,v_m) = (A(f_p+1), . . . ,A(f_m))(resp.(v_p⁰₊₁, . . . ,v_m⁰) = (A⁰(f_p+1), . . . ,A⁰(f_m))) est une base de ImA (resp. de ImA⁰). En complétant chacune de ces deux familles libres en des basesB, B⁰ deK^met en notant P la matrice de passage deB àB⁰, on aA⁰=PA.

• Le fait que toute matrice est dans l’orbite d’une matrice échelonnée réduite résulte de la méthode du pivot de Gauss : en effet, partant d’une matrice réduite selon l’algorithme décrit ci-dessus, quitte à multiplier par des matrices de dilatation, on peut supposer que le pivot de chaque ligne est 1 ; de plus, si le pivot d’une ligne iest situé en j^ièmeposition, on peut annuler par des opérationsL_k←L_k−?L_i tous les coefficients a_k,_j pourk6=i.

• Montrons enfin que deux matrices distinctesE,E⁰∈ Em,nne peuvent être dans la même orbite.

Procédons par récurrence sur m. Supposons que le résultat soit vrai pour toutes ma- trices échelonnées réduites àm−1 lignes. Supposons qu’il existePinversible telle que E=P E⁰. Notons(j₁, . . . ,j_r)et(j₁⁰, . . . ,j_s⁰)leurs types respectifs. Alorss=r est le rang de E,E⁰. De plus, les j₁-1 premières colonnes deP E sont nulles et celle d’indice j₁ est la première colonne de P. Donc j₁= j₁⁰. Prenons P =







1 p₁₂ . . . p_1m 0

... Q

0







,E = L F

,

E⁰=

L F

L,L⁰∈ M1,n(K), des décompositions par blocs de P,E,E⁰. Alors F et F⁰sont

(11)

échelonnées réduites etP E=

L+ (p₁₂. . .p_1m)F QF

=E⁰d’oùQF =F⁰et par hypothèse de récurrence F = F⁰, d’oùQ= I_m−1. De plus, comme F est de type(j₂, . . . ,j_r), pour k¾2, le coefficient d’indice(1,j_k)deP Eest p_1k et d’autre part, le coefficient d’indice (1,j_k)de E⁰est 0 car j₁= j₁⁰. D’où P=I_m et E=E⁰.

Remarque.On peut conduire la même étude pour l’action par multiplication à droite. Dans ce cas, deux matrices sont dans la même orbite si et seulement si elles ont la même image.

En utilisant la notion duale dematrice échelonnée réduite en lignes, on peut obtenir une description pratique des grassmanniennes de taille r de Kⁿ, c’est à dire les sous-espaces vectoriels de dimension r deKⁿ :

SiF est un sous-espace vectoriel deKⁿde dimension r, il existe une unique suite stricte- ment croissantei= (i₁, . . . ,i_r)et une matrice échelonnéeA_F réduite en lignes de typei dansMn,r(K)telle queA_F est la matrice d’une base de F dans la base canonique deKⁿ. Démonstration.Voir[2]p. 137.

L’étude duplongement de Plückerpermet de prolonger cette étude et de réaliser l’espace des grassmanniennes comme un sous-ensemble d’un espace projectif.

Notation: On noteΛ(r,n)l’ensemble des parties àr éléments deJ,nK, et Gr_r,n l’espace des grassmanniennes de taille r de Kⁿ.

En utilisant la multilinéarité par rapport aux colonnes du déterminant, on obtient la formule suivante :

Proposition 2.13 (formule de Binet-Cauchy)

SiA∈ Mm,n,B ∈ Mn,l, alors pour tout r¶min(m,n,l), I ∈Λ(r,m),J ∈Λ(r,l), on a la relation sur les mineurs suivante :

∆I,J(AB) = X

K∈Λ(r,n)

∆I,K(A)∆K,J(B) Si A∈ Mm,n(K), r ¶min(m,n)on définit Λ^r(A) = (∆I,J)^I∈Λ(r,m)

J∈Λ(r,n). On peut voir cet objet comme une matrice dansM(^m^r)^,(^rⁿ). La formule ci-dessus se réécrit alorsΛ^r(AB) =Λ^r(A)Λ^r(B).

En particulier, siA∈ Mn,r(K),Q∈GL_r(K), alorsΛ^r(AQ) =detQΛ^r(A). Théorème 2.14

Soit F ∈Gr_r,n,A_F ∈ Mn,r(K)matrice d’une base B de F dans la base canonique deKⁿ. La droite engendrée parΛ^r(A_F)∈ M(n^r)^,1(K)ne dépend que deF, l’application

ψ: Gr_r,n −→ P(^rⁿ)⁻¹(K) F 7−→ [Λ^r(A_F)]

est bien définie, et injective. De plus,ψ commute aux actions naturelles deGL_n(K) surGr_r,n etP(^rn)⁻¹(K), son image est une orbite deP(^rn)⁻¹(K)sous cette action.

Démonstration.Puisque A_F est de rang r, Λ^r(A_F) 6= 0. Soit B⁰ autre base de F et A⁰_F la matrice associée, soit Q ∈ GL_r(K) matrice de passage de B à B⁰. Alors A⁰_F = A_FQ donc

(12)

Λ^r(A⁰_F) = detQΛ^r(A_F), de sorte que les droites engendrées par Λ^r(A⁰_F) et Λ^r(A_F) sont les mêmes. Doncψest bien définie.

Pour tout v∈Kⁿ, v∈ F si et seulement si la matrice (A_F v)∈ Mn,r+1(K)est de rang r, c’est à dire si tous ses mineurs de taille r+1 sont nuls.

En développant pour toutI ∈Λ(r+1,n)par rapport à la dernière colonne le mineur de taille r+1 associé àI de(A_F v), on obtient

∀v∈Kⁿ,v∈F ⇔ ∀I ∈Λ(r+1,n),∆I =X

i∈I

(−1)ⁱv_i∆_I\{i}(A_F) =0

Cette équation est homogène donc ne dépend pas de l’élément de la droite engendrée parΛ^r(A_F)choisi. Ainsi,ψest injectif.

Le groupe linéaire GL_n(K)agit sur Gr_r,n via P·F = P(F)et sur P(^rⁿ)⁻¹(K) via P ·[v] = [Λ^r(P)v]. Alors∀P ∈GL_n(K),ψ(P·F) = [Λ^r(PA_F)] = [Λ^r(P)Λ^r(A_F)] =P·[Λ^r(A_F)].

En outre, l’action de GL_n(K) sur Gr_r,n est évidemment transitive donc l’image de ψ est une orbite dansP(^rⁿ)⁻¹(K).

2.4 Sur un anneau euclidien : l’algorithme des facteurs invariants

On s’appuie sur[1], pp.286-287.

Théorème 2.15

Soit Aun anneau euclidien, U ∈ Mm,n(A). Alors il existe s ∈ Net (d₁, . . . ,d_s) ∈A^s tels qued_s|. . .|d₁ et(P,Q)∈GL_m(A)×GL_n(A)tels que

U =P







d₁ (0)

...

d_s

(0) 0





 Q

De plus, si U vérifie une relation de cette forme avec (d₁⁰, . . . ,d_r⁰), alorsr=s et pour tout i,d_i⁰ etd_i sont associés.

Remarque.Le résultat est encore vrai si Aest un anneau principal, cependant, la preuve n’est alors plus algorithmique.

Décrivons l’algorithme permettant d’obtenir une telle réduction.

Algorithme des facteurs invariants

Entrées:Aun anneau euclidien de stathmeϕ,U ∈ Mm,n(A). On noteC_j sa j^ème colonne et L_i sai^èmeligne.

SiU 6=0 :

1 Choisir(i₀,j₀)tel queϕ(u_i

0,j₀)est minimal parmi les stathmes des coefficients non nuls de U.

ÉchangerC₁ etC_j

0, L₁ et L_i

0. 2 Pour2¶i¶m:

(a) Effectuer la division euclidienneu_i,1=u₁₁q+r_i. Effectuer L_i ←L_i−q L₁

(13)

(b) Si r_i 6=0, échanger L_i et L₁ et retourner en2(a) 3 Pour2¶j¶n:

(a) Effectuer la division euclidienneu_1,j=u₁₁q+s_j. EffectuerC_j←C_j−qC₁

(b) Sis_j6=0, échangerC_j etC₁, retourner en2

4 (a) Si il existe i₁ ¾2, j₁ ¾2 tels que u₁₁ ne divise pasu_i₁_,j₁, faire C₁ ← C₁+C_j₁ et retourner en2.

(b) Sinon, appliquer l’algorithme à(u_i,j)2¶i,j¶n

Expliquons le principe : les étapes1à3visent à obtenir une matrice de la forme

β 0 0 A˜

où ˜U ∈ M_m−_1,n−1(A). Pour ce faire, on procède de manière analogue au pivot de Gauss en utilisant cette fois la terminaison de l’algorithme d’Euclide en un nombre fini d’étapes. En effet, pour annuler u_i,1, on retranche à L_i le quotient de la division euclidienne par u₁₁ et on échange L_i et L₁ puis on recommence, ce qui revient à placer à l’étapeklek^ièmereste de l’algorithme d’Euclide en place(1, 1).

Exemple 2.16(résolution de systèmes diophantiens).SoitA∈ Mm,n(Z), b∈ Mm,1(Z). Soit (P,Q)∈GL_m(Z)×GL_n(Z)tel que PAQ=D=







d₁ (0)

...

d_r

(0) 0







oùd₁|. . .|d_r. Alors∀x ∈ Mn,1(Z),Ax = b⇔D y =b⁰où y =U⁻¹x, b⁰=U b. Le système admet donc une solution si et seulement si∀1¶i¶r,d_i|b⁰_i.

Proposition 2.17 (théorème de la base adaptée)

SoientAun anneau euclidien, L unA-module de rang net R⊂L un sousA-module. Il existe une base(e₁, . . . ,e_n)de L et(d₁, . . . ,d_k)∈A^k tels qued₁|. . .|d_k et(d₁e₁, . . . ,d_ke_k) est une base deR.

Dans le cas des groupes abéliens finis, qui sont des Z-modules, on obtient le résultat suivant :

Si G est un groupe abélien fini, il existe un unique(d₁, . . . ,d_r)∈Z^r tel qued_r|. . .|d₁ et G'Z/d₁Z×. . .Z/d_rZ.

Mentionnons également que, siK est un corps, l’utilisation de l’algorithme des facteurs invariants sur un certain K[X]-module de type fini permet d’obtenir les invariants de simi- litude d’un endomorphisme de u de Kⁿ, c’est-à-dire l’unique (P₁, . . . ,P_r) ∈ K[X]^r tel que P_r|. . .P₁ et dans une base B bien choisie, M_B(u) =



 C_P

1 0

. . .

0 C_P

r



, avec C_P_i la matrice compagnon associée à P_i.

(14)

3 Résolution effective des systèmes linéaires

3.1 Méthodes directes

Commençons par remarquer le fait suivant : la résolution d’un système triangulaire supé- rieur de taillendemandeO(n²)opérations. En effet, si











t₁₁x₁+· · ·+t_1,nx_n = b₁

... ...

t_n−_1,n−₁x_n−₁+t_n−_1,nx_n = b_n−₁ t_n,nx_n = b_n

, on calcule x_n en une opération, puis x_n₋₁ en trois opérations (une multiplication, une soustraction, une division), puis x_n₋₂ en cinq, ..., x₁ en 1+2(n−1) opérations. Comme Pn

i=11+2(n−i) =n+n(n−1) =n², c’est bien le nombre d’opérations nécessaires.

Définition 3.1

LeconditionnementdeA∈ Mn(C)relativement à la norme subordonnéek·kestcond(A) = kAkkA⁻¹k¾1.

Le conditionnement quantifie la dépendance de la solution deAx=bpar rapport à une petite variation de bou deA, comme le montre la proposition suivante :

Proposition 3.2

• SiAx=betA(x+δx) = b+δb, alors kδxk

kxk ¶cond(A)kδbk kbk

• Si(A+δA)(x+δx) =b, alors kδxk

kx+δxk ¶cond(A)kδAk kAk Ces inégalités sont optimales.

Une méthode directe vise à obtenir une solution exacte en un nombre fini d’étapes. On s’appuie pour cela sur des décompositions de A permettant de se ramener à la résolution d’un système triangulaire supérieure.

Théorème 3.3 (décomposition LU)

SoitA∈GL_n(C)telle que tous ses mineurs principaux sont non nuls. Il existe un unique couple(L,U)avec U triangulaire supérieure et L triangulaire inférieure ayant unique- ment des 1 sur la diagonale tel queA=LU.

Par conséquent, pour tout x ∈Rⁿ,Ax = b⇔

§ U x =y

L y =b . La décomposition LU et la résolution du système se font enO(n³)opérations.

Définition 3.4

Unematrice bande pest une matriceA= (a_{i j})i,j telle quea_{i j} =0pour|i−j|>p.

Proposition 3.5

La décomposition LU préserve la structure bande des matrices.

Théorème 3.6

SoitA∈ Mn(C). Il existeQ∈ Mn(C)unitaire etR∈ Mn(C)triangulaire supérieure telle queA=QR.

Démonstration.Essentiellement, pour une matrice Ainversible, il s’agit du procédé d’or- thonormalisation de Gram-Schmidt. En effet, soit〈·,·〉le produit scalaire canonique deCⁿ.