1) Combinaisons linéaires

(1)

Dans tout le chapitre, Kdésigne Rou Cet E est unK-espace vectoriel.

II - Combinaisons linéaires — Bases

On généralise ici les notions étudiées en 1^re année au cas d’un ensemble d’indicesI non nécessairement ﬁni(complément hors programme en PSI).

1) Combinaisons linéaires

Définition :le support d’une famille de scalaires (λi)_i∈I ∈ KÎ est {i∈I / λi = 0}. On note K^(I) l’ensemble des familles de scalairesà support fini.

Propriété : K^(I) est un sous-espace vectoriel de K^I,+, . .

Déﬁnition :soitF = (xi)i∈Iune famille de vecteurs deE. On dit qu’un vecteurxdeEestcombinaison linéaire des vecteurs de F si et seulement s’il existe une famille (λi)i∈I ∈ K^(I) telle que x=

i∈I

λi.xi (il s’agit d’unesomme ﬁnie de vecteurs de E. . . ).

2) Bases

a) Familles génératrices

Soit F une famille de vecteurs deE. On dit que F est une famille génératrice deE si et seulement si tout vecteur deE est combinaison linéaire des vecteurs deF.

b) Sous-espace engendré par une famille de vecteurs

Soit F une famille de vecteurs deE etF l’ensemble des combinaisons linéaires des vecteurs deF. F est un sous-espace vectoriel deE ; c’est le plus petit sous-espace deE contenant les vecteurs de F.

F est notéVectF, appelé le sous-espace vectoriel de E engendré par F (F est une famille génératrice deVectF !).

NB : une familleF est génératrice de E si et seulement si VectF =E.

c) Familles libres

Soit F = (xi)i∈I une famille de vecteurs de E. On dit que F est libre si et seulement si la seule combinaison linéaire nulle des vecteurs deF est celle dont tous les coeﬃcients sont nuls :

∀(λi)i∈I ∈K^(I)

i∈I

λi.xi= 0 =⇒ ∀i∈I λi= 0 . F est libre si et seulement si toutes ses sous-familles ﬁnies sont libres.

Une partie A deE est dite libre si et seulement si la famille(x)x∈A est libre.

Par convention, ∅est libre.

d) Bases

Soit F une famille de vecteurs deE.

On dit que F est unebase deE si et seulement siF est libre et génératrice.

Une famille B= (ei)i∈I de vecteurs deE est une base deE si et seulement si tout vecteur deE s’écrit de manière unique comme combinaison linéaire des vecteurs de B. Dans ce cas, si x =

i∈I

λi.ei, la famille (λi)i∈I est appelée la famille des coordonnées de xdans la base B.

Exemple : X^k _k∈N est une base deK[X], appeléela base canonique de K[X].

NB : l’existence de bases en dimension quelconque est liée à l’axiome du choix. . .

(2)

e) Caractérisation d’une application linéaire par l’image d’une base

Théorème :soientE etF deux K-espaces vectoriels,B= (ei)i∈I une base de E et(yi)i∈I une famille de vecteurs de F (indexées par le même ensembleI).

Il existe une unique application linéaireu deE dans F telle que : ∀i∈I u(ei) =yi . En outre ladite application linéaire u vériﬁe :

∗ Imu= Vect(yi)i∈I : u est surjective si et seulement si la famille(yi)i∈I engendre F.

∗ u est injective si et seulement si la famille(yi)i∈I est libre.

∗ u est bijective si et seulement si la famille(yi)i∈I est une base deF.

NB : dans le cas particulier oùE =K^(I), muni de labase canonique (ei)i∈I, oùei = (δi,j)_j∈I,Keru est l’ensemble des familles de coeﬃcients des relations de dépendance linéaire de la famille (yi)i∈I

(la famille nulle mise à part !).

II

II - Structure d’algèbre

1) Déﬁnition

On appelle K-algèbre tout quadruplet(A,+, .,×) où : 1) (A,+, .) est unK-espace vectoriel ;

2) (A,+,×) est un anneau ;

3) ∀λ∈K ∀(x, y)∈A² λ.(x×y) = (λ.x)×y=x×(λ.y)

UneK-algèbre(A,+, .,×) est ditecommutative si et seulement si ×est en outre commutative.

NB : le point 3) et la distributivité de × par rapport à + reviennent à dire que l’application (x, y)→x×y estbilinéaire deE×E dansE.

2) Exemples

1) K-algèbre commutative(K[X],+, .,×)des polynômes à coeﬃcients dansK. 2) K-algèbre(L(E),+, .,◦) des endomorphismes d’unK-espace vectoriel E.

3) K-algèbre(Mn(K),+, .,×) des matrices carrées d’ordre nà coeﬃcients dans K.

III

III - Sommes directes de sous-espaces vectoriels

Dans tout ce paragraphe,I est un ensembleﬁni non vide.

1) Produit d’une famille ﬁnie d’espaces-vectoriels

On généralise la notion de produit cartésien de deuxK-espaces vectoriels en déﬁnissantle produit d’une famille ﬁnie (Ei)_i∈I de K-espaces vectoriels, ensemble des familles de vecteurs de la forme (xi)_i∈I où, pour tout i,xi∈Ei, ensemble noté

i∈I

Ei. Théorème :

i∈I

Ei,+, . est unK-espace vectoriel, les lois+et.étant déﬁnies par pour x= (xi)_i∈I ety= (yi)_i∈I dans

i∈I

Ei : x+y= (xi+yi)_i∈I pour λ∈Ketx= (xi)_i∈I dans

i∈I

Ei : λ.x= (λ.xi)_i∈I Propriété : si lesEi sont tous de dimension ﬁnie, alors

i∈I

Ei est de dimension ﬁnie égale à

i∈I

dimEi.

(3)

2) Somme d’une famille ﬁnie de sous-espaces-vectoriels

Soient E un K-espace vectoriel et (Ei)_i∈I une famille ﬁnie de sous-espaces vectoriels de E.

L’espace produit

i∈I

Ei s’identifie au sous-espace vectoriel deEÎ (l’espace des familles de vecteurs de E indexées par I) formé des familles (xi)_i∈I deEÎ telles que : ∀i∈I xi ∈Ei.

Théorème et déﬁnition :avec les notations précédentes, l’applicationϕ:

i∈I

Ei → E (xi)_i∈I →

i∈I

xi

est linéaire. Son image, notée

i∈I

Ei, est un sous-espace vectoriel de E appelé somme des Ei,i∈I.

i∈I

Ei est l’ensemble des sommes de la forme

i∈I

xi,(xi)_i∈I ∈

i∈I

Ei.

i∈I

Ei est le plus petit sous-espace de E contenant les Ei,i∈I. Autrement dit :

i∈I

Ei = Vect

i∈I

Ei .

Cas particulier : siF,Gsont deux sous-espaces de E,

F +G={y+z, (y, z)∈F×G}= Vect (F ∪G).

3) Somme directe d’une famille ﬁnie de sous-espaces vectoriels

Déﬁnition :(mêmes notations) lesEi,i∈I sont ditsen somme directe si et seulement si tout vecteur x de

i∈I

Ei s’écrit de manière uniquesous la forme x=

i∈I

xi,(xi)_i∈I ∈

i∈I

Ei

(c’est-à-dire si et seulement si l’application linéaire ϕdu §1est injective).

Si c’est le cas, le sous-espace

i∈I

Ei est noté

i∈I

Ei, appelé somme directe des Ei,i∈I.

Caractérisation :toujours avec les mêmes notations, les assertions suivantes sont équivalentes : a)les Ei,i∈I sont en somme directe ;

b)∀(xi)_i∈I∈

i∈I

Ei i∈I

xi = 0⇒ ∀i∈I xi = 0; c)∀i∈ I Ei∩

j=i

Ej ={0} (i.e. l’intersection de chaque sous-espace avec la somme des autres est réduite à {0}).

Attention ! Il ne suﬃt pas que les intersections des sous-espaces pris deux à deux soient réduites à {0} (voir par exemple trois droites vectorielles distinctes dans un plan).

Dém.Je remarque tout d’abord que les assertionsa)etb)sont toutes deux équivalentes à l’injectivité de l’application linéaire ϕ : a) signifie par définition d’une somme directe que tout élément de Imϕ admet au plus un antécédent, tandis que b) signifie que Kerϕ ={0}. J’en déduis par transitivité de l’équivalence que a)etb)sont équivalentes.

Je montre ensuite l’équivalence entre b)etc) par double implication :

•b) ⇒ c) : je suppose b) et, pour prouver c), je ﬁxe arbitrairement i dans I et je considère un vecteurx élément de Ei∩

j=i

Ej . Ainsi, d’une part x est élément deEi, d’autre partx s’écrit x=

j=i

xj où xj ∈Ej, pour toutj dans I\ {i} . Je pose (habilement)xi=−x : la famille (xj)_j∈I vériﬁe alors, par construction,

(xj)_j∈I ∈

j∈I

Ej et

j∈I

xj = 0

donc, d’aprèsb), tous les xj sont nuls, en particulier x= 0. c)en résulte.

(4)

•c)⇒b): par contraposition, je suppose “non b)”, je dispose donc d’une famille (xi)_i∈I dans

i∈I

Ei

de vecteurs dont la somme est nulle alors que les xi ne sont pas tous nuls. Soit donc i0 tel que xi0 = 0. xi0 appartient à Ei0 et donc

j=i0

xj =−xi0 est un vecteur non nul de Ei0 ∩

j=i0

Ej , ce qui prouve “non c)” et achève la démonstration.

Cas particulier : deux sous-espacesF,Gde E sont en somme directe si et seulement si F∩G={0} .

F etGsontsupplémentaires si et seulement si E=F⊕G.

NB : E =

i∈I

Ei si et seulement si l’application ϕest surjective ; E =

i∈I

Eisi et seulement siϕest un isomorphisme, dans ce cas chaqueEi est un supplémentaire dans E de la somme des autres, à savoirFi=

j=i

Ej (qui est également une somme directe).

4) Famille de projecteurs associée à une somme directe

Soit E =

i∈I

Ei ; on associe à cette décomposition deE la famille(pi)_i∈I de projecteurs deE où, pour tout idansI,pi est la projection deE surEi parallèlement àFi =

j=i

Ej (voir la remarque ci-dessus).

Alors, la décomposition de tout vecteur x deE suivant la somme directe

i∈I

Ei n’est autre que x=

i∈I

pi(x) . (En eﬀet, soitx=

j∈I

xj cette décomposition ; pouri ﬁxé dansI,x s’écrit x=xi+yi , où xi ∈Ei et yi =

j=i

xj ∈Fi , par conséquent xi est bien égal à pi(x), par déﬁnition de la projection pi.) NB : la famille (pi)_i∈I d’endomorphismes deE vériﬁe :

∗

i∈I

pi = IdE (d’après la propriété précédente) ;

∗ pour i, j distincts dans I,pi◦pj = 0(car Impj =Ej ⊂Fi= Kerpi).

Exercice : établir réciproquement que, si (pi)_i∈I est une famille d’endomorphismes de E vériﬁant les deux propriétés ci-dessus, alors les pi sont des projecteurs de E, E =

i∈I

Impi et (pi)_i∈I est — au sens précédent — la famille de projecteurs associée à cette décomposition deE.

Cas particulier de deux sous-espaces supplémentaires

Soient E =F⊕Getp, q les projecteurs associés, on ap+q= IdE,p◦q=q◦p= 0.

s= 2p−IdE et−s= 2q−IdE sont les symétries associées.

5) Prolongement linéaire d’applications linéaires

Théorème :soientE, F deux K-espaces vectoriels,(Ei)_i∈I une famille ﬁnie de sous-espaces deE telle que E=

i∈I

Ei et, pour toutidans I,ui une application linéaire de Ei dans F.

Il existe alors une unique application linéaire udeE dansF telle que

∀i∈I u|Ei =ui(la restriction deu à Ei est ui).

En outre,u est déﬁnie par : ∀x∈E u(x) =

i∈I

ui[pi(x)],

où (pi)_i∈I est la famille de projecteurs associée à la décomposition E =

i∈I

Ei. Dém.Analyse — synthèse. . .

(5)

NB : on se permet parfois d’écrireu =

i∈I

ui◦pi car l’image depi est incluse dans l’ensemble de départ deui. . .

Exemple : si E1 est un sous-espace deE et u1 ∈ L(E1, F), on peut prolonger u1 en une application linéaire de E dans F grâce au théorème précédent, en utilisant un supplémentaire E2 de E1 dansE (en choisissant par exemple u2 = 0∈ L(E2, F)!).

Attention ! u:x→ u1(x) si x∈E1

0 sinon est bien un prolongement de u1 à E, mais non linéaire “en général” (exercice : CNS surE1 et u1 pour queu soit linéaire ?).

6) En dimension ﬁnie

Ici, E est unK-espace vectoriel de dimension ﬁnie.

Les résultats précédents s’appliquent bien sûr dans le cas particulier de la dimension ﬁnie.

On a en outre le :

Théorème :soit(Ei)_i∈I une famille ﬁnie de sous-espaces vectoriels deE.

a)les Ei,i∈I, sont en somme directe si et seulement si dim

i∈I

Ei =

i∈I

dimEi ; b)dans le cas où les Ei sont en somme directe, E est égal à

i∈I

Ei si et seulement si dimE =

i∈I

dimEi. Dém.Soit S=

i∈I

Ei ; l’applicationϕ:

i∈I

Ei → S (xi)_i∈I →

i∈I

xi

est linéaire et surjective.

De plus, les Ei sont en somme directe si et seulement si ϕ est injective, donc si et seulement si ϕ est un isomorphisme, soit si et seulement si

i∈I

Ei etS sont de même dimension. Le a)en découle.

Leb)est immédiat, compte tenu dua), puisqueS est un sous-espace deE, doncE =S si et seulement si dimS= dimE.

Exemple : si(ei)_i∈I est une famille ﬁnie de vecteurs non nuls deE, les droites vectorielles K.ei sont en somme directe si et seulement si la famille(ei)_i∈I est libre.

Déﬁnition :(basesadaptées)

a)si F est un sous-espace de E, une base B = (e1, . . . , en) deE est dite adaptée à F si et seulement si les premiers vecteurs de B forment une base deF ;

b)si E =

p k=1

Ek, une base B de E est diteadaptée à la décomposition E =

p k=1

Ek si et seulement si les premiers vecteurs de B forment une base deE1, les suivants une base de E2. . .

Fractionnement d’une base : siB = (e1, . . . , en) est une base de E et (I1, . . . , Ip) une partition de N_n, alors

E =

p k=1

Vect (ei)_i∈Ik.

IV

IV - Isomorphismes classiques et applications

1) Isomorphisme de tout supplémentaire de

^Ker^u

dans

^Im^u

Théorème :soientu∈ L(E, F) etE^′ un supplémentaire deKeru dans E ; alorsu déﬁnit un isomorphisme deE^′ dans Imu, c’est-à-dire que u^′ : E^′ → Imu

x → u(x)

est un isomorphisme.

(6)

Dém.L’application u^′ est bien déﬁnie, linéaire commeu ; de plus :

•u^′ est injective : six∈Keru^′, alorsx∈E^′ etu(x) = 0, doncx∈E^′∩Kerud’où x= 0puisqueE^′ etKeru sont supplémentaires ;

•u^′ est surjective : soit y ∈ Imu ; par déﬁnition de Imu, je dispose d’un élément x de E tel que u(x) =y ; commeE =E^′⊕Keru,x s’écritx=x^′+z avecx^′ ∈E^′ et z∈Keru. J’ai alors :

y =u(x) =u x^′+z =u x^′ +u(z) =u^′ x^′ car x^′ ∈E^′ etz∈Keru.

Donc tout élément de Imu admet au moins un antécédent par u^′.

En conclusion, u^′ est linéaire et bijective, donc un isomorphisme de E^′ dans Imu.

Application — théorème du rang

SiE est de dimension ﬁnie etu∈ L(E, F) alorsImu est de dimension ﬁnie et dim Imu+ dim Keru= dimE.

Corollaire : 1) Lorsque dimE = dimF =n,u est un isomorphisme si et seulement si rgu=n.

2) Le rang est invariant par composition avec un isomorphisme.

2) Isomorphisme entre deux supplémentaires d’un même sous-espace

Théorème :soientE^′ un sous-espace vectoriel de E,F1 etF2 deux supplémentaires deE^′ dans E ; la projection de E surF1 parallèlement à E^′ déﬁnit un isomorphisme de F2 dansF1. Dém. Soit p ∈ L(E) cette projection ; F2 est un supplémentaire dans E de E^′ qui n’est autre que le noyau de p, tandis que F1 est l’image de p : le théorème du paragraphe précédent fournit donc le résultat.

3) Application : notion d’hyperplan

Déﬁnition :on appellehyperplan de E tout sous-espace de E admettant une droite pour supplémen- taire.

Propriétés :soitH un hyperplan de E.

1) SiF est un sous-espace deE contenant H, alors F =H ou F =E.

2) Pour tout vecteuradeE\H,E=H⊕K.a.

3) Deux hyperplans quelconques deE sont isomorphes.

Dém.Fixons un vecteur bdeE tel queE=H⊕K.b (il en existe par déﬁnition d’un hyperplan !).

1) SoitF un sous-espace deE contenant H. Deux cas se présentent :

•sib∈F, alors F contientH etK.b, donc F contient la sommeH+K.bqui n’est autre queE tout entier (H+K.best le plus petit — au sens de l’inclusion — des sous-espaces de E contenant H et K.b) ; d’oùF =E dans ce cas ;

•si b /∈ F, alors je montre que F = H ; j’ai déjà F ⊃ H, soit donc x un vecteur de F ; comme E =H⊕K.b, je dispose de hdansH et deλdans Ktels quex =h+λ.bet nécessairement λ= 0 (sinonb= 1

λ·(x−h) appartiendrait àF, d’où une contradiction) ; ainsix=happartient àH, ceci pour toutx deF, autrement ditF ⊂H, ce qui achève la démonstration.

2) Soit a ∈ E\H ; H ∩K.a = {0} (sinon a serait élément de H) ; de plus F = H +K.a est un sous-espace deE contenantH eta, doncF =H d’où — grâce au1)— F =E ; en conclusion,H etK.a sont supplémentaires, ce qu’il fallait démontrer.

3) Soient H1 etH2 deux hyperplans de E, distincts (s’ils sont égaux, ils sont isomorphes !). Si j’avais H1 ⊂ H2, j’aurais H2 = E d’après 1), d’où une contradiction. Comme les rôles sont symétriques, j’ai H1 ⊂/ H2 et H2 ⊂/ H1 ; il en résulte (classique !) que H1∪H2 n’est pas stable par l’addition, donc est strictement inclus dans E. Fixons donc a ∈ E\(H1∪H2) ; d’après 2), H1 et H2 sont des supplémentaires de la même droite K.a ; il sont par conséquent isomorphes d’après le théorème précédent.

(7)

Exemples :

1) SiE est de dimension ﬁnie n≥1, les hyperplans de E sont les sous-espaces de dimensionn−1.

2) DansK[X], pourα∈K, l’ensemble des multiples deX−α, polynôme de degré 1, admet pour supplé- mentaire la droite vectorielleK₀[X] =K; c’est donc un hyperplan deK[X], égal à{P ∈K[X] / P (α) = 0}

(le noyau de la forme linéaireP →P(α)).

V

V - Hyperplans et formes linéaires

1) Équations d’un hyperplan

Théorème :soitE unK-espace vectoriel,E ={0}.

1) Siϕest une forme linéaire non nulle sur E,H = Kerϕest un hyperplan de E (dit l’hyperplan d’équation ϕ(x) = 0).

De plus, toute forme linéaireψ nulle surH est colinéaire àϕ.

2) Si H est un hyperplan de E, alors il existe des formes linéaires sur E dont H est le noyau. De plus, si H = Kerϕ, alors l’ensemble des formes linéaires ψ sur E telles que H = Kerψ est {λ.ϕ, λ∈K^∗} (autrement dit l’équation de H est unique à un coeﬃcient multiplicatif non nul près).

Dém.1) Soitϕforme linéaire non nulle surE etbdansE tel que ϕ(b) = 0 ; je posea= 1

ϕ(b)·b, alors ϕ(a) = 1. Montrons que tout vecteurx deE s’écrit de manière uniquex=h+λ.aavec(h, λ)∈H×K (où H= Kerϕ).

Analyse : si le couple(h, λ)existe, nécessairementϕ(x) =ϕ(h) +λϕ(a) =λcarϕ(h) = 0etϕ(a) = 1, la seule solution possible est donc donnée par λ=ϕ(x) eth=x−ϕ(x).a.

Synthèse : je poseλ=ϕ(x) eth=x−ϕ(x).a. J’ai bienx=h+λ.a,ϕ(h) =ϕ(x)−λϕ(a) = 0donc h∈H, etλ∈K.

En conclusion, E =H⊕K.a, ce qui prouve queH est un hyperplan deE.

Supposons maintenant ψ forme linéaire sur E, nulle sur H, c’est-à-dire que H ⊂ Kerψ. H étant un hyperplan et Kerψun sous-espace vectoriel de E, deux cas se présentent :

•soitKerψ=E ; alorsψ= 0 = 0.ϕ est bien colinéaire àϕ;

•soit Kerψ = H = Kerϕ ; je construis comme ci-dessus un vecteur a de E tel que ϕ(a) = 1 et j’observe la forme linéaire δ = ψ−ψ(a).ϕ ; il est clair que H ⊂ Kerδ et que a ∈ Kerδ ; ainsi Kerδ contient H et K.a, donc leur somme qui n’est autre que E tout entier, donc δ = 0. Ainsi ψ=ψ(a).ϕ est là encore colinéaire àϕ.

2) Soit H un hyperplan de E et a ∈ E\H ; j’ai vu au § 3) que E = H ⊕K.a ; soient alors u l’application linéaire deE dansK.aqui à tout xdeE associe sa projection surK.aparallèlement àH, θ l’isomorphisme de K dans K.a qui à tout scalaire λassocie λ.a. Soit enﬁn ϕ =θ⁻¹◦u ; ϕ est une forme linéaire surE et, pour toutx deE : ϕ(x) = 0⇔u(x) = 0⇔x∈H.

Autrement dit,Kerϕ=H.

Supposons pour finir queϕest une forme linéaire surE telle queH = Kerϕ. Il est alors immédiat que toute forme linéaire ψ de la forme λ.ϕ, avecλ∈K^∗, vérifie Kerψ= Kerϕ=H. Réciproquement, soit ψ forme linéaire sur E de noyauH ; d’après le 1) in fine,ψ est de la forme λ.ϕ, oùλ est un scalaire, nécessairement non nul (puisqueKerψ=E). Cela achève la démonstration.

NB : siϕest une forme linéaire non nulle surE etH = Kerϕ, alorsϕest surjective (son image est un sous-espace vectoriel de K diﬀérent de {0} !) et ses lignes de niveau (les ensembles d’équation ϕ(x) =k, k∈K) sont les hyperplans aﬃnes deE de directionH.

2) Cas où

^E

est de dimension ﬁnie non nulle

ⁿ

Dans E de dimension ﬁnien >0, le théorème de la base incomplète montre qu’il existe des hyperplans (un seul si n= 1 !) et donc des formes linéaires non nulles (on peut aussi en déﬁnir directement par l’image d’une base. . . ).

Les hyperplans deE sont exactement les sous-espaces vectoriels deE de dimension n−1.

(8)

Équations (cartésiennes) d’un hyperplan dans une base :

Étant donnée une baseB= (e1, . . . , en)deE, toute forme linéaireϕsurE est déﬁnie par son expression analytique dans B : six=

n k=1

xk.ek,ϕ(x) =

n k=1

akxk (oùak n’est autre que le scalaire ϕ(ek)).

Siϕ= 0, l’hyperplanKerϕadmet pouréquation cartésienne dans la base B : ⁿ

k=1

akxk= 0.

Réciproquement, si(a1, . . . , an)est une famille denscalaires non tous nuls, ⁿ

k=1

xk.ek∈E /

n k=1

akxk= 0 est un hyperplan de E, appelél’hyperplan d’équation ⁿ

k=1

akxk= 0 dans la base B.

Dans les deux cas, l’hyperplan considéré admet une inﬁnité d’équations dans la base B, mais elles se déduisent l’une de l’autre par multiplication par un scalaire non nul.

VI

VI - Matrices semblables — Notion de trace

1) Changement de base pour un endomorphisme — Matrices semblables

Théorème :soient B et B^′ deux bases d’un K-espace vectoriel de dimension ﬁnie E, P = PB,B^′ et u∈ L(E). SiA est la matrice de u dans la base B etA^′ la matrice de u dans la base B^′, alorsA^′=P⁻¹AP.

Déﬁnition :deux matrices carréesA et Bd’ordre nsontsemblables si et seulement si :

∃P ∈GLn(K) B=P⁻¹AP.

i.e. si et seulement siAetBreprésentent un même endomorphisme dans deux bases d’un mêmeK-espace vectoriel de dimensionn.

NB : la relation “est semblable à” est une relation d’équivalence surMn(K), mais la description des classes d’équivalence est non triviale. Nous ne verrons que des conditions nécessaires : siAetB sont semblables, alors elles ont le même rang, le même déterminant, etc.

2) Trace d’une matrice carrée

Déﬁnition :soit A= (ai,j) ∈ Mn(K) ; on appelle trace de A la somme des éléments de la diagonale principale de A:

TrA=

n

k=1

ak,k

Propriétés : 1) L’applicationTr est une forme linéaire surMn(K).

2) ∀(A, B)∈ Mn(K)² Tr (BA) = Tr (AB).

3) ∀P ∈GLn(K) ∀A∈ Mn(K) Tr P⁻¹AP = TrA (deux matrices semblables ont même trace).

Dém.1)Vériﬁcation immédiate.

2) SoientA= (ai,j) etB= (bi,j) ; j’ai Tr (AB) =

n

i=1





n

j=1

ai,jbj,i



 et Tr (BA) =

n

i=1





n

j=1

bi,jaj,i





d’où le résultat par réindexation.

3) D’après2):

Tr P⁻¹AP = Tr P⁻¹(AP) = Tr (AP)P⁻¹ = Tr AP P⁻¹ = TrA . Attention ! En généralTr(AB) = (TrA)(TrB) ; Tr(ABC) = Tr(BAC).

(9)

NB : dans Mn(R), le calcul précédent montre que, avec les mêmes notations, Tr A^tB = Tr ^tAB =

n

i=1 n

j=1

ai,jbi,j

qui n’est autre que le produit scalaire canonique de Aet Bdans Mn(R).

On vériﬁe que, pour ce produit scalaire, le sous-espace des matrices symétriques et celui des matrices antisymétriques sont supplémentaires orthogonaux.

3) Trace d’un endomorphisme

Théorème et déﬁnition :soit u un endomorphisme d’un K-espace vectoriel E de dimension ﬁnie ; la trace de la matrice de udans une base deE ne dépend pas du choix de cette base, on l’appelle trace de u, notéeTru.

Dém.Soient B et C sont deux bases deE etP la matrice de passage de Bà C ; si A est la matrice de u dansB, alors la matrice de u dansC est P⁻¹AP, qui a la même trace queAd’après le §1).

Propriétés : 1) L’applicationTr est une forme linéaire surL(E).

2) ∀(u, v)∈ L(E)² Tr (v◦u) = Tr (u◦v).

3) Le rang d’un projecteur est égal à sa trace.

Dém.1)et 2)découlent du paragraphe précédent.

3) Soit p un projecteur de rang r ; dans une base adaptée à la décomposition E = Imp⊕Kerp, p admet pour matrice Ir 0

0 0 , d’oùTrp=r= rgp.

VII

VII - Compléments sur les déterminants

1) Matrices déﬁnies par blocs

Étant données quatre matricesA1,1 ∈ Mn1(K),A2,1 ∈ Mn2,n1(K),A1,2 ∈ Mn1,n2(K),A2,2∈ Mn2(K), on identiﬁe le “tableau” A1,1 A1,2

A2,1 A2,2 à une matrice deMn1+n²(K), dite matrice déﬁnie par blocs.

A1,1 etA2,2 sont les blocs diagonaux (carrés par hypothèse, mais pas nécessairement de même taille).

SiA2,1 (resp. A1,2) est nul, la matrice est ditetriangulaire supérieure (resp. inférieure) par blocs.

Si les deux blocs A2,1 et A1,2 sont nuls, la matrice est dite diagonale par blocs.

La transposée d’une matrice déﬁnie par blocs s’écrit naturellement, sans oublier de transposer les blocs ! La multiplication par un scalaire d’une matrice déﬁnie par blocs est naturelle.

L’addition de deux matrices A et B déﬁnies par blocs est naturelle également, si les blocs sont de mêmes tailles (c’est-à-dire que les deux blocs Ai,j et Bi,j sont de même taille pour tout couple (i, j) donné, mais il peut y avoir des blocs de tailles diﬀérentes selon les couples (i, j) !).

La multiplication de deux matrices déﬁnies par blocs, avec des blocs diagonaux de même taille (c’est-à-dire que les deux blocsAi,i etBi,i sont carrés de même taille pour toutidonné), s’eﬀectue selon l’algorithme habituel, en traitant les blocs comme des scalaires (en laissant bien à gauche les blocs de la matrice de gauche !). Ainsi, siA1,1 et B1,1 sont dansMn1(K),A2,1 etB2,1 dansMn2,n1(K),A1,2 et B1,2 dansMn1,n2(K),A2,2 etB2,2Mn2(K), on a

A1,1 A1,2

A2,1 A2,2 × B1,1 B1,2

B2,1 B2,2 = A1,1B1,1+A1,2B2,1 A1,1B1,2+A1,2B2,2

A2,1B1,1+A2,2B2,1 A2,1B1,2+A2,2B2,2 .

On obtient une matrice déﬁnie par blocs, avec des blocs de mêmes tailles que ceux des deux matrices que l’on a multipliées. Notamment, les puissances positives d’une matrice déﬁnie par blocs s’écrivent par blocs de la même taille que ceux de la matrice initiale.

Toutes ces déﬁnitions et propriétés se généralisent par récurrence à des matrices comportant un plus grand nombre de blocs.

(10)

2) Déterminant d’une matrice triangulaire par blocs

Rappel : le déterminant d’une matrice triangulaire est le produit des coeﬃcients de la diagonale.

Généralisation : le déterminant d’une matrice triangulaire par blocs est le produit des déterminants des blocs diagonaux (qui sont carrés par déﬁnition).

Corollaire : une matrice triangulaire par blocs est inversible si et seulement si tous ses blocs diagonaux sont inversibles.

3) Exemples de déterminants

a) Matrices aI+bU

SoitU la matrice deMn(K)dont tous les coeﬃcients valent 1 etI la matrice identité deMn(K). Pour (a, b)∈K² on a

det (aI+bU) = (a+nb)aⁿ⁻¹. b) Matrices tridiagonales

Poura, b, c dans K, la suite (∆n)_n∈N∗ déﬁnie par

∀n∈N^∗ ∆n=

a c 0 · · · 0 b a c ... ...

0 b ... ... 0 ... ... ... a c 0 · · · 0 b a

(déterminant d’ordre n)

vériﬁe la relation de récurrence linéaire double

∀n≥3 ∆n=a∆n−1−bc∆n−2 (à retrouver par deux développements consécutifs. . . ).

On en déduit l’expression de ∆n en fonction de n grâce à l’équation caractéristique associée, sachant que

∆1 =a et ∆2 =a²−bc.

On peut remarquer (habilement) que la relation ci-dessus reste vraie pour n= 2 en posant∆0 = 1, ce qui peut simpliﬁer les calculs. . .

c) Produit tensoriel PourA= a c

b d ∈ M2(K) etB∈ Mn(K), on déﬁnit par blocs la matrice A⊗B= aB cB

bB dB ∈ M_2n(K). On a det (A⊗B) = det (A)ⁿdet (B)².

4) Déterminant de Vandermonde

Pour tout ndans N, on déﬁnit la fonction Vn+1 de Kⁿ⁺¹ dansKpar

∀(a0, . . . , an)∈Kⁿ Vn+1(a0, . . . , an) =

1 a0 a²₀ · · · aⁿ₀ 1 a1 a²₁ · · · aⁿ₁ ... ... ... ...

... ... ... ...

1 an a²_n · · · aⁿ_n

= det a^j−1_i−1

1≤i,j≤n+1

On peut montrer que :

∀(a0, . . . , an)∈Kⁿ⁺¹ Vn+1(a0, . . . , an) =

0≤i<j≤n

(aj−ai).

Noter que l’on pouvait prévoir que ce déterminant est non nul si et seulement si les aj sont distincts deux à deux ; en eﬀet c’est le déterminant de la matrice, dans les bases canoniques, de l’application linéaire

φ: K_n[X] → Kⁿ⁺¹

P → P(a0), . . . , P(an) liée aux polynômes de Lagrange évoqués ci-après.

(11)

Interpolation de Lagrange (hors programme mais trèsclassique) Soient a0, . . . , an dansK, distincts deux à deux.

L’application φ: K_n[X] → Kⁿ⁺¹

P → P(a0), . . . , P(an)

est un isomorphisme.

En eﬀetφest linéaire et injective (car un polynôme de degré au plusnadmettantn+1racines distinctes est nécessairement nul), entre deux K-espaces vectoriels de même dimension.

On en déduit en particulier, pour toutb= (b0, . . . , bn)deKⁿ⁺¹, l’existence et l’unicité deP dansK_n[X]

tel que

∀j∈ {0, . . . , n} P(aj) =bj.

Pour expliciter ce polynôme d’interpolation P, il suﬃt de remarquer que les polynômesLi déﬁnis par

∀i∈ {0, . . . , n} Li=

k=i

X−ak

ai−ak. vériﬁent :

∀(i, j)∈ {0, . . . , n}² Li(aj) =δi,j = 1 sii=j

0 sii=j (symbole de Kronecker). (1) On en déduit par unicité de P que

P = ⁿ

i=0

bi.Li.

NB : les relations(1)signiﬁent que lesLi sont les antécédents parφdes vecteurs de la base canonique deKⁿ⁺¹. Si besoin, on peut retrouver l’expression de Lià partir de ces relations : Liest de degré au plusn, admet lesnracines distinctes(ak)_k=i etLi(ai) = 1, cette dernière relation permettant de déterminer le coeﬃcient dominant deLi.

VIII

VIII - Applications des déterminants

1) Orientation d’un

^R

-espace vectoriel

Théorème et déﬁnition :soient E un R-espace vectoriel de dimension n ≥ 1, B et B^′ deux bases de E ; on dit que B^′ est de même orientation que B si et seulement si la matrice de passage PB,B^′ a un déterminant strictement positif.

La relation ainsi déﬁnie sur l’ensemble des bases de E est une relation d’équivalence, pour laquelle il existe exactementdeuxclasses d’équivalence.

Orienter E, c’est choisir l’une de ces deux classes, dont les éléments sont appelésbases directes, les autres étant lesbases indirectes (ourétrogrades).

Dém. Tout vient des propriétés des matrices de passages. . . Rappelons que, si B, B^′ et B^′′ sont trois bases deE, alors on a la relation

PB,B^′′ =PB,B^′×PB^′,B^′′

En eﬀet, siX, X^′, X^′′ sont les vecteurs colonnes des coordonnées d’un même vecteurx deE respective- ment dansB, B^′,B^′′,

X =PB,B^′X^′ =PB,B^′ PB^′,B^′′X^′′ = (PB,B^′ ×PB^′,B^′′)X^′′.

On en déduit le résultat en prenant pour x les vecteurs de B^′′, ce qui donne les colonnes dePB,B^′′.

•La relation est réﬂexive car PB,B =Inest de déterminant 1 et 1>0!

•La relation est symétrique carPB^′,B =P_B,B⁻¹′, donc les déterminants de PB,B^′ etPB^′,B sont de même signe puisque ce sont deux réels inverses l’un de l’autre.

•La relation est transitive car le déterminant du produit de deux matrices de déterminant positif est positif. . .

Nous avons donc bien une relation d’équivalence.

•Il y a au moins deux classes d’équivalences, car si B = (e1, . . . , en) est une base de E, alors B^′ = (−e1, . . . , en) n’est pas de même orientation queB, puisquedetPB,B^′ =−1<0.

(12)

•Il n’y a que deux classes d’équivalence, car siB,B^′ sont comme ci-dessus et si B^′′ est un troisième base deE, alors

detPB,B^′′ =−detPB^′,B^′′

donc l’un de ces deux déterminants est positif, c’est-à-dire queB^′′ est soit dans la classe de B, soit dans la classe deB^′.

NB : le choix de l’une des deux orientations est purement conventionnel. Sur une droite, il s’agit intuitivement de “mettre une ﬂèche” d’un côté ou de l’autre, pour déﬁnir unaxe. En dimension 2 ou 3, il y a des orientations “usuelles” : sens trigonométrique dans le plan, orientation testée par diverses méthodes (trois doigts, bonhomme d’Ampère, tire-bouchon. . . ) en dimension 3.

Propriété : soit u ∈ GL(E) ; la base B^′ = u(e1), . . . , u(en) est de même orientation que B= (e1, . . . , en)si et seulement si detu >0.

Dém.Il suﬃt de remarquer que, si A désigne la matrice deu dansB, alors PB,B^′ =MB u(e1), . . . , u(en) =A et donc

detPB,B^′ = detA= detu, d’où le résultat !

2) Comatrice (hors programme mais classique)

Soit M ∈ Mn(K); on appellecomatrice de M la matrice des cofacteurs des éléments de M : ComM = (Ai,j)_1≤i,j≤n .

On a alors les relations :

M×^t(ComM) =^t(ComM)×M = (detM).In

donc, sidetM = 0:

M⁻¹ = 1

detM ·^t(ComM).

3) Formules de Cramer (hors programme mais classiques)

Soit (S) :MX =Bun système linéaire, où X=



 x1

...

xn



et B=



 b1

...

bn



 etM ∈GLn(K).

Un tel système est ditsystème de Cramer ; il admet pour unique solutionX =M⁻¹Bquel que soitB.

La solution de(S) est donnée par :

∀j ∈N_n xj = detMj

detM (formules de Cramer)

où Mj est la matrice deMn(K) obtenue en remplaçant dansM la colonnej par le second membre B.

Dém.SoientC1, . . . , Cnles vecteurs colonnes deM et(x1, . . . , xn) la solution de(S), ce qui signiﬁe que B =

n j=1

xj.Cj ; j’obtiens alors, par déﬁnition de Mj et par linéarité par rapport à la j-ième variable, en notant Bla base canonique de Kⁿ :

det (Mj) = detB(C1, . . . , Cj−1, B, Cj+1, . . . , Cn)

= detB C1, . . . , Cj−1,

n k=1

xk.Ck, Cj+1, . . . , Cn

=

n k=1

xk.detB(C1, . . . , Cj−1, Ck, Cj+1, . . . , Cn)

= xj.det (M)

car pourk=j il y a deux vecteurs identiques dans la famille. Le résultat en découle.

NB : ce résultat n’est pas très eﬃcace en pratique, mais il a un intérêt théorique, faisant apparaître l’expression des solutions sous forme de “fonctions rationnelles”. . .