Dans tout le chapitre, Kdésigne Rou Cet E est unK-espace vectoriel.
II - Combinaisons linéaires — Bases
On généralise ici les notions étudiées en 1re année au cas d’un ensemble d’indicesI non nécessairement fini(complément hors programme en PSI).
1) Combinaisons linéaires
Définition :le support d’une famille de scalaires (λi)i∈I ∈ KI est {i∈I / λi = 0}. On note K(I) l’ensemble des familles de scalairesà support fini.
Propriété : K(I) est un sous-espace vectoriel de KI,+, . .
Définition :soitF = (xi)i∈Iune famille de vecteurs deE. On dit qu’un vecteurxdeEestcombinaison linéaire des vecteurs de F si et seulement s’il existe une famille (λi)i∈I ∈ K(I) telle que x=
i∈I
λi.xi (il s’agit d’unesomme finie de vecteurs de E. . . ).
2) Bases
a) Familles génératrices
Soit F une famille de vecteurs deE. On dit que F est une famille génératrice deE si et seulement si tout vecteur deE est combinaison linéaire des vecteurs deF.
b) Sous-espace engendré par une famille de vecteurs
Soit F une famille de vecteurs deE etF l’ensemble des combinaisons linéaires des vecteurs deF. F est un sous-espace vectoriel deE ; c’est le plus petit sous-espace deE contenant les vecteurs de F.
F est notéVectF, appelé le sous-espace vectoriel de E engendré par F (F est une famille génératrice deVectF !).
NB : une familleF est génératrice de E si et seulement si VectF =E.
c) Familles libres
Soit F = (xi)i∈I une famille de vecteurs de E. On dit que F est libre si et seulement si la seule combinaison linéaire nulle des vecteurs deF est celle dont tous les coefficients sont nuls :
∀(λi)i∈I ∈K(I)
i∈I
λi.xi= 0 =⇒ ∀i∈I λi= 0 . F est libre si et seulement si toutes ses sous-familles finies sont libres.
Une partie A deE est dite libre si et seulement si la famille(x)x∈A est libre.
Par convention, ∅est libre.
d) Bases
Soit F une famille de vecteurs deE.
On dit que F est unebase deE si et seulement siF est libre et génératrice.
Une famille B= (ei)i∈I de vecteurs deE est une base deE si et seulement si tout vecteur deE s’écrit de manière unique comme combinaison linéaire des vecteurs de B. Dans ce cas, si x =
i∈I
λi.ei, la famille (λi)i∈I est appelée la famille des coordonnées de xdans la base B.
Exemple : Xk k∈N est une base deK[X], appeléela base canonique de K[X].
NB : l’existence de bases en dimension quelconque est liée à l’axiome du choix. . .
e) Caractérisation d’une application linéaire par l’image d’une base
Théorème :soientE etF deux K-espaces vectoriels,B= (ei)i∈I une base de E et(yi)i∈I une famille de vecteurs de F (indexées par le même ensembleI).
Il existe une unique application linéaireu deE dans F telle que : ∀i∈I u(ei) =yi . En outre ladite application linéaire u vérifie :
∗ Imu= Vect(yi)i∈I : u est surjective si et seulement si la famille(yi)i∈I engendre F.
∗ u est injective si et seulement si la famille(yi)i∈I est libre.
∗ u est bijective si et seulement si la famille(yi)i∈I est une base deF.
NB : dans le cas particulier oùE =K(I), muni de labase canonique (ei)i∈I, oùei = (δi,j)j∈I,Keru est l’ensemble des familles de coefficients des relations de dépendance linéaire de la famille (yi)i∈I
(la famille nulle mise à part !).
II
II - Structure d’algèbre
1) Définition
On appelle K-algèbre tout quadruplet(A,+, .,×) où : 1) (A,+, .) est unK-espace vectoriel ;
2) (A,+,×) est un anneau ;
3) ∀λ∈K ∀(x, y)∈A2 λ.(x×y) = (λ.x)×y=x×(λ.y)
UneK-algèbre(A,+, .,×) est ditecommutative si et seulement si ×est en outre commutative.
NB : le point 3) et la distributivité de × par rapport à + reviennent à dire que l’application (x, y)→x×y estbilinéaire deE×E dansE.
2) Exemples
1) K-algèbre commutative(K[X],+, .,×)des polynômes à coefficients dansK. 2) K-algèbre(L(E),+, .,◦) des endomorphismes d’unK-espace vectoriel E.
3) K-algèbre(Mn(K),+, .,×) des matrices carrées d’ordre nà coefficients dans K.
III
III - Sommes directes de sous-espaces vectoriels
Dans tout ce paragraphe,I est un ensemblefini non vide.
1) Produit d’une famille finie d’espaces-vectoriels
On généralise la notion de produit cartésien de deuxK-espaces vectoriels en définissantle produit d’une famille finie (Ei)i∈I de K-espaces vectoriels, ensemble des familles de vecteurs de la forme (xi)i∈I où, pour tout i,xi∈Ei, ensemble noté
i∈I
Ei. Théorème :
i∈I
Ei,+, . est unK-espace vectoriel, les lois+et.étant définies par pour x= (xi)i∈I ety= (yi)i∈I dans
i∈I
Ei : x+y= (xi+yi)i∈I pour λ∈Ketx= (xi)i∈I dans
i∈I
Ei : λ.x= (λ.xi)i∈I Propriété : si lesEi sont tous de dimension finie, alors
i∈I
Ei est de dimension finie égale à
i∈I
dimEi.
2) Somme d’une famille finie de sous-espaces-vectoriels
Soient E un K-espace vectoriel et (Ei)i∈I une famille finie de sous-espaces vectoriels de E.
L’espace produit
i∈I
Ei s’identifie au sous-espace vectoriel deEI (l’espace des familles de vecteurs de E indexées par I) formé des familles (xi)i∈I deEI telles que : ∀i∈I xi ∈Ei.
Théorème et définition :avec les notations précédentes, l’applicationϕ:
i∈I
Ei → E (xi)i∈I →
i∈I
xi
est linéaire. Son image, notée
i∈I
Ei, est un sous-espace vectoriel de E appelé somme des Ei,i∈I.
i∈I
Ei est l’ensemble des sommes de la forme
i∈I
xi,(xi)i∈I ∈
i∈I
Ei.
i∈I
Ei est le plus petit sous-espace de E contenant les Ei,i∈I. Autrement dit :
i∈I
Ei = Vect
i∈I
Ei .
Cas particulier : siF,Gsont deux sous-espaces de E,
F +G={y+z, (y, z)∈F×G}= Vect (F ∪G).
3) Somme directe d’une famille finie de sous-espaces vectoriels
Définition :(mêmes notations) lesEi,i∈I sont ditsen somme directe si et seulement si tout vecteur x de
i∈I
Ei s’écrit de manière uniquesous la forme x=
i∈I
xi,(xi)i∈I ∈
i∈I
Ei
(c’est-à-dire si et seulement si l’application linéaire ϕdu §1est injective).
Si c’est le cas, le sous-espace
i∈I
Ei est noté
i∈I
Ei, appelé somme directe des Ei,i∈I.
Caractérisation :toujours avec les mêmes notations, les assertions suivantes sont équivalentes : a)les Ei,i∈I sont en somme directe ;
b)∀(xi)i∈I∈
i∈I
Ei i∈I
xi = 0⇒ ∀i∈I xi = 0; c)∀i∈ I Ei∩
j=i
Ej ={0} (i.e. l’intersection de chaque sous-espace avec la somme des autres est réduite à {0}).
Attention ! Il ne suffit pas que les intersections des sous-espaces pris deux à deux soient réduites à {0} (voir par exemple trois droites vectorielles distinctes dans un plan).
Dém.Je remarque tout d’abord que les assertionsa)etb)sont toutes deux équivalentes à l’injectivité de l’application linéaire ϕ : a) signifie par définition d’une somme directe que tout élément de Imϕ admet au plus un antécédent, tandis que b) signifie que Kerϕ ={0}. J’en déduis par transitivité de l’équivalence que a)etb)sont équivalentes.
Je montre ensuite l’équivalence entre b)etc) par double implication :
•b) ⇒ c) : je suppose b) et, pour prouver c), je fixe arbitrairement i dans I et je considère un vecteurx élément de Ei∩
j=i
Ej . Ainsi, d’une part x est élément deEi, d’autre partx s’écrit x=
j=i
xj où xj ∈Ej, pour toutj dans I\ {i} . Je pose (habilement)xi=−x : la famille (xj)j∈I vérifie alors, par construction,
(xj)j∈I ∈
j∈I
Ej et
j∈I
xj = 0
donc, d’aprèsb), tous les xj sont nuls, en particulier x= 0. c)en résulte.
•c)⇒b): par contraposition, je suppose “non b)”, je dispose donc d’une famille (xi)i∈I dans
i∈I
Ei
de vecteurs dont la somme est nulle alors que les xi ne sont pas tous nuls. Soit donc i0 tel que xi0 = 0. xi0 appartient à Ei0 et donc
j=i0
xj =−xi0 est un vecteur non nul de Ei0 ∩
j=i0
Ej , ce qui prouve “non c)” et achève la démonstration.
Cas particulier : deux sous-espacesF,Gde E sont en somme directe si et seulement si F∩G={0} .
F etGsontsupplémentaires si et seulement si E=F⊕G.
NB : E =
i∈I
Ei si et seulement si l’application ϕest surjective ; E =
i∈I
Eisi et seulement siϕest un isomorphisme, dans ce cas chaqueEi est un supplémentaire dans E de la somme des autres, à savoirFi=
j=i
Ej (qui est également une somme directe).
4) Famille de projecteurs associée à une somme directe
Soit E =
i∈I
Ei ; on associe à cette décomposition deE la famille(pi)i∈I de projecteurs deE où, pour tout idansI,pi est la projection deE surEi parallèlement àFi =
j=i
Ej (voir la remarque ci-dessus).
Alors, la décomposition de tout vecteur x deE suivant la somme directe
i∈I
Ei n’est autre que x=
i∈I
pi(x) . (En effet, soitx=
j∈I
xj cette décomposition ; pouri fixé dansI,x s’écrit x=xi+yi , où xi ∈Ei et yi =
j=i
xj ∈Fi , par conséquent xi est bien égal à pi(x), par définition de la projection pi.) NB : la famille (pi)i∈I d’endomorphismes deE vérifie :
∗
i∈I
pi = IdE (d’après la propriété précédente) ;
∗ pour i, j distincts dans I,pi◦pj = 0(car Impj =Ej ⊂Fi= Kerpi).
Exercice : établir réciproquement que, si (pi)i∈I est une famille d’endomorphismes de E vérifiant les deux propriétés ci-dessus, alors les pi sont des projecteurs de E, E =
i∈I
Impi et (pi)i∈I est — au sens précédent — la famille de projecteurs associée à cette décomposition deE.
Cas particulier de deux sous-espaces supplémentaires
Soient E =F⊕Getp, q les projecteurs associés, on ap+q= IdE,p◦q=q◦p= 0.
s= 2p−IdE et−s= 2q−IdE sont les symétries associées.
5) Prolongement linéaire d’applications linéaires
Théorème :soientE, F deux K-espaces vectoriels,(Ei)i∈I une famille finie de sous-espaces deE telle que E=
i∈I
Ei et, pour toutidans I,ui une application linéaire de Ei dans F.
Il existe alors une unique application linéaire udeE dansF telle que
∀i∈I u|Ei =ui(la restriction deu à Ei est ui).
En outre,u est définie par : ∀x∈E u(x) =
i∈I
ui[pi(x)],
où (pi)i∈I est la famille de projecteurs associée à la décomposition E =
i∈I
Ei. Dém.Analyse — synthèse. . .
NB : on se permet parfois d’écrireu =
i∈I
ui◦pi car l’image depi est incluse dans l’ensemble de départ deui. . .
Exemple : si E1 est un sous-espace deE et u1 ∈ L(E1, F), on peut prolonger u1 en une application linéaire de E dans F grâce au théorème précédent, en utilisant un supplémentaire E2 de E1 dansE (en choisissant par exemple u2 = 0∈ L(E2, F)!).
Attention ! u:x→ u1(x) si x∈E1
0 sinon est bien un prolongement de u1 à E, mais non linéaire “en général” (exercice : CNS surE1 et u1 pour queu soit linéaire ?).
6) En dimension finie
Ici, E est unK-espace vectoriel de dimension finie.
Les résultats précédents s’appliquent bien sûr dans le cas particulier de la dimension finie.
On a en outre le :
Théorème :soit(Ei)i∈I une famille finie de sous-espaces vectoriels deE.
a)les Ei,i∈I, sont en somme directe si et seulement si dim
i∈I
Ei =
i∈I
dimEi ; b)dans le cas où les Ei sont en somme directe, E est égal à
i∈I
Ei si et seulement si dimE =
i∈I
dimEi. Dém.Soit S=
i∈I
Ei ; l’applicationϕ:
i∈I
Ei → S (xi)i∈I →
i∈I
xi
est linéaire et surjective.
De plus, les Ei sont en somme directe si et seulement si ϕ est injective, donc si et seulement si ϕ est un isomorphisme, soit si et seulement si
i∈I
Ei etS sont de même dimension. Le a)en découle.
Leb)est immédiat, compte tenu dua), puisqueS est un sous-espace deE, doncE =S si et seulement si dimS= dimE.
Exemple : si(ei)i∈I est une famille finie de vecteurs non nuls deE, les droites vectorielles K.ei sont en somme directe si et seulement si la famille(ei)i∈I est libre.
Définition :(basesadaptées)
a)si F est un sous-espace de E, une base B = (e1, . . . , en) deE est dite adaptée à F si et seulement si les premiers vecteurs de B forment une base deF ;
b)si E =
p k=1
Ek, une base B de E est diteadaptée à la décomposition E =
p k=1
Ek si et seulement si les premiers vecteurs de B forment une base deE1, les suivants une base de E2. . .
Fractionnement d’une base : siB = (e1, . . . , en) est une base de E et (I1, . . . , Ip) une partition de Nn, alors
E =
p k=1
Vect (ei)i∈Ik.
IV
IV - Isomorphismes classiques et applications
1) Isomorphisme de tout supplémentaire de
Kerudans
ImuThéorème :soientu∈ L(E, F) etE′ un supplémentaire deKeru dans E ; alorsu définit un isomorphisme deE′ dans Imu, c’est-à-dire que u′ : E′ → Imu
x → u(x)
est un isomorphisme.
Dém.L’application u′ est bien définie, linéaire commeu ; de plus :
•u′ est injective : six∈Keru′, alorsx∈E′ etu(x) = 0, doncx∈E′∩Kerud’où x= 0puisqueE′ etKeru sont supplémentaires ;
•u′ est surjective : soit y ∈ Imu ; par définition de Imu, je dispose d’un élément x de E tel que u(x) =y ; commeE =E′⊕Keru,x s’écritx=x′+z avecx′ ∈E′ et z∈Keru. J’ai alors :
y =u(x) =u x′+z =u x′ +u(z) =u′ x′ car x′ ∈E′ etz∈Keru.
Donc tout élément de Imu admet au moins un antécédent par u′.
En conclusion, u′ est linéaire et bijective, donc un isomorphisme de E′ dans Imu.
Application — théorème du rang
SiE est de dimension finie etu∈ L(E, F) alorsImu est de dimension finie et dim Imu+ dim Keru= dimE.
Corollaire : 1) Lorsque dimE = dimF =n,u est un isomorphisme si et seulement si rgu=n.
2) Le rang est invariant par composition avec un isomorphisme.
2) Isomorphisme entre deux supplémentaires d’un même sous-espace
Théorème :soientE′ un sous-espace vectoriel de E,F1 etF2 deux supplémentaires deE′ dans E ; la projection de E surF1 parallèlement à E′ définit un isomorphisme de F2 dansF1. Dém. Soit p ∈ L(E) cette projection ; F2 est un supplémentaire dans E de E′ qui n’est autre que le noyau de p, tandis que F1 est l’image de p : le théorème du paragraphe précédent fournit donc le résultat.
3) Application : notion d’hyperplan
Définition :on appellehyperplan de E tout sous-espace de E admettant une droite pour supplémen- taire.
Propriétés :soitH un hyperplan de E.
1) SiF est un sous-espace deE contenant H, alors F =H ou F =E.
2) Pour tout vecteuradeE\H,E=H⊕K.a.
3) Deux hyperplans quelconques deE sont isomorphes.
Dém.Fixons un vecteur bdeE tel queE=H⊕K.b (il en existe par définition d’un hyperplan !).
1) SoitF un sous-espace deE contenant H. Deux cas se présentent :
•sib∈F, alors F contientH etK.b, donc F contient la sommeH+K.bqui n’est autre queE tout entier (H+K.best le plus petit — au sens de l’inclusion — des sous-espaces de E contenant H et K.b) ; d’oùF =E dans ce cas ;
•si b /∈ F, alors je montre que F = H ; j’ai déjà F ⊃ H, soit donc x un vecteur de F ; comme E =H⊕K.b, je dispose de hdansH et deλdans Ktels quex =h+λ.bet nécessairement λ= 0 (sinonb= 1
λ·(x−h) appartiendrait àF, d’où une contradiction) ; ainsix=happartient àH, ceci pour toutx deF, autrement ditF ⊂H, ce qui achève la démonstration.
2) Soit a ∈ E\H ; H ∩K.a = {0} (sinon a serait élément de H) ; de plus F = H +K.a est un sous-espace deE contenantH eta, doncF =H d’où — grâce au1)— F =E ; en conclusion,H etK.a sont supplémentaires, ce qu’il fallait démontrer.
3) Soient H1 etH2 deux hyperplans de E, distincts (s’ils sont égaux, ils sont isomorphes !). Si j’avais H1 ⊂ H2, j’aurais H2 = E d’après 1), d’où une contradiction. Comme les rôles sont symétriques, j’ai H1 ⊂/ H2 et H2 ⊂/ H1 ; il en résulte (classique !) que H1∪H2 n’est pas stable par l’addition, donc est strictement inclus dans E. Fixons donc a ∈ E\(H1∪H2) ; d’après 2), H1 et H2 sont des supplémentaires de la même droite K.a ; il sont par conséquent isomorphes d’après le théorème précédent.
Exemples :
1) SiE est de dimension finie n≥1, les hyperplans de E sont les sous-espaces de dimensionn−1.
2) DansK[X], pourα∈K, l’ensemble des multiples deX−α, polynôme de degré 1, admet pour supplé- mentaire la droite vectorielleK0[X] =K; c’est donc un hyperplan deK[X], égal à{P ∈K[X] / P (α) = 0}
(le noyau de la forme linéaireP →P(α)).
V
V - Hyperplans et formes linéaires
1) Équations d’un hyperplan
Théorème :soitE unK-espace vectoriel,E ={0}.
1) Siϕest une forme linéaire non nulle sur E,H = Kerϕest un hyperplan de E (dit l’hyperplan d’équation ϕ(x) = 0).
De plus, toute forme linéaireψ nulle surH est colinéaire àϕ.
2) Si H est un hyperplan de E, alors il existe des formes linéaires sur E dont H est le noyau. De plus, si H = Kerϕ, alors l’ensemble des formes linéaires ψ sur E telles que H = Kerψ est {λ.ϕ, λ∈K∗} (autrement dit l’équation de H est unique à un coefficient multiplicatif non nul près).
Dém.1) Soitϕforme linéaire non nulle surE etbdansE tel que ϕ(b) = 0 ; je posea= 1
ϕ(b)·b, alors ϕ(a) = 1. Montrons que tout vecteurx deE s’écrit de manière uniquex=h+λ.aavec(h, λ)∈H×K (où H= Kerϕ).
Analyse : si le couple(h, λ)existe, nécessairementϕ(x) =ϕ(h) +λϕ(a) =λcarϕ(h) = 0etϕ(a) = 1, la seule solution possible est donc donnée par λ=ϕ(x) eth=x−ϕ(x).a.
Synthèse : je poseλ=ϕ(x) eth=x−ϕ(x).a. J’ai bienx=h+λ.a,ϕ(h) =ϕ(x)−λϕ(a) = 0donc h∈H, etλ∈K.
En conclusion, E =H⊕K.a, ce qui prouve queH est un hyperplan deE.
Supposons maintenant ψ forme linéaire sur E, nulle sur H, c’est-à-dire que H ⊂ Kerψ. H étant un hyperplan et Kerψun sous-espace vectoriel de E, deux cas se présentent :
•soitKerψ=E ; alorsψ= 0 = 0.ϕ est bien colinéaire àϕ;
•soit Kerψ = H = Kerϕ ; je construis comme ci-dessus un vecteur a de E tel que ϕ(a) = 1 et j’observe la forme linéaire δ = ψ−ψ(a).ϕ ; il est clair que H ⊂ Kerδ et que a ∈ Kerδ ; ainsi Kerδ contient H et K.a, donc leur somme qui n’est autre que E tout entier, donc δ = 0. Ainsi ψ=ψ(a).ϕ est là encore colinéaire àϕ.
2) Soit H un hyperplan de E et a ∈ E\H ; j’ai vu au § 3) que E = H ⊕K.a ; soient alors u l’application linéaire deE dansK.aqui à tout xdeE associe sa projection surK.aparallèlement àH, θ l’isomorphisme de K dans K.a qui à tout scalaire λassocie λ.a. Soit enfin ϕ =θ−1◦u ; ϕ est une forme linéaire surE et, pour toutx deE : ϕ(x) = 0⇔u(x) = 0⇔x∈H.
Autrement dit,Kerϕ=H.
Supposons pour finir queϕest une forme linéaire surE telle queH = Kerϕ. Il est alors immédiat que toute forme linéaire ψ de la forme λ.ϕ, avecλ∈K∗, vérifie Kerψ= Kerϕ=H. Réciproquement, soit ψ forme linéaire sur E de noyauH ; d’après le 1) in fine,ψ est de la forme λ.ϕ, oùλ est un scalaire, nécessairement non nul (puisqueKerψ=E). Cela achève la démonstration.
NB : siϕest une forme linéaire non nulle surE etH = Kerϕ, alorsϕest surjective (son image est un sous-espace vectoriel de K différent de {0} !) et ses lignes de niveau (les ensembles d’équation ϕ(x) =k, k∈K) sont les hyperplans affines deE de directionH.
2) Cas où
Eest de dimension finie non nulle
nDans E de dimension finien >0, le théorème de la base incomplète montre qu’il existe des hyperplans (un seul si n= 1 !) et donc des formes linéaires non nulles (on peut aussi en définir directement par l’image d’une base. . . ).
Les hyperplans deE sont exactement les sous-espaces vectoriels deE de dimension n−1.
Équations (cartésiennes) d’un hyperplan dans une base :
Étant donnée une baseB= (e1, . . . , en)deE, toute forme linéaireϕsurE est définie par son expression analytique dans B : six=
n k=1
xk.ek,ϕ(x) =
n k=1
akxk (oùak n’est autre que le scalaire ϕ(ek)).
Siϕ= 0, l’hyperplanKerϕadmet pouréquation cartésienne dans la base B : n
k=1
akxk= 0.
Réciproquement, si(a1, . . . , an)est une famille denscalaires non tous nuls, n
k=1
xk.ek∈E /
n k=1
akxk= 0 est un hyperplan de E, appelél’hyperplan d’équation n
k=1
akxk= 0 dans la base B.
Dans les deux cas, l’hyperplan considéré admet une infinité d’équations dans la base B, mais elles se déduisent l’une de l’autre par multiplication par un scalaire non nul.
VI
VI - Matrices semblables — Notion de trace
1) Changement de base pour un endomorphisme — Matrices semblables
Théorème :soient B et B′ deux bases d’un K-espace vectoriel de dimension finie E, P = PB,B′ et u∈ L(E). SiA est la matrice de u dans la base B etA′ la matrice de u dans la base B′, alorsA′=P−1AP.
Définition :deux matrices carréesA et Bd’ordre nsontsemblables si et seulement si :
∃P ∈GLn(K) B=P−1AP.
i.e. si et seulement siAetBreprésentent un même endomorphisme dans deux bases d’un mêmeK-espace vectoriel de dimensionn.
NB : la relation “est semblable à” est une relation d’équivalence surMn(K), mais la description des classes d’équivalence est non triviale. Nous ne verrons que des conditions nécessaires : siAetB sont semblables, alors elles ont le même rang, le même déterminant, etc.
2) Trace d’une matrice carrée
Définition :soit A= (ai,j) ∈ Mn(K) ; on appelle trace de A la somme des éléments de la diagonale principale de A:
TrA=
n
k=1
ak,k
Propriétés : 1) L’applicationTr est une forme linéaire surMn(K).
2) ∀(A, B)∈ Mn(K)2 Tr (BA) = Tr (AB).
3) ∀P ∈GLn(K) ∀A∈ Mn(K) Tr P−1AP = TrA (deux matrices semblables ont même trace).
Dém.1)Vérification immédiate.
2) SoientA= (ai,j) etB= (bi,j) ; j’ai Tr (AB) =
n
i=1
n
j=1
ai,jbj,i
et Tr (BA) =
n
i=1
n
j=1
bi,jaj,i
d’où le résultat par réindexation.
3) D’après2):
Tr P−1AP = Tr P−1(AP) = Tr (AP)P−1 = Tr AP P−1 = TrA . Attention ! En généralTr(AB) = (TrA)(TrB) ; Tr(ABC) = Tr(BAC).
NB : dans Mn(R), le calcul précédent montre que, avec les mêmes notations, Tr AtB = Tr tAB =
n
i=1 n
j=1
ai,jbi,j
qui n’est autre que le produit scalaire canonique de Aet Bdans Mn(R).
On vérifie que, pour ce produit scalaire, le sous-espace des matrices symétriques et celui des matrices antisymétriques sont supplémentaires orthogonaux.
3) Trace d’un endomorphisme
Théorème et définition :soit u un endomorphisme d’un K-espace vectoriel E de dimension finie ; la trace de la matrice de udans une base deE ne dépend pas du choix de cette base, on l’appelle trace de u, notéeTru.
Dém.Soient B et C sont deux bases deE etP la matrice de passage de Bà C ; si A est la matrice de u dansB, alors la matrice de u dansC est P−1AP, qui a la même trace queAd’après le §1).
Propriétés : 1) L’applicationTr est une forme linéaire surL(E).
2) ∀(u, v)∈ L(E)2 Tr (v◦u) = Tr (u◦v).
3) Le rang d’un projecteur est égal à sa trace.
Dém.1)et 2)découlent du paragraphe précédent.
3) Soit p un projecteur de rang r ; dans une base adaptée à la décomposition E = Imp⊕Kerp, p admet pour matrice Ir 0
0 0 , d’oùTrp=r= rgp.
VII
VII - Compléments sur les déterminants
1) Matrices définies par blocs
Étant données quatre matricesA1,1 ∈ Mn1(K),A2,1 ∈ Mn2,n1(K),A1,2 ∈ Mn1,n2(K),A2,2∈ Mn2(K), on identifie le “tableau” A1,1 A1,2
A2,1 A2,2 à une matrice deMn1+n2(K), dite matrice définie par blocs.
A1,1 etA2,2 sont les blocs diagonaux (carrés par hypothèse, mais pas nécessairement de même taille).
SiA2,1 (resp. A1,2) est nul, la matrice est ditetriangulaire supérieure (resp. inférieure) par blocs.
Si les deux blocs A2,1 et A1,2 sont nuls, la matrice est dite diagonale par blocs.
La transposée d’une matrice définie par blocs s’écrit naturellement, sans oublier de transposer les blocs ! La multiplication par un scalaire d’une matrice définie par blocs est naturelle.
L’addition de deux matrices A et B définies par blocs est naturelle également, si les blocs sont de mêmes tailles (c’est-à-dire que les deux blocs Ai,j et Bi,j sont de même taille pour tout couple (i, j) donné, mais il peut y avoir des blocs de tailles différentes selon les couples (i, j) !).
La multiplication de deux matrices définies par blocs, avec des blocs diagonaux de même taille (c’est-à-dire que les deux blocsAi,i etBi,i sont carrés de même taille pour toutidonné), s’effectue selon l’algorithme habituel, en traitant les blocs comme des scalaires (en laissant bien à gauche les blocs de la matrice de gauche !). Ainsi, siA1,1 et B1,1 sont dansMn1(K),A2,1 etB2,1 dansMn2,n1(K),A1,2 et B1,2 dansMn1,n2(K),A2,2 etB2,2Mn2(K), on a
A1,1 A1,2
A2,1 A2,2 × B1,1 B1,2
B2,1 B2,2 = A1,1B1,1+A1,2B2,1 A1,1B1,2+A1,2B2,2
A2,1B1,1+A2,2B2,1 A2,1B1,2+A2,2B2,2 .
On obtient une matrice définie par blocs, avec des blocs de mêmes tailles que ceux des deux matrices que l’on a multipliées. Notamment, les puissances positives d’une matrice définie par blocs s’écrivent par blocs de la même taille que ceux de la matrice initiale.
Toutes ces définitions et propriétés se généralisent par récurrence à des matrices comportant un plus grand nombre de blocs.
2) Déterminant d’une matrice triangulaire par blocs
Rappel : le déterminant d’une matrice triangulaire est le produit des coefficients de la diagonale.
Généralisation : le déterminant d’une matrice triangulaire par blocs est le produit des déterminants des blocs diagonaux (qui sont carrés par définition).
Corollaire : une matrice triangulaire par blocs est inversible si et seulement si tous ses blocs diagonaux sont inversibles.
3) Exemples de déterminants
a) Matrices aI+bU
SoitU la matrice deMn(K)dont tous les coefficients valent 1 etI la matrice identité deMn(K). Pour (a, b)∈K2 on a
det (aI+bU) = (a+nb)an−1. b) Matrices tridiagonales
Poura, b, c dans K, la suite (∆n)n∈N∗ définie par
∀n∈N∗ ∆n=
a c 0 · · · 0 b a c ... ...
0 b ... ... 0 ... ... ... a c 0 · · · 0 b a
(déterminant d’ordre n)
vérifie la relation de récurrence linéaire double
∀n≥3 ∆n=a∆n−1−bc∆n−2 (à retrouver par deux développements consécutifs. . . ).
On en déduit l’expression de ∆n en fonction de n grâce à l’équation caractéristique associée, sachant que
∆1 =a et ∆2 =a2−bc.
On peut remarquer (habilement) que la relation ci-dessus reste vraie pour n= 2 en posant∆0 = 1, ce qui peut simplifier les calculs. . .
c) Produit tensoriel PourA= a c
b d ∈ M2(K) etB∈ Mn(K), on définit par blocs la matrice A⊗B= aB cB
bB dB ∈ M2n(K). On a det (A⊗B) = det (A)ndet (B)2.
4) Déterminant de Vandermonde
Pour tout ndans N, on définit la fonction Vn+1 de Kn+1 dansKpar
∀(a0, . . . , an)∈Kn Vn+1(a0, . . . , an) =
1 a0 a20 · · · an0 1 a1 a21 · · · an1 ... ... ... ...
... ... ... ...
1 an a2n · · · ann
= det aj−1i−1
1≤i,j≤n+1
On peut montrer que :
∀(a0, . . . , an)∈Kn+1 Vn+1(a0, . . . , an) =
0≤i<j≤n
(aj−ai).
Noter que l’on pouvait prévoir que ce déterminant est non nul si et seulement si les aj sont distincts deux à deux ; en effet c’est le déterminant de la matrice, dans les bases canoniques, de l’application linéaire
φ: Kn[X] → Kn+1
P → P(a0), . . . , P(an) liée aux polynômes de Lagrange évoqués ci-après.
Interpolation de Lagrange (hors programme mais trèsclassique) Soient a0, . . . , an dansK, distincts deux à deux.
L’application φ: Kn[X] → Kn+1
P → P(a0), . . . , P(an)
est un isomorphisme.
En effetφest linéaire et injective (car un polynôme de degré au plusnadmettantn+1racines distinctes est nécessairement nul), entre deux K-espaces vectoriels de même dimension.
On en déduit en particulier, pour toutb= (b0, . . . , bn)deKn+1, l’existence et l’unicité deP dansKn[X]
tel que
∀j∈ {0, . . . , n} P(aj) =bj.
Pour expliciter ce polynôme d’interpolation P, il suffit de remarquer que les polynômesLi définis par
∀i∈ {0, . . . , n} Li=
k=i
X−ak
ai−ak. vérifient :
∀(i, j)∈ {0, . . . , n}2 Li(aj) =δi,j = 1 sii=j
0 sii=j (symbole de Kronecker). (1) On en déduit par unicité de P que
P = n
i=0
bi.Li.
NB : les relations(1)signifient que lesLi sont les antécédents parφdes vecteurs de la base canonique deKn+1. Si besoin, on peut retrouver l’expression de Lià partir de ces relations : Liest de degré au plusn, admet lesnracines distinctes(ak)k=i etLi(ai) = 1, cette dernière relation permettant de déterminer le coefficient dominant deLi.
VIII
VIII - Applications des déterminants
1) Orientation d’un
R-espace vectoriel
Théorème et définition :soient E un R-espace vectoriel de dimension n ≥ 1, B et B′ deux bases de E ; on dit que B′ est de même orientation que B si et seulement si la matrice de passage PB,B′ a un déterminant strictement positif.
La relation ainsi définie sur l’ensemble des bases de E est une relation d’équivalence, pour laquelle il existe exactementdeuxclasses d’équivalence.
Orienter E, c’est choisir l’une de ces deux classes, dont les éléments sont appelésbases directes, les autres étant lesbases indirectes (ourétrogrades).
Dém. Tout vient des propriétés des matrices de passages. . . Rappelons que, si B, B′ et B′′ sont trois bases deE, alors on a la relation
PB,B′′ =PB,B′×PB′,B′′
En effet, siX, X′, X′′ sont les vecteurs colonnes des coordonnées d’un même vecteurx deE respective- ment dansB, B′,B′′,
X =PB,B′X′ =PB,B′ PB′,B′′X′′ = (PB,B′ ×PB′,B′′)X′′.
On en déduit le résultat en prenant pour x les vecteurs de B′′, ce qui donne les colonnes dePB,B′′.
•La relation est réflexive car PB,B =Inest de déterminant 1 et 1>0!
•La relation est symétrique carPB′,B =PB,B−1′, donc les déterminants de PB,B′ etPB′,B sont de même signe puisque ce sont deux réels inverses l’un de l’autre.
•La relation est transitive car le déterminant du produit de deux matrices de déterminant positif est positif. . .
Nous avons donc bien une relation d’équivalence.
•Il y a au moins deux classes d’équivalences, car si B = (e1, . . . , en) est une base de E, alors B′ = (−e1, . . . , en) n’est pas de même orientation queB, puisquedetPB,B′ =−1<0.
•Il n’y a que deux classes d’équivalence, car siB,B′ sont comme ci-dessus et si B′′ est un troisième base deE, alors
detPB,B′′ =−detPB′,B′′
donc l’un de ces deux déterminants est positif, c’est-à-dire queB′′ est soit dans la classe de B, soit dans la classe deB′.
NB : le choix de l’une des deux orientations est purement conventionnel. Sur une droite, il s’agit intuitivement de “mettre une flèche” d’un côté ou de l’autre, pour définir unaxe. En dimension 2 ou 3, il y a des orientations “usuelles” : sens trigonométrique dans le plan, orientation testée par diverses méthodes (trois doigts, bonhomme d’Ampère, tire-bouchon. . . ) en dimension 3.
Propriété : soit u ∈ GL(E) ; la base B′ = u(e1), . . . , u(en) est de même orientation que B= (e1, . . . , en)si et seulement si detu >0.
Dém.Il suffit de remarquer que, si A désigne la matrice deu dansB, alors PB,B′ =MB u(e1), . . . , u(en) =A et donc
detPB,B′ = detA= detu, d’où le résultat !
2) Comatrice (hors programme mais classique)
Soit M ∈ Mn(K); on appellecomatrice de M la matrice des cofacteurs des éléments de M : ComM = (Ai,j)1≤i,j≤n .
On a alors les relations :
M×t(ComM) =t(ComM)×M = (detM).In
donc, sidetM = 0:
M−1 = 1
detM ·t(ComM).
3) Formules de Cramer (hors programme mais classiques)
Soit (S) :MX =Bun système linéaire, où X=
x1
...
xn
et B=
b1
...
bn
etM ∈GLn(K).
Un tel système est ditsystème de Cramer ; il admet pour unique solutionX =M−1Bquel que soitB.
La solution de(S) est donnée par :
∀j ∈Nn xj = detMj
detM (formules de Cramer)
où Mj est la matrice deMn(K) obtenue en remplaçant dansM la colonnej par le second membre B.
Dém.SoientC1, . . . , Cnles vecteurs colonnes deM et(x1, . . . , xn) la solution de(S), ce qui signifie que B =
n j=1
xj.Cj ; j’obtiens alors, par définition de Mj et par linéarité par rapport à la j-ième variable, en notant Bla base canonique de Kn :
det (Mj) = detB(C1, . . . , Cj−1, B, Cj+1, . . . , Cn)
= detB C1, . . . , Cj−1,
n k=1
xk.Ck, Cj+1, . . . , Cn
=
n k=1
xk.detB(C1, . . . , Cj−1, Ck, Cj+1, . . . , Cn)
= xj.det (M)
car pourk=j il y a deux vecteurs identiques dans la famille. Le résultat en découle.
NB : ce résultat n’est pas très efficace en pratique, mais il a un intérêt théorique, faisant apparaître l’expression des solutions sous forme de “fonctions rationnelles”. . .