L’essentiel du Cours d’Algèbre
1 Espaces vectoriels
Définition: on appelle espace vectoriel (e.v) sur un corpsK(RouC) un ensembleE muni de deux lois :
• une loi interne, notée “+”, telle que(E,+)est un groupe commutatif (voir Annexe).
• une loi externe, notée “.”, définie deK×E dansEtelle que : – ∀(λ, µ)∈K2,∀u∈E,(λ+µ).u=λ.u+µ.u
– ∀λ∈K,∀(u, v)∈E×E, λ.(u+v) =λ.u+λ.v – ∀(λ, µ)∈K2,∀u∈E,(λ.µ).u=λ.(µ.u)
– ∀u∈E,1K.u=u (1K, élément neutre deKpour le produit, est aussi neutre pour “.”).
Les éléments d’un e.v. sont appelés des vecteurs. Un espace vectoriel peut être de dimension finie ou infinie.
Propriétés élémentaires – ∀u∈E,0K.u= 0E
– ∀λ∈K,λ.0E= 0E
– ∀(λ, u)∈K×E,λ.u= 0E⇒λ= 0Kouu= 0E – ∀(λ, x, y)∈K∗E×E,λ.x=λ.y⇒x=y – ∀(λ, µ)∈K2,∀x∈E\ {0E},λ.x=µ.x⇒λ=µ – ∀λ∈K,∀x∈E,λ.(−x) =−(λ.x) = (−λ).x Sous-espace vectoriel
• Famille d’éléments d’un e.v. : n étant un entier non nul quelconque, on appelle famille finie à nd’éléments deE, et on note(u1, . . . , un)unn-uplet d’éléments deE (les ui ne sont pas forcément distincts).
• Combinaison linéaire (c.l.) : Soit(u1, . . . , un)une famille finie d’éléments deE, on appelle combinaison linéaire des ui tout vecteurudeE de la forme : Pn
i=1
αiui, où lesαi sont desscalaires.
• Sous-espace vectoriel (s.e.v) : on appelle sous-espace vectoriel de E toute partie A non vide deE, stable par les deux opérations “+” et “.”, et qui, munie des lois induites, est encore un K–e.v..
• Théorème : SoitAune partie non vide deE. Aest un s.e.v. deE ⇐⇒ Aeststable par c.l..
• Sous-espace vectoriel engendré
– Définition : soitP une partie quelconque deE. On appelle s.e.v. engendré parP l’intersection de tous les s.e.v deE contenantP. C’est aussi l’ensemble de toutes les combinaisons linéaires (finies) d’éléments deP. On le noteV ect(P)et pour la relation⊂c’est le plus petit s.e.v. de E contenantP.
– Théorème : l’intersection d’une famille quelconque de s.e.v. de E est un s.e.v. deE.
• Somme
– Définition : Soient F et Gdeux s.e.v. deE. On noteF+Gl’ensemble des éléments z de E tels que ∃x∈F et ∃y∈Gavecz=x+y.F+Gest aussi un s.e.v. deE.
– Théorème :dim(F+G) =dimF+dimG−dim(F∩G).
• Somme directe
– Définition : Soient F etGdeux s.e.v. deE. On dit queF et Gsontsupplémentaires, et on noteE =F⊕G, si tout vecteur deE se décompose de façon unique en la somme d’un vecteur deF et d’un vecteur deG – Théorème :E=F⊕G⇐⇒E=F+GetF∩G={0E}.
Espace vectoriel E de dimension finie n
• Famille génératrice deE : il s’agit d’une famille deE telle queE =V ect({x1,· · ·, xn}). On dit qu’unK–e.v. est de dimension finie s’il admet une famille génératrice finie. Toute famille génératrice de E a au moinsnéléments.
• Famille libre : il s’agit d’une famille dont les éléments sont linéairement indépendants. Aucun élément n’est c.l. des autres. C’est aussi une famille d’éléments telle que la seule c.l. nulle est la combinaison linéaire à coefficients tous
Raphaël Grandin – IPGP – [email protected] Version du17 janvier 2021
nuls. Dans un e.v. de dimension finie, une famille libre ne peut avoir plus d’éléments qu’une famille génératrice.
Toute famille libre de E a au plusnéléments.
• Base : il s’agit d’une famille libre et génératrice. Tout e.v. de dimension finie admet une base. Toutes les bases ont le même nombre d’éléments, égal àn, la dimension deE. Toute famille génératrice ànéléments est une base. Toute famille libre à néléments est une base. Toute famille génératrice de E contient une base. Tout famille libre deE peut-être complétée en une base. Dans ce cours, nous considérerons le plus souvent possible desbases orthonormées. La notion de base orthonormale nécessite de disposer d’un produit scalaire (voir partie 2). Labase canonique d’un e.v. est la base la plus “naturelle” (par exemple{(1,0); (0,1)}dansR2). On la choisit généralementorthonorméeet directe (règle de la main droite dansR3).
• Sous-espace vectoriel : SiF est un s.e.v. deE, alorsdimF ≤dimE.
• Théorèmes : Soit E un e.v. avecdimE=n. SoitΩ ={x1,· · ·, xm)une famille denvecteurs deE. – Ωfamille libre=⇒CardΩ≤n
– Ωfamille génératrice=⇒CardΩ≥n – Ωbase⇐⇒
CardΩ =n
Ωfamille libre ⇐⇒
CardΩ =n
Ωfamille génératrice
2 Produit scalaire
Espace vectoriel euclidien
• Définition : SoitEun e.v. réel muni d’un produit scalaire et de dimension finie. On dit queEest un e.v.euclidien.
• Produit scalaire : Soit E un e.v. surR. On appelle produit scalaire surRtoute formeΦdeE×E dansR: – bilinéaire : les applications
Φx: E →R
y 7→Φx(y) = Φ(x, y) et
Φy: E→R
x7→Φy(x) = Φ(x, y) sont linéaires.
– symétrique : ∀(x, y)∈E2,Φ(x, y) = Φ(y, x)
– définie positive :∀x∈E,Φ(x, x)≥0 et Φ(x, x) = 0⇒x= 0E On le note(x|y),< x, y >, ou encore~u.~v (ne pas confondre avec le signe “.” utilisé pour la loi de composition externe).
• Norme :∀x∈E la norme dexest définie par :||x||=p (x|x).
• Distance euclidienne :∀(x, y)∈E la distance euclidienne entrexet y est définie par :d(x, y) =||x−y||.
• Propriétés
– ||x||= 0⇒x= 0E
– ||λ.x||=|λ| ||x||
– d(x, y) = 0⇒x=y
– d(x, y) =d(y, x) =||x−y||=||y−x||
– ∀(x, y)∈E2 et∀(α, β)∈R2,||αx+βy||2=α2||x||2+ 2αβ(x|y) +β2||y||2 – ∀(x, y)∈E2,|(x|y)| ≤ ||x|| ||y|| (inégalité de Cauchy-Schwarz)
– ∀(x, y)∈E2,||x+y|| ≤ ||x||+||y|| (inégalité triangulaire)
– ∀(x, y)∈E2,||x+y||2+||x−y||2= 2(||x||2+||y||2) (identité du parallélogramme) – ∀(x, y)∈E2,||x+y||2− ||x−y||2= 4|(x|y)| (identité de polarisation)
Orthogonalité
• Définition : Soient(x, y)∈E2,Eun e.v. euclidien muni du produit scalaire “|”. On dit quexety sont orthogonaux si(x|y) = 0.
• Entre e.v. :
– Définition : SoientF etGdeux s.e.v. deE. On dit queF etGsont orthogonaux si∀(x, y)∈F×G,(x|y) = 0. On appelle orthogonale deF, notéeF⊥, l’ensemble défini par :F⊥={x∈E /∀y∈F, (x|y) = 0}
– Propriétés :F⊕F⊥=E ; (F⊥)⊥=F ; F⊂G⇒G⊥⊂F⊥
• Entre familles :
– Soit (e1,· · ·, en) une famille de vecteurs de E. On dit que cette famille estorthogonale si∀(i, j) ∈[|1, p|]× [|1, p|], (ei, ej) = 0pouri6=j.
– Soit un vecteure∈E\ {0E}. On dit queeestunitaire si||e||= 1.
– Une famille estorthonormale si elle est orthogonale et si ses vecteurs sont unitaires.
– Si la famille(e1,· · ·, en)est orthogonale, alors||e1+· · ·+en||2=||e1||2+· · ·+||en||2 (théorème de Pythagore) – Conséquence : Une famille orthogonale de vecteurs non nuls est libre.
– Corollaire : Une famille orthonormale de vecteurs est libre.
– Si dimE=n, toute famille orthonormale denvecteurs est une base.
– Théorèmes : Soit(e1,· · · , en)unebase orthonormale(b.o.n.) deE. Soitx=
n
P
i=1
xieiet soity=
n
P
i=1
yiei. Alors,
∀i∈[|1, n|] :xi= (x|ei) ; ||x||2=
n
P
i=1
x2i ; (x|y) =
n
P
i=1
xiyi ; d(x, y) =||x−y||= s n
P
i=1
(xi−yi)2
• Projection orthogonale
– Equation d’une droite : en 2D,ax+by+c= 0, devecteur normal (a,b) ; en 3D,ax+by+cz+d= 0de vecteur normal (a,b,c) ; etc...
– Définition : soit (d)une droite et P un point hors de (d). On appelle projection orthogonale de P sur (d)le pointP0 dedtel que :P P0⊥(d).
– Distance : ladistance du pointP à la droite(d)est notéeδ{P; (d)}. Elle est égale à la norme du vecteur−−→
P P0, oùP0 est la projection orthogonale deP sur(d).
– Théorème : la distance du point P de coordonnées (xP;yP) à la droite (d) d’équation ax+by+c = 0 est donnée par : δ{P; (d)}=|axP+byP+c|
√a2+b2
Produit scalaire hermitien (dans C≡R2)
• Forme algébrique :z=a+ibaveca=Re(z)etb=Im(z).zest l’affixede−−→
OM (ou deM) dans leplan complexe.
• Conjugué : ¯z=a−ib ; Re(z) =12(z+ ¯z) ; Im(z) =2i1(z−z)¯
• Module :|z|=||−−→
OM||=√
a2+b2 =p−−→
OM .−−→
OM
• Produit scalaire (dans C)
– Produit scalaire hermitien (surC) :(z|z0) =z∗z0 ∈C
– Norme hermitienne :(z|z) =z∗z=|z|2 (s’identifie à la norme euclidienne dansR2) – Conséquences : 1
z = z
|z|2 = a−ib
a2+b2;|zz0| ≤ |z||z0|(Cauchy-Schwarz) ;|z+z0| ≤ |z|+|z0|(inégalité triangulaire)
3 Géométrie dans l’espace ( R
3)
Produit scalaire Soient ~u = u1
u2
u3
! et ~v =
v1
v2
v3
!
deux vecteurs deR3 exprimés dans une base orthonormale. Le produit scalaire s’écrit~u.~v=u1v1+u2v2+u3v3∈R.
Produit vectoriel
• Définition Le produit vectoriel s’écrit~u ∧ ~v=
u2v3−u3v2
u3v1−u1v3
u1v2−u2v1
!
∈R3
• Conséquences (~u ∧ ~v)⊥~u ; (~u ∧ ~v)⊥~v ; ~u // ~v⇐⇒(~u ∧ ~v) =~0 ; Le trièdre(~u;~v;w~ =~u ∧ ~v)est direct (règle de la main droite). ; ||~u ∧ ~v||=||~u||.||~v||.|sin(d~u, ~v) ; ||~u ∧ ~v||=aire du parallélogramme.
• Propriétés
– Anti-symétrie :~u ∧ ~v=−~v ∧ ~u
– Bilinéarité : Soientλ∈Ret (~u, ~v, ~w)∈R3×R3×R3.
(λ~u) ∧ ~v=λ(~u ∧ ~v) =~u ∧ (λ~v) (~u+~v) ∧ w~ = (~u ∧ w) + (~~ v ∧ w)~
~
u ∧ (~v+w) = (~~ u ∧ ~v) + (~u ∧ w)~ Double produit vectoriel
• En général,~u ∧ (~v ∧ w)~ 6= (~u ∧ ~v) ∧ w~
• En fait,(~u ∧ ~v) ∧ w~ =−(~v. ~w).~u+ (~u. ~w).~v Produit mixte
• Définition :(~u, ~v, ~w) = (~u ∧ ~v). ~w∈R
• Interprétation : volume du parallélépipède engendré par{~u, ~v, ~w}.
• Permutation circulaire : (~u, ~v, ~w) = (w, ~~ u, ~v) = (~v, ~w, ~u)
• Permutation non-circulaire :(~u, ~v, ~w) =−(~v, ~u, ~w) =−(~u, ~w, ~v) =−(~w, ~v, ~u)
• Propriétés
– (~u, ~v, ~w) =det
u1 v1 w1 u2 v2 w2 u3 v3 w3
=u1
v2 w2 v3 w3
+u2
v3 w3 v1 w1
+u3
v1 w1 v2 w2
(dévpt selon 1ère colonne).
– ~u,~v etw~ coplanaires ⇐⇒det(~u, ~v, ~w)≡det(U, V, W) = 0 (en notant~u, ~v, ~wsous la forme de vecteurs colonnes)
– On admettra que cette notion (nullité du déterminant ⇐⇒dépendance linéaire) peut être extrapolée àRn.
4 Applications linéaires
Généralités sur les applications
• Définition : la donnée d’une application d’un ensembleEdans un autre ensembleFest la donnée d’un sous-ensemble G deE×F tel que, ∀x∈E, ∃!y ∈F /(x, y)∈G. En clair : une application est une fonction deE dansF. Un élément de l’ensemble de départ ne peut être associé qu’à un unique élement dans l’ensemble d’arrivée (aucun élément deE ne pointe vers plusieurs éléments deF).
• Composition∀x∈E,(g◦f)(x) =g(f(x)). La loi “◦” est associative mais non commutative (a priori).
• Injectivité, surjectivité, bijectivité : : Soit f une application deE dansF.
– On dit que f est injective si tout élément deF a au plus un antécédent ⇐⇒ ∀(x, x0)∈E2, f(x) =f(x0)⇒ x=x0
– On dit quef est surjective si tout élément deF a au moins un antécédent⇐⇒ ∀y∈F,∃x∈E / f(x) =y – On dit quef est bijective deEsurF si f est à la fois injective et surjective⇐⇒tout élément deF a un unique
antécédent⇐⇒ ∀y∈F, ∃!x∈E / f(x) =y
• Théorème : f est une bijection de E sur F ssi il existe une fonction g de F dans E telle que g◦f = IdE et f ◦g=IdF. On note alorsg=f−1.
Applications linéaires
• Définition : SoientE et F deuxR-e.v. de dimension finie. SoientBE et BF deux bases deE et F. L’applicationudeE dansF estlinéaire si∀(x, y)∈E×E,∀(a, b)∈R2, u(ax+by)=L a.u(x) +b.u(y).
• Conséquence :u(0E) = 0F
Image et noyau
– Image : Im(u) ={y∈F /∃x∈E / u(x) =y} ⊂F – Noyau :Ker(u) ={x∈E / u(x) = 0F} ⊂E – Rang : rg(u) =dim Im(u)
Théorèmes
– Im(u)est un s.e.v deF – Ker(u)est un s.e.v deE
– uinjective⇐⇒u(BE)libre⇐⇒rg u=dimE ⇐⇒Ker(u) ={0E} – usurjective⇐⇒u(BE)génératrice ⇐⇒rg u=dimF ⇐⇒ Im(u) =F – ubijective⇐⇒u(BE)base deF ⇐⇒ rg u=dimE =dimF
– Théorème du rang : soituun app. lin. deE surF. On a :dimE=dim Ker(u) +dim Im(u)
5 Représentation matricielle des applications linéaires
Définition
Soient E etF deuxR-e.v. de dimension finiesnet p, respectivement.
• Décomposition : SoientBE= (e1, e2,· · ·, en)et BF = (f1, f2,· · ·, fn)des bases deE etF, respectivement.
∀x∈E, la décomposition sur BE est unique :x=x1.e1+x2.e2+· · ·+xn.en
∀y∈F, la décomposition sur BF est unique :y=y1.f1+y2.f2+· · ·+yn.fp
• Image d’un vecteur par une application linéaire : Soituune application linéaire deEdansF. Soity∈Im(u). Alors,∃x∈E tel que :
y = u(x)
= u(x1.e1+x2.e2+· · ·+xn.en)
=L x1.u(e1) +x2.u(e2) +· · ·+xn.u(en)
En notant :
u(e1) = a11.f1+a21.f2+· · ·+ap1.fp ∈F u(e2) = a12.f1+a22.f2+· · ·+ap2.fp ∈F
...
u(en) = a1n.f1+a2n.f2+· · ·+apn.fp ∈F
on peut réécrire : y = (x1.a11+x2.a12+· · ·+xn.a1n).f1+ (x1.a21+x2.a22+· · ·+xn.a2n).f2+· · ·+ +· · ·+ (x1.ap1+x2.ap2+· · ·+xn.apn).fp
ou, de façon matricielle : Y =
a11 a12 · · · a1n
a21 a22 · · · a2n
... ... ...
ap1 ap2 · · · apn
| {z }
A
x1
x2
...
xn
| {z } X
=AX =⇒A=
u(e1) u(e2) · · · u(en)
La matriceA comporteplignes etncolonnes car elle correspond à une application linéaire de l’e.v.E de dimension nvers l’e.v.F de dimensionp(contre-intuitif !).
La matrice X comporte nlignes, car elle correspond à un vecteur xdeE, e.v. de dimensionn. La matrice Y faitp lignes, car elle correspond à un vecteury deF, e.v. de dimensionp.
• Intérêt : La donnée de Asuffit à caractériser complètement l’applicationu: y=u(x)⇐⇒Y =AX
• Composition :
Considérons deux applications linéaires uet v :
u: E → F
x 7→ u(x) =y et
v: F → G y 7→ v(y) =z Il est alors possible de définir l’application composée :
v◦u: E → G
x 7→ v◦u(x) =v{u(x)}=z
En notant Aet B les matrices représentant les applicationsuet v dans des bases adaptées (AdeBE dansBF, etB deBF dansBG), on en déduit :
u(x) =y⇐⇒AX=Y v(y) =z⇐⇒BY =Z
=⇒v{u(x)}=z⇐⇒BY =B(AX) =BAX=Z
La matrice BA est donc la représentation de l’application v◦u. Attention : la matrice AB n’existe pas forcément, de même que l’application u◦v. La composition, de même que la multiplication matricielle, n’est pas une opération commutative (en général).
• Remarque : Les coefficients à l’intérieur de la matriceAdépendent du choix des basesBE etBF. Lorsqu’on change de bases (soit au départ, soit à l’arrivée), les coefficients changent, de sorte que la matrice associée àuva différer.
En toute rigueur, il faudrait noterA≡ABE,BF. Pour déterminer la nouvelle expression de la matrice représentant ulors d’un changement de base, voir la partie 6.
Opérations sur les matrices
On note Mmn(R)l’ensemble des matrices de dimensionmlignes etncolonnes à coefficients réels.
SoitA∈ Mmn(R). On note :A=
a11 a12 · · · a1n
a21 a22 · · · a2n
... ... ...
am1 am2 · · · amn
= (aij)1≤i≤m,1≤j≤m
• Addition matricielle
– Définition : soient (A, B)∈ Mnp(R)× Mnp(R).
A+B=
a11 a12 · · · a1n a21 a22 · · · a2n
... ... ...
am1 am2 · · · amn
+
b11 b12 · · · b1n b21 b22 · · · b2n
... ... ...
bm1 bm2 · · · bmn
=
a11+b11 a12+b12 · · · a1n+b1n a21+b21 a22+b22 · · · a2n+b2n
... ... ...
am1+bm1 am2+bm2 · · · amn+bmn
– Remarque : les matricesAet B doivent être demême dimension. – Propriété : commutativité :A+B =B+A
• Multiplication externe
– Définition : soitA∈ Mnp(R)et λ∈R.
λA=λ.
a11 a12 · · · a1n
a21 a22 · · · a2n
... ... ...
am1 am2 · · · amn
=
λa11 λa12 · · · λa1n
λa21 λa22 · · · λa2n
... ... ...
λam1 λam2 · · · λamn
– Propriété : distributivité par rapport à l’addition :λ(A+B) =λA+λB
– Remarque : Muni des opérations addition et multiplication externe, on peut montrer queMnp(R)est espace vectoriel euclidien isomorphe àRnp, de dimensionn×p.
• Multiplication matricielle
– Définition : soient A∈ Mmn(R)et B∈ ×Mnp(R).
AB=
a11 a12 . . . . a1n
a21 a22 . . . . a2n
... ... ...
am1 am2 . . . . amn
b11 b12 · · · b1p b21 b22 · · · b2p
.. ..
.. ..
.. .. bn1 bn2 · · · bnp
=
c11 c12 · · · c1p c21 c22 · · · c2p
... ... ...
cm1 cm2 · · · cmp
avec :c22=a21b12+a22b22+· · ·+a2nbn2 En généralisant :cij=
n
P
k=1
aikbkj
– Remarque : le nombre de colonnes deAdoit être égal au nombre de lignes deB. Autrement dit, la multiplication AmnBpqn’a de sens que si n=p.
– Propriétés
∗ associativité :A(BC) = (AB)C
∗ en général, non-commutativité :AB6=BA
– Remarque : dans Mnn (espace des matrices carrées), lamatrice identité s’écrit :
Inn=
1 0 · · · 0 0 1 · · · 0 ... ... ...
0 0 · · · 1
Elle représente l’élément neutre deMnn pour la multiplication matricielle :∀A∈ Mnn, AInn=InnA=A.
• Matrice transposée
– Définition : Soit A∈ Mnp(R). On noteAT sa transposée.
A=
a11 a12 . . . . a1n a21 a22 . . . . a2n
.. ..
.. ..
.. .. ap1 ap2 · · · apn
=⇒ AT =
a11 a21 · · · ap1 a12 a22 · · · ap2
... ... ...
a1n a2n . . . . apn
∈ Mpn(R)
– Remarque : le nombre de colonnes et de lignes de AT est égal au nombre de lignes et de colonnes deA. – Propriétés :
∗ (AB)T =BTAT
∗ (A+B)T =AT +BT
• Produit scalaire
Soient x= (x1, x2,· · ·, xn)et y = (y1, y2,· · ·, yn) deux vecteurs deRn. SoitB = (e1, e2,· · · , cn)la base canonique orthonormale deRn.
On peut écrire xety sous la forme de vecteurs colonne : X=
x1 x2 ...
xn
B
∈ Mn1(R) ; Y =
y1 y2 ...
yn
B
∈ Mn1(R)
Le produit scalaire dansRn peut être reconstituté entre les éléments deMn1(R). Il s’écrit alors : (x|y) =x1y1+x2y2+· · ·+xnyn=XTY = x1 x2 · · · xn
B
y1
y2
...
yn
B
• Trace
– Définition : La trace d’une matrice carréeA= (aij)1≤i,j≤n est :T r(A) =
n
P
i=1
aii (somme éléments diagonaux) – Propriétés :T r(A+B) =T r(A) +T r(B) ; T r(λA) =λ.T r(A) ; T r(AT) =T r(A) ; T r(AB) =T r(BA)
6 Matrice de passage
Expression
SoitE unR-e.v. de dimension finien. SoientB= (e1, e2,· · ·, en)etB0= (e01, e02,· · · , e0n)deux bases de E. Soitx∈E. On peut décomposerxdansBou dansB0 :
x = x1e1+x2e2+· · ·+xnen
| {z }
dansB0
= x01e01+x02e02+· · ·+x0ne0n
| {z }
dansB0
Lesn-uplets(x1, x2,· · ·, xn)et (x01, x02,· · · , x0n)sont lescoordonnés du vecteurxdans les basesB etB0. Le vecteur x∈Epeut ainsi être associé à deux représentations matricielles, ouvecteurs colonnes :
X=
x1
x2
...
xn
B
et X0=
x01 x02 ...
x0n
B0
6=X
De la même manière, les vecteurs(e1, e2,· · ·, en)et(e01, e02,· · · , e0n)peuvent aussi être associés à des vecteurs colonnes.
Ainsi : EB010 =
1 0...
0
B0
;EB020 =
0 1...
0
B0
;· · ·; EB0n0 =
0 0...
1
B0
car
e01 = 1.e01+ 0.e02+· · ·+ 0.e0n e02 = 0.e01+ 1.e02+· · ·+ 0.e0n
...
e0n = 0.e01+ 0.e02+· · ·+ 1.e0n De même :
EB1 =
1 0...
0
B
;EB2 =
0 1...
0
B
;· · ·;EBn =
0 0...
1
B
car
e1 = 1.e1+ 0.e2+· · ·+ 0.en e2 = 0.e1+ 1.e2+· · ·+ 0.en
...
en = 0.e1+ 0.e2+· · ·+ 1.en
Pour relier X et X0 (c’est à dire passer des coordonnées dans une base aux coordonnées dans l’autre base), il faut décomposer chaque vecteur de la baseB0 sur la baseB :
e01 = p11e1+p21e2+· · ·+pn1en e02 = p12e1+p22e2+· · ·+pn2en
...
e0n = p1ne1+p2ne2+· · ·+pnnen
d’où : x = x01.(p11e1+p21e2+· · ·+pn1en) +x02.(p12e1+p22e2+· · ·+pn2en) +· · ·
· · ·+x0n.(p1ne1+p2ne2+· · ·+pnnen)
= (x01p11+x02p12+· · ·+x0np1n)e1+ (x01p21+x02p22+· · ·+x0np2n)e2+· · ·
· · ·+ (x01pn1+x02pn2+· · ·+x0npnn)en Par identification, on peut réécrire le vecteur colonnex:
X =
x1 x2 ...
xn
B
=
x01p11+x02p12+· · ·+x0np1n x01p21+x02p22+· · ·+x0np2n
...
x01pn1+x02pn2+· · ·+x0npnn
B
=x01
p11 p21 ...
pn1
B
+x02
p12 p22 ...
pn2
B
+· · ·+x0n
p1n p2n ...
pnn
B
On voit alors apparaître naturellement le produit de deux matrices :
X=
p11 p12 · · · p1n
p21 p22 · · · p2n
... ... ...
pn1 pn2 · · · pnn
| {z }
PBB0
x01 x02 ...
x0n
| {z } X0
=PBB0X0
La matrice PBB0 est appeléematrice de passage de la base B à la base B0. Ses colonnes contiennent les coordonnées des vecteurs de la baseB0 exprimés dans la baseB. En effet :
∀i∈[|1, n|], EB0i=p1iEB1 +p2iEB2+· · ·+pniEBn=p1i
1 0...
0
B
+p2i
0 1...
0
B
+· · ·+pni
0 0...
1
B
=
p1i
p2i
...
pni
D’où : B
PBB0 =
p11 p12 · · · p1n
p21 p22 · · · p2n
... ... ...
pn1 pn2 · · · pnn
=
E01B E02B · · · EB0n
Première approche de l’inverse d’une matrice
A l’inverse du cheminement précédent, la matrice PBB0 peut être considérée comme la représentation matricielle d’une application linéaire f de E dans E (on parle alors d’un endomorphisme). Puisque X et X0 sont tous les deux les représentations matricielle du même vecteurx∈E, on peut écrire :
X =PBB0X0⇐⇒x=f(x) (?)
Il devient alors évident que l’applicationfn’est rien d’autre que l’applicationidentité,idE:
idE: E → E x 7→ f(x) =x En reprenant le déroulement précédent, mais en choisissant d’exprimer X0 en fonction de X, nous aurions pu, de manière équivalente, déterminer l’expression de la matrice de passage de la baseB0 à la baseB.
Soituune application linéaire deE dansF. On noteAla représentation matricielle de udans deux basesBE :
X0 =PBB0X, avec :PBB0 =
p011 p012 · · · p01n p021 p022 · · · p02n
... ... ...
p0n1 p0n2 · · · p0nn
=
EB10 EB20 · · · EnB0
De même, la matricePBB0 est la représentation de l’application identitéidE.
A présent, multiplions l’expression ci-dessus, à gauche, par la matrice PBB0. Cela donne : PBB0X0=PBB0PBB0X(?)=X. De manière évidente, on aboutit à :PBB0PBB0 =Inn. On en déduit quePBB0 est lamatrice inversedePBB0 :PBB0−1=PBB0
Or, on l’a vu plus haut, la multiplication matricielle est équivalente à une composition des application sous-jacentes.
De même, puisque,idE◦idE =idE, on en déduit que idE =id−1E (application réciproque).
En résumé :
– la question de l’existence d’une matrice inverse est équivalente à la question de l’existence d’une application réciproque. On note A−1 l’inverse d’une matriceA.
– le raisonnement ci-dessus doit être réversible si l’on veut avoir PBB0PBB0 = PBB0PBB0 = Inn. Ceci n’est possible que si la dimension de l’espace de départ est égale à la dimension de l’espace d’arrivée. Autrement dit, seules les matrices carrées peuvent être inversibles.
– une matrice de passage est la représentation matricielle de l’application identité. L’ensemble des matrices de passage sont doncequivalentes, au sens où elles reflètent la même application sous-jacente.
Applications linéaires
• Endorphisme : soit u une application linéaire de E dans E. Soient deux bases B et B0 de E. Soient A et A0 les représentations matricielles deudansBetB0. Soientx∈E,yson image paru, etX,X0d’une part,Y,Y0d’autre part, les vecteurs colonnes associés dans les basesBet B0.
u: E → E
x 7→ u(x) =y ⇐⇒ Y =AX ⇐⇒ Y0=A0X0 SoientPBB0 etPBB0 les matrices de passage associées àBet B0. On peut alors écrire :
Y =PBB0Y0 X =PBB0X0
D’où : Y =AX ⇐⇒ PBB0Y0=APBB0X0
PBB0−1
×
⇐⇒
PBB0−1
PBB0
| {z } Inn
Y0=Y0= PBB0−1
APBB0
| {z } A0 =P−1AP
X0=A0X0
D’où : A0 = P−1AP. On dit que A et A0 sont des matrices semblables. Elles représentent la même application sous-jacente. Des matrices semblables ont la même trace, le même rang et le même déterminant.
• Morphisme
Considérons maintenant des e.v. de départ et d’arrivée de dimensions différentes.
Soituune application linéaire telle que :
u: E → F
x 7→ u(x) =y . E est un e.v. de dimension n,F un e.v. de dimensionp.
SoitP la matrice de passage de la base(ej)nj=1vers la base(e0j)nj=1. SoitQla matrice de passage de la base(fi)pi=1 vers la base(f0i)pi=1.
SoitAla matrice représentant u, exprimée depuis la base(ej)nj=1 deE vers la base(fi)ni=1 deF. SoitA0 la matrice représentantu, exprimée depuis la base(e0j)nj=1 deE vers la base(f0i)ni=1 deF.
Alors :A0=Q−1AP. On dit que les matrices sontéquivalentes. Deux matrices semblables sont équivalentes (réciproque fausse en général). Deux matrices sont équivalentes si et seulement si elles ont le même rang.
7 Inverse d’une matrice
Sous-espace vectoriel engendré
• Pré-requis : Soit Aune matrice carrée. Elle est associée à une appl. lin.u:E→F, avecdim(E) =dim(F) =n. On a vu que : Y =AX, avecA=
u(e1) u(e2) · · · u(en)
.
∀x∈E, X=
x1
x2 ...
xn
B
⇐⇒x=x1e1+x2e2+· · ·+xnen. Le vecteurxest donc une c.l. de(e1, e2,· · ·, en).
Y =AX⇐⇒y=u(x) =x1u(e1) +x2u(e2) +· · ·+xnu(en). Le vecteur y est une c.l. de(u(e1), u(e2),· · · , u(en))
• Théorème :Ainversible ⇐⇒ubijective ⇐⇒dim{Im(u)}=n
• Interprétation : La famille(u(e1), u(e2),· · ·, u(en))est génératriceF (sinondim{Im(u)}< n).
• Conséquences :
Ainversible ⇐⇒ les vecteurs(u(e1), u(e2),· · · , u(en))sont linéairement indépendants
⇐⇒ Im(u) =F
⇐⇒ dim{Im(u)}=rg(u) =rg(A) =n
⇐⇒ (u(e1), u(e2),· · · , u(en))forment une base de F
⇐⇒ (u(e1), u(e2),· · · , u(en))sont linéairement indépendants
⇐⇒ det{u(e1), u(e2),· · ·, u(en)} 6= 0
⇐⇒ det(A)6= 0
• Rang et échelonnement (matrices carrées) : Le calcul durang d’une matrice s’effectue en essayant d’échelonner la matrice en lui appliquant une série d’opérations élémentaires (permutation de lignes, addition de lignes, multipli- cation de ligne par un scalaire, voir partie 7). Si l’on y parvient, le rang de la matrice est égal à la dimension de la matrice. Sinon, le nombre de ligne nulles donne la dimension du noyau. Le théorème du rang permet d’en déduire le rang de la matrice, qui est alors égal à la différence entre le nombre total de lignes et le nombre de lignes nulles :
dimE=dim Ker(u) +dim Im(u) =dim Ker(u) +rg(A) (partie 4).
Déterminant
• Calcul
– Dimension 2 A=
a b c d
⇒det(A) =
a b c d
=ad−bc
– Dimension 3 A=
a11 a12 a13
a21 a22 a23
a31 a32 a33
⇒det(A) =
a11 a12 a13
a21 a22 a23
a31 a32 a33
=a11
a22 a23
a32 a33
+a21
a32 a33
a12 a13
+a31
a12 a13
a22 a23
– Dimension 4 (formule de Laplace, développement par la première colonne)
A=
a11 a12 a13 a14
a21 a22 a23 a24
a31 a32 a33 a34
a41 a42 a43 a44
⇒ det(A) = a11
a22 a23 a24
a32 a33 a34
a42 a43 a44
−a21
a12 a13 a14
a32 a33 a34
a42 a43 a44
+a31
a12 a13 a14
a22 a23 a24
a42 a43 a44
−a41
a12 a13 a14
a22 a23 a24
a32 a33 a34
– Dimension quelconque (formule de Laplace généralisée, développement par rapport à laj-ième colonne) det(A) =
n
X
i=0
aijCofij avec Cofij = (−1)i+jdet(Mij), où la matriceMij est égale à la matriceA, dans laquelle auraient été supprimées la lignei et la colonnej. Le terme “Cof” est appelé uncofacteur (voir ci-dessous, “Méthode des cofacteurs”).
• Propriétés : – det(I) = 1
– det(AB) =det(A)×det(B)
– Lorsque Aest inversible,A−1A=AA−1=I etdet(A)6= 0. Alors :det(A−1) = 1 det(A) – ∀λ∈R,∀A∈ Mnn(R), det(λA) =λndet(A)
– ∀λ∈R, det(A1,· · ·, λAj,· · ·, An) =λdet(A).
– det(A1,· · ·, A0j+A00j,· · ·, An) =det(A1,· · ·, A0j,· · ·, An) +det(A1,· · ·, A00j,· · · , An). Existence de l’inverse
Considérons le système :
2x + 4y − 2z = 2 4x + 9y − 3z = 8
−2x − 3y + 7z = 10
⇐⇒AX=B avecA=
2 4 −2
4 9 −3
−2 −3 7
; X=
x y z
; B=
2 8 10
InterprétonsAcomme la matrice d’une application linéaireu. Pour simplifier, disons qu’il s’agit d’un endomorphisme deR3 (i.e. une application linéaire deR3 dansR3). Supposons, de plus, queA est exprimée dans une même base deR3 au départ comme à l’arrivée. On la noteB.X est alors le vecteur colonne contenant les coordonnées d’un pointxdeR3, exprimé dansB. Le produitAX=B représente donc l’image ydexparu:AX=B⇐⇒u(x) =y.
Résoudre ce système consiste à déterminer l’inconnue x. Dans ces conditions, le système admet une solution si y ∈Im(u), c’est à dire si y admet un antécédent paru. Une telle situation est garantie, quel que soit y, dès lors que Im(u) =R3, c’est à dire sidim{Im(u)}=rg(u) =rg(A) = 3. Le calcul du rang deApermet donc de vérifier l’existence de cette solution. Dans le cas de cette matricecarrée, si le rang est égal à la dimension de la matrice, alors cela signifie que les vecteurs issus des colonnes de la matrice sont linéairement indépendants. Ceci se vérifie simplement en calculant le déterminant.
Si l’inverse de Aexiste (∃A−1), cela signifie que le système est inversible. On peut alors écrire : AX=BA
−1×
=⇒ A−1AX=X =A−1B Il est à noter que ce raisonnement ne dépend pas deB (ouy).
Calcul pratique
• Opérations élémentaires sur les lignes : Trois opérations importantes sur les lignes peuvent être effectuées sur les matrices : la permutation, l’addition et la multiplication. Ces matrices sont décrites ci-dessous, en dimension 3 par commodité. La multiplication par ces matrices élémentaires ne modifie pas le déterminant de la matrice ainsi transformée. Ces opérations s’effectuent, par convention, en multipliantà gauche par des matrices particulières.
Considérons une matrice :A=
a11 a12 a13 a21 a22 a23
a31 a32 a33
– Permutation
P1=
1 0 0 0 0 1 0 1 0
=⇒P1A=
1 0 0 0 0 1 0 1 0
a11 a12 a13
a21 a22 a23
a31 a32 a33
=
a11 a12 a13
a31 a32 a33
a21 a22 a23
6=A
– Addition
P2=
1 1 0 0 1 0 0 0 1
=⇒P2A=
1 1 0 0 1 0 0 0 1
a11 a12 a13 a21 a22 a23 a31 a32 a33
=
a11+a21 a12+a22 a13+a23 a21 a22 a23 a31 a32 a33
– Multiplication (λ6= 0)
P3=
λ 0 0 0 1 0 0 0 1
=⇒P3A=
λ 0 0 0 1 0 0 0 1
a11 a12 a13 a21 a22 a23 a31 a32 a33
=
λa11 λa12 λa13 a21 a22 a23 a31 a32 a33
– Combinaison de plusieurs opérations : il suffit de multiplier successivement (à gauche) par les matrices élé- mentaires appropriées :
P =P2P3P1=
λ 0 1 0 0 1 0 1 0
=⇒P A=
λ(a11+a31) λ(a12+a32) λ(a13+a33)
a31 a32 a33
a21 a22 a23
• Pivot de Gauss
On procède par multiplication, à gauche, par des matrices élémentaires, dans le but d’échelonner la matrice A, puis de substituer les lignes, afin d’aboutir à la matrice identité. On opère de la même manière avec la matriceB.
A B
Echelonnement et substitutions
−−−−−−−−−−−−−−−−−−−−−−−−−→
P×
I X
Si on repart deAX=B P×
=⇒ P AX =P B. Or,P A=I, d’oùP =A−1. On en déduit :X =P B=A−1B.
Remarque : si, à une étape, une ligne de zéros apparaît, cela signifie que la matrice n’est pas inversible (son rang est inférieur à sa dimension). On dit que la matrice estsingulière.
• Méthode de Gauss-Jordan
La méthode consiste à remplacer B par la matrice identité, et à suivre la même procédure. Le but est de pouvoir exprimer directementP, qui n’est autre queA−1 :
A I
Echelonnement et substitutions
−−−−−−−−−−−−−−−−−−−−−−−−−→
P×
I P
• Méthode de Cramer
De manière équivalente, on peut écrire un système linéaire d’équations sous une forme matricielle :
a11x1+a12x2+...+a1nxn = b1 a21x1+a22x2+...+a2nxn = b2
...
an1x1+an2x2+...+annxn = bn
⇐⇒
a11 a12 · · · a1n
a21 a22 · · · a2n
... ... ...
an1 an2 · · · ann
x1
x2 ...
xn
=
b1
b2 ...
bn
⇐⇒AX=B
X est l’inconnue du système. Lorsque det(A)6= 0, le système admet une et une seule solution pourX. Celle-ci est donnée par la formule :xk =det(Ak)
det(A) , où la matriceAk est formée en remplaçant lak-ième colonne deApar le vecteur colonneb, i.e. Ak= (ak|i,j)avecak|i,j=
aij si j6=k bj si j=k
• Méthode des cofacteurs
A−1= 1
det(A)com(A)T = 1 det(A)
C11 C21 · · · Cn1 C12 ... Cn2
... ... ...
C1n · · · Cnn
oùcom(A)la matrice des cofacteursCij (comatrice) :
com(A) = (Cij)1≤n,j≤n avecCij= (−1)i+jdet
a11 · · · a1,j−1 a1,j+1 · · · a1n
... ... ... ...
ai−1,1 · · · ai−1,,j−1 ai−1,,j+1 · · · ai−1,n ai+1,1 · · · ai+1,,j−1 ai+1,,j+1 · · · ai+1,n
... ... ... ...
an1 · · · an,j−1 an,j+1 · · · ann
(déterminant de la matrice après suppressionième ligne etjème colonne)
8 Projection orthogonale
• Projection orthogonale à deux dimensions
– Définition : pourx∈EetD ladroite vectorielle engendrée parx, i.e.D={λx|λ∈R}, la projection dey∈E orthogonalement àD, notéeΠD(y), est caractérisée par les deux propriétés suivantes :
(i)ΠD(y)∈D, i.e.ΠD(y)est colinéaire àx; (ii)y−ΠD(y)est orthogonal )x. – Expression : (i) vectorielle :ΠD(y) = < x|y >
||x||2 x ; (ii) matricielle (où−→a .−→
b ≡aTb) :ΠD(y) = xxT xTxy – Théorème : Soitx∈E non nul ety∈E. La projection orthogonale dey sur la droiteD engendrée parxest
l’unique vecteurz colinéaire àxréalisant le minimum de||y−z||, i.e. :ΠD(y) = arg min
z∈D||y−z||
• Projection orthogonale à trois dimensions
SoitP un plan deR3 engendré par(a1, a2), i.e.A=
a11 a21
a12 a22
a13 a23
. Soitb un vecteur deR3 ∈ P. L’expression dep, projeté orthogonale deb surP, est donnée par :p=P b, avecP =A(ATA)−1AT.
• Projection orthogonale en dimension quelconque
– Définition : Soit F un s.e.v. de E (e.v. euclidien). On appelle projection orthogonale sur F, notée pF la projection vectorielle surF parallèlement àF⊥.
– Soit A une matrice de taille m×n et soit y ∈ Rm. Si la matrice ATA est inversible, alors la projection orthogonale de ysur le sous-espace deRmengendré par les colonnes deA est :A(ATA)−1ATy .
– On note P la matrice de projection orthogonale, i.e. P = A(ATA)−1AT. P est carrée, de taille m×m, symétrique (P=PT) et idempotente (P2=P). Siy appartient au s.e.v. de Rm engendré par les colonnes de A, alorsP y=y. Siy est orthogonal à ce s.e.v., alorsP y= 0.
– Cas particulier : Soit(e1,· · ·, ep)une b.o.n. deF. Alors,∀x∈E, puisquex=x1+x2avecx1∈F etx2∈F⊥, on a :pF(x) =x1=
p
P
i=1
(x|ei).ei. Les coordonnées dexsont obtenues par projection orthogonale sur les vecteurs de la base.
• Moindres carrés
– Définition : SoitGune matrice de taillem×ntelle queGTGsoit inversible, etd∈Rm. On appellesolution au sens des moindres carrés de l’équation d=Gml’unique vecteur mˆ ∈Rn réalisant le minimum de||d−Gm||, i.e.mˆ = arg min
m∈Rn
||d−Gm||. La recherche demˆ sachantGet dconstitue unproblème inverse.
– Théorème : la solution des moindres carrés est : mˆ = (GTG)−1GTd. C’est celle qui minimisela norme 2 de l’erreur e=d−dˆentre la prédictiondˆ=Gmˆ et l’observationd.