2 Produit scalaire

(1)

L’essentiel du Cours d’Algèbre

1 Espaces vectoriels

Définition: on appelle espace vectoriel (e.v) sur un corpsK(RouC) un ensembleE muni de deux lois :

• une loi interne, notée “+”, telle que(E,+)est un groupe commutatif (voir Annexe).

• une loi externe, notée “.”, définie deK×E dansEtelle que : – ∀(λ, µ)∈K²,∀u∈E,(λ+µ).u=λ.u+µ.u

– ∀λ∈K,∀(u, v)∈E×E, λ.(u+v) =λ.u+λ.v – ∀(λ, µ)∈K²,∀u∈E,(λ.µ).u=λ.(µ.u)

– ∀u∈E,1_K.u=u (1_K, élément neutre deKpour le produit, est aussi neutre pour “.”).

Les éléments d’un e.v. sont appelés des vecteurs. Un espace vectoriel peut être de dimension finie ou infinie.

Propriétés élémentaires – ∀u∈E,0_K.u= 0E

– ∀λ∈K,λ.0E= 0E

– ∀(λ, u)∈K×E,λ.u= 0_E⇒λ= 0_Kouu= 0_E – ∀(λ, x, y)∈K^∗E×E,λ.x=λ.y⇒x=y – ∀(λ, µ)∈K²,∀x∈E\ {0_E},λ.x=µ.x⇒λ=µ – ∀λ∈K,∀x∈E,λ.(−x) =−(λ.x) = (−λ).x Sous-espace vectoriel

• Famille d’éléments d’un e.v. : n étant un entier non nul quelconque, on appelle famille finie à nd’éléments deE, et on note(u1, . . . , un)unn-uplet d’éléments deE (les ui ne sont pas forcément distincts).

• Combinaison linéaire (c.l.) : Soit(u₁, . . . , u_n)une famille finie d’éléments deE, on appelle combinaison linéaire des ui tout vecteurudeE de la forme : Pⁿ

i=1

αiui, où lesαi sont desscalaires.

• Sous-espace vectoriel (s.e.v) : on appelle sous-espace vectoriel de E toute partie A non vide deE, stable par les deux opérations “+” et “.”, et qui, munie des lois induites, est encore un K–e.v..

• Théorème : SoitAune partie non vide deE. Aest un s.e.v. deE ⇐⇒ Aeststable par c.l..

• Sous-espace vectoriel engendré

– Définition : soitP une partie quelconque deE. On appelle s.e.v. engendré parP l’intersection de tous les s.e.v deE contenantP. C’est aussi l’ensemble de toutes les combinaisons linéaires (finies) d’éléments deP. On le noteV ect(P)et pour la relation⊂c’est le plus petit s.e.v. de E contenantP.

– Théorème : l’intersection d’une famille quelconque de s.e.v. de E est un s.e.v. deE.

• Somme

– Définition : Soient F et Gdeux s.e.v. deE. On noteF+Gl’ensemble des éléments z de E tels que ∃x∈F et ∃y∈Gavecz=x+y.F+Gest aussi un s.e.v. deE.

– Théorème :dim(F+G) =dimF+dimG−dim(F∩G).

• Somme directe

– Définition : Soient F etGdeux s.e.v. deE. On dit queF et Gsontsupplémentaires, et on noteE =F⊕G, si tout vecteur deE se décompose de façon unique en la somme d’un vecteur deF et d’un vecteur deG – Théorème :E=F⊕G⇐⇒E=F+GetF∩G={0E}.

Espace vectoriel E de dimension finie n

• Famille génératrice deE : il s’agit d’une famille deE telle queE =V ect({x₁,· · ·, x_n}). On dit qu’unK–e.v. est de dimension finie s’il admet une famille génératrice finie. Toute famille génératrice de E a au moinsnéléments.

• Famille libre : il s’agit d’une famille dont les éléments sont linéairement indépendants. Aucun élément n’est c.l. des autres. C’est aussi une famille d’éléments telle que la seule c.l. nulle est la combinaison linéaire à coefficients tous

Raphaël Grandin – IPGP – [email protected] Version du17 janvier 2021

(2)

nuls. Dans un e.v. de dimension finie, une famille libre ne peut avoir plus d’éléments qu’une famille génératrice.

Toute famille libre de E a au plusnéléments.

• Base : il s’agit d’une famille libre et génératrice. Tout e.v. de dimension finie admet une base. Toutes les bases ont le même nombre d’éléments, égal àn, la dimension deE. Toute famille génératrice ànéléments est une base. Toute famille libre à néléments est une base. Toute famille génératrice de E contient une base. Tout famille libre deE peut-être complétée en une base. Dans ce cours, nous considérerons le plus souvent possible desbases orthonormées. La notion de base orthonormale nécessite de disposer d’un produit scalaire (voir partie 2). Labase canonique d’un e.v. est la base la plus “naturelle” (par exemple{(1,0); (0,1)}dansR²). On la choisit généralementorthonorméeet directe (règle de la main droite dansR³).

• Sous-espace vectoriel : SiF est un s.e.v. deE, alorsdimF ≤dimE.

• Théorèmes : Soit E un e.v. avecdimE=n. SoitΩ ={x1,· · ·, xm)une famille denvecteurs deE. – Ωfamille libre=⇒CardΩ≤n

– Ωfamille génératrice=⇒CardΩ≥n – Ωbase⇐⇒

CardΩ =n

Ωfamille libre ⇐⇒

CardΩ =n

Ωfamille génératrice

2 Produit scalaire

Espace vectoriel euclidien

• Définition : SoitEun e.v. réel muni d’un produit scalaire et de dimension finie. On dit queEest un e.v.euclidien.

• Produit scalaire : Soit E un e.v. surR. On appelle produit scalaire surRtoute formeΦdeE×E dansR: – bilinéaire : les applications

Φx: E →R

y 7→Φx(y) = Φ(x, y) et

Φy: E→R

x7→Φy(x) = Φ(x, y) sont linéaires.

– symétrique : ∀(x, y)∈E²,Φ(x, y) = Φ(y, x)

– définie positive :∀x∈E,Φ(x, x)≥0 et Φ(x, x) = 0⇒x= 0_E On le note(x|y),< x, y >, ou encore~u.~v (ne pas confondre avec le signe “.” utilisé pour la loi de composition externe).

• Norme :∀x∈E la norme dexest définie par :||x||=p (x|x).

• Distance euclidienne :∀(x, y)∈E la distance euclidienne entrexet y est définie par :d(x, y) =||x−y||.

• Propriétés

– ||x||= 0⇒x= 0E

– ||λ.x||=|λ| ||x||

– d(x, y) = 0⇒x=y

– d(x, y) =d(y, x) =||x−y||=||y−x||

– ∀(x, y)∈E² et∀(α, β)∈R²,||αx+βy||²=α²||x||²+ 2αβ(x|y) +β²||y||² – ∀(x, y)∈E²,|(x|y)| ≤ ||x|| ||y|| (inégalité de Cauchy-Schwarz)

– ∀(x, y)∈E²,||x+y|| ≤ ||x||+||y|| (inégalité triangulaire)

– ∀(x, y)∈E²,||x+y||²+||x−y||²= 2(||x||²+||y||²) (identité du parallélogramme) – ∀(x, y)∈E²,||x+y||²− ||x−y||²= 4|(x|y)| (identité de polarisation)

Orthogonalité

• Définition : Soient(x, y)∈E²,Eun e.v. euclidien muni du produit scalaire “|”. On dit quexety sont orthogonaux si(x|y) = 0.

• Entre e.v. :

– Définition : SoientF etGdeux s.e.v. deE. On dit queF etGsont orthogonaux si∀(x, y)∈F×G,(x|y) = 0. On appelle orthogonale deF, notéeF^⊥, l’ensemble défini par :F^⊥={x∈E /∀y∈F, (x|y) = 0}

– Propriétés :F⊕F^⊥=E ; (F^⊥)^⊥=F ; F⊂G⇒G^⊥⊂F^⊥

• Entre familles :

– Soit (e1,· · ·, en) une famille de vecteurs de E. On dit que cette famille estorthogonale si∀(i, j) ∈[|1, p|]× [|1, p|], (ei, ej) = 0pouri6=j.

– Soit un vecteure∈E\ {0E}. On dit queeestunitaire si||e||= 1.

– Une famille estorthonormale si elle est orthogonale et si ses vecteurs sont unitaires.

(3)

– Si la famille(e₁,· · ·, e_n)est orthogonale, alors||e₁+· · ·+e_n||²=||e₁||²+· · ·+||e_n||² (théorème de Pythagore) – Conséquence : Une famille orthogonale de vecteurs non nuls est libre.

– Corollaire : Une famille orthonormale de vecteurs est libre.

– Si dimE=n, toute famille orthonormale denvecteurs est une base.

– Théorèmes : Soit(e1,· · · , en)unebase orthonormale(b.o.n.) deE. Soitx=

n

P

i=1

xieiet soity=

n

P

i=1

yiei. Alors,

∀i∈[|1, n|] :x_i= (x|e_i) ; ||x||²=

n

P

i=1

x²_i ; (x|y) =

n

P

i=1

x_iy_i ; d(x, y) =||x−y||= s n

P

i=1

(x_i−y_i)²

• Projection orthogonale

– Equation d’une droite : en 2D,ax+by+c= 0, devecteur normal (a,b) ; en 3D,ax+by+cz+d= 0de vecteur normal (a,b,c) ; etc...

– Définition : soit (d)une droite et P un point hors de (d). On appelle projection orthogonale de P sur (d)le pointP⁰ dedtel que :P P⁰⊥(d).

– Distance : ladistance du pointP à la droite(d)est notéeδ{P; (d)}. Elle est égale à la norme du vecteur−−→

P P⁰, oùP⁰ est la projection orthogonale deP sur(d).

– Théorème : la distance du point P de coordonnées (x_P;y_P) à la droite (d) d’équation ax+by+c = 0 est donnée par : δ{P; (d)}=|axP+byP+c|

√a²+b²

Produit scalaire hermitien (dans C≡R²)

• Forme algébrique :z=a+ibaveca=Re(z)etb=Im(z).zest l’affixede−−→

OM (ou deM) dans leplan complexe.

• Conjugué : ¯z=a−ib ; Re(z) =¹₂(z+ ¯z) ; Im(z) =_2i¹(z−z)¯

• Module :|z|=||−−→

OM||=√

a²+b² =p−−→

OM .−−→

OM

• Produit scalaire (dans C)

– Produit scalaire hermitien (surC) :(z|z⁰) =z∗z⁰ ∈C

– Norme hermitienne :(z|z) =z∗z=|z|² (s’identifie à la norme euclidienne dansR²) – Conséquences : 1

z = z

|z|² = a−ib

a²+b²;|zz⁰| ≤ |z||z⁰|(Cauchy-Schwarz) ;|z+z⁰| ≤ |z|+|z⁰|(inégalité triangulaire)

3 Géométrie dans l’espace ( R

³

)

Produit scalaire Soient ~u = u1

u2

u3

! et ~v =

v1

v2

v3

!

deux vecteurs deR³ exprimés dans une base orthonormale. Le produit scalaire s’écrit~u.~v=u₁v₁+u₂v₂+u₃v₃∈R.

Produit vectoriel

• Définition Le produit vectoriel s’écrit~u ∧ ~v=

u2v3−u3v2

u3v1−u1v3

u1v2−u2v1

!

∈R³

• Conséquences (~u ∧ ~v)⊥~u ; (~u ∧ ~v)⊥~v ; ~u // ~v⇐⇒(~u ∧ ~v) =~0 ; Le trièdre(~u;~v;w~ =~u ∧ ~v)est direct (règle de la main droite). ; ||~u ∧ ~v||=||~u||.||~v||.|sin(d~u, ~v) ; ||~u ∧ ~v||=aire du parallélogramme.

• Propriétés

– Anti-symétrie :~u ∧ ~v=−~v ∧ ~u

– Bilinéarité : Soientλ∈Ret (~u, ~v, ~w)∈R³×R³×R³.







(λ~u) ∧ ~v=λ(~u ∧ ~v) =~u ∧ (λ~v) (~u+~v) ∧ w~ = (~u ∧ w) + (~~ v ∧ w)~

~

u ∧ (~v+w) = (~~ u ∧ ~v) + (~u ∧ w)~ Double produit vectoriel

• En général,~u ∧ (~v ∧ w)~ 6= (~u ∧ ~v) ∧ w~

• En fait,(~u ∧ ~v) ∧ w~ =−(~v. ~w).~u+ (~u. ~w).~v Produit mixte

• Définition :(~u, ~v, ~w) = (~u ∧ ~v). ~w∈R

• Interprétation : volume du parallélépipède engendré par{~u, ~v, ~w}.

(4)

• Permutation circulaire : (~u, ~v, ~w) = (w, ~~ u, ~v) = (~v, ~w, ~u)

• Permutation non-circulaire :(~u, ~v, ~w) =−(~v, ~u, ~w) =−(~u, ~w, ~v) =−(~w, ~v, ~u)

• Propriétés

– (~u, ~v, ~w) =det





u₁ v₁ w₁ u₂ v₂ w₂ u₃ v₃ w₃



=u₁

v₂ w₂ v₃ w₃

+u₂

v₃ w₃ v₁ w₁

+u₃

v₁ w₁ v₂ w₂

(dévpt selon 1ère colonne).

– ~u,~v etw~ coplanaires ⇐⇒det(~u, ~v, ~w)≡det(U, V, W) = 0 (en notant~u, ~v, ~wsous la forme de vecteurs colonnes)

– On admettra que cette notion (nullité du déterminant ⇐⇒dépendance linéaire) peut être extrapolée àRⁿ.

4 Applications linéaires

Généralités sur les applications

• Définition : la donnée d’une application d’un ensembleEdans un autre ensembleFest la donnée d’un sous-ensemble G deE×F tel que, ∀x∈E, ∃!y ∈F /(x, y)∈G. En clair : une application est une fonction deE dansF. Un élément de l’ensemble de départ ne peut être associé qu’à un unique élement dans l’ensemble d’arrivée (aucun élément deE ne pointe vers plusieurs éléments deF).

• Composition∀x∈E,(g◦f)(x) =g(f(x)). La loi “◦” est associative mais non commutative (a priori).

• Injectivité, surjectivité, bijectivité : : Soit f une application deE dansF.

– On dit que f est injective si tout élément deF a au plus un antécédent ⇐⇒ ∀(x, x⁰)∈E², f(x) =f(x⁰)⇒ x=x⁰

– On dit quef est surjective si tout élément deF a au moins un antécédent⇐⇒ ∀y∈F,∃x∈E / f(x) =y – On dit quef est bijective deEsurF si f est à la fois injective et surjective⇐⇒tout élément deF a un unique

antécédent⇐⇒ ∀y∈F, ∃!x∈E / f(x) =y

• Théorème : f est une bijection de E sur F ssi il existe une fonction g de F dans E telle que g◦f = Id_E et f ◦g=Id_F. On note alorsg=f⁻¹.

Applications linéaires

• Définition : SoientE et F deuxR-e.v. de dimension finie. SoientBE et BF deux bases deE et F. L’applicationudeE dansF estlinéaire si∀(x, y)∈E×E,∀(a, b)∈R², u(ax+by)=^L a.u(x) +b.u(y).

• Conséquence :u(0E) = 0F

Image et noyau

– Image : Im(u) ={y∈F /∃x∈E / u(x) =y} ⊂F – Noyau :Ker(u) ={x∈E / u(x) = 0_F} ⊂E – Rang : rg(u) =dim Im(u)

Théorèmes

– Im(u)est un s.e.v deF – Ker(u)est un s.e.v deE

– uinjective⇐⇒u(BE)libre⇐⇒rg u=dimE ⇐⇒Ker(u) ={0E} – usurjective⇐⇒u(BE)génératrice ⇐⇒rg u=dimF ⇐⇒ Im(u) =F – ubijective⇐⇒u(B_E)base deF ⇐⇒ rg u=dimE =dimF

– Théorème du rang : soituun app. lin. deE surF. On a :dimE=dim Ker(u) +dim Im(u)

5 Représentation matricielle des applications linéaires

Définition

Soient E etF deuxR-e.v. de dimension finiesnet p, respectivement.

• Décomposition : SoientB_E= (e¹, e²,· · ·, eⁿ)et B_F = (f¹, f²,· · ·, fⁿ)des bases deE etF, respectivement.

∀x∈E, la décomposition sur BE est unique :x=x1.e¹+x2.e²+· · ·+xn.eⁿ

∀y∈F, la décomposition sur BF est unique :y=y1.f¹+y2.f²+· · ·+yn.f^p

(5)

• Image d’un vecteur par une application linéaire : Soituune application linéaire deEdansF. Soity∈Im(u). Alors,∃x∈E tel que :

y = u(x)

= u(x₁.e¹+x₂.e²+· · ·+x_n.eⁿ)

=L x1.u(e¹) +x2.u(e²) +· · ·+xn.u(eⁿ)

En notant :











u(e¹) = a₁₁.f¹+a₂₁.f²+· · ·+a_p1.f^p ∈F u(e²) = a₁₂.f¹+a₂₂.f²+· · ·+a_p2.f^p ∈F

...

u(eⁿ) = a1n.f¹+a2n.f²+· · ·+apn.f^p ∈F

on peut réécrire : y = (x₁.a₁₁+x₂.a₁₂+· · ·+x_n.a_1n).f¹+ (x₁.a₂₁+x₂.a₂₂+· · ·+x_n.a_2n).f²+· · ·+ +· · ·+ (x₁.a_p1+x₂.a_p2+· · ·+x_n.a_pn).f^p

ou, de façon matricielle : Y =







a11 a12 · · · a1n

a21 a22 · · · a2n

... ... ...

a_p1 a_p2 · · · a_pn







| {z }

A





 x1

x2

...

x_n







| {z } X

=AX =⇒A=



 u(e¹) u(e²) · · · u(eⁿ)





La matriceA comporteplignes etncolonnes car elle correspond à une application linéaire de l’e.v.E de dimension nvers l’e.v.F de dimensionp(contre-intuitif !).

La matrice X comporte nlignes, car elle correspond à un vecteur xdeE, e.v. de dimensionn. La matrice Y faitp lignes, car elle correspond à un vecteury deF, e.v. de dimensionp.

• Intérêt : La donnée de Asuffit à caractériser complètement l’applicationu: y=u(x)⇐⇒Y =AX

• Composition :

Considérons deux applications linéaires uet v :

u: E → F

x 7→ u(x) =y et

v: F → G y 7→ v(y) =z Il est alors possible de définir l’application composée :

v◦u: E → G

x 7→ v◦u(x) =v{u(x)}=z

En notant Aet B les matrices représentant les applicationsuet v dans des bases adaptées (AdeBE dansBF, etB deBF dansBG), on en déduit :

u(x) =y⇐⇒AX=Y v(y) =z⇐⇒BY =Z

=⇒v{u(x)}=z⇐⇒BY =B(AX) =BAX=Z

La matrice BA est donc la représentation de l’application v◦u. Attention : la matrice AB n’existe pas forcément, de même que l’application u◦v. La composition, de même que la multiplication matricielle, n’est pas une opération commutative (en général).

• Remarque : Les coefficients à l’intérieur de la matriceAdépendent du choix des basesB_E etB_F. Lorsqu’on change de bases (soit au départ, soit à l’arrivée), les coefficients changent, de sorte que la matrice associée àuva différer.

En toute rigueur, il faudrait noterA≡A_B_E_,B_F. Pour déterminer la nouvelle expression de la matrice représentant ulors d’un changement de base, voir la partie 6.

Opérations sur les matrices

On note Mmn(R)l’ensemble des matrices de dimensionmlignes etncolonnes à coefficients réels.

SoitA∈ Mmn(R). On note :A=







a11 a12 · · · a1n

a21 a22 · · · a2n

... ... ...

am1 am2 · · · amn







= (aij)1≤i≤m,1≤j≤m

• Addition matricielle

– Définition : soient (A, B)∈ Mnp(R)× Mnp(R).

A+B=







a₁₁ a₁₂ · · · a_1n a₂₁ a₂₂ · · · a_2n

... ... ...

a_m1 a_m2 · · · a_mn





 +







b₁₁ b₁₂ · · · b_1n b₂₁ b₂₂ · · · b_2n

... ... ...

b_m1 b_m2 · · · b_mn







=







a₁₁+b₁₁ a₁₂+b₁₂ · · · a_1n+b_1n a₂₁+b₂₁ a₂₂+b₂₂ · · · a_2n+b_2n

... ... ...

a_m1+b_m1 a_m2+b_m2 · · · a_mn+b_mn







(6)

– Remarque : les matricesAet B doivent être demême dimension. – Propriété : commutativité :A+B =B+A

• Multiplication externe

– Définition : soitA∈ Mnp(R)et λ∈R.

λA=λ.







a11 a12 · · · a1n

a21 a22 · · · a2n

... ... ...

a_m1 a_m2 · · · a_mn







=







λa11 λa12 · · · λa1n

λa21 λa22 · · · λa2n

... ... ...

λa_m1 λa_m2 · · · λa_mn





 – Propriété : distributivité par rapport à l’addition :λ(A+B) =λA+λB

– Remarque : Muni des opérations addition et multiplication externe, on peut montrer queMnp(R)est espace vectoriel euclidien isomorphe àR^np, de dimensionn×p.

• Multiplication matricielle

– Définition : soient A∈ Mmn(R)et B∈ ×Mnp(R).

AB=







a11 a12 . . . . a1n

a21 a22 . . . . a2n

... ... ...

am1 am2 . . . . amn













b₁₁ b₁₂ · · · b_1p b₂₁ b₂₂ · · · b_2p

.. ..

.. .. bn1 bn2 · · · bnp







=







c₁₁ c₁₂ · · · c_1p c21 c22 · · · c2p

... ... ...

cm1 cm2 · · · cmp







avec :c₂₂=a₂₁b₁₂+a₂₂b₂₂+· · ·+a_2nb_n2 En généralisant :c_ij=

n

P

k=1

a_ikb_kj

– Remarque : le nombre de colonnes deAdoit être égal au nombre de lignes deB. Autrement dit, la multiplication AmnBpqn’a de sens que si n=p.

– Propriétés

∗ associativité :A(BC) = (AB)C

∗ en général, non-commutativité :AB6=BA

– Remarque : dans Mnn (espace des matrices carrées), lamatrice identité s’écrit :

Inn=







1 0 · · · 0 0 1 · · · 0 ... ... ...

0 0 · · · 1







Elle représente l’élément neutre deMnn pour la multiplication matricielle :∀A∈ Mnn, AInn=InnA=A.

• Matrice transposée

– Définition : Soit A∈ Mnp(R). On noteA^T sa transposée.

A=







a₁₁ a₁₂ . . . . a_1n a₂₁ a₂₂ . . . . a_2n

.. ..

.. .. ap1 ap2 · · · apn







=⇒ A^T =







a₁₁ a₂₁ · · · a_p1 a₁₂ a₂₂ · · · a_p2

... ... ...

a1n a2n . . . . apn







∈ M_pn(R)

– Remarque : le nombre de colonnes et de lignes de A^T est égal au nombre de lignes et de colonnes deA. – Propriétés :

∗ (AB)^T =B^TA^T

∗ (A+B)^T =A^T +B^T

• Produit scalaire

Soient x= (x₁, x₂,· · ·, x_n)et y = (y₁, y₂,· · ·, y_n) deux vecteurs deRⁿ. SoitB = (e¹, e²,· · · , cⁿ)la base canonique orthonormale deRⁿ.

On peut écrire xety sous la forme de vecteurs colonne : X=





 x₁ x₂ ...

xn







B

∈ Mn1(R) ; Y =





 y₁ y₂ ...

yn







B

∈ Mn1(R)

(7)

Le produit scalaire dansRⁿ peut être reconstituté entre les éléments deM_n1(R). Il s’écrit alors : (x|y) =x1y1+x2y2+· · ·+xnyn=X^TY = x₁ x₂ · · · x_n

B





 y1

y2

...

y_n







B

• Trace

– Définition : La trace d’une matrice carréeA= (aij)_1≤i,j≤n est :T r(A) =

n

P

i=1

aii (somme éléments diagonaux) – Propriétés :T r(A+B) =T r(A) +T r(B) ; T r(λA) =λ.T r(A) ; T r(A^T) =T r(A) ; T r(AB) =T r(BA)

6 Matrice de passage

Expression

SoitE unR-e.v. de dimension finien. SoientB= (e¹, e²,· · ·, eⁿ)etB⁰= (e⁰¹, e⁰²,· · · , e⁰ⁿ)deux bases de E. Soitx∈E. On peut décomposerxdansBou dansB⁰ :

x = x₁e¹+x₂e²+· · ·+x_neⁿ

| {z }

dansB⁰

= x⁰₁e⁰¹+x⁰₂e⁰²+· · ·+x⁰_ne⁰ⁿ

| {z }

dansB⁰

Lesn-uplets(x₁, x₂,· · ·, x_n)et (x⁰₁, x⁰₂,· · · , x⁰_n)sont lescoordonnés du vecteurxdans les basesB etB⁰. Le vecteur x∈Epeut ainsi être associé à deux représentations matricielles, ouvecteurs colonnes :

X=





 x1

x2

...

xn







B

et X⁰=





 x⁰₁ x⁰₂ ...

x⁰_n







B⁰

6=X

De la même manière, les vecteurs(e¹, e²,· · ·, eⁿ)et(e⁰¹, e⁰²,· · · , e⁰ⁿ)peuvent aussi être associés à des vecteurs colonnes.

Ainsi : E_B⁰¹0 =





 1 0...

0







B⁰

;E_B⁰²0 =





 0 1...

0







B⁰

;· · ·; E_B⁰ⁿ0 =





 0 0...

1







B⁰

car











e⁰¹ = 1.e⁰¹+ 0.e⁰²+· · ·+ 0.e⁰ⁿ e⁰² = 0.e⁰¹+ 1.e⁰²+· · ·+ 0.e⁰ⁿ

...

e⁰ⁿ = 0.e⁰¹+ 0.e⁰²+· · ·+ 1.e⁰ⁿ De même :

E_B¹ =





 1 0...

0







B

;E_B² =





 0 1...

0







B

;· · ·;E_Bⁿ =





 0 0...

1







B

car











e¹ = 1.e¹+ 0.e²+· · ·+ 0.eⁿ e² = 0.e¹+ 1.e²+· · ·+ 0.eⁿ

...

eⁿ = 0.e¹+ 0.e²+· · ·+ 1.eⁿ

Pour relier X et X⁰ (c’est à dire passer des coordonnées dans une base aux coordonnées dans l’autre base), il faut décomposer chaque vecteur de la baseB⁰ sur la baseB :











e⁰¹ = p₁₁e¹+p₂₁e²+· · ·+p_n1eⁿ e⁰² = p₁₂e¹+p₂₂e²+· · ·+p_n2eⁿ

...

e⁰ⁿ = p1ne¹+p2ne²+· · ·+pnneⁿ

d’où : x = x⁰1.(p11e¹+p21e²+· · ·+pn1eⁿ) +x⁰2.(p12e¹+p22e²+· · ·+pn2eⁿ) +· · ·

· · ·+x⁰n.(p1ne¹+p2ne²+· · ·+pnneⁿ)

= (x⁰1p11+x⁰2p12+· · ·+x⁰np1n)e¹+ (x⁰1p21+x⁰2p22+· · ·+x⁰np2n)e²+· · ·

· · ·+ (x⁰1pn1+x⁰2pn2+· · ·+x⁰npnn)eⁿ Par identification, on peut réécrire le vecteur colonnex:

X =





 x₁ x₂ ...

xn







B

=







x⁰1p₁₁+x⁰2p₁₂+· · ·+x⁰np_1n x⁰1p₂₁+x⁰2p₂₂+· · ·+x⁰np_2n

...

x⁰1pn1+x⁰2pn2+· · ·+x⁰npnn







B

=x⁰1





 p₁₁ p₂₁ ...

pn1







B

+x⁰2





 p₁₂ p₂₂ ...

pn2







B

+· · ·+x⁰n





 p_1n p_2n ...

pnn







B

(8)

On voit alors apparaître naturellement le produit de deux matrices :

X=







p11 p12 · · · p1n

p₂₁ p₂₂ · · · p_2n

... ... ...

p_n1 p_n2 · · · p_nn







| {z }

P_B^B⁰





 x⁰₁ x⁰₂ ...

x⁰_n







| {z } X⁰

=P_B^B⁰X⁰

La matrice P_B^B⁰ est appeléematrice de passage de la base B à la base B⁰. Ses colonnes contiennent les coordonnées des vecteurs de la baseB⁰ exprimés dans la baseB. En effet :

∀i∈[|1, n|], E_B⁰ⁱ=p1iE_B¹ +p2iE_B²+· · ·+pniE_Bⁿ=p1i





 1 0...

0







B

+p2i





 0 1...

0







B

+· · ·+pni





 0 0...

1







B

=





 p1i

p2i

...

pni





 D’où : B

P_B^B⁰ =







p11 p12 · · · p1n

p21 p22 · · · p2n

... ... ...

p_n1 p_n2 · · · p_nn







=



 E⁰¹_B E⁰²_B · · · E_B⁰ⁿ





Première approche de l’inverse d’une matrice

A l’inverse du cheminement précédent, la matrice P_B^B⁰ peut être considérée comme la représentation matricielle d’une application linéaire f de E dans E (on parle alors d’un endomorphisme). Puisque X et X⁰ sont tous les deux les représentations matricielle du même vecteurx∈E, on peut écrire :

X =P_B^B⁰X⁰⇐⇒x=f(x) (?)

Il devient alors évident que l’applicationfn’est rien d’autre que l’applicationidentité,id_E:

id_E: E → E x 7→ f(x) =x En reprenant le déroulement précédent, mais en choisissant d’exprimer X⁰ en fonction de X, nous aurions pu, de manière équivalente, déterminer l’expression de la matrice de passage de la baseB⁰ à la baseB.

Soituune application linéaire deE dansF. On noteAla représentation matricielle de udans deux basesB_E :

X⁰ =P_B^B0X, avec :P_B^B0 =







p⁰₁₁ p⁰₁₂ · · · p⁰_1n p⁰₂₁ p⁰₂₂ · · · p⁰_2n

... ... ...

p⁰_n1 p⁰_n2 · · · p⁰_nn







=



 E_B¹0 E_B²0 · · · Eⁿ_B0





De même, la matriceP_B^B0 est la représentation de l’application identitéid_E.

A présent, multiplions l’expression ci-dessus, à gauche, par la matrice P_B^B⁰. Cela donne : P_B^B⁰X⁰=P_B^B⁰P_B^B0X^(?)=X. De manière évidente, on aboutit à :P_B^B⁰P_B^B0 =Inn. On en déduit queP_B^B0 est lamatrice inversedeP_B^B⁰ :P_B^B⁰⁻¹=P_B^B0

Or, on l’a vu plus haut, la multiplication matricielle est équivalente à une composition des application sous-jacentes.

De même, puisque,idE◦idE =idE, on en déduit que idE =id⁻¹_E (application réciproque).

En résumé :

– la question de l’existence d’une matrice inverse est équivalente à la question de l’existence d’une application réciproque. On note A⁻¹ l’inverse d’une matriceA.

– le raisonnement ci-dessus doit être réversible si l’on veut avoir P_B^B⁰P_B^B0 = P_B^B0P_B^B⁰ = Inn. Ceci n’est possible que si la dimension de l’espace de départ est égale à la dimension de l’espace d’arrivée. Autrement dit, seules les matrices carrées peuvent être inversibles.

– une matrice de passage est la représentation matricielle de l’application identité. L’ensemble des matrices de passage sont doncequivalentes, au sens où elles reflètent la même application sous-jacente.

(9)

Applications linéaires

• Endorphisme : soit u une application linéaire de E dans E. Soient deux bases B et B⁰ de E. Soient A et A⁰ les représentations matricielles deudansBetB⁰. Soientx∈E,yson image paru, etX,X⁰d’une part,Y,Y⁰d’autre part, les vecteurs colonnes associés dans les basesBet B⁰.

u: E → E

x 7→ u(x) =y ⇐⇒ Y =AX ⇐⇒ Y⁰=A⁰X⁰ SoientP_B^B0 etP_B^B⁰ les matrices de passage associées àBet B⁰. On peut alors écrire :

Y =P_B^B0Y⁰ X =P_B^B0X⁰

D’où : Y =AX ⇐⇒ P_B^B⁰Y⁰=AP_B^B⁰X⁰

P_B^B0−1

×

⇐⇒

P_B^B⁰−1

P_B^B⁰

| {z } Inn

Y⁰=Y⁰= P_B^B⁰−1

AP_B^B⁰

| {z } A⁰ =P⁻¹AP

X⁰=A⁰X⁰

D’où : A⁰ = P⁻¹AP. On dit que A et A⁰ sont des matrices semblables. Elles représentent la même application sous-jacente. Des matrices semblables ont la même trace, le même rang et le même déterminant.

• Morphisme

Considérons maintenant des e.v. de départ et d’arrivée de dimensions différentes.

Soituune application linéaire telle que :

u: E → F

x 7→ u(x) =y . E est un e.v. de dimension n,F un e.v. de dimensionp.

SoitP la matrice de passage de la base(e^j)ⁿ_j=1vers la base(e^0j)ⁿ_j=1. SoitQla matrice de passage de la base(fⁱ)^p_i=1 vers la base(f⁰ⁱ)^p_i=1.

SoitAla matrice représentant u, exprimée depuis la base(e^j)ⁿ_j=1 deE vers la base(fⁱ)ⁿ_i=1 deF. SoitA⁰ la matrice représentantu, exprimée depuis la base(e^0j)ⁿ_j=1 deE vers la base(f⁰ⁱ)ⁿ_i=1 deF.

Alors :A⁰=Q⁻¹AP. On dit que les matrices sontéquivalentes. Deux matrices semblables sont équivalentes (réciproque fausse en général). Deux matrices sont équivalentes si et seulement si elles ont le même rang.

7 Inverse d’une matrice

Sous-espace vectoriel engendré

• Pré-requis : Soit Aune matrice carrée. Elle est associée à une appl. lin.u:E→F, avecdim(E) =dim(F) =n. On a vu que : Y =AX, avecA=



 u(e¹) u(e²) · · · u(eⁿ)



.

∀x∈E, X=





 x1

x₂ ...

x_n







B

⇐⇒x=x1e¹+x2e²+· · ·+xneⁿ. Le vecteurxest donc une c.l. de(e¹, e²,· · ·, eⁿ).

Y =AX⇐⇒y=u(x) =x1u(e¹) +x2u(e²) +· · ·+xnu(eⁿ). Le vecteur y est une c.l. de(u(e¹), u(e²),· · · , u(eⁿ))

• Théorème :Ainversible ⇐⇒ubijective ⇐⇒dim{Im(u)}=n

• Interprétation : La famille(u(e¹), u(e²),· · ·, u(eⁿ))est génératriceF (sinondim{Im(u)}< n).

• Conséquences :

Ainversible ⇐⇒ les vecteurs(u(e¹), u(e²),· · · , u(eⁿ))sont linéairement indépendants

⇐⇒ Im(u) =F

⇐⇒ dim{Im(u)}=rg(u) =rg(A) =n

⇐⇒ (u(e¹), u(e²),· · · , u(eⁿ))forment une base de F

⇐⇒ (u(e¹), u(e²),· · · , u(eⁿ))sont linéairement indépendants

⇐⇒ det{u(e¹), u(e²),· · ·, u(eⁿ)} 6= 0

⇐⇒ det(A)6= 0

• Rang et échelonnement (matrices carrées) : Le calcul durang d’une matrice s’effectue en essayant d’échelonner la matrice en lui appliquant une série d’opérations élémentaires (permutation de lignes, addition de lignes, multiplication de ligne par un scalaire, voir partie 7). Si l’on y parvient, le rang de la matrice est égal à la dimension de la matrice. Sinon, le nombre de ligne nulles donne la dimension du noyau. Le théorème du rang permet d’en déduire le rang de la matrice, qui est alors égal à la différence entre le nombre total de lignes et le nombre de lignes nulles :

dimE=dim Ker(u) +dim Im(u) =dim Ker(u) +rg(A) (partie 4).

(10)

Déterminant

• Calcul

– Dimension 2 A=

a b c d

⇒det(A) =

a b c d

=ad−bc

– Dimension 3 A=





a11 a12 a13

a21 a22 a23

a₃₁ a₃₂ a₃₃



⇒det(A) =

a11 a12 a13

a21 a22 a23

a₃₁ a₃₂ a₃₃

=a11

a22 a23

a32 a33

+a21

a32 a33

a12 a13

+a31

a12 a13

a22 a23

– Dimension 4 (formule de Laplace, développement par la première colonne)

A=







a11 a12 a13 a14

a21 a22 a23 a24

a31 a32 a33 a34

a41 a42 a43 a44







⇒ det(A) = a₁₁

a22 a23 a24

a32 a33 a34

a42 a43 a44

−a₂₁

a12 a13 a14

a32 a33 a34

a42 a43 a44

+a31

a12 a13 a14

a22 a23 a24

a42 a43 a44

−a41

a12 a13 a14

a22 a23 a24

a32 a33 a34

– Dimension quelconque (formule de Laplace généralisée, développement par rapport à laj-ième colonne) det(A) =

n

X

i=0

a_ijCofij avec Cofij = (−1)^i+jdet(M_ij), où la matriceM_ij est égale à la matriceA, dans laquelle auraient été supprimées la lignei et la colonnej. Le terme “Cof” est appelé uncofacteur (voir ci-dessous, “Méthode des cofacteurs”).

• Propriétés : – det(I) = 1

– det(AB) =det(A)×det(B)

– Lorsque Aest inversible,A⁻¹A=AA⁻¹=I etdet(A)6= 0. Alors :det(A⁻¹) = 1 det(A) – ∀λ∈R,∀A∈ Mnn(R), det(λA) =λⁿdet(A)

– ∀λ∈R, det(A1,· · ·, λAj,· · ·, An) =λdet(A).

– det(A1,· · ·, A⁰_j+A⁰⁰_j,· · ·, An) =det(A1,· · ·, A⁰_j,· · ·, An) +det(A1,· · ·, A⁰⁰_j,· · · , An). Existence de l’inverse

Considérons le système :







2x + 4y − 2z = 2 4x + 9y − 3z = 8

−2x − 3y + 7z = 10

⇐⇒AX=B avecA=





2 4 −2

4 9 −3

−2 −3 7



 ; X=



 x y z



 ; B=



 2 8 10





InterprétonsAcomme la matrice d’une application linéaireu. Pour simplifier, disons qu’il s’agit d’un endomorphisme deR³ (i.e. une application linéaire deR³ dansR³). Supposons, de plus, queA est exprimée dans une même base deR³ au départ comme à l’arrivée. On la noteB.X est alors le vecteur colonne contenant les coordonnées d’un pointxdeR³, exprimé dansB. Le produitAX=B représente donc l’image ydexparu:AX=B⇐⇒u(x) =y.

Résoudre ce système consiste à déterminer l’inconnue x. Dans ces conditions, le système admet une solution si y ∈Im(u), c’est à dire si y admet un antécédent paru. Une telle situation est garantie, quel que soit y, dès lors que Im(u) =R³, c’est à dire sidim{Im(u)}=rg(u) =rg(A) = 3. Le calcul du rang deApermet donc de vérifier l’existence de cette solution. Dans le cas de cette matricecarrée, si le rang est égal à la dimension de la matrice, alors cela signifie que les vecteurs issus des colonnes de la matrice sont linéairement indépendants. Ceci se vérifie simplement en calculant le déterminant.

Si l’inverse de Aexiste (∃A⁻¹), cela signifie que le système est inversible. On peut alors écrire : AX=B^A

−1×

=⇒ A⁻¹AX=X =A⁻¹B Il est à noter que ce raisonnement ne dépend pas deB (ouy).

(11)

Calcul pratique

• Opérations élémentaires sur les lignes : Trois opérations importantes sur les lignes peuvent être effectuées sur les matrices : la permutation, l’addition et la multiplication. Ces matrices sont décrites ci-dessous, en dimension 3 par commodité. La multiplication par ces matrices élémentaires ne modifie pas le déterminant de la matrice ainsi transformée. Ces opérations s’effectuent, par convention, en multipliantà gauche par des matrices particulières.

Considérons une matrice :A=





a₁₁ a₁₂ a₁₃ a21 a22 a23

a31 a32 a33



 – Permutation

P₁=





1 0 0 0 0 1 0 1 0



=⇒P₁A=





1 0 0 0 0 1 0 1 0









a11 a12 a13

a21 a22 a23

a31 a32 a33



=





a11 a12 a13

a31 a32 a33

a21 a22 a23



6=A

– Addition

P₂=





1 1 0 0 1 0 0 0 1



=⇒P₂A=





1 1 0 0 1 0 0 0 1









a₁₁ a₁₂ a₁₃ a₂₁ a₂₂ a₂₃ a₃₁ a₃₂ a₃₃



=





a₁₁+a₂₁ a₁₂+a₂₂ a₁₃+a₂₃ a₂₁ a₂₂ a₂₃ a₃₁ a₃₂ a₃₃





– Multiplication (λ6= 0)

P₃=





λ 0 0 0 1 0 0 0 1



=⇒P₃A=





λ 0 0 0 1 0 0 0 1









a₁₁ a₁₂ a₁₃ a₂₁ a₂₂ a₂₃ a31 a32 a33



=





λa₁₁ λa₁₂ λa₁₃ a₂₁ a₂₂ a₂₃ a31 a32 a33





– Combinaison de plusieurs opérations : il suffit de multiplier successivement (à gauche) par les matrices élé- mentaires appropriées :

P =P₂P₃P₁=





λ 0 1 0 0 1 0 1 0



=⇒P A=





λ(a₁₁+a₃₁) λ(a₁₂+a₃₂) λ(a₁₃+a₃₃)

a31 a32 a33

a21 a22 a23





• Pivot de Gauss

On procède par multiplication, à gauche, par des matrices élémentaires, dans le but d’échelonner la matrice A, puis de substituer les lignes, afin d’aboutir à la matrice identité. On opère de la même manière avec la matriceB.



 A B





Echelonnement et substitutions

−−−−−−−−−−−−−−−−−−−−−−−−−→

P×



 I X





Si on repart deAX=B P×

=⇒ P AX =P B. Or,P A=I, d’oùP =A⁻¹. On en déduit :X =P B=A⁻¹B.

Remarque : si, à une étape, une ligne de zéros apparaît, cela signifie que la matrice n’est pas inversible (son rang est inférieur à sa dimension). On dit que la matrice estsingulière.

• Méthode de Gauss-Jordan

La méthode consiste à remplacer B par la matrice identité, et à suivre la même procédure. Le but est de pouvoir exprimer directementP, qui n’est autre queA⁻¹ :



 A I





Echelonnement et substitutions

−−−−−−−−−−−−−−−−−−−−−−−−−→

P×



 I P





• Méthode de Cramer

De manière équivalente, on peut écrire un système linéaire d’équations sous une forme matricielle :











a₁₁x₁+a₁₂x₂+...+a_1nx_n = b₁ a₂₁x₁+a₂₂x₂+...+a_2nx_n = b₂

...

a_n1x₁+a_n2x₂+...+a_nnx_n = b_n

⇐⇒







a11 a12 · · · a1n

a₂₁ a₂₂ · · · a_2n

... ... ...

a_n1 a_n2 · · · a_nn











 x1

x₂ ...

x_n







=





 b1

b₂ ...

b_n







⇐⇒AX=B

(12)

X est l’inconnue du système. Lorsque det(A)6= 0, le système admet une et une seule solution pourX. Celle-ci est donnée par la formule :xk =det(Ak)

det(A) , où la matriceAk est formée en remplaçant lak-ième colonne deApar le vecteur colonneb, i.e. Ak= (a_k|i,j)aveca_k|i,j=

aij si j6=k bj si j=k

• Méthode des cofacteurs

A⁻¹= 1

det(A)com(A)^T = 1 det(A)







C₁₁ C₂₁ · · · C_n1 C₁₂ ... C_n2

... ... ...

C1n · · · Cnn







oùcom(A)la matrice des cofacteursC_ij (comatrice) :

com(A) = (C_ij)_1≤n,j≤n avecC_ij= (−1)^i+jdet







a₁₁ · · · a_1,j−1 a_1,j+1 · · · a_1n

... ... ... ...

a_i−1,1 · · · a_i−1,,j−1 a_i−1,,j+1 · · · a_i−1,n ai+1,1 · · · a_i+1,,j−1 ai+1,,j+1 · · · ai+1,n

... ... ... ...

an1 · · · a_n,j−1 an,j+1 · · · ann







(déterminant de la matrice après suppressionième ligne etjème colonne)

8 Projection orthogonale

• Projection orthogonale à deux dimensions

– Définition : pourx∈EetD ladroite vectorielle engendrée parx, i.e.D={λx|λ∈R}, la projection dey∈E orthogonalement àD, notéeΠD(y), est caractérisée par les deux propriétés suivantes :

(i)ΠD(y)∈D, i.e.ΠD(y)est colinéaire àx; (ii)y−ΠD(y)est orthogonal )x. – Expression : (i) vectorielle :Π_D(y) = < x|y >

||x||² x ; (ii) matricielle (où−→a .−→

b ≡a^Tb) :Π_D(y) = xx^T x^Txy – Théorème : Soitx∈E non nul ety∈E. La projection orthogonale dey sur la droiteD engendrée parxest

l’unique vecteurz colinéaire àxréalisant le minimum de||y−z||, i.e. :ΠD(y) = arg min

z∈D||y−z||

• Projection orthogonale à trois dimensions

SoitP un plan deR³ engendré par(a1, a2), i.e.A=





a11 a21

a12 a22

a13 a23



. Soitb un vecteur deR³ ∈ P. L’expression dep, projeté orthogonale deb surP, est donnée par :p=P b, avecP =A(A^TA)⁻¹A^T.

• Projection orthogonale en dimension quelconque

– Définition : Soit F un s.e.v. de E (e.v. euclidien). On appelle projection orthogonale sur F, notée pF la projection vectorielle surF parallèlement àF^⊥.

– Soit A une matrice de taille m×n et soit y ∈ R^m. Si la matrice A^TA est inversible, alors la projection orthogonale de ysur le sous-espace deR^mengendré par les colonnes deA est :A(A^TA)⁻¹A^Ty .

– On note P la matrice de projection orthogonale, i.e. P = A(A^TA)⁻¹A^T. P est carrée, de taille m×m, symétrique (P=P^T) et idempotente (P²=P). Siy appartient au s.e.v. de R^m engendré par les colonnes de A, alorsP y=y. Siy est orthogonal à ce s.e.v., alorsP y= 0.

– Cas particulier : Soit(e1,· · ·, ep)une b.o.n. deF. Alors,∀x∈E, puisquex=x1+x2avecx1∈F etx2∈F^⊥, on a :pF(x) =x1=

p

P

i=1

(x|ei).ei. Les coordonnées dexsont obtenues par projection orthogonale sur les vecteurs de la base.

• Moindres carrés

– Définition : SoitGune matrice de taillem×ntelle queG^TGsoit inversible, etd∈R^m. On appellesolution au sens des moindres carrés de l’équation d=Gml’unique vecteur mˆ ∈Rⁿ réalisant le minimum de||d−Gm||, i.e.mˆ = arg min

m∈Rⁿ

||d−Gm||. La recherche demˆ sachantGet dconstitue unproblème inverse.

– Théorème : la solution des moindres carrés est : mˆ = (G^TG)⁻¹G^Td. C’est celle qui minimisela norme 2 de l’erreur e=d−dˆentre la prédictiondˆ=Gmˆ et l’observationd.