Projections - Alg`ebre lin´eaire 3 :

2.3.1 D´efinition

D´efinition 24. Soient E un espace euclidien et A ⊂E une partie non vide de E. On note A^⊥ ={x∈E / ∀a ∈A, hx, ai= 0}

et on l’appelle l’orthogonal de A.

Proposition 13. L’orthogonal A^⊥ de tout partie non vide A est un s.e.v de E. On a

egalement A ⊥ B implique A ⊂ B^⊥ pour deux sous-ensembles (non vides) A, B ⊂ E.

En outre on a :

{0}^⊥ =E, E^⊥={0}.

Démonstration. La propriété de s.e.v. et d’inclusion se vérifient trivialement. De même, tout vecteur est orthogonal à zéro. Pour voir que E^⊥ = {0}, il suffit de remarquer que si

v ∈E^⊥, alors hv, vi= 0.

Proposition 14. Soit F un s.e.v. d’un espace euclidien E. Alors :

• E =F ⊕F^⊥,

• F^⊥⊥ =F.

Soient F₁ et F₂ deux s.e.v. d’un espace euclidien E. Si F₁ ⊕ F₂ = E et F₁ ⊥ F₂, alors F1 =F₂^⊥.

Démonstration. Pour le premier point : on considère une base de F; on étend ensuite celle-ci à une base de E (on utilise ici le Théorème 3 de la base incomplète). Ensuite on orthonormalise (par le procéde de Schmidt) et on obtient donc une base orthonormée de E qui contient une base orthonormée de F, mettons {e₁, . . . , e_n} où les p premiers vecteurs forment une base de F. Il n’est alors pas difficile de voir que

F^⊥ = Vect{e_p+1, . . . , e_n},

en utilisant la formule (8). On conclut ainsi que E = F ⊕F^⊥ et que dim(E) = dim(F) + dim(F^⊥).

Pour le deuxième point, on a tout d’abord dim(F^⊥⊥) = dim(E)−dim(F^⊥) = dim(F) et par ailleurs on vérifie facilement que F ⊂F^⊥⊥. On a donc l’égalité.

Pour la dernière partie, on raisonne de la même manière. On a d’une part dim(F₂) = dim(E)−dim(F₁) = dim(F₁^⊥). Comme d’autre partF₂ ⊂F₁^⊥, cette inclusion est en fait une

egalit´e.

Définition 25. Le théorème précédent nous montre que tout x ∈ E s’écrit d’une manière unique comme x=u+v avec u∈ F et v ∈F^⊥. On appelle u la projection orthogonale de x sur F et on note par p_F l’application x7→p_F(x) =u ainsi construite.

Exemple. DansE =R³ la projection de (3,2,4) sur le plan x= 0 est (0,2,4) alors que sa projection sur x+y+z = 0 est (0,−1,1).

Proposition 15. Soit F un s.e.v. d’un espace euclidien E. Alors

1. Orthogonalit´e : pour toutx∈E on a : ∀y∈F, x−p_F(x)⊥y et x=p_F(x) +p_F^⊥(x).

De plus kp_F(x)k ≤ kxk.

2. si {e₁, . . . , e_k} est une base orthonorm´ee de F on a

∀x∈E, p_F(x) =

i=1

hx, e_iie_i. (10) 3. Si p est une projection orthogonale p◦p=p.

4. Si p est un endomorphisme v´erifiant p◦p=p et si en plus Im(p)⊥ Ker(p) alors p est la projection orthogonale sur Im(p).

5. Caractérisation par la propriété de minimalité :

∀x∈E, kx−p_F(x)k= inf

w∈Fkx−wk.

Démonstration. Le 1. est une conséquence simple de l’écriture x=u+v et de F =F^⊥⊥. L’inégalité kp_F(x)k ≤ kxk découle de Pythagore.

Pour le 2., on écrit la projection comme une combinaison linéaire dans cette base, ensuite les coefficients se déterminent en utilisant x−pF(x) ⊥ F, donc pour i = 1. . . k, hx, eii = hp_F(x), e_ii :

p_F(x) =

i=1

hp_F(x), e_iie_i =

i=1

hx, e_iie_i+hp_F(x)−x, e_iie_i.

Pour le 3., on utilise que pour x ∈ F, p_F(x) = x (ce qui est clair puisque l’´ecriture x=x+ 0 avecx∈F et 0∈F^⊥ est unique).

Pour le 4., on démontre d’abord que Im(p)⊕Ker(p) = E : tout x ∈ E s’écrit x = p(x) +x−p(x) et on voit que p(x−p(x)) = 0 donc x−p(x) ∈ Ker(p). De plus l’écriture est unique puisque si x = a+b avec b ∈ Ker(p) alors p(x) = p(a) = a (une autre manière de faire était de voir que les espacesIm(p) etKer(p) sont en somme directe (du fait de leur orthogonalité) et d’utiliser le théorème du rang). On conclut par la définition de la projection orthogonale.

Pour le 5., on écritkx−wk² =kx−p_F(x) +p_F(x)−wk² =kx−p_F(x)k²+kp_F(x)−wk², la dernière égalité venant de la propriété d’orthogonalité.

Remarque 11. On reconnaˆıt dans la formule (10) une écriture que nous avons vue dans le procédé d’orthonormalisation de Schmidt. On voit que la base obtenue par orthonormalisation peut également s’écrire :

e_k = x_k−P_F_k−1(x_k)

kx_k−P_F_k−1(x_k)k, o`u F_k−1 :=Vect{e₁, . . . , e_k−1}=Vect{x₁, . . . , x_k−1}.

Proposition 16. Soit E un espace euclidien muni d’une base orthonorm´ee (v₁, . . . , v_n).

Soient F un s.e.v. de E et (e₁, . . . , e_k) une base orthonormée deF. Notons U la matrice des coordonnées de e₁, . . ., e_k en colonne dans la base (v₁, . . . , v_n), (qui est donc une matrice à n lignes et k colonnes). Soit x ∈ E, et soient X et Y les matrices coordonnées respectives de x et p_F(x) dans la base (v₁, . . . , v_n). Alors on a :

Y =U^tU X.

D´emonstration. Ce n’est en fait rien d’autre que la formule (10) : ^tU X est le vecteur colonne (`a k lignes) :





 hx, e₁i

... hx, eki





,

et on conclut ais´ement.

2.3.2 Application au probl`eme des moindres carr´es

Soient m points de R notés x_i, i = 1, . . . , m et c_i des valeurs associées à ces points. On s’intéresse au problème d’approcher cette ensemble de points par le graphe d’une fonction

elémentaire, c’est-à-dire de trouver une fonction simple telle que U(xi) ' ci. Un bon choix peut être constitué par les fonctions affines de la forme U(x) = ax+b. Autrement dit, nous allons chercher à approcher un “nuage de points” par une droite. C’est le classique problème de la “régression linéaire”, tel que décrit sur la Figure 2.

(xi, ci)

x y=ax+b y

Figure 2 – Droite de régression linéaire On peut formuler notre problème comme la minimisation de

S(a, b) =

i=1

(ax_i+b−c_i)².

Soit c le vecteur colonne d’entr´ees c_i, autrement dit, c = ^t(c₁, . . . , c_m). On consid`ere aussi x= ^t(x₁, . . . , x_m), u= ^t(1, . . . ,1)∈R^m. On observe alors que

S(a, b) =kax+bu−ck².

On peut donc reformuler le problème comme suit : trouver la combinaison linéaire des vec-teurs x et u (de coefficients a et b) à distance minimale du vecteur c. Soit donc l’espace vectoriel V engendré par x et u dans R^m. D’après ce qui précède, nous cherchons donc la projection orthogonale dec surV :

ax+bu=p_V(c).

Pour effectuer le calcul on utilise la propriété d’orthogonalité : (ax+bu−c)⊥x et (ax+bu−c)⊥u.

Cela donne un système de deux équations à deux inconnues à résoudre.

Ceci se g´en´eralise de plusieurs fa¸cons :

• On peut chercher la meilleure approximation parmi des fonctions non affines. Par exemple, soientx7→g₁(x) etx7→g₂(x). On peut chercher la meilleure approximation comme combinaison de ces deux fonctions

ag₁(x_i) +bg₂(x_i)'c_i, au sens des moindres carr´es, c’est-`a-dire qui minimise

i=1

|ag₁(x_i) +bg₂(x_i)−c_i|².

Le cas précédent correspond à g₁ : x 7→ x et à g₂ la fonction constante à 1. On introduit alors les vecteurs

G₁ = ^t(g₁(x₁), . . . , g₁(x_m)) et G₂ = ^t(g₂(x₁), . . . , g₂(x_m)).

On cherche donc le vecteur au sein de Vect{G₁, G₂} qui soit `a distance minimale du vecteur c. Il s’agit donc encore du projet´e orthogonal de c sur le sous-espace Vect{G₁, G₂}.

• On peut utiliser plus de deux fonctions, par exempleg₁, . . .g_k, et chercher la meilleure approximation sous la forme

α₁g₁(x_i) +· · ·+α_kg_k(x_i)'c_i.

On introduira alors comme précédemment les vecteurs colonnes G₁, . . ., G_k donnés

et la meilleure approximation au sens des moindres carr´es sera le projet´e orthogonal decsur le sous-espace Vect{G1, . . . , Gk}.

• On peut considérer le cas d’une dépendance de plusieurs variables, par exemple quand on a un nuage tridimensionnel (x_i, y_i, c_i)_i=1...m et qu’on cherche à approchercpar une fonction des deux variablesx,y. Dans le cas linéaire pour simplifier, on cherche donc la meilleure approximation

αx_i+βy_i+b'c_i, ce qui donne au sens des moindres carr´es

i=1

|αx_i+βy_i+b−c_i|².

On cherche encore le projet´e orthogonal de csur le sous-espace de R^m :

Vect

On obtient dans ce cas précis trois équations à trois inconnues.

Dans le document Alg`ebre lin´eaire 3 : (Page 23-27)