Module 5 : Formes quadratiques
1. Définition et propriétés
1.1 Définition
On appelle forme quadratique le produit X′
[ ]
AX où :•
[ ]
A est une matrice symétrique,
=
n ij
i
n 1 j
1 12
1
) n , n (
a b
a
b ...
b ...
b a
A
avec ai les éléments de la diagonale principale et bij l’élément de la iième ligne et de la jième colonne qui est égal par symétrie à l’élément de la jième ligne et de la iième colonne de A
• X un vecteur de dimension (n,1)
=
n 2 1
x x x
X M
• X’ le vecteur transposé de X : X′(1,n) =
[
x1,x2,...,xn]
D’où
[ ] [ ][ ] [ ]
=
′ =
n 1
n ij
i
n 1 j
1 12
1
n 2 1 n 2 1 n
2 1
x ..
...
...
...
x
a b
a
b ...
b ...
b a
x ..., x , x x x x A x ..., x , x X A
X M
[ ]
+
+ +
+ +
=
n 1
n n 1
n 1 n
n 1 2
12 1 1
x . . . x
x a ...
x b ..., , x b ...
x b x a
n 1 n 1 2
1 12 2
n n 2
1 1
2n 2 n
n 1 1 n
1 n 1 2
1 2 12
1 1
x x b 2 ...
x x b 2 x a ...
x a
x a ...
x b ...
x x b ...
x x b x a
+ + +
+ +
=
+ + +
+ +
+ +
=
∑ ∑
∑
−= =+
=
+
= n 1
1 i
n 1 i j
j i ij n
1 i
2
ixi 2 b x x
a
Exemples :
Exemple 1 : Ecrire sous la forme X'[A]X les expressions suivantes :
• 2
2 2 2 1
1 4x x 3x
x + + peut s’écrire x1
(
x1+2x2)
+x2(
2x1+3x2)
ou
[ ]
2 1 2
1 x
x 3 2
2 x 1
x
• 2 1 2 1 3
3 2 2 2
1 2x 7x 4x x 8x x
x + − − +
[ ]
−
−
3 2 1 3
2 1
x x x
7 sym
0 2
4 2 1 x x x
• 2
2 3 2 1
1 6x x x x
2 − +
[ ]
−
−
3 2 1 3
2 1
x x x
1 0 0
0 0 3
0 3 2 x x x
• 2 1 2 1 3 2 3
3 2 2 2
1 2x 3x 4x x 6x x 8x x
x − − + + −
[ ]
−
−
−
−
3 2 1 3
2 1
x x x
3 4 3
4 2 2
3 2 1 x x x
Exemple 2 : Ecrire sous la forme développée la forme quadratique en x1,x2x3 dont la matrice est
−
−
− 5 4 1
4 2 3
1 3 2
3 2 3 1 2 2 1
3 2 2 2
1 2x 5x 6x x 2x x 8x x x
2 + − − + +
Exemple 3 : Soit la matrice
=
4 6 4
6 2 2
4 2 1
A . Trouver la forme quadratique associée.
→ par le calcul :
[
1 2 3] [
x1 2x2 4x3 2x1 2x2 6x3 4x1 6x2 4x3]
4 6 4
6 2 2
4 2 1 x x x A
X = + + + + + +
′ =
[ ]
2 3 1
3 2 2 1
3 2 2 2 1
2 3 3 2 3 1 2 2 3
2 2 1 1 3 1 2 2
1
3 2 1 3 2 1 3 2 1 3 2 1
x x 12 x x 8 x x 4 x 4 x 2 x
x 4 x x 6 x x 4 x x 6 x 2 x x 2 x x 4 x x 2 x
x x x x 4 x 6 x 4 x 6 x 2 x 2 x 4 x 2 x AX X
+ +
+ + +
=
+ +
+ +
+ +
+ +
=
+ + +
+ +
+
′ =
Remarque : les coefficients ai
de la matrice A (sur la diagonale de A) sont les coefficients des 2
xi (1, 2 et 4) et les bij
de la matrice A (les éléments de la matrice A qui ne sont pas situés sur la diagonale principale) sont la moitié des coefficients des xij (ici 2, 4 et 6 sont la moitié de 4, 8 et 12)
→ par construction :
∑
aixi2+2∑∑
bijxixj( )
23 1 2 3 1 3 22 2 2 3 1 2 3 1 2 2 1
3 2 2 2
1 2x 4x 22x x 4x x 6x x x 2x 4x 4x x 8x x 12x x
x + + + + + = + + + + +
1.2. Changements de base
Soit P une matrice.
Soit X=
[ ]
PX1 une application linéaire sur un espace vectoriel F. Elle transforme la forme quadratique[ ]
A XX′ de matrice symétrique
[ ]
A sur F en la forme quadratique :[ ]
( ) [ ][ ] ( [ ] [ ][ ] )
[ ]
11
1 1
1 1
X B X
X P A P X X P A X P
= ′
′ ′
′ =
avec
[ ] [
B = P′AP]
,[ ]
B matrice symétrique.Toutes les matrices
[ ]
A et[ ]
B telles que[ ] [
B = P′AP]
sont dites congruentes.1.3. Formes quadratiques définies, semi définies
La forme quadratique X′
[ ]
AX est dite :• définie positive si X′AX>0 pour tout X≠0
• définie négative si X′AX<0 pour tout X≠0
• semi définie positive si X′AX≥0
• semi définie négative si X′AX≤0
Exemple :
=
0 0 0
0 2 0
0 0 1
A Déterminer la nature de la forme quadratique de A.
[ ]
[
x 2x 0][
x x x]
x 2x 0x x x A x x x AX X
2 2 2 3 1 2 1 2
1
3 2 1 3
2 1
≥ +
=
=
′ =
La forme quadratique est donc semi définie positive.
1.4. Matrices définies, semi définies
Théorème 1 : Soit A une matrice symétrique alors :
• A est définie positive si et seulement si toutes ses valeurs propres sont strictement positives : λj >0
• A est définie non négative ou semi définie positive si et seulement si toutes ses valeurs propres sont positives ou nulles : λj ≥0
• A est définie négative si et seulement si toutes ses valeurs propres sont strictement négatives : j <0
λ
• A est semi définie négative si et seulement si toutes ses valeurs propres sont négatives ou nulles : j ≤0
λ
• A est indéfinie si ses valeurs propres sont soient positives, soient négatives.
Théorème 2 : Soit A une matrice symétrique régulière d’ordre n et soit Mj le jème mineur principal, c’est-à- dire le déterminant de la sous-matrice obtenue en supprimant les n-j dernières lignes et les n-j dernières colonnes, alors :
• A est définie positive si et seulement si tous ses mineurs principaux M1,M2...,Mn sont strictement positifs.
• A est définie négative si et seulement si tous ses mineurs principaux alternent en signe en commençant par M1 <0,M2 >0,M3 <0...,(−1)nMn >0
Exemples :
• 1) Soit
−
= −
2 2
2
A 2 Quelle est la nature de A ?
Il faut rechercher les valeurs propres de A
(
2)
4(
4)
02 2
2 I 2
A = −λ 2 − = −λλ =
λ
−
−
− λ
= − λ
−
Deux valeurs propres : 0 4 0≥
= λ
=
λ . A est semi définie positive.
Le théorème 2 n’est pas applicable car A est singulière (déterminant de A=0)
• 2)
= 2 1
1
A 2 Quelle est la nature de A ?
Application des deux théorèmes :
A−λI = 2−1λ 21−λ =
(
2−λ)
2−1=(
3−λ)( )
1−λ =0 Rappel : a2 −b2 =(a−b)(a+b)3 0 1 >
= λ
=
λ . A est définie positive.
Calcul des mineurs :
0 3 1 4 M , 0 2
M1= > 2 = − = > . A est définie positive.
2. Diagonalisation d’une matrice symétrique – Notions de vecteurs orthogonaux – produits scalaires
Soit X′AX une forme quadratique
A une matrice symétrique (par définition).
• Toute matrice symétrique est diagonalisable si et seulement si le polynôme caractéristique d’une matrice symétrique d’ordre n a n racines réelles distinctes ou confondues.
• Si A est une matrice symétrique, 2 vecteurs propres associés à 2 valeurs propres distinctes sont orthogonaux.
Exemple :
=
1 2 2 2
2 2 3 2 2
2 2 2 1
A Diagonalisons la matrice A (Cf §3)
1) Détermination des valeurs propres
⇔
= λ
− λ
− λ
−
= λ
− 0
1 2 2 2
2 2 3 2 2
2 2 2 1 I A
( )
1−λ 32−2λ 12−2λ −2 2222 12−2λ +2222 32−2λ( )
−λ(
− λ−λ+λ −)
−(
− λ−)
+(
− + λ)
= 1 3 3 2 8 2 22 2 2 2 4 2 28 6 2
( )
−λ(
− − λ+λ)
+ + λ+ + λ= 1 5 4 2 8 8 4 4
λ + + λ
− λ + λ + λ + λ
−
−
= 5 4 2 5 4 2 3 12 12 0
7 13 5 2
3 + λ + λ+ = λ
−
=
on remarque que λ=−1 est racine de l’équation (est une solution de l’équation) Divisons −λ3 +5λ2+13λ+7 par λ+1 pour trouver les autres racines
2 3
2
3 5 13 7
λ
− λ
−
+ λ + λ + λ
− λ+1
7
2+6λ+ λ
− λ
+ λ
λ + λ
6 6
13 6
2 2
7 7
7 7
+ λ
+ λ
0
Donc la division de −λ3 +5λ2 +13λ+7 par λ+1 donne −λ2+6λ+7 c'est-à-dire que :
( )
1(
6 7)
7 13
5 2 2
3 + λ + λ+ = λ+ −λ + λ+ λ
−
Recherchons les racines −λ2 +6λ+7=0 c'est-à-dire résolvons −λ2 +6λ+7=0 82
64 28 36+ = =
=
∆
2 1 8 6 =−
−+
−
(
λ′,λ ′′)
= −b2±a ∆2 7 8
6 =
−
−
−
( )(
λ+1 −λ+7)
=0Ainsi −λ2 +6λ+7=
( )(
λ+1 −λ+7)
et donc −λ3+5λ2+13λ+7=
( )
λ+1(
−λ2 +6λ+7)
=( )( )(
λ+1 λ+1 −λ+7)
(
7)( )
12I
A−λ = −λ+ λ+
⇒
= λ
−
= λ
= λ
7 1
3 2 1
2) Recherche des vecteurs propres associés aux différents λi
• λ1=λ2 =−1
=
λ
− λ
− λ
−
0 0 0
z y x
1 2 2 2
2 2 3
2 2
2 2 2 1
1 1
1
z y 2 x 0 z 2 y 2 2 x 2 0 z 4 y 2 4 x 4 0 z 2 y 2 2 x 2
0 z 2 2 y 4 x 2 2
0 z 2 y 2 2 x 2
−
−
=
⇔
= + +
⇔
= + +
⇔
= + +
= +
+
= + +
On obtient l’équation d’un plan vectoriel dont une base est formée par exemple par les vecteurs )
0 1 2 ( w )
1 0 1 (
v = − = −
• λ3 =7
=
λ
− λ
− λ
−
0 0 0
z y x
1 2 2 2
2 2 3
2 2
2 2 2 1
3 3
3
) 3 ( z 3 y 2 x
0 z 3 y 2 x
0 z 2 y 2 x 2
0 z y 2 x 3
0 z 6 y 2 2 x 2
0 z 2 2 y 4 x 2 2
0 z 2 y 2 2 x 6
+
−
=
⇔
=
− +
= +
−
= + +
−
⇔
=
− +
= +
−
= + +
−
( )
( )
⇔ − +− ==
= +
− +
−
= + + +
−
−
0 z 2 4 y 4
0 z 8 y 2 4 0 z 2 y 2 z 3 y 2 2
0 z y 2 z 3 y 2 3
= +
−
=
⇔ −
=
=
=
0 z 2 4 y 4
0 z 2 8 y z 8
2 2
2 2 2 z 2 2 4
z y 8
( )
= +
−
= +
−
=
=
z z 3 z 2 z 3 z 2 2 x
z 2 y
On obtient l’équation d’une droite vectorielle de vecteur directeur par exemple u=
[ ]
1, 2,1On a donc 3 vecteurs propres indépendants. Ils forment une base de ℜ3 (leur déterminant est non nul).
4 0
1 1
1 0 2
2 1 1
−
=
−
−
3) Appelons H, la matrice formée par les 3 vecteurs propres
− −
=
0 1 1
1 0 2
2 1 1 H
La matrice A peut se décomposer en (Cf §3) A =H⋅D⋅H−1
−
−
−
−
−
−
− −
=
4 2 24
4 2
34 24
14
4 2 4
2 14
1 0 0
0 1 0
0 0 7
0 1 1
1 0 2
2 1 1 A
D H A H H
D H
A= ⋅ ⋅ −1⇔ −1⋅ ⋅ = Vérifions le théorème précédent :
Le vecteur u=
( )
1, 2,1 vecteur propre de A pour la valeur propre 7 est orthogonal à chacun des vecteurs propres v =[
−1,0,1]
et w=[
− 2,1,0]
associés à la valeur propre -1. (Cf les définitions suivantes pour le démontrer)On appelle produit scalaire X.Y de 2 vecteurs
[ ]
=
=
n 1 ) 1 , n ( n 1 n) (1,
y y Y
et x , , x
X K M le scalaire x1y1+x2y2+...+xnyn
Exemple :
[
1 1 1]
X1=
= 2 1 2 X2
−
= 1
2 1 X3
(
1 2)
2 1
3 1
2 1
X X 2 10 4 1 1 1 4 1 X 2 X
0 1 2 1 X X
5 2 1 1 1 2 1 X X
=
=
× +
× +
×
=
= +
−
=
=
× +
× +
×
=
Propriétés du produit scalaire :
( )
(
11 2 2)(
33 14)
3 1133 2 3 1 4 2 42 1 2 1
1 2 2 1
X X X X X X X X X X X X
X X X X X X X
X kX kX . X
X X X X
+ +
+
= + +
+
= +
=
=
Définition : deux vecteurs X et Y de taille n, sont dits orthogonaux si leur produit scalaire est nul.
Donc dans l’exemple précédent :
⇒
= +
−
=
⋅
= +
−
=
⋅
0 2 2 w u
0 1 1 v u
vecteur u orthogonal à v et w.
Une base formée de vecteurs 2 à 2 orthogonaux s’appelle une base orthogonale de l’espace.
Un vecteur propre est dit normalisé si x 1
n 1 i
2 i =
∑
=
.
On appelle module d’un vecteur X ou norme d’un vecteur noté X la racine carrée du produit scalaire de X par X :
2 n 2
2 2
1 x x
x X . X
X = = + +K+
Exemple : X1=
[
1 1 1]
X1 = 3Pour normaliser un vecteur, on divise chacune de ses composantes par X . Une base formée de vecteurs orthogonaux unitaires est dite orthonormale.
Dans l’exemple précédent, les vecteurs suivants :
− −
′=
− +
′=
′=
12 22
12 2 w
0 2 22 2 v
2 1 2 2
u 1 sont aussi vecteurs
propres de A et forment une base orthogonale de ℜ3. De même, si on prend :
w w w v v v u
u′′= u ′′= ′′= on obtient :
−
′′=
− +
′′=
′′= 0
3 1 3 w 2
2 0 1
2 v 1
4 1 4 2 4 u 1
sont aussi vecteurs propres de A et forment une base orthonormale de ℜ3. Changement de base (relatif à la matrice symétrique de l’exemple précédent).
Forme quadratique associée à cette matrice A : AX
X Q= ′
( )
23 1 2 1 3 2 32 2 2
1 3x x 4 2x x 4x x 4 2x x x
x
Q = + + + + +
On a vu : (Cf §2)
( )
2( )
1 1 11 Q x XAX Q x X BX
PX
X= = ′ → = ′ avec B=P′AP
changement de base par le biais de P (matrice de passage de la base canonique à la nouvelle base).
Si l’on choisit une base orthonormale de vecteurs propres de A, la matrice de passage P est appelée matrice orthogonale. Elle possède la propriété suivante :
P 1
P′= − Donc B=P−1AP
Or on a vu dans la diagonalisation que A=H⋅D⋅H−1⇔H−1⋅A⋅H=D, avec D matrice diagonale des valeurs propres.
Donc la matrice B=P−1AP est la matrice diagonale dont les termes sont les valeurs propres de A.
Il existe cependant une infinité d’autres bases dans lesquelles la matrice B est diagonale sans pour cela que les termes diagonaux soient égaux aux valeurs propres de A.
Dans chacune d’elles, la forme quadratique associée sera : n2
2 n 2 2 2
1x1′ +α x′ + +α x′
α K
La valeur des αidépend de la base choisie. Mais il y a toujours le même nombre de coefficients αi >0, le même nombre de coefficients αi <0 et donc aussi le même nombre de coefficients nuls.
( )
23 1 2 1 3 2 32 2 2
1 3x x 4 2x x 4x x 4 2x x x
x
Q = + + + + +
En regroupant tous les termes contenant x1, on peut écrire :
( )
x x12 2x1(
2 2x2 2x3)
3x22 x23 4 2x2x3Q = + + + + +
On voit ainsi apparaître dans les 2 premiers termes le début du développement d’un carré. D’où
( )
x(
x1(
2 2x2 2x3) )
2(
8x22 4x23 8 2x2x3)
3x22 x23 4 2x2x3Q = + + − + + + + +
( )
x(
x1 2 2x2 2x3)
2 5x22 3x23 4 2x2x3Q = + + − − −
soit encore
( )
x =(
x1+2 2x2 +2x3)
2 −5x22 + 53x23 + 452 x2x3Q
( )
x =(
x1+2 2x2 +2x3)
2 −5x22 +2252 x2x3 +53x32Q
( ) ( )
+
−
+
− +
+
= 32 23
2 3 2
2 3 2
1 x
5 x 3 25 x 8
5 2 x 2
5 x
2 x 2 2 x x Q
( )
x(
x1 2 2x2 2x3)
2 5 x2 252 x3 2 57x23Q −
+
− +
+
=
Changement de base défini à « l’envers » par : 3
2 1
1 x 2 2x 2x
x′ = + +
3 2
2 x
5 2 x 2
x′ = +
3
3 x
x′ =
( )
22 32
1 x
5 x 7 5 x x
Q = ′ − ′ − ′ Forme quadratique associée à
−
− 75 0 0
0 5 0
0 0 1
Il y a, comme dans la matrice des valeurs propres, un terme positif et 2 termes négatifs.
3 Dérivée matricielles
3.1 Dérivée d’une matrice par rapport à une variable
Soit une matrice A de dimension p,q : A(p,q) et de terme générique aij, la dérivée de A par rapport à une variable t est une matrice B dont les termes sont les dérivés de la matrice par rapport à t. C'est-à-dire :
( )
Bt A =
∂
∂ de terme générique : t aij
∂
∂
3.2 Dérivée d’une forme quadratique par rapport à un vecteur
Soit Q
( )
x =X′[ ]
AX une forme quadratique où X est un vecteur colonne,[ ]
A une matrice symétrique définie positive.On a vu que : (Cf §1)
( ) [ ] ∑ ∑ ∑
−= =+
= +
′ =
= n 1
1 i
n 1 i j
j i ij n
1 i
2
ixi 2 b xx a
X A X x Q
Donc la dérivée de Q(x) par rapport à Xi s’écrit :
∂
∂ ∂
∂ ∂
∂ =
∂
n i 1
i
Qx Q x Q x
x Q
M M
( )
X m 2
x m ...
x m 2
x m x 2
Q
i
n in 1
1 i n
1 j
j ij i
= ′
+ +
=
∂∂ =
∑
=
Soit m′i : ième ligne de
[ ]
A =(mi1,...,min)On démontre que :
[ ]
XAX 2[ ]
A XX X
Q =
∂
∂ ′
∂ =
∂
si 2X
X x Q X
X
Q 2i =
∂
= ∂
= ′
∑
Exemple :
Soit
( )
23 1 3 1 2 2 32 2 2
1 5x 7x 4x x 2x x 2x x x
x
Q = − − + + +
[ ]
−
−
=
7 1 2
1 5 1
2 1 1 A
[ ]
− +
+
− + +
=
−
−
=
∂ =
∂
3 2
1
3 2 1
3 2 1
3 2 1
x 14 x 2 x 4
x 2 x 10 x 2
x 4 x 2 x 2
x x x
14 2
4
2 10 2
4 2 2 X A X 2 Q
− +
+
− + +
=
∂
∂
∂
∂∂
∂
∂ =
∂
3 2
1
3 2 1
2 3 1
3 2 1
x 14 x 2 x 4
x 2 x 10 x 2
x 2 x 4 x 2
x Q x
Q x
Q
X Q
3.3 Maximisation d’une forme quadratique sous contrainte
Cherchons à maximiser la forme quadratique X′
[ ]
AX sous la contrainte X'X=1 (le vecteur X est normé).Pour résoudre ce problème de maximisation sous contrainte on utilise la procédure du Lagrangien :
(
X'X 1)
AX ' X
L= −λ −
On calcule alors :
( ) ( )
X 1 X ' X X
AX ' X X L
∂ − λ∂
∂ −
= ∂
∂∂
Or on a vu que :
( )
2AXX AX '
X =
∂
∂ et
( ) ( )
X X ' X X
1 X ' X
∂
=∂
∂ −
∂ or X'X=x12 +...+xn2
( ) ( )
n n
1 1
x x 2
X ' ... X x x 2
X '
X =
∂
= ∂
∂
⇒ ∂
( )
2XX X '
X =
∂
⇒ ∂
D’où : 2AX 2 X X
L = − λ
∂
∂
Pour maximiser il faut annuler la dérivée (condition du premier ordre) Fonction à
maximiser
Multiplicateur de Lagrange
Contrainte sous forme d’égalité à 0
0 X 2 AX X 2
L = − λ =
∂
∂ soit
(
A−λΙ)
X=0 qui est l’écriture de la recherche des vecteurs propres associés aux valeurs propres λ de la matrice A.Or on sait que avec A symétrique :
= Λ
= AC '
C la matrice diagonale des valeurs propres et C la matrice orthogonale des vecteurs propres.
Donc maximiser X′
[ ]
AX sous la contrainte X'X=1 c’est trouver le vecteur propre normé X qui correspond à la plus grande valeur propre de ACe principe est la base des analyses multidimensionnelles qui seront abordées dans le cours d’analyse de données du Master 1.