Calculer des valeurs propres et des vecteurs propres .1 Approche à éviter.1 Approche à éviter

Résoudre d’autres problèmes d’algèbre linéaire

4.3 Calculer des valeurs propres et des vecteurs propres .1 Approche à éviter.1 Approche à éviter

Les valeurs propres de la matrice (carrée) A sont les solutions en λ de l’équation caractéristique

det(A− λ I) = 0, (4.17) et le vecteur propre vⁱassoci´e `a la valeur propre λiest tel que

Avⁱ= λivⁱ, (4.18) ce qui le définit (à une constante multiplicative près).

On pourrait donc penser à une procédure en trois étapes, où les coefficients de l’équation polynomiale (4.17) seraient évalués à partir de A, avant d’utiliser un algo-rithme d’usage général pour calculer les λien résolvant cette équation polynomiale puis de calculer les vⁱen résolvant le système linéaire (4.18) pour chacun des λiainsi obtenus. Sauf si le problème est très petit, ceci est une mauvaise idée, ne serait-ce que parce que les racines d’une équation polynomiale peuvent être très sensibles à des erreurs sur les coefficients de ce polynôme (voir le polynôme perfide (4.59)

en section 4.4.3). L’exemple 4.3 montrera qu’on peut, au contraire, transformer la recherche des racines d’un polynˆome en celle des valeurs propres d’une matrice.

4.3.2 Exemples d’applications

Les applications du calcul de valeurs propres et de vecteurs propres sont très variés, comme le montrent les exemples qui suivent. Dans le premier de ceux-ci, un seul vecteur propre doit être calculé, qui est associé à une valeur propre connue. La réponse s’est avérée avoir des conséquences économiques majeures.

Exemple 4.1. PageRank

PageRank est un algorithme utilisé par Google, entre autres considérations, pour décider dans quel ordre des pointeurs sur les pages pertinentes doivent être présentés en réponse à une question donnée d’un surfeur sur le WEB [137], [33]. Soit N le nombre de pages indexées. PageRank utilise une matrice de connexion G de dimen-sions N×N, telle que gi, j= 1 s’il existe une lien hypertexte de la page j vers la page i, et g_{i, j}= 0 dans le cas contraire. G est donc une matrice énorme mais très creuse.

Soit x^k∈ RN un vecteur dont i-ème élément est la probabilité que le surfeur soit dans la i-ème page après k changements de page. Toutes les pages ont initialement la même probabilité, de sorte que

x⁰_i = ¹

N, i= 1,··· ,N. (4.19) L’´evolution de x^klors d’un changement de page est d´ecrite par la chaˆıne de Markov

x^k+1= Sxk, (4.20) où la matrice de transition S correspond à un modèle du comportement des surfeurs. Supposons, dans un premier temps, qu’un surfeur suive au hasard n’importe lequel des hyperliens présents dans la page courante. S est alors une matrice creuse, facile à déduire de G en procédant comme suit. Son élément s_{i, j}est la probabilité de sauter de la page j vers la page i via un hyperlien. Comme on ne peut pas rester dans la j-ème page, s_{j, j}= 0. Chacun des nj éléments non nuls de la j-ème colonne de S est égal à 1/nj, de sorte que la somme de tous les éléments d’une colonne de S quelconque est égal à un.

Ce modèle manque de réalisme, car certaines pages ne contiennent aucun hyper-lien ou ne sont le point de destination d’aucun hyperhyper-lien. C’est pourquoi on com-plique le modèle en supposant que le surfeur peut aléatoirement sauter vers une page arbitraire (avec une probabilité 0.15) ou choisir de suivre l’un quelconque des hyperliens présents dans la page courante (avec une probabilité 0.85). Ceci conduit à remplacer S dans (4.20) par

A= αS + (1− α)¹^{· 1}

avec α= 0.85 et 1 un vecteur colonne de dimension N dont tous les éléments sont égaux à un. Avec ce modèle, la probabilité de rester à la même page n’est plus nulle. Bien que A ne soit plus creuse, l’évaluation de Ax^kreste presque aussi simple que si elle l’était.

Après une infinité de sauts de page, la distribution asymptotique des probabilités x∞est telle que

Ax∞= x∞, (4.22) de sorte que x∞est un vecteur propre de A, associé à une valeur propre unité. Les vecteurs propres sont définis à une constante multiplicative près, mais le sens de x∞

implique que N

∑

i=1 x∞ i = 1. (4.23) Une fois x∞évalué, les pages pertinentes associées aux éléments de plus grandes valeurs de x∞ peuvent être présentées en premier. Les matrices de transition des chaˆınes de Markov sont telles que leur valeur propre la plus grande est égale à un. Classer des pages WEB revient donc ici à calculer le vecteur propre associé à la plus grande valeur propre (connue) d’une matrice gigantesque. Exemple 4.2. Oscillations de ponts

Le matin du 7 novembre 1940, le pont de Tacoma s’est violemment vrillé sous l’action du vent avant de s’écrouler dans les eaux froides du détroit de Puget. Ce pont s’était vu affublé du surnom de Galloping Gertie à cause de son comportement inhabituel, et c’est un coup de chance extraordinaire qu’aucun amateur de sensations fortes n’ait été tué dans ce désastre. La vidéo de l’événement, disponible sur le WEB, est un rappel brutal de l’importance de tenir compte du risque d’oscillations lors de la conception de ponts.

Un modèle linéaire dynamique d’un pont, valide pour de petits déplacements, est fourni par l’équation différentielle vectorielle

M¨x+ C˙x + Kx = u, (4.24) où M est une matrice de masses, C une matrice d’amortissements, K une matrice de coefficients de raideur, x un vecteur décrivant les déplacements des nœuds d’un maillage par rapport à leurs positions d’équilibre en l’absence de forces extérieures, et u un vecteur de forces extérieures. C est souvent négligeable, et c’est pourquoi les oscillations sont si dangereuses. L’équation autonome (c’est à dire en l’absence d’entrée extérieure) devient alors

M¨x+ Kx = 0. (4.25) Toutes les solutions de cette ´equation sont des combinaisons lin´eaires des modes propres x^k, avec

x^k(t) = ρρρ^kexp[i(ωkt+ ϕk)], (4.26) où i est l’unité imaginaire, telle que i²=−1, ωkest une pulsation de résonance et ρ

(K− ω2

kM)ρρρ^k= 0. (4.27) Calculer ω_k²et ρρρ^kest un problème de valeurs propres généralisé [202]. En général, M est inversible, de sorte que cette équation peut être transformée en

Aρρρ^k= λ_kρρρ^k, (4.28) avec λk= ω2

k et A= M⁻¹K. Le calcul des ωket ρρρ^kpeut donc se ramener à celui de valeurs propres et de vecteurs propres. La résolution du problème de valeurs propres généralisé peut cependant se révéler préférable car des propriétés utiles de M et K peuvent être perdues lors du calcul de M⁻¹K. Exemple 4.3. Résoudre une équation polynomiale

Les racines de l’´equation polynomiale

xⁿ+ an−1^xⁿ⁻¹+··· + a1x+ a0= 0 (4.29) sont les valeurs propres de sa matrice compagne

A=          0 ··· ··· 0 −a0 1 . ._. ₀ .._. −a1 0 . ._. . ._. .._. .._. .. . . ._. . ._. ₀ .._. 0 ··· 0 1 −an−1          , (4.30)

et l’une des m´ethodes les plus efficaces pour calculer ces racines est de chercher les valeurs propres de A.

4.3.3 Méthode de la puissance itérée

La méthode de la puissance itérée s’applique quand la valeur propre de A de plus grand module est réelle et simple. Elle évalue alors cette valeur propre et le vecteur propre correspondant. Elle est surtout utile sur les grandes matrices creuses (ou qui peuvent être traitées comme si elles l’étaient, comme dans PageRank).

Supposons, pour le moment, que la valeur propre λmaxde plus grand module soit positive. Pourvu que v⁰ait une composante non nulle dans la direction du vecteur propre correspondant v_max, it´erer

v^k+1= Av^k (4.31) fera alors d´ecroˆıtre l’angle entre v^k et v_max. Pour assurer v^k+1 2 = 1, (4.31) est remplac´ee par

v^k+1= ¹ Av^k

Apr`es convergence,

Av∞=kAv∞

k2v∞, (4.33) de sorte que λmax=kAv∞

k2et vmax= v∞. La convergence peut ˆetre lente si d’autres valeurs propres ont un module proche de celui de λmax.

Remarque 4.2.Quand λmaxest n´egative, la r´ecurrence devient v^k+1=− ¹

Av^k

Av^k, (4.34) de sorte qu’apr`es convergence

Av∞=−kAv∞

k2v∞. (4.35) Remarque 4.3.Si A est sym´etrique, alors ses vecteurs propres sont orthogonaux et, pourvu quekvmaxk2= 1, la matrice

A⁰= A− λmaxv_maxv^T_max (4.36) a les même valeurs propres et vecteurs propres que A, sauf pour v_max, qui est main-tenant associé à λ = 0. On peut ainsi appliquer la méthode de la puissance itérée pour trouver la valeur propre avec la deuxième plus grande magnitude et le vecteur propre correspondant. Cette procédure de déflation est à itérer avec prudence, car les erreurs se cumulent.

4.3.4 M´ethode de la puissance inverse

Quand A est inversible et que sa valeur propre λminde plus petit module est r´eelle et unique, la valeur propre de A⁻¹ de plus grand module est ¹

λ_min, de sorte qu’une it´eration en puissance inverse

v^k+1= ¹ kA−1_vkk2

A⁻¹v^k (4.37)

peut être utilisée pour calculer λminet le vecteur propre correspondant (pourvu que λ_min> 0). L’inversion de A est évitée en calculant vk+1par résolution du système

Av^k+1= vk, (4.38) et en normalisant le résultat. Si une factorisation de A est utilisée à cet effet, elle est calculée une fois pour toutes. Une modification triviale de l’algorithme permet de traiter le cas λmin< 0.

4.3.5 M´ethode de la puissance inverse avec d´ecalage

La méthode de la puissance inverse avec décalage vise à calculer un vecteur propre xi associé à une valeur propre isolée λi connue approximativement. Cette valeur propre n’a plus besoin d’être celle de plus grand ou de plus petit module. Cette méthode peut être utilisée sur des matrices réelles ou complexes. Elle est par-ticulièrement efficace sur les matrices A normales, c’est à dire qui commutent avec leur transconjuguée A^Hde sorte que

AA^H= AHA. (4.39) Pour les matrices r´eelles, ceci se traduit par

AA^T= A^TA, (4.40) et les matrices sym´etriques sont donc normales.

Soit ρ une valeur approximative de λi, avec ρ6= λi. Puisque

Axⁱ= λixⁱ, (4.41) nous avons

(A− ρI)xi= (λi− ρ)xi. (4.42) Multiplions (4.42) `a gauche par(A− ρI)⁻¹(λi− ρ)⁻¹, pour obtenir

(A− ρI)⁻¹xⁱ= (λi− ρ)⁻¹xⁱ. (4.43) Le vecteur xⁱ est donc aussi un vecteur propre de(A− ρI)⁻¹, associ´e `a la valeur propre(λi− ρ)−1. En choisissant ρ proche de λi, et pourvu que les autres valeurs propres de A soit suffisamment loin, on peut assurer que, pour tout j6= i,

1 |λi− ρ|

|λj− ρ|^. ^(4.44) L’itération en puissance inverse décalée

v^k+1= (A− ρI)⁻¹v^k, (4.45) combinée avec une normalisation de v^k+1à chaque itération, converge alors vers un vecteur propre de A associé à λi. En pratique, on calcule plutôt v^k+1en résolvant le système

(A− ρI)v^k+1= v^k (4.46) (en général via une factorisation LU avec pivotage partiel de A− ρI, calculée une fois pour toutes). Quand ρ se rapproche de λi, la matrice A− ρI devient presque singulière, ce qui n’empêche pas l’algorithme de fonctionner très bien, au moins quand A est normale. Ses propriétés, y compris son comportement sur des matrices qui ne le sont pas, sont étudiées dans [113].

4.3.6 It´eration QR

L’itération QR, à base de factorisation QR, permet d’évaluer toutes les valeurs propres d’une matrice carrée A à coefficients réels, pourvu qu’elle ne soit pas de trop grande taille. Ces valeurs propres peuvent être réelles ou complexes conjuguées. On suppose seulement que leurs modules diffèrent (sauf, bien sûr, pour une paire de valeurs propres complexes conjuguées). Un récit intéressant de l’histoire de cet algorithme fascinant est dans [177]. Sa convergence est étudiée dans [249].

La méthode de base est comme suit. Partant de A₀= A et i = 0, répéter jusqu’à convergence

1. Factoriser A_icomme Q_iR_i.

2. Inverser l’ordre des facteurs résultants Q_iet R_ipour former A_i+1= RiQ_i. 3. Incrémenter i d’une unité et aller au pas 1.

Pour des raisons compliquées à expliquer, ceci transfère de la masse de la par-tie triangulaire inférieure de A_i vers la partie triangulaire supérieure de A_i+1. Le fait que R_i= Q⁻¹_i A_i implique que A_i+1= Q⁻¹_i A_iQ_i. Les matrices A_i+1 et A_i ont donc les mêmes valeurs propres. Après convergence, A_∞est une matrice triangulaire supérieure par blocs avec les mêmes valeurs propres que A, dans ce qu’on appelle une forme de Schur réelle. Il n’y a que des blocs scalaires et 2× 2 sur la diagonale de A_∞. Chaque bloc scalaire contient une valeur propre réelle de A, tandis que les valeurs propres des blocs 2× 2 sont des valeurs propres complexes conjuguées de A. Si B est l’un de ces blocs 2× 2, alors ses valeurs propres sont les racines de l’équation du second degré

λ²− trace(B)λ + detB = 0. (4.47) La factorisation qui en r´esulte

A= QA∞Q^T (4.48) est appelée décomposition de Schur (réelle). Puisque

∏

Q_i, (4.49) elle est orthonormale, comme produit de matrices orthonormales, et(4.48) implique que

A= QA∞Q⁻¹ (4.50) Remarque 4.4.Après avoir indiqué que “les bonnes mises en œuvre [de l’itération QR] sont depuis longtemps beaucoup plus largement disponibles que les bonnes ex-plications”, [246] montre que cet algorithme n’est qu’une mise en œuvre astucieuse et numériquement robuste de la méthode de la puissance itérée de la section 4.3.3, appliquée à toute une base de Rnplutôt qu’à un vecteur unique. Remarque 4.5.Chaque fois que A n’est pas une matrice de Hessenberg supérieure (c’est à dire une matrice triangulaire supérieure complétée d’une diagonale non

nulle juste en dessous de la diagonale principale), une variante triviale de la fac-torisation QR est tout d’abord utilisée pour la mettre sous cette forme. Ceci accélère considérablement l’itération QR, car la forme de Hessenberg supérieure est préservée par les itérations. Notons que la matrice compagne de l’exemple 4.3 est déjà sous forme de Hessenberg supérieure. Quand A est symétrique, toutes ses valeurs propres λi(i = 1,··· ,n) sont réelles, et les vecteurs propres correspondants vⁱsont orthogonaux. L’itération QR produit alors une série de matrices symétriques A_kqui doit converger vers la matrice diago-nale Λ ΛΛ= Q⁻¹AQ, (4.51) avec Q orthonormale et Λ Λ Λ =       λ1 0 ··· 0 0 λ₂ . ._. .._. .. . . ._. . ._. ₀ 0 ··· 0 λ_n       . (4.52)

L’´equation (4.51) implique que

AQ= QΛΛΛ, (4.53) ou encore que

Aqⁱ= λiqⁱ, i= 1,··· ,n, (4.54) avec qi la i-ème colonne de Q. Ainsi, qi est le vecteur propre associé à λi, et l’itération QR calcule la décomposition spectrale de A

A= QΛΛΛ Q^T= QΛΛΛ Q−1. (4.55) Quand A n’est pas symétrique, le calcul de ses vecteurs propres à partir de la décomposition de Schur reste possible mais devient significativement plus com-pliqué [42].

4.3.7 Itération QR décalée

La version de base de l’itération QR échoue s’il y a plusieurs valeurs propres réelles (ou plusieurs paires de valeurs propres complexes conjuguées) de même mo-dule, comme illustré par l’exemple qui suit.

Exemple 4.4. ´Echec de l’it´eration QR La factorisation QR de A= 0 1 1 0 ,

est A= 0 1 1 0 · 1 0 0 1 , de sorte que RQ= A

et la méthode est bloquée. Ce n’est pas surprenant car les valeurs propres de A ont la même valeur absolue (λ1= 1 et λ2=−1). Pour contourner cette difficulté et accélérer la convergence, l’itération QR décalée de base procède comme suit. Partant de A₀= A et i = 0, elle répète jusqu’à conver-gence

1. Choisir un d´ecalage σi.

2. Factoriser A_i− σiI comme QiR_i.

3. Inverser l’ordre des facteurs r´esultants Qiet Riet compenser le d´ecalage pour obtenir A_i+1= RiQ_i+ σiI.

Une stratégie possible est la suivante. Commencer par fixer σi à la valeur du dernier élément diagonal de A_i, pour accélérer la convergence de la dernière ligne, puis fixer σià la valeur de l’avant-dernier élément diagonal de A_i, pour accélérer la convergence de l’avant-dernière ligne, et ainsi de suite.

Beaucoup de travaux ont été consacrés aux propriétés théoriques et à la mise en œuvre pratique de l’itération QR (décalée), et nous n’avons fait ici qu’effleurer le sujet. L’itération QR, appelée dans [229] (cité dans [42]) l’un des algorithmes les plus remarquables des mathématiques numériques, se révèle converger dans des situations plus générales que celles pour lesquelles sa convergence a été prouvée. Elle a cependant deux inconvénients principaux. Tout d’abord, les valeurs propres de petit module peuvent être évaluées avec une précision insuffisante, ce qui peut justifier une amélioration itérative. Ensuite, l’algorithme QR n’est pas adapté aux très grandes matrices creuses, car il en détruit le caractère creux. En ce qui concerne la résolution numérique de grands problèmes aux valeurs propres, le lecteur pourra consulter [202], et y découvrir que les sous-espaces de Krylov jouent, là encore, un rôle crucial.

4.4 Exemples MATLAB

Dans le document Méthodes numériques et optimisation, un guide du consommateur (Page 74-82)